WO2013054588A1

WO2013054588A1 - 情報処理装置、データストア操作方法、データ構築装置、データ構築方法、データ結合装置、データ結合方法およびプログラム

Info

Publication number: WO2013054588A1
Application number: PCT/JP2012/070123
Authority: WO
Inventors: 小柳　光生; 裕也海野; 吉田　一星
Original assignee: インターナショナル・ビジネス・マシーンズ・コーポレーション
Priority date: 2011-10-11
Filing date: 2012-08-07
Publication date: 2013-04-18

Abstract

　本情報処理装置１００は、入力される入力キーを受け付けて、データストア１２０を構成しキーをツリー構造として維持するバッファ１２２に対し、該入力キーを追加するキー追加部１０４と、バッファ１２４が維持するツリー構造内のノードを走査して、該ツリー構造を表現する簡潔データ構造１４２を構築するとともに、該簡潔データ構造内にキーが存在することを近似的に判定するフィルタ１４４を構築する構築部１０６と、データストア１２０に対する照会キーの問い合わせに対応して探索を行う際に、簡潔データ構造１３２を探索するのに先だって、対応するフィルタ１３４に対し該簡潔データ構造１３２内に照会キーが存在することを確認する照会部１０８とを含む。

Description

情報処理装置、データストア操作方法、データ構築装置、データ構築方法、データ結合装置、データ結合方法およびプログラム

　本発明は、データストアに関し、より詳細には、キーを効率的に格納するデータストアを実現する情報処理装置、データストア操作方法、ツリー構造の簡潔データ構造を構築するデータ構築装置およびデータ構築方法、複数のツリー構造が結合された簡潔データ構造を構築するデータ結合装置およびデータ結合方法、並びにこれらのプログラムに関する。

　言語処理、ユーザ管理などのアプリケーションにおいて、単語、フレーズ、人名、ＵＲＬなどの膨大な文字列をコンパクトにメモリに格納する技術に対する要望が高まっている。これは、文字列をキーとする空間効率の高いデータストアを実現すれば、多数の文字列を省メモリで管理し、応答性能およびスループットを向上させることが可能となり、ひいては上記言語処理やユーザ管理などのアプリケーションを効率よく実現できるようになるからである。

　ところで、情報理論において、要求される最小のメモリ使用量で実現されるデータ構造は、簡潔データ構造（Succinct Data Structure）と称される。ツリー構造を表現する簡潔データ構造として、ＬＯＵＤＳ（Level Order Unary Degree Sequence）が知られている（非特許文献１）。ＬＯＵＤＳは、空間効率の高いデータ構造を有し、さらにツリー構造内の各ノードへ効率的にアクセスする操作も提案されている（非特許文献２）。このため、ＬＯＵＤＳは、データへのアクセス頻度が比較的高い用途においても好適に利用されている。

　上記ツリー構造として、トライ木（ＴＲＩＥ）が知られている。トライ木のリード性能は、トライ木に入力されたデータの個数にはよらず、キーの文字列長に依存するという特性を有する。このため、トライ木は、膨大なキーをメモリに効率良く格納することが求められる辞書などの用途で、好適に利用されている。また、種々のトライ木の実装方法が知られているが、トライ木をＬＯＵＤＳで実装することにより、ダブルアレイ（Double-Array）での実装と比較して、４～１０倍のメモリ効率を実現することができることが知られている（非特許文献３）。ハッシュ関数を使用するブルームフィルタによってキーを検索する技術も知られている（特許文献１）。

　上記トライ木のリード性能がキーの文字列長に依存するという特性は、ＬＯＵＤＳで実装する場合も同様である。しかしながら、トライ木をＬＯＵＤＳで実装した場合、上述したダブルアレイなどのリンク構造を利用した実装に比較して、リード性能が一般的に低下してしまう。例えば、ダブルアレイによる実装と比較して１０倍近い実行時間を必要とする実装例が報告されている（非特許文献３）。

　また、トライ木をＬＯＵＤＳで実装した場合、空間効率が高いという利点があるものの、ダブルアレイなどのリンク構造を利用した実装とは異なり、構築済みのデータ構造に新たな文字列を追加することは通常困難である。ＬＯＵＤＳは、メモリ空間中に密に配置されたデータ構造であるため、一度完成したＬＯＵＤＳに対し新たな文字列を追加するには、新たな文字列のノードを追加する箇所に隙間（ノードを現す１ビット）を作るべく、平均半分のデータを移動する必要がある。辞書表現など入力データが大きい場合は、上記データ移動のコストは非常に大きくなり、オンラインで辞書を構築する用途では許容することが難しい。

特開２００８－０１１４４８号公報

G. Jacobson、"Space-efficient Static Trees and Graphs"、In Proceedings of the 30th Annual Symposium on Foundations of Computer Science (SFCS '89)、IEEE Computer Society、USA、1989、549-554 O'Neil Delpratt，Naila Rahman，and Rajeev Raman、"Engineering the LOUDS Succinct Tree Representation."、Lecture Notes in Computer Science、2006、Volume 4007/2006、134-145 岡野原　大輔、「大規模キー集合の効率的な格納法ｔｘ　ｂｅｐ」、［online］、東京大学、［平成２３年９月１５日検索］、インターネット＜ＵＲＬ：http://www-tsujii.is.s.u-tokyo.ac.jp/~hillbig/papers/2007-1031-massiveKeys.pdf＞ Dong Kyue Kim，Joong Chae Na，Ji Eun Kim and Kunsoo Park、"Efficient Implementation of Rank and Select Functions for Succinct Representation,"、Experimental and Efficient Algorithms Lecture Notes in Computer Science、2005、Volume 3503/2005、125-143

　本発明は、上記従来技術に鑑みてなされたものであり、本発明は、キーを空間効率高く格納するとともに、オンライン構築が可能で、データ操作性能が改善されたデータストアを実現する、情報処理装置、該データストアを操作するデータストア操作方法およびプログラムを提供することを目的とする。

　本発明の他の目的は、トライ木の簡潔データ構造およびフィルタを効率的に構築するためのデータ構築装置およびデータ構築方法、複数のトライ木が結合された簡潔データ構造を効率的に構築するためのデータ結合装置およびデータ結合方法、並びにこれらのプログラムを提供することである。

　本発明では、上記課題を解決するために、以下の特徴を有する、情報処理装置を提供する。本情報処理装置は、入力される入力キーを受け付けて、データストアを構成しキーをツリー構造として維持するバッファに対し、該入力キーを追加するキー追加部を備える。さらに、本情報処理装置は、上記バッファが維持するツリー構造内のノードを走査して、該ツリー構造を表現する簡潔データ構造を構築するとともに、該簡潔データ構造内にキーが存在することを近似的に与えるフィルタを構築する構築部を備える。本情報処理装置は、さらに、上記データストアに対する照会キーの問い合わせに対応して探索を行う際に、簡潔データ構造を探索するのに先だって、対応するフィルタに対し該簡潔データ構造内に照会キーが存在することを確認する照会部を備える。

　上記構成によれば、キーを空間効率高く格納するとともに、オンライン構築が可能で、データ操作性能が改善されたデータストアを実現することができる。特に簡潔データ構造が複数構築された場合でも、上記フィルタにより、簡潔データ構造にキーが含まれるかを近似的に知ることができるため、簡潔データ構造の個数によらず、効率的にキーを照会することが可能となる。

ファサードによるＬＯＵＤＳを用いたキーバリュー・ストアの実装方法を説明する図。本実施形態によるキーバリュー・ストアを実現するコンピュータ装置の機能ブロック図。本実施形態によるコンピュータ装置が実行する、キーバリュー・ストアに対するキー追加処理を示すフローチャート。本実施形態によるコンピュータ装置が実行する、キーバリュー・ストアに対するキー照会処理を示すフローチャート。アルファベット取得関数、第１子ノード取得関数および兄弟ノード取得関数を模式的に説明する図。構築用バッファトライ木から下位ＬＯＵＤＳおよびブルームフィルタを構築する処理を模式的に説明する図。本実施形態のＬＯＵＤ構築処理により構築される構築ＬＯＵＤＳおよび構築ブルームフィルタのデータ構造を示す図。本実施形態によるコンピュータ装置が実行する、ＬＯＵＤＳ構築処理を示すフローチャート（１／２）。本実施形態によるコンピュータ装置が実行する、ＬＯＵＤＳ構築処理を示すフローチャート（２／２）。複数の下位ＬＯＵＤＳから結合されたＬＯＵＤＳおよびブルームフィルタを構築する処理を説明する図。本実施形態によるコンピュータ装置が実行する、キーバリュー・ストアにおける結合処理のメインフローを示すフローチャート。結合ノードについてのアルファベット取得関数、第１子ノード取得関数および兄弟ノード取得関数を模式的に説明する図。（Ａ）結合にかかる複数のトライ木（T1,T2）を例示する図、および（Ｂ）結合ルート（M(r1,r2)）を起点とした結合トライ木の幅優先走査を説明する図。結合トライ木（Tm）が仮想的に辿られる様子を説明する図（１／２）。結合トライ木（Tm）が仮想的に辿られる様子を説明する図（２／２）。本実施形態によるコンピュータ装置が実行する、ＬＯＵＤＳ結合処理を示すフローチャート。本実施形態のコンピュータ装置の概略的なハードウェア構成図。（Ａ）演算時間（sec）をプロットした棒グラフ、および（Ｂ）構築されたＬＯＵＤＳおよびブルームフィルタの各データ構造のサイズを表す積み上げ棒グラフ。（Ａ）入力サイズ（キー数）に対し演算時間（sec）をプロットした折れ線グラフ、および（Ｂ）入力キーの数に対してスループットをプロットした折れ線グラフ。（Ａ）キーバリュー・ストア中に照会キーが存在する場合と、存在しない場合とに分けてスループットをプロットした棒グラフ、および（Ｂ）混合トランザクションのスループットをプロットした棒グラフ。

　以下、本発明について実施形態をもって説明するが、本発明は、後述する実施形態に限定されるものではない。なお、以下に説明する実施形態では、ツリー構造を表現する簡潔データ構造およびフィルタを用いたデータストアを実現する情報処理装置として、トライ木を表現するＬＯＵＤＳ（Level Order Unary Degree Sequence）およびブルームフィルタを用いたキーバリュー・ストア（Key-Value Store）を実現するコンピュータ装置１００を一例に説明する。また、本コンピュータ装置１００は、ＬＯＵＤＳおよびブルームフィルタを構築するためのデータ構築装置および複数のトライ木が結合された結合ＬＯＵＤＳを構築するためのデータ結合装置を構成する。

　まず、本実施形態によるコンピュータ装置についての詳細な説明を行う前に、ＬＯＵＤＳを用いたキーバリュー・ストアの実装手法について説明する。ＬＯＵＤＳのような追記が困難な静的データ構造を用いてキーバリュー・ストアを実装する手法を検討すると、好適には、ファサードと呼ばれる手法を採用することができる。上述したファサードでは、一定数ｎ（ｎは自然数）のキーおよび値のセット（以下、入力データ・セットと参照する。）が入力される毎にＬＯＵＤＳの構築が行われ、これによって生成される複数の下位ＬＯＵＤＳをあたかも単一のデータ構造のように扱う。

　図１は、ファサードによるＬＯＵＤＳを用いたキーバリュー・ストアの実装方法を説明する図である。図１に示すコンピュータ装置５００は、入力される入力データ・セットを受け付けるバッファトライ木５１０と、複数の下位ＬＯＵＤＳ５２０－１～５２０－ｘとを備える。

　バッファトライ木５１０は、入力データ・セットの新規追加を受け付ける、追記可能なバッファであり、一定数ｎ個まで入力データ・セットが追記される。入力バッファトライ木５１０に入力されたデータ数が一定数ｎ個に達すると、このバッファトライ木５１０から下位ＬＯＵＤＳ５２０が構築される。つまり、キーバリュー・ストア全体の入力データ総数Ｎ（Ｎは自然数）に対し、概ねＮ／ｎ個の下位ＬＯＵＤＳ５２０－１～５２０－ｘが構築されることになる。そして、図１に示すように、キー照会要求に応答して、バッファトライ木５１０および複数の下位ＬＯＵＤＳ５２０各々に問い合わせを発生させて、あたかも全体を表す単一のデータ構造であるかのように扱うことにより、オンライン構築可能なキーバリュー・ストアを実現することができる。

　上記実装手法によれば、入力データ・セットが追加される毎にＬＯＵＤＳを再構築する必要がなく、下位ＬＯＵＤＳ５２０の構築回数は、入力データ総数Ｎに対し、Ｎ／ｎ回に抑制される。しかしながら、総数Ｎ個のデータがＮ／ｎ個の下位ＬＯＵＤＳ５２０に分割され格納されるため、１回のリード要求に対し、実データ構造である下位ＬＯＵＤＳ５２０へのＮ／ｎ回のリード要求が発生することになる。したがって、リードの性能は、ｎ／Ｎに低下してしまう。

　上述したデータ構造が、充分に大きなシステムに組み込まれ、全体負荷に占める下位ＬＯＵＤＳ５２０に対するリード負荷の占める割合が充分に小さければ、上記リードの性能の低下はあまり問題とならないかもしれない。しかしながら、上述したようにＬＯＵＤＳ自体へのリード処理は、ダブルアレイによる実装に比べて１０倍近い時間を必要とする可能性がある。つまり、ＬＯＵＤＳによる実装では、ダブルアレイによる実装と比較して、そのリード性能が、ｎ／（１０Ｎ）にまで低下してしまう可能性がある。これは、例えば下位ＬＯＵＤＳ５２０の個数が１０個程度であっても、１／１００程度まで性能が低下しうることを意味する。

　上述した下位ＬＯＵＤＳ５２０の個数の増加に起因するリード性能の低下を緩和するため、一定の戦略に従って下位ＬＯＵＤＳ５２０同士を結合（merge）することも考えられる。結合処理により、下位ＬＯＵＤＳ５２０の個数が抑制されるとともに、重複するプレフィックスが共有されるためトライ木のサイズも圧縮されるという利点がある。

　一方、ＬＯＵＤＳ５２０へのアクセス自体が比較的高負荷であるため、結合処理がシステム全体に加える負荷は無視できない。このため、結合実行をできるだけ遅延させる戦略を採用することが望ましい。しかしながら、リード性能がＬＯＵＤＳの個数に依存して低下してしまうので、結合実行を遅延させればさせるほど、システムのリード性能の低下が著しくなる。

　以上を鑑み、本実施形態では、入力データ総数Ｎとともに増加する下位ＬＯＵＤＳへのアクセス回数に実質的に依存しない、あるいはアクセス回数の増加による影響が小さなデータ操作が可能なキーバリュー・ストアを実現するために、詳細は後述する最適化されたキーバリュー・ストアの実データ構造を提供する。以下、図２～図６を参照しながら、本実施形態により実現されるキーバリュー・ストアの詳細について説明する。

（１）全体構成
　図２は、本実施形態によるキーバリュー・ストアを実現するコンピュータ装置の機能ブロック図である。図２に示すコンピュータ装置１００は、キーバリュー・ストア１２０を構成する実データ構造として、バッファトライ木１２２，１２４と、０または１以上の下位ＬＯＵＤＳ１３２－１～１３２－ｘとを含む。さらに、本実施形態では、実データ構造として、複数の下位ＬＯＵＤＳ１３２－１～１３２－ｘに対応して、複数のブルームフィルタ１３４－１～１３４－ｘが設けられている。

　バッファトライ木１２２，１２４は、データ・セット（キーおよび値のセット）が格納されたトライ木を維持する、追記可能なバッファである。バッファトライ木１２２，１２４は、ＬＯＵＤＳが追記困難な静的なトライ木であるのに対し、リンク構造によりツリー構造が維持された追記可能な動的なトライ木として構成される。バッファトライ木１２２，１２４は、特に限定されるものではないが、ノードごとに文字配列を持たせる方法、遷移テーブル（Transition Table）、トリプルアレイ（Triple Array）、ダブルアレイ（Double Array）などの既知の手法方法により実装することができる。また、ツリー構造としては、トライ木の他、パトリシア木を挙げることができる。

　上記バッファトライ木１２２，１２４のうち、バッファトライ木１２２は、一定数ｎ個までの入力データ・セットが追加される入力バッファとして機能し、以下、入力バッファトライ木１２２と参照する。バッファトライ木１２４は、入力データ数が一定数ｎに達し、ＬＯＵＤＳ構築用として設定された、ＬＯＵＤＳ構築処理中であるバッファトライ木を便宜上表したものである。以下、構築用バッファトライ木１２４と参照する。

　下位ＬＯＵＤＳ１３２は、それぞれ、入力データ総数Ｎのうちのｎ個ずつの入力データ・セットが格納されたトライ木を表現する簡潔データ構造である。下位ＬＯＵＤＳ１３２は、入力バッファトライ木１２２に入力されたデータ数が一定数ｎに達する毎に構築される。

　下位ＬＯＵＤＳ１３２に対応してそれぞれ設けられるブルームフィルタ１３４は、対応する下位ＬＯＵＤＳ１３２内に特定のキーが存在することを、近似的ないし確率的に判定するフィルタである。ブルームフィルタ１３４は、入力バッファトライ木１２２に入力されたデータ数が一定数ｎに達する毎に呼び出されるＬＯＵＤＳ構築処理中に、下位ＬＯＵＤＳ１３２とともに構築される。

　ブルームフィルタ１３４には、ｋ個（１以上の自然数）のハッシュ関数が定義されている。ハッシュ関数は、それぞれ、入力される特定のキーをビット配列中の配列位置にマッピングする。特定のキーをｋ個のハッシュ関数に入力し、得られたｋ個のハッシュ値（配列インデックス）に対応するビット群いずれかひとつでも「０」であれば、その特定のキーが下位ＬＯＵＤＳ１３２中に含まれていないことを示す。反対に、得られたｋ個の配列インデックスに対応するビット群すべてが「１」、すなわち有効化されていれば、その特定のキーが下位ＬＯＵＤＳ１３２中に含まれている可能性（含まれていない場合もある。）があることを示す。ブルームフィルタ１３４は、いわゆる偽陽性（False Positive）を有し、誤検出が生じ得るが、偽陰性（False Negative）は有しない。

　上述したキーバリュー・ストア１２０を構成するバッファトライ木１２２，１２４、下位ＬＯＵＤＳ１３２－１～１３２－ｘおよびブルームフィルタ１３４－１～１３４－ｘは、好適には、高速なデータ操作を可能とするため、コンピュータ装置１００が備えるＲＡＭ（Random Access Memory）などの１次記憶装置に格納することができる。

　コンピュータ装置１００は、さらに、キーバリュー・ストア１２０を管理する機能部として、バッファ準備部１０２と、キー追加部１０４と、ＬＯＵＤＳ構築部１０６と、キー照会部１０８と、ＬＯＵＤＳ結合部１１０とを備える。バッファ準備部１０２は、入力バッファトライ木１２２に入力されたデータ数が一定数ｎ個に達する毎に、新しい入力バッファトライ木を準備するとともに、一定数ｎ個に達した入力バッファトライ木を構築用バッファトライ木１２４として設定する。

　キー追加部１０４は、当該コンピュータ装置１００内で発生したデータ入力要求、または外部から受信したデータ入力要求に応答して、入力データ・セットを構成するキーおよび値を受け取り、このキーおよび値を入力バッファトライ木１２２のトライ木に追記する。ここで、キーは、特に限定されないが、文字列であり、値は、ユニークな整数に対応付けられる任意の型のオブジェクトである。以下、説明の便宜上、キーに整数値が対応付けられるものとして説明する。

　ＬＯＵＤＳ構築部１０６は、構築用バッファトライ木１２４が設定されると、この構築用バッファトライ木１２４が維持するトライ木内の各ノードを走査して、該トライ木を表現する下位ＬＯＵＤＳ１４２を構築するとともに、対応するブルームフィルタ１４４を構築する。

　図２において、構築されたＬＯＵＤＳおよびブルームフィルタは、構築ＬＯＵＤＳ１４２および構築ブルームフィルタ１４４と参照される。構築処理が完了すると、構築ＬＯＵＤＳ１４２および構築ブルームフィルタ１４４を含む新規セット１４０は、検索用ＬＯＵＤＳ群１３０に追加され、一方、構築用バッファトライ木１２４は、検索対象から除外される。検索対象から除外された構築用バッファトライ木１２４は、例えば、ＲＡＭからＨＤＤ（Hard Disk Drive）などの２次記憶装置にダンプされたり、またはＲＡＭから消去されたりする。

　なお、説明する実施形態では、説明の便宜上、データ数が一定数ｎ個に達したことに応答して、新しい入力バッファトライ木１２２が準備され、下位ＬＯＵＤＳ１３２およびブルームフィルタ１３４が構築されるものとして説明する。しかしながら、新規の入力バッファトライ木１２２の準備およびＬＯＵＤＳ構築を開始させる契機となる条件は、特に限定されるものではない。例えば、他の実施形態では、一定時間が経過することを条件としてもよい。また、データ数および時間にしきい値を設けるとしても、一定値に限られず、例えば、しきい値は、キーバリュー・ストア１２０の用途やデータ・セットの性質（データ入力頻度の平均値や時間帯毎の分布）などを考慮して、適宜設定することができる。

　キー照会部１０８は、当該コンピュータ装置１００内で発生したキー照会要求、または外部から受信したキー照会要求に応答して、キー照会要求に含まれるキー（以下、照会キーという。）を取得し、当該キーバリュー・ストア１２０の実データ構造群に対し問い合わせを行う。キー照会部１０８は、また、実データ構造群から照会結果として照会キーに対応する値を取得し、要求元に返却する。

　キー照会部１０８は、より具体的には、入力バッファトライ木１２２、構築中のものがあれば構築用バッファトライ木１２４の順に、照会キーの探索を行う。バッファトライ木１２２，１２４中に照会キーが見付からなければ、キー照会部１０８は、続いて検索用ＬＯＵＤＳ群１３０に対する問い合わせを行う。

　キー照会部１０８は、検索用ＬＯＵＤＳ群１３０に対する問い合わせにおいては、新しいものから順に、下位ＬＯＵＤＳ１３２－１～１３２－ｘの探索を試みる。その際に、下位ＬＯＵＤＳ１３２の探索に先だって、キー照会部１０８は、対応するブルームフィルタ１３４に対し、その対応する下位ＬＯＵＤＳ１３２内に照会キーが存在する可能性を確認する。ブルームフィルタ１３４から肯定的な結果が得られた場合は、対応する下位ＬＯＵＤＳ１３２に問い合わせが行われるが、否定的な結果が得られた場合は、下位ＬＯＵＤＳ１３２自体に対する問い合わせは省略され、次に新しい下位ＬＯＵＤＳへと探索対象が進められる。これにより、キー照会部１０８は、キーバリュー・ストア１２０に格納されたキーの値（複数あるのであればその最新の値）を取得し、要求元に返却する。

　ＬＯＵＤＳ結合部１１０は、所与の戦略に従って、複数の下位ＬＯＵＤＳ１３２を結合し、より上位のＬＯＵＤＳを構築する。なお、ＬＯＵＤＳ結合処理については、詳細を後述する。

（２）キー追加処理
　以下、図３を参照して、本実施形態によるキーバリュー・ストア１２０におけるキー追加処理の詳細について説明する。図３は、本実施形態によるコンピュータ装置が実行する、キーバリュー・ストアに対するキー追加処理を示すフローチャートである。図３に示す処理は、例えばコンピュータ装置１００が起動し、キーバリュー・ストア１２０に対応するサービスが起動されたことに応答して、ステップＳ１００から開始される。

　ステップＳ１０１では、キー追加部１０４は、データ入力要求の受領を待ち受け、データ入力要求を受領するまで（ＮＯの間）、ステップＳ１０１をループさせる。ステップＳ１０１で、データ入力要求を受領したと判定された場合（ＹＥＳ）は、ステップＳ１０２へ処理が進められる。ステップＳ１０２では、キー追加部１０４は、入力データ・セット（キーおよび値）を受け取り、ステップＳ１０３では、キー追加部１０４は、入力データ・セットのキーを入力バッファトライ木１２２中に追記し、該キーに関連付けて入力データ・セットの値を格納する。

　ステップＳ１０４では、キー追加部１０４は、入力バッファトライ木１２２に追加された新規データ数が規定数ｎ以上となったか否かを判定する。新規データ数は、新たな入力バッファが準備される毎にリセットされ、入力データ・セットを追加する毎に増分するカウンタを用いて計数することができる。ステップＳ１０４で、まだ新規データ数が規定数ｎ未満であると判定された場合（ＮＯ）は、ステップＳ１０１へループし、次のデータ入力要求を待ち受ける。一方、ステップＳ１０４で、新規データ数が規定数ｎ以上になったと判定された場合（ＹＥＳ）は、バッファ準備部１０２を呼び出し、ステップＳ１０５へ処理を進める。

　ステップＳ１０５では、バッファ準備部１０２は、以降の入力データ・セットを受け入れるための新しい入力バッファトライ木１２２を準備する。ステップＳ１０６では、バッファ準備部１０２は、規定数ｎに達した古い入力バッファトライ木１２２を構築用バッファトライ木１２４として設定する。ステップＳ１０７では、バッファ準備部１０２は、ＬＯＵＤＳ構築部１０６を呼び出し、構築用バッファトライ木１２４からのＬＯＵＤＳ構築処理を実行させる。なお、ステップＳ１０７で呼び出されるＬＯＵＤＳ構築処理については、詳細を後述する。

　ステップＳ１０７で呼び出されるＬＯＵＤＳ構築処理が完了すると、ステップＳ１０８では、バッファ準備部１０２は、元の構築用バッファトライ木１２４を検索対象から除外し、新たに構築された構築ＬＯＵＤＳ１４２および構築ブルームフィルタ１４４の新規セット１４０を検索用ＬＯＵＤＳ群１３０に追加する。ステップＳ１０８以降は、処理はステップＳ１０１へ再びループされる。

　図３に示した処理フローにより、キーバリュー・ストア１２０に順次入力データ・セットがオンラインで追記されるとともに、新規入力数が規定数ｎに達する毎に行われるＬＯＵＤＳ構築処理により、動的トライ木から静的でコンパクトなＬＯＵＤＳに変換される。これにより、キーバリュー・ストア１２０全体としてのサイズが省容量化される。

（３）キー照会処理
　以下、図４を参照して、本実施形態によるキーバリュー・ストア１２０におけるキー照会処理の詳細について説明する。図４は、本実施形態によるコンピュータ装置が実行する、キーバリュー・ストアに対するキー照会処理を示すフローチャートである。図４に示す処理は、キー追加処理と同様に、キーバリュー・ストア１２０に対応するサービスが起動されたことに応答して、ステップＳ２００から開始される。ステップＳ２０１では、キー照会部１０８は、データ照会要求の受領を待ち受け、データ照会要求を受領するまで（ＮＯの間）、ステップＳ２０１をループさせる。ステップＳ２０１で、データ照会要求を受領したと判定された場合（ＹＥＳ）は、ステップＳ２０２へ処理が進められる。

　ステップＳ２０２では、キー照会部１０８は、入力バッファトライ木１２２に対し、照会キーを問い合わせる。ステップＳ２０３では、キー照会部１０８は、入力バッファトライ木１２２で照会キーが発見されたか否かを判定する。ステップＳ２０３で、肯定的な結果が得られ、入力バッファトライ木１２２内に照会キーで見付かったと判定された場合（ＹＥＳ）は、ステップＳ２１３へ処理を進める。ステップＳ２１３では、キー照会部１０８は、入力バッファトライ木１２２から照会キーに対応する値を読み出し、キー照会要求に対する応答として、要求元に返却する。

　ステップＳ２０３で、否定的な結果が得られ、入力バッファトライ木１２２内で照会キーが見付からなかったと判定された場合（ＮＯ）は、ステップＳ２０４へ処理が進められる。ステップＳ２０４では、キー照会部１０８は、構築用バッファトライ木１２４に対し照会キーを問い合わせる。ステップＳ２０５では、キー照会部１０８は、構築用バッファトライ木１２４内で照会キーが発見されたか否かを判定する。ステップＳ２０５で、肯定的な結果が得られ、構築用バッファトライ木１２４内で照会キーが見付かったと判定された場合（ＹＥＳ）は、ステップＳ２１３へ処理が進められる。この場合、ステップＳ２１３では、キー照会部１０８は、構築用バッファトライ木１２４から照会キーに対応する値を読み出し、キー照会要求に対する応答として、照会キーに対応する値を返却する。

　一方、ステップＳ２０５で、否定的な結果が得られ、構築用バッファトライ木１２４内で照会キーが見付からなかったと判定された場合（ＮＯ）は、ステップＳ２０６へ処理を進める。なお、構築用バッファトライ木１２４が存在しなかった場合は、否定的な結果が得られるものとする。

　ステップＳ２０６～ステップＳ２１１のループでは、検索用ＬＯＵＤＳ群１３０を構成する各下位ＬＯＵＤＳ１３２について、若いものから順に探索が行われる。ステップＳ２０７では、キー照会部１０８は、上記ループにおいて処理対象となる下位ＬＯＵＤＳ１３２自体への問い合わせることに先立って、該下位ＬＯＵＤＳ１３２のブルームフィルタ１３４に対し、照会キーの存在確認を依頼する。

　ステップＳ２０８では、キー照会部１０８は、ブルームフィルタ１３４から返却される結果から、上記下位ＬＯＵＤＳ１３２中に照会キーが含まれる可能性があるか否かを判定する。ステップＳ２０８で、ブルームフィルタ１３４から否定的な結果が返され、上記下位ＬＯＵＤＳ１３２内に照会キーが含まれる可能性が無いと判定された場合（ＮＯ）は、ステップＳ２１１で示すループ終端へ処理を分岐させる。一方、ステップＳ２０８で、ブルームフィルタ１３４から肯定的な結果が返され、上記下位ＬＯＵＤＳ１３２内に照会キーが含まれる可能性が有ると判定された場合（ＹＥＳ）は、ステップＳ２０９へ処理を分岐させる。

　ステップＳ２０９では、キー照会部１０８は、上記下位ＬＯＵＤＳ１３２自体に対し問い合わせを行う。ステップＳ２１０では、キー照会部１０８は、上記下位ＬＯＵＤＳ１３２内で照会キーが発見されたか否かを判定する。ステップＳ２１０で、肯定的な結果が得られ、上記下位ＬＯＵＤＳ１３２内で照会キーが見付かったと判定された場合（ＹＥＳ）は、ステップＳ２１３へ処理が進められる。この場合は、ステップＳ２１３では、キー照会部１０８は、上記ループにおいて処理対象となっている下位ＬＯＵＤＳ１３２から照会キーに対応する値を読み出し、キー照会要求に対する応答として、照会キーに対応する値を返却する。

　一方、ステップＳ２１０で、否定的な結果が得られ、当該下位ＬＯＵＤＳ１３２で照会キーが見付からなかったと判定された場合（ＮＯ）は、ステップＳ２１１で示すループ終端へ分岐させて、次に若い下位ＬＯＵＤＳ１３２へと探索処理を進める。ステップＳ２０６～ステップＳ２１１のループを繰り返しても、検索用ＬＯＵＤＳ群１３０内の下位ＬＯＵＤＳ１３２－１～１３２－ｘいずれからも照会キーが見付からなければ、ステップＳ２０６～ステップＳ２１１のループを抜けて、ステップＳ２１２へ処理が進められる。ステップＳ２１２では、キー照会部１０８は、照会キー無しの応答を要求元に返却する。

　図４に示した処理フローにより、キーバリュー・ストア１２０からキーに対応する値を効率良く取得し、要求元に返却することができる。特に、下位ＬＯＵＤＳ１３２に対する問い合わせに先立って、ブルームフィルタ１３４により照会キーが確率的に存在することを確認した上で、存在する可能性がある下位ＬＯＵＤＳ１３２にのみ問い合わせが行われることになる。このため、下位ＬＯＵＤＳ１３２自体へのアクセス回数を低減することが可能となり、全体のリード性能は、データ総数Ｎとともに増加する下位ＬＯＵＤＳ１３２の個数に実質的に影響されない。

　なお、上述した説明では、キー追加処理において、説明の便宜上、入力データ・セットの存在確認を省略して、新規に入力データ・セットが追加されるものとして説明した。しかしながら、他の実施形態では、入力データ・セットの新規追加処理を行う前に、キー照会処理を実施し、入力データ・セットがキーバリュー・ストア１２０中に存在しないことを確認した上で新規追加のデータ操作を行う混合トランザクションとしてもよい。この実施形態では、入力データ・セットがキーバリュー・ストア１２０中に存在することが確認された場合は、上書き更新としてデータ操作を行うこともできる。一方、キーバリュー・ストア１２０中に存在するか否かに関わらず、入力データ・セットを追加して行くとしても、図４に示すように新しいものから順に実データ構造への問い合わせが行われるため、最新の値が取得されることになる。

（４）ＬＯＵＤＳ構築処理
　以下、図５～図９を参照しながら、ＬＯＵＤＳ構築処理の詳細について説明する。上述したように、ＬＯＵＤＳ構築部１０６は、構築用バッファトライ木１２４のトライ木内の各ノードを走査して、該トライ木を表現する構築ＬＯＵＤＳ１４２を構築するとともに、対応する構築ブルームフィルタ１４４を構築する。ＬＯＵＤＳ構築部１０６は、より具体的には、上記トライ木内の各ノードを幅優先走査しながら、トライ木の各ノードの骨格部分を表すビット列、トライ木の各ノードへ張られるエッジを記述する記号列、トライ木の各ノードがキー末尾に対応するかを示すビット列、およびトライ木の各キーに対応する値の配列を生成する。ＬＯＵＤＳ構築部１０６は、さらに、上記幅優先走査しながら、トライ木の各ノードに対し計算されたｋ個のハッシュ値をそれぞれ、その子ノードのハッシュ計算の中間値として引き継ぎつつ、キー末尾に対応するノードに対し計算されたｋ個のハッシュ値を有効化する。

　ＬＯＵＤＳ構築部１０６では、上記幅優先走査を実現するために、以下に示す関数群が定義される。第１の関数は、所与のノード（node）について、該ノードへ張られたエッジが記述する記号を与えるアルファベット取得関数（alphabet(node)）である。第２の関数は、所与のノード（node）について、その第１子ノードを与える第１子ノード取得関数（firstChild(node)）である。ここで、第１子ノードとは、当該ノードの子ノードのうち、最もアルファベットが小さな子ノードに対応する。なお、説明する実施形態では、アルファベットの大小関係は、アルファベット順序に大きくなるものとして定義されている。第１子ノード取得関数は、第１子ノードが存在しない場合は、ｎｕｌｌ値を返却する（firstChild(node)=null）。

　第３の関数は、所与のノード（node）について、同一のノードを親とする次の兄弟ノードを与える兄弟ノード取得関数（Sibling(node)）である。ここで与えられる兄弟ノードは、上記アルファベットの大小関係の定義によれば、当該ノードと同一のノードを親とする兄弟ノードのうち、当該ノードの次に小さいアルファベットのエッジが張られた、当該ノードの直ぐ右に位置する兄弟ノードが対応する。兄弟ノード取得関数は、次の兄弟ノードが存在しない場合は、ｎｕｌｌ値を返却する（Sibling(node)=null）。

　図５は、上記アルファベット取得関数（alphabet(node)）、第１子ノード取得関数（firstChild(node)）および兄弟ノード取得関数（Sibling(node)）を模式的に説明する図である。ノードＳ０の第１子ノード取得関数（firstChild(S0)）は、アルファベット「ａ」、「ｂ」および「ｃ」のうち最も小さなアルファベット「ａ」のエッジが張られたノードＳ１を返却する。ノードＳ１のアルファベット取得関数（alphabet(S1)）は、アルファベット「ａ」を返却する。ノードＳ１の兄弟ノード取得関数（Sibling(S1)）は、「ａ」の次に大きなアルファベット「ｂ」のエッジが張られたノードＳ２を返却する。同様にノードＳ２の兄弟ノード取得関数（Sibling(S2)）は、「ｂ」の次に大きなアルファベット「ｃ」のエッジが張られたノードＳ３を返却する。

　上述したアルファベット取得関数、第１子ノード取得関数および兄弟ノード取得関数を用いて、ルートを起点とし、ルートの第１子ノードから、その兄弟ノードへと幅方向に走査が行われる。次に、ルートの第１子ノードの第１子ノードおよびその兄弟ノード、ルートの第２子ノードの第１子ノードおよびその兄弟ノードへというように、レベル毎に幅方向の走査が行われる。

　図６は、構築用バッファトライ木１２４から構築ＬＯＵＤＳ１４２および構築ブルームフィルタ１４４を構築する処理を模式的に説明する図である。まず、説明する実施形態では、構築ＬＯＵＤＳ１４２を構成する変数群として、ＢＡＳＥ、ＥＤＧＥ、ＬＥＡＦおよびＶＡＬの変数群が定義される。ＢＡＳＥは、トライ木の骨格部分を表すビット列（BitBuffer）である。ＥＤＧＥは、トライ木の各ノードへ張られるエッジを記述する記号列（CharBuffer）である。ＬＥＡＦは、トライ木の各ノードがキー末尾に対応するかを示すビット列（BitBuffer）であり、ＶＡＬは、トライ木に格納されたキーに対応する整数を格納する配列（IntBuffer）である。

　図６を参照しながら、ＢＡＳＥ変数に関し、例示に沿ってＬＯＵＤＳ構築処理を説明すると、まず、ルートのさらに上位ノードとして最上位ルート（Super Root：番人とも呼ばれる。）が設定され、最上位ルートに対応してビット列「１０」がＢＡＳＥに追記される。続いて、ルートｒに対応して、このルートｒの子ノード数分の「１」と、それに続く「０」を含むビット列「１１０」がＢＡＳＥに追記される。

　図６の例示によれば、幅優先走査により、ルートｒに続いてノードＳ１，Ｓ２が順に訪問される。ルートｒの第１子ノードＳ１に対応して、その子ノード数分の「１」とそれに続く「０」を含むビット列「１１０」がＢＡＳＥに追記される。さらにルートｒの第２子ノードノードＳ２に対応して、その子ノード数分の「１」と、それに続く「０」を含むビット列「１０」がＢＡＳＥに追記される。最後に、ノードＳ１，Ｓ２の各子ノードＳ３～Ｓ５に対応して、各ビット「０」がＢＡＳＥに追記される。このようにして、幅優先走査により、ＢＡＳＥのビット列が構築される。

　以下、図６を参照しながら、ＬＥＡＦ変数、ＥＤＧＥ変数およびＶＡＬ変数に関し、ＬＯＵＤＳ構築処理を説明する。上述したように幅優先走査によりルートｒ、ノードＳ１，Ｓ２，Ｓ３，Ｓ４，Ｓ５の順に各ノードが訪問される。訪問順に、まず、ルートｒに対応して、ルートｒがキー末尾でないことを示すビット「０」がＬＥＡＦに追記される。続いてノードＳ１に対応して、ノードＳ１へ張られたエッジが記述する記号「ａ」およびノードＳ１がキー末尾に対応しないことを示すビット「０」が、ＥＤＧＥおよびＬＥＡＦにそれぞれ追記される。続いて、ノードＳ２に対応して、記号「ｂ」およびビット「０」がＥＤＧＥおよびＬＥＡＦにそれぞれ追記される。

　同様に、ノードＳ３に対応して、エッジ「ｂ」およびノードＳ３がキー末尾に対応することを示すビット「１」がＥＤＧＥおよびＬＥＡＦにそれぞれ追記される。ここでは、ノードＳ３のビット「１」の追記とともに、ルートｒから当該ノードＳ３までのノードが表すキー（文字列ａｂ）に対応付けて整数値「１０」をＶＡＬに格納する。ノードＳ１の子ノードＳ４、ノードＳ２の子ノードＳ５についても同様である。このようにして、幅優先走査により、上記ＢＡＳＥとともに、ＬＥＡＦのビット列、ＥＤＧＥの記号列およびＶＡＬの整数の配列が構築される。

　図６を参照しながら、さらに、ブルームフィルタに関し、ＬＯＵＤＳ構築処理を説明する。ブルームフィルタは、ハッシュ値に対応して有効「１」または無効「０」の値を保持するビット配列として構成される。また、ブルームフィルタには、ＰＵＴ関数が定義されており、ＰＵＴ関数が呼び出されると、与えられたハッシュ値に対応するビット配列中の値が有効化される。ブルームフィルタのビット配列は、初期状態ではすべての値が「０」となっており、キーの末尾に対応するノードについてＰＵＴ関数が呼び出されて、ｋ個のハッシュ値に対応するビットが「１」に書き換えられる。

　図６を参照すると、まず、ルートに対するハッシュ初期値が設定される（root.h=0）。続いて、ルートｒを訪れた際に、ルートｒのハッシュ初期値（root.h）からｋ個のハッシュ値が計算され（h=f(root.h)）、計算されたｋ個のハッシュ値が中間ハッシュ値としてその各子ノードに引き継がれる（node(S1).h = node(S2).h = h）。ノードＳ１を訪れた際には、ノードＳ１のｋ個のハッシュ中間値（node(S1).h）からノードＳ１のｋ個のハッシュ値がそれぞれ計算され（h=f(node(S1).h)）、計算されたｋ個のハッシュ値が当該ノードＳ１の各子ノードに引き継がれる（node(S3).h = node(S4).h = h）。

　ノードＳ３を訪れた際には、ノードＳ３のハッシュ中間値（node(S3).h）からハッシュ値が計算され、キー末尾であることに対応してＰＵＴ関数が呼び出され、計算されたｋ個のハッシュ値（h(S3) = f(node(S3).h)）に対応するブルームフィルタのビット配列中のビットが有効化される。このようにして、幅優先走査により、ブルームフィルタのビット配列が構築される。

　図７は、本実施形態のＬＯＵＤ構築処理により構築される構築ＬＯＵＤＳ１４２および構築ブルームフィルタ１４４のデータ構造を例示する。図７（Ａ）に示すように、構築ＬＯＵＤＳ１４２は、ビット列ＢＡＳＥ、記号列ＥＤＧＥ、ビット列ＬＥＡＦおよびキー値配列ＶＡＬとして構成される。

　また構築ブルームフィルタ１４４は、図７（Ｂ）に示すように、ｋ個のハッシュ関数から計算されるｋ個のハッシュ値に対応して、有効「１」または無効「０」を保持する、ビット配列として構成される。構築処理が完了した構築ブルームフィルタ１４４においては、ビット配列は、ＰＵＴ関数によってキー末尾に対応するノードのハッシュ値に対応するビットが「１」に書き換えられている一方で、それ以外のハッシュ値に対応するビットは「０」を保持したままの状態となっている。

　以下、図８および図９に示すフローチャートを参照して、本実施形態によるＬＯＵＤＳ構築処理について詳細を説明する。図８および図９は、本実施形態によるコンピュータ装置が実行する、ＬＯＵＤＳ構築処理を示すフローチャートである。図８および図９に示す処理は、図３に示したステップＳ１０７で呼び出され、ステップＳ３００から開始される。

　ステップＳ３０１では、ＬＯＵＤＳ構築部１０６は、まず幅優先走査のための空のキューと、上述した空のＢＡＳＥ、空のＥＤＧＥ、空のＬＥＡＦ、空のＶＡＬおよび０クリアされたブルームフィルタのビット配列を作成する。ＬＯＵＤＳ構築部１０６は、ステップＳ３０２で、ルートに対するハッシュ初期値を０に設定し、ステップＳ３０３で、最上位ルート（super root）に対応してＢＡＳＥに「１０」を追記し、ステップＳ３０４で、幅優先走査を開始するべく、トライ木のルートｒをキューに追加する。

　ステップＳ３０５では、ＬＯＵＤＳ構築部１０６は、キューが空であるか否かを判定する。ステップＳ３０５で、キューが空ではないと判定された場合（ＮＯ）は、ステップＳ３０６へ処理が分岐される。ステップＳ３０６では、ＬＯＵＤＳ構築部１０６は、キューの先頭からノードを取り出し、該ノードを訪れる。なお、最初のステップＳ３０６では、ステップＳ３０４で追加されたルートが取り出されることになり、以降のステップＳ３０６では、後述するステップＳ３１０で追加されたノードが取り出されることになる。

　ステップＳ３０７では、ＬＯＵＤＳ構築部１０６は、当該ノードのハッシュ中間値（ノードがルートであればハッシュ初期値が対応する。）から当該ノードのハッシュ値を計算する。ここで、ハッシュ関数について具体例をもって説明すると、文字列（s[0,…,s.length]）に対するハッシュ値（h）が下記疑似コードで定義される場合、下記式（１）を用いてハッシュ中間値（node.h）からハッシュ値（h）を計算することができる。

　上記疑似コードおよび上記式（１）中、文字列（s）は、連続する数値で表現され、変数（s.length）は、文字列（s）の末尾の位置を表し、要素（s[i]）は、文字列（s）中の位置ｉにおける記号を表す数値である。定数（P）は、使用される記号の種類の数に近い素数であり、記号がＡＳＣＩＩ文字で表される場合は、例えば「１３１」の値を用いることができる。

　なお、上記疑似コードおよび上記式（１）は、例示であって、各キーに対するハッシュ値が、プレフィックスを共通するキー同士で共通する中間値を用いるような、如何なるハッシュ関数に対し適用することができる。ｋ個のハッシュ関数は、例えば、上記式（１）でそれぞれ異なる定数（P）を用いて用意してもよいし、上記式（１）で異なる初期値を用いて用意してもよい。あるいは、他の実施形態では、充分に幅広なハッシュ値を生成して、それを所定の位置で分割してｋ個のハッシュ関数を用意してもよい。

　ステップＳ３０８では、ＬＯＵＤＳ構築部１０６は、上記第１子ノード取得関数を用いて当該ノードの第１子ノードの取得を試みる。ステップＳ３０９では、ノードが有るか否かによって処理が分岐される。ステップＳ３０９で、ノードが有ると判定された場合（ＹＥＳ）は、ステップＳ３１０へ処理が分岐される。ステップＳ３１０では、ＬＯＵＤＳ構築部１０６は、当該ノードの子ノードをキューに追加する。ステップＳ３１１では、ＬＯＵＤＳ構築部１０６は、上記ステップＳ３０７で計算されたハッシュ値（h）を、当該ノードの各子ノードのハッシュ中間値（child.h）として設定し、計算途中の中間値を引き継ぐ。ステップＳ３１２では、ＬＯＵＤＳ構築部１０６は、上記兄弟ノード取得関数を用いて、当該ノードの次の兄弟ノードの取得を試み、ステップＳ３０９へ処理を進める。

　一方、ステップＳ３０９で、子ノードが存在しない（firstChild(node)=null）か、または最終ノードへ達した（Sibling(node)=null）ことにより、ノード（当該ノードの第１子ノードまたは子ノードの兄弟ノード）がこれ以上存在しないと判定された場合（ＮＯ）は、存在する子ノードすべてがキューに追加されたことになるので、ポイントＡを介して、図９に示したステップＳ３１３へ処理が進められる。

　ステップＳ３１３では、ＬＯＵＤＳ構築部１０６は、ＢＡＳＥに対し、当該ノードの子ノードと同じ個数の「１」と、それに続く「０」とを追記する。ステップＳ３１４では、ＬＯＵＤＳ構築部１０６は、アルファベット取得関数を用いて、当該ノードへ張られるエッジが記述する文字を取得し、ＥＤＧＥに対し、当該ノードのアルファベットを追記する。

　ステップＳ３１５では、ＬＯＵＤＳ構築部１０６は、訪れている当該ノードが、キーの末尾に対応する「リーフ」であるか否かを判定する。なお、説明する実施形態では、キーの末尾に、末尾にしか現れない特殊な文字を追加する実装を採用するものとする。この場合、必ずキー毎にリーフが作成されるため、最底辺のノードを「リーフ」と判定することができる。末尾にしか現れない特殊な文字が用いられず、終端フラグが導入されて中間ノードに対してもキーの値が格納される実施形態は、最底辺のノードと終端フラグが立っている中間ノードとが「リーフ」と判定される。

　ステップＳ３１５で、「リーフ」ではないと判定された場合（ＮＯ）は、ステップＳ３１６へ処理が分岐される。ステップＳ３１６では、ＬＯＵＤＳ構築部１０６は、ＬＥＡＦに対し、「０」を追記し、ポイントＢを介して図８に示すステップＳ３０５へループさせる。一方、ステップＳ３１５で、「リーフ」であると判定された場合（ＹＥＳ）は、ステップＳ３１７へ処理が分岐される。

　ＬＯＵＤＳ構築部１０６は、ステップＳ３１７で、ＬＥＡＦに対し、「１」を追記し、ステップＳ３１８で、ＶＡＬに対し、当該ノードが末尾を表しているキーに対応する値を追記する。ステップＳ３１９では、ＬＯＵＤＳ構築部１０６は、ブルームフィルタのＰＵＴ関数を呼び出し、当該ノードについて算出されたｋ個のハッシュ値に対応するビット配列の値を有効化して登録し、ポイントＢを介して図８に示すステップＳ３０５へループさせる。なお、ＬＥＡＦ中にルートに関するビットを含めることにより、長さ０の文字列が１つだけ含まれるトライ木も正しく扱われるようになる。

　再びステップＳ３０５を参照すると、ステップＳ３０５で、キューが空であり、トライ木の幅優先走査の終端に達したと判定された場合（ＹＥＳ）は、ステップＳ３２０へ処理が分岐される。ステップＳ３２０では、ＬＯＵＤＳ構築部１０６は、生成されたＢＡＳＥに対し、２つのインデックス（ＢＡＳＥ＿ＲＡＮＫ，ＢＡＳＥ＿ＳＥＬＥＣＴ）を作成する。

　ＢＡＳＥ＿ＲＡＮＫは、ランク・ビット・ディレクトリ（Rank Bit Directory）として参照され、ＢＡＳＥビット配列中の０から与えられたｉ番目までの「０」（または「１」）の個数を定数時間で回答することができるインデックスである。例えば、ＢＡＳＥ＿ＲＡＮＫ_０（ｓ，ｉ）は、ｓ［０，．．．，ｉ］中の「０」の個数を回答し、ＢＡＳＥ＿ＲＡＮＫ_１（ｓ，ｉ）は、ｓ［０，．．．，ｉ］中の「１」の個数を回答する。

　これに対して、ＢＡＳＥ＿ＳＥＬＥＣＴは、セレクト・ビット・ディレクトリ（Select Bit Directory）として参照され、与えられたＢＡＳＥビット配列中の（ｉ＋１）番目の「０」（または「１」）の位置を定数時間で回答するインデックスである。例えば、ＢＡＳＥ＿ＳＥＬＥＣＴ_０（ｓ，ｉ）は、（ｉ＋１）番目の「０」の位置を回答し、ＢＡＳＥ＿ＳＥＬＥＣＴ_１（ｓ，ｉ）は、（ｉ＋１）番目の「１」の位置を回答する。

　上記２つのインデックス（ＢＡＳＥ＿ＲＡＮＫ，ＢＡＳＥ＿ＳＥＬＥＣＴ）により、ＢＡＳＥに対する２種類の操作が定義され、これにより、特定ノードの第１子ノード、兄弟ノード、親ノード、最終子ノードなどを取得することができるようになる。すなわち、ＬＯＵＤＳのデータ構造に対しても、上述した第１子ノード取得関数および兄弟ノード取得関数が提供される。インデックス（ＢＡＳＥ＿ＲＡＮＫ，ＢＡＳＥ＿ＳＥＬＥＣＴ）は、ｌをＢＡＳＥの長さとすると、ｏ（ｌ）ビットの余剰メモリ空間を使用して構築することができる。なお、ＢＡＳＥ＿ＲＡＮＫおよびＢＡＳＥ＿ＳＥＬＥＣＴの詳細については、非特許文献４を参照されたい。

　ステップＳ３２１では、ＬＯＵＤＳ構築部１０６は、上述したステップＳ３２０でＢＡＳＥについて説明したものと同様の手法により、ＬＥＡＦに対してもインデックス（ＬＥＡＦ＿ＲＡＮＫ）を作成し、ステップＳ３２２で本ＬＯＵＤＳ構築処理を終了する。

　図５～図９を参照して上述した処理により、構築用バッファトライ木１２４から構築ＬＯＵＤＳ１４２および構築ブルームフィルタ１４４の新規セット１４０が構築される。上記構築処理においては、構築ＬＯＵＤＳ１４２および構築ブルームフィルタ１４４の両方が、１回の幅優先走査によって構築されるため、構築ＬＯＵＤＳ１４２および構築ブルームフィルタ１４４を別々に構築した場合と比較しても、構築にかかる演算コストが低減される。

　さらに、構築ＬＯＵＤＳ１４２は、本質的にメモリ利用効率が高い簡潔データ構造であり、構築ブルームフィルタ１４４も、構築ＬＯＵＤＳ１４２に比べて小さく、キー数に応じたメモリ使用量で構築される。このため、キーバリュー・ストア１２０全体としても、にキーを空間効率高く格納することが可能となる。

（５）ＬＯＵＤＳ結合処理
　以下、図１０～図１６と再度図９とを参照して、図２に示したＬＯＵＤＳ結合部１１０によるＬＯＵＤＳ結合処理について説明する。図１０は、ＬＯＵＤＳ結合処理を説明する図である。上述したように、ＬＯＵＤＳ結合部１１０は、一定の戦略に従って複数の下位ＬＯＵＤＳを結合し、より上位のＬＯＵＤＳを構築する。

　ＬＯＵＤＳ結合部１１０は、より具体的には、複数の下位ＬＯＵＤＳが表現するトライ木それぞれのルートを結合した結合ルートを起点として幅優先走査することにより、結合トライ木を表現する結合ＬＯＵＤＳおよび対応する結合ブルームフィルタを構築する。ここで、結合トライ木とは、上記複数の下位ＬＯＵＤＳが表現する複数のトライ木が結合（merge）され構成されたものである。結合により、下位ＬＯＵＤＳの個数が抑制されるとともに、重複するプレフィックスが共有されるため、データのサイズも圧縮される。

　上述した結合の戦略は、結合処理を呼び出す契機とする条件（以下、結合条件という。）として、管理者等により事前に記述される。結合条件は、特に限定されるものではないが、図１０に示すように、合計２個の同一レベルの下位ＬＯＵＤＳが検索用ＬＯＵＤＳ群１３０に設定されたことに応答して、２個のＬＯＵＤＳ１５０－１，１５０－２を結合対象として結合処理を呼び出すという条件を採用することができる。なお、図１０中、入力バッファトライ木１２２から直接構築された下位ＬＯＵＤＳをＬｅｖｅｌ１ＬＯＵＤＳと参照し、Ｌｅｖｅｌ１ＬＯＵＤＳが２個結合されたものをＬｅｖｅｌ２ＬＯＵＤＳと参照する。

　図１０の例示では、２個のＬｅｖｅｌ１ＬＯＵＤＳ１５０－１，１５０－２を結合して結合ＬＯＵＤＳ１６２および対応する結合ブルームフィルタ１６４のセット１６０が生成される。結合処理が完了すると、結合ＬＯＵＤＳ１６２および結合ブルームフィルタ１６４を含むセット１６０が、Ｌｅｖｅｌ２ＬＯＵＤＳとして検索用ＬＯＵＤＳ群１３０に追加され、一方で、従前の２個のＬｅｖｅｌ１ＬＯＵＤＳ１５０－１，１５０－２は、検索用ＬＯＵＤＳ群１３０から除外される。除外されたＬｅｖｅｌ１ＬＯＵＤＳ１５０－１，１５０－２は、例えばＲＡＭからＨＤＤなどの２次記憶装置にダンプされたり、あるいはＲＡＭから消去されたりすることになる。

　図１１は、本実施形態によるコンピュータ装置が実行する、キーバリュー・ストアにおける結合処理のメインフローを示すフローチャートである。図１１に示す処理は、例えばキーバリュー・ストア１２０に対応するサービスが起動されたことに応答して、ステップＳ４００から開始される。

　ステップＳ４０１では、ＬＯＵＤＳ結合部１１０は、事前設定された結合条件の成立を待ち受け、結合条件が成立するまで（ＮＯの間）、ステップＳ４０１をループさせる。ステップＳ４０１で、結合条件が成立したと判定された場合（ＹＥＳ）は、ステップＳ４０２へ処理が進められる。ここでは、合計２個の下位ＬＯＵＤＳ１５０が検索用ＬＯＵＤＳ群１３０に設定されたことに応答して結合処理が呼び出されるものとする。

　ステップＳ４０２では、ＬＯＵＤＳ結合部１１０は、成立した結合条件にかかる２個の下位ＬＯＵＤＳ１５０を結合対象に設定する。ステップＳ４０３では、ＬＯＵＤＳ結合部１１０は、結合対象として設定された２個の下位ＬＯＵＤＳ１５０を結合するＬＯＵＤＳ結合処理を実行する。なお、ステップＳ４０３で呼び出されるＬＯＵＤＳ結合処理については、詳細を後述する。

　ステップＳ４０３で呼び出されたＬＯＵＤＳ結合処理が完了すると、ステップＳ４０４では、ＬＯＵＤＳ結合部１１０は、新たに構築された結合ＬＯＵＤＳ１６２および結合ブルームフィルタ１６４のセット１６０を検索用ＬＯＵＤＳ群１３０に追加する。ステップＳ４０５では、ＬＯＵＤＳ結合部１１０は、２つの結合済みの下位ＬＯＵＤＳ１５０とブルームフィルタ１５２とのセットを検索用ＬＯＵＤＳ群１３０から除外する。以降は、ステップＳ４０１へ再び処理がループされる。

　なお、結合条件に関連して、他の実施形態では、結合処理をできるだけ遅延する戦略をとるべく、合計Ｍ（Ｍは２以上の自然数である。）個のＬＯＵＤＳが検索用ＬＯＵＤＳ群１３０に設定されることに応答して、２個ずつＬＯＵＤＳを結合対象として結合処理を（Ｍ－１）回呼び出すことができる。この場合、合計Ｍ個のＬＯＵＤＳを結合した結合ＬＯＵＤＳおよび対応する結合ブルームフィルタが構築されることになる。あるいは、詳細を後述する結合処理を拡張して、３以上のＬＯＵＤＳを一括結合して、結合ＬＯＵＤＳおよび対応する結合ブルームフィルタを構築することも妨げられない。

　以下、図１２～図１６および図９を参照しながら、上述したＬＯＵＤＳ結合部１１０によるＬＯＵＤＳ結合処理の詳細について説明する。ＬＯＵＤＳ結合部１１０は、より具体的には、結合対象の２個のＬＯＵＤＳ１５０の各トライ木内の各ノードを幅優先走査しながら、上記結合トライ木の各ノードの骨格部分を表すビット列、結合トライ木の各ノードへ張られるエッジを記述する記号列、結合トライ木の各ノードがキー末尾に対応するかを示すビット列、および結合トライ木の各キーに対応する値の配列を生成する。ＬＯＵＤＳ結合部１１０は、さらに、上記幅優先走査しながら、結合トライ木の各ノードに対し計算されたｋ個のハッシュ値をそれぞれ、その子ノードのハッシュ計算の中間値として引き継ぎつつ、キー末尾に対応するノードに対し計算されたｋ個のハッシュ値を有効化する。

　ＬＯＵＤＳ結合部１１０では、結合トライ木の仮想的な幅優先走査を実現するために、成立した結合条件に関連する２個のトライ木（T1,T2）の各ノード（node1,node2）ついてのアルファベット取得関数（alphabet(node1), alphabet(node2)）、第１子ノード取得関数（firstChild (node1), firstChild (node2)）および兄弟ノード取得関数（Sibling (node1), Sibling (node2)）に加えて、以下に示す関数群が定義される。ここで、結合にかかるトライ木(T1,T2）から得られる２個のノード（node1,node2）を結合した、結合ノード（M(node1,node2)）を導入する。

　第１の関数は、所与の結合ノード（M(node1,node2)）について、該結合ノードへのエッジが記述する記号を与えるアルファベット取得関数（alphabet(M(node1,node2))）である。アルファベット取得関数（alphabet(M(node1,node2))）は、下記式（２）を用いて計算される。下記式（２）によれば、結合にかかるトライ木（T1,T2）のノード（node1,node2）のうち最も小さなアルファベットが返却される。

　第２の関数は、所与の結合ノード（M(node1,node2)）について、該結合ノードの第１子ノードを与える第１子ノード取得関数（firstChild(M(node1,node2))）である。ここでの第１子ノードは、結合トライ木（Tm）における当該結合ノードの第１子ノードである。第１子ノード取得関数（firstChild(M(node1,node2))）は、下記式（３）によりトライ木について定義された第１子ノード取得関数（firstChild(node)）を用いて計算される。

　結合ノードについての第１子ノード取得関数は、通常のノードと同様に、第１子ノードが存在しない場合は、ｎｕｌｌ値を返却し（firstChild(M)=null）、その場合のアルファベット取得関数は、任意のアルファベットαより大きな値（alphabet(null)>α）を返却する。上記式（３）によれば、共通のプレフィックスを表すノード（alphabet(node1)=alphabet(node2)）については、両方のトライ木のカーソル位置が進められ、新たな結合ノード（M(firstChild(node1), firstChild(node2))）が返却される。この新たな結合ノードは、結合前の各ノードの子ノードを再帰的に結合したものである。ノードのアルファベットが異なる場合（alphabet(node1)<>alphabet(node2)）は、結合にかかるトライ木（T1,T2）のノード（node1,node2）のうち小さな方のトライ木のカーソル位置が進められ、該小さな方のノードにぶら下がる第１子ノードが返却される。

　第３の関数は、所与の結合ノード（M(node1,node2)）について、該結合ノードと同一のノードを親とする次の兄弟ノードを与える兄弟ノード取得関数（Sibling(M(node1,node2))）である。兄弟ノード取得関数（Sibling (M(node1,node2))）は、下記式（４）を用いて計算される。

　結合ノードについての兄弟ノード取得関数は、通常のノードと同様に、次の兄弟ノードが存在しない場合は、ｎｕｌｌ値を返却し（Sibling(M)=null）、その場合のアルファベット取得関数は、任意のアルファベットαより大きな値（alphabet(null)>α）を返却する。上記式（４）によれば、共通のプレフィックスを表すノード（alphabet(node1)=alphabet(node2)）については、両方のトライ木のカーソル位置が進められ、新たな結合ノード（M(Sibling(node1), Sibling(node2))）が返却される。ノードのアルファベットが異なる場合（alphabet(node1)<>alphabet(node2)）は、結合にかかる２個のトライ木のノード（node1,node2）のうち大きな方のトライ木のカーソル位置をそのまま維持したまま、小さな方のトライ木のカーソル位置が進められ、小さな方のノードの兄弟ノード（Sibling(node)）および大きな方のノード（node）の結合ノードが返却される。

　上記結合ノードについてのアルファベット取得関数、第１子ノード取得関数および兄弟ノード取得関数を各トライ木（T1,T2）のノード（node1,node2）におけるアルファベットの大小関係にて整理すると図１２のように模式的に説明することができる。なお、図１２中、特定のアルファベット「ａ」を有するトライ木（T1,T2）のノード（node1,node2）がそれぞれノードａ１，ａ２のように表されている点に留意されたい。

　図１２（Ａ）は、トライ木Ｔ１およびＴ２のノードが共通のアルファベット、ひいては共通のプレフィックスを表している場合（alphabet(a1) = alphabet(a2)）のアルファベット取得関数（alphabet(M(a1,a2))）、第１子ノード取得関数（firstChild(M(a1,a2))）および兄弟ノード取得関数（Sibling(M(a1,a2))）を模式的に説明する。図１２（Ａ）に示すように、ノード（node1）およびノード（node2）が共通のプレフィックスを表す場合は、第１子ノード取得関数（firstChild(M(a1,a2))）および兄弟ノード取得関数（Sibling(M(a1,a2))）に応答して、それぞれ新たな結合ノード（M(firstChild(a1),firstChild(a2))）および結合ノード（M(Sibling(a1), Sibling(a2))）が返却される。

　図１２（Ｂ）は、トライ木Ｔ１のノードのアルファベットが、トライ木Ｔ２のノードのアルファベットより小さい場合（alphabet(b1) < alphabet(c2)）のアルファベット取得関数（alphabet(M(b1,c2))）、第１子ノード取得関数（firstChild(M(b1,c2))）、兄弟ノード取得関数（Sibling(M(b1,c2))）を模式的に説明する。図１２（Ｃ）は、トライ木Ｔ１のノードのアルファベットが、トライ木Ｔ２のノードのアルファベットより大きい場合（alphabet(d1)>alphabet(c2)）のアルファベット取得関数（alphabet(M(d1,c2))）、第１子ノード取得関数（firstChild(M(d1,c2))）、兄弟ノード取得関数（Sibling(M(d1,c2))）を模式的に説明する。

　図１２（Ｂ）および（Ｃ）に示すように、ノード間でアルファベットが異なる場合は、兄弟ノード取得関数については、新たな結合ノード（M(Sibling(b1),c2)）または結合ノード（M(d1,Sibling(c2))）が返却されるが、第１子ノード取得関数については、アルファベットが小さい方のトライ木における第１子ノードfirstChild(b1)または第１子ノードfirstChild(c2))）が返却される。

　ＬＯＵＤＳ結合部１１０は、上記関数群を用いて、図１４（Ａ）に示すように複数のトライ木（T1,T2）のルート（r1,r2）を結合した結合ルート（M(r1,r2)）を起点として、結合にかかる複数のトライ木（T1,T2）の各ノードを、図１４（Ｂ）に示す想定される結合トライ木について幅優先走査となるように訪問する。これにより、ＬＯＵＤＳ結合部１１０は、結合トライ木（Tm）を表現する結合ＬＯＵＤＳ１６２および結合ブルームフィルタ１６４のセット１６０を構築する。

　以下、図１３および図９に示すフローチャートを参照して、本実施形態によるＬＯＵＤＳ結合処理について詳細を説明する。図１３は、本実施形態によるコンピュータ装置が実行する、ＬＯＵＤＳ結合処理を示すフローチャートである。なお、図１３におけるポイントＡおよびポイントＢ間の処理は、図９に示したＬＯＵＤＳ構築処理のフロート同一であるため、同じ図を参照する。図１３および図９に示す処理は、図１１に示したステップＳ４０３で呼び出されて、ステップＳ５００から開始される。

　ステップＳ５０１では、ＬＯＵＤＳ結合部１１０は、まず幅優先走査のための空のキューと、上述した結合ＬＯＵＤＳ用の空のＢＡＳＥ、空のＥＤＧＥ、空のＬＥＡＦ、空のＶＡＬおよび０クリアされた結合ブルームフィルタ用のビット配列を作成する。ＬＯＵＤＳ結合部１１０は、ステップＳ５０２で、ルートに対するハッシュ初期値を０に設定し、ステップＳ５０３で、最上位ルート（super root）に対応してＢＡＳＥに「１０」を追記し、ステップＳ５０４で、幅優先走査を開始するべく、結合にかかる２個のトライ木（T1,T2）の結合ルート（M(r1,r2)）をキューに追加する。

　なお、ステップＳ５０５以降の処理は、実行主体がＬＯＵＤＳ構築部１０６に代わってＬＯＵＤＳ結合部１１０となることを除いて、概ね図８および図９に示したステップＳ３０５～Ｓ３２２と同様の処理が行われる。ステップＳ３１８に対応するステップでは、２つのトライ木（T1,T2）間でキーが重複した場合は、新しい方の下位ＬＯＵＤＳ１５０に対応する値を優先すればよい。それ以外の処理は、概ね同様であるため、詳細な説明は割愛する。

　図１５および図１６は、図１３および図９に示す処理により、図１４（Ａ）に例示した２個のトライ木（T1,T2）をそれぞれ辿ることにより結合トライ木（Tm）が仮想的に辿られる様子を説明する図である。図１５（Ａ）は、結合ルート（M(r1,r2)）が訪問された際に、結合ルート（M(r1,r2)）直下の子ノードが列挙されている様子を示す図である。結合ルート（M(r1,r2)）に対する第１子ノード取得関数が呼び出されると、図１２（Ａ）に示した演算により、第１子ノードとして結合ノード（M(a1,a2)）が取得される。

　続いて、結合ノード（M(a1,a2)）に関連して、兄弟ノード取得関数が順次呼び出され、カーソル位置が進められ、結合ノード（M(a1,a2)）の兄弟ノードとして、結合ノード（M(b1,f2)）および結合ノード（M(null,f2)）が順に取得される。ここで、ノードｂ１およびノードｆ２は、第１のトライ木（T1）におけるノードａ１の兄弟ノードｂ１、および第２のトライ木（T2）におけるノードａ２の兄弟ノードｆ２である。

　図１５（Ａ）を参照して説明した処理により、結合トライ木（Tm）における結合ルート（M(r1,r2)）直下の子ノードがすべて列挙され、キューに投入されることになる。そして、幅優先走査により、結合ノード（M(a1,a2)）、結合ノード（M(b1,f2)）および結合ノード（M(null,f2)が順次走査されると、アルファベット取得関数により、順次、「ａ」、「ｂ」、「ｆ」が小さい順に列挙される。同時に、結合ノード（M(a1,a2)）、結合ノード（M(b1,f2)）および結合ノード（M(null,f2)）の各結合ノードの子ノードが、第１子ノード取得関数および兄弟ノード取得関数により順次取得され、順次キューに投入されることになる。

　なお、後述するように結合ノード（M(a1,a2)）の走査が先に行われるが、結合ノード（M(b1,f2)）および結合ノード（M(null,f2)）が走査された際には、それぞれ、第１子ノード取得関数により、第１のトライ木（T1）のノードｂ１にぶら下がる子ノードｅ１および第２のトライ木（T2）のノードｆ２にぶら下がる子ノードｆ２への走査に繋げられる。

　図１５（Ｂ）は、例示として結合ノード（M(a1,a2)）が訪問された際に結合ノード（M(a1,a2)）直下の子ノードが列挙されている様子を示す。結合ノード（M(a1,a2)）に対する第１子ノード取得関数が呼び出されると、第１子ノードとして、結合ノード（M(c1,d2)）が取得される。ここで、ノードｃ１，ｄ２は、第１のトライ木（T1）におけるノードａ１の第１子ノードｃ１、および第２のトライ木（T2）におけるノードａ２の第１子ノードｄ２である。

　続いて、結合ノード（M(c1,d2)）に関連して、兄弟ノード取得関数が順次呼び出され、兄弟ノードとして、結合ノード（M(g1,d2)）および結合ノード（M(g1,null)）が順次取得される。ここで、ノードｇ１は、第１のトライ木（T1）におけるノードｃ１の兄弟ノードｂ１である。

　図１５（Ｂ）を参照して説明した処理により、結合トライ木（Tm）における結合ノード（M(a1,a2)）直下の子ノードがすべて列挙され、キューに投入されることになる。結合ノード（M(c1,d2)）、結合ノード（M(g1,d2)）および結合ノード（M(g1,null)が順に走査されると、アルファベット取得関数により順次、「ｃ」、「ｄ」、「ｇ」が小さい順に列挙される。同時に、結合ノード（M(c1,d2)）、結合ノード（M(g1,d2)）および結合ノード（M(g1,null)の各結合ノードの子ノードが、第１子ノード取得関数および兄弟ノード取得関数により順次取得され、順次キューに投入されることになる。

　図１６（Ａ）は、第１子ノード取得関数および兄弟ノード取得関数により、結合ノード（M(c1,d2)）が訪問された際にその直下の子ノードが列挙されている様子を示す。図１６（Ｂ）は、結合ノード（M(g1,d2)）が訪問された際にその直下の子ノードが列挙されている様子を示す。

　図１５および図１６に例示した流れにより、図１４（Ｂ）に示すように、２個のトライ木（T1,T2）を結合した結合トライ木（Tm）の各ノードを幅優先走査することに相当する走査が２個のトライ木（T1,T2）について行われる。

　図１２～図１６および図９を参照して上述した処理により、２個の下位ＬＯＵＤＳ１５０－１，１５０－２から結合ＬＯＵＤＳ１６２および結合ブルームフィルタ１６４のセット１６０が構築される。上記結合処理においては、結合ＬＯＵＤＳ１６２および結合ブルームフィルタ１６４の両方が、各１回下位ＬＯＵＤＳ１５０のトライ木を幅優先走査することによって構築されるため、結合ＬＯＵＤＳ１６２および結合ブルームフィルタ１６４を別々に構築した場合と比較しても、結合処理にかかる演算コストは低減される。

　また、各１回下位ＬＯＵＤＳ１５０のトライ木を幅優先走査することによってセット１６０が直接構築されるため、一旦下位ＬＯＵＤＳ１５０のトライ木（T1,T2）を結合して結合トライ木（Tm）を構築した後に、結合トライ木を辿って上記セット１６０を構築する場合と比較しても、結合処理にかかる演算コストは低減される。

　さらに、結合ＬＯＵＤＳ１６２は、本質的にメモリ利用効率が高い簡潔データ構造であり、結合ブルームフィルタ１６４も、結合ＬＯＵＤＳ１６２に比べて小さく、キー数に応じたメモリ使用量で構築される。また、結合処理により、下位ＬＯＵＤＳの個数が抑制され、共通するプレフィックスが圧縮され、より空間効率を高くすることが可能となる。また、本実施形態においては、キーバリュー・ストア１２０に対するリード性能は、下位ＬＯＵＤＳの個数に実質的に依存しないため、結合処理がシステム全体に加える負荷が無視できない場合に、好適に上記結合処理をより遅く遅延させることが可能となる。

　なお、上述した実施形態では、２個のＬＯＵＤＳ１５０を結合するものとして説明してきたが、特に限定されるものではない。他の実施形態では、上記２個のＬＯＵＤＳ１５０を結合する構成を一般化して、各トライ木のノードが有するアルファベットの大小関係に応じたアルファベット取得関数、第１子ノード取得関数および兄弟ノード取得関数を定義することにより、３個以上のＬＯＵＤＳ結合処理に拡張することもできる。上記２つの結合する結合ノードの一方が，再帰的に結合ノードであった場合（Ｍ（ｎ１，Ｍ（ｎ２，Ｍ（ｎ３，…））を想定し，それを再帰的に解くことにより，３個以上のＬＯＵＤＳ結合処理についての一般解を得ることができる。

（６）結合処理に関する証明
　上記結合ノード（M）に関する操作によって得られるノードが、結合トライ木（Tm）のノードと同一であることを、以下、木の高さに関し、帰納法を適用することにより証明する。

　まず、任意の木Ｔのルートｒ（Ｔ）のアルファベットが常に等しいとする（例えば文字列は常に記号「＄」で始まるとする）。ここで、木Ｔの高さは、ルートｒ（Ｔ）から任意のリーフまでのパス長の最大値を示すものとする。例えば、ルートのみからなる木の高さは１であり、ルートの直下にリーフだけが存在する木の高さは２である。

　まず、高さ１の２個の木Ｔ１，Ｔ２の結合は、アルファベット取得関数（alphabet(r(T1), t(T2))）により自明に定まる。このとき、第１子ノード取得関数（firstChild）および兄弟ノード取得関数（Sibling）は、木Ｔ１，Ｔ２に存在しないため、走査中一度も呼ばれない。

　続いて、木の高さｈ＞１とし、ここで、高さ（ｈ－１)以下の任意の木Ｔ１，Ｔ２に対して、上記結合操作により正しい結合木の走査が実行されると仮定する。

　まず、走査の初期にアルファベット取得関数（alphabet(r(T1),r(T2))）が呼ばれるが、これは自明に結合木のルートを定めるものである。木Ｔ１，Ｔ２の走査を行うカーソル位置は、それぞれ木Ｔ１におけるルートの第１子ノード（firstChild(r(T1))）および木Ｔ２におけるルートの第１子ノード（firstChild(r(T2))）に移動する。このとき、
（１）木Ｔ１におけるルートの第１子ノード（firstChild(r(T1))）が存在しない場合は、木Ｔ１の走査が完了したことになり、結合ノード(M)の定義より、以後常にfirstChild(M(node1, node2))=firstChild(node2)、sibling(M(node1,node2))=sibling(node2)となる。帰納法の仮定により、木Ｔ２におけるルートの第１子ノード（firstChild(r(T2))）および兄弟ノード（Sibling(firstChild(r(T2)))）、・・・をそれぞれルートとする木に関しては正しく結合されるので、木Ｔ１，Ｔ２の結合も正しく行われることになる。
（２）木Ｔ２におけるルートの第１子ノード（firstChild(r(T2))）が存在しない場合、上記（１）と同じ議論により、結合が正しく行われることになる。
（３）木Ｔ１におけるルートの第１子ノード（firstChild(r(T1))）および木Ｔ２におけるルートの第１子ノード（firstChild(r(T2))）が共に存在する場合、第１子ノード取得関数（firstChild(M(r(T1), r(T2)))）の定義により、結合木のノードＺが新たに１個作られる。新たなノードＺをルートとする木の高さは、ｈ－１以下であることから、帰納法の仮定により、正しく結合が行われることになる。さらに、新たなノードＺをルートとする木が正しく作成されるのであるから、ノードＺの作り方からノードＺ自体も正しい結合に対応することになる。続いて幅優先走査により順に兄弟ノード取得関数（sibling(M(node1, node2))）を１回呼ぶ毎に新しいノードが作られるが、これも上述した第１子ノード取得関数で行ったのと同一の議論で、正しく結合が行われることになる。

（７）ハードウェア構成
　図１７は、本実施形態のコンピュータ装置の概略的なハードウェア構成を示す。図１７に示すコンピュータ装置１００は、中央処理装置（ＣＰＵ）１２と、ＣＰＵ１２が使用するデータの高速アクセスを可能とするＬ１およびＬ２などのレベルを有するキャッシュ・メモリ１４と、ＣＰＵ１２の処理を可能とするＤＲＡＭなどの固体メモリ素子から形成されるシステム・メモリ１６とを備えている。

　ＣＰＵ１２、キャッシュ・メモリ１４およびシステム・メモリ１６は、システム・バス１８を介して、他のデバイスまたはドライバ、例えば、グラフィックス・ドライバ２０およびネットワーク・インタフェース・カード（ＮＩＣ）２２へと接続されている。グラフィックス・ドライバ２０は、バスを介して外部のディスプレイ２４に接続されて、ＣＰＵ１２による処理結果をディスプレイ画面上に表示させることができる。また、ＮＩＣ２２は、物理層レベルおよびデータリンク層レベルでコンピュータ装置１００を、ＴＣＰ／ＩＰなどの適切な通信プロトコルを使用するネットワークへと接続している。

　システム・バス１８には、さらにＩ／Ｏバス・ブリッジ２６が接続されている。Ｉ／Ｏバス・ブリッジ２６の下流側には、ＰＣＩなどのＩ／Ｏバス２８を介して、ＩＤＥ、ＡＴＡ、ＡＴＡＰＩ、シリアルＡＴＡ、ＳＣＳＩ、ＵＳＢなどにより、ハードディスク装置３０が接続されている。また、Ｉ／Ｏバス２８には、ＵＳＢなどのバスを介して、キーボードおよびマウスなどのポインティング・デバイスなどの入力装置３２が接続されていて、この入力装置３２によりユーザ・インタフェースが提供される。

　コンピュータ装置１００のＣＰＵ１２としては、いかなるシングルコア・プロセッサまたはマルチコア・プロセッサを用いることができる。コンピュータ装置１００は、ＷＩＮＤＯＷＳ（登録商標）２００Ｘ、ＵＮＩＸ（登録商標）、ＬＩＮＵＸ（登録商標）などのオペレーティング・システム（以下、ＯＳとして参照する。）により制御される。コンピュータ装置１００は、上記ＯＳの管理の下、システム・メモリ１６上などにプログラムを展開し、プログラムを実行し、各ハードウェア資源を動作制御することによって、上述した機能部の構成および処理をコンピュータ上に実現する。

（７）実験
（７－１）コンピュータ装置における実装
　クロック数２．２ＧＨｚのＤｕａｌ　Ｃｏｒｅ　Ｏｐｔｅｒｏｎ（登録商標）２７５プロセッサ２機と、２ＭＢの２次キャッシュ、４ＧＢのＰＣ３２００のＲＡＭ、７５０ＧＢのＳＡＴＡインタフェースのＨＤＤ（７２００ｒｐｍ）２機を備えるＩｎｔｅｌｌｉＳｔａｔｉｏｎ（登録商標）ＡＰｒｏを用いて、本実施形態によるキーバリュー・ストアを実現するコンピュータ装置を実装した。このコンピュータ装置のオペレーティング・システムは、Ｗｉｎｄｏｗｓ（登録商標）２００３　Ｓｅｒｖｅｒ　Ｓｔａｎｄａｒｄ　ｘ６４　Ｅｄｉｔｉｏｎ　ＳｅｒｖｉｃｅＰａｃｋ２であり、上記プログラムは、Ｊａｖａ（登録商標）言語（Ｖｅｒｓｉｏｎ　１．６．０）によって記述した。

（７－２）ＬＯＵＤＳ構築処理に関する実験結果
　図２に示すキーバリュー・ストア１２０を実現するシステムをコンピュータ装置上に構築し、本発明の実施形態によるＬＯＵＤＳ構築部１０６を実現した。所定入力サイズの構築用バッファトライ木１２４を準備し、この構築用バッファトライ木１２４からＬＯＵＤＳ構築処理により下位ＬＯＵＤＳ１３２およびブルームフィルタ１３４を同時に生成した。そして、上記ＬＯＵＤＳ構築処理を完了させるまでにかかった演算時間と、生成されたデータ構造１３２，１３４のサイズとを測定した。なお、ブルームフィルタ１３４は、１キーワードあたり３ビットのビット配列を準備し、２個のハッシュ関数によって各２ビットを有効化する構成とした。

　さらに、比較のため、ＬＯＵＤＳを単独で構築する処理のプログラムを実行し、所定入力サイズの構築用バッファトライ木１２４から単独でＬＯＵＤＳを生成した。そして、上記単独でＬＯＵＤＳを構築する処理を完了させるまでにかかった演算時間を測定した。さらに比較のため、生成されたＬＯＵＤＳからキーを取り出して別途ブルームフィルタを構築する処理のプログラムを実行し、所定入力サイズの構築用バッファトライ木１２４から生成されたＬＯＵＤＳから、ブルームフィルタを生成した。そして、上記ブルームフィルタの構築を完了させるまでにかかった演算時間を測定した。

　構築用バッファトライ木の入力キー数を６５０万キーワードとして行った、ＬＯＵＤＳ構築処理（ＬＯＵＤＳ＋ＢＦ）、ＬＯＵＤＳ単独構築処理（ＬＯＵＤＳ単独）およびブルームフィルタ構築処理（ＢＦ）にかかる実験例を、それぞれ、実験例１、実験例２および実験例３と参照する。複数の入力キー数の構築用バッファトライ木を用いて行った、ＬＯＵＤＳ構築処理（ＬＯＵＤＳ＋ＢＦ）およびＬＯＵＤＳ単独構築処理（ＬＯＵＤＳ単独）にかかる実験例を、それぞれ、実験例４および実験例５と参照する。実験例１および実験例４は、実施例に対応する。

　図１８（Ａ）は、上記実験例１～実験例３について測定された演算時間（sec）をプロットした棒グラフである。図１８（Ｂ）は、実験例１で構築されたＬＯＵＤＳおよびブルームフィルタ（ＢＦ）の各データ構造のサイズを表す積み上げ棒グラフである。

　ＬＯＵＤＳおよびブルームフィルタを同時に生成しない場合は、データ構造１３２，１３４の生成には、図１８（Ａ）に示す実験例２および実験例３の演算時間の合計が必要となる。これに対して、図１８（Ａ）を参照すると、ＬＯＵＤＳを生成する過程でブルームフィルタを同時に生成する場合（実験例１）には、ブルームフィルタの生成コストは、１回のＬＯＵＤＳの生成あたり約２４％程度であった。

　図１８（Ｂ）は、ＬＯＵＤＳおよびブルームフィルタのサイズを表すが、実験例１で使用した入力サイズ（６５０万キーワード）では、全体として１キーワードあたり９．４バイトを消費し、そのうちのブルームフィルタは、ＬＯＵＤＳのサイズの約６．８％を占めていた。

　図１９（Ａ）は、上記実験例４および実験例５で測定された、入力サイズ（キー数）に対し演算時間（sec）をプロットした折れ線グラフである。なお、図１９（Ａ）中、△記号で示す系列（オーバーヘッド）は、ＬＯＵＤＳ構築処理（ＬＯＵＤＳ＋ＢＦ）およびＬＯＵＤＳ単独構築処理（ＬＯＵＤＳ単独）にかかる演算時間の差分であり、ブルームフィルタの生成コストを表す。

　図１９（Ａ）を参照すると、オーバーヘッドの入力サイズ（キー数）に対する増加量が、ＬＯＵＤＳ生成コストの増加量に比べて小さいことが理解される。つまり、キー数が増大するにつれ、ブルームフィルタの生成コストの全体に占める割合が減少することが示された。

（７－３）キー追加処理に関する実験結果
　図２に示すキーバリュー・ストア１２０を実現するシステムをコンピュータ装置上に構築した。そして、キーバリュー・ストア１２０に対し、ユニークな入力キーを追加した場合のスループットを測定した。なお、バッファサイズｎは、１００，０００とし、同レベルのＬＯＵＤＳを結合する個数を示す結合ファクタを４とした。すなわち、４個の同レベルの下位ＬＯＵＤＳが生じる毎に、４個の下位ＬＯＵＤＳから一括で１個の上位のＬＯＵＤＳへ結合した。３，２８０，５０５個のキー入力数に対しては、最終的には、１，６０００００個のキーを含む２つのＬＯＵＤＳと、８０５０５個のキーを含むバッファトライ木が生成される。また、ブルームフィルタは、上記（７－２）の場合と同一構成とした。

　さらに、比較のため、図２に示すキーバリュー・ストア１２０からブルームフィルタの構成を除いたシステムをコンピュータ装置上に構築した。そして、このシステムのキーバリュー・ストアに対し、ユニークな入力キーを追加した場合のスループットを測定した。なお、バッファサイズ、結合ファクタ、ブルームフィルタの構成は、上記と同一とした。

　図２に示すシステム（ＬＯＵＤＳ＋ＢＦ）および、図２に示すキーバリュー・ストア１２０からブルームフィルタの構成を除いたシステム（ＬＯＵＤＳ）について行ったキー追加処理にかかる実験例を、それぞれ、実験例６および実験例７と参照する。実験例６は、実施例に対応する。

　図１９（Ｂ）は、上記実験例６および実験例７で測定されたスループットを、測定時点までに入力されたキーの数に対してプロットした折れ線グラフである。図１９（Ｂ）を参照すると、上記実験例６および実験例７の両方に関して、入力キー数が増加するに伴い、ＬＯＵＤＳを構築するためのオーバーヘッドに起因して全体のスループットは低下する傾向が観測された。しかしながら、図１９（Ｂ）に示す上記実験例６および実験例７を比較すると、実験例６には僅かにブルームフィルタ生成コストが認められるが、他のコストに隠蔽され、実験例６および実験例７間で有意な差は認められなかった。したがって、ブルームフィルタ生成の構成は、有意なパフォーマンス低下を招かないことが示された。

（７－４）キー照会処理に関する実験結果
　図２に示すキーバリュー・ストア１２０を実現するシステムをコンピュータ装置上に構築した。なお、バッファサイズｎは、１００，０００とし、結合ファクタを４とし、合計３，２８０，５０５キーワードを入力して、用いるキーバリュー・ストア１２０を構成した。また、ブルームフィルタは、上記（７－２）の場合と同一構成とした。そして、構成されたキーバリュー・ストア１２０に対し、キー照会を行い、その際のスループットを測定した。

　さらに、比較のため、図２に示すキーバリュー・ストア１２０からブルームフィルタの構成を除いたシステムをコンピュータ装置上に構築し、上記と同一のバッファサイズ、結合ファクタ、キーワード数、ブルームフィルタの構成のキーバリュー・ストアを構成した。そして、構成されたキーバリュー・ストアに対し、キー照会を行い、その際のスループットを測定した。

　図２に示すシステム（ＬＯＵＤＳ＋ＢＦ）および図２に示すブルームフィルタの構成を除いたシステム（ＬＯＵＤＳ）について行ったキー照会処理にかかる実験例を、それぞれ、実験例８および実験例９と参照する。実験例８は、実施例に対応する。

　図２０（Ａ）は、上記実験例８および実験例９で測定されたスループットを、キーバリュー・ストア中に照会キーが存在する場合と、存在しない場合とに分けてプロットした棒グラフである。図２０（Ａ）に示すように、存在する照会キーで問い合わせた場合は、スループットに明瞭な差は認められなかった。これは、存在する照会キーで問い合わせた場合は、いずれもＬＯＵＤＳに対する照会が発生するためであると考えられる。これに対し、存在しない照会キーで問い合わせた場合は、図２０（Ａ）に示すように、実験例８および実験例９のスループットの差が顕著となった。これは、存在しないキーで問い合わせた場合は、ブルームフィルタを含まない実験例９ではすべてのＬＯＵＤＳを照会する必要があるのに対して、ブルームフィルタを含む実験例８では、ＬＯＵＤＳへの照会が発生しないためであると考えられる。

（７－５）混合トランザクションに関する実験結果
　図２に示すキーバリュー・ストア１２０を実現するシステムをコンピュータ装置上に構築した。なお、バッファサイズ、結合ファクタ、キーワード数、ブルームフィルタ構成は、上記（７－３）および（７－４）と同一条件とした。そして、構成されたキーバリュー・ストア１２０に対し、新規追加にかかる入力キーについてキー照会を行い、入力キーが存在しない場合にだけ、キー追加処理を行うという混合トランザクションを実行し、その際のスループットを測定した。なお、新規入力キーは、入力全体の２．６５％を占めた。

　さらに、比較のため、図２に示すキーバリュー・ストア１２０からブルームフィルタの構成を除いたシステムをコンピュータ装置上に構築し、上記と同一のバッファサイズ、結合ファクタ、キーワード数、ブルームフィルタの構成のキーバリュー・ストアを構成した。そして、キーバリュー・ストア１２０に対し、混合トランザクションを実行し、スループットを測定した。

　図２に示すシステム（ＬＯＵＤＳ＋ＢＦ）および図２に示すブルームフィルタの構成を除いたシステム（ＬＯＵＤＳ）について行った混合トランザクション処理にかかる実験例を、それぞれ、実験例１０および実験例１１と参照する。実験例１０は、実施例に対応する。

　図２０（Ｂ）は、上記実験例１０および実験例１１で測定されたスループットをプロットした棒グラフである。図２０（Ｂ）を参照すると、より現実に即していると考えられる混合トランザクションにおいても、図２に示すキーバリュー・ストア１２０を実現するシステムは、ブルームフィルタを用いないシステムと比べて、スループットが大幅に改善した。

（７－６）まとめ
　以上の実験結果により、本発明の実施形態によるキーバリュー・ストア１２０を実現するシステムによれば、構築時に大きなコストを上乗せすることなく、キーバリュー・ストア１２０内の各下位ＬＯＵＤＳに対してブルームフィルタを生成し、特に、ストア中に存在しないキーのリード性能が大幅に向上することが示された。この特性は、新しいキーを追加しながらキーおよび値を保持するキーバリュー・ストアにとって効果的である。実験結果によれば、２．５％程度の新規キーを含む入力に対して、ブルームフィルタを用いない実装に比べて、２．５倍の性能差を発揮することが実証された。

　以上説明したように、本発明の実施形態によれば、キーを空間効率高く格納するとともに、オンライン構築が可能で、データ操作性能が改善されたデータストアを実現する、情報処理装置、該データストアを操作するデータストア操作方法およびプログラムを提供することができる

　本発明の実施形態によれば、さらに、トライ木の簡潔データ構造およびフィルタを効率的に構築するためのデータ構築装置およびデータ構築方法、複数のトライ木が結合された簡潔データ構造を効率的に構築するためのデータ結合装置およびデータ結合方法、並びにこれらのプログラムを提供することができる。

　なお、本発明につき、発明の理解を容易にするために各機能部および各機能部の処理を記述したが、本発明は、上述した特定の機能部が特定の処理を実行するほか、処理効率や実装上のプログラミングなどの効率を考慮して、いかなる機能部に、上述した処理を実行するための機能を割当てることができる。

　また、本発明は、キーとして、記号として１バイト文字を用いる文字列のほか、日本語、中国語、韓国語、アラビア語などマルチ・バイトの文字の文字列に対しても適用可能であることは言うまでもない。

　本発明の上記機能は、Ｃ＋＋、Ｊａｖａ（登録商標）、ＪａｖａＢｅａｎｓ（登録商標）、Ｊａｖａ（登録商標）Ａｐｐｌｅｔ、ＪａｖａＳｃｒｉｐｔ（登録商標）、Ｐｅｒｌ、Ｒｕｂｙなどのオブジェクト指向プログラミング言語などで記述された装置実行可能なプログラムにより実現でき、装置可読な記録媒体に格納して頒布または伝送して頒布することができる。

　これまで本発明を、特定の実施形態をもって説明してきたが、本発明は、実施形態に限定されるものではなく、他の実施形態、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。

１２…ＣＰＵ、１４…キャッシュ・メモリ、１６…システム・メモリ、１８…システム・バス、２０…グラフィック・ドライバ、２２…ＮＩＣ、２４…ディスプレイ、２６…Ｉ／Ｏバス・ブリッジ、２８…Ｉ／Ｏバス、３０…ハードディスク装置、３２…入力装置、１００…コンピュータ装置、１０２…バッファ準備部、１０４…キー追加部、１０６…ＬＯＵＤＳ構築部、１０８…キー照会部、１１０…ＬＯＵＤＳ結合部、１２０…キーバリュー・ストア、１２２…入力バッファトライ木、１２４…構築用バッファトライ木、１３０…検索用ＬＯＵＤＳ群、１３２…下位ＬＯＵＤＳ、１３４…ブルームフィルタ、１４０…新規セット、１４２…構築ＬＯＵＤＳ、１４４…構築ブルームフィルタ、１５０…Ｌｅｖｅｌ１ＬＯＵＤＳ、１５２…ブルームフィルタ、１５４…Ｌｅｖｅｌ２ＬＯＵＤＳ、１５６…ブルームフィルタ、１６０…セット、１６２…結合ＬＯＵＤＳ、１６４…結合ブルームフィルタ、５００…コンピュータ装置、５１０…バッファトライ木、５２０…下位ＬＯＵＤＳ

Claims

　データストアを実現する情報処理装置であって、
　入力される入力キーを受け付けて、前記データストアを構成しキーをツリー構造として維持するバッファに対し、該入力キーを追加するキー追加部と、
　前記バッファが維持するツリー構造内のノードを走査して、該ツリー構造を表現する簡潔データ構造を構築するとともに、該簡潔データ構造内にキーが存在することを近似的に判定するフィルタを構築する構築部と、
　前記データストアに対する照会キーの問い合わせに対応して探索を行う際に、簡潔データ構造を探索するのに先だって、対応するフィルタに対し該簡潔データ構造内に前記照会キーが存在することを確認する照会部と
　を含む、情報処理装置。
　前記構築部は、前記バッファが維持するツリー構造内の各ノードを幅優先走査しながら、該ノードに関連する骨格部分を表すビット、該ノードへのエッジを記述する記号、および該ノードがキー末尾に対応するかを示すビットを生成する、請求項１に記載の情報処理装置。
　前記構築部は、前記幅優先走査しながら、該ノードに対し計算された１以上のハッシュ値をそれぞれ子ノードのハッシュ計算の中間値として引き継ぎつつ、キー末尾に対応するノードに対し計算された１以上のハッシュ値を有効化して前記フィルタを構築する、請求項２に記載の情報処理装置。
　複数の簡潔データ構造が表現するツリー構造それぞれのルートを結合した結合ルートを起点として幅優先走査することにより、前記複数の簡潔データ構造を結合し、前記複数の簡潔データ構造により表現される複数のツリー構造を結合した結合ツリー構造を表現する結合簡潔データ構造および対応する結合フィルタを構築する結合部をさらに含む、請求項１に記載の情報処理装置。
　前記結合部は、結合にかかる第１の簡潔データ構造の第１ノードと第２の簡潔データ構造の第２ノードとを結合した結合ノードについて、
　前記第１ノードおよび前記第２ノードが表す記号の大小関係に応じて、前記結合ノードが表す記号を与える記号取得関数、
　前記大小関係に応じて、前記第１ノードの第１子ノード、前記第１ノードの第１子ノードと前記第２ノードの第１子ノードとの結合ノード、または前記第２ノードの第１子ノードを与える第１子ノード取得関数、および
　前記大小関係に応じて、前記第１ノードの兄弟ノードと前記第２ノードとの結合ノード、前記第１ノードの兄弟ノードと前記第２ノードの兄弟ノードとの結合ノード、または前記第１ノードと前記第２ノードの兄弟ノードとの結合ノードを与える兄弟ノード取得関数
　を含む、請求項４に記載の情報処理装置。
　前記照会部は、フィルタから対応する簡潔データ構造中に照会キーが存在しない旨の応答を受けた場合は、該対応する簡潔データ構造の探索を省略する、請求項１に記載の情報処理装置。
　前記バッファにｎ個のキーおよび値のセットが格納される毎に、新しいバッファを準備する準備部をさらに含み、
　前記構築部は、前記バッファに格納される前記セットの数がｎ個に達する毎に、前記ｎ個のセットを格納するバッファから簡潔データ構造およびフィルタのセットを構築する、請求項１に記載の情報処理装置。
　前記照会部は、新しいバッファおよび構築中のバッファの順に探索し、前記バッファ中に照会キーが見付からなかった場合は、新しく構築された順に、フィルタを事前確認し、対応する簡潔データ構造を探索することを特徴とする、請求項７に記載の情報処理装置。
　前記バッファは、リンク構造によるトライ木を含み、前記簡潔データ構造は、ＬＯＵＤＳ（Level-Order Unary Degree Sequence）であり、前記フィルタは、１または複数のハッシュ関数を備えるブルームフィルタであることを特徴とする、請求項１に記載の情報処理装置。
　データストアを操作する方法であって、コンピュータ・システムが、
　入力操作にかかる入力キーを受け付けて、前記データストアを構成しキーをツリー構造として維持するバッファに対し、該入力キーを追加するステップと、
　前記バッファから簡潔データ構造およびフィルタを構築するステップと、
　前記データストアに対する照会キーの問い合わせに応答して探索を行うステップと
　を含み、
　前記構築するステップは、前記バッファが維持するツリー構造内のノードを走査して、該ツリー構造を表現する簡潔データ構造を構築するとともに、該簡潔データ構造内にキーが存在することを近似的に判定するフィルタを構築するステップであり、
　前記探索を行うステップは、簡潔データ構造を探索するのに先だって、対応するフィルタに対し該簡潔データ構造内に前記照会キーが存在することを確認するサブステップを含む、
　データストア操作方法。
　前記走査は、幅優先走査であり、前記構築するステップは、訪れたノードについて、該ノードに関連する骨格部分を表すビット、該ノードへのエッジを記述する記号、および該ノードがキー末尾に対応するかを示すビットを生成する各サブステップを含む、請求項１０に記載のデータストア操作方法。
　前記構築するステップは、前記訪れたノードに対し計算された１以上のハッシュ値をそれぞれ子ノードのハッシュ計算の中間値として引き継ぐサブステップと、キー末尾に対応するノードに対し計算された１以上のハッシュ値を有効化するサブステップとをさらに含む、請求項１１に記載のデータストア操作方法。
　前記構築するステップは、複数の簡潔データ構造が表現するツリー構造それぞれのルートを結合した結合ルートを幅優先走査の起点として設定するサブステップを含み、
　前記幅優先走査によって、前記複数の簡潔データ構造により表現される複数のツリー構造を結合した結合ツリー構造を表現する結合簡潔データ構造および対応する結合フィルタが構築される、請求項１２に記載のデータストア操作方法。
　ツリー構造を表現する簡潔データ構造および対応するフィルタを構築するデータ構築装置であって、
　前記ツリー構造を走査し、該ツリー構造内の各ノードを訪れる手段と、
　前記簡潔データ構造を構成する、訪れたノードに関連する骨格部分を表すビット、該ノードへのエッジを記述する記号、および該ノードがキー末尾に対応するかを示すビットを生成する各手段と、
　前記訪れたノードに対し計算された１以上のハッシュ値をそれぞれ子ノードのハッシュ計算の中間値として引き継ぐ手段と、
　前記訪れたノードがキー末尾に対応する場合に、前記フィルタを構成するために、該ノードに対し計算された１以上のハッシュ値を有効化する手段と
　を備える、データ構築装置。
　ツリー構造を表現する簡潔データ構造および対応するフィルタを構築する方法であって、コンピュータ・システムが、前記ツリー構造を走査し、該ツリー構造内の各ノードを訪れるステップを含み、前記各ノードを訪れるステップは、訪れた各ノードについて、
　前記訪れたノードに対し１以上のハッシュ値を計算するサブステップと、
　前記１以上のハッシュ値をそれぞれ該訪れたノードの子ノードのハッシュ計算の中間値として引き継ぐサブステップと、
　前記簡潔データ構造を構成する、該訪れたノードに関連する骨格部分を表すビットを生成するサブステップと、
　前記簡潔データ構造を構成する、該訪れたノードへのエッジを記述する記号を生成するサブステップと、
　該訪れたノードがキー末尾に対応する場合に、前記簡潔データ構造を構成する、該訪れたノードがキーの末尾に対応することを示すビットを生成するサブステップと、
　前記訪れたノードがキー末尾に対応する場合に、前記フィルタを構成するため該ノードに対し計算された１以上のハッシュ値を有効化するサブステップと
　を含む、データ構築方法。
　複数のツリー構造を結合して構成される結合ツリー構造を表現する簡潔データ構造および対応するフィルタを構築するデータ結合装置であって、
　前記複数のツリー構造それぞれのルートを結合した結合ルートを起点として、前記複数のツリー構造それぞれを走査し、各ノードを訪れる手段と、
　前記簡潔データ構造を構成する、訪れたノードに関連する骨格部分を表すビット、該ノードへのエッジを記述する記号、および該ノードがキー末尾に対応するかを示すビットを生成する各手段と、
　前記訪れたノードに対し計算された１以上のハッシュ値をそれぞれ子ノードのハッシュ計算の中間値として引き継ぐ手段と、
　前記訪れたノードがキー末尾に対応する場合に、前記フィルタを構成するため該ノードに対し計算された１以上のハッシュ値を有効化する手段と
　を備える、データ結合装置。
　複数のツリー構造を結合して構成される結合ツリー構造を表現する簡潔データ構造および対応するフィルタを構築する方法であって、コンピュータ・システムが、前記複数のツリー構造それぞれのルートを結合した結合ルートを起点として、前記複数のツリー構造それぞれを走査し、各ノードを訪れるステップを含み、前記各ノードを訪れるステップは、訪れた各ノードについて、
　前記訪れたノードに対し１以上のハッシュ値を計算するサブステップと、
　前記１以上のハッシュ値をそれぞれ該訪れたノードの子ノードのハッシュ計算の中間値として引き継ぐサブステップと、
　前記簡潔データ構造を構成する、該訪れたノードに関連する骨格部分を表すビットを生成するサブステップと、
　前記簡潔データ構造を構成する、該訪れたノードへのエッジを記述する記号を生成するサブステップと、
　前記簡潔データ構造を構成する、該訪れたノードがキー末尾に対応する場合に、該訪れたノードがキーの末尾に対応することを示すビットを生成するサブステップと、
　前記訪れたノードがキー末尾に対応する場合に、前記フィルタを構成するため該ノードに対し計算された１以上のハッシュ値を有効化するサブステップと
　を含む、データ結合方法。
　請求項１に記載の各機能部としてコンピュータ・システムを機能させるためのコンピュータ実行可能なプログラム。
　請求項１４に記載の各手段としてコンピュータ・システムを機能させるためのコンピュータ実行可能なプログラム。
　請求項１６に記載の各手段としてコンピュータ・システムを機能させるためのコンピュータ実行可能なプログラム。