JP6672190B2 - データベースシステムおよびデータ処理方法 - Google Patents

データベースシステムおよびデータ処理方法 Download PDF

Info

Publication number
JP6672190B2
JP6672190B2 JP2017005121A JP2017005121A JP6672190B2 JP 6672190 B2 JP6672190 B2 JP 6672190B2 JP 2017005121 A JP2017005121 A JP 2017005121A JP 2017005121 A JP2017005121 A JP 2017005121A JP 6672190 B2 JP6672190 B2 JP 6672190B2
Authority
JP
Japan
Prior art keywords
data
node device
storage unit
node
parent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017005121A
Other languages
English (en)
Other versions
JP2018116348A (ja
Inventor
大河 片山
大河 片山
基孝 金松
基孝 金松
繁雄 廣瀬
繁雄 廣瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2017005121A priority Critical patent/JP6672190B2/ja
Priority to US15/864,141 priority patent/US20180203908A1/en
Publication of JP2018116348A publication Critical patent/JP2018116348A/ja
Application granted granted Critical
Publication of JP6672190B2 publication Critical patent/JP6672190B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2471Distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Description

本発明の実施形態は、データベースシステムおよびデータ処理方法に関する。
IoT(Internet of Things)機器の普及により、様々な場所や状況において生成されたデータをネットワーク経由で利用する度合いがますます増大しつつある。従来の技術では、IoT機器等において生成されたデータを、ネットワーク経由で中央サーバー装置に集め、中央サーバー装置のデータベースシステムに格納している。中央サーバー装置のデータベースシステムに格納された膨大なデータは、必要なときにユーザーによって検索され、利用される。
一方で、従来技術において、中央サーバー装置側は、大量のデータを格納するために大規模な記憶手段(例えば、磁気ハードディスク装置や、半導体メモリーなど)を備えなければならず、システムの高コスト化を招く場合があり得る。
また、IoT機器自身や、IoT機器と中央サーバー装置とを仲介する装置(ゲートウェイ装置、ルーター等)も、内部にデータを格納する手段を持っている。しかし、従来技術では、データを中央サーバー装置に集中して保持するシステムアーキテクチャーを採用していることにより、これらの末端の機器や中間の機器の記憶手段は活用されておらず、改善の余地がある。
また、従来技術では、中央サーバー装置にデータを集中的に格納しているため、収集されたデータを検索する(クエリーの実行)際にも、処理の負荷が中央サーバー装置に集中し、効率悪くなる可能性がある。
また、従来技術において、ツリー状に配置したクエリー処理エンジンを階層的に用いてデータを検索するアーキテクチャーも一部において採用されている。しかし、そのようなシステムにおいても、データは中央サーバー装置に集中的に保持されており、上記の負荷集中の問題は解決されにくい。
また、従来の分散データベースシステムにおいて、データへのアクセスの分布の状況に基づいて、データベースの分散配置のさせ方を定め、負荷を分散させる方式が一部において採用されている。しかしながら、アクセス分布に基づく分散配置の決定には、複雑な処理を必要とし、管理が複雑になるという問題が生じ得る。
特開平6−259478号公報
「Apache Drill」,[online],[平成28年11月11日検索],インターネット<URL:http://drill.apache.org/ >
本発明が解決しようとする課題は、データを効率よく格納することができ、検索処理の負荷を分散させることができ、簡単な鍵情報に基づいてデータの再配置を簡単に行うことができるデータベースシステムおよびデータ処理方法を提供することである。
実施形態のデータベースシステムは、複数のノード装置間を親子関係で接続してなる。ノード装置は、データ記憶部と、退避ルール記憶部と、格納処理部と、問合せ処理部とを持つ。データ記憶部は、データを記憶する。退避ルール記憶部は、自ノード装置が最上位の親でない場合には前記データ記憶部に記憶されている前記データを親のノード装置に退避させ、自ノード装置が最上位の親である場合には前記データ記憶部に記憶されているデータを削除するための退避ルールを記憶する。格納処理部は、データの登録要求を受け付けて前記データ記憶部に書き込むとともに、前記退避ルール記憶部の前記退避ルールを参照することによって、前記データに関連付けられた順序情報が示す順序で前記データ記憶部から退避させるべきデータを親のノード装置に退避させまたは前記データ記憶部から削除すべきデータを削除する。問合せ処理部は、データの検索要求を受け付けて、自ノード装置の前記データ記憶部に記憶されている前記データを検索し第1検索結果を取得するとともに、前記検索要求を子のノード装置に送信し当該子のノード装置から第2検索結果を取得し、前記第1検索結果と前記第2検索結果とを要求元に送信する。
第1の実施形態のデータベースシステムの概略構成を示す構成図。 第1の実施形態のノード装置の概略機能構成を示す機能ブロック図。 第1の実施形態のデータベースシステムが保持するデータの基本構造を示す概略図。 第1の実施形態の接続リスト記憶部が記憶する接続リストのデータ構成例を示す概略図。 第1の実施形態の格納情報記憶部が記憶する格納情報のデータ構成例を示す概略図。 第1の実施形態のノード装置におけるデータ登録の処理の手順を示すフローチャート。 第1の実施形態のノード装置におけるデータ検索の処理の手順を示すフローチャート。 第1の実施形態のノード装置において、退避ルールとして定期退避が選択される場合の、データの登録および退避の処理の手順を示すフローチャート。 第1の実施形態のノード装置において、退避ルールとして追加データ量に基づく逐次退避が選択される場合の、データの登録および退避の処理の手順を示すフローチャート。 第1の実施形態のノード装置において、退避ルールとして不足容量に基づく逐次退避が選択される場合の、データの登録および退避の処理の手順を示すフローチャート。 第1の実施形態のノード装置において、退避ルールとして空き容量に基づく逐次退避が選択される場合の、データの登録および退避の処理の手順を示すフローチャート。 第1の実施形態のノード装置におけるデータ移動の処理の詳細な手順を示すフローチャート。 第1の実施形態のノード装置におけるデータ検索の処理の詳細な手順を示すフローチャート。 第2の実施形態のデータベースシステムが保持するデータの基本構造を示す概略図。 第2の実施形態のデータベースシステムにおいて複数の系列を有するデータがツリー構造のノード装置間で分散して格納される状況を示す概略図。 第2の実施形態のデータベースシステムにおいて、複数の系列に共通の格納範囲を用いてノード間のデータ分散を行う場合のデータ格納例を示す概略図。 第2の実施形態のデータベースシステムにおいて、複数の系列のそれぞれで独立の格納範囲を用いてノード間のデータ分散を行う場合のデータ格納例を示す概略図。 第3の実施形態のデータベースシステムにおけるノード装置群の接続形態の例を示す概略図。 第4の実施形態のデータベースシステムにおけるノード装置群の接続形態の例を示す概略図。
以下、実施形態のデータベースシステムおよびデータ処理方法を、図面を参照して説明する。
(第1の実施形態)
図1は、本実施形態によるデータベースシステムの概略構成を示す構成図である。図示するように、データベースシステム100は、階層構造に配置した複数のノード装置10を含んで構成される。つまり、データベースシステム100は、複数のノード装置間を階層構成の親子関係で接続してなるものである。これらのノード装置10は、ツリー構造(木構造)状に配置されている。つまり、各ノード装置10は、0個または1個の親ノードに接続されており、また0個以上の子ノードに接続されている。同図において、上の方に配置されたノード装置10が親の方向であり、下の方に配置されたノード装置10が子の方向である。これらのノード装置10の階層構造において、特に最上位の、親を持たないノード装置は、ルートノード装置である。ルートノード装置には、符号10Rを付している。また、同階層構造において、特に最下位の、子を持たないノード装置はリーフノード装置である。リーフノード装置には、符号10Lを付している。また、ルートノード装置10Rでもリーフノード装置10Lでもないノード装置10は、中間層に属するノード装置である。
なお、ルートノード装置10Rからリーフノード装置10Lまでの深さ(接続の段数)は、すべての枝において同一であってもよいし、枝に依って異なっていてもよい。
データベースシステム100を構築するための実際の装置構成の一例は、次の通りである。ツリー構造における末端に位置するリーフノード装置10Lは、例えば、何らかのIoT機器である。なお「IoT」は、「Internet of Things」の略である。データベースシステム100が蓄積して管理するデータは、ノード装置10Lにおいて生成され、収集される。また、ルートに位置するルートノード装置10Rは、例えば、中央サーバー装置である。ノード装置10Rは、クライアント装置9から、データベースシステム100が管理するデータに関する問合せを最初に受け、その問合せの結果をクライアント装置9に返す。また、ルート層でもリーフ層でもない中間層に位置するノード装置10は、例えば、データを中継する役割を持つゲートウェイ装置である。ゲートウェイ装置は、より具体的には、コンピューターや通信機器(ルーター等)等である。ゲートウェイ装置は、例えば、IoT機器と中央サーバー装置の間をつなぐものである。
なお、ノード装置10の具体例として、中央サーバー装置や、その他のコンピューターや、ルーターや、IoT機器といったものを例示したが、本実施形態におけるノード装置10として機能し得るものはこれらには限られない。
クライアント装置9上では、アプリケーションプログラム(以下において単に「アプリ」と呼ぶ場合がある)が稼働し得る。クライアント装置9上で稼働するアプリケーションプログラムは、データベースシステム100に対して、データを要求するための問合せを発行する。この問合せは、データの検索条件を伴う場合がある。データベースシステムは、クライアント装置9から受け付ける問合せが検索条件を含む場合、その条件に合ったデータを、クライアント装置9に返す。
データベースシステム100は、各ノード装置10(ノード装置10Lやノード装置10Rを含む)に分散してデータを格納する。つまり、ノード装置10Lで生成されたデータは、まずそのノード装置10Lが有する記憶手段に蓄積される。そして、ノード装置10Lの記憶手段においてデータが溢れる前に、データを上の階層の方向に(ルートノード10Rに向かう方向に)退避させる。中間層におけるノード装置10もまた、同様に、データを退避させる。つまり、中間層に位置するノード装置10は、より下位のノード装置10から退避されるデータを蓄積するとともに、装置内の記憶手段においてデータが溢れる前に、データを上の階層の方向に(ルートノード10Rに向かう方向に)退避させる。
なお、ルートノード装置10Rもまた、下位のノード装置10から退避されるデータを蓄積する。ただし、ルートノード装置10Rはより上位のノード装置10に接続されていないため、ルートノード装置10Rの記憶手段においてデータが溢れる前に、不要なデータを削除する。あるいは、ルートノード装置10Rが、不要なデータを単に削除する代わりに、アーカイブ用の記録媒体(例えば、磁気テープや、光磁気ディスク装置など)にデータを記録するようにしてもよい。
次に各ノード装置10の内部の機能構成について説明する。
図2は、ノード装置10(ノード装置10Rやノード装置10Lを含む)の概略機能構成を示すブロック図である。図示するように、ノード装置10は、データ記憶部20と、接続リスト記憶部21と、格納情報記憶部22と、退避ルール記憶部23と、データ収集部31と、格納処理部32と、問合せ処理部35とを含んで構成される。ノード装置10を構成する各部は、電子回路を用いて実現される。また、各部は、必要に応じて、情報を記憶するための記憶手段を含む。また、ノード装置10を、コンピューターとプログラムを用いて実現するようにしてもよい。
なお、ノード装置10は、中間層またはリーフ層に位置するノードである場合、親ノード装置11に接続されている。また、ノード装置10は、ルート層または中間層に位置するノードである場合、子ノード装置12に接続されている。つまり、ノード装置10は、中間層に位置するノードである場合、親ノード装置11と子ノード装置12の両方に接続されている。
なお、親および子は、相対的な概念であり、あるノード装置10は、他のあるノード装置11の子であると同時に、さらに他のあるノード装置12の親でもあり得る。
データ記憶部20は、自ノード装置10が格納するデータを記憶するものである。データ記憶部20は、例えば、磁気ハードディスク装置や半導体メモリー等の記録媒体を用いて実現される。なお、データ記憶部20が記憶するデータの構成については、別の図を参照しながら、後で説明する。
接続リスト記憶部21は、他のノード装置10との接続の情報を記憶する。一形態として、接続リスト記憶部21は、自ノード装置10に直接接続されている親ノード装置11および子ノード装置12の情報のリストを記憶する。また、他の形態として、接続リスト記憶部21が、ツリー構造全体に含まれるすべてのノード装置10の情報のリストを保持するようにしてもよい。接続リスト記憶部21は、他のノード装置10の情報として、アドレス(IPアドレス等)や、ノードの論理名や、接続関係(どのノードがどのノードの親または子であるか)の情報を記憶する。
なお、データ収集部31や格納処理部32や問合せ処理部35が、親または子のノード装置に接続して通信する際に、この接続リスト記憶部21を参照する。
格納情報記憶部22は、自ノード装置10が格納するデータの範囲の情報を記憶する。つまり、格納情報記憶部22は、自ノード装置10のデータ記憶部20に記憶されているデータに関連付けられた順序情報の範囲の情報を記憶する。このデータの範囲の情報は、データの順序を表す情報の範囲(上限および下限)の情報として表現され得る。本実施形態においてデータの順序を表す情報は時刻の情報である。時刻の情報は、例えば、時・分・秒(さらに秒未満の単位を有していてもよい)を表す数値の情報である。また、時刻の情報が、年・月・日などの日付の情報を含んでいてもよい。つまり、格納情報記憶部22は、自ノード装置10が格納するデータの範囲の情報として、時刻の上限および下限の情報を記憶する。
また、格納情報記憶部22は、子ノード装置12またはさらにその子孫(リーフ側の方向)のノード装置に含まれるデータの範囲の情報(これを便宜的に子孫ノード格納情報と呼ぶ)を記憶する。なお、格納情報記憶部22のうちの子孫ノード格納情報を記憶する部分を、子孫ノード格納情報記憶部と呼ぶ。子ノード装置12が格納するデータの範囲を表す情報は、少なくとも、子ノード装置12またはさらにその子孫のノード装置に含まれる最古のデータの時刻情報(その範囲における時刻値の下限)である。
格納情報記憶部22が記憶するデータの具体例については、後で、図面を参照しながら説明する。
退避ルール記憶部23は、自ノード装置10が格納しているデータの中から親ノード装置11に退避するデータを選択するためのルール(方法、ポリシー)を記憶する。ただし、親ノード装置11が存在しない場合には、データを退避する代わりに、単に削除する。
ここで、データベースシステム100のツリー構造における退避ルールの例について説明する。退避ルールとして、(A)定期退避、(B)追加データ量に基づく逐次退避、(C)不足容量に基づく逐次退避、(D)空き容量に基づく逐次退避の4種類を少なくとも挙げることができる。退避ルール記憶部23は、用いるべきルールの種類を識別するデータを記憶する。
つまり、退避ルール記憶部23は、自ノード装置が最上位の親でない場合にはデータ記憶部20に記憶されているデータを親のノード装置に退避させるための退避ルールを記憶する。また、退避ルール記憶部23が記憶する上記の退避ルールは、自ノード装置が最上位の親である場合にはデータ記憶部20に記憶されているデータを削除するためのルールとして適用される。
上記の4種類のルールの詳細を、次に説明する。
(A)定期退避では、予め定めた所定の時間間隔が経過するごとに、予め定めた所定量のデータを、自ノード装置10から親ノード装置11に退避させる。なお定期退避の変形例として、時間帯や曜日や日付等に応じて、上記所定の時間間隔を可変としてもよい。また、時間帯や曜日や日付等に応じて、退避すべきデータの量を可変としてもよい。
つまり、この場合、退避ルール記憶部23は、自ノード装置が最上位の親でない場合にはデータ記憶部20に記憶されているデータの所定量を所定の時間間隔で親のノード装置に退避させ、自ノード装置が最上位の親である場合にはそのデータの所定量を所定の時間間隔で削除するための退避ルール(定期退避のルール)を記憶する。
(B)追加データ量に基づく逐次退避では、データ収集部31が収集したデータを自ノードに追加する際に、追加データ量を計算し、その追加データを格納するための空き容量が自ノードのデータ記憶部20内に確保できるように、データを退避する。つまり、空き容量を確保するために必要な分の古いデータを、自ノード装置10から親ノード装置11に退避させる。なお、このときに計算に用いるデータ記憶部20の容量は、記憶装置が物理的に有する容量であってもよいし、パラメーター等によって設定される容量であってもよい。
つまり、この場合、退避ルール記憶部23は、自ノード装置のデータ記憶部20にデータを書き込む際に書き込むデータのデータ量を計算しデータ記憶部20の空き容量が不十分である場合に、自ノード装置が最上位の親でない場合にはデータ記憶部20に記憶されているデータのうちの空き容量確保に必要な分を親のノード装置に退避させ、自ノード装置が最上位の親である場合にはデータのうちの空き容量確保に必要な分を削除するための退避ルール(追加データ量に基づく逐次退避のルール)を記憶する。
(C)不足容量に基づく逐次退避では、データ収集部31が収集したデータを自ノードのデータ記憶部20に書き込む(追加する)ことを試みて、データ記憶部20の容量が不足した場合には、一定量のデータを退避させる。つまり、その一定量のデータを自ノード装置10から親ノード装置11に退避させる。そして、そのときに追加すべきデータのすべてを自ノードのデータ記憶部20に書き込めるようになるまで、上記一定量のデータの親ノードへの退避を繰り返す。なお、このときも、データ記憶部20の容量は、記憶装置が物理的に有する容量であってもよいし、パラメーター等によって設定される容量であってもよい。
つまり、この場合、退避ルール記憶部23は、自ノード装置のデータ記憶部20にデータの書き込みを試みた結果として容量不足エラーが発生したときに、自ノード装置が最上位の親でない場合にはデータ記憶部20に記憶されているデータを親のノード装置に退避させ、自ノード装置が最上位の親である場合にはデータを削除するための退避ルール(不足容量に基づく逐次退避のルール)を記憶する。
(D)空き容量に基づく逐次退避では、自ノードのデータ記憶部20の空き容量を監視し、空き容量が予め定めた閾値を下回ったときに一定量のデータを親ノード装置11に退避する。あるいは、1件のデータのサイズが固定長である場合には、空き容量の代わりに、データの空き個数(あと何件のデータを格納できるかを表す数値)を監視し、空き個数が予め定めた閾値を下回ったときに一定量のデータを親ノード装置11に退避する。なお、このときも、データ記憶部20の容量は、記憶装置が物理的に有する容量であってもよいし、パラメーター等によって設定される容量であってもよい。
つまり、この場合、退避ルール記憶部23は、自ノード装置のデータ記憶部20の空き容量を監視し空き容量が所定の閾値を下回ったときに、自ノード装置が最上位の親でない場合にはデータ記憶部20に記憶されているデータを親のノード装置に退避させ、自ノード装置が最上位の親である場合にはデータを削除するための退避ルール(空き容量に基づく逐次退避のルール)を記憶する。
以上、4種類のルールを説明したが、これら以外のルールに基づいてデータを子から親へ退避させるようにしてもよい。
また、いずれのルールを用いる場合にも、ルートノード装置10Rにおいては、データを退避させる代わりに、必要量のデータを単にデータ記憶部20から削除する。つまり、古いデータから順に、データベースシステム100から削除するようにする。
なお、特殊な条件下にある場合を除き、一般的には、同じ階層に属している異なるノード装置の間で、データの格納範囲が異なり得る。つまり、あるノード装置に接続された複数の子ノード装置の間で、データの格納範囲が異なる場合がある。また、あるノード装置と、その子ノード装置との間で、データの格納範囲が一部重複する場合があり得る。
上記の「特殊な条件下」とは、例えば、(A)定期退避が用いられ、その定期退避を行うための時間間隔がすべてのノードにおいて同一であって、ルートノード装置10Rからリーフノード装置10Lまでの深さ(接続の段数)がツリーの枝に依らずにすべて一定であって、すべてのリーフノード装置10Lにおけるデータの発生頻度(単位時間当たりのデータ量)が同一であって、且つある階層における各ノード装置での1回あたりの退避データ量が同一である場合である。そのような特殊な条件を満たす場合に限り、階層ごとにその時点におけるデータ格納範囲(上限時刻と下限時刻)が決まる。
データ収集部31は、自ノード装置10に格納すべきデータを収集する。自ノード装置10がルート層または中間層に位置するノードである場合、データ収集部31は、子ノード装置12からのデータを収集する。また、自ノード装置10がリーフ層に位置するノードである場合、データ収集部31は、例えば、自ノード装置10において生成されるデータを収集したり、接続されているセンサー等で生成されるデータを収集したりする。
いずれの場合も、データ収集部31は、収集したデータを格納処理部32に渡す。
格納処理部32は、データ収集部31から渡されるデータを、自ノード装置10のデータ記憶部20に書き込む。また、格納処理部32は、退避ルール記憶部23を参照してえられる退避ルールにしたがって、自ノード装置10のデータ記憶部20から退避させるデータを読み出し、親ノード装置11に送信する。また、データを退避させる際には、格納処理部32は、退避対象のデータをデータ記憶部20から削除する。
ただし、自ノード装置10がルート層に位置するノードである場合には、親ノード装置11が存在しないため、退避すべきデータの親ノード装置11への送信は行わない。
なお、格納処理部32は、データ収集部31から受け取ったデータをデータ記憶部20に書き込んだり、データ記憶部20が保持していたデータを対比させたりする場合には、適宜、格納情報記憶部22を更新する。即ち、格納処理部32は、格納情報記憶部22に記憶されているデータの範囲の情報を更新することにより、その時点でデータ記憶部20に格納されているデータの範囲と、格納情報記憶部22に保持されているデータの範囲の情報とを整合させる。
つまり、格納処理部32は、データの登録要求を受け付けてそのデータをデータ記憶部20に書き込むとともに、退避ルール記憶部23が保持する退避ルールを参照することによって、前記のデータに関連付けられた順序情報(時刻の情報)が示す順序でデータ記憶部20から退避させるべきデータを親のノード装置に退避させる、あるいはルートノードにおいては、格納処理部32は、前記のデータに関連付けられた順序情報(時刻の情報)が示す順序で、データ記憶部20から削除すべきデータを削除する。このとき、格納処理部32は、例えば接続リスト記憶部21を参照することにより、自ノード装置がルートノードであるか否かを知る。
問合せ処理部35は、上位から受け取った検索要求を処理する。具体的には、自ノード装置10がルート層に位置している場合、問合せ処理部35は、クライアント装置9から受け取った検索要求を処理する。また、自ノード装置10が中間層またはリーフ層に位置している場合、問合せ処理部35は、親ノード装置11から受け取った検索要求を処理する。
具体的には、問合せ処理部35は、(1)自ノード装置10のデータベースの検索と、(2)子ノード装置12への検索要求の分配と、(3)検索範囲に応じて検索要求を自ノード装置10において打ち切るか否かの判断と、を行う。
(1)自ノード装置のデータベースの検索は次の通りに行われる。即ち、問合せ処理部35は、格納情報記憶部22を参照し、目的とするデータを自ノード装置のデータ記憶部20が保持している可能性がある場合には、データ記憶部20に格納されているデータを検索する。
(2)子ノード装置への検索要求の分配は、次の通りに行われる。即ち、問合せ処理部35は、格納情報記憶部22を参照し、目的とするデータを子ノード装置12が保持している可能性がある場合には、それらの子ノード装置12に検索要求を分配(転送)する。このとき、問合せ処理部35は、必要に応じて接続リスト記憶部21を参照することによって、分配先とすべき子ノード装置12の情報を得る。
(3)検索要求の打ち切りの判断は、次の通りに行われる。即ち、問合せ処理部35は、格納情報記憶部22を参照し、目的とするデータを子ノード装置12が保持している可能性が全くない場合には、子ノード装置12への検索要求の分配を行わず、自ノード装置10において打ち切る。子ノード装置12に検索要求の分配を行わないのは、例えば、子ノード装置12およびさらにその下(孫等)のノード装置には所定の時刻よりも新しいデータしか格納されておらず、且つ検索要求の対象がその所定時刻よりも古いデータのみである場合である。
つまり、問合せ処理部35は、受け付けた検索要求に含まれる順序情報に関する検索条件を抽出し、自ノード装置のデータ記憶部20には検索条件に合致するデータが記憶されていない場合には、自ノード装置のデータ記憶部20に記憶されているデータの検索を行わず、第1検索結果として空集合のデータを取得したものとする。
また、問合せ処理部35は、受け付けた検索要求に含まれる順序情報に関する検索条件を抽出し、子のノード装置またはより下位のノード装置(つまり、子孫のノード装置群)のデータ記憶部20には検索条件に合致するデータが記憶されていない場合には、検索要求をその系列の子のノード装置に送信せず、当該子のノード装置に関しては第2検索結果として空集合のデータを取得したものとする。
なお、問合せ処理部35は、自ノード装置10のデータベースを検索して得られた結果と、子ノード装置12から返された検索結果とを統合して、親ノード装置11に検索結果を返す。
以上説明したように、問合せ処理部35は、データの検索要求を受け付けて、自ノード装置のデータ記憶部20に記憶されているデータを検索し検索結果(これを便宜的に第1検索結果と呼ぶ)を取得するとともに、検索要求を子のノード装置に送信し当該子のノード装置から検索結果(これを便宜的に第2検索結果と呼ぶ)を取得し、第1検索結果と第2検索結果を統合して要求元に送信する。なお、自ノード装置のデータ記憶部20のデータを検索しない場合には、空集合のデータを、第1検索結果として取り扱う。また、子ノード装置に検索要求を送信しない場合には、空集合のデータを第2検索結果として取り扱う。
次に、データベースシステム100が格納するデータの構造について説明する。
図3は、データベースシステム100が保持するデータの基本構造を示す概略図である。各ノード装置10におけるデータ記憶部20が、同図に示す構造のデータを記憶している。一例として、同図では、表形式でデータを示している。図示するように、データベースシステム100は、時刻(順序情報)とデータ内容とを関連付けて保持し、管理する。時刻は、データ内容に関連付けられた時刻である。一例として、時刻は、そのデータが生成された時刻である。時刻は、「YYYY/MM/DD hh:mm:ss.nnn」(年月日、時分秒、千分の一秒)の形式で表される。データベースシステム100において、データは、関連付けられている時刻によって一意に順序付けられている。また、データ内容は、任意のデータである。一例として、データ内容は、リーフ層のノード装置10Lにおいて生成されたものである。
次に、データベースシステム100が使用する接続リストおよび格納情報について説明する。
図4は、接続リスト記憶部21が記憶する接続リストのデータ構成例を示す概略図である。図示するように、接続リストのデータは、一例として、表形式で表される。この接続リストのデータは、ノード種別、ノード論理名、アドレス、その他のノード属性の各項目を有する。
ノード属性は、接続先のノードが、自ノードから見て、親ノードであるか子ノードであるかを表すデータである。ノードがツリー状に接続されているため、自ノードに直接接続されているノードは、親ノードまたは子ノードのいずれかである。
ノード論理名は、接続先のノードを識別するために付与された論理的な名称である。ノード論理名は、ノードごとにユニークな名称である。
アドレスは、接続先のノードと通信するために用いられるアドレスの情報である。アドレスとしては、例えば、IPアドレスを用いる。
その他のノード属性は、ノード種別やノード論理名やアドレス以外の、接続先のノードの属性を表す情報である。
図4(A)は、中間層に位置するノード装置10が保持する接続リストの例を示す。中間層に位置するノード装置の接続リストは、1個の親ノードの情報と、1個または複数の子ノードの情報とを含む。
図4(B)は、ルート層に位置するノード装置10が保持する接続リストの例を示す。ルート層に位置するノード装置の接続リストは、親ノードの情報を含まず、1個または複数の子ノードの情報を含む。
図4(C)は、リーフ層に位置するノード装置10が保持する接続リストの例を示す。リーフ層に位置するノード装置の接続リストは、1個の親ノードの情報を含み、子ノードの情報を含まない。
図5は、格納情報記憶部22が記憶する格納情報のデータ構成例を示す概略図である。図5(A)および図5(B)のそれぞれは、異なるタイプの格納情報を示している。
図5(A)に示す格納情報は、自ノード格納範囲のデータのみを有し、子ノード格納範囲のデータを持たない。自ノードのデータの格納範囲(時刻の範囲)が定まれば子ノードの格納範囲も定まる場合に、格納情報記憶部22は、図5(A)に示すタイプの格納情報を保持する。
自ノード格納範囲は、その日時データの上限値および下限値で表される。ここでは、日時の過去側(日時の数値の小さい方)を下とし、未来側(日時の数値の大きい方)を上とする。自ノード格納範囲の上限値は、自ノード装置10が格納するデータのうちの最新のデータに関連付けられている時刻(日時)の値である。また、自ノード格納範囲の下限値は、自ノード装置10が格納するデータのうちの最古のデータに関連付けられている時刻(日時)の値である。
このとき、自ノード装置から接続されているすべての子ノード装置およびさらにその子孫のノード装置は、自ノード装置格納範囲の上限値よりも大きい(新しい)時刻に関連付けられたデータを保持する。
格納情報記憶部22が図5(A)に示すタイプの格納情報を保持することにより、ノード装置10において格納されているデータの範囲がわかる。
図5(B)に示す格納情報は、自ノード格納範囲のデータと、子ノード格納範囲のデータとを含む。自ノードのデータの格納範囲(時刻の範囲)が定まれば子ノードの格納範囲も定まるかどうかに関わらず、格納情報記憶部22は、図5(B)に示すタイプの格納情報を保持することができる。
自ノード格納範囲のデータについては、既に上で述べたとおりである。
子ノード格納範囲のデータは、自ノードの直接の子ノードごとに、その子を含む枝(子ノードや孫ノード等を含む枝)が有する最古のデータに関連付けられた日時の情報を持つ。即ち、直接の子ノードごとに、その枝が有するデータに関連付けられた日時の下限値を持つ。また、これらの日時の下限値は、対応する子ノードの論理名と関連付けて保持されている。
格納情報記憶部22が図5(B)に示すタイプの格納情報を保持することにより、自ノード装置および子ノード装置以下において格納されているデータの範囲がわかる。
次に、データベースシステム100を構成する各ノード装置による処理の手順について説明する。
図6は、ノード装置10(ルートノードやリーフノードも含む)におけるデータ登録の処理の手順を示すフローチャートである。以下、このフローチャートに沿って説明する。
まずステップS11において、格納処理部32は、データの登録要求を受け付ける。なお、ルート層または中間層に位置するノード装置10においては、データの登録要求は、子ノード装置12から送られ、データ収集部31が受け付けたものである。また、リーフ層に位置するノード装置10においては、データの登録要求は、データ収集部31におけるデータ生成に基づくものである。
次にステップS12において、格納処理部32は、必要に応じて、自ノードのデータベース(データ記憶部20)内のデータの一部を親ノードに退避させる。つまり、格納処理部32は、親ノード装置11に対して、退避データの登録を要求する。ただし、実際に退避すべきデータ存在するか否かは、退避ルール記憶部23で設定されているルールや、そのときのデータ記憶部20の空き容量の状況等にも依る。
なお、ルート層に位置するノード装置10においては、本ステップの処理で、データを親ノードに退避させる代わりに、単にそのデータの削除を行う。
次にステップS13において、格納処理部32は、自ノードのデータベース(データ記憶部20)にデータを登録する。
以上で、このフローチャート全体の処理を終了する。なお、データの退避と格納の詳細な処理については、後で別のフローチャートを参照しながらさらに詳細に説明する。
図7は、ノード装置10(ルートノードやリーフノードも含む)におけるデータ検索の処理の手順を示すフローチャートである。以下、このフローチャートに沿って説明する。
まずステップS21において、問合せ処理部35は、外部からの検索要求を受け付ける。なお、ルート層に位置するノード装置10においては、この検索要求はクライアント装置9から送られてくるものである。また、中間層またはリーフ層に位置するノード装置においては、この検索要求は親ノード装置11から送られてくるものである。
次にステップS22において、問合せ処理部35は、ステップS21で受け付けた検索要求に基づき、自ノードのデータベース(データ記憶部20)にアクセスして検索結果を取得する。なお、後述するように検索要求に含まれる条件(時刻の条件)によっては、自ノードのデータベースの検索を省略する場合がある。
次にステップS23において、問合せ処理部35は、ステップS21で受け付けた検索要求に基づき、子ノード装置12に対して検索要求を転送する。そして、その子ノード装置12からの応答として、検索結果を取得する。なお、子ノード装置12が複数接続されている場合には、問合せ処理部35は、それらの子ノード装置12の各々に対して検索要求を転送し、検索結果を取得する。また、後述するように検索要求に含まれる条件(時刻の条件)によっては、子ノード装置12への検索要求を省略する場合がある。
次にステップS24において、問合せ処理部35は、自ノードのデータベースから取得した検索結果と、子ノード装置12から取得した検索結果とを、統合(マージ)する。なお、自ノードのデータベースの検索あるいは子ノード装置の検索のいずれかが省略された場合には、統合する際に、省略された側の検索結果が空集合であるものとして扱う。
次にステップS25において、問合せ処理部35は、ステップS24で得られた検索結果を要求元に返す。
以上で、このフローチャート全体の処理を終了する。なお、データの検索の詳細な処理については、後で別のフローチャートを参照しながらさらに詳細に説明する。
図8,図9,図10,図11は、個々の退避ルールに応じたデータの退避およびデータの登録の処理の手順を示すフローチャートである。以下において、(A)定期退避、(B)追加データ量に基づく逐次退避、(C)不足容量に基づく逐次退避、(D)空き容量に基づく逐次退避のそれぞれの場合の処理を説明する。
図8は、退避ルールとして定期退避が選択される場合の、データの登録および退避の処理の手順を示すフローチャートである。なお、図8(A)はデータの登録の処理の手順を示し、図8(B)はデータの移動の処理の手順を示す。これらのデータ格納処理とデータ移動処理とは、ノード装置10において別スレッドとして互いに独立、且つ並列に実行され得るものである。データ移動の処理は、それぞれ所定の時間間隔で繰り返し実行される。
図8(A)のステップS101において、格納処理部32は、データ収集部31から渡されるデータを、自ノードのデータベース(データ記憶部20)に登録する。本ステップの処理が終了すると、このフローチャート全体の処理を終了する。
図8(B)のステップS111において、格納処理部32は、一定量のデータを親ノード装置11に移動させる。つまり、格納処理部32は、そのデータの登録を親ノード装置11に要求する。なお、データ記憶部20に存在するデータが上記の一定量に満たない場合には、存在するすべてのデータを親ノード装置11に移動させる。ただし、自ノード装置10がルート層に位置する場合には、格納処理部32は、一定量のデータを親ノードに移動させる代わりに、単にそのデータを削除する。本ステップの処理が終了すると、このフローチャート全体の処理を終了する。
図9は、退避ルールとして追加データ量に基づく逐次退避が選択される場合の、データの登録および退避の処理の手順を示すフローチャートである。以下、このフローチャートに沿って説明する。
まずステップS121において、格納処理部32は、登録するデータのデータ量を計算する。
次にステップS122において、格納処理部32は、ステップS121で算出された登録データ量に基づいて、データベース(データ記憶部20)に充分な空き容量が存在しているか否かを判断する。空き容量が充分である場合(ステップS122:YES)には、ステップS124に飛ぶ。空き容量が不充分である場合(ステップS122:NO)には、次のステップS123に進む。
次にステップS123に進んだ場合、同ステップおいて、格納処理部32は、容量が不足する分のデータを、親ノード装置11に移動させる。なお、自ノード装置10がルート層に位置するノードである場合には、そのデータを親ノードに移動させる代わりに、単にデータベース(データ記憶部20)から削除する。
次にステップS124において、格納処理部32は、データ収集部31から渡されるデータを、自ノードのデータベース(データ記憶部20)に登録する。本ステップの処理が終了すると、このフローチャート全体の処理を終了する。
図10は、退避ルールとして不足容量に基づく逐次退避が選択される場合の、データの登録および退避の処理の手順を示すフローチャートである。以下、このフローチャートに沿って説明する。
まずステップS131において、格納処理部32は、データ収集部31から渡されたデータの、自ノードのデータベース(データ記憶部20)への登録を試みる。
次にステップS132において、格納処理部32は、ステップS131におけるデータの登録(書き込み)において、容量不足のエラーが起こったか否かを判断する。容量不足エラーが起こった場合(ステップS132:YES)には、ステップS133に進む。容量不足エラーが起こらず正常にデータ登録が完了した場合(ステップS132:NO)には、このフローチャート全体の処理を終了する。
次にステップS133に進んだ場合、同ステップおいて、格納処理部32は、一定量のデータを親ノード装置11に移動させる。ただし、自ノード装置10がルート層に位置するノードである場合には、本ステップにおいて、一定量のデータを親ノード装置11に移動させる代わりに、そのデータを単にデータベース(データ記憶部20)から削除する。本ステップの処理が終了すると、再度、ステップS131に戻る。
図11は、退避ルールとして空き容量に基づく逐次退避が選択される場合の、データの登録および退避の処理の手順を示すフローチャートである。なお、図11(A)はデータの登録の処理の手順を示し、図11(B)はデータの移動の処理の手順を示す。なお、データの移動を行うために、格納処理部32は、データベースの空き容量を監視する。これらのデータ格納処理とデータ移動処理とは、ノード装置10において別スレッドとして互いに独立、且つ並列に実行され得るものである。データ移動の処理は、それぞれ所定の時間間隔で繰り返し実行される。
図11(A)のステップS141において、格納処理部32は、データ収集部31から渡されるデータを、自ノードのデータベース(データ記憶部20)に登録する。本ステップの処理が終了すると、このフローチャート全体の処理を終了する。
図11(B)のステップS151において、格納処理部32は、自ノードのデータベース(データ記憶部20)の空き容量または空き件数をチェックする。ここで、空き件数をチェックできるのは、1件のデータのサイズが固定長である場合などである。
次にステップS152において、格納処理部32は、ステップS151で確認した空き容量等が予め定めた閾値以上であるかどうかを判定する。そして、閾値以上の空き容量が存在する場合(ステップS152:YES)には、このフローチャート全体の処理を終了する。空き容量が閾値未満である場合(ステップS152:NO)には、次のステップS153に進む。
次にステップS153に進んだ場合、同ステップにおいて、格納処理部32は、一定量のデータを親ノード装置11に移動させる。ただし、自ノード装置10がルート層に位置するノードである場合には、本ステップにおいて、一定量のデータを親ノード装置11に移動させる代わりに、そのデータを単にデータベース(データ記憶部20)から削除する。本ステップの処理が終了すると、このフローチャート全体の処理を終了する。
図12は、データを移動させる処理のさらに詳細な手順を示すフローチャートである。
つまり、図8(B)のステップS111や、図9のステップS123や、図10のステップS133や、図11のステップS153におけるデータの移動(退避)の処理の、詳細な手順を示すものが図12である。以下、このフローチャートに沿って説明する。
まずステップS161において、格納処理部32は、自ノードがルートノードであるか否かを判定する。自ノードがルートノードであるか否かは、例えば、接続リスト記憶部21を参照したり、その他の定義情報を参照したりすることによって判定可能である。そして、自ノードがルートノードである場合(ステップS161:YES)には、ステップS164に移る。自ノードがルートノードではない場合(ステップS161:NO)には、ステップS162に進む。
次にステップS162に進んだ場合、同ステップにおいて、格納処理部32は、移動するデータの範囲の情報を取得する。つまり、格納処理部32は、移動すべきデータに関連付けられた時刻の範囲の情報を取得する。データは、古いものから順に親ノードに移動される。したがって、望まれる範囲の情報は、移動すべきデータの量とその時点でデータベース(データ記憶部20)に格納されているデータとから取得可能である。
次にステップS163において、格納処理部32は、親ノード装置11に、その範囲のデータの登録要求を送信する。本ステップの処理が終了すると、次にステップS165に進む。
一方、ステップS164に進んだ場合、同ステップにおいて、格納処理部32は、削除すべきデータの範囲の情報を取得する。つまり、格納処理部32は、削除すべきデータに関連付けられた時刻の範囲の情報を取得する。範囲の情報を取得するための原理は、ステップS162の説明で述べたものと同様である。
次にステップS165において、格納処理部32は、移動対象のデータ(またはルートノードの場合には削除対象のデータ)をデータベース(データ記憶部20)から削除する。
以上でこのフローチャート全体の処理を終了する。
図13は、データ検索のさらに詳細な処理手順を示すフローチャートである。同図に示す処理は、図7におけるステップS22およびS23の処理に当たる部分である。図示する通り、問合せ処理部35は、検索要求を分配して処理する。以下、このフローチャートに沿って説明する。
まずステップS41において、問合せ処理部35は、受け取った検索要求から、時刻に関する検索条件を抽出する。
次にステップS42において、問合せ処理部35は、ステップS41で抽出した時刻に関する抽出条件に基づいて、自ノードが、その時刻の条件に合致するデータを含んでいる可能性があるか否かを判定する。自ノードがそのデータを含む可能性がある場合(ステップS42:YES)には次のステップS43に進む。自ノードがそのデータを含む可能性がない場合(ステップS42:NO)にはステップS44に飛ぶ。
次にステップS43に進んだ場合、同ステップにおいて、問合せ処理部35は、自ノードのデータベースを検索し、検索結果を取得する。
次にステップS44において、問合せ処理部35は、ステップS41で抽出した時刻に関する抽出条件に基づいて、子ノード以下のノードが、その条件に合致するデータを含んでいる可能性があるか否かを判定する。子ノード以下のノードがそのデータを含む可能性がある場合(ステップS44:YES)には次のステップS45に進む。子ノード以下のノードがそのデータを含む可能性がない場合(ステップS44:NO)にはこのフローチャートの処理全体を終了する。
次にステップS45に進んだ場合、同ステップにおいて、問合せ処理部35は、子ノードに対して検索要求を送り、その子ノードから検索結果を取得する。なお、自ノードが複数の子ノードに接続されているとき、子ノードの枝ごとにデータの格納範囲が異なる場合には、検索条件に合致するデータを含む可能性のある枝の子ノードのみに検索要求を送るようにしてもよい。そして、本ステップの処理が終了すると、このフローチャートの処理全体を終了する。
なお、ステップS42およびS44における判定の方法の詳細は、次の通りである。」
即ち、上記のステップS42においては、問合せ処理部35は、格納情報記憶部22の自ノード格納範囲の情報を参照する。これにより、問合せ処理部35は、検索要求に含まれる時刻の条件と、自ノード格納範囲の上限と下限とで表される範囲とが重なるか否かを判定する。
また、上記のステップS44において、問合せ処理部35は、次のような判定を行う。即ち、格納情報記憶部22が図5(A)に示したタイプの格納情報を保持している場合、問合せ処理部35は、検索要求に含まれる時刻の条件と、自ノード格納範囲の上限よりも大きい(新しい)範囲とが重なるか否かを判定する。一方、格納情報記憶部22が図5(B)に示したタイプの格納情報を保持している場合、問合せ処理部35は、検索要求に含まれる時刻の条件と、子ノード格納範囲の下限よりも大きい(新しい)範囲が重なるか否かを、子ノードごとに判定する。
以下では、本実施形態を用いる場合の検索性能と、従来技術を用いる場合の検索性能とを、例に基づいて比較する。本実施形態のデータベースシステムは、4階層のノード装置で構成される。第1層(ルート層)は、1台のノード装置を含む。このルート層のノード装置が、第2層における100台のノード装置に接続されている。そして、第2層のノード装置の各々が、第3層における100台のノード装置に接続されている。つまり、第3層のノード装置は10000台である。そして、第3層のノード装置の各々が、第4層における100台のノード装置に接続されている。つまり、第4層のノード装置は1000000台(百万台)である。第4層はリーフ層であり、第4層のノード装置は、センサー等からの信号に基づいてデータを生成する。第4層の各ノード装置のデータベース容量は1GB(ギガバイト)である。つまり、第4層の百万台のノード装置全体でのデータベース容量は1PB(ペタバイト)である。第3層の10000台のノード装置の各々のデータベース容量は100GBである。つまり、第3層の10000台のノード装置全体でのデータベース容量は1PB(ペタバイト)である。第2層の100台のノード装置の各々のデータベース容量は10TB(テラバイト)である。つまり、第2層の100台のノード装置全体でのデータベース容量は1PB(ペタバイト)である。第1層(ルート層)の1台のノード装置のデータベース容量は1PBである。つまり、第1層から第4層までのノード装置全体でのデータベースの総容量は4PBである。
一方、従来技術を用いた構成で、1,000,000台(百万台)のデータ管理装置が、データを保持する。これらの百万台のデータ管理装置は、ツリー構造あるいは層構造を成しておらず、すべてがフラットにネットワークに接続されている。また、各々のデータ管理装置のデータベース容量は4GBである。つまり、百万台のデータ管理装置全体でのデータベース容量は4PGである。つまり、全体のデータベース容量は、上記の本実施形態を用いる場合と同等である。
上記の前提で、従来技術と本実施形態との性能を比較する。なお、ハードウェアの性能として、ネットワークのデータ転送速度が1GB/秒、データベース(磁気ハードディスク装置で構成)のアクセス速度が100MB/秒であることを想定する。
本実施形態の例では、検索は、各層(第1層から第4層まで)のノード装置で行われる。第1層(ルート層)のノード装置では、1PBの容量のデータベースに100MB/秒のアクセス速度でシーケンシャルにアクセスするため、1[PB]/100[MB/秒]で、10,000,000秒(1千万秒)を要する。なお、第2層から第4層までにおける各ノード装置でのデータベースへのアクセスと、取得されたデータの上位層への転送は、上で想定した速度によれば充分に速いため、第1層(ルート層)でのデータアクセス時間の1千万秒に隠蔽される。
一方、従来技術の例では、4PBのデータに100MB/秒の速度でアクセスするため、4[PB]/100[MB/秒]で、合計で40,000,000秒(4千万秒)を要する。
つまり、本実施形態の例で検索した場合の性能は、従来技術の例の場合の性能を上回る。
次に、検索要求内に時刻の条件を含む場合について、上記の前提を用いて、従来技術と本実施形態との性能を比較する。ここでも、ハードウェアの性能として、ネットワークのデータ転送速度が1GB/秒、データベース(磁気ハードディスク装置で構成)のアクセス速度が100MB/秒であることを想定する。
また、本実施形態の各層におけるデータ格納状況は次の通りである。即ち、第4層(リーフ層)は現時点から24時間前まで(これを「当日」と呼ぶ)のデータを格納している。また、第3層は、24時間前から48時間前まで(これを「1日前」と呼ぶ)のデータを格納している。また、第2層は、48時間前から72時間前(これを「2日前」と呼ぶ)のデータを格納している。また、第1層は、72時間前から96時間前(これを「3日前」と呼ぶ)のデータを格納している。ここで、検索要求内に、時刻の条件として、1日前のデータ(つまり、第3層のノード装置に格納されているデータ)のみを検索する条件を含む場合を想定する。つまり、第3層の10,000台のノード装置の各々において、100GBのデータを探索する。つまり、10,000並列にデータアクセスが行われる。このデータアクセスに要する時間は、100[GB]/100[MB/秒]で、1,000秒である(時間A)。アクセスの結果得られたデータを第3層から第2層に転送する処理は、100並列で行われる(第2層のノード装置が100台)。第3層から第2層へのデータ転送に要する時間は、10[TB]/1[GB/秒]で、10,000秒である(時間B)。このデータを第2層から第1層に転送する処理は、1並列で(シーケンシャルに)行われる(第1層のノード装置が1台)。第2層から第1層へのデータ転送に要する時間は、1[PB]/1[GB/秒]で、1,000,000秒である(時間C)。つまり、これらの時間A、時間B、時間Cをたし合わせると、検索処理に要する総時間は、1,011,000秒である。
一方、従来技術の例では、1PBのデータにシーケンシャルにアクセスする。つまり、このデータアクセスに要する時間は、1[PB]/100[MB/秒]で、合計で10,000,000秒(1千万秒)である。
つまり、この場合も、本実施形態の例で検索した場合の性能は、従来技術の例の場合の性能を上回る。
(第2の実施形態)
次に、第2の実施形態について説明する。なお、前述の実施形態と共通の事項については以下における説明を省略し、本実施形態に特有の事項を中心に説明する。
第1の実施形態におけるデータベースシステムに格納されるデータの構成は図3に示した通りであった。一方、本実施形態におけるデータベースシステム101は、複数の系列(時系列)のデータを格納する。
図14は、本実施形態によるデータベースシステム101が保持するデータの基本構造を示す概略図である。データベースシステム101に含まれる各ノード装置10におけるデータ記憶部20が、同図に示す構造のデータを記憶している。図示するように、データベースシステム101は、時刻(順序情報)とデータ内容とを関連付けて保持し、管理する。また、本実施形態における特徴として、データベースシステム101は、複数の系列のデータをひとつのツリー構造のノード装置群で管理する。そのため、図示する表は、データ項目のひとつとして系列識別情報を持つ。系列識別情報は、データの各系列を識別するものである。図示する例では、系列識別情報として「P」および「Q」の2つの値が表の中に含まれている。
例えば、系列識別情報「P」および「Q」は、リーフノード装置10Lにおいてデータを生成する2種類のセンサー(センサーPとセンサーQ)に対応する。
つまり、本実施形態におけるデータ記憶部20は、順序情報(時刻)によって順序付けられる複数の系列のデータを記憶する。
図15は、複数の系列を有するデータ(図14参照)が、ツリー構造で接続されるノード装置間で分散して格納される状況を示す概略図である。同図において、3つのノード装置10は、親−子−孫の関係を有している。これら3つのノード装置以外については図面における記載を省略している。これらのノード装置間で、時刻の情報(順序情報)をキーとして、データを分散して保持する点は、第1の実施形態と同様である。ただし、本実施形態においては、系列識別情報「P」および「Q」で表される2つの系列のデータが、論理的には相互に独立に、ノード装置10内に格納されている。
なお、ここでは、データベースシステム101が管理するデータの系列数が2の場合について例示しているが、データの系列数は3以上であってもよい。
本実施形態において、時刻(順序情報)をキーとしたノード間での分散のさせ方に、2種類の方式がある。第1の方式では、複数の系列に共通の格納範囲を用いてノード間のデータ分散を行う。第2の方式では、複数の系列それぞれに独立の格納範囲によってノード間のデータ分散を行う。以下に、これら2つの方式の具体例を説明する。
図16は、上記の第1の方式により、複数の系列に共通の格納範囲を用いた場合のデータの格納例を示す概略図である。なお、ここでのデータ例は、図15に示したデータに対応している。同図において、第1層のノードは、第2層のノードの直接の親である。また、第2層のノードは、第3層のノードの直接の親である。本方式においては、複数の系列に共通の格納範囲が、各ノードで設定されている。
具体的には、第1層のノードでは、系列P,Qに依らずに、自ノード格納範囲の上限が「2017/01/03 04:00:00.000」であり、下限が「2017/01/02 21:00:00.000」である。また、第2層のノードでは、同じく系列P,Qに依らずに、自ノード格納範囲の上限が「2017/01/03 10:00:00.000」であり、下限が「2017/01/03 04:00:00.000」である。また、第3層のノードでは、同じく系列P,Qに依らずに、自ノード格納範囲の上限が「2017/01/03 04:00:00.000」であり、下限が「2017/01/02 21:00:00.000」である。
つまり、この場合、格納処理部32は、複数の系列のデータに共通の順序情報が示す順序で、データ記憶部20から退避させるべきデータを親のノード装置に退避させまたはルートノードにおいてはデータ記憶部20から削除すべきデータを削除する、
このように、自ノード格納範囲はデータ系列に依存しない。したがって、本方式において、各ノード装置10の格納情報記憶部22は、データ系列に依存せず共通の格納範囲の情報(自ノード格納範囲等)を保持する。
本実施形態の本方式(第1の方式)によると、データ系列をまたいで、合計のデータ量に基づいて古い順にデータを親ノードに退避させるということが可能となる。
図17は、上記の第2の方式により、複数の系列それぞれに独立の格納範囲によってノード間のデータ分散を行った場合のデータの格納例を示す概略図である。なお、ここでのデータ例は、図15に示したデータに対応している。同図において、第1層のノードは、第2層のノードの直接の親である。また、第2層のノードは、第3層のノードの直接の親である。本方式においては、系列ごとに格納範囲が設定されている。
具体的には、第1層のノードにおいて系列Pに関して、自ノード格納範囲の上限が「2017/01/03 01:00:00.000」であり、下限が「2017/01/02 21:00:00.000」である。また、第1層のノードの系列Qに関して、自ノード格納範囲の上限が「2017/01/03 08:00:00.000」であり、下限が「2017/01/03 00:00:00.000」である。
また、第2層のノードにおいて系列Pに関して、自ノード格納範囲の上限が「2017/01/03 06:00:00.000」であり、下限が「2017/01/03 02:00:00.000」である。また、第2層のノードの系列Qに関して、自ノード格納範囲の上限が「2017/01/03 12:00:00.000」であり、下限が「2017/01/03 10:00:00.000」である。
また、第3層のノードにおいて系列Pに関して、自ノード格納範囲の上限が「2017/01/03 11:00:00.000」であり、下限が「2017/01/03 07:00:00.000」である。また、第2層のノードには系列Qのデータが存在しない。
つまり、この場合、格納処理部32は、複数の系列のデータごとの順序情報が示す順序で、データ記憶部20から退避させるべきデータを親のノード装置に退避させまたはデータ記憶部20から削除すべきデータを削除する。
このように、自ノード格納範囲はデータ系列ごとに異なる。したがって、本方式において、各ノード装置10の格納情報記憶部22は、データ系列ごとに、格納範囲の情報(自ノード格納範囲等)を保持する。
本実施形態の本方式(第2の方式)によると、データ系列ごとに個別に古い順にデータを親ノードに退避させるということが可能となる。
(第3の実施形態)
次に、第3の実施形態について説明する。なお、前述の各実施形態と共通の事項については以下における説明を省略し、本実施形態に特有の事項を中心に説明する。本実施形態におけるデータベースシステムの特徴として、ノード装置10は必ずしもツリー構造状に接続される必要はない。
図18は、本実施形態によるデータベースシステム102の構成例を示す概略図である。図示するように、本実施形態においても、複数のノード装置10が接続されることによりデータベースシステム102が構成される。そして、ノード装置間では、親ノードと子ノードの関係が定義される。図内の有向矢印線の元側が親ノードであり、先側が子ノードである。ただし、データベースシステム102において、例えばノード装置10−8は、ノード装置10−5と10−6の2つの親を持つ。このように、データベースシステム102において、ノード装置10はツリー構造に接続されなくてもよい。ただし、データベースシステム102を構成するノード装置群において、親子関係に関する半順序が成立する。即ち、あるノード装置は、他のあるノード装置の、直系の先祖であるか、直系の子孫であるか、あるいは先祖でも子孫でもないか、のいずれかである。あるノード装置が他のノード装置の先祖でもあり且つ子孫でもあるという関係は存在しない。言い換えれば、親子関係を表す有向グラフにおける閉路は存在しない。
本実施形態において、前述の各実施形態と同様に、データに関連付けられた時刻をキーとしてデータの格納および退避が行われる。また、前述の各実施形態と同様に、子ノード側から親ノード側にデータの退避が行われる。データの退避ルールとして、例えば、第1の実施形態で説明した4種類のルールのうちいずれかを用いることができる。ただし、あるノード装置10が複数の親を持つ場合、そのノード装置10は、適宜、退避先である親ノード装置を分散させてデータの退避を行う。退避先の親ノード装置を分散させる方法は任意であるが、例えば、データに関連付けられた時刻(順序情報)を区切ってデータの移動先の親ノード装置を決定する。あるいは、例えば、データに関連付けられた時刻(順序情報)を、そのノード装置に接続されている親ノード装置の数で除した場合の剰余により、移動先の親ノード装置を決定する。あるいは、例えば、データにハッシュ関数を適用して得られた結果に基づいて移動先の親ノード装置を決定する。
また、本実施形態において、前述の各実施形態と同様にデータの検索処理が行われる。つまり、ノード装置10は、適宜、子ノード装置への検索要求の分配を行う。ただし、複数の親ノード(例えば、ノード装置10−5と10−6)が1つの共通の子ノード(ノード装置10−8)を持つ場合には、それら複数の親ノードのうちのどの親ノードから、共通の子ノードに対して検索要求を送るかを、ルール等により予め定めておく。
本実施形態によれば、ノード装置間の接続の形態は必ずしもツリー構造状でなくてもよく、柔軟にシステムを構成できる。本実施形態においても、子ノードから親ノードにデータを退避させていくことにより、各ノード装置の記憶手段を有効に使用することができる。また、順序情報にしたがって、どのノード装置にどの範囲のデータが存在するかを管理することができる。
(第4の実施形態)
次に、第4の実施形態について説明する。なお、前述の各実施形態と共通の事項については以下における説明を省略し、本実施形態に特有の事項を中心に説明する。本実施形態におけるデータベースシステムの特徴として、ノード装置10は必ずしもツリー構造状に接続される必要はなく、また必ずしも単一のルートノード装置を有さない構成としてもよい。
図19は、本実施形態によるデータベースシステム103の構成例を示す概略図である。図示するように、本実施形態においても、複数のノード装置10が接続されることによりデータベースシステム102が構成される。そして、ノード装置間では、親ノードと子ノードの関係が定義される。図内の有向矢印線の元側が親ノードであり、先側が子ノードである。
本実施形態において、前述の各実施形態と同様に、データに関連付けられた時刻をキーとしてデータの格納および退避が行われる。また、前述の各実施形態と同様に、子ノード側から親ノード側にデータの退避が行われる。データの退避ルールとして、例えば、第1の実施形態で説明した4種類のルールのうちいずれかを用いることができる。ただし、データベースシステム103において、ノード装置10−51から10−58までのグループと、ノード装置10−59から10−62までのグループとは、グラフとして連結されていない。したがって、ノード間でデータを退避させる場合にも、これら2つのグループをまたいでデータが移動することはない。
また、本実施形態において、前述の各実施形態と同様にデータの検索処理が行われる。つまり、ノード装置10は、適宜、子ノード装置への検索要求の分配を行う。ただし、ノードの親子関係における最上位の親ノードが複数存在する場合(例えば、図19におけるノード装置10−51や10−59)には、クライアント装置9がそれら複数のノード装置(ノード装置10−51や10−59)に検索要求を分配する。あるいは、クライアント装置9と最上位の親ノードであるノード装置との間に、フロントエンド処理装置を設けて、そのフロントエンド処理装置が最上位の親ノードである複数のノード装置に検索要求を分配するようにしてもよい。
本実施形態によれば、すべてのノード装置が必ずしも1つに連結されていなくてもよい。つまり、ノード間接続のグラフ構造として、非連結のノード装置群を有していてもよい。これにより、柔軟にシステムを構成できる。本実施形態においても、子ノードから親ノードにデータを退避させていくことにより、各ノード装置の記憶手段を有効に使用することができる。また、順序情報にしたがって、どのノード装置にどの範囲のデータが存在するかを管理することができる。
上記各実施形態では、データベースシステムに格納するデータの順序を表す情報として、データの各件に関連付けられた時刻(日時)の情報を用いた。しかし、時刻に代わって、他の情報により、データの順序を表すようにしてもよい。例えば、データの発生順序を表すシリアル番号(通番)をデータの各件に付与し、これを順序情報として用いてもよい。あるいは、時刻(日本標準時や協定世界時)とは異なる他の何らかの数値データをデータの各件に付与し、これを順序情報として用いてもよい。このように、時刻(日時)以外の順序情報を用いる場合にも、子ノードから親ノードに退避させるデータの範囲の管理を、その順序情報を用いて行うことができる。また、検索要求を、自ノード内で処理するか否か、あるいは子ノードに分配するか否か、を判断する場合にも、その順序情報に基づくことができる。つまり、適切に付与された順序情報は、上記各実施形態における時刻(日時)の代わりに適用することができる。
また、上記各実施形態では、順序情報を用いてデータの順序を管理するにあたり、数値が大きい側を新しいデータの側とし、数値が小さい側を古いデータの側とした。しかし、この新旧の順序と数値の大小との関係は、逆転していてもよい。
以上説明した少なくともひとつの実施形態によれば、退避ルール記憶部23が記憶する退避ルールに従ってノード間で子から親へと順次データを退避させる格納処理部32を持つことにより、ノード装置10が有する記憶手段を有効に使用することができ、中央サーバー装置へのデータの集中を回避することができる。また、データベースシステム全体としてのデータ格納容量を大きくすることができる。また、以上説明した少なくともひとつの実施形態によれば、上位からの検索要求を分配する問合せ処理部35を持つことにより、多並列に検索処理を行うことができ、データ検索の効率が向上する。
なお、上述した実施形態におけるノード装置やクライアント装置の機能をコンピューターで実現するようにしても良い。その場合、この機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM、DVD−ROM、USBメモリー等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリーのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
10,10−1〜10−10,10−51〜10−62…ノード装置、10R…ノード装置(ルートノード装置)、10L…ノード装置(リーフノード装置)、11…親ノード装置、12…子ノード装置、20…データ記憶部、21…接続リスト記憶部、22…格納情報記憶部、23…退避ルール記憶部、31…データ収集部、32…格納処理部、35…問合せ処理部、100,101,102,103…データベースシステム

Claims (9)

  1. 複数のノード装置間を親子関係で接続してなるデータベースシステムであって、
    前記ノード装置は、
    データを記憶するデータ記憶部と、
    自ノード装置が最上位の親でない場合には前記データ記憶部に記憶されている前記データを親のノード装置に退避させ、自ノード装置が最上位の親である場合には前記データ記憶部に記憶されているデータを削除するための退避ルールを記憶する退避ルール記憶部と、
    データの登録要求を受け付けて前記データ記憶部に書き込むとともに、前記退避ルール記憶部の前記退避ルールを参照することによって、前記データに関連付けられた順序情報が示す順序で前記データ記憶部から退避させるべきデータを親のノード装置に退避させまたは前記データ記憶部から削除すべきデータを削除する格納処理部と、
    データの検索要求を受け付けて、自ノード装置の前記データ記憶部に記憶されている前記データを検索し第1検索結果を取得するとともに、前記検索要求を子のノード装置に送信し当該子のノード装置から第2検索結果を取得し、前記第1検索結果と前記第2検索結果とを要求元に送信する問合せ処理部と、
    を備
    前記データ記憶部は、前記順序情報によって順序付けられる複数の系列の前記データを記憶するものであり、
    前記格納処理部は、前記複数の系列のデータごとの前記順序情報が示す順序で、前記データ記憶部から退避させるべきデータを親のノード装置に退避させまたは前記データ記憶部から削除すべきデータを削除する、
    データベースシステム。
  2. 前記退避ルール記憶部は、自ノード装置が最上位の親でない場合には前記データ記憶部に記憶されている前記データの所定量を所定の時間間隔で親のノード装置に退避させ、自ノード装置が最上位の親である場合には前記データの所定量を所定の時間間隔で削除するための前記退避ルールを記憶する、
    請求項1に記載のデータベースシステム。
  3. 前記退避ルール記憶部は、自ノード装置の前記データ記憶部に前記データを書き込む際に書き込む前記データのデータ量を計算し前記データ記憶部の空き容量が不十分である場合に、自ノード装置が最上位の親でない場合には前記データ記憶部に記憶されている前記データのうちの空き容量確保に必要な分を親のノード装置に退避させ、自ノード装置が最上位の親である場合には前記データのうちの空き容量確保に必要な分を削除するための前記退避ルールを記憶する、
    請求項1に記載のデータベースシステム。
  4. 前記退避ルール記憶部は、自ノード装置の前記データ記憶部に前記データの書き込みを試みた結果として容量不足エラーが発生したときに、自ノード装置が最上位の親でない場合には前記データ記憶部に記憶されている前記データを親のノード装置に退避させ、自ノード装置が最上位の親である場合には前記データを削除するための前記退避ルールを記憶する、
    請求項1に記載のデータベースシステム。
  5. 前記退避ルール記憶部は、自ノード装置の前記データ記憶部の空き容量を監視し前記空き容量が所定の閾値を下回ったときに、自ノード装置が最上位の親でない場合には前記データ記憶部に記憶されている前記データを親のノード装置に退避させ、自ノード装置が最上位の親である場合には前記データを削除するための前記退避ルールを記憶する、
    請求項1に記載のデータベースシステム。
  6. 自ノード装置の前記データ記憶部に記憶されているデータに関連付けられた順序情報の範囲の情報を記憶する格納情報記憶部、
    をさらに備え、
    前記問合せ処理部は、受け付けた検索要求に含まれる前記順序情報に関する検索条件を抽出し、自ノード装置の前記データ記憶部には前記検索条件に合致するデータが記憶されていない場合には、自ノード装置の前記データ記憶部に記憶されている前記データの検索を行わず、前記第1検索結果として空集合のデータを取得したものとする、
    請求項1からまでのいずれか一項に記載のデータベースシステム。
  7. 子のまたはより下位のノード装置の前記データ記憶部に記憶されているデータに関連付けられた順序情報の範囲の情報を記憶する子孫ノード格納情報記憶部、
    をさらに備え、
    前記問合せ処理部は、受け付けた検索要求に含まれる前記順序情報に関する検索条件を抽出し、前記子のまたはより下位のノード装置の前記データ記憶部には前記検索条件に合致するデータが記憶されていない場合には、前記検索要求を前記子のノード装置に送信せず、当該子のノード装置に関しては前記第2検索結果として空集合のデータを取得したものとする、
    請求項1からまでのいずれか一項に記載のデータベースシステム。
  8. 前記順序情報は、時刻の情報である、
    請求項1からまでのいずれか一項に記載のデータベースシステム。
  9. 複数のノード装置間を親子関係で接続してなるデータベースシステムによるデータ処理方法であって、
    前記ノード装置において、
    データ記憶部は、データを記憶し、
    退避ルール記憶部は、自ノード装置が最上位の親でない場合には前記データ記憶部に記憶されている前記データを親のノード装置に退避させ、自ノード装置が最上位の親である場合には前記データ記憶部に記憶されているデータを削除するための退避ルールを記憶し、
    格納処理部は、データの登録要求を受け付けて前記データ記憶部に書き込むとともに、前記退避ルール記憶部の前記退避ルールを参照することによって、前記データに関連付けられた順序情報が示す順序で前記データ記憶部から退避させるべきデータを親のノード装置に退避させまたは前記データ記憶部から削除すべきデータを削除し、
    問合せ処理部は、データの検索要求を受け付けて、自ノード装置の前記データ記憶部に記憶されている前記データを検索し第1検索結果を取得するとともに、前記検索要求を子のノード装置に送信し当該子のノード装置から第2検索結果を取得し、前記第1検索結果と前記第2検索結果とを要求元に送信する、
    ものであって、
    前記データ記憶部は、前記順序情報によって順序付けられる複数の系列の前記データを記憶するものであり、
    前記格納処理部は、前記複数の系列のデータごとの前記順序情報が示す順序で、前記データ記憶部から退避させるべきデータを親のノード装置に退避させまたは前記データ記憶部から削除すべきデータを削除する、
    データ処理方法。
JP2017005121A 2017-01-16 2017-01-16 データベースシステムおよびデータ処理方法 Active JP6672190B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017005121A JP6672190B2 (ja) 2017-01-16 2017-01-16 データベースシステムおよびデータ処理方法
US15/864,141 US20180203908A1 (en) 2017-01-16 2018-01-08 Distributed database system and distributed data processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017005121A JP6672190B2 (ja) 2017-01-16 2017-01-16 データベースシステムおよびデータ処理方法

Publications (2)

Publication Number Publication Date
JP2018116348A JP2018116348A (ja) 2018-07-26
JP6672190B2 true JP6672190B2 (ja) 2020-03-25

Family

ID=62838308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017005121A Active JP6672190B2 (ja) 2017-01-16 2017-01-16 データベースシステムおよびデータ処理方法

Country Status (2)

Country Link
US (1) US20180203908A1 (ja)
JP (1) JP6672190B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7082373B2 (ja) * 2019-03-27 2022-06-08 日本電信電話株式会社 データ管理装置およびデータ管理方法
CN111427695A (zh) * 2020-04-01 2020-07-17 山东汇贸电子口岸有限公司 一种分布式数据库中存储过程的并发调度装置
EP3916581A1 (de) * 2020-05-29 2021-12-01 Siemens Aktiengesellschaft Computerimplementiertes verfahren zur speicherung von daten mittels einer verteilten transaktionsdatenbank, computerprogrammprodukt und netzwerk

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19807872A1 (de) * 1998-02-25 1999-08-26 Pact Inf Tech Gmbh Verfahren zur Verwaltung von Konfigurationsdaten in Datenflußprozessoren sowie Bausteinen mit zwei- oder mehrdimensionalen programmierbaren Zellstruktur (FPGAs, DPGAs, o. dgl.
US9361332B2 (en) * 2013-03-15 2016-06-07 International Business Machines Corporation Index record-level locking for file systems using a B+ tree structure
US9015111B2 (en) * 2013-04-05 2015-04-21 Hitachi, Ltd. Storage system and storage system control method
US10261960B2 (en) * 2014-09-12 2019-04-16 Scality, S.A. Snapshots and forks of storage systems using distributed consistent databases implemented within an object store
CN107077481B (zh) * 2014-09-19 2021-01-22 日本电气方案创新株式会社 信息处理装置、信息处理方法和计算机可读存储介质

Also Published As

Publication number Publication date
JP2018116348A (ja) 2018-07-26
US20180203908A1 (en) 2018-07-19

Similar Documents

Publication Publication Date Title
US10209893B2 (en) Massively scalable object storage for storing object replicas
US10649827B2 (en) Two level addressing in storage clusters
US9898521B2 (en) Massively scalable object storage system
US8676951B2 (en) Traffic reduction method for distributed key-value store
US8762353B2 (en) Elimination of duplicate objects in storage clusters
JP5043937B2 (ja) 分散システム内の連合リソース発見のための方法およびコンピュータ・プログラム
US8996611B2 (en) Parallel serialization of request processing
KR100974149B1 (ko) 네임스페이스에 대한 정보 유지 방법, 시스템 및 컴퓨터 판독가능 저장 매체
US20080126404A1 (en) Scalable distributed object management in a distributed fixed content storage system
JP6672190B2 (ja) データベースシステムおよびデータ処理方法
CN102708165A (zh) 分布式文件系统中的文件处理方法及装置
JP4713257B2 (ja) データ記憶装置及びバージョン管理プログラム
US20110040788A1 (en) Coherent File State System Distributed Among Workspace Clients
US10936590B2 (en) Bloom filter series
JP5371656B2 (ja) ファイル検索システム
JP7434088B2 (ja) 分散処理システム、分散処理装置、データベース管理装置及び方法
US11853298B2 (en) Data storage and data retrieval methods and devices
JP2000250918A (ja) 分散データベースシステムと検索方法およびその処理プログラムを記録した記録媒体
Malensek On the evaluation of exact-match and range queries over multidimensional data in distributed hash tables
CN101300552A (zh) 信息检索系统及其方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200304

R151 Written notification of patent or utility model registration

Ref document number: 6672190

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151