JPWO2013018808A1 - 分散ストレージシステムおよび方法 - Google Patents
分散ストレージシステムおよび方法 Download PDFInfo
- Publication number
- JPWO2013018808A1 JPWO2013018808A1 JP2013526936A JP2013526936A JPWO2013018808A1 JP WO2013018808 A1 JPWO2013018808 A1 JP WO2013018808A1 JP 2013526936 A JP2013526936 A JP 2013526936A JP 2013526936 A JP2013526936 A JP 2013526936A JP WO2013018808 A1 JPWO2013018808 A1 JP WO2013018808A1
- Authority
- JP
- Japan
- Prior art keywords
- data
- information
- access
- unit
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
- G06F16/184—Distributed file systems implemented as replicated file system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0617—Improving the reliability of storage systems in relation to availability
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/065—Replication mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/568—Storing data temporarily at an intermediate stage, e.g. caching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、日本国特許出願:特願2011−169588号(2011年8月2日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、分散ストレージに関し、特に、データ構造の制御が可能な分散ストレージシステム、および方法と装置に関する。
・データをどの計算機(ノード)に配置するか、
・処理をどの計算機(ノード)で行うか、
といった判断をソフトウェアや特別な専用ハードウェア等により実現している。分散ストレージシステムにおいて、システムの状態に対して、その動作を動的に変更することで、システム内のリソース使用量を調整し、システム利用者(クライアント計算機)に対する性能を向上している。
データを保持しているノードの位置を知るための別の手法(技術)として、分散関数(例えば、ハッシュ関数)を用いてデータの位置を求めるものがある。この種の手法は、例えば分散KVS(Key Value Store:キー・バリュー・ストア)で利用されている。分散KVSとは、連想配列のような「Key(キー)」と「Value(値)」のペアからなるシンプル(simple)なデータモデルのストレージ機能を、複数ノードで実現する分散ストレージシステムの一種である。分散KVS手法に基づく分散ストレージシステム(分散KVSシステムともいう)では、全てのクライアントで、分散関数と、システムに参加しているノードのリスト(ノードリスト)とを共有する。また、格納データは、固定長あるいは任意長のデータ断片(Value)に分かれている。各データ断片には、該データ断片を一意に特定可能な識別子が付与され、データ断片の配置場所を識別子と分散関数を用いて決定する。例えば、ハッシュ関数によりキーの値に応じて保存先のノード(サーバ)は異なるため、複数のノードにデータを分散保存することが可能となる。また、分散関数が同一ならば、同一キーに基づく保存先が常に同一となるため、アクセスするクライアントはデータアクセス先を容易に把握することができる。簡潔な分散KVSシステムでは、Keyを識別子とし、Keyに対応したValueを格納データの単位とすることで、KeyとValueに基づくデータアクセス機能を実現する。
分散ストレージシステムにおいては、可用性(Availability:システムが連続して動作できる能力)確保のために、データの複製を複数ノードで保持し、データの複製を、負荷分散に活用することが一般的に行われている。
前記データノードへのアクセスの履歴情報を記憶するアクセス履歴記録部を備え、
前記データノードで非同期に行われる前記目的のデータ構造への変換の実行の契機となる契機情報を、前記アクセス履歴記録部に記録されたアクセス履歴情報に基づき、可変させる手段を備えている、分散ストレージシステムが提供される。
データ更新要求に対応したデータの複製にあたり、複製先のデータノードでは、
更新対象のデータを、一旦、書き込みデータ保持用の中間構造に格納し、更新要求とは非同期で、それぞれ目的のデータ構造に変換して前記データ格納部に格納し、
前記データノードで非同期に行われる前記目的のデータ構造への変換の実行の契機となる契機情報を、前記データノードのアクセス履歴情報に基づき、可変させる、分散ストレージのデータ複製方法が提供される。
前記テーブル識別子に対応して、前記レプリカ識別子と、前記レプリカ識別子に対応した1つ又は複数のデータ配置先のデータノード情報とを備えたデータ配置特定情報(図2の922:図5)と、を記憶管理する構造情報保持部(92)を有する構造情報管理装置(9)と、前記データ構造管理情報と前記データ配置特定情報とを参照して、更新処理及び参照処理のアクセス先を特定するデータアクセス部を備えたクライアント機能実現部(61)と、それぞれが前記データ格納部(12)を備え、前記構造情報管理装置(9)と前記クライアント機能実現部(61)とに接続される複数の前記データノード(1〜4)と、を備えている。前記データノードは、前記クライアント機能実現部(61)からのアクセス要求に基づき、更新処理を行う場合に、一旦中間構造にデータを保持した上で前記クライアント機能実現部(61)に応答を返すアクセス受付・処理部(111、112)と、前記データ構造管理情報を参照し、指定された更新契機に応答して、前記中間構造に保持されるデータを、前記データ構造管理情報で指定されたデータ構造に変換する処理を行うデータ構造変換部(113)とを備えたデータ管理・処理部(11)構成としてもよい。
前記アクセス受付部(111)は、
前記アクセス処理部からの完了通知(図14)、又は、
前記アクセス処理部からの完了通知、及びレプリカ先の各データノードからの完了通知(図13)、
を受けると、前記クライアント機能実現部(9)に対して応答し、
前記データ構造変換部(113)は、前記中間構造に保持されたデータを、前記データ構造管理情報に指定されているデータ構造に変換し変換先の前記構造別データ格納部(121〜123)に格納するようにしてもよい。
図1は、本発明の例示的な一実施形態のシステム構成の一例を示す図である。データノード1〜4、ネットワーク5、クライアントノード6、構造情報管理手段(構造情報管理装置)9を備える。
図2は、図1の構成例詳細に説明する図である。図2には、図1のデータノード1〜4を中心に示した構成が示されている。図1のデータノード1〜4は基本的に同一構成とされるため、図2では、データノード1のデータ管理・処理手段11、データ格納部12、アクセス履歴記録部71(図1の71−1に対応)が示されている。なお、図2等の図面において、簡単化のため、構造情報保持部92に格納される構造情報は参照符号92で参照される場合がある。
図2のデータ構造管理情報921は、データの集合毎にデータの格納方式を特定するためのパラメータ情報である。図3は、図2のデータ構造管理情報921の一例を示す図である。特に制限されるものではないが、図3に示す例では、データの格納方式を制御する単位を、テーブルとする。そして、テーブル毎(テーブル識別子毎)に、レプリカ識別子、データ構造の種別、更新契機の各情報を、データ複製の複製数分、用意する。
A:キュー、
B:ロウストア、
C:カラムストア
が指定されている。図3(B)の例では、テーブル識別子「Stocks」のレプリカ識別子0は、データ構造B(ロウストア)として格納される。
A:キュー(queue)は、リンクトリスト(Linked List)である。
図4は、テーブルのデータ保持構造の一例を模式的に示す図である。図4の(A)のテーブルは、Keyカラムと、3つのValueカラムを備え、各ローは、Keyと3つのValueのセットからなる。
レプリカ識別子0と1のデータとして、データ構造B(ロウストア)で保持し(図4の(B)、(C)参照)、
レプリカ識別子2のデータとして、データ構造C(カラムストア)として保持する(図4の(D)参照)。
再び図3(A)を参照すると、データ構造管理情報921(図2参照)における更新契機は、データを指定されたデータ構造として格納されるまでの時間契機である。Stocksのレプリカ識別子0の例では30secと指定されている。したがって、Stocksのレプリカ識別子0のデータ構造B(ロウストア)を格納するデータノードにおいて、ロウストア方式の構造別データ格納部122に対して、データの更新が反映されるのが30sec契機であることを示す。データ更新が反映されるまでの間は、キュー等の中間構造としてデータが保持される。また、データノードでは、クライアントからの要求に対しても、中間構造に格納して応答が行われる。本実施形態では、指定されたデータ構造への変換は、更新要求に対して、非同期(Asynchronous)で行われる。
図5は、図2のデータ配置特定情報922の一例を示す図である。各テーブル識別子のレプリカ識別子0、1、2(図3参照)のそれぞれに対して、配置ノード(データ格納先のデータノード)が指定されている。これは、前述したメタサーバ方式に対応している。分散KVS方式の場合、データ配置特定情報922は、分散ストレージに参加しているノードリスト情報(不図示)が該当する。このノードリスト情報をデータノード間で共有することによって、例えば「テーブル識別子」+「レプリカ識別子」をキー情報として、コンシステント・ハッシング方式により、配置ノードを特定することが出来る。また、レプリカの配置先として、コンシステント・ハッシング方式における隣接ノードに格納することができる。
図6は、テーブルのデータ保持、非同期更新の基本形式を模式的に説明する図である。図6は、本発明で解決されることになる問題点を説明するための図、したがって、本発明の比較例を説明するための図でもある。
・ロウストア構造におけるインデックスの有無、
・インデックスを作成したカラムの種類の違い、
・更新を追記構造で格納するロウストア形式、
等であってもよい。
そこで、本実施形態では、図8に示すように、例えば、アクセスの頻度に関連付けてデータ構造の変換の契機(図3(A)の更新契機情報)を調整する。アクセス頻度(Readアクセスの頻度)が予め定めた閾値以下/以上ならば、非同期タイマ(Async(タイマ))の設定値(タイムアウト時間)を大きく/小さくする。すなわち、データ構造管理情報921(図2)の更新契機情報(非同期タイマ:図3(A)の更新契機情報)の値を、アクセス頻度に合わせて、調整する。
図9は、データ構造管理情報921の更新契機情報の調整を行うための構成の一例を示す図である。図9に示すように、アクセス履歴記録部71のアクセス情報に基づき、データ構造管理情報921の更新契機情報の変更を行うか否かを判断する変更判定手段(変更判定部)72を備えている。
図10は、図1のクライアント機能実現手段61が、更新先のデータノードに対して命令を発行し、待ち合わせるというクライアント機能実現手段61の動作を説明するためのフローチャートである。図10を参照して、クライアントのアクセスフローについて説明する。
・INSERT命令(テーブルへレコードを追加するSQL命令)であれば、WRITE処理、
・SELECT命令(テーブルからレコードを参照、検索するSQL命令)であれば、参照系処理、
である。
図11は、図2のデータノードにおけるアクセス処理を説明するフローチャートである。図11、図2を参照して、データノードの動作について詳細に説明する。
図12は、図2のデータ構造変換手段113におけるデータ変換処理の動作を示すフローチャートである。図12、図2を参照して、データ変換処理を説明する。
図13は、Write処理(データの更新を伴う処理)のシーケンスを示す図である。
なお、図13の例では、データノード1が、レプリカ先のデータノード2、3に対して、Write要求を転送しているが、図14に示すように、クライアント計算機が、格納先のデータノードの全てに対して、Write要求を発行するようにしても良い。
図15は、図8の構成の一変形例を説明する図である。図15を参照すると、図8のカラムストア(Column Store)形式のデータノード3を、2つのデータノード3A、3Bで構成し、一方のデータノード3AでWrite中間構造からカラムストア(Column Store)形式のデータ構造への変換を行っている場合、解析系のクライアント(Client)は、他方のデータノード3Bのデータ(Write中間構造に格納された変換前のデータとカラムストア形式に変換済みのデータ)を参照して解析を行う。データノード3A、3Bでの非同期のタイマの設定は20秒(Aync(20秒))であるが、データノード3Bでのデータ構造の変換は、データノード3Aでのデータ構造の変換よりも10秒遅れている。例えばデータノード3Aでは、0秒〜20秒の時間区間でデータ構造の変換が行われ、続く20〜40秒の時間区間でReadアクセスを行うクライアント(Client)によるデータの解析が行われる。データノード3Bでは、10秒〜30秒の時間区間でReadアクセスを行うクライアント(Client)によるデータの解析が行われ、続く30〜50秒の時間区間で、データ構造の変換が行われる。したがって、例えば10秒と20秒の中間の15秒時点では、データノード3Aではデータ構造の変換、データノード3Bではデータの解析が行われる。なお、データノード3A、3Bにおける非同期のタイマの設定は、データノード3A、3Bのアクセス履歴情報(アクセス頻度)に基づいて設定される。
図16は、オンライン処理(Write処理を行うオンライン処理システム)とバッチ処理等で行われる解析系(データウエアハウス)間にETL(Extract/Transform/Load)を配設した例を示している。
5 ネットワーク
6 クライアントノード
9 構造情報管理手段(構造情報管理装置)
11、21、31、41 データ管理・処理手段(データ管理・処理部)
12、22、32、42 データ格納部
61 クライアント機能実現手段(クライアント機能実現部)
71 アクセス履歴記録部
72 変更判定手段(変更判定部)
91 構造情報変更手段(構造情報変更部)
92 構造情報保持部
111 アクセス受付手段(アクセス受付部)
112 アクセス処理手段(アクセス処理部)
113 データ構造変換手段(データ構造変換部)
121、122、123、12X 構造別データ格納部
611 データアクセス手段(データアクセス部)
612 構造情報キャッシュ保持部
921 データ構造管理情報
922 データ配置特定情報
Claims (14)
- それぞれがデータ格納部を備え、ネットワーク結合される複数のデータノードを備え、
データの更新要求に対して前記データの複製先のデータノードでは、
更新対象のデータを、一旦、書き込みデータ保持用の中間構造に格納し、受け取った前記更新要求とは非同期で、それぞれ目的のデータ構造に変換して前記データ格納部に格納し、
前記データノードへのアクセス頻度の履歴を記憶するアクセス履歴記録部を備え、
前記データノードで非同期に行われる前記目的のデータ構造への変換の契機となる契機情報を、前記アクセス履歴記録部に記録されたアクセス情報に基づき、可変させる手段を備えている、分散ストレージシステム。 - 複製先の前記データノードは、それぞれ、前記中間構造に、前記データを保持して、応答を返し、
前記中間構造に保持されるデータ構造を、前記更新対象のデータの受信から前記契機情報で規定される時間経過時に、前記目的のデータ構造に非同期で変換した上で前記データ格納部に格納する、請求項1記載の分散ストレージシステム。 - 予め定められたテーブル単位でデータ配置先のデータノード、配置先のデータノードにおける目的のデータ構造を制御する手段を備えた請求項1又は2記載の分散ストレージシステム。
- 格納対象のデータを識別する識別子であるテーブル識別子に対応させて、複製を特定するレプリカ識別子と、前記レプリカ識別子に対応したデータ構造の種類を特定するデータ構造情報と、指定されたデータ構造に変換して格納されるまでのタイマ情報である契機情報と、を、前記データ構造の種類の数に対応させて備えたデータ構造管理情報と、
前記テーブル識別子に対応して、前記レプリカ識別子と、前記レプリカ識別子に対応した1つ又は複数のデータ配置先のデータノード情報とを備えたデータ配置特定情報と、
を記憶管理する構造情報保持部を有する構造情報管理装置と、
前記データ構造管理情報と前記データ配置特定情報とを参照して、更新処理及び参照処理のアクセス先を特定するデータアクセス部を備えたクライアント機能実現部と、
それぞれが前記データ格納部を備え、前記構造情報管理装置と前記クライアント機能実現部とに接続される複数の前記データノードと、
を備え、
前記データノードは、
前記クライアント機能実現部からのアクセス要求に基づき、更新処理を行う場合に、中間構造にデータを保持して前記クライアント機能実現部に応答を返すアクセス受付・処理部と、
前記データ構造管理情報を参照し、指定された更新契機に応答して、前記中間構造に保持されるデータを、前記データ構造管理情報で指定されたデータ構造に変換する処理を行うデータ構造変換部と、
を備えたデータ管理・処理部を有する、ことを特徴とする、請求項1乃至3のいずれか1項に記載の分散ストレージシステム。 - 前記アクセス履歴記録部に記録されたアクセス情報、又は、前記アクセス情報を加工して得た別のアクセス情報を用いて、前記構造情報保持部の前記データ構造管理情報の更新契機情報を変更するか否か判定し、
前記データ構造管理情報の更新契機情報を変更する場合、前記構造情報管理装置に通知する変更判定部を備え、
前記構造情報管理装置は、前記変更判定部からの前記更新契機情報の変更の通知を受け、前記データ構造管理情報の更新契機情報を変更する構造情報変更部を備えた、請求項4記載の分散ストレージシステム。 - 前記アクセス履歴記録部に記録されたアクセス情報が、前記データ格納部からの読み出しアクセスと、前記中間構造へのデータの書き込みアクセスの頻度情報を含む、請求項1又は5記載の分散ストレージシステム。
- 前記データノードにおいて、
前記アクセス受付・処理部が、
アクセス受付部、アクセス処理部を備え、
前記データノードの前記データ格納部は、構造別データ格納部を備え、
前記アクセス受付部は、
前記クライアント機能実現部からの更新要求を受け付け、前記データ配置特定情報においてレプリカ識別子に対応して指定されているデータノードに対して更新要求を転送し、
さらに前記アクセス履歴記録部にアクセス要求を記録し、
前記データノードの前記アクセス処理部は、
受け取った更新要求の処理を行い、前記データ構造管理情報の情報を参照して更新処理を実行し、その際、前記データ構造管理情報の情報から、前記データノードに対する前記更新契機情報が零の場合、更新データを、前記データ構造管理情報に指定されるデータ構造に変換して、前記構造別データ格納部に格納し、
前記更新契機が零でない場合、前記中間構造に、一旦、更新データを書き込み、処理完了を応答し、
前記アクセス受付部は、
前記アクセス処理部からの完了通知、又は、
前記アクセス処理部からの完了通知及びレプリカ先の各データノードからの完了通知、
を受けると、前記クライアント機能実現部に対して応答し、
前記データ構造変換部は、前記中間構造のデータを、前記データ構造管理情報に指定されているデータ構造に変換し変換先の前記構造別データ格納部に格納する、請求項5記載の分散ストレージシステム。 - 前記目的のデータ構造が同一の少なくとも二つのデータノードを備え、
前記二つのデータノードでは、前記書き込みデータ保持用の中間構造に保持されたデータから前記目的のデータ構造への変換を、設定された前記契機情報に基づき、それぞれ、時間的に重ならないタイミングで行い、一方のデータノードで、前記書き込みデータ保持用の中間構造に保持されたデータを、前記目的のデータ構造に変換しているとき、他方のデータノードでは、前記目的のデータ構造に変換されたデータの読み出しが行われる、請求項1記載の分散ストレージシステム。 - それぞれがデータ格納部を備え、ネットワーク結合される複数のデータノードを備えた分散ストレージのデータ複製方法において、
データの更新要求に対応したデータの複製にあたり、複製先のデータノードでは、
更新対象のデータを、一旦、書き込みデータ保持用の中間構造に格納し、更新要求とは非同期で、それぞれ目的のデータ構造に変換して前記データ格納部に格納し、
前記データノードで非同期に行われる前記目的のデータ構造への変換の実行の契機となる契機情報を、前記データノードへのアクセスの履歴情報に基づき、可変させる、データ複製方法。 - 複製先の前記データノードは、前記中間構造に前記データを保持して応答を返し、
前記中間構造に保持されるデータ構造を、前記更新対象のデータの受信から前記契機情報で規定される時間経過時に、前記目的のデータ構造に非同期で変換する、請求項9記載のデータ複製方法。 - 予め定められたテーブル単位でデータ配置先のデータノード、配置先のデータノードにおける目的のデータ構造を制御する請求項9又は10記載のデータ複製方法。
- 格納対象のデータを識別する識別子であるテーブル識別子に対応させて、複製を特定するレプリカ識別子と、前記レプリカ識別子に対応したデータ構造の種類を特定するデータ構造情報と、指定されたデータ構造に変換して格納されるまでの時間情報である契機情報と、を、前記データ構造の種類の数に対応させて管理するデータ構造管理情報と、
前記テーブル識別子に対応して、前記レプリカ識別子と、前記レプリカ識別子に対応した1つ又は複数のデータ配置先のデータノード情報とを備えたデータ配置特定情報と、
を構造情報管理装置の構造情報保持部にて記憶し、
データアクセス部において、前記データ構造管理情報と前記データ配置特定情報とを参照して、更新処理及び参照処理のアクセス先を特定し、
前記データノードは、
前記クライアントからのアクセス要求に基づき、更新処理を行う場合に、中間構造にデータを保持して応答を返し、
前記データ構造管理情報を参照し、指定された更新契機に応答して、前記中間構造に保持されるデータを、前記データ構造管理情報で指定されたデータ構造に変換する、ことを特徴とする、請求項9乃至11のいずれか1項に記載のデータ複製方法。 - 前記アクセスの履歴情報が、前記データ格納部からの読み出しアクセスと、前記中間構造へのデータの書き込みアクセスの頻度情報を含む、請求項9又は12記載のデータ複製方法。
- 前記目的のデータ構造が同一の少なくとも二つのデータノードを用意し、
前記二つのデータノードでは、前記書き込みデータ保持用の中間構造に保持されたデータから前記目的のデータ構造への変換を、設定された前記契機情報に基づき、それぞれ、時間的に重ならないタイミングで行い、一方のデータノードで、前記書き込みデータ保持用の中間構造に保持されたデータを、前記目的のデータ構造に変換しているとき、他方のデータノードでは、前記目的のデータ構造に変換されたデータの読み出しが行われる、請求項9記載のデータ複製方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011169588 | 2011-08-02 | ||
JP2011169588 | 2011-08-02 | ||
PCT/JP2012/069499 WO2013018808A1 (ja) | 2011-08-02 | 2012-07-31 | 分散ストレージシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2013018808A1 true JPWO2013018808A1 (ja) | 2015-03-05 |
JP6044539B2 JP6044539B2 (ja) | 2016-12-14 |
Family
ID=47629329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013526936A Active JP6044539B2 (ja) | 2011-08-02 | 2012-07-31 | 分散ストレージシステムおよび方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9609060B2 (ja) |
JP (1) | JP6044539B2 (ja) |
WO (1) | WO2013018808A1 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10706021B2 (en) | 2012-01-17 | 2020-07-07 | Oracle International Corporation | System and method for supporting persistence partition discovery in a distributed data grid |
US10229221B1 (en) * | 2012-03-01 | 2019-03-12 | EMC IP Holding Company LLC | Techniques for cache updates based on quality of service |
US9542433B2 (en) | 2012-12-20 | 2017-01-10 | Bank Of America Corporation | Quality assurance checks of access rights in a computing system |
US9483488B2 (en) | 2012-12-20 | 2016-11-01 | Bank Of America Corporation | Verifying separation-of-duties at IAM system implementing IAM data model |
US9189644B2 (en) | 2012-12-20 | 2015-11-17 | Bank Of America Corporation | Access requests at IAM system implementing IAM data model |
US9537892B2 (en) | 2012-12-20 | 2017-01-03 | Bank Of America Corporation | Facilitating separation-of-duties when provisioning access rights in a computing system |
US9529629B2 (en) * | 2012-12-20 | 2016-12-27 | Bank Of America Corporation | Computing resource inventory system |
US9639594B2 (en) | 2012-12-20 | 2017-05-02 | Bank Of America Corporation | Common data model for identity access management data |
US9489390B2 (en) | 2012-12-20 | 2016-11-08 | Bank Of America Corporation | Reconciling access rights at IAM system implementing IAM data model |
US9495380B2 (en) | 2012-12-20 | 2016-11-15 | Bank Of America Corporation | Access reviews at IAM system implementing IAM data model |
US9477838B2 (en) | 2012-12-20 | 2016-10-25 | Bank Of America Corporation | Reconciliation of access rights in a computing system |
JP6152704B2 (ja) * | 2013-05-28 | 2017-06-28 | 富士通株式会社 | ストレージシステム、情報処理装置の制御プログラム、およびストレージシステムの制御方法 |
GB2522459B (en) * | 2014-01-24 | 2021-02-17 | Metaswitch Networks Ltd | Timer services |
JP2015156111A (ja) * | 2014-02-20 | 2015-08-27 | 日本電気株式会社 | 配置先決定装置、配置先決定方法、及び配置先決定プログラム |
JP6361199B2 (ja) * | 2014-03-20 | 2018-07-25 | 日本電気株式会社 | 情報記憶システム |
JP6549704B2 (ja) | 2014-09-25 | 2019-07-24 | オラクル・インターナショナル・コーポレイション | 分散コンピューティング環境内でゼロコピー2進基数木をサポートするためのシステムおよび方法 |
US10664495B2 (en) | 2014-09-25 | 2020-05-26 | Oracle International Corporation | System and method for supporting data grid snapshot and federation |
US9781225B1 (en) * | 2014-12-09 | 2017-10-03 | Parallel Machines Ltd. | Systems and methods for cache streams |
CN105739909A (zh) | 2014-12-11 | 2016-07-06 | 国际商业机器公司 | 分布式存储系统中基于时间的数据放置方法和装置 |
US10096065B2 (en) * | 2015-01-16 | 2018-10-09 | Red Hat, Inc. | Distributed transactions with extended locks |
WO2016194159A1 (ja) * | 2015-06-03 | 2016-12-08 | 株式会社日立製作所 | 計算機、データベース管理方法、データベース管理システム |
US11163498B2 (en) * | 2015-07-01 | 2021-11-02 | Oracle International Corporation | System and method for rare copy-on-write in a distributed computing environment |
US10860378B2 (en) | 2015-07-01 | 2020-12-08 | Oracle International Corporation | System and method for association aware executor service in a distributed computing environment |
US10585599B2 (en) | 2015-07-01 | 2020-03-10 | Oracle International Corporation | System and method for distributed persistent store archival and retrieval in a distributed computing environment |
US11567972B1 (en) * | 2016-06-30 | 2023-01-31 | Amazon Technologies, Inc. | Tree-based format for data storage |
US11550820B2 (en) | 2017-04-28 | 2023-01-10 | Oracle International Corporation | System and method for partition-scoped snapshot creation in a distributed data computing environment |
US10769019B2 (en) | 2017-07-19 | 2020-09-08 | Oracle International Corporation | System and method for data recovery in a distributed data computing environment implementing active persistence |
US10721095B2 (en) | 2017-09-26 | 2020-07-21 | Oracle International Corporation | Virtual interface system and method for multi-tenant cloud networking |
US10862965B2 (en) | 2017-10-01 | 2020-12-08 | Oracle International Corporation | System and method for topics implementation in a distributed data computing environment |
CN108038199A (zh) * | 2017-12-12 | 2018-05-15 | 清华大学 | 一种层次结构的传感器时序数据存储方法和系统 |
CN108255429B (zh) * | 2018-01-10 | 2021-07-02 | 郑州云海信息技术有限公司 | 一种写操作控制方法、系统、装置及计算机可读存储介质 |
US20200051147A1 (en) * | 2018-08-10 | 2020-02-13 | Digital River, Inc. | Deriving and Presenting Real Time Marketable Content by Efficiently Deciphering Complex Data of Large Dynamic E-Commerce Catalogs |
US10796276B1 (en) * | 2019-04-11 | 2020-10-06 | Caastle, Inc. | Systems and methods for electronic platform for transactions of wearable items |
WO2021046750A1 (zh) * | 2019-09-11 | 2021-03-18 | 华为技术有限公司 | 数据重分布方法、装置及系统 |
CN111125101B (zh) * | 2019-12-16 | 2023-10-13 | 杭州涂鸦信息技术有限公司 | 一种数据中心表结构一致性监控方法及系统 |
US11803568B1 (en) * | 2020-03-25 | 2023-10-31 | Amazon Technologies, Inc. | Replicating changes from a database to a destination and modifying replication capacity |
US11947838B2 (en) * | 2020-11-30 | 2024-04-02 | International Business Machines Corporation | Utilizing statuses to preserve a state of data during procedures such as testing without causing functional interruptions |
CN117895546A (zh) * | 2024-03-15 | 2024-04-16 | 国网山东省电力公司东营供电公司 | 基于农机电气化改造的新能源一体化站点配置方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002197781A (ja) * | 2000-12-22 | 2002-07-12 | Ricoh Co Ltd | 情報記録再生装置と情報記録再生方法 |
JP2007317017A (ja) * | 2006-05-26 | 2007-12-06 | Nec Corp | ストレージシステム及びデータ保護方法とプログラム |
JP2010128752A (ja) * | 2008-11-27 | 2010-06-10 | Internatl Business Mach Corp <Ibm> | データベース・システム、サーバ、更新方法およびプログラム |
WO2010101189A1 (ja) * | 2009-03-06 | 2010-09-10 | 日本電気株式会社 | 情報処理システムと方法 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5119465A (en) * | 1989-06-19 | 1992-06-02 | Digital Equipment Corporation | System for selectively converting plurality of source data structures through corresponding source intermediate structures, and target intermediate structures into selected target structure |
JP3911810B2 (ja) | 1998-01-07 | 2007-05-09 | 富士ゼロックス株式会社 | 情報流通システム及び可搬型記憶媒体 |
JP3756708B2 (ja) * | 1999-09-30 | 2006-03-15 | 株式会社東芝 | 情報処理端末装置およびそのファイル管理方法 |
US6658540B1 (en) * | 2000-03-31 | 2003-12-02 | Hewlett-Packard Development Company, L.P. | Method for transaction command ordering in a remote data replication system |
JP4528039B2 (ja) | 2004-06-29 | 2010-08-18 | 国立大学法人東京工業大学 | 自律ストレージ装置、自律ストレージシステム、ネットワーク負荷分散プログラム及びネットワーク負荷分散方法 |
US7936691B2 (en) * | 2005-02-28 | 2011-05-03 | Network Equipment Technologies, Inc. | Replication of static and dynamic databases in network devices |
JP4615337B2 (ja) * | 2005-03-16 | 2011-01-19 | 株式会社日立製作所 | ストレージシステム |
US7689602B1 (en) * | 2005-07-20 | 2010-03-30 | Bakbone Software, Inc. | Method of creating hierarchical indices for a distributed object system |
JP2007128335A (ja) * | 2005-11-04 | 2007-05-24 | Nec Corp | レプリケーション調停装置と方法並びにプログラム |
US7617253B2 (en) * | 2005-12-19 | 2009-11-10 | Commvault Systems, Inc. | Destination systems and methods for performing data replication |
US7651593B2 (en) * | 2005-12-19 | 2010-01-26 | Commvault Systems, Inc. | Systems and methods for performing data replication |
US7716180B2 (en) | 2005-12-29 | 2010-05-11 | Amazon Technologies, Inc. | Distributed storage system with web services client interface |
US7783956B2 (en) * | 2006-07-12 | 2010-08-24 | Cronera Systems Incorporated | Data recorder |
US8433730B2 (en) * | 2006-10-31 | 2013-04-30 | Ariba, Inc. | Dynamic data access and storage |
US7925749B1 (en) * | 2007-04-24 | 2011-04-12 | Netapp, Inc. | System and method for transparent data replication over migrating virtual servers |
US8006111B1 (en) * | 2007-09-21 | 2011-08-23 | Emc Corporation | Intelligent file system based power management for shared storage that migrates groups of files based on inactivity threshold |
JP5199003B2 (ja) * | 2008-09-25 | 2013-05-15 | 株式会社日立製作所 | 管理装置及び計算機システム |
WO2011121869A1 (ja) * | 2010-03-29 | 2011-10-06 | 日本電気株式会社 | データアクセス場所選択システム、方法およびプログラム |
US9342574B2 (en) * | 2011-03-08 | 2016-05-17 | Nec Corporation | Distributed storage system and distributed storage method |
US8626799B2 (en) * | 2011-10-03 | 2014-01-07 | International Business Machines Corporation | Mapping data structures |
US9069835B2 (en) * | 2012-05-21 | 2015-06-30 | Google Inc. | Organizing data in a distributed storage system |
US9635109B2 (en) * | 2014-01-02 | 2017-04-25 | International Business Machines Corporation | Enhancing reliability of a storage system by strategic replica placement and migration |
US10061628B2 (en) * | 2014-03-13 | 2018-08-28 | Open Text Sa Ulc | System and method for data access and replication in a distributed environment utilizing data derived from data access within the distributed environment |
JP6361199B2 (ja) * | 2014-03-20 | 2018-07-25 | 日本電気株式会社 | 情報記憶システム |
US9569108B2 (en) * | 2014-05-06 | 2017-02-14 | International Business Machines Corporation | Dataset replica migration |
-
2012
- 2012-07-31 WO PCT/JP2012/069499 patent/WO2013018808A1/ja active Application Filing
- 2012-07-31 JP JP2013526936A patent/JP6044539B2/ja active Active
- 2012-07-31 US US14/236,666 patent/US9609060B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002197781A (ja) * | 2000-12-22 | 2002-07-12 | Ricoh Co Ltd | 情報記録再生装置と情報記録再生方法 |
JP2007317017A (ja) * | 2006-05-26 | 2007-12-06 | Nec Corp | ストレージシステム及びデータ保護方法とプログラム |
US20080154914A1 (en) * | 2006-05-26 | 2008-06-26 | Nec Corporation | Storage system, data protection method, and program |
JP2010128752A (ja) * | 2008-11-27 | 2010-06-10 | Internatl Business Mach Corp <Ibm> | データベース・システム、サーバ、更新方法およびプログラム |
WO2010101189A1 (ja) * | 2009-03-06 | 2010-09-10 | 日本電気株式会社 | 情報処理システムと方法 |
US20110320750A1 (en) * | 2009-03-06 | 2011-12-29 | Masaki Kan | Information processing system and method |
EP2405360A1 (en) * | 2009-03-06 | 2012-01-11 | Nec Corporation | Information processing system and method |
CN102341791A (zh) * | 2009-03-06 | 2012-02-01 | 日本电气株式会社 | 信息处理系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2013018808A1 (ja) | 2013-02-07 |
JP6044539B2 (ja) | 2016-12-14 |
US20140173035A1 (en) | 2014-06-19 |
US9609060B2 (en) | 2017-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6044539B2 (ja) | 分散ストレージシステムおよび方法 | |
JP5765416B2 (ja) | 分散ストレージシステムおよび方法 | |
US11816063B2 (en) | Automatic archiving of data store log data | |
US9906598B1 (en) | Distributed data storage controller | |
US8271455B2 (en) | Storing replication requests for objects in a distributed storage system | |
US8918392B1 (en) | Data storage mapping and management | |
CN102265277B (zh) | 数据存储系统的操作方法和装置 | |
CN104965850B (zh) | 一种基于开源技术的数据库高可用实现方法 | |
JP5387757B2 (ja) | 並列データ処理システム、並列データ処理方法及びプログラム | |
US8930364B1 (en) | Intelligent data integration | |
US8935203B1 (en) | Environment-sensitive distributed data management | |
KR20180055952A (ko) | 데이터베이스 관리 시스템에서의 데이터 복제 기법 | |
JP5686034B2 (ja) | クラスタシステム、同期制御方法、サーバ装置および同期制御プログラム | |
CN103294167B (zh) | 一种基于数据行为的低能耗集群存储复制装置和方法 | |
US9195611B2 (en) | Efficiently updating and deleting data in a data storage system | |
US9984139B1 (en) | Publish session framework for datastore operation records | |
EP2380090B1 (en) | Data integrity in a database environment through background synchronization | |
US8423517B2 (en) | System and method for determining the age of objects in the presence of unreliable clocks | |
US20200409566A1 (en) | Key Value Store Using Progress Verification | |
KR20190022600A (ko) | 데이터베이스 관리 시스템에서의 데이터 복제 기법 | |
US11210212B2 (en) | Conflict resolution and garbage collection in distributed databases | |
JP2012008934A (ja) | 分散ファイルシステム及び分散ファイルシステムにおける冗長化方法 | |
CN114201109A (zh) | 跟踪存储卷在数据传递期间的变化 | |
KR20130074207A (ko) | 스케줄러기반 데이터 서버간 데이터 복제 방법 | |
CN112579297A (zh) | 一种数据处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150604 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6044539 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |