JP2011248584A - 分散データ管理システム、データサーバ、トランザクションサーバ、分散データ管理方法、プログラム - Google Patents
分散データ管理システム、データサーバ、トランザクションサーバ、分散データ管理方法、プログラム Download PDFInfo
- Publication number
- JP2011248584A JP2011248584A JP2010120468A JP2010120468A JP2011248584A JP 2011248584 A JP2011248584 A JP 2011248584A JP 2010120468 A JP2010120468 A JP 2010120468A JP 2010120468 A JP2010120468 A JP 2010120468A JP 2011248584 A JP2011248584 A JP 2011248584A
- Authority
- JP
- Japan
- Prior art keywords
- lock
- statement
- data
- transaction
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】データサーバ1は、自サーバで格納するデータの階層関係を管理し、トランザクションサーバ2からステートメントのロック要求を受けると、階層関係のルートノードから、ロック要求をしてきたステートメントで用いるデータを持つ下位ノードまでを1つのグループとして該グループの各ノードのロックを取得させることとする。もし、該グループにおいて既に他のトランザクションのステートメントがロックを取得している場合、ロック要求をしてきたステートメントのトランザクションに一意に付与される特定値を、グループの他のトランザクションの中の最小の特定値と比較し、最小の特定値よりも小さい場合にグループのロックを取得させる。
【選択図】図1
Description
トランザクションを発行するトランザクションサーバと、該トランザクションで用いるデータを分散して格納する複数のデータサーバと、を有してなる分散データ管理システムであって、
前記トランザクションサーバは、
トランザクション内のステートメント毎に、該ステートメントで用いるデータに対するロック要求を前記データサーバに伝送する分散ロック状態管理装置を有し、
前記複数のデータサーバの各々は、
自サーバで格納するデータの階層関係を管理し、前記トランザクションサーバからステートメントのロック要求を受けると、階層関係のルートノードから、ロック要求をしてきたステートメントで用いるデータを持つ下位ノードまでを1つのグループとして該グループの各ノードのロックを取得させることとし、該グループにおいて既に他のトランザクションのステートメントがロックを取得している場合、ロック要求をしてきたステートメントのトランザクションに一意に付与される特定値を、グループの他のトランザクションの中の最小の特定値と比較し、最小の特定値よりも小さい場合にグループのロックを取得させるロック管理装置を有する。
トランザクションサーバにて発行されたトランザクションで用いるデータを分散して格納する複数のデータサーバのうちの1つのデータサーバであって、
自サーバで格納するデータの階層関係を管理し、前記トランザクションサーバから、トランザクション内のステートメントで用いるデータに対するロック要求を受けると、階層関係のルートノードから、ロック要求をしてきたステートメントで用いるデータを持つ下位ノードまでを1つのグループとして該グループの各ノードのロックを取得させることとし、該グループにおいて既に他のトランザクションのステートメントがロックを取得している場合、ロック要求をしてきたステートメントのトランザクションに一意に付与される特定値を、グループの他のトランザクションの中の最小の特定値と比較し、最小の特定値よりも小さい場合にグループのロックを取得させるロック管理装置を有する。
データを分散して格納する複数のデータサーバに対し、トランザクションを発行するトランザクションサーバであって、
トランザクション内のステートメント毎に、該ステートメントで用いるデータに対するロック要求を前記データサーバに伝送し、さらに、該ステートメントが、1つのデータサーバにのみロック要求をする場合、および、複数のデータサーバにロック要求をしたロックを全て取得した場合は、該ステートメントにデッドロックの可能性がない旨を、該ステートメントのロック要求の伝送先のデータサーバに通知する分散ロック状態管理装置を有する。
トランザクションを発行するトランザクションサーバと、該トランザクションで用いるデータを分散して格納する複数のデータサーバと、を有してなる分散データ管理システムによる分散データ管理方法であって、
前記複数のデータサーバの各々が、自サーバで格納するデータの階層関係を管理し、前記トランザクションサーバからステートメントのロック要求を受けると、階層関係のルートノードから、ロック要求をしてきたステートメントで用いるデータを持つ下位ノードまでを1つのグループとして該グループの各ノードのロックを取得させることとし、
前記トランザクションサーバが、トランザクション内のステートメント毎に、該ステートメントで用いるデータに対するロック要求を前記データサーバに伝送するステップと、
前記トランザクションサーバからステートメントのロック要求を受けたデータサーバが、該ステートメントにロックを取得させるグループにおいて既に他のトランザクションのステートメントがロックを取得している場合、ロック要求をしてきたステートメントのトランザクションに一意に付与される特定値を、グループの他のトランザクションの中の最小の特定値と比較し、最小の特定値よりも小さい場合にグループのロックを取得させるステップと、を有する。
トランザクションサーバにて発行されたトランザクションで用いるデータを分散して格納する複数のデータサーバのうちの1つのデータサーバによる分散データ管理方法であって、
自サーバで格納するデータの階層関係を管理し、前記トランザクションサーバから、トランザクション内のステートメントで用いるデータに対するロック要求を受けると、階層関係のルートノードから、ロック要求をしてきたステートメントで用いるデータを持つ下位ノードまでを1つのグループとして該グループの各ノードのロックを取得させることとし、
前記トランザクションサーバから、ステートメントのロック要求を受けると、該グループにおいて既に他のトランザクションのステートメントがロックを取得している場合、ロック要求をしてきたステートメントのトランザクションに一意に付与される特定値を、グループの他のトランザクションの中の最小の特定値と比較し、最小の特定値よりも小さい場合にグループのロックを取得させるロック取得ステップを有する。
データを分散して格納する複数のデータサーバに対し、トランザクションを発行するトランザクションサーバによる分散データ管理方法であって、
トランザクション内のステートメント毎に、該ステートメントで用いるデータに対するロック要求を前記データサーバに伝送するステップと、
ステートメントが、1つのデータサーバにのみロック要求をする場合、および、複数のデータサーバにロック要求をしたロックを全て取得した場合は、該ステートメントにデッドロックの可能性がない旨を、該ステートメントのロック要求の伝送先のデータサーバに通知するステップと、を有する。
前記分散データ管理方法を前記データサーバに実行させる。
(1)第1の実施形態
(1−1)第1の実施形態の構成
図1に、本実施形態の分散データ管理システムの構成を示す。
(1−2)第1の実施形態の動作
ロック管理装置12は、各データサーバ1に備えられ、各データサーバ1のロック管理装置12は、タイムスタンプを用いて、次の方式で同じ動作する。
(2)第2の実施形態
(2−1)第2の実施形態の構成
(2−1−1)分散データ管理システムの全体構成
図2に、本実施形態の分散データ管理システムの構成を示す。なお、図2において、図1と同様の部分には同一の符号を付す。
(2−1−2)トランザクションサーバ2の構成
次に、トランザクションサーバ2の構成について説明する。
(2−1−3)データサーバ1の構成
次に、データサーバ1の構成について説明する。
(2−2)第2の実施形態の動作
(2−2−1)ロック取得動作
次に、ロック取得動作について、図5を用いて説明する。
(2−2−2)優先フラグの変更動作
次に、ロック要求情報の優先フラグの変更動作について、図8を用いて説明する。
(2−2−3)ロック要求の伝送時の具体的な流れ
次に、トランザクションサーバ2からデータサーバ1へのロック要求の伝送時の処理の具体的な流れについて、図9を用いて説明する。
(2−2−4)ロック評価動作
次に、優先フラグを考慮して、ロック要求情報のロック取得の優先度を評価するロック評価動作について、図10、図11、および図12を用いて説明する。
11 記憶装置
12 ロック管理装置
2 トランザクションサーバ
21 分散ロック状態管理装置
3 位置管理サーバ
Claims (10)
- トランザクションを発行するトランザクションサーバと、該トランザクションで用いるデータを分散して格納する複数のデータサーバと、を有してなる分散データ管理システムであって、
前記トランザクションサーバは、
トランザクション内のステートメント毎に、該ステートメントで用いるデータに対するロック要求を前記データサーバに伝送する分散ロック状態管理装置を有し、
前記複数のデータサーバの各々は、
自サーバで格納するデータの階層関係を管理し、前記トランザクションサーバからステートメントのロック要求を受けると、階層関係のルートノードから、ロック要求をしてきたステートメントで用いるデータを持つ下位ノードまでを1つのグループとして該グループの各ノードのロックを取得させることとし、該グループにおいて既に他のトランザクションのステートメントがロックを取得している場合、ロック要求をしてきたステートメントのトランザクションに一意に付与される特定値を、グループの他のトランザクションの中の最小の特定値と比較し、最小の特定値よりも小さい場合にグループのロックを取得させるロック管理装置を有する、分散データ管理システム。 - トランザクションサーバにて発行されたトランザクションで用いるデータを分散して格納する複数のデータサーバのうちの1つのデータサーバであって、
自サーバで格納するデータの階層関係を管理し、前記トランザクションサーバから、トランザクション内のステートメントで用いるデータに対するロック要求を受けると、階層関係のルートノードから、ロック要求をしてきたステートメントで用いるデータを持つ下位ノードまでを1つのグループとして該グループの各ノードのロックを取得させることとし、該グループにおいて既に他のトランザクションのステートメントがロックを取得している場合、ロック要求をしてきたステートメントのトランザクションに一意に付与される特定値を、グループの他のトランザクションの中の最小の特定値と比較し、最小の特定値よりも小さい場合にグループのロックを取得させるロック管理装置を有する、データサーバ。 - 前記ロック管理装置は、
前記トランザクションサーバから、デッドロックの可能性がないステートメントが通知されると、前記通知を受けたステートメントのロック要求の優先フラグをTRUEにし、
前記トランザクションサーバから、ステートメントのロック要求を受けると、該ステートメントにロックを取得させるグループにおいて既にロックを取得した他のトランザクションのステートメントの中にロック要求の優先フラグがTRUEのトランザクションがある場合、ロック要求をしてきたステートメントには、ロックを取得させない、請求項2に記載のデータサーバ。 - データを分散して格納する複数のデータサーバに対し、トランザクションを発行するトランザクションサーバであって、
トランザクション内のステートメント毎に、該ステートメントで用いるデータに対するロック要求を前記データサーバに伝送し、さらに、該ステートメントが、1つのデータサーバにのみロック要求をする場合、および、複数のデータサーバにロック要求をしたロックを全て取得した場合は、該ステートメントにデッドロックの可能性がない旨を、該ステートメントのロック要求の伝送先のデータサーバに通知する分散ロック状態管理装置を有する、トランザクションサーバ。 - トランザクションを発行するトランザクションサーバと、該トランザクションで用いるデータを分散して格納する複数のデータサーバと、を有してなる分散データ管理システムによる分散データ管理方法であって、
前記複数のデータサーバの各々が、自サーバで格納するデータの階層関係を管理し、前記トランザクションサーバからステートメントのロック要求を受けると、階層関係のルートノードから、ロック要求をしてきたステートメントで用いるデータを持つ下位ノードまでを1つのグループとして該グループの各ノードのロックを取得させることとし、
前記トランザクションサーバが、トランザクション内のステートメント毎に、該ステートメントで用いるデータに対するロック要求を前記データサーバに伝送するステップと、
前記トランザクションサーバからステートメントのロック要求を受けたデータサーバが、該ステートメントにロックを取得させるグループにおいて既に他のトランザクションのステートメントがロックを取得している場合、ロック要求をしてきたステートメントのトランザクションに一意に付与される特定値を、グループの他のトランザクションの中の最小の特定値と比較し、最小の特定値よりも小さい場合にグループのロックを取得させるステップと、を有する、分散データ管理方法。 - トランザクションサーバにて発行されたトランザクションで用いるデータを分散して格納する複数のデータサーバのうちの1つのデータサーバによる分散データ管理方法であって、
自サーバで格納するデータの階層関係を管理し、前記トランザクションサーバから、トランザクション内のステートメントで用いるデータに対するロック要求を受けると、階層関係のルートノードから、ロック要求をしてきたステートメントで用いるデータを持つ下位ノードまでを1つのグループとして該グループの各ノードのロックを取得させることとし、
前記トランザクションサーバから、ステートメントのロック要求を受けると、該グループにおいて既に他のトランザクションのステートメントがロックを取得している場合、ロック要求をしてきたステートメントのトランザクションに一意に付与される特定値を、グループの他のトランザクションの中の最小の特定値と比較し、最小の特定値よりも小さい場合にグループのロックを取得させるロック取得ステップを有する、分散データ管理方法。 - 前記トランザクションサーバから、デッドロックの可能性がないステートメントが通知されると、前記通知を受けたステートメントのロック要求の優先フラグをTRUEにするステップをさらに有し、
前記ロック取得ステップでは、前記トランザクションサーバから、ステートメントのロック要求を受けると、該ステートメントにロックを取得させるグループにおいて既にロックを取得した他のトランザクションのステートメントの中にロック要求の優先フラグがTRUEのトランザクションがある場合、ロック要求をしてきたステートメントには、ロックを取得させない、請求項6に記載の分散データ管理方法。 - データを分散して格納する複数のデータサーバに対し、トランザクションを発行するトランザクションサーバによる分散データ管理方法であって、
トランザクション内のステートメント毎に、該ステートメントで用いるデータに対するロック要求を前記データサーバに伝送するステップと、
ステートメントが、1つのデータサーバにのみロック要求をする場合、および、複数のデータサーバにロック要求をしたロックを全て取得した場合は、該ステートメントにデッドロックの可能性がない旨を、該ステートメントのロック要求の伝送先のデータサーバに通知するステップと、を有する、分散データ管理方法。 - 請求項6または7に記載の分散データ管理方法を前記データサーバに実行させるためのプログラム。
- 請求項8に記載の分散データ管理方法を前記トランザクションサーバに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010120468A JP5069337B2 (ja) | 2010-05-26 | 2010-05-26 | 分散データ管理システム、データサーバ、トランザクションサーバ、分散データ管理方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010120468A JP5069337B2 (ja) | 2010-05-26 | 2010-05-26 | 分散データ管理システム、データサーバ、トランザクションサーバ、分散データ管理方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011248584A true JP2011248584A (ja) | 2011-12-08 |
JP5069337B2 JP5069337B2 (ja) | 2012-11-07 |
Family
ID=45413769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010120468A Active JP5069337B2 (ja) | 2010-05-26 | 2010-05-26 | 分散データ管理システム、データサーバ、トランザクションサーバ、分散データ管理方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5069337B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013132628A1 (ja) * | 2012-03-08 | 2013-09-12 | 株式会社Murakumo | データベースの管理方法 |
WO2013157099A1 (ja) * | 2012-04-18 | 2013-10-24 | 株式会社Murakumo | データベースの管理方法、データベースシステム、及び、プログラム |
CN106462601A (zh) * | 2014-03-31 | 2017-02-22 | 亚马逊科技公司 | 针对多盘区操作的原子写入 |
US10264071B2 (en) | 2014-03-31 | 2019-04-16 | Amazon Technologies, Inc. | Session management in distributed storage systems |
US10372685B2 (en) | 2014-03-31 | 2019-08-06 | Amazon Technologies, Inc. | Scalable file storage service |
US11003509B2 (en) | 2017-11-29 | 2021-05-11 | Fujitsu Limited | Lock control apparatus and lock control method |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0277960A (ja) * | 1988-09-14 | 1990-03-19 | Toshiba Corp | 分散型データベースにおける一貫性制御のデッドロック防止方式 |
JP2009026334A (ja) * | 2001-03-19 | 2009-02-05 | Ricoh Co Ltd | 書き込み遅延データベース管理システム、及びプログラム |
-
2010
- 2010-05-26 JP JP2010120468A patent/JP5069337B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0277960A (ja) * | 1988-09-14 | 1990-03-19 | Toshiba Corp | 分散型データベースにおける一貫性制御のデッドロック防止方式 |
JP2009026334A (ja) * | 2001-03-19 | 2009-02-05 | Ricoh Co Ltd | 書き込み遅延データベース管理システム、及びプログラム |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013132628A1 (ja) * | 2012-03-08 | 2013-09-12 | 株式会社Murakumo | データベースの管理方法 |
JPWO2013132628A1 (ja) * | 2012-03-08 | 2015-07-30 | 株式会社Murakumo | データベースの管理方法 |
US10102263B2 (en) | 2012-03-08 | 2018-10-16 | Murakumo Corporation | Database management method |
US11151157B2 (en) | 2012-03-08 | 2021-10-19 | Murakumo Corporation | Database management method |
WO2013157099A1 (ja) * | 2012-04-18 | 2013-10-24 | 株式会社Murakumo | データベースの管理方法、データベースシステム、及び、プログラム |
JPWO2013157099A1 (ja) * | 2012-04-18 | 2015-12-21 | 株式会社Murakumo | データベースの管理方法、データベースシステム、及び、プログラム |
CN106462601A (zh) * | 2014-03-31 | 2017-02-22 | 亚马逊科技公司 | 针对多盘区操作的原子写入 |
JP2017510002A (ja) * | 2014-03-31 | 2017-04-06 | アマゾン・テクノロジーズ・インコーポレーテッド | 複数エクステント動作のための原子書き込み |
US10264071B2 (en) | 2014-03-31 | 2019-04-16 | Amazon Technologies, Inc. | Session management in distributed storage systems |
US10372685B2 (en) | 2014-03-31 | 2019-08-06 | Amazon Technologies, Inc. | Scalable file storage service |
CN106462601B (zh) * | 2014-03-31 | 2019-12-17 | 亚马逊科技公司 | 针对多盘区操作的原子写入 |
US11003509B2 (en) | 2017-11-29 | 2021-05-11 | Fujitsu Limited | Lock control apparatus and lock control method |
Also Published As
Publication number | Publication date |
---|---|
JP5069337B2 (ja) | 2012-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5069337B2 (ja) | 分散データ管理システム、データサーバ、トランザクションサーバ、分散データ管理方法、プログラム | |
CN107977376B (zh) | 分布式数据库系统及事务处理方法 | |
EP2875426B1 (en) | Combining scalability across multiple resources in a transaction processing system having global serializability | |
US20040199734A1 (en) | Deadlock resolution through lock requeuing | |
US20080319996A1 (en) | Distributed Lock Manager For File System Objects In A Shared File System | |
JP2014535081A (ja) | クライアント/サーバシステムの分散した複製コンテンツの強一貫性を維持するための方法およびシステム | |
JP6198825B2 (ja) | 分散並列環境における非同期メッセージのシーケンシングの方法、システム、およびコンピュータプログラム製品 | |
CN113722127A (zh) | 高效轻量易用的分布式网络消息中间件 | |
Shrivastava et al. | Replica control following 1SR in DRTDBS through best case of transaction execution | |
EP2693337B1 (en) | Method, system and computer program products for sequencing asynchronous messages in a distributed and parallel environment | |
US11762878B2 (en) | System and method for a distributed database | |
US20140040194A1 (en) | Method, system and computer program product for sequencing asynchronous messages in a distributed and parallel environment | |
CN110659303A (zh) | 一种数据库节点的读写控制方法及装置 | |
Yadav et al. | A review of various mutual exclusion algorithms in distributed environment | |
Alom et al. | Optimization of detected deadlock views of distributed database | |
Olmsted et al. | High volume web service resource consumption | |
Alom et al. | Deadlock detection views of distributed database | |
Tang et al. | An efficient deadlock prevention approach for service oriented transaction processing | |
WO2013018593A1 (ja) | 情報処理装置、情報処理システム、情報処理方法および制御プログラム記録媒体 | |
Basu | Token Ring Algorithm to Achieve Mutual Exclusion In Distributed System-A Centralized Approach | |
Lou et al. | An effective deadlock prevention mechanism for distributed transaction management | |
Tomar et al. | A review on deadlock detection in distributed database | |
Tang et al. | A pipeline-based approach for long transaction processing in web service environments | |
Desai et al. | A log (n) multi-mode locking protocol for distributed systems | |
Böttcher et al. | Reducing sub-transaction aborts and blocking time within atomic commit protocols |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120814 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120816 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150824 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5069337 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |