JP2014532921A - 高可用性クラスタにおけるスプリット・ブレイン耐性フェイルオーバ - Google Patents
高可用性クラスタにおけるスプリット・ブレイン耐性フェイルオーバ Download PDFInfo
- Publication number
- JP2014532921A JP2014532921A JP2014538959A JP2014538959A JP2014532921A JP 2014532921 A JP2014532921 A JP 2014532921A JP 2014538959 A JP2014538959 A JP 2014538959A JP 2014538959 A JP2014538959 A JP 2014538959A JP 2014532921 A JP2014532921 A JP 2014532921A
- Authority
- JP
- Japan
- Prior art keywords
- master
- current
- quorum
- candidates
- machines
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/275—Synchronous replication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/142—Reconfiguring to eliminate the error
- G06F11/1425—Reconfiguring to eliminate the error by reconfiguration of node membership
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/18—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
- G06F11/187—Voting techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Hardware Redundancy (AREA)
Abstract
Description
Claims (23)
- 少なくとも1台のネットワーク・クライアントにサービスを提供する高可用性クラスタのマシン群を含むノード間においてフェイルオーバを提供するべくステートを同期的にレプリケートする方法であって、
a)前記マシン群の中からm台(mは少なくとも2である)のマスタ候補を特定するステップと、
b)前記マシン群の中からn台(nは少なくとも3でありかつ奇数である)のクォーラム・マシンを特定するステップと、
c)前記m台のマスタ候補の各々を同期的に更新してカレント・ステートを維持するステップと、
d)前記クォーラム・マシン群からのクォーラムベースの多数決によって、前記m台のマスタ候補からカレント・マスタを選出するステップと、
e)前記カレント・マスタに対して、該カレント・マスタに属するローカル・クロックで測定することにより求められるカレントの期限付きリースを発行し、前記カレント・マスタが、前記カレントの期限付きリースを保持している間に、前記少なくとも1台のネットワーク・クライアントによって要求されたサービスを実行するステップと、
f)前記カレントの期限付きリースの相対的なクロック・スキューを或る上限に抑制するステップとを含み、
前記カレント・マスタに障害が発生した場合に、前記m台のマスタ候補の中から新たなマスタへのフェイルオーバをトリガし、前記新たなマスタに対して新たな期限付きリースを発行し、それによって前記マスタ候補間のスプリット・ブレイン状態を防止するようにしたことを特徴とする方法。 - 前記n台のクォーラム・マシンからのクォーラムベースの多数決によって、前記m台のマスタ候補からカレント・バックアップ・マスタを選出するステップをさらに含むことを特徴とする請求項1に記載の方法。
- 前記新たなマスタが前記カレント・バックアップ・マスタであり、前記フェイルオーバが前記カレント・バックアップ・マスタへのフェイルオーバであることを特徴とする請求項2に記載の方法。
- 前記相対的なクロック・スキューを抑制する前記ステップが、
a)データ補正間の遅延を比較することによって前記相対的なクロック・スキューを推定するステップと、
b)前記データ補正間の前記遅延に基づいて前記上限を調節するステップとを含むことを特徴とする請求項1に記載の方法。 - 前記上限が、前記ローカル・クロックの物理的特性から決定されることを特徴とする請求項1に記載の方法。
- 前記物理的特性が、熱ドリフト及び発振器ドリフトからなる群から選択されることを特徴とする請求項5に記載の方法。
- 前記上限が、セントラル・クロックとの比較から決定されることを特徴とする請求項1に記載の方法。
- 前記カレントの期限付きリースが、数秒または数十秒間であることを特徴とする請求項1に記載の方法。
- 前記m台のマスタ候補を動的に拡張するステップをさらに含み、該ステップが、
a)前記高可用性クラスタに属する新たな候補マシンを特定するステップと、
b)前記新たな候補マシンを同期的に更新してカレント・ステートを維持するステップと、
c)前記新たな候補マシンを前記m台のマスタ候補に加えて前記台数mを増加させるステップとを含むことを特徴とする請求項1に記載の方法。 - 前記マスタ候補のプールを動的に縮小するステップをさらに含み、該ステップが、
a)前記m台のマスタ候補の中から所定の候補マシンを特定するステップと、
b)前記所定の候補マシンを前記m台のマスタ候補から除外して前記台数mを減少させるステップとを含むことを特徴とする請求項1に記載の方法。 - 前記サービスが、前記高可用性クラスタのリソースから前記少なくとも1台のネットワーク・クライアントに提供されるレガシー・アプリケーションを含むことを特徴とする請求項1に記載の方法。
- 前記同期的に更新するステップが、ローカル・エリア・ネットワーク上で行われ、
前記サービスが、広域ネットワーク上での通信を含むことを特徴とする請求項1に記載の方法。 - 前記m台のマスタ候補及び前記n台のクォーラム・マシンが、互いに異なるマシンを含むことを特徴とする請求項1に記載の方法。
- 前記n台のクォーラム・マシンを互いにアイソレートするステップをさらに含むことを特徴とする請求項13に記載の方法。
- 少なくとも1台のネットワーク・クライアントにサービスを提供する高可用性クラスタを、前記高可用性クラスタのマシン群を含むノード間においてスプリット・ブレイン状態を生じさせることなくフェイルオーバを提供するべく動作させる方法であって、
a)前記マシン群の中からm台(mは少なくとも2である)のマスタ候補を特定するステップと、
b)前記マシン群の中からn台(nは少なくとも3でありかつ奇数である)のクォーラム・マシンを特定するステップと、
c)前記m台のマスタ候補の各々を同期的に更新して、カレント・ステートを維持するステップと、
d)前記クォーラム・マシン群からのクォーラムベースの多数決によって、前記m台のマスタ候補からカレント・マスタを選出するステップと、
e)前記カレント・マスタに対して、該カレント・マスタに属するローカル・クロックで測定することにより求められるカレントの期限付きリースを発行し、前記カレント・マスタが、前記カレントの期限付きリースを保持している間に、前記少なくとも1台のネットワーク・クライアントによって要求されたサービスを実行するステップと、
f)前記カレントの期限付きリースの相対的なクロック・スキューを或る上限に抑制するステップとを含み、
前記カレント・マスタに障害が発生した場合に、前記m台のマスタ候補の中から新たなマスタへのフェイルオーバをトリガし、前記新たなマスタに対して新たな期限付きリースを発行し、それによって前記マスタ候補間のスプリット・ブレイン状態を防止するようにしたことを特徴とする方法。 - 前記m台のマスタ候補からカレント・バックアップ・マスタを選出するステップをさらに含むことを特徴とする請求項15に記載の方法。
- 前記新たなマスタが前記カレント・バックアップ・マスタであり、前記フェイルオーバが前記カレント・バックアップ・マスタへのフェイルオーバであることを特徴とする請求項16に記載の方法。
- 前記相対的なクロック・スキューを抑制する前記ステップが、データ補正間の遅延、前記ローカル・クロックの物理的特性、前記ローカル・クロック及びセントラル・クロック間のドリフトからなる群の中からから選択された物理パラメータから決定される調節を含むことを特徴とする請求項15に記載の方法。
- マシン群を含むノード間においてスプリット・ブレイン状態を生じさせることなくフェイルオーバを行う能力を有する高可用性クラスタであって、
a)前記マシン群の中から特定されたm台(mは少なくとも2である)のマスタ候補と、
b)前記マシン群の中から特定されたn台(nは少なくとも3でありかつ奇数である)のクォーラム・マシンと、
b)前記m台のマスタ候補の中からステートを同期的にレプリケートしかつ更新してカレント・ステートを維持するためのローカル・エリア・ネットワークと、
c)前記m台のマスタ候補の中からカレント・マスタを選出するための、前記クォーラム・マシン群からのクォーラムベースの多数決プロトコルと、
d)前記カレント・マスタに対して、該カレント・マスタに属するローカル・クロックで測定することにより求められるカレントの期限付きリースを発行するための機構と、
e)前記カレントの期限付きリースの相対的なクロック・スキューを或る上限に抑制するための物理パラメータとを含み、
前記カレント・マスタに障害が発生した場合に、前記m台のマスタ候補の中から新たなマスタへのフェイルオーバをトリガし、前記新たなマスタに対して新たな期限付きリースを発行し、それによって前記マスタ候補間のスプリット・ブレイン状態を防止するようにしたことを特徴とする高可用性クラスタ。 - 前記クォーラムベースの多数決プロトコルがPaxosであることを特徴とする請求項19に記載の高可用性クラスタ。
- 前記マスタ候補が、ネーム・ノード・マスタ候補であることを特徴とする請求項19に記載の高可用性クラスタ。
- 前記物理パラメータが、データ補正間の遅延、前記ローカル・クロックの物理的特性、前記ローカル・クロック及びセントラル・クロック間のドリフトからなる群から選択されたものであることを特徴とする請求項19に記載の高可用性クラスタ。
- 前記ノードが、ブロック・ストレージ・デバイスを備えた分散型ストレージ・システムを含むことを特徴とする請求項19に記載の高可用性クラスタ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/317,803 US8595546B2 (en) | 2011-10-28 | 2011-10-28 | Split brain resistant failover in high availability clusters |
US13/317,803 | 2011-10-28 | ||
PCT/US2012/061740 WO2013063152A1 (en) | 2011-10-28 | 2012-10-24 | Split brain resistant failover in high availability clusters |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014532921A true JP2014532921A (ja) | 2014-12-08 |
JP6084624B2 JP6084624B2 (ja) | 2017-02-22 |
Family
ID=48168449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014538959A Expired - Fee Related JP6084624B2 (ja) | 2011-10-28 | 2012-10-24 | 高可用性クラスタにおけるスプリット・ブレイン耐性フェイルオーバ |
Country Status (6)
Country | Link |
---|---|
US (2) | US8595546B2 (ja) |
EP (1) | EP2771789A4 (ja) |
JP (1) | JP6084624B2 (ja) |
KR (1) | KR101992508B1 (ja) |
CA (1) | CA2853465C (ja) |
WO (1) | WO2013063152A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018534665A (ja) * | 2015-09-30 | 2018-11-22 | ベリタス テクノロジーズ エルエルシー | 入力/出力フェンシングの最適化 |
Families Citing this family (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9361311B2 (en) * | 2005-01-12 | 2016-06-07 | Wandisco, Inc. | Distributed file system using consensus nodes |
US9424272B2 (en) | 2005-01-12 | 2016-08-23 | Wandisco, Inc. | Distributed file system using consensus nodes |
US8595546B2 (en) * | 2011-10-28 | 2013-11-26 | Zettaset, Inc. | Split brain resistant failover in high availability clusters |
TWI461929B (zh) * | 2011-12-09 | 2014-11-21 | Promise Tecnnology Inc | 雲端數據儲存系統 |
EP2792104B1 (en) | 2011-12-21 | 2021-06-30 | SSH Communications Security Oyj | Automated access, key, certificate, and credential management |
US9069827B1 (en) | 2012-01-17 | 2015-06-30 | Amazon Technologies, Inc. | System and method for adjusting membership of a data replication group |
US9116862B1 (en) | 2012-01-17 | 2015-08-25 | Amazon Technologies, Inc. | System and method for data replication using a single master failover protocol |
US8843441B1 (en) | 2012-01-17 | 2014-09-23 | Amazon Technologies, Inc. | System and method for maintaining a master replica for reads and writes in a data store |
US9489434B1 (en) * | 2012-01-17 | 2016-11-08 | Amazon Technologies, Inc. | System and method for replication log branching avoidance using post-failover rejoin |
US10037346B1 (en) * | 2012-07-25 | 2018-07-31 | Google Llc | Time reservations for ensuring consistent reads in a distributed database without logging |
US9753954B2 (en) * | 2012-09-14 | 2017-09-05 | Cloudera, Inc. | Data node fencing in a distributed file system |
US9146794B2 (en) * | 2012-10-01 | 2015-09-29 | Microsoft Technology Licensing, Llc | Enhanced arbitration protocol for nodes in a cluster |
US10432703B2 (en) * | 2012-11-26 | 2019-10-01 | Facebook, Inc. | On-demand session upgrade in a coordination service |
US20140258771A1 (en) | 2013-03-06 | 2014-09-11 | Fortinet, Inc. | High-availability cluster architecture and protocol |
US10229181B2 (en) * | 2013-07-16 | 2019-03-12 | Pankaj Sharma | System and method for synchronizing data between communication devices in a networked environment without a central server |
JP6091376B2 (ja) * | 2013-08-12 | 2017-03-08 | 日本電信電話株式会社 | クラスタシステムおよびSplit−BrainSyndrome検出方法 |
IN2013MU02794A (ja) * | 2013-08-27 | 2015-07-03 | Tata Consultancy Services Ltd | |
US9569513B1 (en) * | 2013-09-10 | 2017-02-14 | Amazon Technologies, Inc. | Conditional master election in distributed databases |
US9686161B2 (en) * | 2013-09-16 | 2017-06-20 | Axis Ab | Consensus loss in distributed control systems |
US9465698B2 (en) * | 2014-03-06 | 2016-10-11 | Software Ag | Systems and/or methods for data recovery in distributed, scalable multi-tenant environments |
US9251017B2 (en) | 2014-03-25 | 2016-02-02 | International Business Machines Corporation | Handling failed cluster members when replicating a database between clusters |
US9742692B2 (en) * | 2014-06-23 | 2017-08-22 | Microsoft Technology Licensing, Llc | Acquiring resource lease using multiple lease servers |
JP6367630B2 (ja) * | 2014-07-17 | 2018-08-01 | Necネットワーク・センサ株式会社 | 冗長系システム、冗長機器及びその切替方法 |
US9047246B1 (en) | 2014-07-31 | 2015-06-02 | Splunk Inc. | High availability scheduler |
US20160080249A1 (en) * | 2014-09-17 | 2016-03-17 | Telefonaktiebolaget L M Ericsson (Publ) | Prevent vrrp master / master split in active / standby icr system |
US9984140B1 (en) * | 2015-02-05 | 2018-05-29 | Amazon Technologies, Inc. | Lease based leader election system |
CN106155780B (zh) | 2015-04-02 | 2020-01-31 | 阿里巴巴集团控股有限公司 | 一种基于时间的节点选举方法及装置 |
US10609137B2 (en) | 2015-08-24 | 2020-03-31 | Microsoft Technology Licensing, Llc | Global logical timestamp |
US9916214B2 (en) | 2015-11-17 | 2018-03-13 | International Business Machines Corporation | Preventing split-brain scenario in a high-availability cluster |
US9858011B2 (en) * | 2015-12-16 | 2018-01-02 | International Business Machines Corporation | Repopulating failed replicas through modified consensus recovery |
US10187255B2 (en) | 2016-02-29 | 2019-01-22 | Red Hat, Inc. | Centralized configuration data in a distributed file system |
US11075806B1 (en) | 2016-06-30 | 2021-07-27 | Juniper Networks, Inc. | Hierarchical naming scheme for state propagation within network devices |
US10461991B1 (en) * | 2016-09-19 | 2019-10-29 | Amazon Technologies, Inc. | Dynamic replication peering |
US10346366B1 (en) | 2016-09-23 | 2019-07-09 | Amazon Technologies, Inc. | Management of a data processing pipeline |
US10805238B1 (en) * | 2016-09-23 | 2020-10-13 | Amazon Technologies, Inc. | Management of alternative resources |
US10423459B1 (en) | 2016-09-23 | 2019-09-24 | Amazon Technologies, Inc. | Resource manager |
US10666569B1 (en) | 2016-09-23 | 2020-05-26 | Amazon Technologies, Inc. | Journal service with named clients |
CN107919977B (zh) * | 2016-10-11 | 2021-09-03 | 阿里巴巴集团控股有限公司 | 一种基于Paxos协议的在线扩容、在线缩容的方法和装置 |
US10664866B2 (en) * | 2016-11-30 | 2020-05-26 | Facebook, Inc. | Conversion optimization with long attribution window |
US11803420B1 (en) * | 2016-12-20 | 2023-10-31 | Amazon Technologies, Inc. | Execution of replicated tasks using redundant resources |
US11316775B2 (en) * | 2016-12-21 | 2022-04-26 | Juniper Networks, Inc. | Maintaining coherency in distributed operating systems for network devices |
US10887173B2 (en) | 2016-12-21 | 2021-01-05 | Juniper Networks, Inc. | Communicating state information in distributed operating systems |
US11316744B2 (en) | 2016-12-21 | 2022-04-26 | Juniper Networks, Inc. | Organizing execution of distributed operating systems for network devices |
US10521344B1 (en) * | 2017-03-10 | 2019-12-31 | Pure Storage, Inc. | Servicing input/output (‘I/O’) operations directed to a dataset that is synchronized across a plurality of storage systems |
US10534767B2 (en) | 2017-03-14 | 2020-01-14 | International Business Machines Corporation | Disaster recovery for split storage cluster |
CN109240840B (zh) * | 2017-07-11 | 2022-04-19 | 阿里巴巴集团控股有限公司 | 集群系统的容灾方法、装置和机器可读介质 |
US20190354628A1 (en) | 2018-05-21 | 2019-11-21 | Pure Storage, Inc. | Asynchronous replication of synchronously replicated data |
CN108989391B (zh) * | 2018-06-19 | 2021-09-07 | 北京百悟科技有限公司 | 一种一致性处理的方法及系统 |
US10884879B2 (en) | 2018-10-18 | 2021-01-05 | Oracle International Corporation | Method and system for computing a quorum for two node non-shared storage converged architecture |
US10963353B2 (en) * | 2018-10-23 | 2021-03-30 | Capital One Services, Llc | Systems and methods for cross-regional back up of distributed databases on a cloud service |
US11095742B2 (en) | 2019-03-27 | 2021-08-17 | Juniper Networks, Inc. | Query proxy for delivery of dynamic system state |
US11614769B2 (en) * | 2019-07-15 | 2023-03-28 | Ecole Polytechnique Federale De Lausanne (Epfl) | Asynchronous distributed coordination and consensus with threshold logical clocks |
CN110417600B (zh) * | 2019-08-02 | 2022-10-25 | 秒针信息技术有限公司 | 分布式系统的节点切换方法、装置及计算机存储介质 |
CN110455370B (zh) * | 2019-08-18 | 2020-10-02 | 安徽省(水利部淮河水利委员会)水利科学研究院(安徽省水利工程质量检测中心站) | 防汛抗旱远程遥测显示系统 |
US20210191826A1 (en) * | 2019-12-20 | 2021-06-24 | Johnson Controls Technology Company | Building system with ledger based software gateways |
US11544228B2 (en) | 2020-05-07 | 2023-01-03 | Hewlett Packard Enterprise Development Lp | Assignment of quora values to nodes based on importance of the nodes |
US11477117B1 (en) | 2020-11-23 | 2022-10-18 | Juniper Networks, Inc. | High-availability switchover based on traffic metrics |
US11575741B2 (en) | 2021-04-29 | 2023-02-07 | Zoom Video Communications, Inc. | System and method for active-active standby in phone system management |
US11785077B2 (en) | 2021-04-29 | 2023-10-10 | Zoom Video Communications, Inc. | Active-active standby for real-time telephony traffic |
US20230032812A1 (en) * | 2021-08-02 | 2023-02-02 | International Business Machines Corporation | Auto-split and auto-merge clusters |
US11438224B1 (en) | 2022-01-14 | 2022-09-06 | Bank Of America Corporation | Systems and methods for synchronizing configurations across multiple computing clusters |
CN115967669B (zh) * | 2023-03-16 | 2023-06-27 | 北京志凌海纳科技有限公司 | 基于vrrp拓展协议的脑裂抑制方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002163140A (ja) * | 2000-11-27 | 2002-06-07 | Fujitsu Ltd | ストレージシステム |
JP2005502957A (ja) * | 2001-09-06 | 2005-01-27 | ビーイーエイ システムズ, インコーポレイテッド | 厳密に一回のキャッシュフレームワーク |
JP2006004434A (ja) * | 2004-06-18 | 2006-01-05 | Microsoft Corp | 分散障害許容型コンピューティングシステムにおける効率のよいレプリカセットの変更 |
US20060015507A1 (en) * | 2004-07-17 | 2006-01-19 | Butterworth Henry E | Controlling data consistency guarantees in storage apparatus |
US20100185781A1 (en) * | 2009-01-22 | 2010-07-22 | Anderson Eric A | System and Method for Measuring Clock Skew on a Network |
JP2011210106A (ja) * | 2010-03-30 | 2011-10-20 | Nippon Telegr & Teleph Corp <Ntt> | メッセージキュー管理システム及びロックサーバ及びメッセージキュー管理方法及びメッセージキュー管理プログラム |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5261085A (en) | 1989-06-23 | 1993-11-09 | Digital Equipment Corporation | Fault-tolerant system and method for implementing a distributed state machine |
US7774469B2 (en) * | 1999-03-26 | 2010-08-10 | Massa Michael T | Consistent cluster operational data in a server cluster using a quorum of replicas |
US6487622B1 (en) * | 1999-10-28 | 2002-11-26 | Ncr Corporation | Quorum arbitrator for a high availability system |
US6687846B1 (en) * | 2000-03-30 | 2004-02-03 | Intel Corporation | System and method for error handling and recovery |
US7228453B2 (en) * | 2000-10-16 | 2007-06-05 | Goahead Software, Inc. | Techniques for maintaining high availability of networked systems |
US7640582B2 (en) * | 2003-04-16 | 2009-12-29 | Silicon Graphics International | Clustered filesystem for mix of trusted and untrusted nodes |
US6944785B2 (en) * | 2001-07-23 | 2005-09-13 | Network Appliance, Inc. | High-availability cluster virtual server system |
KR100753564B1 (ko) * | 2001-12-24 | 2007-08-30 | 엘지엔시스(주) | 고가용성 시스템의 정보 유지방법 |
US6950855B2 (en) * | 2002-01-18 | 2005-09-27 | International Business Machines Corporation | Master node selection in clustered node configurations |
US7421478B1 (en) * | 2002-03-07 | 2008-09-02 | Cisco Technology, Inc. | Method and apparatus for exchanging heartbeat messages and configuration information between nodes operating in a master-slave configuration |
DE60318468T2 (de) * | 2002-10-07 | 2008-05-21 | Fujitsu Siemens Computers, Inc., Sunnyvale | Verfahren zur lösung von entscheidungslosigkeiten in einem cluster-rechnersystem |
US7194652B2 (en) | 2002-10-29 | 2007-03-20 | Brocade Communications Systems, Inc. | High availability synchronization architecture |
EP1620968B1 (en) * | 2003-04-29 | 2011-02-09 | TELEFONAKTIEBOLAGET LM ERICSSON (publ) | Multiphase clock recovery |
US7478263B1 (en) * | 2004-06-01 | 2009-01-13 | Network Appliance, Inc. | System and method for establishing bi-directional failover in a two node cluster |
US7711820B2 (en) * | 2004-11-08 | 2010-05-04 | Cisco Technology, Inc. | High availability for intelligent applications in storage networks |
JP4182948B2 (ja) | 2004-12-21 | 2008-11-19 | 日本電気株式会社 | フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法 |
US7953890B1 (en) | 2006-01-27 | 2011-05-31 | Symantec Operating Corporation | System and method for switching to a new coordinator resource |
US20080140982A1 (en) | 2006-10-05 | 2008-06-12 | Holt John M | Redundant multiple computer architecture |
US8473564B2 (en) | 2006-10-05 | 2013-06-25 | Waratek Pty Ltd. | Contention detection and resolution |
US7590886B2 (en) | 2006-11-21 | 2009-09-15 | General Instruments, Corporation | Method and apparatus for facilitating device redundancy in a fault-tolerant system |
US7814301B2 (en) | 2007-04-11 | 2010-10-12 | Hewlett-Packard Development Company, L.P. | Clock architecture for multi-processor systems |
KR100864987B1 (ko) * | 2007-04-12 | 2008-10-22 | 디비코 주식회사 | 클라이언트 동기화 시스템 및 그 방법 |
US20090249174A1 (en) * | 2008-04-01 | 2009-10-01 | International Business Machines Corporation | Fault Tolerant Self-Correcting Non-Glitching Low Power Circuit for Static and Dynamic Data Storage |
US8001413B2 (en) | 2008-05-05 | 2011-08-16 | Microsoft Corporation | Managing cluster split-brain in datacenter service site failover |
GB0914815D0 (en) * | 2009-08-25 | 2009-09-30 | Univ City | Improvements relating to database replication protocols |
JP5292351B2 (ja) | 2010-03-30 | 2013-09-18 | 日本電信電話株式会社 | メッセージキュー管理システム及びロックサーバ及びメッセージキュー管理方法及びメッセージキュー管理プログラム |
US9081888B2 (en) * | 2010-03-31 | 2015-07-14 | Cloudera, Inc. | Collecting and aggregating log data with fault tolerance |
US9323775B2 (en) * | 2010-06-19 | 2016-04-26 | Mapr Technologies, Inc. | Map-reduce ready distributed file system |
US8627135B2 (en) | 2010-08-14 | 2014-01-07 | Teradata Us, Inc. | Management of a distributed computing system through replication of write ahead logs |
US8949558B2 (en) * | 2011-04-29 | 2015-02-03 | International Business Machines Corporation | Cost-aware replication of intermediate data in dataflows |
US8595546B2 (en) * | 2011-10-28 | 2013-11-26 | Zettaset, Inc. | Split brain resistant failover in high availability clusters |
US9069827B1 (en) * | 2012-01-17 | 2015-06-30 | Amazon Technologies, Inc. | System and method for adjusting membership of a data replication group |
US9116862B1 (en) * | 2012-01-17 | 2015-08-25 | Amazon Technologies, Inc. | System and method for data replication using a single master failover protocol |
US9146794B2 (en) * | 2012-10-01 | 2015-09-29 | Microsoft Technology Licensing, Llc | Enhanced arbitration protocol for nodes in a cluster |
-
2011
- 2011-10-28 US US13/317,803 patent/US8595546B2/en active Active
-
2012
- 2012-10-24 JP JP2014538959A patent/JP6084624B2/ja not_active Expired - Fee Related
- 2012-10-24 EP EP12843454.5A patent/EP2771789A4/en not_active Withdrawn
- 2012-10-24 WO PCT/US2012/061740 patent/WO2013063152A1/en active Application Filing
- 2012-10-24 KR KR1020147014185A patent/KR101992508B1/ko active IP Right Grant
- 2012-10-24 CA CA2853465A patent/CA2853465C/en active Active
-
2013
- 2013-11-12 US US14/078,488 patent/US9460183B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002163140A (ja) * | 2000-11-27 | 2002-06-07 | Fujitsu Ltd | ストレージシステム |
JP2005502957A (ja) * | 2001-09-06 | 2005-01-27 | ビーイーエイ システムズ, インコーポレイテッド | 厳密に一回のキャッシュフレームワーク |
JP2006004434A (ja) * | 2004-06-18 | 2006-01-05 | Microsoft Corp | 分散障害許容型コンピューティングシステムにおける効率のよいレプリカセットの変更 |
US20060015507A1 (en) * | 2004-07-17 | 2006-01-19 | Butterworth Henry E | Controlling data consistency guarantees in storage apparatus |
US20100185781A1 (en) * | 2009-01-22 | 2010-07-22 | Anderson Eric A | System and Method for Measuring Clock Skew on a Network |
JP2011210106A (ja) * | 2010-03-30 | 2011-10-20 | Nippon Telegr & Teleph Corp <Ntt> | メッセージキュー管理システム及びロックサーバ及びメッセージキュー管理方法及びメッセージキュー管理プログラム |
Non-Patent Citations (1)
Title |
---|
マキュージック マーシャル カーク, 4.4BSDの設計と実装, vol. 第1版 第2刷, JPN6016026035, 19 December 2003 (2003-12-19), JP, pages 377 - 385, ISSN: 0003353776 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018534665A (ja) * | 2015-09-30 | 2018-11-22 | ベリタス テクノロジーズ エルエルシー | 入力/出力フェンシングの最適化 |
Also Published As
Publication number | Publication date |
---|---|
US20130111261A1 (en) | 2013-05-02 |
CA2853465A1 (en) | 2013-05-02 |
EP2771789A4 (en) | 2015-09-16 |
JP6084624B2 (ja) | 2017-02-22 |
US8595546B2 (en) | 2013-11-26 |
KR20140088176A (ko) | 2014-07-09 |
CA2853465C (en) | 2016-06-14 |
US9460183B2 (en) | 2016-10-04 |
KR101992508B1 (ko) | 2019-09-30 |
WO2013063152A1 (en) | 2013-05-02 |
US20140188794A1 (en) | 2014-07-03 |
EP2771789A1 (en) | 2014-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6084624B2 (ja) | 高可用性クラスタにおけるスプリット・ブレイン耐性フェイルオーバ | |
US9984140B1 (en) | Lease based leader election system | |
TWI625621B (zh) | 用於資料庫中進行回復的方法、電腦可用程式產品、與資料處理系統 | |
JP4896438B2 (ja) | 分散障害許容型コンピューティングシステムにおける効率のよいレプリカセットの変更 | |
US20180260125A1 (en) | Synchronously replicating datasets and other managed objects to cloud-based storage systems | |
US8301600B1 (en) | Failover recovery in a distributed data store | |
US20130151653A1 (en) | Data management systems and methods | |
WO2016070375A1 (zh) | 一种分布式存储复制系统和方法 | |
US11709743B2 (en) | Methods and systems for a non-disruptive automatic unplanned failover from a primary copy of data at a primary storage system to a mirror copy of the data at a cross-site secondary storage system | |
GB2484086A (en) | Reliability and performance modes in a distributed storage system | |
US11550820B2 (en) | System and method for partition-scoped snapshot creation in a distributed data computing environment | |
JP2008059583A (ja) | クラスタ・システムならびにクラスタ・システム内でレプリカをバックアップする方法およびプログラム製品 | |
WO2018068661A1 (zh) | 一种基于Paxos协议的分布式一致性系统的在线扩容、在线缩容的方法和装置 | |
JP5292351B2 (ja) | メッセージキュー管理システム及びロックサーバ及びメッセージキュー管理方法及びメッセージキュー管理プログラム | |
CN105493474A (zh) | 用于支持用于同步分布式数据网格中的数据的分区级别日志的系统及方法 | |
CN110402429B (zh) | 复制用于管理基于云的资源的存储表以抵挡存储账户中断 | |
US11003550B2 (en) | Methods and systems of operating a database management system DBMS in a strong consistency mode | |
US10970177B2 (en) | Methods and systems of managing consistency and availability tradeoffs in a real-time operational DBMS | |
WO2015196692A1 (zh) | 一种云计算系统以及云计算系统的处理方法和装置 | |
Kazhamiaka et al. | Sift: resource-efficient consensus with RDMA | |
US12019873B2 (en) | Methods and systems to improve resumption time of input/output (I/O) operations based on prefetching of configuration data and early abort of conflicting workflows during a non-disruptive automatic unplanned failover from a primary copy of data at a primary storage system to a mirror copy of the data at a cross-site secondary storage system | |
US20240036997A1 (en) | Methods and systems to improve input/output (i/o) resumption time during a non-disruptive automatic unplanned failover from a primary copy of data at a primary storage system to a mirror copy of the data at a cross-site secondary storage system | |
US20240028611A1 (en) | Granular Replica Healing for Distributed Databases | |
US11288004B1 (en) | Consensus-based authority selection in replicated network-accessible block storage devices | |
Chaurasiya et al. | Linux highly available (HA) fault-tolerant servers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150819 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150819 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6084624 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |