JP6362120B2 - クラスタ・ブレイン分割後の調停処理方法、クォーラム記憶装置、およびシステム - Google Patents
クラスタ・ブレイン分割後の調停処理方法、クォーラム記憶装置、およびシステム Download PDFInfo
- Publication number
- JP6362120B2 JP6362120B2 JP2016570024A JP2016570024A JP6362120B2 JP 6362120 B2 JP6362120 B2 JP 6362120B2 JP 2016570024 A JP2016570024 A JP 2016570024A JP 2016570024 A JP2016570024 A JP 2016570024A JP 6362120 B2 JP6362120 B2 JP 6362120B2
- Authority
- JP
- Japan
- Prior art keywords
- quorum
- node
- quorum node
- master
- storage device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims description 370
- 210000004556 brain Anatomy 0.000 title claims description 98
- 238000003672 processing method Methods 0.000 title claims description 12
- 238000001514 detection method Methods 0.000 claims description 191
- 238000000034 method Methods 0.000 claims description 105
- 230000004044 response Effects 0.000 claims description 63
- 230000008859 change Effects 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 28
- 238000004891 communication Methods 0.000 claims description 17
- 230000005540 biological transmission Effects 0.000 description 31
- 230000008569 process Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 13
- 238000000638 solvent extraction Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 208000033748 Device issues Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/04—Network management architectures or arrangements
- H04L41/044—Network management architectures or arrangements comprising hierarchical management structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/0757—Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/142—Reconfiguring to eliminate the error
- G06F11/1425—Reconfiguring to eliminate the error by reconfiguration of node membership
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2046—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
- H04L41/0661—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/28—Timers or timing mechanisms used in protocols
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/40—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/18—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
- G06F11/187—Voting techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/505—Clust
Description
本発明の諸実施形態を説明する前に、図1に示すように、クラスタ・ノードと記憶装置により形成されるクラスタ・システムのアーキテクチャの略図を先ず説明する。当該システムは、N個のノード(N≧1およびNは整数である)により形成されるクラスタ100であって、各ノードを物理ノード(例えば、サーバ)に展開してもよく、または、仮想ノード(例えば、仮想マシン)に展開してもよく、アプリケーションまたはクライアントにより送信されたデータ・アクセス要求を受信し、当該データ・アクセス要求を当該記憶装置に対するIOアクセス要求に変換する責任を負う、クラスタ100と、M個の記憶装置(M≧1およびMは整数である)により形成された記憶装置リソース・プール200とを備える。各記憶装置を、記憶管理ソフトウェアと記憶媒体を含む記憶装置として理解してもよい。記憶装置リソース・プール200内の当該M個の記憶装置は様々な方式で接続される。図1に示すM個の記憶装置はリング構造接続方式である(これは例示的な説明にすぎない)。実際の適用では、星型構造、バス構造、分散構造、ツリー構造、メッシュ構造、セルラ構造等があってもよく、詳細は本発明の当該実施形態では説明しない。当該記憶装置リソース・プール200において、少なくとも1つの記憶装置をクォーラム記憶装置として使用してもよい。クォーラム記憶装置はクラスタ内のマスタ・クォーラム・ノードの識別子を格納するために使用され、当該識別子がクラスタ内のクォーラム・ノードのIPアドレス、数等であってもよい。
図2A乃至図2Cは、クラスタ内でブレイン分割が行われた後にクォーラム記憶装置がブレイン分割調停を実装する第1の方法の実施形態を示す。当該方法の実施形態は、クラスタとクォーラム記憶装置により形成される、図1に示すシステムに適用される。図2Aを参照すると、当該方法は以下を含む。
当該方法では、システムにおいて、ノードが、トポロジ構造に従うハート・ビート・リングを形成してもよく、当該ハート・ビート・リングにより、ハート・ビート情報を当該ノードの間で送信してもよい(ハート・ビート情報を送信する期間は一般にリース期間より短い)。当該ノードのハート・ビート情報が集約されると、当該ハート・ビート情報をクラスタ内のクォーラム・ノードで集約してもよく、ノードのハート・ビート情報が失われたかどうかが識別される。誤判定を避けるため、検出を複数回繰り返して実施してもよい。ノードのハート・ビート情報が複数回受信されない場合、当該ノードが故障しているかもしれないと判定され(この場合、アクティブな検出を実施して、当該ノードが故障しているかどうかを判定してもよい)、当該ノードが故障していることを示す通知がクラスタ内の別のノードに送信される。ノード・グループ内の全てのノードが故障していることを示す通知を当該クォーラム・ノードが受信した場合、当該クォーラム・ノードが、ブレイン分割がクラスタ内で行われたと決定してもよい。
図4を参照すると、本発明はさらに、クラスタとクォーラム記憶装置400により形成されたシステムに適用される、クラスタ内の調停処理に使用されるクォーラム記憶装置400を提供する。当該クラスタは、少なくとも2つのクォーラム・ノードを含み、クォーラム記憶装置400は、クラスタ内のマスタ・クォーラム・ノードの識別子を事前に記録し、マスタ・クォーラム・ノードは当該少なくとも2つのクォーラム・ノードの1つである。クォーラム記憶装置400は、検出期間内に、クラスタ内のクォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を受信するように構成された受信ユニット401であって、各マスタ・クォーラム・ノード・プリエンプション要求はクォーラム・ノードの識別子を含む、受信ユニット401と、当該マスタ・クォーラム・ノードの識別子に従って、受信ユニット401により受信されたマスタ・クォーラム・ノード・プリエンプション要求が当該マスタ・クォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を含むかどうかを判定するように構成される判定ユニット402と、当該受信されたマスタ・クォーラム・ノード・プリエンプション要求が当該マスタ・クォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を含むとき、当該ノードの記録された識別子を維持するか、または、当該受信されたマスタ・クォーラム・ノード・プリエンプション要求が当該マスタ・クォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を含まないとき、第1のリフレッシュ・パケット検出期間の後、当該記録された識別子を、クォーラム記憶装置に最初に到着したマスタ・クォーラム・ノード・プリエンプション要求に対応するクォーラム・ノードの識別子に変更するように構成された実行ユニット403と、マスタ・クォーラム・ノード・プリエンプション成功応答メッセージを当該記録された識別子に対応するクォーラム・ノードに送信するように構成された送信ユニット404であって、当該応答メッセージは、マスタ・クォーラム・ノードのプリエンプションに成功したことを、当該記録された識別子に対応するクォーラム・ノードに通知するために使用される、送信ユニット404とを備える。
図9A乃至図9Cは、クラスタ内でブレイン分割が行われた後にクォーラム記憶装置がブレイン分割調停を実装する第3の方法の実施形態を示す。当該方法の実施形態は、クラスタおよびクォーラム記憶装置により形成された図1に示すシステムに適用される。クラスタは少なくとも2つのクォーラム・ノードを含む。図9Aを参照すると、当該方法は以下を含む。
図10を参照すると、本発明はさらに、クラスタおよびクォーラム記憶装置1000により形成されたシステムに提供される、当該クラスタ内の調停処理に使用されるクォーラム記憶装置1000を提供する。当該クラスタは少なくとも2つのクォーラム・ノードを含み、クォーラム記憶装置1000は、当該クラスタ内の少なくとも2つのクォーラム・ノードの1つを初期マスタ・クォーラム・ノードに予め構成する。クォーラム記憶装置1000は、リフレッシュ・パケット検出期間を開始するように構成された開始ユニット1005であって、当該リフレッシュ・パケット検出期間は反復実行される期間であり、当該開始ユニットをタイマを設定することにより実装してもよい、開始ユニット1005と、第1のリフレッシュ・パケット検出期間内に、ブレイン分割がクラスタ内で行われた後、クラスタ内の少なくとも2つのクォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を受信するように構成された受信ユニット1001であって、第1のリフレッシュ・パケット検出期間はブレイン分割がクラスタ内で行われた時点に対応するリフレッシュ・パケット検出期間であり、当該受信ユニットの受信方式を有線または無線の方式で実装してもよく、無線方式を実装に使用するとき、当該受信ユニットを無線周波数モジュールを用いて実装してもよく、有線方式を実装に使用するとき、当該受信ユニットを有線インタフェースを用いて実装してもよい、受信ユニット1001と、初期マスタ・クォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求が第1のリフレッシュ・パケット検出期間内に受信されたかどうかを判定するように構成された判定ユニット1002であって、当該判定ユニットを判定ロジックにより実装してもよい、判定ユニット1002と、初期マスタ・クォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求が第1のリフレッシュ・パケット検出期間内に受信されたと判定されたとき、初期マスタ・クォーラム・ノードはマスタ・クォーラム・ノードのプリエンプションに成功したクォーラム・ノードであると判定するように構成された実行ユニット1003であって、当該実行ユニットをプロセッサ(Processor)を用いて実装してもよい、実行ユニット1003と、マスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功したクォーラム・ノードに送信するように構成された送信ユニット1004であって、当該送信ユニットは当該受信ユニットと同様であり、有線方式または無線方式で実装してもよく、無線方式(例えば、無線周波数)が実装に使用されるとき、当該送信ユニットを無線周波数モジュールを用いて実装してもよく、有線方式(例えば、Ethernet)が実装に使用されるとき、当該送信ユニットを有線インタフェースを用いて実装してもよい、送信ユニット1004とを備える。
402 判定ユニット
403 実行ユニット
404 送信ユニット
501 プロセッサ
502 メモリ
503 通信インタフェース
601 受信ユニット
602 判定ユニット
603 送信ユニット
701 プロセッサ
702 メモリ
703 通信インタフェース
811 クォーラム・ノード
8111 クォーラム・ノード・
820 クォーラム記憶装置
1001 受信ユニット
1002 判定ユニット
1003 実行ユニット
1004 送信ユニット
1005 開始ユニット
Claims (22)
- クラスタおよびクォーラム記憶装置により形成されたシステムに適用されるクラスタ・ブレイン分割後の調停処理方法であって、前記クラスタは少なくとも2つのクォーラム・ノードを含み、前記クラスタ内の前記少なくとも2つのクォーラム・ノードの1つは初期マスタ・クォーラム・ノードとして予め記録され、前記方法は、
前記クォーラム記憶装置により、リフレッシュ・パケット検出期間を開始するステップであって、前記リフレッシュ・パケット検出期間は反復実行される期間である、ステップと、
ブレイン分割が前記クラスタ内で行われた後、前記クォーラム記憶装置により、第1のリフレッシュ・パケット検出期間内に、前記クラスタ内の前記少なくとも2つのクォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を受信し、前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求が、前記初期マスタ・クォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を含むかどうかを判定するステップであって、前記第1のリフレッシュ・パケット検出期間は前記ブレイン分割が前記クラスタ内で発生した時点に対応するリフレッシュ・パケット検出期間である、ステップと、
前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求が、前記初期マスタ・クォーラム・ノードにより送信された前記マスタ・クォーラム・ノード・プリエンプション要求を含むと判定したとき、前記クォーラム記憶装置により、前記初期マスタ・クォーラム・ノードがマスタ・クォーラム・ノードのプリエンプションに成功したクォーラム・ノードであると判定するステップと、
前記クォーラム記憶装置により、マスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信するステップと、
前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求が、前記初期マスタ・クォーラム・ノードにより送信された前記マスタ・クォーラム・ノード・プリエンプション要求を含まないと判定したとき、クォーラム記憶装置により、第2のリフレッシュ・パケット検出期間内に受信された第1のマスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードをマスタ・クォーラム・ノードのプリエンプションに成功したクォーラム・ノードとして使用し、マスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信するステップであって、前記第2のリフレッシュ・パケット検出期間は前記第1のリフレッシュ・パケット検出期間に続くリフレッシュ・パケット検出期間である、ステップと、
を含む、方法。 - 前記クォーラム記憶装置により、ブレイン分割が前記クラスタ内で行われた後、前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求が、前記初期マスタ・クォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を含むかどうかを判定するステップは特に、
前記ブレイン分割が前記クラスタで行われた後、前記クォーラム記憶装置により、前記第1のリフレッシュ・パケット検出期間内に受信された全てのマスタ・クォーラム・ノード・プリエンプション要求をキャッシュし、前記クォーラム記憶装置により、全ての前記キャッシュされたマスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードが前記初期マスタ・クォーラム・ノードを含むかどうかを判定するステップ、
または
前記ブレイン分割が前記クラスタで行われた後、前記クォーラム記憶装置により、前記第1のリフレッシュ・パケット検出期間内に受信された各マスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードが前記初期マスタ・クォーラム・ノードであるかどうかを逐次的に判定するステップ
を含む、請求項1に記載の方法。 - 前記クォーラム記憶装置が、前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求が、前記初期マスタ・クォーラム・ノードにより送信された前記マスタ・クォーラム・ノード・プリエンプション要求を含まないと判定した後、前記方法はさらに、
前記クォーラム記憶装置により、マスタ・クォーラム・ノードのプリエンプション失敗応答メッセージを前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードの各々に送信し、その結果、前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードは新たなマスタ・クォーラム・ノード・プリエンプション要求を前記クォーラム記憶装置に再度送信する、ステップ
を含む、請求項1に記載の方法。 - 前記クォーラム記憶装置により、マスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信した後、前記方法はさらに、
前記クォーラム記憶装置により、マスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードにより送信された第1のパーミッション制御メッセージを受信するステップであって、前記第1のパーミッション制御メッセージはマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに接続しない第1のカテゴリのクォーラム・ノードの識別子を含む、ステップと、
前記クォーラム記憶装置により、アクセス拒否通知メッセージを前記第1のカテゴリのクォーラム・ノードに送信して、ノード再開動作を実施するように前記第1のカテゴリのクォーラム・ノードに指示するステップと、
を含む、請求項1乃至3の何れか1項に記載の方法。 - 前記クォーラム記憶装置により、マスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信した後、前記方法はさらに、
前記クォーラム記憶装置により、マスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードにより送信された第2のパーミッション制御メッセージを受信するステップであって、前記第2のパーミッション制御メッセージは、マスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに接続する第2のカテゴリのクォーラム・ノードの識別子を含む、ステップと、
前記クォーラム記憶装置により、マスタ・クォーラム・ノード・プリエンプション失敗通知メッセージを前記第2のカテゴリのクォーラム・ノードに送信して、マスタ・クォーラム・ノード・プリエンプション要求を前記クォーラム記憶装置に送信するのを停止するように前記第2のカテゴリのクォーラム・ノードに指示するステップと、
を含む、請求項1乃至4の何れか1項に記載の方法。 - 前記クォーラム記憶装置により、マスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信した後、前記方法はさらに、
前記クォーラム記憶装置により、マスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードにより送信されたパーミッション制御メッセージを受信するステップであって、前記パーミッション制御メッセージは、前記クォーラム記憶装置に対する、前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードを除く別のクォーラム・ノードの識別子と、前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードを除く前記別のクォーラム・ノードのアクセス・パーミッションとを含み、前記アクセス・パーミッションは許可または拒否を含む、ステップと、
前記パーミッション制御メッセージに従って、前記クォーラム記憶装置により、通知メッセージを前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードを除く前記別のクォーラム・ノードに送信するステップと、
を含む、請求項1乃至3の何れか1項に記載の方法。 - アクセス・パーミッションが拒否である第1のカテゴリのクォーラム・ノードに対して、前記パーミッション制御メッセージに従って、前記クォーラム記憶装置により、通知メッセージを前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードを除く前記別のクォーラム・ノードに送信するステップは特に、
前記クォーラム記憶装置により、アクセス拒否通知メッセージを前記第1のカテゴリのクォーラム・ノードに送信して、ノード再開動作を実施するように前記第1のカテゴリのクォーラム・ノードに指示するステップ
を含む、請求項6に記載の方法。 - アクセス・パーミッションが許可である第2のカテゴリのクォーラム・ノードに対して、前記パーミッション制御メッセージに従って、前記クォーラム記憶装置により、通知メッセージを前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードを除く前記別のクォーラム・ノードに送信するステップは特に、
前記クォーラム記憶装置により、マスタ・クォーラム・ノード・プリエンプション失敗通知メッセージを前記第2のカテゴリのクォーラム・ノードに送信して、マスタ・クォーラム・ノード・プリエンプション要求を前記クォーラム記憶装置に送信するのを停止するように前記第2のカテゴリのクォーラム・ノードに指示するステップ
を含む、請求項6または7に記載の方法。 - 前記クォーラム記憶装置により、アクセス拒否通知メッセージを前記第1のカテゴリのクォーラム・ノードに送信した後、前記方法はさらに、
前記クォーラム記憶装置により、ファイアウォール・ポリシを拒否に変更するために使用される通知メッセージを前記第1のカテゴリのクォーラム・ノードに送信するステップであって、ファイアウォール・ポリシを拒否に変更するために使用される前記通知メッセージは、前記第1のカテゴリのクォーラム・ノードのファイアウォール内のファイアウォール・ポリシを拒否に変更して、前記第1のカテゴリのクォーラム・ノードにより前記クォーラム記憶装置に送信されたマスタ・クォーラム・ノード・プリエンプション要求をブロックするように前記第1のカテゴリのクォーラム・ノードに指示するために使用される、ステップ
を含む、請求項4または7に記載の方法。 - 前記第1のカテゴリのクォーラム・ノードが前記再開動作を実施し、前記クラスタに再度参加した後、前記方法はさらに、
前記クォーラム記憶装置により、ファイアウォール・ポリシを許可に変更するために使用される通知メッセージを前記第1のカテゴリのクォーラム・ノードに送信して、前記第1のカテゴリのクォーラム・ノードの前記ファイアウォール内の前記ファイアウォール・ポリシを許可に変更して、前記第1のカテゴリのクォーラム・ノードがマスタ・クォーラム・ノード・プリエンプション要求を前記クォーラム記憶装置に送信できるようにするように前記第1のカテゴリのクォーラム・ノードに指示するステップ
を含む、請求項9に記載の方法。 - クラスタおよびクォーラム記憶装置により形成されたシステムに適用されるクラスタ内の調停処理のためのクォーラム記憶装置であって、前記クラスタは少なくとも2つのクォーラム・ノードを含み、前記クラスタ内の前記少なくとも2つのクォーラム・ノードの1つは初期マスタ・クォーラム・ノードとして予め記録され、前記クォーラム記憶装置は、
リフレッシュ・パケット検出期間を開始するように構成された開始ユニットであって、前記リフレッシュ・パケット検出期間は反復実行される期間である、開始ユニットと、
第1のリフレッシュ・パケット検出期間内に、ブレイン分割が前記クラスタ内で行われた後、前記クラスタ内の前記少なくとも2つのクォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を受信するように構成された受信ユニットであって、前記第1のリフレッシュ・パケット検出期間は前記ブレイン分割が前記クラスタ内で発生した時点に対応するリフレッシュ・パケット検出期間である、受信ユニットと、
前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求が、前記初期マスタ・クォーラム・ノードにより送信されたマスタ・クォーラム・ノード・プリエンプション要求を含むかどうかを判定するように構成された判定ユニットと、
前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求が、前記初期マスタ・クォーラム・ノードにより送信された前記マスタ・クォーラム・ノード・プリエンプション要求を含むと判定されたとき、前記初期マスタ・クォーラム・ノードはマスタ・クォーラム・ノードのプリエンプションに成功したクォーラム・ノードであると判定するように構成された実行ユニットと、
マスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信するように構成された送信ユニットと、
を備え、
前記実行ユニットはさらに、前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求が、前記初期マスタ・クォーラム・ノードにより送信された前記マスタ・クォーラム・ノード・プリエンプション要求を含まないと判定されたとき、第2のリフレッシュ・パケット検出期間内に受信された第1のマスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードをマスタ・クォーラム・ノードのプリエンプションに成功したクォーラム・ノードとして使用するように構成され、前記第2のリフレッシュ・パケット検出期間は前記第1のリフレッシュ・パケット検出期間に続くリフレッシュ・パケット検出期間であり、
前記送信ユニットはさらに、マスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信するように構成される、
クォーラム記憶装置。 - 前記判定ユニットは特に、前記ブレイン分割が前記クラスタで行われた後、前記第1のリフレッシュ・パケット検出期間内に受信された全てのマスタ・クォーラム・ノード・プリエンプション要求をキャッシュし、全ての前記キャッシュされたマスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードが前記初期マスタ・クォーラム・ノードを含むかどうかを判定するか、または、前記ブレイン分割が前記クラスタで行われた後、前記第1のリフレッシュ・パケット検出期間内に受信された各マスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードが前記初期マスタ・クォーラム・ノードであるかどうかを逐次的に判定するように構成される、
請求項11に記載のクォーラム記憶装置。 - 前記実行ユニットはさらに、前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードが前記初期マスタ・クォーラム・ノードを含まないと判定されたとき、マスタ・クォーラム・ノードのプリエンプション失敗応答メッセージを生成するように構成され、
前記送信ユニットはさらに、前記マスタ・クォーラム・ノードのプリエンプション失敗応答メッセージを前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードの各々に送信するように構成され、その結果、前記第1のリフレッシュ・パケット検出期間内に受信された前記マスタ・クォーラム・ノード・プリエンプション要求を送信したクォーラム・ノードは新たなマスタ・クォーラム・ノード・プリエンプション要求を前記クォーラム記憶装置に再度送信する、
請求項11に記載のクォーラム記憶装置。 - 前記受信ユニットはさらに、前記送信ユニットがマスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信した後、マスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードにより送信された第1のパーミッション制御メッセージを受信するように構成され、前記第1のパーミッション制御メッセージは、前記クラスタ内の前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに接続しない第1のカテゴリのクォーラム・ノードの識別子を含み、
前記実行ユニットはさらに、マスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードにより送信された前記第1のパーミッション制御メッセージに従ってアクセス拒否通知メッセージを生成するように構成され、
前記送信ユニットはさらに、前記アクセス拒否通知メッセージを前記第1のカテゴリのクォーラム・ノードに送信して、ノード再開動作を実施するように前記第1のカテゴリのクォーラム・ノードに指示するように構成される、
請求項11乃至13の何れか1項に記載のクォーラム記憶装置。 - 前記受信ユニットはさらに、前記送信ユニットがマスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信した後、マスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードにより送信された第2のパーミッション制御メッセージを受信するように構成され、前記第2のパーミッション制御メッセージは、前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに接続する第2のカテゴリのクォーラム・ノードの識別子を含み、
前記実行ユニットはさらに、マスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードにより送信された前記第2のパーミッション制御メッセージに従ってマスタ・クォーラム・ノード・プリエンプション失敗通知メッセージを生成するように構成され、
前記送信ユニットはさらに、前記マスタ・クォーラム・ノード・プリエンプション失敗通知メッセージを前記第2のカテゴリのクォーラム・ノードに送信して、マスタ・クォーラム・ノード・プリエンプション要求を前記クォーラム記憶装置に送信するのを停止するように前記第2のカテゴリのクォーラム・ノードに指示するように構成される、
請求項11乃至14の何れか1項に記載のクォーラム記憶装置。 - 前記受信ユニットはさらに、前記送信ユニットがマスタ・クォーラム・ノード・プリエンプション成功応答メッセージをマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードに送信した後、マスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードにより送信されたパーミッション制御メッセージを受信するように構成され、前記パーミッション制御メッセージは、前記クォーラム記憶装置に対する、前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードを除く別のクォーラム・ノードの識別子と、前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードを除く前記別のクォーラム・ノードのアクセス・パーミッションとを含み、前記アクセス・パーミッションは許可または拒否を含み、
前記実行ユニットはさらに、前記パーミッション制御メッセージに従って通知メッセージを生成するように構成され、
前記送信ユニットはさらに、前記通知メッセージを前記少なくとも2つのクォーラム・ノード内のマスタ・クォーラム・ノードのプリエンプションに成功した前記クォーラム・ノードを除く前記別のクォーラム・ノードに送信するように構成され、
請求項11乃至13の何れか1項に記載のクォーラム記憶装置。 - 前記実行ユニットは特に、アクセス・パーミッションが拒否である第1のカテゴリのクォーラム・ノードに対するアクセス拒否通知メッセージを生成するように構成され、
前記送信ユニットは特に、前記アクセス拒否通知メッセージをアクセス・パーミッションが拒否である前記第1のカテゴリのクォーラム・ノードに送信して、ノード再開動作を実施するように前記第1のカテゴリのクォーラム・ノードに指示するように構成される、
請求項16に記載のクォーラム記憶装置。 - 前記実行ユニットは特に、アクセス・パーミッションが許可である第2のカテゴリのクォーラム・ノードに対してマスタ・クォーラム・ノード・プリエンプション失敗通知メッセージを生成し、マスタ・クォーラム・ノード・プリエンプション要求を前記クォーラム記憶装置に送信するのを停止するように前記第2のカテゴリのクォーラム・ノードに指示するように構成され、
前記送信ユニットは特に、前記マスタ・クォーラム・ノード・プリエンプション失敗通知メッセージをアクセス・パーミッションが許可である前記第2のカテゴリのクォーラム・ノードに送信するように構成される、
請求項16または17に記載のクォーラム記憶装置。 - 前記実行ユニットはさらに、前記送信ユニットが前記アクセス拒否通知メッセージを前記第1のカテゴリのクォーラム・ノードに送信した後、前記第1のカテゴリのクォーラム・ノードに対して、ファイアウォール・ポリシを拒否に変更するために使用される通知メッセージを生成するように構成され、ファイアウォール・ポリシを拒否に変更するために使用される前記通知メッセージは、前記第1のカテゴリのクォーラム・ノードのファイアウォール内のファイアウォール・ポリシを拒否に変更して、前記第1のカテゴリのクォーラム・ノードにより前記クォーラム記憶装置に送信されたマスタ・クォーラム・ノード・プリエンプション要求をブロックするように前記第1のカテゴリのクォーラム・ノードに指示するために使用され、
前記送信ユニットはさらに、ファイアウォール・ポリシを拒否に変更するために使用される前記通知メッセージを前記第1のカテゴリのクォーラム・ノードに送信するように構成される、
請求項14または17に記載のクォーラム記憶装置。 - 前記実行ユニットはさらに、前記第1のカテゴリのクォーラム・ノードが前記再開動作を実施し、前記クラスタに再度参加した後、前記第1のカテゴリのクォーラム・ノードに対して、ファイアウォール・ポリシを許可に変更するために使用される通知メッセージを生成するように構成され、ファイアウォール・ポリシを許可に変更するために使用される前記通知メッセージは、前記第1のカテゴリのクォーラム・ノードの前記ファイアウォール内の前記ファイアウォール・ポリシを許可に変更して、前記第1のカテゴリのクォーラム・ノードがマスタ・クォーラム・ノード・プリエンプション要求を前記クォーラム記憶装置に送信できるようにするように前記第1のカテゴリのクォーラム・ノードに指示するために使用され、
前記送信ユニットはさらに、ファイアウォール・ポリシを許可に変更するために使用される前記通知メッセージを前記第1のカテゴリのクォーラム・ノードに送信するように構成される、
請求項19に記載のクォーラム記憶装置。 - クォーラム記憶装置であって、前記クォーラム記憶装置は、プロセッサ、メモリ、通信インタフェース、およびバスを備え、前記プロセッサ、前記メモリ、および前記通信インタフェースは前記バスを用いて互いと通信し、
前記通信インタフェースはクラスタ内の少なくとも2つのクォーラム・ノードと通信するように構成され、
前記メモリはプログラムを格納するように構成され、
前記記憶装置が実行したとき、前記プロセッサは、前記メモリに格納された前記プログラムを実行して請求項1乃至10の何れか1項に記載の方法を実行するように構成される、
クォーラム記憶装置。 - クラスタ・ブレイン分割後の調停処理システムであって、前記システムは、クラスタおよび請求項11乃至20の何れか1項に記載のクォーラム記憶装置を備え、前記クラスタは少なくとも2つのクォーラム・ノードを含み、前記クォーラム記憶装置は、前記クラスタ内の前記少なくとも2つのクォーラム・ノードの1つを初期マスタ・クォーラム・ノードに予め構成する、調停処理システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNPCT/CN2014/095892 | 2014-12-31 | ||
PCT/CN2014/095892 WO2016106682A1 (zh) | 2014-12-31 | 2014-12-31 | 一种集群脑裂后仲裁处理方法、仲裁存储装置以及系统 |
PCT/CN2015/086146 WO2016107172A1 (zh) | 2014-12-31 | 2015-08-05 | 一种集群脑裂后仲裁处理方法、仲裁存储装置以及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017517817A JP2017517817A (ja) | 2017-06-29 |
JP6362120B2 true JP6362120B2 (ja) | 2018-07-25 |
Family
ID=56283956
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016570024A Active JP6362120B2 (ja) | 2014-12-31 | 2015-08-05 | クラスタ・ブレイン分割後の調停処理方法、クォーラム記憶装置、およびシステム |
JP2016569878A Active JP6362119B2 (ja) | 2014-12-31 | 2015-08-05 | クラスタ・ブレイン分割後の調停処理方法、クォーラム記憶装置、およびシステム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016569878A Active JP6362119B2 (ja) | 2014-12-31 | 2015-08-05 | クラスタ・ブレイン分割後の調停処理方法、クォーラム記憶装置、およびシステム |
Country Status (5)
Country | Link |
---|---|
US (2) | US10298436B2 (ja) |
EP (2) | EP3128719B1 (ja) |
JP (2) | JP6362120B2 (ja) |
CN (2) | CN105934929B (ja) |
WO (3) | WO2016106682A1 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10341252B2 (en) * | 2015-09-30 | 2019-07-02 | Veritas Technologies Llc | Partition arbitration optimization |
US11075806B1 (en) | 2016-06-30 | 2021-07-27 | Juniper Networks, Inc. | Hierarchical naming scheme for state propagation within network devices |
CN106301900B (zh) * | 2016-08-08 | 2019-08-23 | 华为技术有限公司 | 设备仲裁的方法和设备 |
CN106789193A (zh) * | 2016-12-06 | 2017-05-31 | 郑州云海信息技术有限公司 | 一种集群投票仲裁方法及系统 |
US11316744B2 (en) * | 2016-12-21 | 2022-04-26 | Juniper Networks, Inc. | Organizing execution of distributed operating systems for network devices |
US10887173B2 (en) | 2016-12-21 | 2021-01-05 | Juniper Networks, Inc. | Communicating state information in distributed operating systems |
US11316775B2 (en) | 2016-12-21 | 2022-04-26 | Juniper Networks, Inc. | Maintaining coherency in distributed operating systems for network devices |
WO2018151290A1 (ja) * | 2017-02-20 | 2018-08-23 | 日本電気株式会社 | 情報処理装置、情報処理方法および記憶媒体 |
US10534767B2 (en) | 2017-03-14 | 2020-01-14 | International Business Machines Corporation | Disaster recovery for split storage cluster |
CN109428740B (zh) * | 2017-08-21 | 2020-09-08 | 华为技术有限公司 | 设备故障恢复的方法和装置 |
CN107579860A (zh) * | 2017-09-29 | 2018-01-12 | 新华三技术有限公司 | 节点选举方法及装置 |
CN108449200A (zh) * | 2018-02-02 | 2018-08-24 | 云宏信息科技股份有限公司 | 一种基于控制节点的屏蔽信息写入方法及装置 |
US10592342B1 (en) * | 2018-02-02 | 2020-03-17 | EMC IP Holding Company LLC | Environmental aware witness for active-active storage cluster nodes |
CN109445942B (zh) * | 2018-10-22 | 2021-09-17 | 郑州云海信息技术有限公司 | 一种心跳消息的处理方法及装置 |
US11516084B2 (en) * | 2019-01-31 | 2022-11-29 | EMC IP Holding Company LLC | Device compatibility in a communication architecture |
US11095742B2 (en) | 2019-03-27 | 2021-08-17 | Juniper Networks, Inc. | Query proxy for delivery of dynamic system state |
CN111835534B (zh) * | 2019-04-15 | 2022-05-06 | 华为技术有限公司 | 一种用于集群控制的方法,网络设备,主控节点装置及计算机可读存储介质 |
CN111651291B (zh) * | 2020-04-23 | 2023-02-03 | 国网河南省电力公司电力科学研究院 | 一种共享存储集群防脑裂的方法、系统、计算机存储介质 |
CN111651294B (zh) * | 2020-05-13 | 2023-07-25 | 浙江华创视讯科技有限公司 | 一种节点异常检测方法及装置 |
CN112181305A (zh) * | 2020-09-30 | 2021-01-05 | 北京人大金仓信息技术股份有限公司 | 数据库集群网络分区选择方法和装置 |
CN112468596B (zh) * | 2020-12-02 | 2022-07-05 | 苏州浪潮智能科技有限公司 | 一种集群仲裁方法、装置、电子设备及可读存储介质 |
CN112822238B (zh) * | 2020-12-29 | 2023-05-26 | 深圳市金证科技股份有限公司 | 一种主节点的切换方法以及计算机可读存储介质 |
CN113625946A (zh) * | 2021-06-28 | 2021-11-09 | 苏州浪潮智能科技有限公司 | 一种实现存储集群仲裁的方法、系统及计算机设备 |
CN113377702B (zh) * | 2021-07-06 | 2024-03-22 | 安超云软件有限公司 | 两节点集群启动的方法及装置、电子设备和存储介质 |
CN114461141B (zh) * | 2021-12-30 | 2023-08-18 | 苏州浪潮智能科技有限公司 | 一种etcd系统、节点仲裁方法及系统 |
CN114500327B (zh) * | 2022-04-13 | 2022-08-12 | 统信软件技术有限公司 | 一种服务器集群的检测方法、检测装置及计算设备 |
CN116737634A (zh) * | 2023-07-12 | 2023-09-12 | 北京鲸鲨软件科技有限公司 | 一种drbd双主模式下基于仲裁的脑裂快速处理方法和装置 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5999712A (en) * | 1997-10-21 | 1999-12-07 | Sun Microsystems, Inc. | Determining cluster membership in a distributed computer system |
US6487622B1 (en) * | 1999-10-28 | 2002-11-26 | Ncr Corporation | Quorum arbitrator for a high availability system |
US6615256B1 (en) * | 1999-11-29 | 2003-09-02 | Microsoft Corporation | Quorum resource arbiter within a storage network |
US6965936B1 (en) * | 2000-12-06 | 2005-11-15 | Novell, Inc. | Method for detecting and resolving a partition condition in a cluster |
US7277952B2 (en) * | 2001-09-28 | 2007-10-02 | Microsoft Corporation | Distributed system resource protection via arbitration and ownership |
US20050132154A1 (en) | 2003-10-03 | 2005-06-16 | International Business Machines Corporation | Reliable leader election in storage area network |
US7320085B2 (en) | 2004-03-09 | 2008-01-15 | Scaleout Software, Inc | Scalable, software-based quorum architecture |
US7496782B1 (en) * | 2004-06-01 | 2009-02-24 | Network Appliance, Inc. | System and method for splitting a cluster for disaster recovery |
US7313636B2 (en) | 2004-06-15 | 2007-12-25 | Lsi Corporation | Methods and structure for supporting persistent reservations in a multiple-path storage environment |
JP4371942B2 (ja) * | 2004-08-06 | 2009-11-25 | 富士通株式会社 | クラスタシステムのノード制御プログラムおよびサーバ |
US7653682B2 (en) | 2005-07-22 | 2010-01-26 | Netapp, Inc. | Client failure fencing mechanism for fencing network file system data in a host-cluster environment |
US20070168507A1 (en) * | 2005-11-15 | 2007-07-19 | Microsoft Corporation | Resource arbitration via persistent reservation |
JP4505763B2 (ja) * | 2007-01-31 | 2010-07-21 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | ノードクラスタの管理 |
US20080225837A1 (en) | 2007-03-16 | 2008-09-18 | Novell, Inc. | System and Method for Multi-Layer Distributed Switching |
US7778157B1 (en) | 2007-03-30 | 2010-08-17 | Symantec Operating Corporation | Port identifier management for path failover in cluster environments |
US8024432B1 (en) * | 2008-06-27 | 2011-09-20 | Symantec Corporation | Method and apparatus for partitioning a computer cluster through coordination point devices |
KR101042908B1 (ko) * | 2009-02-12 | 2011-06-21 | 엔에이치엔(주) | 네트워크 분리 장애 상황에서 메이저 그룹을 결정하기 위한방법, 시스템, 및 컴퓨터 판독 가능한 기록 매체 |
US8145938B2 (en) | 2009-06-01 | 2012-03-27 | Novell, Inc. | Fencing management in clusters |
US8484510B2 (en) | 2009-12-15 | 2013-07-09 | Symantec Corporation | Enhanced cluster failover management |
US8443231B2 (en) * | 2010-04-12 | 2013-05-14 | Symantec Corporation | Updating a list of quorum disks |
US8108715B1 (en) * | 2010-07-02 | 2012-01-31 | Symantec Corporation | Systems and methods for resolving split-brain scenarios in computer clusters |
CN102402395B (zh) * | 2010-09-16 | 2014-07-16 | 中标软件有限公司 | 基于仲裁磁盘的高可用系统不间断运行方法 |
JP2012173996A (ja) * | 2011-02-22 | 2012-09-10 | Nec Corp | クラスタシステム、クラスタ管理方法、およびクラスタ管理プログラム |
WO2012083693A1 (zh) * | 2011-07-26 | 2012-06-28 | 华为技术有限公司 | 一种用于集群计算机系统的投票仲裁方法及装置 |
CN102420820B (zh) | 2011-11-28 | 2016-06-08 | 杭州华三通信技术有限公司 | 一种集群系统中的隔离方法和装置 |
CN102594596B (zh) * | 2012-02-15 | 2014-08-20 | 华为技术有限公司 | 识别集群网络中可用分区的方法、装置及集群网络系统 |
US8738701B2 (en) * | 2012-02-28 | 2014-05-27 | Microsoft Corporation | Arbitration of disk ownership in a storage pool |
CN102904946B (zh) * | 2012-09-29 | 2015-06-10 | 浪潮(北京)电子信息产业有限公司 | 集群内节点管理方法和装置 |
CN103532748B (zh) * | 2013-10-08 | 2017-01-25 | 北京华胜天成科技股份有限公司 | 一种drbd脑裂的处理方法及装置 |
CN103684941B (zh) * | 2013-11-23 | 2018-01-16 | 广东中兴新支点技术有限公司 | 基于仲裁服务器的集群裂脑预防方法和装置 |
CN103647820B (zh) * | 2013-12-09 | 2016-11-23 | 华为数字技术(苏州)有限公司 | 用于分布式集群系统的仲裁方法及仲裁装置 |
CN104158707B (zh) * | 2014-08-29 | 2017-10-17 | 新华三技术有限公司 | 一种检测并处理集群脑裂的方法和装置 |
-
2014
- 2014-12-31 WO PCT/CN2014/095892 patent/WO2016106682A1/zh active Application Filing
-
2015
- 2015-08-05 WO PCT/CN2015/086147 patent/WO2016107173A1/zh active Application Filing
- 2015-08-05 CN CN201580000286.6A patent/CN105934929B/zh active Active
- 2015-08-05 CN CN201580000284.7A patent/CN106170971B/zh active Active
- 2015-08-05 JP JP2016570024A patent/JP6362120B2/ja active Active
- 2015-08-05 WO PCT/CN2015/086146 patent/WO2016107172A1/zh active Application Filing
- 2015-08-05 JP JP2016569878A patent/JP6362119B2/ja active Active
- 2015-08-05 EP EP15874861.6A patent/EP3128719B1/en active Active
- 2015-08-05 EP EP15874862.4A patent/EP3128720B1/en active Active
-
2017
- 2017-06-23 US US15/631,485 patent/US10298436B2/en active Active
- 2017-06-28 US US15/636,340 patent/US10020980B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3128720B1 (en) | 2019-05-22 |
JP6362119B2 (ja) | 2018-07-25 |
JP2017517817A (ja) | 2017-06-29 |
EP3128720A1 (en) | 2017-02-08 |
EP3128720A4 (en) | 2017-06-21 |
US20170302502A1 (en) | 2017-10-19 |
CN106170971A (zh) | 2016-11-30 |
EP3128719B1 (en) | 2018-11-28 |
EP3128719A4 (en) | 2017-06-21 |
WO2016107173A1 (zh) | 2016-07-07 |
CN106170971B (zh) | 2019-06-11 |
WO2016106682A1 (zh) | 2016-07-07 |
CN105934929A (zh) | 2016-09-07 |
US10020980B2 (en) | 2018-07-10 |
US10298436B2 (en) | 2019-05-21 |
WO2016107172A1 (zh) | 2016-07-07 |
JP2017525008A (ja) | 2017-08-31 |
US20170293613A1 (en) | 2017-10-12 |
EP3128719A1 (en) | 2017-02-08 |
CN105934929B (zh) | 2017-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6362120B2 (ja) | クラスタ・ブレイン分割後の調停処理方法、クォーラム記憶装置、およびシステム | |
US10979286B2 (en) | Method, device and computer program product for managing distributed system | |
JP3932994B2 (ja) | サーバ引継システムおよびその方法 | |
JP6466003B2 (ja) | Vnfフェイルオーバの方法及び装置 | |
CN106911728A (zh) | 分布式系统中主节点的选取方法和装置 | |
US20170270015A1 (en) | Cluster Arbitration Method and Multi-Cluster Cooperation System | |
US9992058B2 (en) | Redundant storage solution | |
CN106911648B (zh) | 一种环境隔离方法及设备 | |
WO2017210209A1 (en) | Keepalive scheduler in a network device | |
US8842524B2 (en) | Redundant ring automatic recovery | |
US9342291B1 (en) | Distributed update service | |
US10680930B2 (en) | Method and apparatus for communication in virtual network | |
US20220286350A1 (en) | Systems and methods for seamless failover in branch deployments by superimposing clustering solution on vrrp | |
WO2016106661A1 (zh) | 一种存储装置的访问控制方法、存储装置以及控制系统 | |
US20170141950A1 (en) | Rescheduling a service on a node | |
CN116095145B (zh) | 一种vpc集群的数据控制方法和系统 | |
US20180124220A1 (en) | DEPLOYING AN INTERNET STORAGE NAME SERVICE (iSNS) SERVER ON A NETWORK DEVICE | |
CN104702693A (zh) | 两节点系统分区的处理方法和节点 | |
WO2024083259A1 (zh) | 主备数据库集群及选主方法、计算设备及存储介质 | |
CN108874918A (zh) | 一种数据处理装置、数据库一体机及其数据处理方法 | |
KR20170131001A (ko) | 메시지분산 서비스 환경에서의 운영 서버 제어 시스템 | |
RU2673019C1 (ru) | Способ обеспечения доступа к разделяемому ресурсу в распределенной вычислительной системе | |
Yasa et al. | Neferion: Time Bound, Fail-Safe and Deterministic Propagation of Network Connectivity Policies Across Large Multi-datacenter Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161213 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180524 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6362120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |