JP7006606B2 - 計算機並びにクラスタ管理システム、方法及びプログラム - Google Patents
計算機並びにクラスタ管理システム、方法及びプログラム Download PDFInfo
- Publication number
- JP7006606B2 JP7006606B2 JP2018540947A JP2018540947A JP7006606B2 JP 7006606 B2 JP7006606 B2 JP 7006606B2 JP 2018540947 A JP2018540947 A JP 2018540947A JP 2018540947 A JP2018540947 A JP 2018540947A JP 7006606 B2 JP7006606 B2 JP 7006606B2
- Authority
- JP
- Japan
- Prior art keywords
- state information
- storage
- computer
- acquisition
- object storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 48
- 238000003860 storage Methods 0.000 claims description 186
- 230000006854 communication Effects 0.000 claims description 117
- 238000004891 communication Methods 0.000 claims description 114
- 230000008569 process Effects 0.000 claims description 36
- 238000007726 management method Methods 0.000 claims description 26
- 238000012544 monitoring process Methods 0.000 claims description 22
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 230000000717 retained effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 230000004083 survival effect Effects 0.000 description 8
- 238000005192 partition Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1608—Error detection by comparing the output signals of redundant hardware
- G06F11/1625—Error detection by comparing the output signals of redundant hardware in communications, e.g. transmission, interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/0757—Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0772—Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0778—Dumping, i.e. gathering error/state information after a fault for later diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1443—Transmit or communication errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1034—Reaction to server failures by a load balancer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
- Hardware Redundancy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
他の計算機とクラスタを構成する計算機であって、
データをオブジェクト単位で管理するオブジェクトストレージに対して、自計算機の正常状態を示す第1の状態情報の格納を要求する格納要求部と、
前記オブジェクトストレージに対して前記他の計算機の正常状態を示す第2の状態情報の取得を要求する取得要求部と、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行うクラスタ制御部と、を備え、
前記取得要求部は、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記第2の状態情報の取得を要求する。
データをオブジェクト単位で管理するオブジェクトストレージと、
前記オブジェクトストレージとネットワークを介して通信可能な複数の計算機と、を備え、
前記複数のサーバのそれぞれは、
前記オブジェクトストレージに対して自計算機の正常状態を示す第1の状態情報の格納を要求し、
前記オブジェクトストレージに対して他の計算機の正常状態を示す第2の状態情報の取得を要求し、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行い、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記取得の要求を行う。
データをオブジェクト単位で管理するオブジェクトストレージに対して、自計算機の正常状態を示す第1の状態情報の格納を要求し、
前記オブジェクトストレージに対して他の計算機の正常状態を示す第2の状態情報の取得を要求し、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行い、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記第2の状態情報の取得を要求する。
データをオブジェクト単位で管理するオブジェクトストレージに対して、自計算機の正常状態を示す第1の状態情報の格納を要求する処理と、
前記オブジェクトストレージに対して他の計算機の正常状態を示す第2の状態情報の取得を要求する処理と、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行う処理と、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記第2の状態情報の取得を要求する処理と、
をコンピュータに実行させる。
図1は、本発明の実施の形態1にかかるクラスタ管理システム1000の全体構成を示すブロック図である。クラスタ管理システム1000は、計算機10と、計算機20と、オブジェクトストレージ30と、ネットワーク40とを備える。ここで、計算機10、20及びオブジェクトストレージ30は、ネットワーク40により接続されている。つまり、計算機10及び20は、ネットワーク40を介してオブジェクトストレージ30と通信可能である。尚、計算機は、3台以上であってもよい。
本実施の形態2は、上述した実施の形態1の具体的な実施例である。
図3は、本発明の実施の形態2にかかるクラスタ管理システム2000の構成を示すブロック図である。クラスタ管理システム2000は、サーバ300と、サーバ350と、オブジェクトストレージ100と、インターネット200とを備える。サーバ300、350及びオブジェクトストレージ100は、インターネット200を介して接続されている。また、サーバ300とサーバ350とは、ハートビート通信経路400により接続されている。オブジェクトストレージ100は、上述したオブジェクトストレージ30と同様である。インターネット200は、上述したネットワーク40の一例である。
(S002)ハートビート通信部302は、ハートビート通信経路400を通じて、サーバ350のハートビート通信部352にハートビートを送信する。
(S003)ハートビート通信部352は、サーバ300からハートビートを受信したことを、クラスタ制御部351に通知する。
(S004)クラスタ制御部351は、ハートビート通信部352からのハートビート受信通知に従って、サーバ300の死活状態を「正常状態」に更新する。
また、サーバ350からサーバ300に対するハートビートも同じように送信される。
(S103)所定のタイムアウト時間に達したため、ハートビート通信部352は、サーバ300からのハートビートを受信できない状態であることをクラスタ制御部351に通知する。
サーバ300がサーバ350からのハートビートを待ち、タイムアウト時間に達した場合の動作も同様である。
(S202)ハートビート通信部302は、オブジェクトストレージアクセス部303に対して、ハートビート情報ファイル(詳細は後述)をオブジェクトストレージ100に格納するよう要求する。
(S302)オブジェクトストレージアクセス部353は、オブジェクトストレージ100に格納されているファイルの一覧を取得する。
(S302-1)オブジェクトストレージアクセス部353は、ファイルの一覧の取得に成功したか否かを判定する。ステップS302の処理が成功した場合は、次にステップS303の処理に進む。処理が失敗した場合は、ステップS302-2の処理に進む。
(S302-2)ステップS302-1でオブジェクトストレージ100からハートビート情報ファイルの一覧の取得に失敗した場合、クラスタ制御部351は、自サーバを異常状態に更新する。
(S304)オブジェクトストレージアクセス部353は、他サーバの最新のハートビート情報ファイルが存在するか否かを判定する。他サーバの最新のハートビート情報ファイルが存在する場合、ステップS308に進む。そうでない場合、ステップS305に進む。
(S307)オブジェクトストレージアクセス部353は、リトライ回数を1つ加算し、再度ステップS302を実行する。
(S309)オブジェクトストレージアクセス部353は、ハートビート情報ファイルを読み取り、ハートビート通信部352に結果を通知する。
(S310)ハートビート通信部352は、他サーバからのハートビートを受信したことを、クラスタ制御部351に通知する。
(S311)クラスタ制御部351は、他サーバの死活状態を「正常状態」に更新する。
本実施の形態3は、上述した実施の形態2の改良例である。
オブジェクトストレージを介したハートビート情報のやり取りは、既存のハートビート通信と比較すると、通信路に対する負荷が大きい。また、利用するオブジェクトストレージによっては、格納されているデータのサイズやデータにアクセスする際のHTTPリクエストの数に応じて利用料が発生することがある。そのため、オブジェクトストレージを介したハートビート情報のやり取りは、必要最小限に抑えることが望ましい。しかし、単純にハートビート情報をやり取りする回数を減らしてしまうと、障害発生の検出が遅れてしまい、サービスの停止時間が長くなってしまう原因となる。
(S401)クラスタ制御部301は、図4におけるステップS004、図5におけるステップS104、図10におけるステップS311が実行されて、相手方サーバ350の死活状態を更新する際に、ハートビート間隔調節部304にも最新の死活状態の情報を入力する。
(S402)ハートビート間隔調節部304は、クラスタ制御部301からの入力に応じて、ハートビート通信経路テーブルの状態を更新する。
(S403)ハートビート間隔調節部304は、ハートビート通信経路テーブルの「状態」に変化があったか否かを判定する。変化があった場合、ステップS404へ進み、変化がなかった場合、処理を終了する。
通信間隔の初期値 x (正常状態の経路数 / 総経路数) = 調節後の通信間隔
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
(付記1)
他の計算機とクラスタを構成する計算機であって、
データをオブジェクト単位で管理するオブジェクトストレージに対して、自計算機の正常状態を示す第1の状態情報の格納を要求する格納要求部と、
前記オブジェクトストレージに対して前記他の計算機の正常状態を示す第2の状態情報の取得を要求する取得要求部と、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行うクラスタ制御部と、を備え、
前記取得要求部は、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記第2の状態情報の取得を要求する
計算機。
(付記2)
クラスタ制御部は、
前記第1の状態情報の格納に失敗した場合、自計算機が異常であると判定してクラスタ制御を行う
付記1に記載の計算機。
(付記3)
前記計算機は、
前記他の計算機と相互に稼動状態を監視するための第1の通信回線で接続され、
前記オブジェクトストレージとの第2の通信回線と前記第1の通信回線とを含む複数の通信回線のそれぞれについて、監視間隔を対応付けて記憶する記憶部を備える
付記1又は2に記載の計算機。
(付記4)
前記複数の通信回線の一部が利用不能となった場合、他の通信回線に対応付けられた前記監視間隔を調節する間隔調節部をさらに備える
付記3に記載の計算機。
(付記5)
前記記憶部は、前記複数の通信回線のそれぞれについて、前記監視間隔の調節の要否をさらに対応付けて記憶し、
前記間隔調節部は、前記他の通信回線のうち、前記調節の要否に基づいて各通信回線の調節を行う
付記4に記載の計算機。
(付記6)
前記クラスタ制御部は、
前記取得要求部により取得された前記第2の状態情報を保持し、
その後、前記第2の状態情報の取得に成功した場合の前記第2の状態情報と前記保持した第2の状態情報との比較により、前記他の計算機の稼動状態を判定する
付記1乃至5のいずれか1項に記載の計算機。
(付記7)
前記クラスタ制御部は、
前記オブジェクトストレージから取得されるオブジェクトのパスに基づいて、前記他の計算機の稼動状態を判定する
付記6に記載の計算機。
(付記8)
データをオブジェクト単位で管理するオブジェクトストレージと、
前記オブジェクトストレージとネットワークを介して通信可能な複数の計算機と、を備え、
前記複数の計算機のそれぞれは、
前記オブジェクトストレージに対して自計算機の正常状態を示す第1の状態情報の格納を要求し、
前記オブジェクトストレージに対して他の計算機の正常状態を示す第2の状態情報の取得を要求し、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行い、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記取得の要求を行う
クラスタ管理システム。
(付記9)
データをオブジェクト単位で管理するオブジェクトストレージに対して、自計算機の正常状態を示す第1の状態情報の格納を要求し、
前記オブジェクトストレージに対して他の計算機の正常状態を示す第2の状態情報の取得を要求し、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行い、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記第2の状態情報の取得を要求する
クラスタ管理方法。
(付記10)
データをオブジェクト単位で管理するオブジェクトストレージに対して、自計算機の正常状態を示す第1の状態情報の格納を要求する処理と、
前記オブジェクトストレージに対して他の計算機の正常状態を示す第2の状態情報の取得を要求する処理と、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行う処理と、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記第2の状態情報の取得を要求する処理と、
をコンピュータに実行させるクラスタ管理プログラム。
2000 クラスタ管理システム
3000 クラスタ管理システム
10 計算機
11 格納要求部
12 取得要求部
13 クラスタ制御部
20 計算機
21 格納要求部
22 取得要求部
23 クラスタ制御部
30 オブジェクトストレージ
40 ネットワーク
100 オブジェクトストレージ
101 ハートビート情報
102 ハートビート情報
200 インターネット
300 サーバ
301 クラスタ制御部
302 ハートビート通信部
303 オブジェクトストレージアクセス部
304 ハートビート間隔調節部
350 サーバ
351 クラスタ制御部
352 ハートビート通信部
353 オブジェクトストレージアクセス部
354 ハートビート間隔調節部
400 ハートビート通信経路
401 ハートビート通信経路
Claims (10)
- データをオブジェクト単位で管理し、通信ネットワークを介して接続され、冗長化されたストレージシステムであるオブジェクトストレージに対して、自計算機の正常状態を示す第1の状態情報の格納を要求する格納要求手段と、
前記オブジェクトストレージに対して前記自計算機とクラスタを構成する他の計算機の正常状態を示す第2の状態情報の取得を要求する取得要求手段と、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行うクラスタ制御手段と、を備え、
前記取得要求手段は、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記第2の状態情報の取得を要求する
計算機。 - クラスタ制御手段は、
前記第1の状態情報の格納に失敗した場合、自計算機が異常であると判定してクラスタ制御を行う
請求項1に記載の計算機。 - 前記計算機は、
前記他の計算機と相互に稼動状態を監視するための第1の通信回線で接続され、
前記通信ネットワークである第2の通信回線と前記第1の通信回線とを含む複数の通信回線のそれぞれについて、監視間隔を対応付けて記憶する記憶手段を備える
請求項1又は2に記載の計算機。 - 前記複数の通信回線の一部が利用不能となった場合、他の通信回線に対応付けられた前記監視間隔を調節する間隔調節手段をさらに備える
請求項3に記載の計算機。 - 前記記憶手段は、前記複数の通信回線のそれぞれについて、前記監視間隔の調節の要否をさらに対応付けて記憶し、
前記間隔調節手段は、前記他の通信回線のうち、前記調節の要否に基づいて各通信回線の調節を行う
請求項4に記載の計算機。 - 前記クラスタ制御手段は、
前記取得要求手段により取得された前記第2の状態情報を保持し、
その後、前記第2の状態情報の取得に成功した場合の前記第2の状態情報と前記保持した第2の状態情報との比較により、前記他の計算機の稼動状態を判定する
請求項1乃至5のいずれか1項に記載の計算機。 - 前記クラスタ制御手段は、
前記オブジェクトストレージから取得されるオブジェクトのパスに基づいて、前記他の計算機の稼動状態を判定する
請求項6に記載の計算機。 - データをオブジェクト単位で管理し、通信ネットワークを介して接続され、冗長化されたストレージシステムであるオブジェクトストレージと、
前記オブジェクトストレージとネットワークを介して通信可能な複数の計算機と、を備え、
前記複数の計算機のそれぞれは、
前記オブジェクトストレージに対して自計算機の正常状態を示す第1の状態情報の格納を要求し、
前記オブジェクトストレージに対して前記自計算機とクラスタを構成する他の計算機の正常状態を示す第2の状態情報の取得を要求し、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行い、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記取得の要求を行う
クラスタ管理システム。 - データをオブジェクト単位で管理し、通信ネットワークを介して接続され、冗長化されたストレージシステムであるオブジェクトストレージに対して、自計算機の正常状態を示す第1の状態情報の格納を要求し、
前記オブジェクトストレージに対して前記自計算機とクラスタを構成する他の計算機の正常状態を示す第2の状態情報の取得を要求し、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行い、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記第2の状態情報の取得を要求する
クラスタ管理方法。 - データをオブジェクト単位で管理し、通信ネットワークを介して接続され、冗長化されたストレージシステムであるオブジェクトストレージに対して、自計算機の正常状態を示す第1の状態情報の格納を要求する処理と、
前記オブジェクトストレージに対して前記自計算機とクラスタを構成する他の計算機の正常状態を示す第2の状態情報の取得を要求する処理と、
前記第1の状態情報の格納結果及び前記第2の状態情報の取得結果に応じて、クラスタ制御を行う処理と、
前記第2の状態情報の取得結果が最新でなかった場合、所定回数、前記第2の状態情報の取得を要求する処理と、
をコンピュータに実行させるクラスタ管理プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016184515 | 2016-09-21 | ||
JP2016184515 | 2016-09-21 | ||
PCT/JP2017/031876 WO2018056044A1 (ja) | 2016-09-21 | 2017-09-05 | 計算機並びにクラスタ管理システム、方法及び非一時的なコンピュータ可読媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018056044A1 JPWO2018056044A1 (ja) | 2019-07-04 |
JP7006606B2 true JP7006606B2 (ja) | 2022-01-24 |
Family
ID=61690892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018540947A Active JP7006606B2 (ja) | 2016-09-21 | 2017-09-05 | 計算機並びにクラスタ管理システム、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11119870B2 (ja) |
JP (1) | JP7006606B2 (ja) |
WO (1) | WO2018056044A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6724998B2 (ja) * | 2016-10-20 | 2020-07-15 | 日本電気株式会社 | サーバ装置、クラスタシステム、クラスタ制御方法およびプログラム |
JP7375342B2 (ja) * | 2019-06-17 | 2023-11-08 | 富士フイルムビジネスイノベーション株式会社 | 中継装置、情報処理システム及び中継処理プログラム |
JP7328907B2 (ja) * | 2020-01-31 | 2023-08-17 | 株式会社日立製作所 | 制御システム、制御方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004021556A (ja) | 2002-06-14 | 2004-01-22 | Hitachi Ltd | 記憶制御装置およびその制御方法 |
JP2004199682A (ja) | 2002-12-18 | 2004-07-15 | Internatl Business Mach Corp <Ibm> | 高可用性クラスタにおける活性判定用通信ネットワークとしての記憶媒体の使用 |
JP2005196467A (ja) | 2004-01-07 | 2005-07-21 | Hitachi Ltd | ストレージシステム、ストレージシステムの制御方法、及びストレージ制御装置 |
JP2014109973A (ja) | 2012-12-04 | 2014-06-12 | Toppan Printing Co Ltd | 通信媒体 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6952737B1 (en) * | 2000-03-03 | 2005-10-04 | Intel Corporation | Method and apparatus for accessing remote storage in a distributed storage cluster architecture |
US8041735B1 (en) * | 2002-11-01 | 2011-10-18 | Bluearc Uk Limited | Distributed file system and method |
JP5096799B2 (ja) | 2007-05-29 | 2012-12-12 | 株式会社野村総合研究所 | クラスタシステム、計算機、および障害対処方法 |
US8775773B2 (en) * | 2011-08-26 | 2014-07-08 | Vmware, Inc. | Object storage system |
-
2017
- 2017-09-05 US US16/335,072 patent/US11119870B2/en active Active
- 2017-09-05 JP JP2018540947A patent/JP7006606B2/ja active Active
- 2017-09-05 WO PCT/JP2017/031876 patent/WO2018056044A1/ja active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004021556A (ja) | 2002-06-14 | 2004-01-22 | Hitachi Ltd | 記憶制御装置およびその制御方法 |
JP2004199682A (ja) | 2002-12-18 | 2004-07-15 | Internatl Business Mach Corp <Ibm> | 高可用性クラスタにおける活性判定用通信ネットワークとしての記憶媒体の使用 |
JP2005196467A (ja) | 2004-01-07 | 2005-07-21 | Hitachi Ltd | ストレージシステム、ストレージシステムの制御方法、及びストレージ制御装置 |
JP2014109973A (ja) | 2012-12-04 | 2014-06-12 | Toppan Printing Co Ltd | 通信媒体 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2018056044A1 (ja) | 2019-07-04 |
US20190266059A1 (en) | 2019-08-29 |
US11119870B2 (en) | 2021-09-14 |
WO2018056044A1 (ja) | 2018-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6056453B2 (ja) | プログラム、データ管理方法および情報処理装置 | |
US8458398B2 (en) | Computer-readable medium storing data management program, computer-readable medium storing storage diagnosis program, and multinode storage system | |
US11232007B2 (en) | Server system and method of switching server | |
JP7006606B2 (ja) | 計算機並びにクラスタ管理システム、方法及びプログラム | |
US20150201036A1 (en) | Gateway device, file server system, and file distribution method | |
US9336093B2 (en) | Information processing system and access control method | |
EP3648405B1 (en) | System and method to create a highly available quorum for clustered solutions | |
US9342418B2 (en) | Storage system, storage control device and data transfer method | |
US10782913B2 (en) | Apparatus, method, and program product for data integrity during asynchronous remote copy | |
CN108512753A (zh) | 一种集群文件系统中消息传输的方法及装置 | |
CN110688262B (zh) | 一种基于主机仲裁的双活存储系统及存储方法 | |
JP6260470B2 (ja) | 網監視システムおよび網監視方法 | |
JP4485560B2 (ja) | コンピュータ・システム及びシステム管理プログラム | |
JP6237925B2 (ja) | クラスタシステム及びクラスタ制御方法 | |
JP2017010102A (ja) | 二重系システム | |
US10855610B2 (en) | Information processing apparatus, information processing system, information processing method, and storage medium | |
US10210094B2 (en) | Information processing system, information processing method and information processing apparatus | |
CN117743218A (zh) | 一种双活仲裁的方法、系统、设备及存储介质 | |
JP6558012B2 (ja) | ストレージ管理装置、ストレージシステム、ストレージ管理方法及びプログラム | |
JP2012073774A (ja) | 記憶システム及びフェイルオーバ制御方法 | |
JP2020031375A (ja) | 送信制御装置および送信制御プログラム | |
JP2018169772A (ja) | ディザスタリカバリシステム、ディザスタリカバリ方法及びプログラム | |
JP2016208232A (ja) | ビデオサーバシステム、データ操作方法、及び、コンピュータ・プログラム | |
JP2016051267A (ja) | ノードクラスタシステム及びノードクラスタ管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190313 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210915 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211220 |