JP2018056633A - クラスタシステム、サーバ、サーバの動作方法、及びプログラム - Google Patents

クラスタシステム、サーバ、サーバの動作方法、及びプログラム Download PDF

Info

Publication number
JP2018056633A
JP2018056633A JP2016187023A JP2016187023A JP2018056633A JP 2018056633 A JP2018056633 A JP 2018056633A JP 2016187023 A JP2016187023 A JP 2016187023A JP 2016187023 A JP2016187023 A JP 2016187023A JP 2018056633 A JP2018056633 A JP 2018056633A
Authority
JP
Japan
Prior art keywords
server
leader
node
servers
keep
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016187023A
Other languages
English (en)
Other versions
JP6838334B2 (ja
Inventor
敏喜 瀬戸
Toshiki Seto
敏喜 瀬戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2016187023A priority Critical patent/JP6838334B2/ja
Publication of JP2018056633A publication Critical patent/JP2018056633A/ja
Application granted granted Critical
Publication of JP6838334B2 publication Critical patent/JP6838334B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】クラスタシステムのノード数が増加しても、死活監視のための通信の増大を抑制可能とする。【解決手段】サーバ10は、複数のサーバを含むクラスタシステムに用いられる。リーダー選出部11は、複数のサーバ10のうちの1つをリーダーとして選出する。キープアライブ通信制御部12は、自サーバがリーダーである場合は、クラスタシステムに含まれる他のサーバにキープアライブを送信して他のサーバを監視する。キープアライブ通信制御部12は、自サーバがリーダーでない場合は、リーダーであるサーバからキープアライブを受信し、それに対する応答をリーダーに送信する。ノード状態記録部13は、自サーバがリーダーである場合に、キープアライブ通信制御部における監視の結果を記録する。【選択図】図1

Description

本発明は、クラスタシステムに関し、更に詳しくは、複数のサーバを含むクラスタシステムに関する。
また、本発明は、クラスタシステムに用いられるサーバ、その動作方法、及びプログラムに関する。
複数のコンピュータを束ねて一体として動作させるクラスタシステムが知られている。クラスタシステムのうち、システムの可用性(availability)を高めるために構築されたものは、高可用クラスタシステムと呼ばれる。高可用クラスタシステムは、ネットワークを介して相互に接続された複数のノード(サーバ)を含む。
高可用クラスタシステムにおいて、各ノードは、ネットワークを経由して互いに死活監視を行う。高可用クラスタシステムでは、ある業務はただ一つのノードで実行され、その業務が正常に実行されている可否かが監視される。高可用クラスタシステムは、業務が実行されていたノードが停止したことを検知すると別のノードにその業務を引き継ぐ機能と、業務の監視が異常を検知すると別のノードにその業務を引き継ぐ機能とを持つ。高可用クラスタシステムでは、クラスタ内のあるノードが通信不能であると判断されると、当該ノードが停止したと判断され、そのノード上で動作していた業務が他ノードで起動される。
クラスタシステムに関して、特許文献1は、正常なノードがサービスを継続するシステムを開示する。特許文献1では、ノードがサービス処理を実行できる割当て時間と、ノードごとに設定された割当て時間の優先順位とを含む定義情報が用いられる。特許文献1において、クラスタシステムを構成する2つのサーバ(ノード)間の通信が不通になると、各ノードは、定義情報に基づいて、次の割当て時間の開始時刻を算出する。各ノードは、算出された開始時刻まで、所定のサービス(業務)処理の起動を遅延する。各ノードは、割当て時間の開始時刻になると、業務処理を起動し、割当て時間内に業務が実行できれば業務処理を継続し、業務が実行できなければ動作を停止する。
また、クラスタシステムに関して、特許文献2は、スプリットブレインの発生時に、クライアントに対してサービスを提供するマスタノードを選択することを開示する。特許文献2において、各ノードのクラスタ管理部は、相互にハートビート通信を行うことでノード障害を検出する。各ノードの重み付け処理部は、ノードのサービスの開始に関する状態をチェックし、そのチェックされた状態に応じて、共有ストレージ装置に格納されている重み情報中の自ノードの重みを更新する。各ノードのタイブレーカ機構は、更新された重み情報が示す重みに基づいて自ノードの優先順位が最も高いか否かを判定し、最も優先順位が高い場合に自ノードをマスタノードとして選択する。
特開2006−48477号公報 特開2009−223519号公報
特許文献1及び2では、それぞれのノードが他のノードの死活監視を行っている。このため、ノード数が増加すると、それに伴い死活監視のための通信量が増大する。例えばNを2以上の整数として、クラスタシステムを構成するノードの数がNであった場合、クラスタシステムにおいて死活監視のための通信の数はN(N−1)/2になる。特許文献1及び2において、ノード数が増加すると通信負荷が増大し、通信の管理も複雑となる。
本発明は、上記事情に鑑み、ノード数が増加しても死活監視のための通信の増大を抑制可能なクラスタシステムを提供することを目的とする。
また、本発明は、上記クラスタシステムに用いられるサーバ、そのサーバの動作方法、及びプラグラムを提供することを目的とする。
上記目的を達成するために、本発明は、複数のサーバを含むクラスタシステムに使用されるサーバであって、前記複数のサーバのうちの1つのサーバをリーダーとして選出するリーダー選出部と、自サーバがリーダーである場合は、前記クラスタシステムに含まれる他のサーバにキープアライブを送信して他のサーバを監視し、自サーバがリーダーでない場合は、リーダーであるサーバから前記キープアライブを受信し、該キープアライブに対する応答を前記リーダーであるサーバに送信するキープアライブ通信制御部と、自サーバがリーダーである場合に、前記キープアライブ通信制御部における監視の結果を記録するノード状態記録部とを備えるサーバを提供する。
本発明は、また、複数のサーバを含むクラスタシステムであって、前記複数のサーバのうちの1つがリーダーとして選出され、前記リーダーして選出されたサーバが、他のサーバにキープアライブを送信して他のサーバを監視し、前記他のサーバはキープアライブに対する応答を前記リーダーとして選出されたサーバに送信するクラスタシステムを提供する。
さらに、本発明は、複数のサーバを含むクラスタシステムにおいてリーダーとして動作するサーバの動作方法であって、前記クラスタシステムに含まれる他のサーバにキープアライブを送信するステップと、前記他のサーバからキープアライブに対する応答を受信するステップと、前記応答を受信できたか否かを示す監視結果をノード状態記録部に記録するステップとを有するサーバの動作方法を提供する。
本発明は、複数のサーバを含むクラスタシステムにおいてリーダーとして動作するサーバに、前記クラスタシステムに含まれる他のサーバにキープアライブを送信するステップと、前記他のサーバからキープアライブに対する応答を受信するステップと、前記応答を受信できたか否かを示す監視結果をノード状態記録部に記録するステップとを実行させるためのプログラムを提供する。
本発明のクラスタシステム、サーバ、サーバの動作方法、及びプログラムは、クラスタシステムのノード数が増加しても死活監視のための通信の増大を抑制することができる。
本発明のクラスタシステムに用いられるサーバを示すブロック図。 本発明の一実施形態に係るクラスタシステムを示すブロック図。 サーバの構成を示すブロック図。 リーダー選出時の動作手順を示すフローチャート。 リーダーノード処理の動作手順を示すフローチャート。 非リーダーノード処理の動作手順を示すフローチャート
本発明の実施の形態の説明に先立って、本発明の概要を説明する。図1は、本発明のクラスタシステムに用いられるサーバを示す。サーバ10は、リーダー選出部11、キープアライブ通信制御部12、及びノード状態記録部13を有する。クラスタシステムには、複数のサーバ10が含まれる。
リーダー選出部11は、クラスタシステムに含まれる複数のサーバ10のうちの1つをリーダーとして選出する。キープアライブ通信制御部12は、自サーバがリーダーである場合は、クラスタシステムに含まれる他のサーバ10にキープアライブを送信し、他のサーバを監視する。キープアライブ通信制御部12は、自サーバがリーダーではない場合は、リーダーであるサーバ10からキープアライブを受信し、受信したキープアライブに対する応答をリーダーであるサーバ10に送信する。ノード状態記録部13は、自サーバがリーダーである場合、キープアライブ通信制御部における監視の結果を記録する。
本発明では、クラスタシステムを構成する複数のサーバの1つがリーダーとして選出される。リーダーとして選出されたサーバは、残りのサーバにキープアライブを送信し、キープアライブに対する応答を受信する。リーダーとして選出されたサーバは、キープアライブに対する応答の有無に基づいて、残りのサーバの稼動状態を監視する。本発明では、リーダーとして選出されたサーバと残りのサーバのそれぞれとの間でキープアライブ及びそれに対する応答の通信を行えばよいため、クラスタシステムのノード数が増加しても死活監視のための通信の増大を抑制することができる。
以下、図面を参照しつつ、本発明の実施の形態を詳細に説明する。図2は、本発明の一実施形態に係るクラスタシステムを示す。クラスタシステム100は、Nを3以上の整数として、サーバ110−1〜110−Nを有する。これらサーバ110−1〜110−Nは、典型的には、プロセッサ、メモリ、及び補助記憶装置などを有するコンピュータ装置である。サーバ110−1〜110−Nは、ネットワークを介して相互に接続される。サーバ110−1〜110−Nは、例えば高可用クラスタシステムを構成する。なお、以下の説明では、複数のサーバを特に区別する必要がない場合は、サーバ110とも呼ぶ。
本実施形態では、クラスタシステム100において、複数のサーバ110のうちの1つがリーダーとして動的に選出される。リーダーとして選出されたサーバ110は、定期的に残りのサーバ110にキープアライブを送信し、それに対する応答を受信することで、残りのサーバ110の死活監視を行う。リーダーではない残りのサーバ110は、リーダーから送信されるキープアライブを用いて、リーダーとして選出されたサーバ110の死活監視を行う。
ここで、キープアライブに対して応答を返さないサーバには、動作を停止しているサーバと、何らかの理由でネットワークから切り離されてリーダーと通信不能になったサーバとが含まれる。以下では、動作を停止しているサーバを停止ノードとも呼び、リーダーと通信不能になったサーバを無応答ノードとも呼ぶ。無応答ノードと停止ノードを区別するため、各サーバ110は、その停止処理において、リーダーとして選出されたサーバ110に停止通知を送信するものとする。停止通知を送信しておらず、かつキープアライブに対して応答を返さないサーバは、無応答ノードとして取り扱われる。
本実施形態において、複数のサーバ110のそれぞれは、外部から強制停止の指示を受け付ける機能を有している。リーダーとして選出されたサーバ110は、無応答ノードを検出すると、無応答ノードを強制的に停止させることができる。例えば、リーダーとして選出されたサーバ110は、無応答ノードのサーバ110が物理マシンであれば、IPMI(Intelligent Platform Management Interface)に準拠するBMC(Baseboard Management Controller)を利用して外部から電源断を実行する。リーダーとして選出されたサーバ110は、無応答ノードのサーバ110が仮想化環境上の仮想マシンであれば、ホストマシンに対する当該仮想マシンの強制停止要求を実行する。
リーダーとして選出されたサーバ110が停止する場合、他に動作しているサーバ110があればリーダー選出が再度実行される。リーダーとして選出されていたサーバ110は、新たにリーダーとして選出されたサーバ110がリーダーとしての動作を開始してから、停止処理を実行する。リーダーとして選出されたサーバ110は、他に動作しているサーバ110がない場合は、そのまま停止処理を実行する。
クラスタシステム100において、リーダーとして選出されたサーバ110が、何らかの理由で他のサーバ110と通信できなくなる場合も考えられる。そのような場合に対応するため、リーダーとして選出されたサーバ110は、クラスタ内の半数以上のサーバ110と通信が可能な場合にリーダーを維持できるものとする。
図3は、サーバ110の構成を示す。サーバ110は、リーダー選出部111、キープアライブ通信制御部112、ノード状態記録部113、通信部114、及び電源制御部115を有する。サーバ110において、リーダー選出部111、キープアライブ通信制御部112、ノード状態記録部113、通信部114、及び電源制御部115の機能のうちの少なくとも一部は、サーバがプログラムに従って処理を実行することで実現される。
通信部114は、他のサーバ110及び図示しないクライアント端末の少なくとも一方との間で通信を行う。リーダー選出部111は、複数のサーバ110−1〜110−Nのうちの1つをリーダーとして選出する。キープアライブ通信制御部112は、自サーバがリーダーである場合は、他のサーバにキープアライブを送信する。キープアライブ通信制御部112は、自サーバがリーダーではない場合は、リーダーであるサーバからキープアライブを受信し、それに対する応答を送信する。
ノード状態記録部113は、記憶装置を含んでおり、キープアライブ通信制御部112における監視の結果を記憶する。ノード状態記録部113は、例えばキープアライブ対する応答がないサーバ110のうち、停止通知を受け取っていないサーバを無応答ノードとして記録する。ノード状態記録部113は、停止通知を受け取っていたサーバを停止ノードとして記録する。また、ノード状態記録部113は、どのサーバがリーダーであるかを示す情報を記憶する。
電源制御部115は、サーバ110の電源制御を行う。電源制御部115は、自サーバがリーダーである場合に、キープアライブに対して応答しないノードの電源を停止させる。電源制御部115は、ノードの停止を制御するノード停止制御部に相当する。電源制御部115は、自サーバがリーダーである場合、停止させるサーバ110の電源制御部115に、電源断の要求を送信する。電源制御部115は、リーダーであるサーバ110から電源断の要求を受信すると、自サーバの電源を停止する。
リーダーとして選出されたサーバ110の電源制御部115は、例えば、ノード状態記録部113において無応答ノードとして記録されたノード(サーバ)の電源を強制的に停止する。電源制御部115は、無応答ノードとして記録されたサーバの数が、全サーバの半分よりも少ない場合に、サーバの電源停止を実施してもよい。無応答ノードして記録されたサーバの数が全サーバの半分以上の場合、リーダー選出部111は、新たなリーダーの選出を実施してもよい。
続いて動作手順を説明する。図4は、リーダー選出時の動作手順を示す。各サーバ110は、例えばその起動時にリーダー選出処理を開始する。各サーバ110において、リーダー選出部111は、クラスタシステムを構成する複数のサーバ110の1つをリーダーとして選出する(ステップA1)。リーダー選出部111は、例えば分散合意アルゴリズムなどを利用し、リーダーとして動作させるサーバ(リーダーノード)を1つ選出する。
リーダー選出部111は、ノード状態記録部113にリーダーノードを記録する。各サーバは、自サーバがリーダーであるか否かを判断する(ステップA3)。各サーバ110は、自サーバがリーダーである場合は、リーダーノード処理を実行し(ステップA4)、リーダーではない場合は非リーダーノード処理を実行する(ステップA5)。
図5は、リーダーノード処理の動作手順を示す。リーダーとして選出されたサーバ110のキープアライブ通信制御部112は、リーダー以外のサーバ110のそれぞれへキープアライブを送信する(ステップB1)。キープアライブ通信制御部112は、キープアライブに対する応答を待つ(ステップB2)。キープアライブ通信制御部112は、応答待ちがタイムアウトしたか否かを判断する(ステップB3)。
キープアライブ通信制御部112は、タイムアウトする前に応答を受信できた場合は、その旨をノード状態記録部113に記録する(ステップB4)。キープアライブ通信制御部112は、ステップB4では、無応答ノードとして記録したサーバからキープアライブに対する応答が受信できた場合は、無応答ノードの記録を削除する。その後、キープアライブ通信制御部112は、一定時間待機した後にステップB1に戻り、例えば所定時間間隔で定期的にキープアライブの送信を行う。
ステップB3でタイムアウトしたと判断された場合、ノード状態記録部113は、応答がタイムアウトしたノードを無応答ノードとして記録する(ステップB5)。キープアライブ通信制御部112は、無応答ノードの数が全サーバの半数以上であるか否かを判断する(ステップB6)。リーダー選出部111は、ステップB6で無応答ノードの数が全サーバの半数以上であると判断された場合は、リーダー維持不能であるとして、リーダー選出処理をやり直す(ステップB7)。
ステップB6で無応答ノードの数が全サーバの半数以上ではないと判断された場合、電源制御部115は、無応答ノードとして記録されたサーバ110を強制的に停止させる(ステップB8)。ステップB8では、例えばリーダーであるサーバ110のキープアライブ通信制御部112から、無応答ノードとして記録されたサーバ110の電源制御部115に電源停止要求を送信する。電源制御部115が、電源停止要求を受信して電源停止を実行することで、無応答ノードとして記録された自サーバを停止させる。
図6は、非リーダーノード処理の動作手順を示す。リーダーとして選出されなかった残りのサーバ110のキープアライブ通信制御部112は、リーダーとして選出されたサーバ110から送信されるキープアライブを待ち受ける(ステップC1)。キープアライブ通信制御部112は、キープアライブがタイムアウトしたか否かを判断する(ステップC2)。キープアライブ通信制御部112は、ステップC2でキープアライブがタイムアウトしていないと判断した場合は、キープアライブに対する応答をリーダーとして選出されたサーバ110に送信する(ステップC3)。その後、キープアライブ通信制御部112は、ステップC1に戻り、次のキープアライブを待ち受ける。
キープアライブ通信制御部112は、ステップC2でキープアライブがタイムアウトしたと判断した場合は、リーダーが消失したとして、リーダー選出部111にリーダー選出のやり直しを指示する。リーダー選出部111は、指示に従って、リーダー選出処理を実行する(ステップC4)。
なお、リーダー選出後に再度リーダー選出処理を開始する判断は、クラスタシステムを構成する各サーバ110が独立して行う。元のリーダーが何らかの理由でリーダー選出処理を開始した場合、他のサーバ110はキープアライブの受信が途絶えるため、他のサーバ110においてもリーダー選出処理が開始される。その結果として、全てのサーバ110においてリーダー選出処理が実行されることになる。一方、リーダーからキープアライブが受信できないことであるサーバ110がリーダー選出処理を開始した場合、全体の過半数のサーバ110がリーダー選出処理を開始すれば、新たなリーダーが選出される。そうでない場合、元のリーダーが継続してリーダーとして動作し、リーダーから送信されたキープアライブが受信できなかったサーバ110、つまりリーダー選出処理を実行したもののリーダーを選出できなかったサーバ110は、リーダーからの指示で停止させられる。
本実施形態では、クラスタシステムを構成する複数のサーバ110−1〜110−Nのうち、1つのサーバ110がリーダーとして選出される。リーダーとして選出されたサーバ110は、残りのサーバ110に対して、キープアライブ通信を用いた死活監視を行う。リーダーとして選出されなかったサーバ110は、それぞれリーダーとして選出されたサーバ110との間でキープアライブ通信を行えばよい。本実施形態では、例えばサーバ110の台数がN台であった場合、キープアライブの通信の数はN−1となる。本実施形態では、リーダーとして選出されていないサーバ110の間でキープアライブ通信を行う必要がないため、クラスタシステムを構成するサーバの数が増えた場合の通信負荷の増加を抑制することができ、通信の管理も簡素化することができる。
また、本実施形態では、各サーバ110は、その停止時に、ノードの停止通知をリーダーとして選出されたサーバ110に送信する。リーダーとして選出されたサーバ110は、キープアライブに対する応答がないサーバ110がある場合に、停止通知の有無を調べることで、そのサーバ110が停止しているのか、或いは何らかの理由で応答を返すことができないのかを判別することが可能である。
例えば、あるサーバが一時的に動作不能になり、しばらく後に動作を再開するような挙動を示した場合を考える。クラスタシステムにおいて、業務を提供していたサーバが一時的に動作不能状態になり、そのサーバが停止したと判断されると、別のサーバで業務が起動される。別のサーバで業務が起動された後、元のサーバが動作を再開すると、複数のサーバで業務が実行された状態(以下、両系活性状態とも呼ぶ)になる可能性がある。
本実施形態では、リーダーとして選出されたサーバ110は、一時的に動作不能になったサーバ110から停止通知を受け取ったか否かを判断する。リーダーとして選出されたサーバ110は、停止通知の有無に基づいて、そのサーバ110が停止したのか、或いは無応答であるのかを判断することができる。本実施形態では、リーダーとして選出されたサーバ110は、無応答のサーバ110を、例えばIPMIなどを利用した外部からの電源制御を用いて強制的に停止させる。このようにすることで、無応答のサーバ110が動作を再開し、両系活性状態になることを防ぐことができる。
以上、本発明の実施形態を詳細に説明したが、本発明は、上記した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で上記実施形態に対して変更や修正を加えたものも、本発明に含まれる。
上記実施形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記憶媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、例えばフレキシブルディスク、磁気テープ、又はハードディスクなどの磁気記録媒体、例えば光磁気ディスクなどの光磁気記録媒体、CD(compact disc)、又はDVD(digital versatile disk)などの光ディスク媒体、及び、マスクROM(read only memory)、PROM(programmable ROM)、EPROM(erasable PROM)、フラッシュROM、又はRAM(random access memory)などの半導体メモリを含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)を用いてコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバなどの有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
10:サーバ
11:リーダー選出部
12:キープアライブ通信制御部
13:ノード状態記録部
110:サーバ
111:リーダー選出部
112:キープアライブ通信制御部
113:ノード状態記録部
114:通信部
115:電源制御部

Claims (9)

  1. 複数のサーバを含むクラスタシステムに使用されるサーバであって、
    前記複数のサーバのうちの1つのサーバをリーダーとして選出するリーダー選出部と、
    自サーバがリーダーである場合は、前記クラスタシステムに含まれる他のサーバにキープアライブを送信して他のサーバを監視し、自サーバがリーダーでない場合は、リーダーであるサーバから前記キープアライブを受信し、該キープアライブに対する応答を前記リーダーであるサーバに送信するキープアライブ通信制御部と、
    自サーバがリーダーである場合に、前記キープアライブ通信制御部における監視の結果を記録するノード状態記録部とを備えるサーバ。
  2. 前記他のサーバは、それぞれ、自ノードの停止時に前記リーダーであるサーバにノードの停止通知を送信し、
    ノード状態記録部は、自サーバがリーダーである場合、前記キープアライブに対して応答せず、かつ前記停止通知を受け取っていないサーバを無応答ノードとして記録する請求項1に記載のサーバ。
  3. 前記ノード状態記録部は、自サーバがリーダーである場合、前記停止通知の送信元のサーバを、停止ノードとして記録する請求項2に記載のサーバ。
  4. 自サーバがリーダーである場合に、前記無応答ノードとして記録されたサーバを停止させるノード停止制御部を更に有する請求項2又は3に記載のサーバ。
  5. 前記ノード停止制御部は、前記無応答ノードとして記録されたサーバの数が前記クラスタシステムに含まれるサーバの数の半分以下の場合に、前記無応答ノードとして記録されたサーバを停止させる請求項4に記載のサーバ。
  6. 前記リーダー選出部は、自サーバがリーダーである場合で、かつ前記無応答ノードとして記録されたサーバの数が前記クラスタシステムに含まれるサーバの数の半分を超える場合は、新たなリーダーの選出を実施する請求項5に記載のサーバ。
  7. 複数のサーバを含むクラスタシステムであって、
    前記複数のサーバのうちの1つがリーダーとして選出され、
    前記リーダーして選出されたサーバが、他のサーバにキープアライブを送信して他のサーバを監視し、
    前記他のサーバはキープアライブに対する応答を前記リーダーとして選出されたサーバに送信するクラスタシステム。
  8. 複数のサーバを含むクラスタシステムにおいてリーダーとして動作するサーバの動作方法であって、
    前記クラスタシステムに含まれる他のサーバにキープアライブを送信するステップと、
    前記他のサーバからキープアライブに対する応答を受信するステップと、
    前記応答を受信できたか否かを示す監視結果をノード状態記録部に記録するステップとを有するサーバの動作方法。
  9. 複数のサーバを含むクラスタシステムにおいてリーダーとして動作するサーバに、
    前記クラスタシステムに含まれる他のサーバにキープアライブを送信するステップと、
    前記他のサーバからキープアライブに対する応答を受信するステップと、
    前記応答を受信できたか否かを示す監視結果をノード状態記録部に記録するステップとを実行させるためのプログラム。
JP2016187023A 2016-09-26 2016-09-26 クラスタシステム、サーバ、サーバの動作方法、及びプログラム Active JP6838334B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016187023A JP6838334B2 (ja) 2016-09-26 2016-09-26 クラスタシステム、サーバ、サーバの動作方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016187023A JP6838334B2 (ja) 2016-09-26 2016-09-26 クラスタシステム、サーバ、サーバの動作方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2018056633A true JP2018056633A (ja) 2018-04-05
JP6838334B2 JP6838334B2 (ja) 2021-03-03

Family

ID=61836123

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016187023A Active JP6838334B2 (ja) 2016-09-26 2016-09-26 クラスタシステム、サーバ、サーバの動作方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6838334B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020173743A (ja) * 2019-04-15 2020-10-22 明京電機株式会社 障害監視復旧システム、その方法、およびそのプログラム
CN111835534A (zh) * 2019-04-15 2020-10-27 华为技术有限公司 一种集群控制的方法及相关设备
JP7458424B2 (ja) 2019-07-24 2024-03-29 シスコ テクノロジー,インコーポレイテッド 性能ルーティング測定を伴う双方向フォワーディング検出を提供するためのシステムおよび方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113495A (ja) * 2008-11-06 2010-05-20 Nomura Research Institute Ltd クラスタシステムおよびクラスタ制御方法
JP2011123681A (ja) * 2009-12-10 2011-06-23 Canon Inc フェイルオーバー制御方法
JP2011203941A (ja) * 2010-03-25 2011-10-13 Nec Corp 情報処理装置、監視方法、および監視プログラム
JP2013186781A (ja) * 2012-03-09 2013-09-19 Nec Corp クラスタシステム
WO2015029139A1 (ja) * 2013-08-27 2015-03-05 株式会社東芝 データベースシステム、プログラムおよびデータ処理方法
JP2015191451A (ja) * 2014-03-28 2015-11-02 富士通株式会社 情報処理装置、制御方法および制御プログラム
JP2016151965A (ja) * 2015-02-18 2016-08-22 富士通株式会社 冗長構成システム及び冗長構成制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113495A (ja) * 2008-11-06 2010-05-20 Nomura Research Institute Ltd クラスタシステムおよびクラスタ制御方法
JP2011123681A (ja) * 2009-12-10 2011-06-23 Canon Inc フェイルオーバー制御方法
JP2011203941A (ja) * 2010-03-25 2011-10-13 Nec Corp 情報処理装置、監視方法、および監視プログラム
JP2013186781A (ja) * 2012-03-09 2013-09-19 Nec Corp クラスタシステム
WO2015029139A1 (ja) * 2013-08-27 2015-03-05 株式会社東芝 データベースシステム、プログラムおよびデータ処理方法
JP2015191451A (ja) * 2014-03-28 2015-11-02 富士通株式会社 情報処理装置、制御方法および制御プログラム
JP2016151965A (ja) * 2015-02-18 2016-08-22 富士通株式会社 冗長構成システム及び冗長構成制御方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020173743A (ja) * 2019-04-15 2020-10-22 明京電機株式会社 障害監視復旧システム、その方法、およびそのプログラム
CN111835534A (zh) * 2019-04-15 2020-10-27 华为技术有限公司 一种集群控制的方法及相关设备
CN111835534B (zh) * 2019-04-15 2022-05-06 华为技术有限公司 一种用于集群控制的方法,网络设备,主控节点装置及计算机可读存储介质
JP7288662B2 (ja) 2019-04-15 2023-06-08 明京電機株式会社 障害監視復旧システム、その方法、およびそのプログラム
JP7458424B2 (ja) 2019-07-24 2024-03-29 シスコ テクノロジー,インコーポレイテッド 性能ルーティング測定を伴う双方向フォワーディング検出を提供するためのシステムおよび方法

Also Published As

Publication number Publication date
JP6838334B2 (ja) 2021-03-03

Similar Documents

Publication Publication Date Title
US10389824B2 (en) Service management modes of operation in distributed node service management
US9762669B2 (en) Service management roles of processor nodes in distributed node service management
EP2637102B1 (en) Cluster system with network node failover
US8112518B2 (en) Redundant systems management frameworks for network environments
US10331472B2 (en) Virtual machine service availability
US8898312B2 (en) Element terminal and communication system
JP6179101B2 (ja) 管理装置、管理方法、および管理プログラム
JP6838334B2 (ja) クラスタシステム、サーバ、サーバの動作方法、及びプログラム
JP7206981B2 (ja) クラスタシステム、その制御方法、サーバ、及びプログラム
JP6866927B2 (ja) クラスタシステム、クラスタシステムの制御方法、サーバ装置、制御方法、及びプログラム
CN110958151B (zh) 保活检测方法、装置、节点、存储介质及通信系统
JP6551111B2 (ja) 情報処理装置、ダウン判定方法、クラスタシステム、及びプログラム
JP5613119B2 (ja) マスター/スレーブシステム、制御装置、マスター/スレーブ切替方法、および、マスター/スレーブ切替プログラム
US10516625B2 (en) Network entities on ring networks
JP6790667B2 (ja) クラスタシステム、サーバ、動作方法、及びプログラム
JP4485560B2 (ja) コンピュータ・システム及びシステム管理プログラム
CN116339902A (zh) 超融合基础设施环境中的事件消息管理
WO2019171704A1 (ja) 管理サーバ、クラスタシステム、クラスタシステムの制御方法、及びプログラムが格納された非一時的なコンピュータ可読媒体
JP2012190101A (ja) クラスタシステム
US10122588B2 (en) Ring network uplink designation
JP2016009413A (ja) 網監視システムおよび網監視方法
JP6935819B2 (ja) ノード装置、回復動作制御方法、及び回復動作制御プログラム
JP6745767B2 (ja) 通信サービスシステムおよび系切り戻し方法
JP6111791B2 (ja) ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラム
CN117560268A (zh) 集群管理方法及相关装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210125

R150 Certificate of patent or registration of utility model

Ref document number: 6838334

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150