WO2019053939A1

WO2019053939A1 - ノード装置、回復動作制御方法、及び回復動作制御プログラムを格納する非一時的なコンピュータ可読媒体

Info

Publication number: WO2019053939A1
Application number: PCT/JP2018/018027
Authority: WO
Inventors: 展祥奥谷
Original assignee: 日本電気株式会社
Priority date: 2017-09-13
Filing date: 2018-05-10
Publication date: 2019-03-21
Also published as: US11150980B2; US20200272534A1; JPWO2019053939A1; JP6935819B2

Abstract

クラスタシステム内の複数のノード装置の間で時刻同期がとられていない場合でも回復動作によってすべてのノード装置が停止してしまうことを防止することができる、ノード装置、回復動作制御方法、及び回復動作制御プログラムを提供する。ノード装置（１０－１）は、クラスタシステム（１）におけるシステム障害を検知した場合、ノード装置（１０－１）が回避優先装置であるか否かを判定する。そして、ノード装置（１０－１）は、自ノード装置が回避優先装置であると判定された場合、ノード装置（１０－１）以外のノード装置（１０－２）に向けて、要求信号を送信する。要求信号は、ノード装置（１０－２）の正常状態及び異常状態に関する報告を要求する信号である。そして、ノード装置（１０－１）は、ノード装置（１０－２）からの報告に基づいて、自ノード装置の回復動作を実行するか又は自ノード装置の回復動作の実行を回避するかを決定する。

Description

ノード装置、回復動作制御方法、及び回復動作制御プログラムを格納する非一時的なコンピュータ可読媒体

　本発明は、ノード装置、回復動作制御方法、及び回復動作制御プログラムに関する。

　従来、継続的にサービスを提供するために、複数のノード装置（例えば、複数のコンピュータ）による連携構成を有するクラスタシステム（例えば、ＨＡ（High Availability）クラスタシステム）が提案されている（例えば、特許文献１）。特許文献１に開示されているクラスタシステムでは、クラスタ内で或る系に障害が発生した場合に、すべての系がリセットされることを防止するために、その障害を検知したクラスタ内の系が優先度に応じたリセット遅延時間に基づいて、リセットを発行する。

特開２００６－１１９９２号公報

　しかしながら、上記関連技術のクラスタシステムでは、予備系が障害系に対してリセット遅延時間に基づくタイミングでリセットを発行するため、クラスタシステム内の複数のノード装置の間で時刻同期している必要がある。このため、複数のノード装置の間で時刻同期が実現されていない場合、クラスタシステムにおいて障害が発生したときにクラスタシステムにおける複数のノード装置のすべてが回復動作（アプリケーション再起動、フェールオーバー、ノード停止など）を実行して、すべてのノード装置が停止してしまう可能性がある。

　本発明の目的は、クラスタシステム内の複数のノード装置の間で時刻同期がとられていない場合でも回復動作によってすべてのノード装置が停止してしまうことを防止することができる、ノード装置、回復動作制御方法、及び回復動作制御プログラムを提供することにある。

　本発明の第１の態様にかかるノード装置は、複数のノード装置による連携構成を有するクラスタシステムにおけるノード装置であって、自ノード装置がシステム障害を検知した場合、前記自ノード装置が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定する判定部と、前記クラスタシステムにおける前記自ノード装置以外の１つ又は複数の他ノード装置に向けて、各他ノード装置の正常状態及び異常状態に関する報告を要求する要求信号を送信する報告要求部と、前記判定部によって前記自ノード装置が前記回避優先装置であると判定された場合、前記報告要求部に対して前記要求信号を送信させ、前記１つ又は複数の他ノード装置からの前記報告に基づいて、前記自ノード装置の回復動作を実行するか又は前記自ノード装置の回復動作の実行を回避するかを決定する、回復動作制御部と、を具備する。

　本発明の第２の態様にかかる回復動作制御方法は、複数のノード装置による連携構成を有するクラスタシステムにおける第１ノード装置によって実行される回復動作制御方法であって、前記第１ノード装置がシステム障害を検知した場合、前記第１ノード装置が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定し、前記第１ノード装置が前記回避優先装置であると判定された場合、前記クラスタシステムにおける前記第１ノード装置以外の１つ又は複数の他ノード装置に向けて、各他ノード装置の正常状態及び異常状態に関する報告を要求する要求信号を送信し、前記１つ又は複数の他ノード装置からの前記報告に基づいて、前記第１ノード装置の回復動作を実行するか又は前記第１ノード装置の回復動作の実行を回避するかを決定する。

　本発明の第３の態様にかかる回復動作制御プログラムは、複数のノード装置による連携構成を有するクラスタシステムにおける第１ノード装置に、前記第１ノード装置がシステム障害を検知した場合、前記第１ノード装置が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定し、前記第１ノード装置が前記回避優先装置であると判定された場合、前記クラスタシステムにおける前記第１ノード装置以外の１つ又は複数の他ノード装置に向けて、各他ノード装置の正常状態及び異常状態に関する報告を要求する要求信号を送信し、前記１つ又は複数の他ノード装置からの前記報告に基づいて、前記第１ノード装置の回復動作を実行するか又は前記第１ノード装置の回復動作の実行を回避するかを決定する、処理を、実行させる。

　本発明により、クラスタシステム内の複数のノード装置の間で時刻同期がとられていない場合でも回復動作によってすべてのノード装置が停止してしまうことを防止することができる、ノード装置、回復動作制御方法、及び回復動作制御プログラムを提供することができる。

第１実施形態のクラスタシステムの一例を示す図である。第１実施形態のノード装置の一例を示すブロック図である。第１実施形態のノード装置の処理動作の一例を示すフローチャートである。第２実施形態のクラスタシステムの一例を示す図である。第２実施形態のノード装置の一例を示すブロック図である。第３実施形態のクラスタシステムの一例を示す図である。第３実施形態のノード装置の一例を示すブロック図である。第３実施形態のノード装置のハートビート送信処理の一例を示すフローチャートである。第３実施形態のノード装置の異常検出処理の一例を示すフローチャートである。第３実施形態のノード装置の回復動作の制御処理の一例を示すフローチャートである。ノード装置のハードウェア構成例を示す図である。

　以下、図面を参照しつつ、実施形態について説明する。なお、実施形態において、同一又は同等の要素には、同一の符号を付し、重複する説明は省略される。

＜第１実施形態＞
　＜クラスタシステムの概要＞
　図１は、第１実施形態のクラスタシステムの一例を示す図である。図１において、クラスタシステム１は、通信ネットワークＮ１を介して互いに接続されている、複数のノード装置１０を有している。ノード装置１０－１，１０－２は、継続的にサービスを提供するために、連携している。ここでは、クラスタシステム１はノード装置１０－１，１０－２の２つを有しているが、クラスタシステム１に含まれるノード装置１０の数は、２つに限定されるものではない。ノード装置１０－１，１０－２は、互いに同じ構成を有している。以下では、ノード装置１０－１，１０－２を総称して、ノード装置１０と呼ぶことがある。ノード装置１０－１，１０－２のうちの１つのノード装置１０は、「回避優先装置」として設定されている一方、他のノード装置１０は、回避優先装置ではない。ここでは、ノード装置１０－１が「回避優先装置」として設定されているものとする。

　ノード装置１０－１は、クラスタシステム１におけるシステム障害を検知した場合、ノード装置１０－１が「回避優先装置」であるか否かを判定する。「回避優先装置」は、自ノード装置が回復動作の実行よりも回復動作を回避することを優先する装置である。ここでは、ノード装置１０－１が「回避優先装置」として設定されていることを前提としているので、ノード装置１０－１は、自ノード装置が回避優先装置であると判定する。一方で、ノード装置１０－２も、クラスタシステム１におけるシステム障害を検知した場合、ノード装置１０－１が「回避優先装置」であるか否かを判定するが、自ノード装置は回避優先装置ではないと判定することになる。

　そして、ノード装置１０－１は、自ノード装置が回避優先装置であると判定された場合、ノード装置１０－１以外のノード装置１０、つまり、ノード装置１０－２に向けて、「要求信号」を送信する。「要求信号」は、ノード装置１０－２の正常状態及び異常状態に関する報告を要求する信号である。

　そして、ノード装置１０－１は、ノード装置１０－２からの報告に基づいて、自ノード装置の回復動作を実行するか又は自ノード装置の回復動作の実行を回避するかを決定する。

　以上のようにクラスタシステム１において、ノード装置１０－１は、クラスタシステム１におけるシステム障害を検知した場合、ノード装置１０－１が「回避優先装置」であるか否かを判定する。そして、ノード装置１０－１は、自ノード装置が回避優先装置であると判定された場合、ノード装置１０－１以外のノード装置１０－２に向けて、「要求信号」を送信する。そして、ノード装置１０－１は、ノード装置１０－２からの報告に基づいて、自ノード装置の回復動作を実行するか又は自ノード装置の回復動作の実行を回避するかを決定する。

　このクラスタシステム１の構成により、ノード装置１０－１がノード装置１０－２からの報告に基づいて、自ノード装置の回復動作を実行するか又は自ノード装置の回復動作の実行を回避するかを決定するので、すべてのノード装置が回復動作によって停止してしまうことを防止することができる。また、ノード装置１０－１がクラスタシステム１におけるシステム障害を検知し且つノード装置１０－１が回避優先装置である場合、ノード装置１０－１が「要求信号」を送信してノード装置１０－２の状態を確認するので、ノード装置間で時刻同期がとられていない場合でも、すべてのノード装置が回復動作によって停止してしまうことを防止することができる。

　＜ノード装置の構成例＞
　図２は、第１実施形態のノード装置の一例を示すブロック図である。図２において、ノード装置１０は、制御部１１を有する。制御部１１は、システム障害監視部１２と、判定部１３と、報告要求部１４と、回復動作制御部１５と、報告送信部１６とを有している。

　システム障害監視部１２は、自ノード装置１０及び通信ネットワークＮ１における障害（つまり、システム障害）を監視する。なお、ここでは、ノード装置１０－１の機能部（例えば、システム障害監視部１２）にとって、自ノード装置１０はノード装置１０－１を意味し、他ノード装置１０はノード装置１０－２を意味する。

　判定部１３は、システム障害監視部１２によってシステム障害が検知された場合、自ノード装置１０が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定する。

　回復動作制御部１５は、判定部１３によって自ノード装置１０が回避優先装置であると判定された場合、報告要求部１４に対して要求信号を自ノード装置１０以外の他ノード装置１０に向けて送信させる。そして、回復動作制御部１５は、他ノード装置１０からの報告に基づいて、自ノード装置１０の回復動作を実行するか又は自ノード装置１０の回復動作の実行を回避するかを決定する。例えば、回復動作制御部１５は、他ノード装置１０からの報告が他ノード装置１０の正常状態を示している場合、回復動作を実行すると決定する一方、他ノード装置１０からの報告が他ノード装置１０の異常状態を示している場合、回復動作の実行を回避すると決定する。

　報告要求部１４は、回復動作制御部１５による制御に従って、要求信号を自ノード装置１０以外の他ノード装置１０に向けて送信する。

　報告送信部１６は、自ノード装置１０が回避優先装置でなく且つ回避優先装置である他ノード装置１０から要求信号を受け取った場合、報告を他ノード装置１０に向けて送信する。例えば、報告送信部１６は、システム障害監視部１２がシステム障害を検知している場合、自ノード装置１０が異常状態にあることを示す報告を送信する一方、システム障害監視部１２がシステム障害を検知していない場合、自ノード装置１０が正常状態にあることを示す報告を送信する。

　＜ノード装置の動作例＞
　以上の構成を有するノード装置１０の処理動作の一例について説明する。図３は、第１実施形態のノード装置の処理動作の一例を示すフローチャートである。以下では、ノード装置１０－１を例にとって説明する。

　ノード装置１０－１においてシステム障害監視部１２は、システム障害を検知したか否かを繰り返し判定する（ステップＳ１０１ＮＯ）。

　システム障害監視部１２によってシステム障害が検知された場合（ステップＳ１０１ＹＥＳ）、判定部１３は、自ノード装置１０（つまり、ノード装置１０－１）が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定する（ステップＳ１０２）。

　回復動作制御部１５は、判定部１３によって自ノード装置１０（つまり、ノード装置１０－１）が回避優先装置であると判定された場合（ステップＳ１０２ＹＥＳ）、報告要求部１４に対して要求信号を自ノード装置１０以外の他ノード装置１０（つまり、ノード装置１０－２）に向けて送信させる（ステップＳ１０３）。

　回復動作制御部１５は、他ノード装置１０（つまり、ノード装置１０－２）からの報告を待って（ステップＳ１０４ＮＯ）、他ノード装置１０からの報告を受け取った場合（ステップＳ１０４ＹＥＳ）、他ノード装置１０（つまり、ノード装置１０－２）からの報告が正常状態を示しているか否かを判定する（ステップＳ１０５）。

　他ノード装置１０（つまり、ノード装置１０－２）からの報告が正常状態を示している場合（ステップＳ１０５ＹＥＳ）、回復動作制御部１５は、回復動作を実行すると決定する（ステップＳ１０６）。そして、回復動作が実行されて図３のフローが一度終了し、再度、図３のフローがスタートする。

　他ノード装置１０（つまり、ノード装置１０－２）からの報告が正常状態を示していない場合、つまり、他ノード装置１０からの報告が異常状態を示している場合（ステップＳ１０５ＮＯ）、回復動作制御部１５は、回復動作の実行を回避すると決定する（ステップＳ１０７）。そして、フローは、ステップＳ１０１に戻る。

　ここで、判定部１３によって自ノード装置１０が回避優先装置でないと判定された場合（ステップＳ１０２ＮＯ）、回復動作制御部１５は、報告要求部１４に対して要求信号を送信させずに、回復動作を実行すると決定する（ステップＳ１０６）。すなわち、回避優先装置に設定されていないノード装置１０－２では、このような処理が実行されることになる。これにより、障害検出から回復動作の実行までの時間をできるだけ短くするというクラスタシステムの要求を満たすことができる。

　以上のように第１実施形態によれば、ノード装置１０－１において判定部１３は、システム障害監視部１２によってシステム障害が検知された場合、ノード装置１０－１が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定する。回復動作制御部１５は、判定部１３によってノード装置１０－１が回避優先装置であると判定された場合、報告要求部１４に対して要求信号をノード装置１０－１以外のノード装置１０－２に向けて送信させる。

　このノード装置１０－１の構成により、ノード装置１０－２からの報告に基づいて、ノード装置１０－１の回復動作を実行するか又はノード装置１０－１の回復動作の実行を回避するかを決定するので、すべてのノード装置１０が回復動作によって停止してしまうことを防止することができる。また、ノード装置１０－１がクラスタシステム１におけるシステム障害を検知し且つノード装置１０－１が回避優先装置である場合、ノード装置１０－１が「要求信号」を送信してノード装置１０－２の状態を確認するので、ノード装置１０－１，１０－２間で時刻同期がとられていない場合でも、すべてのノード装置１０－１，１０－２が回復動作によって停止してしまうことを防止することができる。また、ノード装置１０－１が「要求信号」を送信してノード装置１０－２の状態を確認するので、ノード装置１０－２の死活監視だけでなく（つまり、ノード装置１０－２の生死）だけでなく、ノード装置１０－２の個別リソースの障害状況（つまり、ノード装置１０－２は生きているが、業務で利用するリソースが正常か異常か）について確認することができる。

　＜変形例＞
　＜１＞以上の説明では、クラスタシステム１に含まれるノード装置１０が２つであることを前提に説明を行ったが、クラスタシステム１に含まれるノード装置１０が３つ以上である場合には、回復動作制御部１５は次のような処理を実行することができる。すなわち、回復動作制御部１５は、複数の他ノード装置１０のうちの少なくとも１つの他ノード装置１０からの報告が正常状態を示す場合、自ノード装置１０の回復動作の実行を制御する一方、複数の他ノード装置１０からのすべての報告が異常状態を示す場合、自ノード装置１０の回復動作の実行を回避してもよい。

　＜２＞以上の説明では、クラスタシステム１に含まれるノード装置１０が２つであることを前提に説明を行ったが、クラスタシステム１に含まれるノード装置１０が３つ以上である場合には、判定部１３は次のような処理を実行することができる。すなわち、クラスタシステム１に含まれる複数のノード装置１０のうちで起動状態にある自ノード装置１０を含む複数の起動ノード装置の中で、自ノード装置１０に割り当てられている「回避優先度」が自ノード装置１０以外のいずれの起動ノードに割り当てられている回避優先度よりも高い場合に、自ノード装置１０が回避優先装置であると判定する。例えば、クラスタシステム１に５つのノード装置１０が含まれる場合、該５つのノード装置１０に対して回避優先度１～５がそれぞれ設定される。そして、今、回避優先度２，４，５の３つのノード装置１０が起動状態にあり、回避優先度１，４のノード装置１０が停止状態にある場合、回避優先度２のノード装置１０の判定部１３だけが、自ノード装置１０が回避優先装置であると判定することになる。

＜第２実施形態＞
　＜クラスタシステムの概要＞
　図４は、第２実施形態のクラスタシステムの一例を示す図である。図４において、クラスタシステム２は、ノード装置２０－１，２０－２と、ノード装置２０－１，２０－２にそれぞれ装着されたＮＩＣ（ネットワークインタフェースカード）３０－１，３０－２と、ＮＩＣ３０－１，３０－２を介してノード装置２０－１とノード装置２０－２との間を接続するＨＵＢ（ネットワーク装置）４０とを有している。ノード装置２０－１とノード装置２０－２とは、第１実施形態のノード装置１０－１，１０－２と同様に、通信ネットワークＮ１によって接続されている。第２実施形態の通信ネットワークＮ１は、第１通信ルートＲ１と第２通信ルートＲ２とを有している。図４において、ＮＩＣ３０－１、ＨＵＢ４０、及びＮＩＣ３０－２を含むルートが、第１通信ルートＲ１である。

　ノード装置２０－１とノード装置２０－２とは、互いに同じ構成を有している。以下では、ノード装置２０－１，２０－２を総称して、ノード装置２０と呼ぶことがある。ノード装置２０－１，２０－２のうちの１つのノード装置２０は、「回避優先装置」として設定されている一方、他のノード装置２０は、回避優先装置ではない。ここでは、ノード装置２０－１が「回避優先装置」として設定されているものとする。

　＜ノード装置の構成例＞
　図５は、第２実施形態のノード装置の一例を示すブロック図である。図５において、ノード装置２０は、制御部２１を有している。制御部２１は、システム障害監視部２２と、判定部２３と、報告要求部２４と、回復動作制御部２５と、報告送信部２６とを有している。

　システム障害監視部２２は、第１実施形態のシステム障害監視部１２と同様に、自ノード装置２０及び通信ネットワークＮ１における障害（つまり、システム障害）を監視する。なお、ここでは、ノード装置２０－１の機能部（例えば、システム障害監視部２２）にとって、自ノード装置２０はノード装置２０－１を意味し、他ノード装置２０はノード装置２０－２を意味する。

　システム障害監視部２２は、例えば、自ノード装置２０に装着されているＮＩＣ３０の障害及びＨＵＢ４０の障害、つまり、第１通信ルートＲ１の障害を監視している。第１通信ルートＲ１の障害としては、例えば、ＮＩＣ３０に繋がるＬＡＮケーブルの断線、及び、ＨＵＢ４０の故障が含まれ、いずれの場合も、システム障害監視部２２は、ＮＩＣ３０のリンク断線として検知する。

　ここで、ノード装置２０－１に装着されているＮＩＣ３０－１で障害が発生した場合、ノード装置２０－１のシステム障害監視部２２では、障害が検知される一方で、ノード装置２０－２のシステム障害監視部２２では、障害が検知されない。従って、ＮＩＣ３０－１で障害が発生した場合、ノード装置２０－２は回復動作を実行しないので、クラスタシステム２のすべてのノード装置２０が停止することはない。これに対して、ＨＵＢ４０で障害が発生した場合、ノード装置２０－１のシステム障害監視部２２及びノード装置２０－２のシステム障害監視部２２の両方によって、障害が検知される。従って、ノード装置２０－１，２０－２の両方にて回復動作が実行されてしまうと問題となる。

　判定部２３は、システム障害監視部２２で第１通信ルートＲ１の障害が検知された場合、自ノード装置２０が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定する。

　回復動作制御部２５は、判定部２３によって自ノード装置２０が回避優先装置であると判定された場合、報告要求部２４に対して要求信号を自ノード装置２０以外の他ノード装置２０に向けて、第２通信ルートＲ２を介して送信させる。そして、回復動作制御部２５は、他ノード装置２０からの報告に基づいて、自ノード装置２０の回復動作を実行するか又は自ノード装置２０の回復動作の実行を回避するかを決定する。

　報告要求部２４は、回復動作制御部２５による制御に従って、要求信号を自ノード装置２０以外の他ノード装置２０に向けて、第２通信ルートＲ２を介して送信する。

　報告送信部２６は、自ノード装置２０が回避優先装置でなく且つ回避優先装置である他ノード装置２０から要求信号を第２通信ルートＲ２を介して受け取った場合、報告を他ノード装置１０に向けて第２通信ルートＲ２を介して送信する。

　以上のように第２実施形態によれば、ノード装置２０－１において判定部２３は、第１通信ルートＲ１の障害が検知された場合、ノード装置２０－１が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定する。そして、回復動作制御部２５は、判定部２３によってノード装置２０－１が回避優先装置であると判定された場合、報告要求部２４に対して要求信号をノード装置２０－２に向けて、第２通信ルートＲ２を介して送信させる。そして、回復動作制御部２５は、ノード装置２０－２からの報告に基づいて、ノード装置２０－１の回復動作を実行するか又はノード装置２０－１の回復動作の実行を回避するかを決定する。

　このノード装置２０－１の構成により、ノード装置２０－１及びノード装置２０－２の両方によって検知される第１通信ルートＲ１の障害が発生した場合でも、ノード装置２０－１及びノード装置２０－２の両方が回復動作のために停止してしまうことを防止することができる。

＜第３実施形態＞
　＜クラスタシステムの概要＞
　図６は、第３実施形態のクラスタシステムの一例を示す図である。図６において、クラスタシステム３は、ノード装置５０－１，５０－２と、ノード装置５０－１，５０－２にそれぞれ装着されたＮＩＣ（ネットワークインタフェースカード）３０－１，３０－２と、ＮＩＣ３０－１，３０－２を介してノード装置５０－１とノード装置５０－２との間を接続するＨＵＢ（ネットワーク装置）４０とを有している。ノード装置５０－１とノード装置５０－２とは、第２実施形態のノード装置２０－１，２０－２と同様に、通信ネットワークＮ１によって接続されている。

　ノード装置５０－１とノード装置５０－２とは、互いに同じ構成を有している。以下では、ノード装置５０－１，５０－２を総称して、ノード装置５０と呼ぶことがある。ノード装置５０－１，５０－２のうちの１つのノード装置５０は、「回避優先装置」として設定されている一方、他のノード装置５０は、回避優先装置ではない。ここでは、ノード装置５０－１が「回避優先装置」として設定されているものとする。

　＜ノード装置の構成例＞
　図７は、第３実施形態のノード装置の一例を示すブロック図である。図７において、ノード装置５０は、制御部５１を有している。制御部５１は、システム障害監視部５２と、判定部５３と、報告要求部５４と、回復動作制御部５５と、報告送信部５６と、ハートビート制御部５７とを有している。ハートビート制御部５７は、ハートビート送信部５７Ａと、ハートビート受信部５７Ｂと、異常検出部５７Ｃとを有している。

　システム障害監視部５２は、第２実施形態のシステム障害監視部２２と同様に、自ノード装置５０及び通信ネットワークＮ１における障害（つまり、システム障害）を監視する。システム障害監視部５２は、例えば、自ノード装置５０に装着されているＮＩＣ３０の障害及びＨＵＢ４０の障害、つまり、第１通信ルートＲ１の障害を監視している。ここでは、ノード装置５０－１の機能部（例えば、システム障害監視部２２）にとって、自ノード装置５０はノード装置５０－１を意味し、他ノード装置５０はノード装置５０－２を意味する。

　判定部５３は、第２実施形態の判定部２３と同様に、システム障害監視部２２によって例えば第１通信ルートＲ１の障害が検知された場合、自ノード装置５０が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定する。

　ハートビート送信部５７Ａは、第１通信ルートＲ１及び第２通信ルートＲ２のそれぞれを介して、ハートビート信号を所定周期で送信する。

　ハートビート受信部５７Ｂは、他ノード装置５０から送信されたハートビート信号を第１通信ルートＲ１及び第２通信ルートＲ２を介して受信する。

　異常検出部５７Ｃは、他ノード装置５０からハートビート信号を所定周期で受信しない場合、他ノード装置５０が異常であることを検出する。一方で、異常検出部５７Ｃは、他ノード装置５０からハートビート信号を所定周期で受信する場合、他ノード装置５０が正常であることを検出する。

　回復動作制御部５５は、判定部５３によって自ノード装置５０が回避優先装置であると判定され且つ異常検出部５７Ｃによって他ノード装置５０が正常であると検出された場合、報告要求部５４に対して要求信号を他ノード装置５０に向けて第２通信ルートＲ２を介して送信させる。そして、回復動作制御部５５は、他ノード装置５０からの報告に基づいて、自ノード装置５０の回復動作を実行するか又は自ノード装置５０の回復動作の実行を回避するかを決定する。

　また、回復動作制御部５５は、判定部５３によって自ノード装置５０が回避優先装置であると判定され且つ異常検出部５７Ｃによって他ノード装置５０が異常であると検出された場合、報告要求部５４に対して要求信号を送信させずに、自ノード装置５０の回復動作の実行を回避することを決定する。これにより、制御部５１の処理負荷をできるだけ小さくするというクラスタシステムの要求を満たすことができる。また、報告要求部５４に対して要求信号を送信させずに、自ノード装置５０の回復動作の実行を回避することを決定するので、遅延無く決定を行うことができる。

　報告要求部５４は、回復動作制御部５５による制御に従って、要求信号を自ノード装置５０以外の他ノード装置５０に向けて、第２通信ルートＲ２を介して送信する。

　報告送信部５６は、自ノード装置５０が回避優先装置でなく且つ回避優先装置である他ノード装置５０から要求信号を第２通信ルートＲ２を介して受け取った場合、報告を他ノード装置５０に向けて第２通信ルートＲ２を介して送信する。

　＜ノード装置の動作例＞
　以上の構成を有するノード装置５０の処理動作の一例について説明する。図８～図１０は、第３実施形態のノード装置の処理動作の一例を示すフローチャートである。

　〈ハートビート送信処理〉
　図８は、第３実施形態のノード装置のハートビート送信処理の一例を示すフローチャートである。

　ハートビート送信部５７Ａは、第１通信ルートＲ１及び第２通信ルートＲ２のそれぞれを介してハートビート信号を送信すると共に、ハートビート送信部５７Ａが有している送信タイマ（図示せず）をスタートさせる（ステップＳ２０１）。

　ハートビート送信部５７Ａは、ハートビート信号の送信タイミングからの経過時間がハートビート送信間隔値に到達するまで待つ（ステップＳ２０２ＮＯ）。

　そして、経過時間がハートビート送信間隔値に到達すると（ステップＳ２０２ＹＥＳ）、処理ステップは、ステップＳ２０１に戻る。すなわち、ハートビート送信部５７Ａは、第１通信ルートＲ１及び第２通信ルートＲ２のそれぞれを介してハートビート信号を送信すると共に、ハートビート送信部５７Ａが有している送信タイマ（図示せず）をリセットする。

　以上のようにして、ハートビート送信部５７Ａは、第１通信ルートＲ１及び第２通信ルートＲ２のそれぞれを介して、ハートビート信号を所定周期で送信する。

　〈他ノード装置の異常検出処理〉
　図９は、第３実施形態のノード装置の異常検出処理の一例を示すフローチャートである。この異常検出処理は、上記のハートビート送信処理と並行して実行される。

　異常検出部５７Ｃは、他ノード装置５０からのハートビート信号を受信するまで待つ（ステップＳ３０１ＮＯ）。

　他ノード装置５０からのハートビート信号を受信すると（ステップＳ３０１ＹＥＳ）、異常検出部５７Ｃは、他ノード装置５０のステータス情報を「正常」に更新すると共に、異常検出部５７Ｃが有している受信タイマ（図示せず）をスタートさせる（ステップＳ３０２）。

　次いで、異常検出部５７Ｃは、受信タイミングからの経過時間がハートビート送信間隔値よりも所定値以上超えたか否かを判定する（ステップＳ３０３）。なお、所定値は、ゼロ又は正の値である。

　経過時間がハートビート送信間隔値よりも所定値以上超えていない場合（ステップＳ３０３ＮＯ）、異常検出部５７Ｃは、他ノード装置５０からのハートビート信号を受信したか否かを判定する（ステップＳ３０４）。

　他ノード装置５０からのハートビート信号を受信していない場合（ステップＳ３０４ＮＯ）、処理ステップは、ステップＳ３０３に戻る。

　他ノード装置５０からのハートビート信号を受信した場合（ステップＳ３０４ＹＥＳ）、処理ステップは、ステップＳ３０２に戻る。

　すなわち、異常検出部５７Ｃは、受信タイミングからの経過時間がハートビート送信間隔値よりも所定値以上超えるまで他ノード装置５０からのハートビート信号の受信を待つ（ステップＳ３０３ＮＯ、ステップＳ３０４ＮＯ）。そして、異常検出部５７Ｃは、経過時間がハートビート送信間隔値よりも所定値以上超える前に他ノード装置５０からのハートビート信号を受信すると（ステップＳ３０３ＮＯ、ステップＳ３０４ＹＥＳ）、他ノード装置５０のステータス情報を「正常」に更新すると共に、受信タイマ（図示せず）をリセットする（ステップＳ３０２）。

　経過時間がハートビート送信間隔値よりも所定値以上超える前に他ノード装置５０からのハートビート信号を受信することなしに、経過時間がハートビート送信間隔値よりも所定値以上超えた場合（ステップＳ３０３ＹＥＳ）、異常検出部５７Ｃは、他ノード装置５０のステータス情報を「異常」に更新する（ステップＳ３０５）。そして、処理ステップは、ステップＳ３０１に戻る。

　〈回復動作の制御処理〉
　図１０は、第３実施形態のノード装置の回復動作の制御処理の一例を示すフローチャートである。この回復動作の制御処理は、上記の他ノード装置の異常検出処理と並列して実行される。

　ステップＳ４０１，Ｓ４０２の処理動作は、図３のステップＳ１０１，１０２と同じである。

　回復動作制御部５５は、判定部５３によって自ノード装置５０が回避優先装置であると判定された場合（ステップＳ４０２ＹＥＳ）、ハートビート信号に基づいて他ノード装置５０の異常が検出されているか否かを判定する（ステップＳ４０３）。すなわち、回復動作制御部５５は、図９の異常検出処理で更新されるステータス情報を参照して、他ノード装置５０が異常であるか否かを判定する。

　ハートビート信号に基づいて他ノード装置５０の異常が検出されていない場合（ステップＳ４０３ＮＯ）、回復動作制御部５５は、報告要求部５４に対して要求信号を自ノード装置５０以外の他ノード装置５０に向けて送信させる（ステップＳ４０４）。ステップＳ４０４からステップＳ４０８の処理動作は、図３のステップＳ１０３からステップＳ１０７と同じである。

　これに対して、ハートビート信号に基づいて他ノード装置５０の異常が検出されている場合（ステップＳ４０３ＹＥＳ）、回復動作制御部５５は、報告要求部５４に対して要求信号を送信させずに、自ノード装置５０の回復動作の実行を回避することを決定する（ステップＳ４０８）。

　以上のように第３実施形態によれば、ノード装置５０－１において回復動作制御部５５は、判定部５３によってノード装置５０－１が回避優先装置であると判定され且つ異常検出部５７Ｃによってノード装置５０－２の異常が検出されている場合、報告要求部５４に対して要求信号を送信させずに、ノード装置５０－１の回復動作の実行を回避することを決定する。

　このノード装置５０－１により、制御部５１の処理負荷をできるだけ小さくするというクラスタシステムの要求を満たすことができる。

　＜他の実施形態＞
　図１１は、ノード装置のハードウェア構成例を示す図である。図１１においてノード装置１００は、プロセッサ１０１と、メモリ１０２とを有している。第１実施形態から第３実施形態のノード装置１０，２０，５０の制御部１１，２１，５１は、プロセッサ１０１がメモリ１０２に記憶されたプログラムを読み込んで実行することにより実現される。また、該プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（ｔａｎｇｉｂｌｅ　ｓｔｏｒａｇｅ　ｍｅｄｉｕｍ）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Ｐｒｏｇｒａｍｍａｂｌｅ　ＲＯＭ）、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　ＰＲＯＭ）、フラッシュＲＯＭ、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　以上、実施の形態を参照して本願発明を説明したが、本願発明は上記によって限定されるものではない。本願発明の構成や詳細には、発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０１７年９月１３日に出願された日本出願特願２０１７－１７５５０５を基礎とする優先権を主張し、その開示の全てをここに取り込む。

１，２，３　クラスタシステム
１０，２０，５０　ノード装置
１１，２１，５１　制御部
１２，２２，５２　システム障害監視部
１３，２３，５３　判定部
１４，２４，５４　報告要求部
１５，２５，５５　回復動作制御部
１６，２６，５６　報告送信部
５７　ハートビート制御部
５７Ａ　ハートビート送信部
５７Ｂ　ハートビート受信部
５７Ｃ　異常検出部

Claims

　複数のノード装置による連携構成を有するクラスタシステムにおけるノード装置であって、
　自ノード装置がシステム障害を検知した場合、前記自ノード装置が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定する判定手段と、
　前記クラスタシステムにおける前記自ノード装置以外の１つ又は複数の他ノード装置に向けて、各他ノード装置の正常状態及び異常状態に関する報告を要求する要求信号を送信する報告要求手段と、
　前記判定手段によって前記自ノード装置が前記回避優先装置であると判定された場合、前記報告要求手段に対して前記要求信号を送信させ、前記１つ又は複数の他ノード装置からの前記報告に基づいて、前記自ノード装置の回復動作を実行するか又は前記自ノード装置の回復動作の実行を回避するかを決定する、回復動作制御手段と、
　を具備するノード装置。
　前記複数のノード装置が、第１通信ルート及び第２通信ルートによって互いに接続された、第１ノード装置及び第２ノード装置であり、且つ、前記自ノード装置が、前記第１ノード装置であるとき、
　前記判定手段は、前記第１ノード装置が前記システム障害として前記第１通信ルートの通信障害を検知した場合、前記第１ノード装置が前記回避優先装置であるか否かを判定し、
　前記回復動作制御手段は、前記判定手段によって前記第１ノード装置が前記回避優先装置であると判定された場合、前記報告要求手段に対して前記要求信号を前記第２ノード装置に向けて前記第２通信ルートを介して送信させ、前記第２ノード装置からの前記報告に基づいて、前記第１ノード装置の回復動作を実行するか又は前記第１ノード装置の回復動作の実行を回避するかを決定する、
　請求項１に記載のノード装置。
　前記第１通信ルート及び第２通信ルートのそれぞれを介して前記第２ノード装置から送信されるハートビート信号に基づいて、前記第２ノード装置が正常であるか異常であるかを検出する検出手段をさらに具備し、
　前記回復動作制御手段は、
　前記判定手段によって前記第１ノード装置が前記回避優先装置であると判定され且つ前記検出手段によって前記第２ノード装置が正常であると検出されている場合、前記報告要求手段に対して前記要求信号を前記第２ノード装置に向けて前記第２通信ルートを介して送信させ、前記第２ノード装置からの前記報告に基づいて、前記第１ノード装置の回復動作を実行するか又は前記第１ノード装置の回復動作の実行を回避するかを決定し、
　前記判定手段によって前記第１ノード装置が前記回避優先装置であると判定され且つ前記検出手段によって前記第２ノード装置が異常であると検出されている場合、前記報告要求手段に対して前記要求信号を送信させずに、前記第１ノード装置の回復動作の実行を回避することを決定する、
　請求項２記載のノード装置。
　前記回復動作制御手段は、前記１つ又は複数の他ノード装置のうちの少なくとも１つの他ノード装置からの前記報告が正常状態を示す場合、前記自ノード装置の回復動作の実行を制御する一方、前記１つ又は複数の他ノード装置からのすべての前記報告が異常状態を示す場合、前記自ノード装置の回復動作の実行を回避する、
　請求項１記載のノード装置。
　前記判定手段は、前記複数のノード装置のうちで起動状態にある前記自ノード装置を含む複数の起動ノード装置の中で、前記自ノード装置に割り当てられている回避優先度が前記自ノード装置以外のいずれの起動ノード装置に割り当てられている回避優先度よりも高い場合に、前記自ノード装置が前記回避優先装置であると判定する、
　請求項４記載のノード装置。
　複数のノード装置による連携構成を有するクラスタシステムにおける第１ノード装置によって実行される回復動作制御方法であって、
　前記第１ノード装置がシステム障害を検知した場合、前記第１ノード装置が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定し、
　前記第１ノード装置が前記回避優先装置であると判定された場合、前記クラスタシステムにおける前記第１ノード装置以外の１つ又は複数の他ノード装置に向けて、各他ノード装置の正常状態及び異常状態に関する報告を要求する要求信号を送信し、
　前記１つ又は複数の他ノード装置からの前記報告に基づいて、前記第１ノード装置の回復動作を実行するか又は前記第１ノード装置の回復動作の実行を回避するかを決定する、
　回復動作制御方法。
　複数のノード装置による連携構成を有するクラスタシステムにおける第１ノード装置に、
　前記第１ノード装置がシステム障害を検知した場合、前記第１ノード装置が回復動作の実行よりも回復動作を回避することを優先する回避優先装置であるか否かを判定し、
　前記第１ノード装置が前記回避優先装置であると判定された場合、前記クラスタシステムにおける前記第１ノード装置以外の１つ又は複数の他ノード装置に向けて、各他ノード装置の正常状態及び異常状態に関する報告を要求する要求信号を送信し、
　前記１つ又は複数の他ノード装置からの前記報告に基づいて、前記第１ノード装置の回復動作を実行するか又は前記第１ノード装置の回復動作の実行を回避するかを決定する、
　処理を、実行させる、回復動作制御プログラムを格納する非一時的なコンピュータ可読媒体。