JPH07319836A

JPH07319836A - 障害監視方式

Info

Publication number: JPH07319836A
Application number: JP6116216A
Authority: JP
Inventors: Natsuo Tanaka; 夏朗田中
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1994-05-30
Filing date: 1994-05-30
Publication date: 1995-12-08

Abstract

(57)【要約】【目的】プロセッサ数の非常に多い並列コンピュータや
クラスタシステムにおいて、プロセッサ数が数百個以上
と多くても、障害検知の遅延を発生させないことを目的
とした。【構成】図１は本発明の一実施例を示す並列コンピュー
タシステムの構成図である。１１は並列コンピュータシ
ステムを構成するプロセッサ、１２はプロセッサを接続
するプロセッサ間ネットワーク、１３は並列コンピュー
タシステムである。【効果】並列コンピュータシステムあるいはクラスタシ
ステムとしてはプロセッサ数は多いが、プロセッサをグ
ループ分けし階層化することにより、障害検知の遅延を
防ぐことができるとともに、システム全体の一元管理も
可能である。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、プロセッサ数が非常に
多く、全てのプロセッサの障害を監視し、障害発生を迅
速に検知する必要のある並列コンピュータシステムやサ
ーバ／ＷＳをネットワークで接続したクラスタシステム
において好適な障害監視方式に関する。

【０００２】

【従来の技術】従来、プロセッサが多数組み込まれた並
列コンピュータは信頼性を考慮して設計されたものでは
なく、よって障害監視機能を実現しているものではな
い。

【０００３】またサーバ／ＷＳをネットワークで接続し
たクラスタシステムにおいて、複数の現用サーバを１台
の監視サーバが監視する場合、監視サーバが全ての現用
サーバからａｌｉｖｅメッセージを受け取り正常である
ことを確認していたが、現用サーバの台数は１０台程度
であり、監視サーバの負荷も小さかった。また現用サー
バと予備サーバのペアを作り、そのペアを複数化するこ
とでクラスタシステムとして構成する方式もあるが、プ
ロセッサ数が多くなるとペアも多くなり、システム全体
の管理が困難になった。

【０００４】

【発明が解決しようとする課題】前記、従来技術におけ
る並列コンピュータあるいはクラスタシステムにおいて
複数の現用サーバを１台の監視プロセッサが監視する場
合、現用プロセッサ／サーバ数が多くなる(数十台〜数
千台)と監視プロセッサ／サーバが監視する現用プロセ
ッサ／サーバも多くなり、全ての現用プロセッサからａ
ｌｉｖｅメッセージを受信すると、監視パスのトラフィ
ックの増大によるａｌｉｖｅメッセージの到着遅れ、監
視プロセッサ／サーバの負荷増大による処理(障害検知
／判断)の遅れが発生するという問題があった。

【０００５】本発明の目的は、並列コンピュータシステ
ムや、大規模なクラスタシステムにおいて、プロセッサ
／サーバ数の増大に対しても障害検知の遅延を発生させ
ずにシステム全体として管理も同時に行い、更に処理す
る業務の重要度に応じた障害監視を行うことにある。

【０００６】

【課題を解決するための手段】本発明によれば、監視プ
ロセッサのメモリ上に状態管理テーブルを設け、多数の
プロセッサの内の１つをシステム全体の全プロセッサの
状態を管理する監視元プロセッサとして設定し、残りの
多数のプロセッサを少数のプロセッサのグループに分
け、そのグループ内のプロセッサの１つをグループ内の
他のプロセッサを監視するグループ内監視プロセッサと
して設定し、グループ内監視プロセッサはグループ内の
他プロセッサだけからａｌｉｖｅメッセージをある一定
間隔で受信することにより正常に動作していることを確
認し、監視元プロセッサは、他の全プロセッサからでは
なく、各グループのグループ内監視プロセッサからのみ
ａｌｉｖｅメッセージを受信することにより、監視パス
のトラフィックの集中化を回避し、監視元プロセッサの
負荷増大による処理の遅れ、すなわち障害検知／判断の
遅れを防ぐことができる。

【０００７】また本発明によれば、監視元プロセッサと
グループ内監視プロセッサの状態管理テーブルには、各
プロセッサからのａｌｉｖｅメッセージ受信時間時刻と
受信時刻から障害と判断するまでの許容時間を各プロセ
ッサ毎に設定することにより、各プロセッサで処理する
業務の内容／重要度によって重要な業務については早く
障害と判断し、系切り替え等の処理により業務を再開す
ることができる。

【０００８】

【作用】グループ内監視プロセッサは、各グループ内の
プロセッサからある一定間隔で送信されたａｌｉｖｅメ
ッセージを受信すると、メモリ上の状態監視テーブルの
ａｌｉｖｅメッセージ受信時刻を記録し、当該プロセッ
サが正常であることを認識する。

【０００９】監視元プロセッサは、各グループの監視プ
ロセッサからのみある一定間隔でａｌｉｖｅメッセージ
を受信し、メモリ上の状態監視テーブルのａｌｉｖｅメ
ッセージを送信したプロセッサのａｌｉｖｅメッセージ
受信時刻を記録し、当該グループ内監視プロセッサが正
常であることを認識する。

【００１０】また状態監視テーブルには、各プロセッサ
毎にａｌｉｖｅメッセージが到着時刻から障害と判断す
るまでの許容時間を設定し、この許容時間内に次のａｌ
ｉｖｅメッセージを受信し、受信時刻を書き替えた場合
に、正常であると判断する。

【００１１】許容時間内に次のaliveメッセージを受信
しない場合には障害と判断し、系切り替え等の処理を行
い業務を再開する。

【００１２】これにより、監視パスのトラフィックの集
中化の回避、監視元プロセッサの負荷増大を防ぎ、更に
プロセッサ単位に処理する業務内容／重要度による障害
検知時間の設定を行う弧とができる。

【００１３】

【実施例】以下本発明の一実施例を図１、図２、図３、
図４、図５を用いて説明する。

【００１４】図１は本発明のコンピュータシステムの中
の一つの例である並列コンピュータシステムを表すブロ
ック図、図２は多数のプロセッサを監視するため監視方
式の論理図、図３は監視プロセッサが他のプロセッサを
監視するためのメモリ上の状態監視テーブルの構成図、
図４はあるプロセッサグループ内の監視プロセッサがグ
ループ内のプロセッサを監視するフローチャート、図５
は監視元プロセッサがグループ内の監視プロセッサを監
視するフッローチャートである。

【００１５】図１において、１１は並列コンピュータシ
ステムを構成するプロセッサ群、１２は１１のプロセッ
サ群を接続し通信を可能とするプロセッサ間ネットワー
ク、１３は１１のプロセッサ群と１２のネットワークか
ら構成される並列コンピュータシステムである。

【００１６】図２において、２１は処理を実行するプロ
セッサ群の中の１つのプロセッサ、２２はプロセッサ群
をグループ分けした場合のグループ内監視プロセッサ、
２３はグループ内監視プロセッサ２２のメモリ上にある
状態監視テーブル、２４はグループ内監視プロセッサ２
２の監視を行う監視元プロセッサ、２５は監視元プロセ
ッサのメモリ上の状態監視テーブル、２６は多数のプロ
セッサ群をグループ分けした場合のある１つのグループ
である。

【００１７】グループ内監視プロセッサ２２は、自分の
属するグループ２６内のプロセッサのみを監視し、他の
グループのプロセッサの監視は行わない。監視元プロセ
ッサ２４は、並列コンピュータ１３内の全てのプロセッ
サの状態を管理するが、全プロセッサの監視は直接行わ
ず、各グループのグループ内監視プロセッサが監視を行
う。

【００１８】図３において、３１は図２におけるの状態
監視テーブル２３、２５の構成、３２はプロセッサＮ
Ｏ．、３３は監視元プロセッサＮＯ．、３４はグループ
内監視プロセッサＮＯ．、３５はグループＮＯ．、３６
はａｌｉｖｅメッセージ受信時刻、３７は障害判断許容
時間である。

【００１９】各グループのプロセッサ２１はグループ内
監視プロセッサ２２に対し、正常であれば一定の時間間
隔でａｌｉｖｅメッセージを送信し、グループ内監視プ
ロセッサ２２は、プロセッサ２１からのａｌｉｖｅメッ
セージを受信している間は、プロセッサ２１は正常であ
ると判断し、ａｌｉｖｅメッセージが一定時間以上受信
されないとプロセッサ２１が障害であると判断する。

【００２０】次に各グループ２６内のグループ内監視プ
ロセッサがプロセッサ２１からａｌｉｖｅメッッセージ
を使って監視し、また監視元プロセッサ２４がグループ
内監プロセッサ２２を監視する処理を、図４、図５を参
照して具体的に説明する。

【００２１】多数のプロセッサを持つ並列コンピュータ
１３は、それぞれのプロセッサが障害であるかを効率良
く監視するために、まず多数のプロセッサを論理的にグ
ループ分けする。このグループ分けの基準は、そのプロ
セッサ群で処理する業務サービスっでも良いし、物理的
に近いプロセッサでも良い。また１つのグループに含ま
れるプッロセッサの数は、２つ以上からグループ内監視
プロセッサの監視のための負荷があまり増大しない程度
（１０個程度）が好ましい。

【００２２】グループ内監視プロセッサ２２は、監視す
るプロセッサ２１が正常であれば（４０１）、一定時間
間隔毎にａｌｉｖｅメッセージを受信し（４０２）、メ
モリ上の状態監視テーブル３１の該当するプロセッサＮ
Ｏ．のａｌｉｖｅメッセージの受信時刻３６に受信した
時刻をセットする（４０３）。

【００２３】プロセッサ２１に障害が発生した場合、グ
ループ内監視プロセッサ２２はａｌｉｖｅメッセージを
受信しない（４０４）。グループ内監視プロッサ２２
は、メモリ上の状態監視テーブル３１の、最後にａｌｉ
ｖｅメッセージを受信した時刻（ａｌｉｖｅメッセージ
受信時刻３６）からの時間と、各プロセッサを障害と判
断する障害判断許容時間３７を比較しており（４０
５）、（ａｌｉｖｅメッセージ受信時刻からの時間）＜
（障害判断許容時間３７）であれば（４０５）、障害と
判断しない。（ａｌｉｖｅメッセージ受信時刻からの時
間）≧（障害判断許容時間３７）となった場合（４０
５）、グループ内監視プロセッサ２２は当該プロセッサ
２１が障害であると判断し（４０６）、プロセッサ２１
をリセットし再実行する、あるいは他のプロセッサ（予
備プロセッサを設けておいても良い）に処理を引き継が
せ、プロセッサ２１をシステムから論理的に切り離す等
の処理を行う（４０７）。

【００２４】グループ内監視プロセッサ２２は、障害プ
ロセッサ２１をシステムから切り離した場合、プロセッ
サ２１をシステムから切離したことを監視元プロセッサ
２４に通知する（４０８）。監視元プロセッサ２４は、
通知を受けるとメモリ上の状態監視テーブル２５からプ
ロセッサ２１の内容を削除する（４０９）。

【００２５】次に監視元プロセッサ２４が、並列コンピ
ュータ１３の中の全てのプロセッサを監視せずに、グル
ープ内監視プロセッサ２２のみを監視する処理を説明す
る。

【００２６】監視元プロッセサ２４がグループ内監視プ
ロセッサ２２からａｌｉｖｅメッセージを受信すること
で、グループ内監視プロセッサの障害を監視する処理
（５０１〜５０６）は、グループ内監視プロセッサ２２
がプロセッサ２１を監視する処理（４０１〜４０６）と
同様である。監視元プロセッサ２４はメモリ上の状態監
視テーブルに全プロセッサの情報を図３に示すように保
持するが、ａｌｉｖｅメッセージを受信し障害判断許容
時間との比較を行うのはグループ内監視プロセッサの部
分だけである。

【００２７】監視元プロセッサ２４は、グループ内監視
プロセッサ２２が障害と判断すると（５０６）、障害の
グループ内監視プロセッサ２２の処理を他のプロセッサ
（予備プロセッサに引き継がせ、新たにグループ内監視
プロセッサにする（５０７）。新しくグループ内監視プ
ロセッサになる予備プロセッサは、同じグループにある
もとする。次に監視元プロセッサ２４は、障害の発生し
たグループ内監視プロセッサ２２のグループ２６の全て
のプロセッサに対し、新たにグループ内監視プロセッサ
になったプロセッサのアドレスをブロードキャストし、
ａｌｉｖｅメッセージの送信先を変更する（５０８）。

【００２８】以上の処理により、監視元プロセッサ２４
は並列コンピュータシステム１３内の全プロセッサの監
視を行う事なく（監視に要する負荷を増大させることな
く）、システム全体の管理も行うことができる。

【００２９】また監視元プロセッサ２４自身の監視につ
いては、他の予備プロセッサを設けておき、予備プロセ
ッサが監視元プロセッサを監視することにより実現でき
る。

【００３０】

【発明の効果】本発明によれば、多数あるプロセッサを
グループ分けし、かつ論理的に階層型に障害監視するこ
とにより、処理する業務量等の増加によってプロセッサ
数を増やしても、監視プロセッサの負荷を増大させるこ
となく全プロセッサを監視することができる。

【００３１】また本発明によれば、処理する業務の重要
度に応じて障害検知時間（障害判断時間）をプロセッッ
サ毎に設定できるので、重要な業務を処理するプロセッ
サに対しては検知時間を短くし、予備プロセッサに早く
切り替える等の処理を行い、業務を早く再開することが
できる。

【図面の簡単な説明】

【図１】本発明の一実施例を示す並列コンピュータシス
テムの構成例。

【図２】プロセッサ監視方式の論理図。

【図３】監視プロッセのメモリ上にあるプロセッサの状
態監視テーブル。

【図４】グループ内監視プロセッサがグループ内のプロ
セッサを監視するフローチャート。

【図５】監視元プロセッサがグループ内監視プロセッサ
を監視するフローチャート。

【符号の説明】

１１…プロセッサ群、１２…プロセッサ間ネットワーク、１３…並列コンピュータシステム、２１…プロセッサ、２２…グループ内監視プロセッサ、２３…状態監視テーブル、２４…監視元プロセッサ、２５…状態監視テーブル、２６…グループ、３１…状態監視テーブル、３２…プロセッサＮＯ．、３３…監視元プロセッサＮＯ．、３４…グループ内監視プロセッサＮＯ．、３５…グループＮＯ．、３６…ａｌｉｖｅメッセージ受信時刻、３７…障害判断許容時間。

Claims

【特許請求の範囲】

【請求項１】業務を実行する複数のプロセッサと、複数
のプロセッサを接続するプロセッサ間ネットワークから
構成される並列コンピュータシステム（複数のサーバ／
ＷＳから構成されるクラスタシステムを含む）におい
て、複数のプロセッサの内の１つをシステム全体の障害
監視プロセッサとして設定し、その他のプロセッサをい
くつかのプロセッサ毎にグループ分けし、そのグループ
内のプロセッサの１つを、グループ内のプロセッサの障
害を監視するグループ内監視プロセッサとして設定し、
グループ内監視プロセッサはグループ内のプロセッサか
ら一定時間間隔でａｌｉｖｅメッセージを受信すること
により、グループ内プロセッサを監視し、同様に監視元
プロセッサは、グループ内監視プッロセッサから一定間
隔でａｌｉｖｅメッセージを受信することにより、グル
ープ内監視プロセッサを監視するというように、被監視
プロセッサをグルーピングし、且つ階層型にすることに
より、監視元プロセッサの負荷集中、監視パスのトラフ
ィックの集中を防ぎ、障害検知の遅延を無くすことを特
徴とする障害監視方式。
【請求項２】上記並列コピュータにおいて、グループ内
監視プロセッサと監視元プロセッサのメモリ上に、被監
視プロセッサから最後のａｌｉｖｅメッセージが届いて
から障害検知／判断までの時間を、実行する業務内容に
よってプロセッサ毎に設定し、プロセッサで実行する業
務の重要度によって障害検知／判断時間を可変とするこ
とを特徴とする障害監視方式。