JPH05290010A - マルチプロセッサシステムの障害監視方式 - Google Patents

マルチプロセッサシステムの障害監視方式

Info

Publication number
JPH05290010A
JPH05290010A JP4094046A JP9404692A JPH05290010A JP H05290010 A JPH05290010 A JP H05290010A JP 4094046 A JP4094046 A JP 4094046A JP 9404692 A JP9404692 A JP 9404692A JP H05290010 A JPH05290010 A JP H05290010A
Authority
JP
Japan
Prior art keywords
monitoring
module
communication control
failure
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4094046A
Other languages
English (en)
Inventor
Kazunari Someya
一成 染谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4094046A priority Critical patent/JPH05290010A/ja
Publication of JPH05290010A publication Critical patent/JPH05290010A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【目的】 システム内の通信制御モジュールの障害監視
処理を停止することなく、早急な障害回復を継続して実
現させる。 【構成】 複数の通信制御モジュール14,15は一定
時間以内にシステム監視モジュール13からの障害監視
通知信号を受信しなければ、システム監視モジュール1
3を障害とみなし、最も早くシステム監視モジュール1
3の障害を発見した通信制御モジュール14(15)
が、他の通信制御モジュール15(14)に対して障害
監視通知信号を一定周期で送信し、システム監視モジュ
ール13が障害から回復するまで、システム監視モジュ
ール13に代行して障害監視処理を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、マルチプロセッサシス
テムの障害監視方式に関する。
【0002】
【従来の技術】従来、この種のマルチプロセッサシステ
ムの障害監視方式は、システム監視モジュールが各通信
制御モジュールに対して、それぞれ障害監視通知信号を
一定周期で送信し、一定時間以内に障害監視応答信号を
受信しなければ、その通信制御モジュールを障害とみな
し、障害から回復させるために障害回復モジュールに対
して、障害回復指示信号を送信し、障害回復モジュール
に障害となった通信制御モジュールの障害回復処理を行
わせていた。
【0003】図5、図6は、従来のマルチプロセッサシ
ステムの障害監視方式の処理シーケンスの一例である。
図において、システム監視モジュール13に障害が発生
した場合、システム監視モジュール13が障害から回復
するまでの間に通信制御モジュール15に障害が発生し
てしまうと、それを監視するモジュールがないため、シ
ステム監視モジュール13が障害から回復した後に新た
に障害監視通知信号33を通信制御モジュール15に送
信し、一定時間以内に障害監視応答信号34を受信しな
かったときに初めて、通信制御モジュール15を障害と
みなし、障害回復モジュール12に対して、障害回復指
示信号30を送信し、障害回復処理を行わせる障害監視
処理を行っていた。
【0004】
【発明が解決しようとする課題】上述したマルチプロセ
ッサシステムの障害監視方式は、システム監視モジュー
ルに障害が発生した場合、通信制御モジュールの障害監
視処理を行うモジュールがなくなってしまうため、シス
テム監視モジュールが障害から回復する前に通信制御モ
ジュールが障害となってしまうと障害監視処理が行われ
ず、システム監視モジュールが障害から回復するまでシ
ステム内の障害監視処理が停止してしまうという問題が
ある。
【0005】本発明の目的は、システム監視モジュール
が障害から回復するまでの間に通信制御モジュールが障
害となっても、システム内の障害監視処理が停止せず、
障害発生時の早急な対処を行うことのできるマルチプロ
セッサシステムの障害監視方式を提供することにある。
【0006】
【課題を解決するための手段】本発明は、端末を収容す
る複数の通信制御モジュールと、通信制御モジュールの
障害監視を行うシステム監視モジュールと、通信制御モ
ジュールの障害回復処理を行う障害回復モジュールとが
1つのシステムバスによって結合されているマルチプロ
セッサシステムの障害監視方式において、システム監視
モジュールは、複数の通信制御モジュールに対して、そ
れぞれ障害監視通知信号を一定周期で送信し、一定時間
以内に通信制御モジュールからの障害監視応答信号を受
信しなければ、障害監視応答信号を受信しない通信制御
モジュールを障害とみなし、障害から回復させるために
障害回復モジュールに対して、障害回復指示信号を送信
し、障害回復モジュールに障害となった通信制御モジュ
ールの障害回復処理を行わせて通信制御モジュールを障
害から回復させ、通信制御モジュールは、一定時間以内
にシステム監視モジュールからの障害監視通知信号を受
信しなければ、システム監視モジュールを障害とみな
し、障害回復モジュールに対して、監視代行要求信号を
送信し、障害回復モジュールは、最も早く監視代行要求
信号を送信してきた通信制御モジュールに対して、監視
代行依頼信号を送信し、監視代行依頼信号を受信した通
信制御モジュールは、システム監視モジュールおよび他
の通信制御モジュールに対して、障害監視通知信号を一
定周期で送信し、システム監視モジュールが障害から回
復してシステム監視モジュールからの障害監視応答信号
を受信するまでシステム監視モジュールに代行して障害
監視処理を行うことを特徴としている。
【0007】また、本発明によれば、障害監視処理を代
行している前記通信制御モジュールが障害になると、最
も早く障害を発見した他の通信制御モジュールが次々と
システム内の障害監視処理を代行するのが好ましい。
【0008】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。図1は、本発明におけるマルチプロセッサ
システムの一実施例を示す構成図である。図1のマルチ
プロセッサシステムは、端末を収容する通信制御モジュ
ール14,15と、通信制御モジュールの障害監視を行
うシステム監視モジュール13と、各通信制御モジュー
ルの障害回復処理を行う障害回復モジュール12とによ
り構成されている。これらはそれぞれ1つのシステムバ
ス11によって接続されており、本発明のマルチプロセ
ッサシステムの障害監視方式を実現している。
【0009】次に、本実施例の動作について説明する。
【0010】図2、図3、図4は、本発明のマルチプロ
セッサシステムの障害監視方式の一実施例を示す処理シ
ーケンス図である。
【0011】図において、システム監視モジュール13
は、通信制御モジュール14、通信制御モジュール15
に対して、それぞれ障害監視通知信号31,33を一定
周期で送信し、各通信制御モジュール14,15は、そ
れぞれ障害監視通知信号31,33を受信すると、シス
テム監視モジュール13に対して障害監視応答信号3
2,34を送信するが、システム監視モジュール13に
障害が発生し、通信制御モジュール14が一定時間以内
にシステム監視モジュール13からの障害監視通知信号
31を受信しなかった場合、通信制御モジュール14は
システム監視モジュール13を障害とみなして、障害回
復モジュール12に対して、監視代行要求信号25を送
信し、更に、通信制御モジュール15は一定時間以内に
システム監視モジュール13からの障害監視通知信号3
3を受信しなかった場合、通信制御モジュール15はシ
ステム監視モジュール13を障害とみなして、障害回復
モジュール12に対して、監視代行要求信号27を送信
する。
【0012】監視代行要求信号25,27を受信した障
害回復モジュール12は、最も早く監視代行要求信号2
5を送信してきた通信制御モジュール14に対して、監
視代行依頼信号26を送信し、通信制御モジュール14
に障害監視を代行するように通知し、監視代行要求信号
27を送信してきた通信制御モジュール15に対して、
既に通信制御モジュール14に障害監視の代行を依頼し
たため、監視代行拒否信号28を送信し、通信制御モジ
ュール15に障害監視の代行を拒否することを通知す
る。
【0013】監視代行依頼信号26を受信した通信制御
モジュール14は、システム監視モジュール13が障害
から回復するまで、通信制御モジュール15に対して、
障害監視通知信号23を一定周期で送信し、システム監
視モジュール13に代行して障害監視処理を行う。
【0014】障害監視処理を代行している通信制御モジ
ュール14は、通信制御モジュール15に対して、障害
監視通知信号23を一定周期で送信し、通信制御モジュ
ール15は、障害監視通知信号23を受信すると、通信
制御モジュール14に対して、障害監視応答信号24を
送信するが、通信制御モジュール15に障害が発生し、
通信制御モジュール14が一定時間以内に通信制御モジ
ュール15からの障害監視応答信号24を受信しなかっ
た場合、通信制御モジュール15を障害とみなし、障害
から回復させるために、障害回復モジュール12に対し
て、障害回復指示信号20を送信し、障害回復モジュー
ル12に障害となった通信制御モジュール15の障害回
復を行わせる。
【0015】また、障害監視処理を代行している通信制
御モジュール14は、システム監視モジュール13に対
しても障害監視通知信号21を一定周期で送信してお
り、システム監視モジュール13が障害から回復し、通
信制御モジュール14が障害監視通知信号21に対する
システム監視モジュール13からの障害監視応答信号2
2を受信した場合、障害監視処理を代行している通信制
御モジュール14は、システム監視モジュール13が障
害から回復したとみなし、障害回復モジュール12に対
して、代行終了通知信号29を送信し、障害監視処理の
代行を終了し、システム監視モジュール13がその後障
害監視処理を継続して行う。
【0016】また、システム監視モジュール13の障害
が回復する前に通信制御モジュール14に障害が発生す
ると、最も早くその障害を発見した通信制御モジュール
15が障害監視処理を代行する、というように順次、通
信制御モジュールが障害監視処理を代行する。
【0017】このように、本実施例は、システム監視モ
ジュール13が障害となった場合に、最も早くその障害
を発見した通信制御モジュール14がシステム監視モジ
ュール13の行っていた障害監視処理を代行することに
より、システム監視モジュール13および通信制御モジ
ュール15に対する障害監視を停止させることなく継続
して実行する。
【0018】
【発明の効果】以上説明したように本発明は、システム
内の全通信制御モジュールが障害監視処理の代行機能を
有し、システム監視モジュールに障害が発生すると、最
も早くその障害を発見した通信制御モジュールが障害監
視処理を代行し、システム監視モジュールの障害が回復
する前にその通信制御モジュールに障害が発生すると、
最も早くその障害を発見した通信制御モジュールが障害
監視処理を代行する、というように順次、通信制御モジ
ュールが障害監視処理を代行していくことにより、シス
テム内のどのモジュールが障害となっても、システム内
の障害監視処理が停止しないばかりか、障害発生時の早
急な対処を行うことができるという効果を有する。
【図面の簡単な説明】
【図1】本発明におけるマルチプロセッサシステムの一
実施例を示す構成図である。
【図2】本発明のマルチプロセッサシステムの障害監視
方式の一実施例を示す処理シーケンス図である。
【図3】本発明のマルチプロセッサシステムの障害監視
方式の一実施例を示す処理シーケンス図である。
【図4】本発明のマルチプロセッサシステムの障害監視
方式の一実施例を示す処理シーケンス図である。
【図5】従来のマルチプロセッサシステムの障害監視方
式の一実施例を示す処理シーケンス図である。
【図6】従来のマルチプロセッサシステムの障害監視方
式の一実施例を示す処理シーケンス図である。
【符号の説明】
11 システムバス 12 障害回復モジュール 13 システム監視モジュール 14,15 通信制御モジュール 20 障害回復指示信号 21,23 障害監視通知信号 22,24 障害監視応答信号 25,27 監視代行要求信号 26 監視代行依頼信号 28 監視代行拒否信号 29 代行終了通知信号 30 障害回復指示信号 31,33 障害監視通知信号 32,34 障害監視応答信号

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】端末を収容する複数の通信制御モジュール
    と、通信制御モジュールの障害監視を行うシステム監視
    モジュールと、通信制御モジュールの障害回復処理を行
    う障害回復モジュールとが1つのシステムバスによって
    結合されているマルチプロセッサシステムの障害監視方
    式において、 システム監視モジュールは、複数の通信制御モジュール
    に対して、それぞれ障害監視通知信号を一定周期で送信
    し、 一定時間以内に通信制御モジュールからの障害監視応答
    信号を受信しなければ、障害監視応答信号を受信しない
    通信制御モジュールを障害とみなし、 障害から回復させるために障害回復モジュールに対し
    て、障害回復指示信号を送信し、 障害回復モジュールに障害となった通信制御モジュール
    の障害回復処理を行わせて通信制御モジュールを障害か
    ら回復させ、 通信制御モジュールは、一定時間以内にシステム監視モ
    ジュールからの障害監視通知信号を受信しなければ、シ
    ステム監視モジュールを障害とみなし、 障害回復モジュールに対して、監視代行要求信号を送信
    し、 障害回復モジュールは、最も早く監視代行要求信号を送
    信してきた通信制御モジュールに対して、監視代行依頼
    信号を送信し、 監視代行依頼信号を受信した通信制御モジュールは、シ
    ステム監視モジュールおよび他の通信制御モジュールに
    対して、障害監視通知信号を一定周期で送信し、システ
    ム監視モジュールが障害から回復してシステム監視モジ
    ュールからの障害監視応答信号を受信するまでシステム
    監視モジュールに代行して障害監視処理を行うことを特
    徴とするマルチプロセッサシステムの障害監視方式。
  2. 【請求項2】障害監視処理を代行している前記通信制御
    モジュールが障害になると、最も早く障害を発見した他
    の通信制御モジュールが次々とシステム内の障害監視処
    理を代行することを特徴とする請求項1記載のマルチプ
    ロセッサシステムの障害監視方式。
JP4094046A 1992-04-14 1992-04-14 マルチプロセッサシステムの障害監視方式 Pending JPH05290010A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4094046A JPH05290010A (ja) 1992-04-14 1992-04-14 マルチプロセッサシステムの障害監視方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4094046A JPH05290010A (ja) 1992-04-14 1992-04-14 マルチプロセッサシステムの障害監視方式

Publications (1)

Publication Number Publication Date
JPH05290010A true JPH05290010A (ja) 1993-11-05

Family

ID=14099627

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4094046A Pending JPH05290010A (ja) 1992-04-14 1992-04-14 マルチプロセッサシステムの障害監視方式

Country Status (1)

Country Link
JP (1) JPH05290010A (ja)

Similar Documents

Publication Publication Date Title
JPH0576654B2 (ja)
US20080313426A1 (en) Information Processing Apparatus and Information Processing Method
JPH04299429A (ja) マルチプロセッサシステムの障害監視方式
JPH05290010A (ja) マルチプロセッサシステムの障害監視方式
JPH01217666A (ja) マルチプロセッサシステムの障害検出方式
KR930010291B1 (ko) 이중화된 프로세서의 동작/대기 결정 방법
JP3104608B2 (ja) マルチプロセッサシステムにおける障害復旧方法及びそのシステム
JPS6314542B2 (ja)
JPH06187270A (ja) マルチプロセッサシステム
KR930007469B1 (ko) 프로세서 정합 운용시 장애진단 및 복구방법
JPS63285053A (ja) 網管理装置の障害処理方式
JPS61236241A (ja) 情報伝送装置の縮退運用方式
JPH06152570A (ja) 二重化データ処理装置における系切替え処理方式
JPS6123246A (ja) マルチプロセツサシステムの監視方式
JP2645134B2 (ja) 復旧信号リンクへのメッセージ送出制御方式
JPH0228941B2 (ja)
JPS62180454A (ja) 通信システムの障害情報収集方法
JPS62105243A (ja) システム障害の復旧装置
JPH08147255A (ja) 障害監視方式
JPH04167142A (ja) 情報処理装置の障害検出方式
JPH09160875A (ja) マルチエージェント相互バックアップ方式
JPS6337448A (ja) アツプラインダンプ方式
JPH03237556A (ja) マルチホストシステムの通信管理方式
JPS63266549A (ja) 自動システム切換え方式
JPH0241058A (ja) データ伝送システムの診断装置