JPS6249444A - マルチプロセツサシステムの障害検出方法 - Google Patents

マルチプロセツサシステムの障害検出方法

Info

Publication number
JPS6249444A
JPS6249444A JP60187475A JP18747585A JPS6249444A JP S6249444 A JPS6249444 A JP S6249444A JP 60187475 A JP60187475 A JP 60187475A JP 18747585 A JP18747585 A JP 18747585A JP S6249444 A JPS6249444 A JP S6249444A
Authority
JP
Japan
Prior art keywords
processor
signal
request
check
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60187475A
Other languages
English (en)
Inventor
Kunitoshi Sugi
杉 邦俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60187475A priority Critical patent/JPS6249444A/ja
Publication of JPS6249444A publication Critical patent/JPS6249444A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Monitoring And Testing Of Exchanges (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はマルチプロセッサの障害検出方法に関し、特に
自己と異なる他のプロセッサの障害を検出するにあたり
、システム管理プロセッサからのバスを経由した定期的
なヘルスチェック信号を使用せずに、かつ自己が障害と
して検出したプロセッサの状態を自己が正常と認識して
いる他のプロセッサにチェックさせる事により、多数決
で決定しプロセッサの障害検出確度を高める障害検出方
法に関する。
〔従来の技術〕
従来、この種の障害検出方法は、システム管理プロセッ
サがシステムに接続されている全てのプロセッサに対し
バスを経由してヘルスチェック信号を定期的に送出し、
無応答の場合該当のプロセッサに障害が生じていると判
定していた。
〔発明が解決しようとする問題点〕
上述した従来の障害検出方法では、システム管理プロセ
ッサがシステムに接続されている全てのプロセラ′すに
対しバスを経由してヘルスチェック信号を定期的に送出
しているので、検出時期の早期化の為にはヘルスチェッ
ク信号の送出間隔を短縮せざるを得す、又システムに接
続されているプロセッサが増加すれば必然的にヘルスチ
ェ・ツク信号も増加する為、ヘルスチェック信号がノく
スを占有する率が飛躍的に増大する事になり、システム
で必要とする信号がバスを流れにくくなりシステム設計
でハスネックが発生するという欠点があった。さらに、
ヘルスチェック信号に対し無応答が発生した場合、シス
テム管理プロセッサの障害なのか、該当プロセッサの障
害なのかを判断する事が困難になるという欠点がある。
本発明は上記欠点を解決すべく成されたもので、ヘルス
チェック信号を用いずにプロセ・ノサの障害検出確度を
向上させたマルチプロセッサシステムの障害検出方法を
提供することを目的とする。
〔問題点を解決するための手段〕
本発明は、複数のプロセッサがバスのみで結合されてい
るマルチプロセッサで構成されたシステムの障害を検出
するにあたって、特定のプロセッサから検出対象プロセ
ッサへ信号を送出して障害が生じているか否かを直接検
出すると共に、前記特定のプロセッサから他のプロセッ
サへ前記検出対象プロセッサに障害が生じているか否か
の検出の依頼を行い、前記特定のプロセッサにおいて直
接検出結果と依頼結果とに基づいて前記対象プロセッサ
に障害が生じているか否かを検出することを特徴とする
〔実施例〕
次に、本発明の実施例について図面を参照して説明する
。本発明が適用されるマルチプロセッサシステムは、同
一構成の複数のプロセッサをバスによって結合して構成
されている。
第1図は、本発明が適用されるマルチプロセッサシステ
ムの中の1つのプロセッサを示す装置関連図であり、ま
た第1図はバス40で結合されている各プロセッサを制
御する各装置を拡大したものである。この装置は、通信
制御部(COM C)100゜障害検出部(FLDT)
200及び呼処理制御部(CPRC) 300から構成
されている。
通信制御部100はバス40とインタフェース線30に
よって接続され、通信制御部100に含まれる装置と障
害検出部200に含まれる各装置とは後述するインタフ
ェース線20.21.22.23.24.25.26に
よって接続され、そして通信制御部100と呼処理制御
部300とはインタフェース線10によって接続されて
いる。さらにこれらの通信制御部、障害検出部及び呼処
理制御部は以下の各装置に細分化されている。
通信制御部100は、バスインタフェース装置(BIN
T)110と信号送受信装置(SGSR)111とから
構成されている。そして、これらの装置はインクフェー
ス線120にて接続されている。障害検出部200は、
無応答監視装置(NASP)210.プロセッサ状態チ
ェック依頼装置(CHRQ)211、プロセッサ状態チ
ェック依頼受信装置(CHRV)212、プロセッサ状
態チェック実行装置(CHEX)213.プロセッサ状
態チェック結果受信装置(CH3R)214 、プロセ
ッサ状態チェック結果解答装置(RP L Y ) 2
15及びプロセッサ障害判定装置(FLJG)216か
ら構成されている。これらの装置はインタフェース線2
20(無応答監視装置210とプロセッサ状態チェック
依頼装置211の間)、インタフェース線221(無応
答監視装置210とプロセッサ障害判定装置216の間
)、インタフェース線222(プロセッサ状態チェック
依頼受信装置212とプロセッサ状態チェック実行装置
213の間)、インタフェース線223(プロセッサ状
態チェック結果受信装置214とプロセッサ状態チェッ
ク結果回答装置215の間)、インタフェース線224
(プロセッサ状態チェック実行装置213とプロセッサ
状態チェック結果回答装置215の間)、インタフェー
ス線225(無応答監視装置210とプロセッサ状態チ
ェック結果受信装置214の間)により接続されている
呼処理制御部300の内部の詳細については、本発明に
直接関係しない為説明を省略する。通信制御部100に
含まれている信号送受信装置111と障害検出部200
に含まれている各装置とは、インタフェース線20(信
号送受信装置111 と無応答監視装置210の間)、
インタフェース線21(信号送受信装置111とプロセ
ッサ状態チェック依頼装置211の間)。
インタフェース線22(信号送受信装置111とプロセ
ッサ状態チェック依頼受信装置212の間)、インタフ
ェース線23(信号送受信装置111とプロセッサ状態
チェック実行装置213の間)、インクフェース線24
(信号送受信装置111とプロセッサ状態チェック結果
受信装置214の間)、インタフェース線25号送受信
装置111とプロセッサ障害判定装置216の間)によ
り接続されている。
ここで、呼処理制御部300より、バス40を経由して
他の装置群に対して通信要求が発生し、その信号が無応
答になった場合を例に本発明の実施例を第2図−第3図
を参照して説明する。呼処理制御部300よりインタフ
ェース線10を経由して信号送受信装置111に、通信
要求が通達されると(ステップS1)、信号送受信装置
111はインタフェース線120を経由して、バスイン
タフェース装置11Gに通信信号を通達し、バスインク
フエ・−ス装置110はインタフェース線30およびバ
ス40を経由して他の装置群に通信を実行するくステッ
プS2)。同時に信号送受信装置111 はインタフェ
ース線20を経由して、無応答監視装置210に一般信
号の応答待ちタイミングの設定を要求する(ステップ3
3)。
要求にあたり、通信対象装置群の名称は必須条件である
。一定時間内にバス40を経由して他の装置群よりバス
インタフェース装置110に応答があり、インタフェー
ス線120を経由して信号送受信装置111にその内容
が通達された場合、信号送受信装置111 はインタフ
ェース線20を経由して、無応答監視装置210に応答
待ちタイミングの解除を要求する(ステップS5)。一
定時間内に応答が無く、応答待ちタイミングがオーバー
フローした場合、無応答監視装置210はインタフェー
ス線220を経由してプロセッサ状態チェック依頼装置
211に依頼元としての自装置群の名称と、該当装置群
の名称をもってチェックを依頼する(ステップS6)と
同時に、インタフェース線221を経由してプロセッサ
障害判定装置216に該当装置群の名称を通達する(ス
テップS7)。チェック依頼を受けたプロセッサ状態チ
ェック依頼装置211は、該当装置群と異なる装置群に
対し該当装置群のプロセッサ状態チェックを依頼する為
、インタフェース線21を経由して信号送受信装置11
1に依頼信号の送信を要求する(ステップS8)。依頼
信号には、依頼元として自装置群の名称とチェックを受
ける装置群の名称は必須条件である。信号送受信装置1
11は前述の呼処理制御部300の信号と同じ扱いとし
てインタフェース線120に信号送信を要求する。この
時、プロセッサ状態チェック依頼信号も無応答監視装置
210の対象とするか否かはシステムで決定すればよい
以降、特に記述するまでチェックを依頼された装置群内
部の動作を説明するが各装置群の構成は同一であるので
、便宜上第1図の装置および第3図の流れ図を参照して
説明する。バス40を経由して送達されたチェック依頼
信号はインタフェース線30を経由してバスインタフェ
ース装置110 に到達する。バスインタフェース装置
110 はインタフェース線120を経由して、信号の
内容を信号送受信装置111に送る。信号送受信装置1
11はインクフェース線22を経由してプロセッサ状態
チェック依頼受信装置212にプロセッサ状態チェック
依頼信号を受けた事と、チェック対象の装置群の名称及
び依頼元の装置群の名称を通達する(ステップ510)
。プロセッサ状態チェック依頼受信装置212はインタ
フェース線222を経由してプロセッサ状態チェック実
行装置213にチェック対象装置群の名称と、チェック
依頼元の装置群の名称を通達する(ステップ511)。
通達を受けたプロセッサ状態チェック実行装置213は
、チェック実行の為インタフェース線23を経由して信
号送受信装置111に試験信号の送信を要求する(ステ
ップ512)。
この時、該当装置群の名称は必須条件である。また、プ
ロセッサ状態チェック実行装置213は、試験信号の送
信を要求すると同時に、インタフェース線224を介し
てチェック依頼元の装置群の名称をプロセッサ状態チェ
ック結果回答装置215に通知する(ステップ513)
。信号送受信装置111は前述の呼処理制御部300の
信号と同じ扱いとしてインタフェース線120に信号送
信を要求するうこの時、試験信号に関し信号送受信装置
1.11は呼処理制御部300からの信号同様、無応答
監視の対象として無応答監視装置210に応答持ちのタ
イミング設定を要求する(ステップ514)。該当装置
群からの試験信号に対する応答信号がバス40を経由し
てバスインタフェース装置110 に到達し、インタフ
ェース線120を経由して信号送受信装置111に内容
が通達されると信号送受信装置111はプロセッサ状態
チェック結果受信装置214にインタフェース線24を
経由して通知する(ステップ516)と共に、無応答監
視装置210にインクフェース線20を経由して信号応
答待ちタイミングの解除を要求する(ステップ517)
。通知を受けたプロセッサ状態チェック結果受信装置2
14はインタフェース線223を経由してプロセッサ状
態チェック結果回答装置215に、チェック結果正常の
通知を送る(ステップ818)。通知を受けたプロセッ
サ状態チェック結果回答装置215 は、あらかじめイ
ンタフェース線224を経由して、プロセッサ状態チェ
ック実行装置より通知されていたチェック依頼元装置群
の名称に従って回答の送出をインタフェース線25を経
由して信号送受信装置111に要求する(ステップ51
9)。信号送受信装置111は前述の呼処理制御部30
0の信号と同じ扱いとしてインタフェース線120に信
号送信を要求する。この時、プロセッサ状態チェック依
頼回答信号も無応答監視装置210の対象とするか否か
はシステムで決定すればよい。
チェック対象の装置群より試験信号に対する応答信号が
無い場合、無応答監視装置210にて信号応答待ちタイ
ミングがオーバーフローするため、その結果をプロセッ
サ状態チェック信号受信装置214にインタフェース線
225を経由して通知する(ステップ520)。通知を
受けたプロセッサ状態チェック信号受信装置214はチ
ェック結果異常の内容を、プロセッサ状態チェック結果
回答装置215にインタフェース線223を経由して通
知する(ステップ521)。通知を受けたプロセッサ状
態チェック結果回答装置215は前述と同じ手順により
、チェック依頼元の装置群に内容の通知を実行する(ス
テップ519)。
以降はチェック依頼元の説明になる。チェック依頼元の
装置群にチェック依頼元の装置群よりバス40を経由し
て通知されたチェック結果の信号は、インタフェース線
30を経由してバスインタフェース装置110に到達し
、インタフェース線120を経由して信号送受信装置1
11に通知される。通知を受けた信号送受信装置111
はインタフェース線26を経由してプロセッサ障害判定
装置216に内容を通知する(ステップ522)。プロ
セッサ障害判定装置216においては、通知結果がチェ
ック正常であればもう一度他の装置群にチェックを依頼
し、その結果もチェック正常であれば多数決によりチェ
ック対象の装置群が正常であると判断し、又通知結果が
チェック異常であれば2台の異なる装置群にて異常と判
定されたのであるから、チェック対象の装置群は確実に
障害状態にあると判断し、しかるべき処置をとることが
できる。
〔発明の効果〕
以上説明した様に本発明によれば自己と異なる他のプロ
セッサ障害検出にあたり、常にヘルスチェック信号を使
用して正常性をチェックする方式と異なり、システムに
有効な信号の無応答で第一段階の検出を実施し、他の装
置群とのチェック結果の多数決により他のプロセッサ障
害を検出する事により、プロセッサ障害発生時のみ試験
信号がバスを流れることになり、システムで必要とする
信号が通常時バスを流れにくくなる事を除去できる効果
がある。
【図面の簡単な説明】
第1図は本発明が適用される装置の関連図、第2図およ
び第3図は本発明の一実施例を説明するための流れ図で
ある。 10  ・・・ 呼処理制御部(CPRC)と信号送受
信装置(SGSR)間のインタフェース線20  ・・
・ 信号送受信装置、(S G S R)と無応答監視
装置(NASP)間のインタフェース線 21  ・・・ 信号送受信装置(SGSR)とプロセ
ッサ状態チェック依頼装置(CHRQ)間のインタフェ
ース線 22  ・・・ 信号送受信装置(SGSR)とプロセ
ッサ状態チェック依頼受信装置(CHRV)間のインタ
フェース線 23  ・・・ 信号送受信装置(SGSR)とプロセ
ッサ状態チェック実行装置(CHEX)間のインタフェ
ース線 24  ・・・ 信号送受信装置(SGSR)とプロセ
ッサ状態チェック結果受信装置(CH3R)間のインク
フェース線 25  ・・・ 信号送受信装置(SGSR)とプロセ
ッサ状態チェック結果回答装置(RPLY)間のインク
フェース線 26  ・・・ 、信号送受信装置(SGSR)とプロ
セッサ障害判定装置(FLJG)間のインタフェース線 30  ・・・ バスとバスインタフェース装置(BI
NT)間のインタフェース線 40  ・・・ 他の装置群と自装置群を接続している
バス 100・・・ 通信制御部(COM C)110・・・
 パイインタフェース装置(BINT)111・・・ 
信号送受信装置(SGSR)200・・・ 障害検出部
(FLDT)210・・・ 無応答監視装置(NASP
)211・・・ プロセッサ状態チェック依頼装置(C
HRQ) 212・・・ プロセッサ状態チェック依頼受信装置(
CHRV) 213・・・ プロセッサ状態チェック実行装置(CH
EX) 214・・・ プロセッサ状態チェック結果受信装置(
CH3R) 215・・・ プロセッサ状態チェック結果回答装置(
RPLY) 216・・・ プロセッサ障害判定装置(FLJG)2
20・・・ 無応答監視装置(NASP)とプロセッサ
状態チェック依頼装置(CHRQ)間のインタフェース
線 221・・・ 無応答監視装置(NASP)とプロセッ
サ障害判定装置(FLJG)間のインタフェース線 222・・・ プロセッサ状態チェック依頼受信装置(
CHRV)とプロセッサ状態チェック実行装置(CHE
X)間のインタフェース線 223・・・ プロセッサ状態チェック結果受信装置(
CH3R)とプロセッサ状態チェック結果回答装置(R
PLY)間のインタフェース線 224・・・ プロセッサ状態チェック実行装置(CH
EX)とプロセッサ状態チェック結果回答装置(RPL
Y)間のインタフェース線 225・・・ 無応答監視装置(NASP)とプロセッ
サ状態チェック結果回答装置(RPLY)間のインタフ
ェース線 300・・・ 呼処理制御部(CPRC)代理人 弁理
士  岩 佐 義 幸 第1図 第2図 第3図

Claims (1)

    【特許請求の範囲】
  1. (1)複数のプロセッサがバスのみで結合されているマ
    ルチプロセッサで構成されたシステムの障害を検出する
    にあたって、特定のプロセッサから検出対象プロセッサ
    へ信号を送出して障害が生じているか否かを直接検出す
    ると共に、前記特定のプロセッサから他のプロセッサへ
    前記検出対象プロセッサに障害が生じているか否かの検
    出の依頼を行い、前記特定のプロセッサにおいて直接検
    出結果と依頼結果とに基づいて前記検出対象プロセッサ
    に障害が生じているか否かを検出することを特徴とする
    マルチプロセッサシステムの障害検出方法。
JP60187475A 1985-08-28 1985-08-28 マルチプロセツサシステムの障害検出方法 Pending JPS6249444A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60187475A JPS6249444A (ja) 1985-08-28 1985-08-28 マルチプロセツサシステムの障害検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60187475A JPS6249444A (ja) 1985-08-28 1985-08-28 マルチプロセツサシステムの障害検出方法

Publications (1)

Publication Number Publication Date
JPS6249444A true JPS6249444A (ja) 1987-03-04

Family

ID=16206728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60187475A Pending JPS6249444A (ja) 1985-08-28 1985-08-28 マルチプロセツサシステムの障害検出方法

Country Status (1)

Country Link
JP (1) JPS6249444A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0198357A (ja) * 1987-10-09 1989-04-17 Nec Corp 共通バス障害処理方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0198357A (ja) * 1987-10-09 1989-04-17 Nec Corp 共通バス障害処理方式

Similar Documents

Publication Publication Date Title
JPH01293450A (ja) 障害装置特定システム
JPS6249444A (ja) マルチプロセツサシステムの障害検出方法
JPS6356755A (ja) スレ−ブプロセツサの異常監視方式
JP2707663B2 (ja) メツセージ転送チエツク方式
JPS59182655A (ja) デ−タ通信折返し方式
JP2002330191A (ja) 異常検出方式、及び、異常検出システム
JPS5842491B2 (ja) マルチプロセッサシステムに於ける故障認識方式
JPH07334433A (ja) バス制御装置
JPS62174838A (ja) マルチプロセサ・システムに於けるプロセサ障害検出方法
JPH02281368A (ja) 制御装置の故障検出機構
JPS6211957A (ja) マルチプロセツサシステムにおける障害プロセツサ検出方式
JPS6314542B2 (ja)
JPS62175836A (ja) デ−タ処理システムのヘルスチエツク方式
KR970007275B1 (ko) 파이프라인 방식 연결망에서의 연결망 응답장치(respondent in pipelined bus system)
JPS61123235A (ja) デ−タ伝送システム
JPS61146044A (ja) デ−タ通信制御装置の診断方式
JPH04179687A (ja) エレベータの遠隔制御装置
JP2004234183A (ja) 計算機制御装置のバスチェック方法およびシステム
JPH02216577A (ja) マルチプロセッサシステムにおける障害検出方式
KR19990058381A (ko) 분산 제어 시스템의 네트워크 점검 장치
JP2001075935A (ja) プロセッサ間通信方法
JPH0341838A (ja) ループバス診断方式
JPS62162155A (ja) 情報処理システム
JPH04318722A (ja) 保守試験用データリンクの試験方式
JPH02176944A (ja) 故障エージエント検出方式