JPH01269152A - 分散処理システムにおけるプロセッサ障害検出方式 - Google Patents

分散処理システムにおけるプロセッサ障害検出方式

Info

Publication number
JPH01269152A
JPH01269152A JP63097661A JP9766188A JPH01269152A JP H01269152 A JPH01269152 A JP H01269152A JP 63097661 A JP63097661 A JP 63097661A JP 9766188 A JP9766188 A JP 9766188A JP H01269152 A JPH01269152 A JP H01269152A
Authority
JP
Japan
Prior art keywords
processor
communication
processors
exceeds
common bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63097661A
Other languages
English (en)
Inventor
Mitsuo Kato
光夫 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63097661A priority Critical patent/JPH01269152A/ja
Publication of JPH01269152A publication Critical patent/JPH01269152A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Exchange Systems With Centralized Control (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は複数のプロセッサを共通バ曵により相互に接続
してなる分散処理システムにおけるプロセッサ障害検出
方式に関する。
〔従来の技術〕
複数のプロセッサが共通バスを介して情報の送受信を行
ないつつ各プロセッサがシステムに課せられた処理の一
部をそれぞれ分担する分散処理システムにおいて、シス
テムを構成しているプロセッサに障害が発生したか否か
の検出は、従来、システムを構成する複数のプロセッサ
のうちの一つを親プロセツサ、他を子プロセッサと定義
し、親プロセツサから各子プロセフサヘ一定周期毎に共
通バス経由で間合せ信号を送信し、この間合せ信号に応
答して各子プロセッサが親プロセツサへ共通バス経由で
応答信号を返すか否かにより、親プロセツサ側で他の子
プロセッサの障害発生の有無を検出していた。
〔発明が解決しようとする問題点〕
上述した従来のプロセッサ障害検出方式では、親プロセ
ツサから各子プロセッサへ共通バスを介して間合せ信号
を送信し、各子プロセッサは親プロセツサへ共通バスを
介して応答信号を返す構成を採用しているので、データ
の送受信等のシステム本来の処理を遂行する為に共通バ
スが使用される以外に障害監視の為にも頻繁に共通バス
が使用されることになり、システノ、の処理能力が低下
するおそれがあった。
そこで本発明の目的は、障害検出の為にプロセッサ間で
共通バスを使用して間合せ信号や応答信号を送受信する
ことなく、プロセッサの障害を検出し得る方式を提供す
ることにある。
〔問題点を解決するための手段〕
本発明は上記の目的を達成するために、複数のプロセッ
サが共通バスを介して相互に接続され、各プロセッサは
、前記共通バス経由で他のプロセッサと通信を行うプロ
セッサ間通信機構と、前記共通バス経由での通信の不可
状態発生時に通信要求を通信相手プロセッサ毎に待合せ
、前記通信不可状態の解除時に前記待合せた通信要求を
再処理する通信待合せ機構とを含む分散処理システムに
おいて、各プロセッサは、前記通信待合せ機構で通信相
手プロセッサ対応に待合せた通信要求の数が所定数を越
えたか否かを判断する判断手段を有し、前記判断手段で
通信要求待合せ数が所定数を越えたと判断された通信相
手プロセッサを障害プロセッサとして検出するように構
成される。
〔作用〕
本発明の分散処理システムにおけるプロセッサ障害検出
方式においては、各プロセッサが、その有する判断手段
により、共通バス経由での通信不可状態発生による通信
相手プロセッサ毎の通信要求待合せ数が所定数を越えた
か否かを判断し、通信要求待合せ数が所定数を越えたと
判断された通信相手プロセッサを障害プロセッサとして
検出する。プロセッサが障害を起こしていない場合、そ
のプロセッサを通信相手プロセッサとするプロセッサに
おいては、その通信相手プロセッサ対応の通信要求待合
せ数が所定数を越えることはないが、その通信相手ブロ
モ、すが障害を起こすと、通信要求待合せ数が所定数を
越えるので、上記の構成によって各プロセッサ毎に他の
プロセッサの障害検出が可能となる。
〔実施例〕
次に、本発明の実施例について図面を参照して詳細に説
明する。
第1図は本発明のプロセッサ障害検出方式を通用した分
散処理システムの一例を示す、この分散処理システムは
、プロセッサ間通信用バス1を介して複数のプロセッサ
2−1〜2−nが相互に接続され、各プロセッサ間でプ
ロセッサ間通信用バス1を時分割に使用して通信を行い
つつ、システムに課せられた処理を各々が分担して処理
している。
各プロセッサ2−1〜2−nは、プロセッサ間通信機構
3−1〜3−nと、通信待合せ機構4−1〜4−nとを
含む、プロセッサ間通信機構3−1〜3−nは、プロセ
ッサ間通信用バス1経出で他のプロセッサと通信を行う
ものである。また、通信待合せ機構4−1〜4−nは、
プロセッサ間通信用バスl経由での通信の不可状態発生
時に通信要求を通信相手プロセッサ毎に待合せ、通信不
可状態が解除されしだいその待合せていた通信要求を再
処理する処理を行い、且つ、通信相手プロセッサ対応に
待合せている通信要求の数が所定数を越えたか否かを判
定し、越えているときはそのプロセッサを障害プロセッ
サと判断する判断手段とを有するものである。
第2図は通信待合せ機構4−1〜4−〇の構成例を示す
。通信待合せ機構4−i(i=1=n)は、宛先プロセ
ッサ待合せ管理部40において、宛先プロセッサ毎の通
信要求の管理を行い、自プロセッサで発生した通信要求
がうまく処理されなかった送信不可状態時には、その通
信要求は待キュー42にキューイングされて待たされる
。そして、通信可能な状態になると、ファーストイン・
ファーストアウト方式により、待合せていた通信要求が
再処理され、宛先プロセッサへ送信が試みられる。この
ような通信要求の管理を行う宛先プロセッサ待合せ管理
部40では、各宛先プロセッサ(通信相手プロセッサ)
毎の待合せ通信要求数を保持しており、判定部41はそ
の待合せ通信要求数と予め定められた数Mとの比較によ
りプロセッサの障害の有無を判断している。
第3図はそのような動作を行う通信待合せ機構4−1の
処理例を示す流れ図である。通信待合せ機構4−1は、
通信要求が発生すると、先ず、その宛先プロセッサに既
に待ちの通信要求があるか否かを調べ(Sl)、無けれ
ばその宛先プロセッサが送信中か否かを判定しくS2)
、送信中でなければプロセッサ間通信機構3−iを使用
してその宛先プロセッサへ送信を行う(S3)。また、
その宛先プロセッサに既に待ちの通信要求があるか、或
いは宛先プロセッサが送信中であれば、その宛先プロセ
ッサの通信要求待合せ数が所定値Mを越えているか否か
を調べ(S4)、越えていなければ今回の通信要求をそ
の宛先プロセッサの待キュー42にキューイングする(
S5)、反対に、その宛先プロセッサの通信要求待合せ
数が所定値Mを越えていれば、その宛先プロセッサは障
害とみなし、プロセッサ間通信機構3−1を使用して他
のプロセッサにその旨を通知する(S6)、なお、障害
とみなしたプロセッサ宛のキエーは解放され、他プロセ
ッサ宛の通信要求へ使用可能とされる。
第4図は第1図の分散処理システムにおける動作説明図
である。プロセッサ間通信は、フレームと呼ばれる伝送
単位をブロモ・7す間通信用バス1を介してプロセッサ
間で授受することにより達成される。第4rf!Jのケ
ースKlは、プロセッサ2−1からプロセッサ2−2お
よび2−n宛のフレームが正常に送信、受信され、プロ
セッサ’l−nからプロセッサ2−2宛のフレームが正
常に送信5受信された場合を示している。このケースK
lのようにフレームの送信、受信が正常に行われシステ
ムが順調に運用されているとき、各プロセッサの通信待
合せ機構4−iにおいて各プロセッサの通信要求待合せ
数が所定値Mを越えることはない。
第4図のケースに2は、プロセッサ2−1内で発生した
プロセッサ2−2宛および2−n宛の通信要求について
、フレームの送受信が正常に終了しないか、或いはプロ
セッサ2−1内の通信待合せ機構4−1で既にプロセッ
サ2−2宛およびプロセッサ’l−n宛の通信要求待ち
が存在していた場合を示している。このような場合、そ
れらの通信要求はプロセッサ2−1内の通信待合せ機構
4−1においてプロセッサ2−2および”l−nに対応
する待キューにキューイングされる。
第4図のケースに3は、プロセッサ2−1内の通信待合
せ機構4−1において成るプロセッサに対応する通信要
求待合せ数が所定値Mを越えた場合を示している。この
ときは、そのブロモ・ノサは他のプロセッサと通信不可
になっているので障害プロセッサとみなされ、その旨が
システム内の全プロセッサに対し例えば同報通信形式の
ブロモ・ノサ障害通知フレームにより通知される。これ
により、システム内の全プロセッサが障害発生プロセッ
サを認識することができる。
〔発明の効果〕
以上説明したように、本発明は、各プロセッサ内で通信
相手プロセッサ対応に待合せている通信要求の数が所定
数を越えることにより、その通信相手プロセッサを障害
プロセッサとして検出するものであり、プロセッサ障害
検出の為にプロセッサ間で間合せ信号や応答信号を送受
信する必要がな(なるので、その分従来方式に比べて共
通バスをシステム本来の処理の為の通信に使用すること
が可能となり、分散処理システムの処理能力を高めるこ
とができる効果がある。また、−C的に分散処理システ
ムにおいてはシステム内でプロセッサ間通信要求が高い
頻度で発生しているので、プロセッサ障害の速やかな検
出が可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例のシステム構成図、第2図は
通信待合せ機構の構成例を示す図、第3図は通信待合せ
機構の処理例の流れ図および、 第4図は本発明の実施例の動作説明図である。 図において、 1・・・プロセッサ間通信用バス 2−1〜’l−n・・・プロセッサ 3−1〜3−n・・・プロセッサ間通信機構4−1〜4
−n・・・通信待合せ機構 40・・・宛先プロセッサ待合せ管理部41・・・通信
要求待合せ数が所定値を越えたか否かを判断する判定部 42・・・待キュー

Claims (1)

  1. 【特許請求の範囲】 複数のプロセッサが共通バスを介して相互に接続され、
    各プロセッサは、前記共通バス経由で他のプロセッサと
    通信を行うプロセッサ間通信機構と、前記共通バス経由
    での通信の不可状態発生時に通信要求を通信相手プロセ
    ッサ毎に待合せ、前記通信不可状態の解除時に前記持合
    せた通信要求を再処理する通信待合せ機構とを含む分散
    処理システムにおいて、 各プロセッサは、前記通信待合せ機構で通信相手プロセ
    ッサ対応に待合せた通信要求の数が所定数を越えたか否
    かを判断する判断手段を有し、各プロセッサは、前記判
    断手段で通信要求待合せ数が所定数を越えたと判断され
    た通信相手プロセッサを障害プロセッサとして検出する
    ことを特徴とする分散処理システムにおけるプロセッサ
    障害検出方式。
JP63097661A 1988-04-20 1988-04-20 分散処理システムにおけるプロセッサ障害検出方式 Pending JPH01269152A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63097661A JPH01269152A (ja) 1988-04-20 1988-04-20 分散処理システムにおけるプロセッサ障害検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63097661A JPH01269152A (ja) 1988-04-20 1988-04-20 分散処理システムにおけるプロセッサ障害検出方式

Publications (1)

Publication Number Publication Date
JPH01269152A true JPH01269152A (ja) 1989-10-26

Family

ID=14198244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63097661A Pending JPH01269152A (ja) 1988-04-20 1988-04-20 分散処理システムにおけるプロセッサ障害検出方式

Country Status (1)

Country Link
JP (1) JPH01269152A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016184284A (ja) * 2015-03-26 2016-10-20 Necプラットフォームズ株式会社 インタフェース障害検出装置、インタフェース障害検出システム、インタフェース障害検出方法、及びインタフェース障害検出プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016184284A (ja) * 2015-03-26 2016-10-20 Necプラットフォームズ株式会社 インタフェース障害検出装置、インタフェース障害検出システム、インタフェース障害検出方法、及びインタフェース障害検出プログラム

Similar Documents

Publication Publication Date Title
US5386512A (en) System for deriving and testing mutual capability set after receiving updated capability from other processors and before requesting service information
EP0854610A2 (en) Ethernet communication redundancy method
WO2004004158A1 (en) System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
WO2004004180A1 (en) Software fault tolerance between nodes
JPH01269152A (ja) 分散処理システムにおけるプロセッサ障害検出方式
JP4131263B2 (ja) マルチノードシステム、ノード装置、ノード間クロスバスイッチ及び障害処理方法
JPH01217666A (ja) マルチプロセッサシステムの障害検出方式
JP2633351B2 (ja) 制御装置の故障検出機構
JPH11177550A (ja) ネットワークの監視方式
JPH05225161A (ja) ネットワーク監視方式
JPH05224964A (ja) バス異常通知方式
JPH0248736A (ja) 情報処理システム
JPH08329023A (ja) 並列電子計算機システム
JPS6224358A (ja) 信号ル−テイングテ−ブル方式
JPH03210654A (ja) 分散制御処理装置
JPH0223740A (ja) 通信ネットワークシステム
JPH0628407A (ja) データベースシステム
JP2848442B2 (ja) 任意メッセージデータ判別方式
JPH04281535A (ja) 情報処理装置、待機冗長型システムおよび待機冗長型システムの主系と待機系との間でチェックポイントをとる方法
JPS62293453A (ja) 多重バス方式デ−タ処理装置
JPH08147255A (ja) 障害監視方式
JPH08161277A (ja) 並列計算機システム
JPH04178099A (ja) 監視制御システム
JPS6383857A (ja) マルチプロセツサシステムにおけるプロセツサ輻輳制御方式
JPH0463419B2 (ja)