JPH01269152A - 分散処理システムにおけるプロセッサ障害検出方式 - Google Patents
分散処理システムにおけるプロセッサ障害検出方式Info
- Publication number
- JPH01269152A JPH01269152A JP63097661A JP9766188A JPH01269152A JP H01269152 A JPH01269152 A JP H01269152A JP 63097661 A JP63097661 A JP 63097661A JP 9766188 A JP9766188 A JP 9766188A JP H01269152 A JPH01269152 A JP H01269152A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- communication
- processors
- exceeds
- common bus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 22
- 238000004891 communication Methods 0.000 claims abstract description 100
- 230000007246 mechanism Effects 0.000 claims abstract description 24
- 238000001514 detection method Methods 0.000 claims abstract description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 125000001246 bromo group Chemical group Br* 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
Landscapes
- Debugging And Monitoring (AREA)
- Multi Processors (AREA)
- Exchange Systems With Centralized Control (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は複数のプロセッサを共通バ曵により相互に接続
してなる分散処理システムにおけるプロセッサ障害検出
方式に関する。
してなる分散処理システムにおけるプロセッサ障害検出
方式に関する。
複数のプロセッサが共通バスを介して情報の送受信を行
ないつつ各プロセッサがシステムに課せられた処理の一
部をそれぞれ分担する分散処理システムにおいて、シス
テムを構成しているプロセッサに障害が発生したか否か
の検出は、従来、システムを構成する複数のプロセッサ
のうちの一つを親プロセツサ、他を子プロセッサと定義
し、親プロセツサから各子プロセフサヘ一定周期毎に共
通バス経由で間合せ信号を送信し、この間合せ信号に応
答して各子プロセッサが親プロセツサへ共通バス経由で
応答信号を返すか否かにより、親プロセツサ側で他の子
プロセッサの障害発生の有無を検出していた。
ないつつ各プロセッサがシステムに課せられた処理の一
部をそれぞれ分担する分散処理システムにおいて、シス
テムを構成しているプロセッサに障害が発生したか否か
の検出は、従来、システムを構成する複数のプロセッサ
のうちの一つを親プロセツサ、他を子プロセッサと定義
し、親プロセツサから各子プロセフサヘ一定周期毎に共
通バス経由で間合せ信号を送信し、この間合せ信号に応
答して各子プロセッサが親プロセツサへ共通バス経由で
応答信号を返すか否かにより、親プロセツサ側で他の子
プロセッサの障害発生の有無を検出していた。
上述した従来のプロセッサ障害検出方式では、親プロセ
ツサから各子プロセッサへ共通バスを介して間合せ信号
を送信し、各子プロセッサは親プロセツサへ共通バスを
介して応答信号を返す構成を採用しているので、データ
の送受信等のシステム本来の処理を遂行する為に共通バ
スが使用される以外に障害監視の為にも頻繁に共通バス
が使用されることになり、システノ、の処理能力が低下
するおそれがあった。
ツサから各子プロセッサへ共通バスを介して間合せ信号
を送信し、各子プロセッサは親プロセツサへ共通バスを
介して応答信号を返す構成を採用しているので、データ
の送受信等のシステム本来の処理を遂行する為に共通バ
スが使用される以外に障害監視の為にも頻繁に共通バス
が使用されることになり、システノ、の処理能力が低下
するおそれがあった。
そこで本発明の目的は、障害検出の為にプロセッサ間で
共通バスを使用して間合せ信号や応答信号を送受信する
ことなく、プロセッサの障害を検出し得る方式を提供す
ることにある。
共通バスを使用して間合せ信号や応答信号を送受信する
ことなく、プロセッサの障害を検出し得る方式を提供す
ることにある。
本発明は上記の目的を達成するために、複数のプロセッ
サが共通バスを介して相互に接続され、各プロセッサは
、前記共通バス経由で他のプロセッサと通信を行うプロ
セッサ間通信機構と、前記共通バス経由での通信の不可
状態発生時に通信要求を通信相手プロセッサ毎に待合せ
、前記通信不可状態の解除時に前記待合せた通信要求を
再処理する通信待合せ機構とを含む分散処理システムに
おいて、各プロセッサは、前記通信待合せ機構で通信相
手プロセッサ対応に待合せた通信要求の数が所定数を越
えたか否かを判断する判断手段を有し、前記判断手段で
通信要求待合せ数が所定数を越えたと判断された通信相
手プロセッサを障害プロセッサとして検出するように構
成される。
サが共通バスを介して相互に接続され、各プロセッサは
、前記共通バス経由で他のプロセッサと通信を行うプロ
セッサ間通信機構と、前記共通バス経由での通信の不可
状態発生時に通信要求を通信相手プロセッサ毎に待合せ
、前記通信不可状態の解除時に前記待合せた通信要求を
再処理する通信待合せ機構とを含む分散処理システムに
おいて、各プロセッサは、前記通信待合せ機構で通信相
手プロセッサ対応に待合せた通信要求の数が所定数を越
えたか否かを判断する判断手段を有し、前記判断手段で
通信要求待合せ数が所定数を越えたと判断された通信相
手プロセッサを障害プロセッサとして検出するように構
成される。
本発明の分散処理システムにおけるプロセッサ障害検出
方式においては、各プロセッサが、その有する判断手段
により、共通バス経由での通信不可状態発生による通信
相手プロセッサ毎の通信要求待合せ数が所定数を越えた
か否かを判断し、通信要求待合せ数が所定数を越えたと
判断された通信相手プロセッサを障害プロセッサとして
検出する。プロセッサが障害を起こしていない場合、そ
のプロセッサを通信相手プロセッサとするプロセッサに
おいては、その通信相手プロセッサ対応の通信要求待合
せ数が所定数を越えることはないが、その通信相手ブロ
モ、すが障害を起こすと、通信要求待合せ数が所定数を
越えるので、上記の構成によって各プロセッサ毎に他の
プロセッサの障害検出が可能となる。
方式においては、各プロセッサが、その有する判断手段
により、共通バス経由での通信不可状態発生による通信
相手プロセッサ毎の通信要求待合せ数が所定数を越えた
か否かを判断し、通信要求待合せ数が所定数を越えたと
判断された通信相手プロセッサを障害プロセッサとして
検出する。プロセッサが障害を起こしていない場合、そ
のプロセッサを通信相手プロセッサとするプロセッサに
おいては、その通信相手プロセッサ対応の通信要求待合
せ数が所定数を越えることはないが、その通信相手ブロ
モ、すが障害を起こすと、通信要求待合せ数が所定数を
越えるので、上記の構成によって各プロセッサ毎に他の
プロセッサの障害検出が可能となる。
次に、本発明の実施例について図面を参照して詳細に説
明する。
明する。
第1図は本発明のプロセッサ障害検出方式を通用した分
散処理システムの一例を示す、この分散処理システムは
、プロセッサ間通信用バス1を介して複数のプロセッサ
2−1〜2−nが相互に接続され、各プロセッサ間でプ
ロセッサ間通信用バス1を時分割に使用して通信を行い
つつ、システムに課せられた処理を各々が分担して処理
している。
散処理システムの一例を示す、この分散処理システムは
、プロセッサ間通信用バス1を介して複数のプロセッサ
2−1〜2−nが相互に接続され、各プロセッサ間でプ
ロセッサ間通信用バス1を時分割に使用して通信を行い
つつ、システムに課せられた処理を各々が分担して処理
している。
各プロセッサ2−1〜2−nは、プロセッサ間通信機構
3−1〜3−nと、通信待合せ機構4−1〜4−nとを
含む、プロセッサ間通信機構3−1〜3−nは、プロセ
ッサ間通信用バス1経出で他のプロセッサと通信を行う
ものである。また、通信待合せ機構4−1〜4−nは、
プロセッサ間通信用バスl経由での通信の不可状態発生
時に通信要求を通信相手プロセッサ毎に待合せ、通信不
可状態が解除されしだいその待合せていた通信要求を再
処理する処理を行い、且つ、通信相手プロセッサ対応に
待合せている通信要求の数が所定数を越えたか否かを判
定し、越えているときはそのプロセッサを障害プロセッ
サと判断する判断手段とを有するものである。
3−1〜3−nと、通信待合せ機構4−1〜4−nとを
含む、プロセッサ間通信機構3−1〜3−nは、プロセ
ッサ間通信用バス1経出で他のプロセッサと通信を行う
ものである。また、通信待合せ機構4−1〜4−nは、
プロセッサ間通信用バスl経由での通信の不可状態発生
時に通信要求を通信相手プロセッサ毎に待合せ、通信不
可状態が解除されしだいその待合せていた通信要求を再
処理する処理を行い、且つ、通信相手プロセッサ対応に
待合せている通信要求の数が所定数を越えたか否かを判
定し、越えているときはそのプロセッサを障害プロセッ
サと判断する判断手段とを有するものである。
第2図は通信待合せ機構4−1〜4−〇の構成例を示す
。通信待合せ機構4−i(i=1=n)は、宛先プロセ
ッサ待合せ管理部40において、宛先プロセッサ毎の通
信要求の管理を行い、自プロセッサで発生した通信要求
がうまく処理されなかった送信不可状態時には、その通
信要求は待キュー42にキューイングされて待たされる
。そして、通信可能な状態になると、ファーストイン・
ファーストアウト方式により、待合せていた通信要求が
再処理され、宛先プロセッサへ送信が試みられる。この
ような通信要求の管理を行う宛先プロセッサ待合せ管理
部40では、各宛先プロセッサ(通信相手プロセッサ)
毎の待合せ通信要求数を保持しており、判定部41はそ
の待合せ通信要求数と予め定められた数Mとの比較によ
りプロセッサの障害の有無を判断している。
。通信待合せ機構4−i(i=1=n)は、宛先プロセ
ッサ待合せ管理部40において、宛先プロセッサ毎の通
信要求の管理を行い、自プロセッサで発生した通信要求
がうまく処理されなかった送信不可状態時には、その通
信要求は待キュー42にキューイングされて待たされる
。そして、通信可能な状態になると、ファーストイン・
ファーストアウト方式により、待合せていた通信要求が
再処理され、宛先プロセッサへ送信が試みられる。この
ような通信要求の管理を行う宛先プロセッサ待合せ管理
部40では、各宛先プロセッサ(通信相手プロセッサ)
毎の待合せ通信要求数を保持しており、判定部41はそ
の待合せ通信要求数と予め定められた数Mとの比較によ
りプロセッサの障害の有無を判断している。
第3図はそのような動作を行う通信待合せ機構4−1の
処理例を示す流れ図である。通信待合せ機構4−1は、
通信要求が発生すると、先ず、その宛先プロセッサに既
に待ちの通信要求があるか否かを調べ(Sl)、無けれ
ばその宛先プロセッサが送信中か否かを判定しくS2)
、送信中でなければプロセッサ間通信機構3−iを使用
してその宛先プロセッサへ送信を行う(S3)。また、
その宛先プロセッサに既に待ちの通信要求があるか、或
いは宛先プロセッサが送信中であれば、その宛先プロセ
ッサの通信要求待合せ数が所定値Mを越えているか否か
を調べ(S4)、越えていなければ今回の通信要求をそ
の宛先プロセッサの待キュー42にキューイングする(
S5)、反対に、その宛先プロセッサの通信要求待合せ
数が所定値Mを越えていれば、その宛先プロセッサは障
害とみなし、プロセッサ間通信機構3−1を使用して他
のプロセッサにその旨を通知する(S6)、なお、障害
とみなしたプロセッサ宛のキエーは解放され、他プロセ
ッサ宛の通信要求へ使用可能とされる。
処理例を示す流れ図である。通信待合せ機構4−1は、
通信要求が発生すると、先ず、その宛先プロセッサに既
に待ちの通信要求があるか否かを調べ(Sl)、無けれ
ばその宛先プロセッサが送信中か否かを判定しくS2)
、送信中でなければプロセッサ間通信機構3−iを使用
してその宛先プロセッサへ送信を行う(S3)。また、
その宛先プロセッサに既に待ちの通信要求があるか、或
いは宛先プロセッサが送信中であれば、その宛先プロセ
ッサの通信要求待合せ数が所定値Mを越えているか否か
を調べ(S4)、越えていなければ今回の通信要求をそ
の宛先プロセッサの待キュー42にキューイングする(
S5)、反対に、その宛先プロセッサの通信要求待合せ
数が所定値Mを越えていれば、その宛先プロセッサは障
害とみなし、プロセッサ間通信機構3−1を使用して他
のプロセッサにその旨を通知する(S6)、なお、障害
とみなしたプロセッサ宛のキエーは解放され、他プロセ
ッサ宛の通信要求へ使用可能とされる。
第4図は第1図の分散処理システムにおける動作説明図
である。プロセッサ間通信は、フレームと呼ばれる伝送
単位をブロモ・7す間通信用バス1を介してプロセッサ
間で授受することにより達成される。第4rf!Jのケ
ースKlは、プロセッサ2−1からプロセッサ2−2お
よび2−n宛のフレームが正常に送信、受信され、プロ
セッサ’l−nからプロセッサ2−2宛のフレームが正
常に送信5受信された場合を示している。このケースK
lのようにフレームの送信、受信が正常に行われシステ
ムが順調に運用されているとき、各プロセッサの通信待
合せ機構4−iにおいて各プロセッサの通信要求待合せ
数が所定値Mを越えることはない。
である。プロセッサ間通信は、フレームと呼ばれる伝送
単位をブロモ・7す間通信用バス1を介してプロセッサ
間で授受することにより達成される。第4rf!Jのケ
ースKlは、プロセッサ2−1からプロセッサ2−2お
よび2−n宛のフレームが正常に送信、受信され、プロ
セッサ’l−nからプロセッサ2−2宛のフレームが正
常に送信5受信された場合を示している。このケースK
lのようにフレームの送信、受信が正常に行われシステ
ムが順調に運用されているとき、各プロセッサの通信待
合せ機構4−iにおいて各プロセッサの通信要求待合せ
数が所定値Mを越えることはない。
第4図のケースに2は、プロセッサ2−1内で発生した
プロセッサ2−2宛および2−n宛の通信要求について
、フレームの送受信が正常に終了しないか、或いはプロ
セッサ2−1内の通信待合せ機構4−1で既にプロセッ
サ2−2宛およびプロセッサ’l−n宛の通信要求待ち
が存在していた場合を示している。このような場合、そ
れらの通信要求はプロセッサ2−1内の通信待合せ機構
4−1においてプロセッサ2−2および”l−nに対応
する待キューにキューイングされる。
プロセッサ2−2宛および2−n宛の通信要求について
、フレームの送受信が正常に終了しないか、或いはプロ
セッサ2−1内の通信待合せ機構4−1で既にプロセッ
サ2−2宛およびプロセッサ’l−n宛の通信要求待ち
が存在していた場合を示している。このような場合、そ
れらの通信要求はプロセッサ2−1内の通信待合せ機構
4−1においてプロセッサ2−2および”l−nに対応
する待キューにキューイングされる。
第4図のケースに3は、プロセッサ2−1内の通信待合
せ機構4−1において成るプロセッサに対応する通信要
求待合せ数が所定値Mを越えた場合を示している。この
ときは、そのブロモ・ノサは他のプロセッサと通信不可
になっているので障害プロセッサとみなされ、その旨が
システム内の全プロセッサに対し例えば同報通信形式の
ブロモ・ノサ障害通知フレームにより通知される。これ
により、システム内の全プロセッサが障害発生プロセッ
サを認識することができる。
せ機構4−1において成るプロセッサに対応する通信要
求待合せ数が所定値Mを越えた場合を示している。この
ときは、そのブロモ・ノサは他のプロセッサと通信不可
になっているので障害プロセッサとみなされ、その旨が
システム内の全プロセッサに対し例えば同報通信形式の
ブロモ・ノサ障害通知フレームにより通知される。これ
により、システム内の全プロセッサが障害発生プロセッ
サを認識することができる。
以上説明したように、本発明は、各プロセッサ内で通信
相手プロセッサ対応に待合せている通信要求の数が所定
数を越えることにより、その通信相手プロセッサを障害
プロセッサとして検出するものであり、プロセッサ障害
検出の為にプロセッサ間で間合せ信号や応答信号を送受
信する必要がな(なるので、その分従来方式に比べて共
通バスをシステム本来の処理の為の通信に使用すること
が可能となり、分散処理システムの処理能力を高めるこ
とができる効果がある。また、−C的に分散処理システ
ムにおいてはシステム内でプロセッサ間通信要求が高い
頻度で発生しているので、プロセッサ障害の速やかな検
出が可能となる。
相手プロセッサ対応に待合せている通信要求の数が所定
数を越えることにより、その通信相手プロセッサを障害
プロセッサとして検出するものであり、プロセッサ障害
検出の為にプロセッサ間で間合せ信号や応答信号を送受
信する必要がな(なるので、その分従来方式に比べて共
通バスをシステム本来の処理の為の通信に使用すること
が可能となり、分散処理システムの処理能力を高めるこ
とができる効果がある。また、−C的に分散処理システ
ムにおいてはシステム内でプロセッサ間通信要求が高い
頻度で発生しているので、プロセッサ障害の速やかな検
出が可能となる。
第1図は本発明の一実施例のシステム構成図、第2図は
通信待合せ機構の構成例を示す図、第3図は通信待合せ
機構の処理例の流れ図および、 第4図は本発明の実施例の動作説明図である。 図において、 1・・・プロセッサ間通信用バス 2−1〜’l−n・・・プロセッサ 3−1〜3−n・・・プロセッサ間通信機構4−1〜4
−n・・・通信待合せ機構 40・・・宛先プロセッサ待合せ管理部41・・・通信
要求待合せ数が所定値を越えたか否かを判断する判定部 42・・・待キュー
通信待合せ機構の構成例を示す図、第3図は通信待合せ
機構の処理例の流れ図および、 第4図は本発明の実施例の動作説明図である。 図において、 1・・・プロセッサ間通信用バス 2−1〜’l−n・・・プロセッサ 3−1〜3−n・・・プロセッサ間通信機構4−1〜4
−n・・・通信待合せ機構 40・・・宛先プロセッサ待合せ管理部41・・・通信
要求待合せ数が所定値を越えたか否かを判断する判定部 42・・・待キュー
Claims (1)
- 【特許請求の範囲】 複数のプロセッサが共通バスを介して相互に接続され、
各プロセッサは、前記共通バス経由で他のプロセッサと
通信を行うプロセッサ間通信機構と、前記共通バス経由
での通信の不可状態発生時に通信要求を通信相手プロセ
ッサ毎に待合せ、前記通信不可状態の解除時に前記持合
せた通信要求を再処理する通信待合せ機構とを含む分散
処理システムにおいて、 各プロセッサは、前記通信待合せ機構で通信相手プロセ
ッサ対応に待合せた通信要求の数が所定数を越えたか否
かを判断する判断手段を有し、各プロセッサは、前記判
断手段で通信要求待合せ数が所定数を越えたと判断され
た通信相手プロセッサを障害プロセッサとして検出する
ことを特徴とする分散処理システムにおけるプロセッサ
障害検出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63097661A JPH01269152A (ja) | 1988-04-20 | 1988-04-20 | 分散処理システムにおけるプロセッサ障害検出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63097661A JPH01269152A (ja) | 1988-04-20 | 1988-04-20 | 分散処理システムにおけるプロセッサ障害検出方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01269152A true JPH01269152A (ja) | 1989-10-26 |
Family
ID=14198244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63097661A Pending JPH01269152A (ja) | 1988-04-20 | 1988-04-20 | 分散処理システムにおけるプロセッサ障害検出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01269152A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016184284A (ja) * | 2015-03-26 | 2016-10-20 | Necプラットフォームズ株式会社 | インタフェース障害検出装置、インタフェース障害検出システム、インタフェース障害検出方法、及びインタフェース障害検出プログラム |
-
1988
- 1988-04-20 JP JP63097661A patent/JPH01269152A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016184284A (ja) * | 2015-03-26 | 2016-10-20 | Necプラットフォームズ株式会社 | インタフェース障害検出装置、インタフェース障害検出システム、インタフェース障害検出方法、及びインタフェース障害検出プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5386512A (en) | System for deriving and testing mutual capability set after receiving updated capability from other processors and before requesting service information | |
EP0854610A2 (en) | Ethernet communication redundancy method | |
WO2004004158A1 (en) | System and method for supporting automatic protection switching between multiple node pairs using common agent architecture | |
WO2004004180A1 (en) | Software fault tolerance between nodes | |
JPH01269152A (ja) | 分散処理システムにおけるプロセッサ障害検出方式 | |
JP4131263B2 (ja) | マルチノードシステム、ノード装置、ノード間クロスバスイッチ及び障害処理方法 | |
JPH01217666A (ja) | マルチプロセッサシステムの障害検出方式 | |
JP2633351B2 (ja) | 制御装置の故障検出機構 | |
JPH11177550A (ja) | ネットワークの監視方式 | |
JPH05225161A (ja) | ネットワーク監視方式 | |
JPH05224964A (ja) | バス異常通知方式 | |
JPH0248736A (ja) | 情報処理システム | |
JPH08329023A (ja) | 並列電子計算機システム | |
JPS6224358A (ja) | 信号ル−テイングテ−ブル方式 | |
JPH03210654A (ja) | 分散制御処理装置 | |
JPH0223740A (ja) | 通信ネットワークシステム | |
JPH0628407A (ja) | データベースシステム | |
JP2848442B2 (ja) | 任意メッセージデータ判別方式 | |
JPH04281535A (ja) | 情報処理装置、待機冗長型システムおよび待機冗長型システムの主系と待機系との間でチェックポイントをとる方法 | |
JPS62293453A (ja) | 多重バス方式デ−タ処理装置 | |
JPH08147255A (ja) | 障害監視方式 | |
JPH08161277A (ja) | 並列計算機システム | |
JPH04178099A (ja) | 監視制御システム | |
JPS6383857A (ja) | マルチプロセツサシステムにおけるプロセツサ輻輳制御方式 | |
JPH0463419B2 (ja) |