JPH05233578A - 障害装置の縮退方式 - Google Patents

障害装置の縮退方式

Info

Publication number
JPH05233578A
JPH05233578A JP4035182A JP3518292A JPH05233578A JP H05233578 A JPH05233578 A JP H05233578A JP 4035182 A JP4035182 A JP 4035182A JP 3518292 A JP3518292 A JP 3518292A JP H05233578 A JPH05233578 A JP H05233578A
Authority
JP
Japan
Prior art keywords
bus
processor module
failure
cycle monitoring
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4035182A
Other languages
English (en)
Inventor
Yoshihisa Ono
嘉久 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4035182A priority Critical patent/JPH05233578A/ja
Publication of JPH05233578A publication Critical patent/JPH05233578A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【目的】本発明は、バスに接続される処理装置に障害が
発生した際に、該処理装置を切り離して縮退運転を行う
障害装置の縮退方式に関し、構成部位で障害が発生して
もシステム全体のダウンを回避することができ、稼動率
や信頼性を向上させることのできる障害装置の縮退方式
を提供することを目的とする。 【構成】複数の処理装置101 〜10n が共通のバス1
1に接続されてなるシステムにおいて、前記各処理装置
101 〜10n は、所定周期時間の間に所定値の再設定
がなければ障害が発生した旨の信号を発生する周期監視
手段20と、該周期監視手段20が出力する信号に応じ
て、該処理装置101 〜10n と前記バス11とを電気
的に接続し又は切離す接離手段21と、を具備し、前記
各処理装置101 〜10n の周期監視手段20が、障害
が発生した旨の信号を発生した際に、前記接離手段21
を駆動して該処理装置101 〜10n と前記バス11と
を電気的に切離すように構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、バスに接続される処理
装置に障害が発生した際に、該処理装置を切り離して縮
退運転を行う障害装置の縮退方式に関する。
【0002】近年、システムバスに複数のプロセッサモ
ジュール(処理装置)を接続し、プロセッサモジュール
間で通信を行いながら処理を進めることにより分散処理
を実現し、トータルとして処理の高速化・効率化を企図
したシステムが多数開発されている。
【0003】かかるシステムでは、システムバスに接続
される所定のプロセッサモジュールに障害が発生して
も、システム全体が稼働停止に至ることを極力回避する
ことが望まれている。
【0004】
【従来の技術】従来、1つのシステムバスを有し、この
システムバスに複数のプロセッサモジュールが接続され
る一重化構成のルーチン値プロセッサシステムとして、
例えば図4に示すものが知られている。
【0005】図において、501 〜504 はプロセッサ
モジュール群であり、51はシステムバスである。かか
る構成のシステムでは、例えばプロセッサモジュール5
3に障害が発生すると、該プロセッサモジュール50
3 の異常動作により、例えば図の×点でシステムバス5
1に影響を与える。
【0006】このような事態が発生すると、システムバ
ス51に接続される他の正常なプロセッサモジュール間
の通信も不可能になる場合があり、システムダウンにつ
ながるおそれがある。
【0007】また、上記のようなマルチプロセッサシス
テムでは、そのシステムの信頼性を向上させる目的で、
多重化による冗長構成がとられる場合もある。n重化さ
れたマルチプロセッサシステムの構成例を図5に示す。
【0008】図において、501 〜504 は第1のプロ
セッサモジュール群であり、51は第1のシステムバス
である。また、521 〜524 は第2のプロセッサモジ
ュール群であり、53は第2のシステムバスである。
【0009】このような構成のシステムにおいても、n
重障害、例えばプロセッサモジュール503 及びプロセ
ッサモジュール522 に障害が発生すると、プロセッサ
モジュール503 及び522 の異常動作により、例えば
図の×点でシステムバス51及び53に影響を与える。
この場合も、上記一重化構成の場合と同様に、冗長構成
であるにも拘わらずシステムダウンにつながる。
【0010】
【発明が解決しようとする課題】このように、従来のシ
ステムでは、システムの構成部位(プロセッサモジュー
ル)の障害がシステムバスにまで波及してシステム全体
に影響を与え、稼動率や信頼性を著しく低下させる要因
の一つとなっているという欠点があった。
【0011】本発明は、上記事情に鑑みてなされたもの
で、システムの構成部位で障害が発生してもシステム全
体のダウンを回避することができ、稼動率や信頼性を向
上させることのできる障害装置の縮退方式を提供するこ
とを目的とする。
【0012】
【課題を解決するための手段】本発明の障害装置の縮退
方式は、図1に原理的に示すように、複数の処理装置1
1 〜10n が共通のバス11に接続されてなるシステ
ムにおいて、前記各処理装置101 〜10n は、所定周
期時間の間に所定値の再設定がなければ障害が発生した
旨の信号を発生する周期監視手段20と、該周期監視手
段20が出力する信号に応じて、該処理装置101 〜1
n と前記バス11とを電気的に接続し又は切離す接離
手段21と、を具備し、前記各処理装置101 〜10n
の周期監視手段20が、障害が発生した旨の信号を発生
した際に、前記接離手段21を駆動して該処理装置10
1 〜10n と前記バス11とを電気的に切離すことを特
徴とする。
【0013】
【作用】本発明は、処理装置101 〜10n 内部におい
て、周期監視手段20に定期的に所定値を再設定し、例
えばハードウエア障害やソフトウエア障害が発生して所
定時間内に上記周期監視手段20に所定値を設定できな
かった場合に、当該処理装置に障害が発生したものとし
て、上記周期監視手段20は障害が発生した旨の信号を
発生する。
【0014】この周期監視手段20で発生した障害が発
生した旨の信号が接離手段21に与えられることによ
り、処理装置101 〜10n とバス11との間が電気的
に切り離される。
【0015】これにより、障害を発生した処理装置は当
該システムから切り離されて縮退運転に入るが、残りの
処理装置により、本来の性能・機能とはいえないまでも
運転を続行することができ、システムダウンは免れる。
これによりシステムの稼動率や信頼性が飛躍的に向上す
る。
【0016】
【実施例】以下、本発明の実施例につき図面を参照しな
がら説明する。なお、図1と同一又は相当部分には同一
符号を付して説明する。
【0017】図2は、本発明の障害装置の縮退方式が適
用されるマルチプロセッサシステムの要部の構成例を示
すブロック図である。
【0018】図において、11はシステムバスであり、
該システムバス11に複数のプロセッサモジュールが接
続されてマルチプロセッサシステムが構成される。この
システムバス11を介してプロセッサモジュール相互間
でデータの送受が行われ、分散処理機能が実現される。
【0019】12は状態表示バスであり、この状態表示
バス12を介して各プロセッサモジュールの状態情報
が、プロセッサモジュール相互間で送受される。これに
より、各プロセッサモジュールは、他のプロセッサモジ
ュールの状態(例えば、所定のプロセッサモジュールが
縮退状態にあるか否か)を知ることができ、システム全
体の状態に応じた処理を行うことができるようになって
いる。
【0020】10は複数のプロセッサモジュールの中の
1つである。上記システムバス11及び状態表示バス1
2には複数のプロセッサモジュールが接続されるが、各
プロセッサモジュールの構成は同じであるので、図で
は、代表して1つのプロセッサモジュール10のみを示
している。
【0021】プロセッサモジュール10は、中央処理装
置(CPU)30を有し、該CPU30は、プロセッサ
モジュール全体を制御する。このCPU30には、内部
バス13を介してメモリ31、周辺コントローラ32、
レジスタ群33及びバス接続部21が接続されている。
また、このCPU30には、当該プロセッサモジュール
の各部からのハードウエア障害を示す信号が供給される
ようになっている。
【0022】メモリ31は、例えばリードオンリメモリ
(ROM)やランダムアクセスメモリ(RAM)で構成
される。このメモリ31には、上記CPU30を動作さ
せるための制御プログラムが格納される他、処理に必要
な種々のデータが記憶される。上記CPU30は、この
メモリ31に記憶された制御プログラムに従って動作す
ることになる。
【0023】周辺コントローラ32は、当該プロセッサ
モジュール10を構成する種々の制御部(図示しない)
を総括的に示したものである。CPU30は、この周辺
コントローラ32を介して当該プロセッサモジュール1
0の各部を制御する。
【0024】レジスタ群33は、CPU30の処理に使
用される複数のレジスタにより構成されるものである。
このレジスタ群33の中の1つは、後述する状態収集装
置35から送られてくる他のプロセッサモジュールの状
態情報をCPU30に受け渡すために使用される。
【0025】バス接続部21は、システムバス11との
インタフェースとして作用するものである。即ち、バス
接続部21は、内部バス13とシステムバス11とを電
気的に接続し又は切り離すスイッチ機能を司るものであ
る。このバス接続部21は、例えばフォトMOSリレー
により構成され、後述する周期監視装置20から送られ
てくる切離し信号に応じて開閉する。
【0026】このバス接続部21にフォトMOSリレー
を使用することにより、従来の機械式リレーにおいて発
生した接点のバウンズに伴うチャタリングの問題が解消
され、システムバス11、つまり他のプロセッサモジュ
ールに影響を与えないで、当該プロセッサモジュール1
0をシステムから切離し又は再接続できるものとなって
いる。
【0027】このことは、当該マルチプロセッサシステ
ムの電源を遮断することなく、プロセッサモジュールを
挿抜する、所謂、活線挿抜ができることを意味する。こ
れにより、障害発生時にプロセッサモジュールを取り替
える際は勿論、保守作業等においてプロセッサモジュー
ルを交換する場合等も、システムを停止させる必要がな
い。
【0028】また、上記CPU30には、周期監視装置
20が接続されている。この周期監視装置20は、例え
ばウオッチドグタイマで実現される。周期監視装置20
は、所定時間T2の計時容量を有し、CPU30とは非
同期に動作するものである。周期監視装置20に、タイ
マ値として時間T2に対応するデータをセットすると、
時間T2の経過後にウオッチドグタイマのランアウトを
示す信号が出力される。
【0029】したがって、上記ランアウト信号の発生を
抑止するためには、上記時間T2より短い時間T1の周
期で、新たなタイマ値を再設定しなければならない。こ
の実施例では、再設定するタイマ値は、時間T2に対応
するデータとする。
【0030】上記ランアウト信号は、切離し信号として
バス接続部21に供給され、フォトMOSリレーの駆動
制御に使用されるとともに、障害通知装置34にも供給
されるようになっている。
【0031】障害通知装置34は、周期監視装置20か
らの切離し信号を受け、当該プロセッサモジュール10
に障害が発生した旨の情報を状態表示バス12に出力す
る。また、障害通知装置34は、状態表示器22を駆動
する。状態表示器22は、例えばLEDにより構成され
るものである。この状態表示器22のLED点灯は、上
記周期監視装置20からの切離し信号を受けた障害通知
装置34により制御される。
【0032】このように、障害を発生したプロセッサモ
ジュールのLEDが点灯されることにより、障害を発生
したプロセッサモジュールを一見して認識することがで
きるので、モジュール交換時の障害装置の切り分け作業
が不要となる。
【0033】さらに、この障害通知装置34は、障害を
検出した旨の信号を、例えば外部遠隔地に設置された集
中監視装置(図示しない)へ出力するための無電圧ルー
プ接点(図示しない)を備えている。この無電圧ループ
接点からの信号を受け取った集中監視装置では、各プロ
セッサモジュールからの障害が発生した旨の信号を受信
して表示することにより、当該マルチプロセッサシステ
ム全体の稼働状況を即座に認識できるように構成するこ
とができ、無人運転時の遠隔監視が可能となる。
【0034】23は手動切換スイッチである。この手動
切換スイッチ23の設定状態を示す信号は、バス接続部
21に供給されるようになっている。この手動切換スイ
ッチ23が出力する信号は、上記周期監視装置20が信
号する切離し信号と同様の性格を有する信号である。し
たがって、手動切換スイッチ23を操作することによ
り、任意のタイミングで当該プロセッサモジュール10
をシステムバス11から切り離すことができる。
【0035】これにより、定期保守時等のように、プロ
セッサモジュールをシステムから切り離す必要が生じた
場合にも、上記バス接続装置21にフォトMOSリレー
を使用したことと相まって活線挿抜が可能となり、シス
テムを停止させないで保守作業を行うことができる。
【0036】35は状態収集装置である。この状態収集
装置35は、状態表示バス12に流されているデータを
受け取って、レジスタ群33の中の特定のレジスタに書
き込む処理を行うものである。CPU30は、上記レジ
スタを参照することにより、他のプロセッサモジュール
の状態を知ることができるようになっている。
【0037】次に、上述した構成において、この実施例
の動作につき、図3のフローチャートを参照しながら説
明する。なお、図3ではプロセッサモジュールの処理の
うち、障害検出に関する処理についてのみ示している。
【0038】プロセッサモジュールの障害には、大きく
分けてソフトウエア障害とハードウエア障害とがある。
この発明では、上記どちらの場合も周期監視装置20の
タイムアウト(ランアウト)を契機にバス切離しを指示
する切離し信号を発生させることになる。
【0039】障害検出に関する処理では、先ず、ハード
ウエア障害があるか否かが調べられる(ステップS1
0)。これは、プロセッサモジュール10内の各部に設
けられているハードウエア障害を検知した旨を記憶する
レジスタ(図示しない)をスキャンすることにより行わ
れる。
【0040】ここで、ハードウエア障害がないことが判
断されると、ソフトウエア障害があるか否かが調べられ
る(ステップS11)。ここで調べられるソフトウエア
障害は、ソフトウエアに論理矛盾があるか否かである。
【0041】そして、ソフトウエア障害がないことが判
断されると、周期監視装置20から、現在のタイマ値が
読み出される(ステップS12)。次いで、該タイマ値
が時間T1より大きいか否か、つまり前回設定した時刻
から時間T1が経過したか否かが調べられる(ステップ
S13)。ここで、タイマ値が時間T1より大きくない
ことが判断されると、ステップS10へ戻り、上述した
と同様の動作を繰り返し実行する。
【0042】かかる繰り返し実行の過程において、ステ
ップS13で、タイマ値が時間T1より大きいことが判
断されると、周期監視装置20に、時間T2に対応する
データを設定する(ステップS14)。その後、ステッ
プS10へ戻る。
【0043】以上までに説明した動作は、当該プロセッ
サモジュールが正常な場合の動作である。即ち、周期監
視機構20がランアウトを生じない周期T1で周期監視
機構20のタイマ値を更新しながら処理が継続される。
【0044】上記繰り返し実行の過程で、ステップS1
0でハードウエア障害が検出された場合、及びソフトウ
エア障害が検出された場合は、CPU30は停止状態に
移行される(ステップS15)。これはCPU30自ら
が、当該CPU30をホルト(HALT)状態にする信
号を駆動することにより実現される。
【0045】このようにして、CPU30の動作が停止
されると、周期監視装置20のタイマ値を更新する動作
は行われない。一方、周期監視装置20の動作自体は停
止しないので、前回のタイマ値の設定から時間T2が経
過することによりランアウトとなり、切離し信号が発生
される。これによりシステムバス11の切離しが行われ
ることになる(ステップS16)。
【0046】即ち、周期監視装置20から切離し信号が
バス接続部21に供給されることにより、バス接続部2
1のフォトMOSリレーが駆動され、内部バス13とシ
ステムバス11とが電気的に切り離される。
【0047】また、上記切離し信号は、障害通知装置3
4にも供給される。障害通知装置34は、当該プロセッ
サモジュール10に障害が発生した旨のデータを状態表
示バス12に流す。これにより、他の全プロセッサモジ
ュールに対し、自プロセッサモジュールが縮退している
ことを通知する。
【0048】上記障害が発生した旨のデータを受信した
他のプロセッサモジュールは、該データを状態収集装置
35及びレジスタ群33を介してCPU30に取り込
む。そして、CPU30は、障害を発生したプロセッサ
モジュールを切り離しても動作可能な状態にシステムを
再構築し、縮退運転に入る。
【0049】また、障害通知装置34は、状態表示器2
2を駆動してLEDを点灯させる。これにより、例えば
オペレータは、どのプロセッサモジュールに障害が発生
したかを容易に知ることができる。
【0050】さらに、障害通知装置34は、無電圧ルー
プ接点を駆動して、障害が発生した旨の信号を外部に送
出する。この信号を受信する外部装置として例えば集中
監視装置が遠隔地に設けられている構成では、所定の一
か所で当該マルチプロセッサシステムの稼働状態を知る
ことができる。
【0051】なお、上述したハードウエア障害、ソフト
ウエア障害以外に、例えば直接CPU30の停止につな
がるようなハードウエア障害が発生した場合、あるい
は、アプリケーションプログラムでループに陥るような
ソフトウエア障害が生じた場合も、周期監視装置20の
タイマ値の再設定が行われないことになるので、上記と
同様の動作により当該プロセッサモジュールが切り離さ
れ、縮退運転に入る。
【0052】なお、上記実施例では、ハードウエア障害
やソフトウエア障害が検出された場合は、直ちに当該プ
ロセッサモジュールの切離しを行うように構成したが、
所定回数のリトライを行い、それでも障害が復旧しない
場合に、プロセッサモジュールの切離しを行うように構
成しても良い。
【0053】上記リトライは、当該プロセッサモジュー
ル自体をリセットした後に、再度同じ動作を行わせるこ
とにより実現される。
【0054】かかる構成とすることにより、リトライに
より障害が救済された場合は縮退運転をする必要がな
く、システム全体の稼動率・信頼性はさらに向上する。
【0055】
【発明の効果】以上詳述したように、本発明によればシ
ステムの構成部位で障害が発生してもシステム全体のダ
ウンを回避することができ、稼動率や信頼性を向上させ
ることのできる障害装置の縮退方式を提供することがで
きる。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明が適用されるマルチプロセッサシステム
の実施例の要部の構成を示すブロック図である。
【図3】図2に示したプロセッサモジュールの動作を示
すフローチャートである。
【図4】従来の一重化されたシステムバスを有するマル
チプロセッサシステムの例を示す図である。
【図5】従来の多重化されたシステムバスを有するマル
チプロセッサシステムの例を示す図である。
【符号の説明】
101 〜10n プロセッサモジュール(処理装置) 11 システムバス(バス) 20 周期監視装置(周期監視手段) 21 バス接続部(接離手段) 22 状態表示器(表示手段) 23 手動切換スイッチ(操作手段)

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数の処理装置(101〜10n ) が共通のバ
    ス(11)に接続されてなるシステムにおいて、 前記各処理装置(101〜10n ) は、 所定周期時間の間に所定値の再設定がなければ障害が発
    生した旨の信号を発生する周期監視手段(20)と、 該周期監視手段(20)が出力する信号に応じて、該処理装
    置(101〜10n ) と前記バス(11)とを電気的に接続し又は
    切離す接離手段(21)と、を具備し、 前記各処理装置(101〜10n ) の周期監視手段(20)が、障
    害が発生した旨の信号を発生した際に、当該処理装置(1
    01〜10n ) の接離手段(21)を駆動して該処理装置(101
    10n ) と前記バス(11)とを電気的に切離すことを特徴と
    する障害装置の縮退方式。
  2. 【請求項2】 請求項1において、各処理装置(101〜10
    n ) は、周期監視手段(20)が、障害が発生した旨の信号
    を発生したことを表示する表示手段(22)を備えたことを
    特徴とする障害装置の縮退方式。
  3. 【請求項3】 請求項1又は2において、手動操作によ
    り接離手段(21)を作動せめる操作手段(23)を設け、該操
    作手段(23)により前記接離手段(21)を駆動して前記処理
    装置(101〜10n ) と前記バス(11)とを接続し又は切り離
    すことを特徴とする障害装置の縮退方式。
JP4035182A 1992-02-21 1992-02-21 障害装置の縮退方式 Withdrawn JPH05233578A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4035182A JPH05233578A (ja) 1992-02-21 1992-02-21 障害装置の縮退方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4035182A JPH05233578A (ja) 1992-02-21 1992-02-21 障害装置の縮退方式

Publications (1)

Publication Number Publication Date
JPH05233578A true JPH05233578A (ja) 1993-09-10

Family

ID=12434711

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4035182A Withdrawn JPH05233578A (ja) 1992-02-21 1992-02-21 障害装置の縮退方式

Country Status (1)

Country Link
JP (1) JPH05233578A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7373382B2 (en) 2000-10-03 2008-05-13 Sharp Kabushiki Kaisha Electronic apparatus, information communications apparatus, management system for same electronic apparatus, and management method for same electronic apparatus
JP2009069939A (ja) * 2007-09-11 2009-04-02 Meidensha Corp マルチcpuシステム移行方法及びcpuシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7373382B2 (en) 2000-10-03 2008-05-13 Sharp Kabushiki Kaisha Electronic apparatus, information communications apparatus, management system for same electronic apparatus, and management method for same electronic apparatus
JP2009069939A (ja) * 2007-09-11 2009-04-02 Meidensha Corp マルチcpuシステム移行方法及びcpuシステム

Similar Documents

Publication Publication Date Title
US4500951A (en) Plant control system
US5086384A (en) Master-slave-type control system with stand-by suspending control station
JPH07334382A (ja) マルチコントローラシステム
KR100279204B1 (ko) 자동제어시스템에서현장제어장치의콘트롤러이중화제어방법및그장치
JPH05233578A (ja) 障害装置の縮退方式
JPH0223120B2 (ja)
JPH06236299A (ja) システム監視方法及び監視装置
JP2000353154A (ja) 障害監視システム
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体
JPH03253945A (ja) データ処理システムの異常回復処理機能確認方式
JP2007026038A (ja) パス監視システム,パス監視方法,およびパス監視プログラム
JPS6290068A (ja) 予備系監視方式
JP3318926B2 (ja) 時刻同期方式
JPS60247750A (ja) システム初期構成制御方式
JP3042034B2 (ja) 障害処理方式
JP3133704B2 (ja) 装置の組み込み方式
JP2699904B2 (ja) ネットワークシステム
JPH0237433A (ja) 多重プロセッサシステムの監視方法
JPH063919B2 (ja) 負荷制御システム
JPH0454747A (ja) データ転送システム
JP2000148540A (ja) プロセッサシステム
JPH08194628A (ja) バス障害処理方式
JPH0588926A (ja) 監視制御系の自動切替回路
JPH11184734A (ja) Cpuの相互監視装置
JPH07183889A (ja) Atm交換機における各装置のオンライン試験方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990518