JPH0573344A

JPH0573344A - 計算機システム

Info

Publication number: JPH0573344A
Application number: JP3232866A
Authority: JP
Inventors: Hirokazu Kawabata; 宏和川端
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1991-09-12
Filing date: 1991-09-12
Publication date: 1993-03-26

Abstract

(57)【要約】（修正有）【目的】重大な故障が発生した制御用計算機から管理
用計算機が故障情報を得られなくなっても、故障した制
御用計算機の初期化処理のための初期化プログラム実行
中において故障発生した制御用計算機内に保存されてい
る故障情報を管理用計算機に送信する。【構成】管理用計算機と複数の制御用計算機2-１〜2-
Ｎとがシステムバス３で接続されており、各制御用計算
機2-１〜2-Ｎで、自己診断部6-１〜6-Ｎから時間監視部
10-1〜10-Nに一定時間内に自己診断結果が送られてこな
いと自制御用計算機2-１〜2-Ｎを自動的にリセットする
自動リセット実行部11-1〜11-Nを備え、また外部から入
力されたリセット指令に従って自動リセット実行部11-1
〜11-Nに強制的にリセットを行わせる管理用計算機指令
実行部14-1〜14-Nを備える。すべての制御用計算機2-１
〜2-Ｎそれぞれが自身の故障情報を直接外部出力する情
報表示部13-1〜13-Nを有する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はマルチプロセッサ構成の
計算機システムに関する。

【０００２】

【従来の技術】図１は例えば特開昭64-72242号公報に開
示された従来のマルチプロセッサ構成の計算機システム
の構成を示すブロック図である。

【０００３】図１において、参照符号31は管理用計算機
(以下、管理CPU という) であり、情報表示器とオペレ
ータによる種々の指令を入力する入力部とを兼ねるシス
テムコンソール34が接続されている。参照符号32, 33は
マルチプロセッサ構成の２台の制御用計算機（以下、制
御CPU という）であり、管理CPU 31とは、システムバス
35で相互に接続されている。

【０００４】管理CPU 31には故障情報格納領域39が設け
られている。この故障情報格納領域39は、両制御CPU 3
2, 33からシステムバス35を介して送られてきたそれぞ
れの故障情報を格納するために設けられている。

【０００５】制御CPU 32, 33は同一の内部構成を有して
いる。即ち、参照符号36A, 36Bはバッテリバックアップ
メモリであり、各制御CPU 32, 33内において、それぞれ
の故障情報を蓄える。また、37A, 37Bは通信用バッファ
であり、システムバス35を介して各バッテリバックアッ
プメモリ36A, 36Bの内容を管理CPU31へそれぞれ送信す
るために備えられている。更に、38A, 38Bはそれぞれ制
御CPU 32, 33に取り付けられたウォッチドッグタイマ(W
DT) であり、各制御CPU 32, 33における暴走状態発生か
らある一定時間経過後にタイムアップして制御CPU 32,
33を強制停止させる。

【０００６】次に故障発生時の動作について図２のフロ
ーチャートを参照して説明する。

【０００７】例えば、制御CPU 32において故障が発生し
(ステップS11)、その後、故障した制御CPU 32のプログ
ラムが暴走状態に陥ったとする (ステップS12)。制御CP
U 32内では故障情報が収集されてバッテリバックアップ
メモリ36A に格納される (ステップS13)。暴走開始後あ
る一定時間が経過すると制御CPU 32のウォッチドッグタ
イマ38A がタイムアップして、例えば、制御CPU 32, 33
への電源供給を遮断する等により両制御CPU 32, 33を強
制的に停止させる (システムS14)。この際、制御CPU 32
のバッテリバックアップメモリ36A には、暴走開始時点
から電源遮断直前までの制御CPU 32の内部状態及び故障
履歴が故障情報として記憶される。

【０００８】一方、管理CPU 31は制御CPU 32, 33の強制
停止とは関係なく稼働状態にあり、システムバス35を介
して制御CPU 32, 33のいずれがダウンしたかを特定し、
システムコンソール34を用いてオペレータに通知する。
この通知に従ってオペレータは、制御CPU 32, 33の再立
ち上げを行う (ステップS15)。

【０００９】両制御CPU 32, 33は再立ち上げ処理に際し
て自身の初期化を行うが (ステップS16)、その際に故障
発生した制御CPU 32は自身のバッテリバックアップメモ
リ36A に保存されている故障情報を通信用バッファ37A
にバッファリングし、システムバス35を介して管理CPU
31へ転送する (ステップS17)。

【００１０】管理CPU 31は、制御CPU 32から転送された
故障情報を例えばメモリで構成される故障情報格納領域
39に保存する(ステップS18)。この故障情報格納領域39
に保存された故障情報は、オペレータからの要求があれ
ばそれ従ってシステムコンソール34へ表示出力されるこ
とによりオペレータに提示される (ステップS19)。

【００１１】

【発明が解決しようとする課題】上述のような特開昭64
-72242号公報に開示された従来の計算機システムでは、
管理用計算機からオペレータへの故障情報の提供は、す
べての制御用計算機の電源が遮断された後に電源を再投
入する等してシステムの再立ち上げ処理が終了した後に
限られる。このため、オペレータは故障発生時に直ちに
故障発生用計算機に関する故障情報の入手, 故障要因解
析及び復旧作業等を行うことが出来ないという問題点が
ある。

【００１２】また、すべての制御用計算機の電源を遮断
する等してシステムの再立ち上げを行うため、一つの制
御用計算機の故障発生によってマルチプロセッサ構成の
計算機システム全体が一旦停止するため、マルチプロセ
ッサ構成の利点を損なうという問題点もある。

【００１３】更に、故障が発生した制御用計算機に関す
る故障情報を管理用計算機がオペレータに提供する以前
に管理用計算機自身が故障した場合には、オペレータは
故障が発生した制御用計算機の情報を全く入手できない
という問題点もある。

【００１４】本発明は上述のような問題点を解決するた
めになされたものであり、マルチプロセッサ構成の計算
機システム全体には影響を与えずに、例えば暴走などの
重大な故障を発生した制御用計算機から管理用計算機が
故障情報を得られなくなった場合にも、故障した制御用
計算機が持つ自動リセット機能またはオペレータからの
リセット指令により、故障した制御用計算機の初期化処
理のための初期化プログラム実行中において故障発生し
た制御用計算機内に保存されている故障情報を管理用計
算機に送信することにより、オペレータに故障情報を提
示し得る計算機システムの提供を目的とする。

【００１５】また、故障発生した制御用計算機の故障情
報を管理用計算機が表示出力する以前に管理用計算機が
故障を発生して故障情報を表示できなくなった場合に
も、故障を発生した制御用計算機から直接故障情報を直
接出力することが可能な計算機システムの提供を目的と
する。

【００１６】

【課題を解決するための手段】本発明に係る計算機シス
テムは、管理用計算機と複数の制御用計算機とがシステ
ムバスで接続されており、各制御用計算機は自己診断部
と、自己診断部による自己診断の結果が故障発生であっ
た場合にオンされる故障発生フラグと、故障発生時に故
障情報を格納する故障情報格納部と、故障情報を管理用
計算機へ送信する送信部と、管理用計算機からの指令を
受信するための受信部と、受信部がリセット指令を受信
した場合に、リセット処理を起動し、且つ故障発生フラ
グがオンであればリセット処理中に故障情報を管理用計
算機へ送信する自動リセット実行部と、それぞれが自身
の故障情報を直接外部出力し得る情報表示器とを有して
いる。

【００１７】

【作用】本発明の計算機システムでは、マルチプロセッ
サ構成の計算機システム全体には影響を与えずに、各制
御用計算機あてに入力されたリセット指令に応じて、故
障発生した制御用計算機においてそれぞれリセット処理
が実行され、このリセット地理実行中に故障情報が管理
用計算機へ送信され、管理用計算機ではそれを記憶する
と共に情報表示器に表示する。また、各制御用計算機に
備えられている補助情報表示器にもそれぞれの制御用計
算機の故障情報が表示されるので、管理用計算機が故障
した場合にも、それぞれの制御用計算機において直接そ
の故障情報が表示される。

【００１８】

【実施例】以下、本発明をその実施例を示す図面に基づ
いて詳述する。

【００１９】図３は本発明のマルチプロセッサ構成の計
算機システムの構成の一実施例を示すブロック図であ
る。

【００２０】図３において、参照符号１は管理用計算機
(以下、管理CPU という) であり、情報表示器とオペレ
ータによる種々の指令を入力する入力部とを兼ねるシス
テムコンソール24が接続されている。参照符号2-１〜2-
Ｎはそれぞれマルチプロセッサ構成の複数の制御用計算
機（以下、制御CPU という）であり、３は管理CPU １と
各制御CPU 2-１〜2-Ｎとの間を接続するシステムバスで
ある。

【００２１】なお、各制御CPU 2-１〜2-Ｎにはそれぞれ
補助情報表示器としての補助用コンソール12-1〜12-Nが
接続されている。

【００２２】各制御CPU 2-１〜2-Ｎの構成は同一であ
り、ここでは制御CPU 2-Ｎを例にしてその詳細を示す図
４のブロック図を参照して説明する。

【００２３】図４において、参照符号4-Ｎはメッセージ
送信部であり、管理CPU １へ自己診断結果, 故障情報等
を送信する。

【００２４】5-Ｎはメッセージ受信部であり、管理CPU
１から送られてきた指令あるいは他の各制御CPU 2-１〜
2-N-1 からそれぞれの故障状態のメッセージなどを受信
する。

【００２５】6-Ｎは自己診断部であり、自制御CPU 2-Ｎ
に故障が発生しているか否かを常時自己診断している。

【００２６】7-Ｎは故障情報収集部であり、自己診断部
6-Ｎにより起動されて、故障情報を収集する。

【００２７】8-Ｎは故障発生フラグであり、自己診断部
6-N による自己診断が行われた場合に故障／正常状態の
自己診断結果に応じてオン／オフされる。この故障発生
フラグ8-Ｎは、例えば、バッテリバックアップメモリで
構成されている。

【００２８】9-Ｎは故障情報格納部であり、自己診断部
6-Ｎが収集した故障情報を格納する。この故障情報格納
部9-Ｎは、例えば、バッテリバックアップメモリで構成
されている。

【００２９】10-Nは時間監視部であり、自己診断部6-Ｎ
から一定時間内に自己診断結果を受信することにより自
制御CPU 2-Ｎが有する自動リセット機能を起動する信号
の発生を抑止して自動リセット機能の起動を禁じる。

【００３０】11-Nは自動リセット実行部であり、時間監
視部10-Nが発生する自動リセット指令を受けて、故障発
生フラグ8-Ｎのオン／オフ状態をチェックし、フラグが
オンであればイニシャル処理の実行中に故障情報格納部
9-Ｎに格納されている故障情報を管理CPU １へ送信する
初期化プログラムを内蔵している。

【００３１】13-Nは故障情報表示部であり、補助用コン
ソール12-Nに故障情報格納部9-Ｎの内容を表示する制御
を行う。

【００３２】14-Nは管理CPU 指令実行部であり、管理CP
U１から送られてくる復旧作業指令あるいはリセット指
令等を実行する。

【００３３】15-Nは他CPU 故障発生情報管理部であり、
他の制御CPU2-1〜2-N-1 の故障発生情報を管理する。

【００３４】また図５は管理CPU １の詳細な構成を説明
するブロック図である。図５において、参照符号21はメ
ッセージ受信部であり、各制御CPU 2-１〜2-Ｎからシス
テムバス３を介して送られて来る自己診断結果，故障情
報などを受信する。

【００３５】22は制御CPU 故障監視部であり、各制御CP
U 2-１〜2-Ｎからシステムバス３を介して送られてくる
自己診断結果を監視すると共に故障情報を解析する。

【００３６】23は故障CPU 故障情報格納部であり、各制
御CPU 2-１〜2-Ｎから送られてきた故障情報を格納す
る。

【００３７】25はオペレータインタフェイス部であり、
制御CPU 故障監視部22から各制御CPU 2-１〜2-Ｎの状態
及び故障情報を得てシステムコンソール24に表示する。

【００３８】26はメッセージ送信部であり、各制御CPU
2-１〜2-Ｎに種々の指令を送信する。

【００３９】27は制御CPU 指令部であり、各制御CPU 2-
１〜2-Ｎに対して、オペレータから入力された指令をメ
ッセージ送信部26に伝える。

【００４０】以上のような構成の本発明のマルチプロセ
ッサ構成の計算機システムの動作について以下に説明す
る。

【００４１】まず、本発明の計算機システムについて、
故障が発生していない状態から、ある制御CPU に故障が
発生した場合の制御CPU 及び管理CPU の動作を説明す
る。続いて、故障が発生した制御CPU に管理CPU １を通
じてオペレータからリセット指令が送られた場合、また
は制御CPU で発生した故障が例えば暴走などの重大な故
障であり、故障情報が管理CPU １に送れなくなった場合
の故障が発生した制御CPU の動作を説明する。

【００４２】なお、故障発生時の各制御CPU の動作を図
６のフローチャートに、管理CPU の動作を図７のフロー
チャートにそれぞれ示す。但し、制御CPU の台数は本質
的には特に限定されないが、説明の簡略化のため、ここ
では２台の場合を考える。

【００４３】いま、本発明の計算機システムが立ち上げ
処理が既に終了し、正常に稼動している状態にあるとす
る。各制御CPU 2-１〜2-Ｎの各自己診断部6-１〜6-Ｎは
既に自CPU の自己診断を実行している (ステップS20)。
自己診断の結果、故障が発生していなければ (ステップ
S21)、各制御CPU 2-１〜2-Ｎ内の各故障発生フラグ8-１
〜8-Ｎはそれぞれオフにされ (ステップS30)、各自己診
断部6-１〜6-Ｎによる自己診断結果がそれぞれの時間監
視部10-1〜10-Nに通知される。

【００４４】その後、管理CPU １から、例えばシステム
操業関連の指令が送られていたのであれば、その指令に
従った処理が実行され（ステップS26, S27, S28)、送ら
れていなかったのであれば自己診断が続行される (ステ
ップS29)。

【００４５】この状態において、制御CPU 2-１に継続実
行可能な故障が発生したとする。制御CPU 2-１の自己診
断部6-１は、自CPU において故障が発生したと診断し
(ステップS21)、故障発生フラグ8-１をオンにする (ス
テップS22)。また、自己診断部6-１は時間監視部10-1に
自己診断結果を通知し、時間監視部10-1のタイムアップ
を抑止する (ステップS23-1)。続いて、自己診断部6-１
は故障情報収集部7-１に対して例えばメッセージにより
自己診断結果を送ると共に、制御CPU 2-１において故障
が発生したことをメッセージ送信部4-１からシステムバ
ス３を介して制御CPU2-2に通知する。この際、制御CPU
2-２は、この制御CPU 2-１のメッセージ送信部4-１から
システムバス３へ出力されたメッセージを自身のメッセ
ージ受信部5-２で受信し、これを他CPU 故障情報管理部
15-2に通知する。

【００４６】制御CPU 2-１の時間監視部10-1は、一定時
間内に自己診断部6-１から例えば割り込み信号などによ
り自己診断結果を通知された場合は、自動リセット実行
部11-1の起動を抑止することにより、制御CPU 2-１の自
動リセットが実行されないようにする。

【００４７】自己診断部6-１により起動された故障情報
収集部7-1 は、制御CPU 2-１内の故障情報を収集してこ
れを故障情報格納部9-１に格納し (ステップS24)、また
収集した故障情報をメッセージ送信部4-１及びシステム
バス３を介して、管理CPU １に送信する（ステップS2
5)。

【００４８】その後、管理CPU １から指令が送られてい
たのであれば、その指令に従った処理が実行され（ステ
ップS26, S27, S28)、送られていなかったのであれば自
己診断が続行される (ステップS29)。なお、ステップS2
7 において管理CPU １からの指令がリセット指令であっ
た場合の動作については後で説明する。

【００４９】一方、管理CPU １は、メッセージ受信部21
で故障した制御CPU 2-１からの故障情報を受信し (ステ
ップS40)、この受信した故障情報を制御CPU 故障監視部
22に送信する。制御CPU 故障情報監視部22は、この故障
情報を、例えば故障の発生した制御CPU の特定及び故障
箇所の推定などの各種解析を行い (ステップS41)、オペ
レータインタフェイス25を介してシステムコンソール24
に表示する (ステップS42)と共に、故障CPU 故障情報格
納部23に蓄える (ステップS43)。

【００５０】また、オペレータから例えば故障した制御
CPU 2-１に対して、例えばメモリ内容の書き換えあるい
はダンプなどの復旧作業指令がシステムコンソール24を
介してオペレータインタフェイス部25へ入力された場
合、オペレータインタフェイス部25は、これを制御CPU
指令部27とメッセージ送信部26及びシステムバス３を介
して制御CPU 2-１へ送信する (ステップS45)。その後、
再び故障情報の受信を持つ状態になる (ステップS46)。

【００５１】次に、故障を発生した制御CPU 2-１に対し
てオペレータからリセット指令が発せられた場合、また
は制御CPU 2-１において発生した故障が例えばプログラ
ムの暴走などの重大な故障であり、管理CPU １へ故障情
報を送ることが出来ないような事態に陥った場合の制御
CPU 2-１の動作を説明する。

【００５２】故障を発生した制御CPU 2-１に対して、オ
ペレータからリセット指令が指示された場合 (ステップ
S27)、制御CPU 2-１内のメッセージ受信部5-１はこの管
理CPU １からの指令を管理CPU 指令実行部14-1に伝え
る。続いて管理CPU指令実行部14-1は自己診断部6-１か
ら時間監視部10-1へ送られる自己診断の送信中止命令を
自己診断部6-１へ出力することにより強制的に時間監視
部10-1をタイムアップさせて、自動リセット実行部11-1
を起動する。

【００５３】自動リセット実行部11-1は、例えば現在実
行中のすべての処理をその時点で中断し、制御CPU 2-１
をリセットすると共に、その初期化処理での初期化プロ
グラムの実行 (ステップS31)に際して故障発生フラグ8-
１の状態をチェックする (ステップS32)。自動リセット
実行部11-1は、故障発生フラグ8-1 がオンであれば、現
在実行中のイニシャル処理はエラー処理作業の一環であ
ると判断し、故障情報格納部9-1 に存在するすべての故
障情報をメッセージ送信部4-1 及びシステムバス３を介
して管理CPU １に送信する（ステップS33)。この送信
後、故障発生フラグ8-１はオフにされる。この後、制御
CPU 2-１は、上述同様にオペレータからの各種指令を受
け付けることが可能な状態になる。一方、故障発生フラ
グ8-１がオフであれば、自動リセット実行部11-1は、現
在実行中のイニシャル処理は通常のシステム立ち上げ処
理であると判断し、管理CPU １への故障情報の送信は行
わない。

【００５４】また、制御CPU 2-１が重大な故障に陥った
場合 (ステップS23 でYES の場合)は、既に自己診断部6
-１は一定周期で時間監視部9-１に自己診断結果を送る
ことができない状態になっている。このため、時間監視
部10-1が自動リセット実行部11-1を起動する信号を抑止
することが出来ず、従って自動リセット実行部11-1はリ
セット処理を実行する (ステップS31)。以後の自動リセ
ット実行部11-1の動作は、前述のオペレータからのリセ
ット指令があった場合と同様であるため、ここでは省略
する。

【００５５】以下、これらの動作に従うことにより、オ
ペレータは故障が発生した制御CPUにリセット指令，あ
るいは例えばメモリ内容の書き換えなどの復旧作業指令
を送ることができる。更に、オペレータは故障した制御
CPU が重大な故障に陥った場合にもシステム全体をリセ
ットすることなくその故障情報を得ることが可能なた
め、オペレータは故障情報に基づいて適切な指令を故障
した制御CPU に送ることも可能である。

【００５６】また、本発明の計算機システムでは、各制
御CPU 2-１〜2-Ｎ内に故障情報格納部９に蓄えられてい
る故障情報を読み出してオペレータに直接提供する故障
情報表示部13及び補助用コンソール12を設けているの
で、管理CPU １の故障発生時においてもオペレータは故
障発生CPU の故障情報を入手することが可能である。

【００５７】なお上記実施例では、自己診断部が自己診
断結果を時間監視部に送出し、時間監視部にてその自己
診断結果の受信のタイムアップを検出するように構成し
たが、自己診断部にて直接自動リセット実行部を起動し
てもよく、また管理CPU からのリセット指令による自動
リセット実行部の起動についても管理CPU 指令実行部か
ら直接行ってもよい。

【００５８】更に上記実施例では、故障発生フラグを制
御CPU 内に備える構成を採っているが、システムバスに
周辺機器とのインタフェイスを行う I/O部あるいは制御
CPU間のコモンメモリを接続して、その上に備えるよう
な構成を採ることも可能である。

【００５９】

【発明の効果】以上に詳述したように本発明によれば、
故障が発生した制御CPU に対してオペレータがリセット
指令を送信した場合、あるいは制御CPU が重大な故障に
陥って故障情報を管理CPU に送れない状態となったよう
な場合でも、制御CPU が有するリセット機能により故障
情報を管理CPU に送信することが可能になるため、オペ
レータは故障した制御CPU の故障情報を入手することが
可能である。また、管理CPU の故障発生時においても、
オペレータは故障の発生した制御CPU から直接その故障
情報を入手することが可能になるので、故障が発生した
制御CPU の要因解析が可能となる。

【図面の簡単な説明】

【図１】特開昭64-72242号公報に開示された従来のマル
チプロセッサ構成の計算機システムの構成を示すブロッ
ク図である。

【図２】特開昭64-72242号公報に開示された従来のマル
チプロセッサ構成の計算機システムの故障発生時の動作
を示すフローチャートである。

【図３】本発明のマルチプロセッサ構成の計算機システ
ムの構成の一実施例を示すブロック図である。

【図４】本発明のマルチプロセッサ構成の計算機システ
ムの各制御CPUの構成を示すブロック図である。

【図５】本発明のマルチプロセッサ構成の計算機システ
ムの管理CPU の詳細な構成を説明するブロック図であ
る。

【図６】本発明のマルチプロセッサ構成の計算機システ
ムの故障発生時の各制御CPU の動作を示すフローチャー
トである。

【図７】本発明のマルチプロセッサ構成の計算機システ
ムの故障発生時の管理CPU の動作を示すフローチャート
である。

【符号の説明】

１管理用計算機 (管理CPU) 2-１〜2-Ｎ制御用計算機（制御CPU) ３システムバス 4-１〜4-Ｎメッセージ送信部 5-１〜5-Ｎメッセージ受信部 6-１〜6-Ｎ自己診断部 8-１〜8-Ｎ故障発生フラグ 9-１〜9-Ｎ故障情報格納部 11-1〜11-N 自動リセット実行部 12-1〜12-N 補助用コンソール 13-1〜13-N 故障情報表示部 14-1〜14-N 管理CPU 指令実行部 21 メッセージ受信部 23 故障CPU 故障情報格納部 24 システムコンソール 26 メッセージ送信部 27 制御CPU 指令部

【手続補正書】

【提出日】平成４年４月１５日

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】００１０

【補正方法】変更

【補正内容】

【００１０】管理CPU 31は、制御CPU 32から転送された
故障情報を例えばメモリで構成される故障情報格納領域
39に保存する (ステップS18)。この故障情報格納領域39
に保存された故障情報は、オペレータからの要求があれ
ばそれに従ってシステムコンソール34へ表示出力される
ことによりオペレータに提示される (ステップS19)。

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】００１７

【補正方法】変更

【補正内容】

【００１７】

【作用】本発明の計算機システムでは、マルチプロセッ
サ構成の計算機システム全体には影響を与えずに、各制
御用計算機あてに入力されたリセット指令に応じて、故
障発生した制御用計算機においてそれぞれリセット処理
が実行され、このリセット処理実行中に故障情報が管理
用計算機へ送信され、管理用計算機ではそれを記憶する
と共に情報表示器に表示する。また、各制御用計算機に
備えられている補助情報表示器にもそれぞれの制御用計
算機の故障情報が表示されるので、管理用計算機が故障
した場合にも、それぞれの制御用計算機において直接そ
の故障情報が表示される。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁵ 識別記号庁内整理番号ＦＩ技術表示箇所Ｇ０６Ｆ 15/16 ４７０Ｅ 9190−5ＬＲ 9190−5Ｌ

Claims

【特許請求の範囲】

【請求項１】管理用計算機と複数の制御用計算機とが
システムバスで接続されており、前記制御用計算機に故
障が発生した場合に前記管理用計算機が故障発生した制
御用計算機の故障情報を管理すべくなしてある計算機シ
ステムにおいて、前記管理用計算機は、前記複数の制御用計算機から受信した故障情報を蓄える
故障情報格納部と、受信した故障情報を表示する情報表示器と、前記制御用計算機それぞれをリセットするためのリセッ
ト指令を含む種々の指令を入力する入力部と、該入力部を介して入力された指令を故障発生した制御用
計算機へ送信する送信部とを有し、前記各制御用計算機は、情報表示のための補助情報表示器と、それぞれの状態を自己診断する自己診断部と、該自己診断部の診断結果が故障発生である場合にオンさ
れる故障発生フラグと、故障発生時に故障情報を格納する故障情報格納部と、故障情報を前記管理用計算機へ前記システムバスを介し
て送信する送信部と、前記管理用計算機からの指令を受信する受信部と、該受信部が前記管理用計算機の前記送信部からリセット
指令を受信した場合に、リセット処理を起動し、その際
に前記故障発生フラグがオンであればリセット処理中に
前記故障情報格納部内の故障情報を前記管理用計算機へ
送信する自動リセット実行部と、前記故障情報格納部に格納されている故障情報を前記補
助情報表示器に表示する故障情報表示部とを有すること
を特徴とする計算機システム。