JPH0573344A - 計算機システム - Google Patents

計算機システム

Info

Publication number
JPH0573344A
JPH0573344A JP3232866A JP23286691A JPH0573344A JP H0573344 A JPH0573344 A JP H0573344A JP 3232866 A JP3232866 A JP 3232866A JP 23286691 A JP23286691 A JP 23286691A JP H0573344 A JPH0573344 A JP H0573344A
Authority
JP
Japan
Prior art keywords
failure
computer
unit
failure information
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3232866A
Other languages
English (en)
Inventor
Hirokazu Kawabata
宏和 川端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP3232866A priority Critical patent/JPH0573344A/ja
Publication of JPH0573344A publication Critical patent/JPH0573344A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 重大な故障が発生した制御用計算機から管理
用計算機が故障情報を得られなくなっても、故障した制
御用計算機の初期化処理のための初期化プログラム実行
中において故障発生した制御用計算機内に保存されてい
る故障情報を管理用計算機に送信する。 【構成】 管理用計算機と複数の制御用計算機2-1〜2-
Nとがシステムバス3で接続されており、各制御用計算
機2-1〜2-Nで、自己診断部6-1〜6-Nから時間監視部
10-1〜10-Nに一定時間内に自己診断結果が送られてこな
いと自制御用計算機2-1〜2-Nを自動的にリセットする
自動リセット実行部11-1〜11-Nを備え、また外部から入
力されたリセット指令に従って自動リセット実行部11-1
〜11-Nに強制的にリセットを行わせる管理用計算機指令
実行部14-1〜14-Nを備える。すべての制御用計算機2-1
〜2-Nそれぞれが自身の故障情報を直接外部出力する情
報表示部13-1〜13-Nを有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はマルチプロセッサ構成の
計算機システムに関する。
【0002】
【従来の技術】図1は例えば特開昭64-72242号公報に開
示された従来のマルチプロセッサ構成の計算機システム
の構成を示すブロック図である。
【0003】図1において、参照符号31は管理用計算機
(以下、管理CPU という) であり、情報表示器とオペレ
ータによる種々の指令を入力する入力部とを兼ねるシス
テムコンソール34が接続されている。参照符号32, 33は
マルチプロセッサ構成の2台の制御用計算機(以下、制
御CPU という)であり、管理CPU 31とは、システムバス
35で相互に接続されている。
【0004】管理CPU 31には故障情報格納領域39が設け
られている。この故障情報格納領域39は、両制御CPU 3
2, 33からシステムバス35を介して送られてきたそれぞ
れの故障情報を格納するために設けられている。
【0005】制御CPU 32, 33は同一の内部構成を有して
いる。即ち、参照符号36A, 36Bはバッテリバックアップ
メモリであり、各制御CPU 32, 33内において、それぞれ
の故障情報を蓄える。また、37A, 37Bは通信用バッファ
であり、システムバス35を介して各バッテリバックアッ
プメモリ36A, 36Bの内容を管理CPU31へそれぞれ送信す
るために備えられている。更に、38A, 38Bはそれぞれ制
御CPU 32, 33に取り付けられたウォッチドッグタイマ(W
DT) であり、各制御CPU 32, 33における暴走状態発生か
らある一定時間経過後にタイムアップして制御CPU 32,
33を強制停止させる。
【0006】次に故障発生時の動作について図2のフロ
ーチャートを参照して説明する。
【0007】例えば、制御CPU 32において故障が発生し
(ステップS11)、その後、故障した制御CPU 32のプログ
ラムが暴走状態に陥ったとする (ステップS12)。制御CP
U 32内では故障情報が収集されてバッテリバックアップ
メモリ36A に格納される (ステップS13)。暴走開始後あ
る一定時間が経過すると制御CPU 32のウォッチドッグタ
イマ38A がタイムアップして、例えば、制御CPU 32, 33
への電源供給を遮断する等により両制御CPU 32, 33を強
制的に停止させる (システムS14)。この際、制御CPU 32
のバッテリバックアップメモリ36A には、暴走開始時点
から電源遮断直前までの制御CPU 32の内部状態及び故障
履歴が故障情報として記憶される。
【0008】一方、管理CPU 31は制御CPU 32, 33の強制
停止とは関係なく稼働状態にあり、システムバス35を介
して制御CPU 32, 33のいずれがダウンしたかを特定し、
システムコンソール34を用いてオペレータに通知する。
この通知に従ってオペレータは、制御CPU 32, 33の再立
ち上げを行う (ステップS15)。
【0009】両制御CPU 32, 33は再立ち上げ処理に際し
て自身の初期化を行うが (ステップS16)、その際に故障
発生した制御CPU 32は自身のバッテリバックアップメモ
リ36A に保存されている故障情報を通信用バッファ37A
にバッファリングし、システムバス35を介して管理CPU
31へ転送する (ステップS17)。
【0010】管理CPU 31は、制御CPU 32から転送された
故障情報を例えばメモリで構成される故障情報格納領域
39に保存する(ステップS18)。この故障情報格納領域39
に保存された故障情報は、オペレータからの要求があれ
ばそれ従ってシステムコンソール34へ表示出力されるこ
とによりオペレータに提示される (ステップS19)。
【0011】
【発明が解決しようとする課題】上述のような特開昭64
-72242号公報に開示された従来の計算機システムでは、
管理用計算機からオペレータへの故障情報の提供は、す
べての制御用計算機の電源が遮断された後に電源を再投
入する等してシステムの再立ち上げ処理が終了した後に
限られる。このため、オペレータは故障発生時に直ちに
故障発生用計算機に関する故障情報の入手, 故障要因解
析及び復旧作業等を行うことが出来ないという問題点が
ある。
【0012】また、すべての制御用計算機の電源を遮断
する等してシステムの再立ち上げを行うため、一つの制
御用計算機の故障発生によってマルチプロセッサ構成の
計算機システム全体が一旦停止するため、マルチプロセ
ッサ構成の利点を損なうという問題点もある。
【0013】更に、故障が発生した制御用計算機に関す
る故障情報を管理用計算機がオペレータに提供する以前
に管理用計算機自身が故障した場合には、オペレータは
故障が発生した制御用計算機の情報を全く入手できない
という問題点もある。
【0014】本発明は上述のような問題点を解決するた
めになされたものであり、マルチプロセッサ構成の計算
機システム全体には影響を与えずに、例えば暴走などの
重大な故障を発生した制御用計算機から管理用計算機が
故障情報を得られなくなった場合にも、故障した制御用
計算機が持つ自動リセット機能またはオペレータからの
リセット指令により、故障した制御用計算機の初期化処
理のための初期化プログラム実行中において故障発生し
た制御用計算機内に保存されている故障情報を管理用計
算機に送信することにより、オペレータに故障情報を提
示し得る計算機システムの提供を目的とする。
【0015】また、故障発生した制御用計算機の故障情
報を管理用計算機が表示出力する以前に管理用計算機が
故障を発生して故障情報を表示できなくなった場合に
も、故障を発生した制御用計算機から直接故障情報を直
接出力することが可能な計算機システムの提供を目的と
する。
【0016】
【課題を解決するための手段】本発明に係る計算機シス
テムは、管理用計算機と複数の制御用計算機とがシステ
ムバスで接続されており、各制御用計算機は自己診断部
と、自己診断部による自己診断の結果が故障発生であっ
た場合にオンされる故障発生フラグと、故障発生時に故
障情報を格納する故障情報格納部と、故障情報を管理用
計算機へ送信する送信部と、管理用計算機からの指令を
受信するための受信部と、受信部がリセット指令を受信
した場合に、リセット処理を起動し、且つ故障発生フラ
グがオンであればリセット処理中に故障情報を管理用計
算機へ送信する自動リセット実行部と、それぞれが自身
の故障情報を直接外部出力し得る情報表示器とを有して
いる。
【0017】
【作用】本発明の計算機システムでは、マルチプロセッ
サ構成の計算機システム全体には影響を与えずに、各制
御用計算機あてに入力されたリセット指令に応じて、故
障発生した制御用計算機においてそれぞれリセット処理
が実行され、このリセット地理実行中に故障情報が管理
用計算機へ送信され、管理用計算機ではそれを記憶する
と共に情報表示器に表示する。また、各制御用計算機に
備えられている補助情報表示器にもそれぞれの制御用計
算機の故障情報が表示されるので、管理用計算機が故障
した場合にも、それぞれの制御用計算機において直接そ
の故障情報が表示される。
【0018】
【実施例】以下、本発明をその実施例を示す図面に基づ
いて詳述する。
【0019】図3は本発明のマルチプロセッサ構成の計
算機システムの構成の一実施例を示すブロック図であ
る。
【0020】図3において、参照符号1は管理用計算機
(以下、管理CPU という) であり、情報表示器とオペレ
ータによる種々の指令を入力する入力部とを兼ねるシス
テムコンソール24が接続されている。参照符号2-1〜2-
Nはそれぞれマルチプロセッサ構成の複数の制御用計算
機(以下、制御CPU という)であり、3は管理CPU 1と
各制御CPU 2-1〜2-Nとの間を接続するシステムバスで
ある。
【0021】なお、各制御CPU 2-1〜2-Nにはそれぞれ
補助情報表示器としての補助用コンソール12-1〜12-Nが
接続されている。
【0022】各制御CPU 2-1〜2-Nの構成は同一であ
り、ここでは制御CPU 2-Nを例にしてその詳細を示す図
4のブロック図を参照して説明する。
【0023】図4において、参照符号4-Nはメッセージ
送信部であり、管理CPU 1へ自己診断結果, 故障情報等
を送信する。
【0024】5-Nはメッセージ受信部であり、管理CPU
1から送られてきた指令あるいは他の各制御CPU 2-1〜
2-N-1 からそれぞれの故障状態のメッセージなどを受信
する。
【0025】6-Nは自己診断部であり、自制御CPU 2-N
に故障が発生しているか否かを常時自己診断している。
【0026】7-Nは故障情報収集部であり、自己診断部
6-Nにより起動されて、故障情報を収集する。
【0027】8-Nは故障発生フラグであり、自己診断部
6-N による自己診断が行われた場合に故障/正常状態の
自己診断結果に応じてオン/オフされる。この故障発生
フラグ8-Nは、例えば、バッテリバックアップメモリで
構成されている。
【0028】9-Nは故障情報格納部であり、自己診断部
6-Nが収集した故障情報を格納する。この故障情報格納
部9-Nは、例えば、バッテリバックアップメモリで構成
されている。
【0029】10-Nは時間監視部であり、自己診断部6-N
から一定時間内に自己診断結果を受信することにより自
制御CPU 2-Nが有する自動リセット機能を起動する信号
の発生を抑止して自動リセット機能の起動を禁じる。
【0030】11-Nは自動リセット実行部であり、時間監
視部10-Nが発生する自動リセット指令を受けて、故障発
生フラグ8-Nのオン/オフ状態をチェックし、フラグが
オンであればイニシャル処理の実行中に故障情報格納部
9-Nに格納されている故障情報を管理CPU 1へ送信する
初期化プログラムを内蔵している。
【0031】13-Nは故障情報表示部であり、補助用コン
ソール12-Nに故障情報格納部9-Nの内容を表示する制御
を行う。
【0032】14-Nは管理CPU 指令実行部であり、管理CP
U1から送られてくる復旧作業指令あるいはリセット指
令等を実行する。
【0033】15-Nは他CPU 故障発生情報管理部であり、
他の制御CPU2-1〜2-N-1 の故障発生情報を管理する。
【0034】また図5は管理CPU 1の詳細な構成を説明
するブロック図である。図5において、参照符号21はメ
ッセージ受信部であり、各制御CPU 2-1〜2-Nからシス
テムバス3を介して送られて来る自己診断結果,故障情
報などを受信する。
【0035】22は制御CPU 故障監視部であり、各制御CP
U 2-1〜2-Nからシステムバス3を介して送られてくる
自己診断結果を監視すると共に故障情報を解析する。
【0036】23は故障CPU 故障情報格納部であり、各制
御CPU 2-1〜2-Nから送られてきた故障情報を格納す
る。
【0037】25はオペレータインタフェイス部であり、
制御CPU 故障監視部22から各制御CPU 2-1〜2-Nの状態
及び故障情報を得てシステムコンソール24に表示する。
【0038】26はメッセージ送信部であり、各制御CPU
2-1〜2-Nに種々の指令を送信する。
【0039】27は制御CPU 指令部であり、各制御CPU 2-
1〜2-Nに対して、オペレータから入力された指令をメ
ッセージ送信部26に伝える。
【0040】以上のような構成の本発明のマルチプロセ
ッサ構成の計算機システムの動作について以下に説明す
る。
【0041】まず、本発明の計算機システムについて、
故障が発生していない状態から、ある制御CPU に故障が
発生した場合の制御CPU 及び管理CPU の動作を説明す
る。続いて、故障が発生した制御CPU に管理CPU 1を通
じてオペレータからリセット指令が送られた場合、また
は制御CPU で発生した故障が例えば暴走などの重大な故
障であり、故障情報が管理CPU 1に送れなくなった場合
の故障が発生した制御CPU の動作を説明する。
【0042】なお、故障発生時の各制御CPU の動作を図
6のフローチャートに、管理CPU の動作を図7のフロー
チャートにそれぞれ示す。但し、制御CPU の台数は本質
的には特に限定されないが、説明の簡略化のため、ここ
では2台の場合を考える。
【0043】いま、本発明の計算機システムが立ち上げ
処理が既に終了し、正常に稼動している状態にあるとす
る。各制御CPU 2-1〜2-Nの各自己診断部6-1〜6-Nは
既に自CPU の自己診断を実行している (ステップS20)。
自己診断の結果、故障が発生していなければ (ステップ
S21)、各制御CPU 2-1〜2-N内の各故障発生フラグ8-1
〜8-Nはそれぞれオフにされ (ステップS30)、各自己診
断部6-1〜6-Nによる自己診断結果がそれぞれの時間監
視部10-1〜10-Nに通知される。
【0044】その後、管理CPU 1から、例えばシステム
操業関連の指令が送られていたのであれば、その指令に
従った処理が実行され(ステップS26, S27, S28)、送ら
れていなかったのであれば自己診断が続行される (ステ
ップS29)。
【0045】この状態において、制御CPU 2-1に継続実
行可能な故障が発生したとする。制御CPU 2-1の自己診
断部6-1は、自CPU において故障が発生したと診断し
(ステップS21)、故障発生フラグ8-1をオンにする (ス
テップS22)。また、自己診断部6-1は時間監視部10-1に
自己診断結果を通知し、時間監視部10-1のタイムアップ
を抑止する (ステップS23-1)。続いて、自己診断部6-1
は故障情報収集部7-1に対して例えばメッセージにより
自己診断結果を送ると共に、制御CPU 2-1において故障
が発生したことをメッセージ送信部4-1からシステムバ
ス3を介して制御CPU2-2に通知する。この際、制御CPU
2-2は、この制御CPU 2-1のメッセージ送信部4-1から
システムバス3へ出力されたメッセージを自身のメッセ
ージ受信部5-2で受信し、これを他CPU 故障情報管理部
15-2に通知する。
【0046】制御CPU 2-1の時間監視部10-1は、一定時
間内に自己診断部6-1から例えば割り込み信号などによ
り自己診断結果を通知された場合は、自動リセット実行
部11-1の起動を抑止することにより、制御CPU 2-1の自
動リセットが実行されないようにする。
【0047】自己診断部6-1により起動された故障情報
収集部7-1 は、制御CPU 2-1内の故障情報を収集してこ
れを故障情報格納部9-1に格納し (ステップS24)、また
収集した故障情報をメッセージ送信部4-1及びシステム
バス3を介して、管理CPU 1に送信する(ステップS2
5)。
【0048】その後、管理CPU 1から指令が送られてい
たのであれば、その指令に従った処理が実行され(ステ
ップS26, S27, S28)、送られていなかったのであれば自
己診断が続行される (ステップS29)。なお、ステップS2
7 において管理CPU 1からの指令がリセット指令であっ
た場合の動作については後で説明する。
【0049】一方、管理CPU 1は、メッセージ受信部21
で故障した制御CPU 2-1からの故障情報を受信し (ステ
ップS40)、この受信した故障情報を制御CPU 故障監視部
22に送信する。制御CPU 故障情報監視部22は、この故障
情報を、例えば故障の発生した制御CPU の特定及び故障
箇所の推定などの各種解析を行い (ステップS41)、オペ
レータインタフェイス25を介してシステムコンソール24
に表示する (ステップS42)と共に、故障CPU 故障情報格
納部23に蓄える (ステップS43)。
【0050】また、オペレータから例えば故障した制御
CPU 2-1に対して、例えばメモリ内容の書き換えあるい
はダンプなどの復旧作業指令がシステムコンソール24を
介してオペレータインタフェイス部25へ入力された場
合、オペレータインタフェイス部25は、これを制御CPU
指令部27とメッセージ送信部26及びシステムバス3を介
して制御CPU 2-1へ送信する (ステップS45)。その後、
再び故障情報の受信を持つ状態になる (ステップS46)。
【0051】次に、故障を発生した制御CPU 2-1に対し
てオペレータからリセット指令が発せられた場合、また
は制御CPU 2-1において発生した故障が例えばプログラ
ムの暴走などの重大な故障であり、管理CPU 1へ故障情
報を送ることが出来ないような事態に陥った場合の制御
CPU 2-1の動作を説明する。
【0052】故障を発生した制御CPU 2-1に対して、オ
ペレータからリセット指令が指示された場合 (ステップ
S27)、制御CPU 2-1内のメッセージ受信部5-1はこの管
理CPU 1からの指令を管理CPU 指令実行部14-1に伝え
る。続いて管理CPU指令実行部14-1は自己診断部6-1か
ら時間監視部10-1へ送られる自己診断の送信中止命令を
自己診断部6-1へ出力することにより強制的に時間監視
部10-1をタイムアップさせて、自動リセット実行部11-1
を起動する。
【0053】自動リセット実行部11-1は、例えば現在実
行中のすべての処理をその時点で中断し、制御CPU 2-1
をリセットすると共に、その初期化処理での初期化プロ
グラムの実行 (ステップS31)に際して故障発生フラグ8-
1の状態をチェックする (ステップS32)。自動リセット
実行部11-1は、故障発生フラグ8-1 がオンであれば、現
在実行中のイニシャル処理はエラー処理作業の一環であ
ると判断し、故障情報格納部9-1 に存在するすべての故
障情報をメッセージ送信部4-1 及びシステムバス3を介
して管理CPU 1に送信する(ステップS33)。この送信
後、故障発生フラグ8-1はオフにされる。この後、制御
CPU 2-1は、上述同様にオペレータからの各種指令を受
け付けることが可能な状態になる。一方、故障発生フラ
グ8-1がオフであれば、自動リセット実行部11-1は、現
在実行中のイニシャル処理は通常のシステム立ち上げ処
理であると判断し、管理CPU 1への故障情報の送信は行
わない。
【0054】また、制御CPU 2-1が重大な故障に陥った
場合 (ステップS23 でYES の場合)は、既に自己診断部6
-1は一定周期で時間監視部9-1に自己診断結果を送る
ことができない状態になっている。このため、時間監視
部10-1が自動リセット実行部11-1を起動する信号を抑止
することが出来ず、従って自動リセット実行部11-1はリ
セット処理を実行する (ステップS31)。以後の自動リセ
ット実行部11-1の動作は、前述のオペレータからのリセ
ット指令があった場合と同様であるため、ここでは省略
する。
【0055】以下、これらの動作に従うことにより、オ
ペレータは故障が発生した制御CPUにリセット指令,あ
るいは例えばメモリ内容の書き換えなどの復旧作業指令
を送ることができる。更に、オペレータは故障した制御
CPU が重大な故障に陥った場合にもシステム全体をリセ
ットすることなくその故障情報を得ることが可能なた
め、オペレータは故障情報に基づいて適切な指令を故障
した制御CPU に送ることも可能である。
【0056】また、本発明の計算機システムでは、各制
御CPU 2-1〜2-N内に故障情報格納部9に蓄えられてい
る故障情報を読み出してオペレータに直接提供する故障
情報表示部13及び補助用コンソール12を設けているの
で、管理CPU 1の故障発生時においてもオペレータは故
障発生CPU の故障情報を入手することが可能である。
【0057】なお上記実施例では、自己診断部が自己診
断結果を時間監視部に送出し、時間監視部にてその自己
診断結果の受信のタイムアップを検出するように構成し
たが、自己診断部にて直接自動リセット実行部を起動し
てもよく、また管理CPU からのリセット指令による自動
リセット実行部の起動についても管理CPU 指令実行部か
ら直接行ってもよい。
【0058】更に上記実施例では、故障発生フラグを制
御CPU 内に備える構成を採っているが、システムバスに
周辺機器とのインタフェイスを行う I/O部あるいは制御
CPU間のコモンメモリを接続して、その上に備えるよう
な構成を採ることも可能である。
【0059】
【発明の効果】以上に詳述したように本発明によれば、
故障が発生した制御CPU に対してオペレータがリセット
指令を送信した場合、あるいは制御CPU が重大な故障に
陥って故障情報を管理CPU に送れない状態となったよう
な場合でも、制御CPU が有するリセット機能により故障
情報を管理CPU に送信することが可能になるため、オペ
レータは故障した制御CPU の故障情報を入手することが
可能である。また、管理CPU の故障発生時においても、
オペレータは故障の発生した制御CPU から直接その故障
情報を入手することが可能になるので、故障が発生した
制御CPU の要因解析が可能となる。
【図面の簡単な説明】
【図1】特開昭64-72242号公報に開示された従来のマル
チプロセッサ構成の計算機システムの構成を示すブロッ
ク図である。
【図2】特開昭64-72242号公報に開示された従来のマル
チプロセッサ構成の計算機システムの故障発生時の動作
を示すフローチャートである。
【図3】本発明のマルチプロセッサ構成の計算機システ
ムの構成の一実施例を示すブロック図である。
【図4】本発明のマルチプロセッサ構成の計算機システ
ムの各制御CPUの構成を示すブロック図である。
【図5】本発明のマルチプロセッサ構成の計算機システ
ムの管理CPU の詳細な構成を説明するブロック図であ
る。
【図6】本発明のマルチプロセッサ構成の計算機システ
ムの故障発生時の各制御CPU の動作を示すフローチャー
トである。
【図7】本発明のマルチプロセッサ構成の計算機システ
ムの故障発生時の管理CPU の動作を示すフローチャート
である。
【符号の説明】
1 管理用計算機 (管理CPU) 2-1〜2-N 制御用計算機(制御CPU) 3 システムバス 4-1〜4-N メッセージ送信部 5-1〜5-N メッセージ受信部 6-1〜6-N 自己診断部 8-1〜8-N 故障発生フラグ 9-1〜9-N 故障情報格納部 11-1〜11-N 自動リセット実行部 12-1〜12-N 補助用コンソール 13-1〜13-N 故障情報表示部 14-1〜14-N 管理CPU 指令実行部 21 メッセージ受信部 23 故障CPU 故障情報格納部 24 システムコンソール 26 メッセージ送信部 27 制御CPU 指令部
【手続補正書】
【提出日】平成4年4月15日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0010
【補正方法】変更
【補正内容】
【0010】管理CPU 31は、制御CPU 32から転送された
故障情報を例えばメモリで構成される故障情報格納領域
39に保存する (ステップS18)。この故障情報格納領域39
に保存された故障情報は、オペレータからの要求があれ
それに従ってシステムコンソール34へ表示出力される
ことによりオペレータに提示される (ステップS19)。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0017
【補正方法】変更
【補正内容】
【0017】
【作用】本発明の計算機システムでは、マルチプロセッ
サ構成の計算機システム全体には影響を与えずに、各制
御用計算機あてに入力されたリセット指令に応じて、故
障発生した制御用計算機においてそれぞれリセット処理
が実行され、このリセット処理実行中に故障情報が管理
用計算機へ送信され、管理用計算機ではそれを記憶する
と共に情報表示器に表示する。また、各制御用計算機に
備えられている補助情報表示器にもそれぞれの制御用計
算機の故障情報が表示されるので、管理用計算機が故障
した場合にも、それぞれの制御用計算機において直接そ
の故障情報が表示される。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.5 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/16 470 E 9190−5L R 9190−5L

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 管理用計算機と複数の制御用計算機とが
    システムバスで接続されており、前記制御用計算機に故
    障が発生した場合に前記管理用計算機が故障発生した制
    御用計算機の故障情報を管理すべくなしてある計算機シ
    ステムにおいて、 前記管理用計算機は、 前記複数の制御用計算機から受信した故障情報を蓄える
    故障情報格納部と、 受信した故障情報を表示する情報表示器と、 前記制御用計算機それぞれをリセットするためのリセッ
    ト指令を含む種々の指令を入力する入力部と、 該入力部を介して入力された指令を故障発生した制御用
    計算機へ送信する送信部とを有し、 前記各制御用計算機は、 情報表示のための補助情報表示器と、 それぞれの状態を自己診断する自己診断部と、 該自己診断部の診断結果が故障発生である場合にオンさ
    れる故障発生フラグと、 故障発生時に故障情報を格納する故障情報格納部と、 故障情報を前記管理用計算機へ前記システムバスを介し
    て送信する送信部と、 前記管理用計算機からの指令を受信する受信部と、 該受信部が前記管理用計算機の前記送信部からリセット
    指令を受信した場合に、リセット処理を起動し、その際
    に前記故障発生フラグがオンであればリセット処理中に
    前記故障情報格納部内の故障情報を前記管理用計算機へ
    送信する自動リセット実行部と、 前記故障情報格納部に格納されている故障情報を前記補
    助情報表示器に表示する故障情報表示部とを有すること
    を特徴とする計算機システム。
JP3232866A 1991-09-12 1991-09-12 計算機システム Pending JPH0573344A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3232866A JPH0573344A (ja) 1991-09-12 1991-09-12 計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3232866A JPH0573344A (ja) 1991-09-12 1991-09-12 計算機システム

Publications (1)

Publication Number Publication Date
JPH0573344A true JPH0573344A (ja) 1993-03-26

Family

ID=16946055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3232866A Pending JPH0573344A (ja) 1991-09-12 1991-09-12 計算機システム

Country Status (1)

Country Link
JP (1) JPH0573344A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009003862A (ja) * 2007-06-25 2009-01-08 Hitachi Industrial Equipment Systems Co Ltd 複数コンポーネントシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009003862A (ja) * 2007-06-25 2009-01-08 Hitachi Industrial Equipment Systems Co Ltd 複数コンポーネントシステム

Similar Documents

Publication Publication Date Title
EP0167540B1 (en) Processing system tolerant of loss of access to secondary storage
KR20040047209A (ko) 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템
TW200426571A (en) Policy-based response to system errors occurring during os runtime
JPH09251443A (ja) 情報処理システムのプロセッサ障害回復処理方法
JP2002215399A (ja) コンピュータシステム
JP2003150279A (ja) コンピュータ・システムにおける管理システム及びバックアップ管理方法
JPH0887341A (ja) 自動縮退立ち上げ機能を有したコンピュータシステム
JPS6129239A (ja) プロセツサ異常再開方式
JPH0573344A (ja) 計算機システム
JP3589830B2 (ja) 電子計算機システム
JP2001331330A (ja) プロセス異常検知及び復旧システム
JPH08329006A (ja) 障害通知方式
WO2007077604A1 (ja) 情報処理装置及びハングアップ監視方法
JP7001236B2 (ja) 情報処理装置、障害監視方法及び障害監視用コンピュータプログラム
JP2785992B2 (ja) サーバプログラムの管理処理方式
JPH0424838A (ja) マルチプロセッサの障害管理方式
JPH11120154A (ja) コンピュータシステムにおけるアクセス制御装置および方法
JP2977705B2 (ja) ネットワーク接続された多重化コンピュータシステムの制御方式
JP2699291B2 (ja) 電源異常処理装置
JPH09198334A (ja) データ伝送システムの障害管理方法
JP2000347758A (ja) 情報処理装置
KR100286222B1 (ko) 망관리부 자동 재부팅 방법
JPH07129425A (ja) リブート処理方法
JPH1049394A (ja) 障害処理システムおよび障害処理方法
JP2578908B2 (ja) 再立ち上げ方式