JP3464846B2 - 計算機システムの障害状態の監視診断装置 - Google Patents

計算機システムの障害状態の監視診断装置

Info

Publication number
JP3464846B2
JP3464846B2 JP13284895A JP13284895A JP3464846B2 JP 3464846 B2 JP3464846 B2 JP 3464846B2 JP 13284895 A JP13284895 A JP 13284895A JP 13284895 A JP13284895 A JP 13284895A JP 3464846 B2 JP3464846 B2 JP 3464846B2
Authority
JP
Japan
Prior art keywords
failure
fault
module
affected
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13284895A
Other languages
English (en)
Other versions
JPH08305600A (ja
Inventor
裕 通 堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP13284895A priority Critical patent/JP3464846B2/ja
Publication of JPH08305600A publication Critical patent/JPH08305600A/ja
Application granted granted Critical
Publication of JP3464846B2 publication Critical patent/JP3464846B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、計算機システムの障害
発生時における障害状況を診断すると共に、障害影響状
況を提示する計算機システムの障害状態の監視診断装
関する。
【0002】
【従来の技術】従来の計算機システムを図34のブロッ
ク図を基に説明する。なおここでは、1系、2系を備え
た2重化計算機システムを仮定する。
【0003】従来の計算機システムAには、2重化され
た1系計算機演算処理装置a及び2系計算機演算処理装
置bと、CRT表示装置21と、プリンタ装置22と、
状態監視装置23とを有する。1系及び2系計算機演算
処理装置a,bは、自計算機演算処理装置内で障害が発
生すると障害信号を発生させ、その障害信号を自計算機
演算処理装置内の1系障害信号処理部1a及び2系障害
信号処理部1bに出力する。各障害信号処理部1a,1
bはその障害信号を1系障害出力処理部3a及び2系障
害出力処理部3bに出力する。各障害出力処理部3a,
3bは、障害信号に応じた障害発生状況のメッセージを
CRT表示装置21、プリンタ装置22、及び状態監視
装置23にそれぞれ出力する。
【0004】計算機システムの運転監視員は、これらの
各装置、特に状態監視装置23を監視することにより、
計算機システムに発生した障害を監視する。
【0005】
【発明が解決しようとする課題】しかし、従来の運転監
視員に表示される障害発生表示内容は、計算機システム
の障害箇所のみであったため、計算機システムの運転監
視員は、計算機システムの障害発生箇所が計算機システ
ムのハードウェア上のどのモジュール部分であるのかを
視覚的に、すなわちモジュール構成図上で知ることがで
きず、またその障害が計算機システムの機能上特にどの
範囲で影響を与えるものなのかも知ることができなかっ
た。そのため、その障害への対応処理の判断を的確に実
施出来なかった。
【0006】そこで本発明の目的は、計算機システムに
障害が発生時に、その障害の発生箇所を計算機システム
のモジュール構成図によって視覚的に提示すると共に、
その障害に対する処置を支援し、その障害状況の管理デ
ータを記録しうる計算機システムの障害状態の監視診断
置を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明の請求項1に係る
計算機システムの障害状態の監視診断装置は、計算機シ
ステムの障害発生時に、その障害信号を入力して、計算
機システムの障害発生状況を周辺装置に出力する計算機
システムの障害状態の監視診断装置であって、障害信号
と計算機システムを構成するモジュールとを対応づける
障害箇所検出データベースと、各モジュール毎に障害状
態を保存しておく障害状態保存テーブルと、障害信号を
障害信号処理手段を介して入力し、障害箇所検出データ
ベースから障害モジュールを検出し、その検出結果を障
害状態保存テーブルに保存する障害箇所検出処理手段
と、検出結果が保存された障害状態保存テーブルを表示
装置にモジュール構成図としてグラフィックに表示する
と共に、検出された障害モジュールを表示装置に強調し
て表示する障害出力処理手段と、障害信号とその障害信
号に対応するモジュールの障害により影響を受けるモジ
ュールとを対応付ける障害影響箇所検出データベース
と、各モジュール毎に他のモジュールの障害により自モ
ジュールが影響を受けるか否かを保存する障害影響状態
保存テーブルと、障害箇所検出処理手段により検出され
た障害モジュールを入力し、障害影響箇所検出データベ
ースから障害による影響を受けるモジュールを検出し、
そのモジュールの状態を障害影響状態保存テーブルに保
存する障害影響箇所検出処理手段とを備え、前記検出さ
れた障害モジュールを前記モジュール構成図上に強調し
て出力するものであることを特徴とする。
【0008】
【0009】本発明の請求項に係る計算機システムの
障害状態の監視診断装置は、障害モジュール又は他のモ
ジュールで発生した障害の影響を受けるモジュールによ
り完全に使用不可能となる部分を計算機システムの機能
毎に記述している完全機能使用不可検出データベース
と、障害モジュール又は他のモジュールで発生した障害
の影響を受けるモジュールにより部分的に使用不可能と
なる部分を計算機システムの機能毎に記述している部分
機能使用不可検出データベースと、計算機システムの機
能毎にその機能の状態を保存している完全使用不可状態
保存テーブル及び部分使用不可状態保存テーブルと、障
害箇所検出処理手段により検出された障害箇所及び障害
影響箇所検出処理手段により検出された障害影響箇所を
入力し、完全機能使用不可検出データベース及び部分機
能使用不可検出データベースを基に、完全に使用不可能
となる機能及び部分的に使用不可能となる機能を検出
し、完全使用不可状態保存テーブル及び部分使用不可状
態保存テーブルにそれぞれ記録する障害機能検出処理手
段とを備え、請求項に記載の障害出力処理手段が、前
記完全使用不可状態保存テーブル及び部分使用不可状
保存テーブルの内容を前記表示装置に表示するものであ
ることを特徴とする。
【0010】本発明の請求項3に係る計算機システムの
障害状態の監視診断装置は、障害箇所、障害影響箇所、
及び障害箇所の障害により影響を受ける機能から障害要
因を調査するために必要とされる調査項目及び障害から
復帰するための一次的な対応手順を記述した一次対応手
順データベースと、障害箇所、障害影響箇所、及び障害
箇所の障害により影響を受ける機能を入力し、一次対応
手順データベースを基に、調査項目及び一次的な対応手
順を検出する一次対応手順検出処理手段とを備え、請求
項1に記載の障害出力処理手段が、前記一次対応手順検
出処理手段により検出された調査項目及び一次的対応手
順を出力するものであることを特徴とする。
【0011】本発明の請求項に係る計算機システムの
障害状態の監視診断装置は、障害箇所、障害影響箇所、
及び障害箇所の障害により影響を受ける機能を障害履歴
データ記録テーブルに記録すると共に、調査項目を調査
した結果判明した障害原因及び一次的な対応手順を実行
した処置結果を障害履歴データ記録テーブルに記録する
障害履歴管理処理手段と、帳票表示要求を受付け、障害
履歴データ記録テーブルに記録されているデータを、障
害履歴管理用装置に帳票出力を行う障害履歴管理入出力
処理手段とを備えたことを特徴とする。
【0012】
【0013】
【作用】本発明の請求項1に係る計算機システムの障害
状態の監視診断装置は、計算機システムの障害信号を障
害信号処理手段を介して入力し障害箇所検出処理手段が
障害箇所検出データベースを基に障害箇所のモジュール
を検出し、その検出結果を障害状態保存テーブルに保存
し、障害出力処理手段がその障害状態保存テーブルを用
いて、表示装置に障害箇所をグラフィック表示する。
【0014】このように、計算機システムの障害発生時
に、障害箇所を表示装置によりグラフィック表示した計
算機システムのハードウェア構成図上に表示することが
可能になり障害発生箇所を視覚的に提示し、運転員及び
保守員が障害発生箇所を正確に認識することが可能にな
る。
【0015】また、障害影響箇所検出処理手段が、障害
影響箇所検出データベースにより障害による影響箇所を
検出し、その検出結果を障害影響状態保存テーブルに保
存し、障害出力処理手段が障害影響状態保存テーブルを
用いて、表示装置で障害影響箇所をグラフィック表示す
る。
【0016】これによって、計算機システムの障害発生
時の影響箇所を表示装置によりグラフィック表示した計
算機ハードウェア構成図上に提示することで障害影響箇
所を視覚的に提示し、運転員及び保守員に障害影響箇所
を正確に認識させること。
【0017】本発明の請求項に係る計算機システムの
障害状態の監視診断装置は、障害の発生による影響を計
算機システムの機能単位で検出し、表示するものであ
る。
【0018】これによって、運転員及び保守員に計算機
システム機能障害状態を正確に認識させ、障害状況の影
響度合い検出を支援する。
【0019】本発明の請求項に係る計算機システムの
障害状態の監視診断装置は、一次対応手順検出処理手段
において一次対応手順データベースにより検出した一次
対応手順を用い、障害出力処理手段が表示装置で一次対
応手順を出力する処理を行う。
【0020】これによって、計算機システムの障害発生
時に計算機システムの障害発生手段位の障害発生要因調
査のための調査事項及び計算機システム機能障害に対し
ての対応事項等一次対応手順を運転員及び保守員に提示
し、速やかな障害復旧対応を支援することが可能にな
る。
【0021】本発明の請求項に係る計算機システムの
障害状態の監視診断装置は、障害履歴管理処理手段が、
障害箇所検出処理手段、機能障害検出処理手段、及び一
次対応手順検出処理手段それぞれで検出処理した結果、
及び障害発生日時を障害履歴データ記録テーブルに記録
する。また、障害履歴管理入出力処理手段を介し障害履
歴管理入出力処理手段から障害履歴データの入力処理を
行い、障害履歴管理用装置に帳票出力を行う。
【0022】これによって、計算機システムの障害発生
時に計算機システムの障害発生日時、障害発生部分、障
害発生時の計算機システムのデータ、障害原因、対策処
置等を記録した計算機システムの障害の履歴管理データ
により、計算機システム運転員及び保守員に障害発生時
の障害要因の推定、対応操作の技術的な支援データを蓄
積・提供することが可能になる。
【0023】
【0024】
【0025】
【実施例】以下、本発明の請求項1に係わる計算機シス
テムの障害状態の監視診断システムの第1実施例を図1
のブロック図を参照して説明する。なお、従来の技術で
述べたように、ここでの計算機システムは1系、2系を
備えた2重化された計算機演算機装置a,bを仮定す
る。
【0026】計算機システムAで発生した障害信号は計
算機演算処理装置a,bの障害信号処理部1a,1bを
介して、障害箇所検出処理部2a,2bに入力される。
障害箇所検出処理部2a,2bは、入力した障害信号か
ら、その障害信号とその障害箇所のモジュールとを対応
づける障害箇所検出データベースD2を基に障害が発生
したモジュールを検出し、検出結果を障害状態保存テー
ブルT2に保存する。
【0027】その検出結果は障害出力処理部3a,3b
に入力され、障害出力処理部3a,3bは、計算機シス
テムAの構成図グラフィックデータベースGDからシス
テム構成図を生成し、CRT表示装置21にグラフィッ
ク表示すると共に、その検出結果を出力する。
【0028】障害箇所のモジュールは、CRT表示装置
21上でグラフィックシンボルで色替え及び点滅処理
等、強調して表示される。
【0029】ここでCRT表示装置21上のグラフィッ
ク画面での障害箇所の表示の1例を図2に示す。
【0030】図2において、1系計算機演算処理装置a
内のCPU20a、二重化されているモジュール1−1
a〜1−5a、装置からなるモジュールs4,s6、そ
れらに対応する2系計算機演算処理装置b内のCPU2
0b、2重化されているモジュール1−1b〜1−5
b、装置モジュールs5,s6、及び2重化されていな
い1系計算機演算処理装置aと2系計算機演算処理装置
bに共通な共有化装置モジュールs1〜s3の接続関係
が示されており、ここではモジュール1−1aとモジュ
ール1−5bとに障害が発生していることを示してい
る。
【0031】ここで障害箇所検出処理部2a,2bによ
る検出処理の動作を図3、図4、及び図5を基に説明す
る。
【0032】図3は障害箇所検出処理部2a,2bによ
る検出処理の動作を示すフローチャートであり、図4は
障害箇所検出データベースD2を示す図表であり、図5
は障害状態保存テーブルT2を示す図表である。
【0033】図4において、計算機システムを構成する
各モジュールには予め一意のモジュール番号(j=1〜
n)が割りふられており、また各障害信号にも一意の番
号(1〜m)が割り当てられている。障害箇所検出デー
タベースD2には、障害信号種別と各モジュールとの関
係が記述されており、表の中で1が立っているモジュー
ルは障害状態であることを示し、0が立っているモジュ
ールは正常状態であることを示している。
【0034】図5において、障害状態保存テーブルT2
は現在の各モジュール毎の障害状態を示しており、もし
障害状態ならば1が、もし障害から復帰した状態ならば
0が立てられている。
【0035】図3において、まず障害箇所検出処理部2
a,2bは、障害信号処理部1a,1bを介して障害信
号を入力し、障害信号番号変数iに代入する。(ステッ
プ31,32)。次にモジュール番号変数jを初期設定
し(ステップ33)、図4に示す障害箇所検出データベ
ースD2の検索を開始する(ステップ34)。まず表の
中で、最初のモジュール番号とその障害信号番号に対応
する値が1が立っているか否か判定する(ステップ3
5)。もし、1が立っていればそのモジュールは障害し
ていると判定し、図5に示す障害状態保存テーブルT2
のそのモジュール欄に障害状態であることを示す1を代
入する(ステップ36)。もし、0が立っていれば,そ
のモジュールは障害から復帰していると判定し、図5に
示す障害状態保存テーブルT2のそのモジュール欄に復
帰状態であることを示す0を代入する(ステップ37,
38)。以後これらの処理を全てのモジュール分だけ繰
り返す(ステップ39,34)。
【0036】この障害状態保存テーブルT2の設定状態
を、障害出力処理部3a,3bが各モジュール毎に検出
処理して、図2に示すような各モジュール単位のグラフ
ィカルな構成図上での障害モジュールのシンボルの色替
え及び点滅処理を行う。
【0037】これによって、計算機システムの障害発生
時に、障害箇所をCRT表示装置によりグラフィック表
示した計算機システムのハードウェア構成図上に表示す
ることが可能になり障害発生箇所を視覚的に提示し、運
転員及び保守員が障害発生箇所を正確に認識することが
可能になる。
【0038】さらに、本発明の請求項に係わる計算機
システムの障害状態の監視診断システムの第2実施例を
図6のブロック図を参照して説明する。
【0039】第2実施例は、障害したモジュールを検出
・表示するだけでなく、例えばあるモジュールの障害に
より他のモジュールが読みとり動作ができなくなる等、
あるモジュールの障害により影響を受ける他のモジュー
ルを検出・表示するものである。
【0040】図示するように、障害箇所検出処理部2
a,2bにより検出された障害モジュールを入力し、そ
の障害モジュールをキーにして、その障害モジュールと
その障害の影響を受けるモジュールとの関係を記述して
いる障害影響箇所検出データベースD4を基に影響を受
けるモジュールを検出する障害影響箇所検出処理部4
a,4bと、各モジュールが影響を受けるか否かを保存
している障害影響状態保存テーブルT4とが新たに備え
られている。
【0041】CRT表示装置21上でのグラフィッフィ
カルな表示画面の例を図7に示す。
【0042】図7において、モジュール1−1a、1−
7aは障害箇所を示し、装置s7はモジュール1−7a
の障害により影響を受けていることを示している。図中
では、各モジュール間を接続するラインの影響範囲も示
しており、ラインL20,L25,L26がモジュール
1−7bの障害による影響を受けることを示している。
【0043】以下、障害影響箇所検出処理部4a,4b
の動作を図8〜11を基に説明する。
【0044】図8は障害影響箇所検出処理部4a,4b
の動作を示すフローチャートであり、図9は障害影響箇
所検出データベースD4を示す図表であり、図10は障
害影響状態保存テーブルT4を示す図表であり、図11
は図8で説明する共有化モジュールへの影響を検出する
処理を示す図表である。
【0045】図9において、各モジュールには予め一意
の障害モジュール番号(i=1〜n)がおり、また各影
響モジュールにも一意の番号(1〜n)が割り当てられ
ている。障害影響箇所検出データベースD4には、障害
モジュール番号とそれによって影響を受ける影響モジュ
ールとの関係が記述されており、表の中で1が立ってい
るモジュールはその障害モジュールにより影響を受ける
ものであることを示しており、0が立っているモジュー
ルはその障害モジュールにより影響を受けないものであ
ることを示している。
【0046】図10において、障害影響状態保存テーブ
ルT4は、各モジュールがある障害により現在の各モジ
ュールが影響を受けるものなのか否かを、もし影響を受
けてるならば1を立てることにより、もしその影響から
復帰した状態ならば0を立てることにより示している。
【0047】図8において、まず障害影響箇所検出処理
部4a,4bは、障害信号処理部2a,2bを介し障害
モジュール番号を入力し、障害モジュールの番号を示す
障害モジュール番号変数iを初期設定する(ステップ8
1)。以降、順番に障害モジュール番号変数iを増分し
ていく(ステップ82)。また、障害の影響を受ける影
響モジュール変数jを初期設定する(ステップ83)。
以降、順番に影響モジュール番号変数jを増分していく
(ステップ84)。次に、障害箇所検出処理部2a,2
bが図5に示す障害状態保存テーブルT2から判定処理
した各モジュールの障害/復帰状態を検出し(ステップ
85)、障害影響箇所検出データベースD4から影響を
受けるモジュールを選び出し、障害の影響が有ると判断
した時には、共有化モジュール判定処理に移る(ステッ
プ88)。
【0048】ここで、共有化モジュール判定処理の動作
を図11の図表を基に説明する。
【0049】この図表は、2重化されている共有化モジ
ュール毎に1系、2系の各モジュールの障害の状態が記
述されており、両系共に障害である時にのみ、そのモジ
ュール対が障害の影響が有ると判断する。もし影響を受
けるモジュールが2重化されているものならば、対にな
るモジュールもその障害の影響を受けるのかを判定す
る。モジュール対に障害の影響が有ると判断した時に
は、図10に示す障害影響状態保存テーブルT4の該当
モジュールに1を設定することによって、影響有りとす
る(ステップ89)。
【0050】他方、もし対になる相手側のモジュールが
影響を受けないのであれば、障害影響状態保存テーブル
T4の該当モジュールに0を設定することによって、影
響無しとする(ステップ90)。
【0051】また、ステップ86の動作の結果、影響を
受けないと判断した時も障害影響状態保存テーブルT4
の該当モジュールに0を設定することによって、影響無
しとする(ステップ87,90)。
【0052】以上の動作を障害モジュール及び影響モジ
ュール分だけ繰り返す(ステップ91,92)。
【0053】障害出力処理部3a,3bは、第1実施例
で説明したように障害検出箇所をグラフィカルに表示す
ると共に、影響を受けるモジュールを障害影響状態保存
テーブルT4を基に図7に示すようにグラフィカルに表
示する。
【0054】更に、障害影響箇所検出処理部4a,4b
は、図12の図表に示すように障害モジュール及びその
障害モジュールにより影響を受けるモジュールと、それ
らの影響をうけるラインとの関係を示す影響ライン検出
データベースDL4により障害の影響を受けるラインを
選び出す。
【0055】図12に示すように影響ライン検出データ
ベースDL4は、障害モジュール及びその障害モジュー
ルにより影響を受けるモジュール番号と各ラインの関係
を示している。例えば、モジュール番号(2)であるモ
ジュール1−1aが障害中であるか又は他モジュールの
故障の影響をうければ、1が立っている。(この場合、
モジュール1−1aの障害によりラインL1及びライン
L2が影響を受ける)。
【0056】ここで、障害影響箇所検出処理部4a,4
bが、影響を受けるラインを検出し、それをCRT表示
装置21に表示する動作を図13のフローチャートを基
に説明する。
【0057】まず障害モジュール及びその障害モジュー
ルにより影響を受けるモジュール番号を示す変数iを初
期設定し(ステップ121)、以後変数iを増分して以
下の判定を行う(ステップ122)。他方、各ラインを
示すライン番号変数jを初期設定(ステップ123)、
ライン番号変数jを増分しながら以下の処理を行う(ス
テップ124)。次に影響ライン検出データベースDL
4から影響を受けるラインを検出し(ステップ12
5)、もし影響を受けるラインであれば、その変数iを
キーにして前述した障害状態保存テーブルT2をひき
(ステップ126)、もしその変数iのモジュールが障
害中であるならば、図14に示す影響ライン検出状態保
存テーブルTL4のそのラインに対応する欄に障害によ
り影響を受けるラインあることを示す1を代入する(ス
テップ127)。他方、障害状態保存テーブルT2をひ
き(ステップ126)、もしその変数iのモジュールが
障害中でないならば、変数iをキーにして前述した障害
影響状態保存テーブルT4をひき(ステップ128)、
もしその変数iのモジュールが影響をうけるモジュール
を示すものであるならば、図14に示す影響ライン検出
状態保存テーブルTL4のそのラインに対応する欄に障
害により影響を受けるラインあることを示す1を代入す
る(ステップ129)。そのライン変数iに対応するモ
ジュールが障害もなく、かつ他のモジュールの障害の影
響をうけない場合は、影響ライン検出状態保存テーブル
TL4のそのラインに対応する欄に障害により影響を受
けるラインでないことを示す0を代入する(ステップ1
26,127,128)。
【0058】以上全てのモジュール及びラインについ
て、処理を繰り返す(ステップ131,132)。
【0059】障害出力処理部3a,3bは、この影響ラ
イン検出状態保存テーブルTL4に基き、障害の影響を
受けるラインを色を替えて,図7に示すようにグラフィ
ックに表示する。
【0060】なお、参考のため図15に各ライン番号を
表示した画面を、図16に各モジュール番号を表示した
画面をそれぞれを示す。
【0061】これによって、障害発生時の影響箇所をC
RT表示装置によりグラフィックに障害影響箇所を、運
転員及び保守員に障害影響箇所を正確に認識させること
が可能になる。
【0062】本発明の請求項に係わる計算機システム
の障害状態の監視診断システムの第3実施例を図17の
ブロック図を参照して説明する。
【0063】第3実施例は障害の発生による影響を計算
機システムの機能単位で検出し、表示するものである。
【0064】第3実施例は、第2実施例に加えて、障害
モジュール又は他のモジュールで発生した障害の影響を
受けるモジュールにより完全に使用不可能となる計算機
システムの機能を記述している完全機能使用不可検出デ
ータベースD5と、障害モジュール又は他のモジュール
で発生した障害の影響を受けるモジュールにより部分的
に使用不可能となる計算機システムの機能を記述してい
る部分機能使用不可検出データベースD6と、障害箇所
検出処理部2a,2bによる検出箇所、障害影響箇所検
出処理部4a,4bによる障害影響箇所を基に、完全機
能使用不可検出データベースD5及び部分機能使用不可
検出データベースD6から、障害により完全に使用不可
能となる計算機システムの機能及び障害により部分的に
使用不可能となる計算機システムの機能を検出し、その
結果を完全使用不可状態保存テーブルT5及び部分使用
不可状態保存テーブルT6にそれぞれ保存する障害機能
検出処理部5a,5bが新たに設けられている。
【0065】ここで、障害機能検出処理部5a,5bが
障害により完全に使用不可能となる計算機システムの機
能を検出処理する動作を図18のフローチャートを基に
説明する。
【0066】まず、障害モジュール番号及び影響モジュ
ール番号を示す変数iを初期設定し(ステップ21
1)、変数iを増分しながら以下の処理を繰り返す(ス
テップ212)。次に障害モジュール及び影響モジュー
ルにより完全に使用不可能となる程の影響を受ける計算
機システムの機能を示す変数jを初期設定し(ステップ
213)、変数jを増分しながら以下の処理を繰り返す
(ステップ214)。次に、各変数i,jを基に図19
に示す完全機能使用不可検出データベースD5をひき、
変数jに対応する機能が変数iに対応するモジュールの
障害の影響を受けるか否かを調べる。もし、影響を受け
る場合であるならば、障害状態保存テーブルT2で変数
iに対応するモジュールが現在障害中かを判断し(ステ
ップ216)、影響を受けない場合であるならば、障害
影響状態保存テーブルT4によって変数iに対応するモ
ジュールが他のモジュールの障害によって影響をうける
か否かを判断し(ステップ217)、変数iに対応する
モジュールが現在障害中か又は他のモジュールの障害に
よって影響をうける場合には、その機能がその機能を実
現しているモジュールの多重化によってカバーされるか
否かの判断を行う(機能多重化影響判定処理、ステップ
218)。機能多重化影響判定処理は、図20の図表に
示すように各機能毎にその機能を実現しているモジュー
ルに状態が記述されており、その機能を実現している全
てのモジュールが影響有の場合に、その機能が完全に使
用ができないと判断する。もしその機能が完全に使用が
できないと判断されたならば、図21に示す完全使用不
可状態保存テーブルT5のその機能に対応する欄に完全
に使用が不可能になっていることを示す1を立てる(ス
テップ219)。
【0067】他方、ステップ217で影響無しとされた
場合又はステップ218でモジュールの多重化により完
全にその機能が影響を受けないと判断された場合には、
完全使用不可状態保存テーブルT5のその機能に対応す
る欄に障害から復帰していることを示す0を立てる(ス
テップ220)。
【0068】以降、各モジュール及び各機能毎に以上の
処理を繰り返す(ステップ221,222)。
【0069】次に障害機能検出処理部5a,5bが障害
により部分的に使用不可能となる計算機システムの機能
を検出処理する動作を図22のフローチャートを基に説
明する。
【0070】まず、障害モジュール番号及び影響モジュ
ール番号を示す変数iを初期設定し(ステップ25
1)、変数iを増分しながら以下の処理を繰り返す(ス
テップ252)。次に障害モジュール及び影響モジュー
ルにより部分的に使用不可能となる程の影響を受ける計
算機システムの機能を示す変数jを初期設定し(ステッ
プ253)、変数jを増分しながら以下の処理を繰り返
す(ステップ254)。次に、各変数i,jを基に図2
3に示す部分機能使用不可検出データベースD6をひ
き、変数jに対応する機能が変数iに対応するモジュー
ルの障害の影響を受けるか否かを調べる。もし、影響を
受ける場合であるならば、障害状態保存テーブルT2で
変数iに対応するモジュールが現在障害中かを判断し
(ステップ256)、影響を受けない場合であるなら
ば、障害影響状態保存テーブルT4によって変数iに対
応するモジュールが他のモジュールの障害によって影響
をうけるか否かを判断し(ステップ257)、変数iに
対応するモジュールが現在障害中か又は他のモジュール
の障害によって影響をうける場合には、その機能がその
機能を実現しているモジュールの多重化によってカバー
されるか否かの判断を行う(機能多重化影響判定処理、
ステップ258)。機能多重化影響判定処理は、図20
の図表に示すように各機能毎にその機能を実現している
モジュールに状態が記述されており、全てのその機能を
実現しているモジュールの一部が影響有の場合に、その
機能が部分的に使用できないと判断する。もしその機能
が部分的に使用できないと判断されたならば、図24に
示す部分使用不可状態保存テーブルT6のその機能に対
応する欄に部分的に使用不可能になっていることを示す
1を立てる(ステップ259)。
【0071】他方、ステップ257で影響無しとされた
場合又はステップ258でモジュールの多重化により部
分的にしかその機能が影響を受けないと判断された場合
には、完全使用不可状態保存テーブルT5のその機能に
対応する欄に障害から復帰していることを示す0を立て
る(ステップ260)。
【0072】以降、各モジュール及び各機能毎に以上の
処理を繰り返す(ステップ261,262)。
【0073】障害出力処理部3a,3bは、完全使用不
可状態保存テーブルT5及び部分使用不可状態保存テー
ブルT6を基に、計算機システムのCRT表示装置21
上に図25に示すようなグラフィカルな表示や図26に
示すような表示を行い、更にプリンタ装置22に図27
に示すような印刷を行う。
【0074】これによって、障害発生時の計算機システ
ムの機能障害状態を提示することで、運転員及び保守員
に計算機システム機能障害状態を正確に認識させ、障害
状況の影響度合い検出を支援することが可能になる。
【0075】本発明の請求項に係わる計算機システム
の障害状態の監視診断システムの第4実施例を図28の
ブロック図を参照して説明する。
【0076】図示するように、第4実施例は第3実施例
に加え、障害箇所検出処理部2a,2bで検出された障
害箇所、障害機能検出処理部5a,5bにより検出され
た機能、及びそれに対処するための一次手順を記述した
一次対応手順データベースD7と、障害箇所検出処理部
2a,2bで検出された障害箇所及び障害機能検出処理
部5a,5bで検出された機能を入力し、一次対応手順
データベースD7から一次対応手順の検出を行う一次対
応手順検出処理部6a,6bとが新たに備えらている。
【0077】ここで一次対応手順データベースD7の持
つ処理項目を下記に示す。 (1)計算機障害箇所 障害箇所モジュールに併せ、対象モジュールと収納筐体
番号を組合せたデータベースにより収納筐体番号を提示
処理する。 (2)一次診断提示処理 障害箇所モジュールに併せ、対象モジュールと確認内容
メッセージを組合せたデータベースにより障害箇所モジ
ュールの確認内容メッセージを提示処理する。 (3)連絡先提示処理 障害箇所モジュール、機能障害状況により連絡先の提示
処理する。
【0078】一次対応手順検出処理部6a,6bは、図
29のフローチャート示すように障害箇所検出処理部2
a,2bで検出された障害箇所及び機能障害検出処理部
5a,5bで検出された機能を入力し(ステップ31
1)、一次対応手順データベースD7を上述した処理項
目単位に検索する。検索した結果、対応する各出力処理
項目毎に、すなわち計算機障害箇所出力処理(ステップ
312)、一次診断提示処理(ステップ313)、及び
連絡先提示処理(ステップ314)を行う。それぞれの
処理結果は、障害出力処理部3a,3bを介し、例えば
図30に示すようにCRT表示装置21上に、そして図
31に示すプリンタ装置22上に表示される。
【0079】これによって、障害発生時に計算機システ
ムの障害発生部位の障害発生要因調査のための調査事項
及び計算機システム機能障害に対しての対応事項等一次
対応手順を運転員及び保守員に提示し、速やかな障害復
旧対応を支援することが可能になる。
【0080】本発明の請求項に係わる計算機システム
の障害状態の監視診断システムの第5実施例を図32の
ブロック図を参照して説明する。
【0081】図示するように、第5実施例は、第4実施
例に加え障害箇所検出処理部2a,2bで検出された障
害箇所及び障害機能検出処理部5a,5bで検出された
障害機能の履歴を記録する障害履歴データ記録テーブル
T8a,T8bと、障害履歴データ記録テーブルT8
a,T8bに記録されたデータの履歴管理を行う障害履
歴管理処理部7a,7bと、障害履歴データ記録テーブ
ルT8a,T8bと障害履歴管理用CRT装置24や障
害履歴管理用プリンタ装置25との間のデータの入出力
を処理する障害履歴管理入出力処理部9a,9bとが新
たに備えられている。
【0082】障害履歴管理処理部7a,7bは、障害履
歴データ記録テーブルT8a,T8b上で。以下に示す
管理記録項目を管理する。 (1)障害機器区分;障害信号により、CPU、周辺機
器、入出力装置、その他に区分した障害機器区分を記録
する。(例えば重障害、軽障害、機器障害、検出器障害
等)。 (2)障害発生日時;計算機システムの障害信号を入力
処理した時点での日時の記録を行う。 (3)警報状態;計算機システムからの障害信号により
出力処理した、計算機障害発生時の検出処理されたデー
タを記録する。 (4)障害発生/復帰時のメッセージ出力結果;計算機
システムからの障害信号により出力処理した、障害発生
時のメッセージ出力の記録を行う。 (5)機能障害発生/復帰時のメッセージ出力結果;計
算機システムの障害影響箇所モジュール信号により検出
処理した、機能障害メッセージの記録を行う。 (6)一次対応手順メッセージ出力結果;一次対応手順
検出処理部により検出処理した、一次対応手順メッセー
ジの記録を行う。
【0083】以上にあげた各障害履歴データは、CRT
表示装置21、プリンタ装置22、及び状態表示装置2
3への出力データであり、障害履歴管理処理部7a,7
bが入力データとして入力する。障害履歴管理処理部7
a,7bでは、入力したデータを障害履歴データ記録テ
ーブルT8a,T8b用に変換処理を行い、障害履歴デ
ータ記録テーブルT8a,T8bに記録する。
【0084】また、障害履歴管理処理部7a,7bは、
例えばキーボードである障害履歴管理用入出力装置24
からデータを入力し、障害履歴管理入出力処理部9a,
9bを介して障害履歴データ記録テーブルT8a,T8
bに書込む。。
【0085】障害履歴管理入出力処理部9a,9bは、
障害履歴データ記録テーブルT8a,T8bに記録され
ている各障害履歴管理データを、障害履歴管理用入出力
装置24からの帳票表示要求により、障害履歴管理用C
RT装置24に帳票表示するとともに、障害履歴管理用
プリンタ装置25に帳票出力を行う。
【0086】以下に、障害履歴管理入出力処理部9a,
9bが受け付ける障害履歴管理機能を示す。 (1)データ表示機能 (2)データ帳票出力機能 (3)データ入力機能 (4)データ保存機能 (5)データ一覧表示・出力機能 ここで、図33に障害履歴データの出力例を示す。
【0087】これによって、障害発生時に計算機システ
ムの障害発生日時、障害発生部位、障害発生時の計算機
システムのデータ、障害原因、対策処置等を記録した計
算機システムの障害の履歴管理データにより、計算機シ
ステム運転員及び保守員に障害発生時の障害要因の推
定、対応操作の技術的な支援データを蓄積・提供するこ
とが可能になる。
【0088】
【発明の効果】請求項1の発明によれば、計算機システ
ムに障害が発生した場合、計算機システムからの障害信
号を用いて障害発生箇所が計算機システム構成上どの箇
所であるかを視覚的にかつ正確に運転員及び計算機保守
員に情報提供する事が可能となる。
【0089】また、計算機のハードウェア構成上で障害
発生箇所が及ぼす障害の影響箇所を視覚的にかつ正確に
運転員及び計算機保守員に情報提供することが可能とな
る。
【0090】請求項の発明によれば、計算機のハード
ウェア構成上の障害箇所、影響箇所を情報提供すること
に加えて、計算機システムの機能障害状態を正確にかつ
速やかに運転員及び計算機保守員に情報提供することが
可能となる。
【0091】請求項の発明によれば、計算機システム
の障害発生時に障害発生箇所の障害発生要因調査のため
の調査事項及び計算機システムの機能障害状態に対する
対応事項等、一次対応手順を運転員及び計算機保守員に
提示し、速やかな障害復旧対応を支援することが可能と
なる。
【0092】請求項の発明によれば、計算機システム
の障害発生時に障害発生日時、障害発生箇所、障害発生
時の計算機システムのデータ、障害原因、対策処置等の
記録が可能となる。また、計算機システムの障害の履歴
管理データの蓄積により、運転員及び計算機保守員に計
算機システムの障害発生時の障害要因の推定、対応操作
の技術的な支援データの提供も可能となる。
【0093】
【図面の簡単な説明】
【図1】本発明の請求項1に係わる計算機システムの障
害状態の監視診断システムによる第1実施例を示すブロ
ック図。
【図2】CRT表示装置上でグラフィックに表示された
障害箇所を示す図。
【図3】障害箇所検出処理部の動作を示すフローチャー
ト。
【図4】障害箇所検出データベースを示す図表。
【図5】障害状態保存テーブルを示す図表。
【図6】第2実施例を示すブロック図。
【図7】CRT表示装置上でグラフィックに表示された
他のモジュールの障害により影響を受ける箇所を示す
図。
【図8】障害影響箇所検出処理部の動作を示すフローチ
ャート。
【図9】障害影響箇所検出データベースを示す図表。
【図10】障害影響状態保存テーブルを示す図表。
【図11】共有化モジュールへの影響を検出する動作を
示す図表。
【図12】障害の発生により影響を受ける各モジュール
を接続するラインを検出する動作を示すフローチャー
ト。
【図13】影響ライン検出データベースを示す図表。
【図14】影響ライン検出状態保存テーブルを示す図
表。
【図15】CRT表示装置上でグラフィックに表示され
たライン番号を示す図。
【図16】CRT表示装置上でグラフィックに表示され
たモジュール番号を示す図。
【図17】第3実施例を示すブロック図。
【図18】障害機能検出処理部の動作を示すフローチャ
ート。
【図19】完全機能使用不可検出データベースを示す図
表。
【図20】機能多重化影響判定処理を説明するための図
表。
【図21】完全使用不可状態保存テーブルを示す図表。
【図22】障害機能検出処理部の動作を示すフローチャ
ート。
【図23】部分使用不可検出データベースを示す図表。
【図24】部分使用不可状態保存テーブルを示す図表。
【図25】CRT表示装置上にグラフィカルに表示され
た障害の影響を受けた計算機システムの機能を示す図。
【図26】CRT表示装置上に表示された障害の影響を
受けた計算機システムの機能を示す図。
【図27】プリンタ装置上に表示された障害の影響を受
けた計算機システムの機能を示す図。
【図28】第4実施例を示すブロック図。
【図29】一次対応手順検出処理部の動作を示すフロー
チャート。
【図30】CRT表示装置上に表示された一次対応手順
のメッセージを示す図。
【図31】プリンタ装置上に表示された一次対応手順の
メッセージを示す図。
【図32】第5実施例を示すブロック図。
【図33】障害履歴データの出力表示を示す図。。
【図34】従来の技術による計算機システムの障害状態
の監視診断システムを示すブロック図。
【符号の説明】
1a,1b 障害信号処理部 2a,2b 障害箇所検出処理部 3a,3b 障害出力処理部 4a,4b 障害影響箇所検出処理部 5a,5b 障害機能検出処理部 6a,6b 一次対応手順検出処理部 7a,7b 障害履歴管理処理部 9a,9b 障害履歴管理入出力処理部 D2 障害箇所検出データベース D4 障害影響箇所検出データベース D5 完全機能使用不可検出データベース D6 部分機能使用不可検出データベース T2 障害状態保存テーブル T4 障害影響状態保存テーブル T5 完全使用不可状態保存テーブル T6 部分使用不可状態保存テーブル T8a,T8b 障害履歴データ記録テーブル

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】計算機システムの障害発生時に、その障害
    信号を入力して、計算機システムの障害発生状況を周辺
    装置に出力する計算機システムの障害状態の監視診断装
    置において、 前記障害信号と前記計算機システムを構成するモジュー
    ルとを対応づける障害箇所検出データベースと、前記各
    モジュール毎に障害状態を保存しておく障害状態保存テ
    ーブルと、前記障害信号を障害信号処理手段を介して入
    力し、前記障害箇所検出データベースから障害モジュー
    ルを検出し、その検出結果を前記障害状態保存テーブル
    に保存する障害箇所検出処理手段と、前記検出結果が保
    存された障害状態保存テーブルを表示装置にモジュール
    構成図としてグラフィックに表示すると共に、前記検出
    された障害モジュールを前記表示装置に強調して表示す
    る障害出力処理手段と、前記障害信号とその障害信号に
    対応するモジュールの障害により影響を受けるモジュー
    ルとを対応付ける障害影響箇所検出データベースと、各
    モジュール毎に他のモジュールの障害により自モジュー
    ルが影響を受けるか否かを保存する障害影響状態保存テ
    ーブルと、前記障害箇所検出処理手段により検出された
    障害モジュールを入力し、前記障害影響箇所検出データ
    ベースから前記障害による影響を受けるモジュールを検
    出し、そのモジュールの状態を前記障害影響状態保存テ
    ーブルに保存する障害影響箇所検出処理手段とを備え、 前記障害出力処理手段は、前記検出された障害モジュー
    ルを前記モジュール構成図上に強調して出力するもので
    ある、 ことを特徴とする 計算機システムの障害状態の監視診断
    装置。
  2. 【請求項2】前記障害モジュール又は他のモジュールで
    発生した障害の影響を受けるモジュールにより完全に使
    用不可能となる部分を計算機システムの機能毎に記述し
    ている完全機能使用不可検出データベースと、前記障害
    モジュール又は他のモジュールで発生した障害の影響を
    受けるモジュールにより部分的に使用不可能となる部分
    を計算機システムの機能毎に記述している部分機能使用
    不可検出データベースと、前記計算機システムの機能毎
    にその機能の状態を保存している完全使用不可状態保存
    テーブル及び部分使用不可状態保存テーブルと、前記障
    害箇所検出処理手段により検出された障害箇所及び障害
    影響箇所検出処理手段により検出された障害影響箇所を
    入力し、完全機能使用不可検出データベース及び部分機
    能使用不可検出データベースを基に、完全に使用不可能
    となる機能及び部分的に使用不可能となる機能を検出
    し、前記完全使用不可状態保存テーブル及び部分使用不
    可状態保存テーブルにそれぞれ記録する障害機能検出処
    理手段とを備え、 前記障害出力処理手段は、前記完全使用不可状態保存テ
    ーブル及び部分使用不可状態保存テーブルの内容を前記
    表示装置に表示するものであることを特徴とする請求項
    1に記載の計算機システムの障害状態の監視診断装置。
  3. 【請求項3】前記障害箇所、前記障害影響箇所、及び前
    記障害箇所の障害により影響を受ける前記機能から障害
    要因を調査するために必要とされる調査項目及び障害か
    ら復帰するための一次的な対応手順を記述した一次対応
    手順データベースと、前記障害箇所、前記障害影響箇
    所、及び前記障害箇所の障害により影響を受ける前記機
    能を入力し、前記一次対応手順データベースを基に、前
    記調査項目及び一次的な対応手順を検出する一次対応手
    順検出処理手段とを備え、 前記障害出力処理手段は、前記一次対応手順検出処理手
    により検出された前記調査項目及び一次的対応手順を
    出力するものであることを特徴とする請求項2に記載の
    計算機システムの障害状態の監視診断装置。
  4. 【請求項4】前記障害箇所、前記障害影響箇所、及び前
    記障害箇所の障害により影響を受ける前記機能を障害履
    歴データ記録テーブルに記録すると共に、前記調査項目
    を調査した結果判明した障害原因及び前記一次的な対応
    手順を実行した処置結果を前記障害履歴データ記録テー
    ブルに記録する障害履歴管理処理手段と、帳票表示要求
    を受付け、前記障害履歴データ記録テーブルに記録され
    ているデータを、障害履歴管理用装置に帳票出力を行う
    障害履歴管理入出力処理手段と を備えたことを特徴とする請求項に記載の計算機シス
    テムの障害状態の監視診断装置。
JP13284895A 1995-05-02 1995-05-02 計算機システムの障害状態の監視診断装置 Expired - Fee Related JP3464846B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13284895A JP3464846B2 (ja) 1995-05-02 1995-05-02 計算機システムの障害状態の監視診断装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13284895A JP3464846B2 (ja) 1995-05-02 1995-05-02 計算機システムの障害状態の監視診断装置

Publications (2)

Publication Number Publication Date
JPH08305600A JPH08305600A (ja) 1996-11-22
JP3464846B2 true JP3464846B2 (ja) 2003-11-10

Family

ID=15090938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13284895A Expired - Fee Related JP3464846B2 (ja) 1995-05-02 1995-05-02 計算機システムの障害状態の監視診断装置

Country Status (1)

Country Link
JP (1) JP3464846B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4260723B2 (ja) 2004-11-04 2009-04-30 株式会社日立製作所 情報処理装置、情報処理装置の制御方法、及びプログラム
JP4522352B2 (ja) * 2005-11-09 2010-08-11 シャープ株式会社 回路検査方法及び回路検査システム
JP2008217188A (ja) * 2007-03-01 2008-09-18 Nec Corp 障害復旧作業支援システム及び障害復旧作業支援方法
JP5558778B2 (ja) * 2009-10-22 2014-07-23 株式会社東芝 医用情報装置
WO2013190694A1 (ja) * 2012-06-22 2013-12-27 株式会社日立製作所 計算機の復旧方法、計算機システム及び記憶媒体
CN102799513B (zh) * 2012-06-28 2016-04-06 腾讯科技(深圳)有限公司 故障问题的展示方法及展示系统

Also Published As

Publication number Publication date
JPH08305600A (ja) 1996-11-22

Similar Documents

Publication Publication Date Title
JPH08297598A (ja) 計算機システム解析装置
JP3464846B2 (ja) 計算機システムの障害状態の監視診断装置
JP2000358029A (ja) 自動障害診断ネットワークシステム及びネットワークの自動障害診断方法
JPH10111712A (ja) 警報監視装置
JPH0534181A (ja) プラント監視システム
JP3163108B2 (ja) プラント監視装置
JPH06241948A (ja) 列車状態監視装置
JPS5818645B2 (ja) 電源異常表示方式
JP2916189B2 (ja) プロセスプラントのマンマシン対話装置
JPH08249212A (ja) 多重化されたコンピュータシステムにおける障害監視方法
JPH04125716A (ja) 電源断診断システム
JPH0415710A (ja) プラント警報システムとその警報表示方法
JPH06245302A (ja) 列車状態監視装置
JPH02253307A (ja) 故障診断装置
JPS6326761A (ja) ソフトウエア異常診断方式
JPH01276301A (ja) 多重化システムの保守支援装置
JPH05143153A (ja) 工業プラント設備制御用コントローラの故障診断装置
JPS63239595A (ja) 警報等の表示管理方式
JPH01250148A (ja) 故障監視装置
JPS63213039A (ja) 診断装置の障害解析方式
JP2821152B2 (ja) プラントの運転制御盤
JPS63310047A (ja) 入出力装置の異常検出方式
JPS62171009A (ja) プラント異常監視装置
JPH05324377A (ja) プロセッサ監視システム
JPS63150743A (ja) 診断装置の障害解析方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070822

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090822

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees