JP2000259455A - 設備障害管理装置および設備障害管理方法、ならびに記憶媒体 - Google Patents

設備障害管理装置および設備障害管理方法、ならびに記憶媒体

Info

Publication number
JP2000259455A
JP2000259455A JP11062833A JP6283399A JP2000259455A JP 2000259455 A JP2000259455 A JP 2000259455A JP 11062833 A JP11062833 A JP 11062833A JP 6283399 A JP6283399 A JP 6283399A JP 2000259455 A JP2000259455 A JP 2000259455A
Authority
JP
Japan
Prior art keywords
failure
fault
cause
information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11062833A
Other languages
English (en)
Other versions
JP4087974B2 (ja
Inventor
Akio Fukada
彰男 深田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP06283399A priority Critical patent/JP4087974B2/ja
Publication of JP2000259455A publication Critical patent/JP2000259455A/ja
Application granted granted Critical
Publication of JP4087974B2 publication Critical patent/JP4087974B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 多くのモシ゛ュール、ユニットから構成されるシステム1で
障害が発生した場合でも、その回復作業、故障解析、修
理作業を容易に実施すること。 【解決手段】 モシ゛ュール及びユニット2,4,5,6,7,8,10,11内部
の障害情報を検出、記録する障害情報検出記録手段20,2
1と、障害情報検出記録手段20,21により検出された障害
情報に基づき、当該障害が発生したモシ゛ュール及びユニットを判
断し、当該障害原因を特定する障害原因特定手段24b
と、障害原因特定手段24bにより特定された障害原因情
報を、当該障害が発生したと判断されたモシ゛ュール及びユニット
に伝達する障害原因伝達手段25bと、障害原因特定手段2
5bにより特定された障害原因情報を、当該障害が発生し
たと判断されたモシ゛ュール及びユニット内部に記録する障害原因
記録手段22と、障害情報検出記録手段22によって検出さ
れた障害情報、および障害原因特定手段25bによって特
定された障害原因情報を表示する表示手段10とを具備す
ること。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えばインタフェ
ースカードなどのハードウェアモジュールや、プリン
タ、ハードディスクドライブなどのユニットを組み合わ
せて構成されるシステムにおける、各ハードウェアモジ
ュールや各ユニットの障害状況を管理する設備障害管理
装置および設備障害管理方法、ならびに記憶媒体に関す
るものである。
【0002】
【従来の技術】この種の従来の設備障害管理装置および
設備障害管理方法について以下に説明する。
【0003】すなわち、従来では、インタフェースカー
ドなどのハードウェアモジュール(以下、「モジュー
ル」と称する)や、プリンタ、ハードディスクドライブ
(以下、「HDD」と称する)などのユニットを組み合
わせて構成されるシステムにおける、各モジュールや各
ユニットの障害は、各モジュールや各ユニットに内蔵さ
れた診断回路により個別に検出され、その検出結果が、
当該システムのヒューマンインタフェース(以下「HM
I」と称する)部にて、警報としてシステムの使用者へ
通知される。
【0004】そして、システムの使用者は、この通知さ
れた障害情報を見ることにより、システムにどのような
障害が発生したのかを判断した上で、障害あるいは故障
の発生したモジュールまたはユニットを交換することに
より、使用中のシステムを障害から回復させる作業を行
う。
【0005】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の設備障害管理装置および設備障害管理方法で
は、以下のような問題がある。
【0006】すなわち、多くのモジュール、ユニットか
ら構成されるシステムの場合、システムの使用者は容易
に的確な判断をすることができず、システムの回復作業
に手間取ることが多かった。
【0007】また、良品と交換し、システムから取り除
かれた障害発生の原因と推定されるモジュール、ユニッ
トは、工場の品質保証部門へ故障解析や修理作業が依頼
されるが、工場で再現テストを行っても容易にその原因
が突き止められない場合があった。
【0008】さらに、各モジュールや各ユニットの障害
履歴は、各モジュール、各ユニットに情報を記録する手
段がないため、各モジュール、各ユニットに添付される
障害履歴を所定の様式にて記載した書類の記録に頼るこ
とになる。
【0009】しかしながら、これらの情報は、障害発見
者、またはサービスマンの主観によって記載されるとこ
ろが多く、客観的な分析が阻害されるという問題があっ
た。特に、伝送路にて互いに接続されたシステム間に発
生した障害の解析を行うことは、難題であった。
【0010】本発明はこのような事情に鑑みてなされた
ものであり、多くのモジュール、ユニットから構成され
るシステムにおいて障害が発生した場合においても、使
用者の能力に依存することなく、その回復作業、故障解
析、および修理作業を容易に実施することができ、もっ
て、障害監視能力や障害回復能力に優れた設備障害管理
装置および設備障害管理方法、ならびに記憶媒体を提供
することを目的とする。
【0011】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明では、以下のような手段を講じる。
【0012】すなわち、請求項1の発明では、各種機能
を持ったハードウェアモジュール及びユニットを組み合
わせて構成されるシステムにおける、ハードウェアモジ
ュール及びユニットの障害の状況を管理する設備障害管
理装置において、ハードウェアモジュール及びユニット
の内部の障害情報を検出し、記録する障害情報検出記録
手段と、障害情報検出記録手段によって検出された障害
情報に基づいて、当該障害が発生したハードウェアモジ
ュール及びユニットを判断するとともに、当該障害の原
因を特定する障害原因特定手段と、障害原因特定手段に
よって特定された障害原因の情報を、当該障害が発生し
たと判断されたハードウェアモジュール及びユニットヘ
伝達する障害原因伝達手段と、障害原因特定手段によっ
て特定された障害原因の情報を、当該障害が発生したと
判断されたハードウェアモジュール及びユニットの内部
に記録する障害原因記録手段と、障害情報検出記録手段
によって検出された障害情報、および障害原因特定手段
によって特定された障害原因情報を表示する表示手段と
を具備する。
【0013】また、請求項2の発明では、各種機能を持
ったハードウェアモジュール及びユニットを組み合わせ
て構成されるシステムにおける、ハードウェアモジュー
ル及びユニットの障害の状況を管理する設備障害管理方
法において、ハードウェアモジュール及びユニットの内
部の障害情報を検出して記録し、検出された障害情報に
基づいて、当該障害が発生したハードウェアモジュール
及びユニットを判断するとともに、当該障害の原因を特
定し、特定された障害原因の情報を、当該障害が発生し
たと判断されたハードウェアモジュール及びユニットヘ
伝達すると共に、その内部に記録し、さらに障害情報お
よび障害原因情報を表示する。
【0014】従って、請求項1および請求項2の発明の
設備障害管理装置および設備障害管理方法においては、
障害が発生した場合に、その障害の発生時刻、障害が発
生したユニットおよびモジュール、障害原因を明確にす
ることができる。
【0015】また、障害が発生したユニットおよびモジ
ュールに障害状況を記録することによって、各ユニット
およびモジュール単位での障害履歴の確認することが可
能となる。
【0016】一方、請求項3の発明では、請求項1の発
明の設備障害管理装置において、障害原因特定手段が障
害原因を特定することができない場合に、障害情報検出
記録手段により検出された障害情報を、障害原因記録手
段によって同一時間帯に障害が発生したハードウェアモ
ジュール及びユニットに記録する。
【0017】また、請求項4の発明では、請求項2の発
明の設備障害管理方法において、障害原因を特定するこ
とができない場合に、検出された障害情報を、同一時間
帯に障害が発生したハードウェアモジュール及びユニッ
トに記録する。
【0018】従って、請求項3および請求項4の発明の
設備障害管理装置および設備障害管理方法においては、
障害が発生した場合に、その障害の発生時刻、障害が発
生したユニットおよびモジュールを明確にすることがで
きる。
【0019】また、障害が発生したユニットおよびモジ
ュールに自身の障害状況のみならず、同一時間帯に障害
が発生した全てのユニットおよびモジュールの障害状況
を記録することによって、障害原因が特定できない場合
においても、ユニットおよびモジュール単体での障害履
歴が確認できるため、障害解析に役立てることができ
る。
【0020】一方、請求項5の発明では、障害情報検出
記録手段および障害原因記録手段を、不揮発性記憶装置
によりそれぞれ構成したことを特徴とする請求項1また
は請求項3の発明の設備障害管理装置とする。
【0021】従って、請求項5の発明の設備障害管理装
置においては、設備障害管理装置本体からモジュール及
びユニットを取り外しても、モジュール及びユニットの
記録内容が喪失しない。よって、モジュール及びユニッ
トのみを設備障害管理装置本体から取り外し、工場、解
析部門へ持ち込んで障害発生の履歴確認及び解析をする
ことが可能となる。
【0022】また、請求項6の発明では、複数の設備障
害管理装置本体を、ネットワークによって相互に接続す
る構成とした請求項1または請求項3または請求項5の
発明の設備障害管理装置とする。
【0023】従って、請求項6の発明の設備障害管理装
置においては、設備障害管理装置の障害データを、公衆
回線などを経由して読み出すことができるようになる。
その結果、ユーザにおける設備の稼働状況を、メーカの
品質管理部門にてリモート診断することが可能となる。
【0024】さらに、請求項7の発明では、各種機能を
持ったハードウェアモジュール及びユニットを組み合わ
せて構成されるシステムにおける、ハードウェアモジュ
ール及びユニットの障害の状況を管理するためのプログ
ラムを記憶した記憶媒体であって、ハードウェアモジュ
ール及びユニットの内部の障害情報を検出し、記録する
障害情報検出記録手段、障害情報検出記録手段によって
検出された障害情報に基づいて、当該障害が発生したハ
ードウェアモジュール及びユニットを判断するととも
に、当該障害の原因を特定する障害原因特定手段、障害
原因特定手段によって特定された障害原因の情報を、当
該障害が発生したと判断されたハードウェアモジュール
及びユニットヘ伝達する障害原因伝達手段、障害原因特
定手段によって特定された障害原因の情報を、当該障害
が発生したと判断されたハードウェアモジュール及びユ
ニットの内部に記録する障害原因記録手段、障害情報検
出記録手段によって検出された障害情報、および障害原
因特定手段によって特定された障害原因情報を表示する
表示手段としてコンピュータを機能させるためのプログ
ラムを記憶したコンピュータ読み取り可能な記憶媒体と
する。
【0025】このような、請求項7の発明は、請求項1
および請求項2に対応する発明をコンピュータに実現さ
せるプログラムを記憶した記憶媒体である。
【0026】この記憶媒体から読み出されたプログラム
により制御されるコンピュータは、請求項1の設備障害
管理装置として機能するとともに、請求項2の設備障害
管理方法を実現する。
【0027】
【発明の実施の形態】以下に、本発明の実施の形態につ
いて図面を参照しながら説明する。
【0028】(第1の実施の形態)本発明の第1の実施
の形態を図1と図2とを用いて説明する。
【0029】図1は、本発明の実施の形態による設備障
害管理装置及び設備障害管理方法を適用したシステム構
成の一例を示す機能ブロック図である。
【0030】本装置および本方法は、例えば磁気ディス
ク等の記憶媒体に記憶されたプログラムを読み込み、こ
のプログラムによって動作が制御されるコンピュータに
よって実現される。
【0031】なお、このシステム構成は、パソコンや制
御システムのヒューマンインタフェースを想定した例で
あり、本発明はこの構成に何ら限定されるものではな
い。
【0032】図1に示すシステムにおいて、図示一点鎖
線で囲まれた範囲は、システムの主装置(以下、単に
「主装置」と記す)1である。主装置1の構成要素であ
る、メインプロセッサモジュール2、主メモリモジュー
ル4、SCSI(small computer system interface)
インタフェースモジュール5、表示・入力制御モジュー
ル6、伝送制御モジュール7は、内部バス3を介して他
の構成要素と互いに各々接続している。
【0033】メインプロセッサモジュール2は、主メモ
リモジュール4上に配置されたプログラムを解読、実行
し、主装置1に与えられている機能を実行する。
【0034】SCSIインタフェースモジュール5は、
インタフェースケーブル9を介してHDD8と接続して
いる。
【0035】HDD8は、主装置1の外部記憶装置とし
て動作するものである。主装置1のプログラムは、通常
このHDD8に格納されており、SCSIインタフェー
スモジュール5は、電源投入時に必要なプログラムをH
DD8から読み出し、主メモリモジュール4に格納す
る。主メモリモジュール4に格納されたプログラムは、
更にメインプロセッサモジュール2によって逐次読み出
され、解読、実行される。
【0036】表示・入力制御モジュール6は、主装置1
の使用者に必要な情報を、使用者が理解できる形にし
て、インタフェースケーブル12を介して表示装置10
に表示する。また、主装置1の使用者は、入力装置11
から操作指令を入力することにより、この操作指令をイ
ンタフェースケーブル13を介して表示・入力制御モジ
ュール6へ伝えることができる。
【0037】表示・入力制御モジュール6は、更にこの
操作指令を内部バス3を経由して、メインプロセッサモ
ジュール2、主メモリモジュール4へ伝達する。
【0038】伝送制御モジュール7は、伝送路14を介
して他の装置との情報交換を行うためのインタフェース
モジュールである。
【0039】本発明の第1の実施の形態による設備障害
管理装置および設備障害管理方法は、システムを構成し
ているモジュールまたはユニットに組み込まれている。
【0040】以下、システムを構成しているメインプロ
セッサモジュール2、主メモリモジュール4、SCSI
インタフェースモジュール5、表示・入力制御モジュー
ル6、伝送制御モジュール7、HDD8、表示装置1
0、入力装置11に組み込んだ本実施の形態による設備
障害管理装置および設備障害管理方法の構成について説
明する。
【0041】主装置1内部のモジュールであるメインプ
ロセッサモジュール2、主メモリモジュール4、SCS
Iインタフェースモジュール5、表示・入力制御モジュ
ール6、伝送制御モジュール7、および主装置1にイン
ターフェイスを介して接続している外部ユニットである
HDD8、表示装置10、入力装置11には、それぞれ
内部に発生する障害を検出する障害検出手段20a、2
0b、20c、20d、20e、20f、20g、20
h(以下、「20a〜h」のように表す)、内部に発生
した障害情報を記録する障害記録手段21a〜h、後述
する障害原因特定プログラム24bによって特定された
障害原因を後述する障害原因記録プログラム25bに指
定されたモジュール又はユニットに記録する障害原因記
録手段22a〜hを個別に備えている。
【0042】また、主メモリモジュール4には、障害の
検出および記録動作をメインプロセッサモジュール2に
指示する障害検出・記録プログラム23b、複数の障害
情報から障害原因を特定する動作をメインプロセッサモ
ジュール2に指示する障害原因特定プログラム24b、
前記障害原因の情報を所定のモジュール又はユニットヘ
書き込む指示をメインプロセッサモジュール2に与える
障害原因記録プログラム25b、障害の情報および障害
原因特定プログラム24bによって決定された障害原因
情報を表示装置10から表示する指示をメインプロセッ
サモジュール2に与える障害情報・障害原因情報読み出
し・表示プログラム26bを備えている。更に、主メモ
リモジュール4は、障害の情報を記録するエリアである
障害管理テーブル27bと、障害を判定する基準となる
データを備えている障害判定データベース28bとを備
えている。
【0043】次に、以上のように構成した本実施の形態
の設備障害管理方法を適用した設備障害管理装置の作用
について、SCSIインタフェースモジュール5にて障
害が検出された場合を例として説明する。
【0044】上述したように、各モジュールおよび各ユ
ニットは、それぞれに障害検出手段20a〜hを備えて
いる。
【0045】いま、SCSIインタフェースモジュール
5において障害が発生すると、SCSIインタフェース
モジュール5が備えている障害検出手段20cにて障害
が検出される。この障害は、1種類とは限らず、装置、
障害の発生状況によっては複数種類の障害が検出される
場合もある。
【0046】このように検出された障害情報、すなわち
障害の種類、障害の発生時刻、障害発生時に動作してい
た作業、などの情報を当該モジュールであるSCSIイ
ンタフェースモジュール5に備えられた障害記録手段2
1cが記録する。
【0047】また、これら障害情報は、障害が発生する
と、メインプロセッサモジュール2へ通知されると共
に、主メモリモジュール4上の障害管理テーブル27b
へ記録される。障害発生の情報が、メインプロセッサモ
ジュール2に通知されると、障害原因特定プログラム2
4bが起動し、障害原因特定プログラム24bは複数の
モジュールまたはユニットから通知された障害情報を考
慮して障害原因の特定を行う。
【0048】尚、上述した例では、同時に他のモジュー
ルおよびユニットから障害発生の通知がない場合である
が、他のモジュールやユニットにて同時に発生した障害
情報がある場合には、障害原因特定プログラム24bは
全ての障害の内容を考慮して、どのモジュール、どのユ
ニットに障害の原因が発生したのかを、障害判定データ
ベース28bを参照することにより特定する。
【0049】この場合、さらに、障害原因記録プログラ
ム25bが起動し、障害原因特定プログラム24bにお
いて特定された障害原因を、主メモリモジュール4上の
障害管理テーブル27bへ記録する。
【0050】図2は、障害管理テーブル27bの一例を
示す図であり、障害発生時刻、検出されたモジュール又
はユニット、原因の発生したモジュールまたはユニッ
ト、障害原因、障害発生時に実行されていた処理を記録
できるようになっている。使用者は、必要に応じて、こ
のような障害管理テーブル27bを参照することによっ
て、発生した障害の原因を分析することができる。
【0051】上述したように、本実施の形態の設備障害
管理装置および設備障害管理方法においては、上記のよ
うな作用により、障害が発生した場合、障害の発生時
刻、障害が発生したユニットおよびモジュール、障害原
因を明確にすることができる。
【0052】また、障害が発生したユニットおよびモジ
ュールに障害状況を記録することによって、各ユニット
およびモジュール単位での障害履歴の確認をすることが
可能となる。
【0053】(第2の実施の形態)すなわち、本発明の
第2の実施の形態の設備障害管理装置および設備障害管
理方法を適用したシステムは、図1および図2に示す前
述した第1の実施の形態において、他のモジュールやユ
ニットにて発生した障害情報があり、これらの情報を基
に障害判定データベース28bを参照しても、どのモジ
ュール、どのユニットに原因となる障害が発生したのか
を特定できない場合に対処する手段を備えたものであ
る。
【0054】なお、本実施の形態においても、第1の実
施の形態と同様、SCSIインタフェースモジュール5
にて障害が検出された場合を例として説明する。
【0055】すなわち、本実施の形態の設備障害管理装
置および設備障害管理方法が適用されるシステムの場合
は、図1に示すように、障害原因記録プログラム25b
によって障害原因特定プログラム24bへ入力された障
害情報の全てを、図2に示すような障害管理テーブル2
7bへ記録すると共に、同一時間帯に障害の発生したモ
ジュールおよびユニットの障害原因記録手段22に、障
害が発生した全てのモジュールおよびユニットを記録す
るようにする。
【0056】主装置1の使用者は、必要に応じて、関連
するモジュールおよびユニットの障害原因記録手段22
から障害の関連情報を取り出すことによって、障害の原
因を推定することができる。また、これらの情報は、メ
インプロセッサモジュール2により表示装置10に表示
することもできる。
【0057】上述したように、本実施の形態の設備障害
管理装置および設備障害管理方法を適用したシステムに
おいては、上記のような作用により、障害が発生した場
合に、その障害の発生時刻、障害が発生したユニットお
よびモジュールを明確にすることができる。
【0058】また、障害が発生したユニットおよびモジ
ュールに自身の障害状況のみならず、同一時間帯に障害
が発生した全てのユニットおよびモジュールの障害状況
を記録することによって、障害原因が特定できない場合
においても、ユニットおよびモジュール単体での障害履
歴が確認できるため、障害解析に役立てることができ
る。
【0059】(第3の実施の形態)すなわち、本発明の
第3の実施の形態の設備障害管理装置および設備障害管
理方法を適用したシステムは、図1および図2に示す前
述した第1または第2の実施の形態において、障害記録
手段21a〜h、および障害原因記録手段22a〜h
を、不揮発性記憶装置によりそれぞれ構成する。
【0060】本実施の形態の設備障害管理装置および設
備障害管理方法を適用したシステムにおいては、以上の
ような手段を講じることによって、設備障害管理装置本
体からモジュール及びユニットを取り外しても、モジュ
ール及びユニットの記録内容が喪失しない。よって、モ
ジュール及びユニットのみを設備障害管理装置本体から
取り外し、工場、解析部門へ持ち込んで障害発生の履歴
確認及び解析をすることが可能となる。
【0061】(第4の実施の形態)本発明の第4の実施
の形態を図2、図3を用いて説明する。
【0062】図3は、本発明の実施の形態による設備障
害管理装置および設備障害管理方法を適用したシステム
の一例を示す機能ブロック図である。
【0063】本装置および本方法は、例えば磁気ディス
ク等の記憶媒体に記憶されたプログラムを読み込み、こ
のプログラムによって動作が制御されるコンピュータに
よって実現される。
【0064】すなわち、本発明の第4の実施の形態の設
備障害管理装置および設備障害管理方法を適用したシス
テムは、図3に示す様に、2つの主装置31、41を、
伝送路幹線56を介して相互に接続している。また、そ
れぞれの主装置31、41は、内部バス33、43を備
えており、この内部バス33、35によって、それぞれ
以下の4つのモジュールである、メインプロセッサモジ
ュール32、42、主メモリモジュール34、44、機
能モジュール35、45、伝送制御モジュール37、4
7を互いに接続している。
【0065】メインプロセッサモジュール32、42
は、主メモリモジュール34、44に格納された種々の
プログラムを解読、実行し、主装置31、41に与えら
れた機能を実行するものである。機能モジュール35、
45は、特定の機能を実行する機能を有したモジュール
である。
【0066】伝送制御モジュール37、47は、他の装
置との情報交換を行うためのインタフェースモジュール
であり、おのおの伝送路支線54、55を経由して他の
装置との共通ネットワーク幹線である伝送路幹線56と
接続している。
【0067】更に、それぞれの主装置31、41内部の
各モジュールには、本実施の形態にある設備障害管理装
置が組み込まれている。すなわち、各モジュール内部に
発生する障害を検出するための障害検出手段20i、2
0j、20k、20l、20m、20n、20o、20
p(以下、「20i〜p」のように表す)、各モジュー
ル内部に発生した障害情報を当該モジュールに記録する
障害記録手段21i〜p、後述する障害原因特定プログ
ラム24j、24nによって特定された障害原因を、後
述する障害原因記録プログラム25j、25nによって
指定されたモジュールに記録する障害原因記録手段22
i〜pを備えている。
【0068】また、第1の主装置31および第2の主装
置41の主メモリモジュール34、44は、障害検出と
その記録とをメインプロセッサモジュール32、42に
指示するための障害検出・記録プログラム23j、23
n、各モジュールから入力された複数の障害情報から真
の障害原因を特定する動作をメインプロセッサモジュー
ル32、42に指示するための障害原因特定プログラム
24j、24n、特定された障害原因を各モジュールヘ
書き込む指示をメインプロセッサモジュール32、42
に与える障害原因記録プログラム25j、25n、各モ
ジュールで検出された障害情報および障害原因特定プロ
グラム24j、24nで決定された真の障害原因情報を
表示装置(図示せず)に表示する指示をメインプロセッ
サモジュール32、42に与える障害情報・障害原因情
報読み出し・表示プログラム26j、26nを備えてい
る。
【0069】更に、第1の主装置31および第2の主装
置41の主メモリモジュール34、44は、障害情報を
記録するエリアである障害管理テーブル27j、27n
と、障害を判定する基準となるデータを備えている障害
判定データベース28j、28nとを備えている。
【0070】次に、以上のように構成した本実施の形態
の設備障害管理方法が適用された設備障害管理装置の作
用について説明する。
【0071】なお、ここでは、第2の主装置41の伝送
制御モジュール47において障害が発生した場合におけ
る障害の検出方法を例として説明する。
【0072】いま、第2の主装置41の伝送制御モジュ
ール47にて動作上の障害が発生すると、伝送制御モジ
ュール47の障害検出手段20oがこの障害を検出す
る。この障害は、1種類とは限らず、装置や障害の発生
状況によって複数種類の障害が検出される場合もある。
【0073】この場合、第2の主装置41の伝送制御モ
ジュール47が備えている障害記録手段21oに検出さ
れた障害情報(障害の種類、障害の発生時刻、障害発生
時に動作していた作業など)は、第2の主装置41のメ
インプロセッサモジュール42へ通知されると共に、第
2の主装置41の主メモリモジュール44の障害管理テ
ーブル27nへ記録される。
【0074】メインプロセッサモジュール42へ障害発
生の通知が行われると、障害原因特定プログラム24n
が起動し、障害原因特定プログラム24nは複数のモジ
ュールから通知された障害の内容も考慮して、障害原因
の特定を行う。
【0075】尚、上述した例は、同時に他のモジュール
から障害発生の通知がない場合であるが、他のモジュー
ルにて発生した障害情報がある場合には、全ての障害の
内容を考慮して、どのモジュールに障害の原因が発生し
たのかを障害判定データベース28nを参照することに
より特定する。
【0076】次に、障害原因記録プログラム25nが起
動し、障害原因特定プログラム24nにおいて特定され
た障害原因を、第2の主装置41の主メモリモジュール
44の障害管理テーブル27nへ記録する。更に、この
障害原因は伝送路幹線56を介して、接続している他の
装置である第1の主装置31の主メモリモジュール34
の障害管理テーブル27jにも記録される。
【0077】図2は、障害管理テーブル27nの一例を
示す図であり、障害発生時刻、検出されたモジュール、
原因の発生したモジュール、障害原因、障害発生時に実
行されていた処理を記録できるようになっていると共
に、関連するモジュールの障害原因記録手段22に障害
が発生した全てのモジュールを記録するようにする。
【0078】尚、伝送制御モジュールにおける障害は、
障害が発生した当該装置における伝送制御モジュールの
みならず、同一ネットワーク上に接続している他の装置
における伝送制御モジュールにおいても検出される。
【0079】すなわち、本実施の形態におけるように、
第2の主装置41の伝送制御モジュール47に障害が発
生した場合、その障害情報は、第1の主装置31の伝送
制御モジュール37の障害検出手段20lにおいても同
様に検出され、この障害の種類、障害の発生時刻、障害
発生時に動作していた作業などの情報が、障害記録手段
21lに記録される。更に、障害検出手段20lにおい
て検出された障害情報は、メインプロセッサモジュール
32へ通知されると共に、主メモリモジュール34の障
害管理テーブル27jに記録される。
【0080】このようにして、第1の主装置31の主メ
モリモジュール34の障害管理テーブル27jは、第2
の主装置41の伝送制御モジュール47で発生した障害
の情報を、第2の主装置41の障害管理テーブル27n
から取得する場合と、伝送制御モジュール37を介して
取得する場合との2つの情報として取得する。
【0081】障害情報がメインプロセッサモジュール3
2へ通知されると、主メモリモジュール34の障害原因
特定プログラム24jが起動し、障害原因の特定を行
う。
【0082】尚、ここでは、伝送制御モジュール37、
47のうちいずれのモジュールに障害の原因が発生した
のかを、障害判定データベース28jを参照することに
より特定する。
【0083】次に、障害原因記録プログラム25jが起
動し、障害原因特定プログラム24jにて特定された障
害原因を、第1の主装置31の主メモリモジュール34
の障害管理テーブル27jへ記録すると共に、伝送制御
モジュール37、47の障害原因記録手段22l、22
oに、障害発生モジュール、ユニット名、時刻を記録す
る。
【0084】また、これら障害情報をシステム全体を管
理する特定の主装置を設け、そこで一元管理することも
可能である。図3の場合、第1の主装置31を、システ
ム全体を管理する主装置として動作させると、システム
内の全ての障害情報は、第1の主装置31へ転送され、
主メモリモジュール34の障害管理テーブル27jに反
映することができる。これにより、使用者は、障害管理
テーブル27jから障害原因情報を取り出すことによっ
て、システム内における障害の全情報を把握することが
できる。
【0085】上述したように、本実施の形態の設備障害
管理装置および設備障害管理方法を適用したシステムに
おいては、上記のような作用により、障害発生時刻と障
害の状況だけでなく、障害発生時に実行されていた処理
および関連モジュールでの障害検出状況が明確になり、
障害発生時の解析を容易に行うことができる。
【0086】更に、これらの設備障害管理装置が接続し
ているネットワークに、公衆回線などを利用することに
より、ユーザ側で使用されている設備の稼働状況を、メ
ーカの品質管理部門にて、リモート診断することも可能
となる。
【0087】なお、上述した各実施の形態において記載
した方法は、コンピュータに実行させることのできるプ
ログラムとして、例えば磁気ディスク(フロッピーディ
スク、ハードディスク等)、光ディスク(CD−RO
M、DVD等)、半導体メモリなどの記憶媒体に書き込
んで各種装置に適用したり、通信媒体により伝送して各
種装置に適用することも可能である。本装置を実現する
コンピュータは、記憶媒体に記憶されたプログラムを読
み込み、このプログラムによって動作が制御されること
により、上述した処理を実行する。
【0088】
【発明の効果】以上説明したように、本発明の設備障害
管理装置および設備障害管理方法、ならびに記憶媒体に
よれば、多くのモジュール、ユニットから構成されるシ
ステムにおいて障害が発生した場合においても、システ
ムの使用者の能力に依存することなく、その回復作業、
故障解析、および修理作業を容易に実施することができ
る。
【0089】以上により、障害履歴の客観的な分析が可
能となり、もって、障害監視能力や障害回復能力に優れ
た設備障害管理装置および設備障害管理方法を実現する
ことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態による設備障害管理
装置および設備障害管理方法を適用したシステムの一例
を示す図。
【図2】本発明による障害管理テーブルのフォーマット
の一例を示す図。
【図3】本発明の第3の実施の形態による設備障害管理
装置および設備障害管理方法を適用したシステムの一例
を示す構成図。
【符号の説明】
1…システムの主装置、 2…メインプロセッサモジュール、 3…内部バス、 4…主メモリモジュール、 5…SCSIインタフェースモジュール、 6…表示・入力制御モジュール、 7…伝送制御モジュール、 8…HDD、 9、12、13…インタフェースケーブル、 10…表示装置、 11…入力装置、 14…伝送路、 20…障害検出手段、 21…障害記録手段、 22…障害原因記録手段、 23…障害検出・記録プログラム、 24…障害原因特定プログラム、 25…障害原因記録プログラム、 26…障害情報・障害原因情報読み出し・表示プログラ
ム、 27…障害管理テーブル、 28…障害判定データベース、 31…第1の主装置、 32、42…メインプロセッサモジュール、 33、43…内部バス、 34、44…主メモリモジュール、 35、45…機能モジュール、 37、47…伝送制御モジュール、 41…第2の主装置、 54、55…伝送路支線、 56…伝送路幹線。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 各種機能を持ったハードウェアモジュー
    ル及びユニットを組み合わせて構成されるシステムにお
    ける、前記ハードウェアモジュール及びユニットの障害
    の状況を管理する設備障害管理装置において、 前記ハードウェアモジュール及び前記ユニットの内部の
    障害情報を検出し、記録する障害情報検出記録手段と、 前記障害情報検出記録手段によって検出された障害情報
    に基づいて、当該障害が発生したハードウェアモジュー
    ル及びユニットを判断するとともに、当該障害の原因を
    特定する障害原因特定手段と、 前記障害原因特定手段によって特定された障害原因の情
    報を、当該障害が発生したと判断されたハードウェアモ
    ジュール及びユニットヘ伝達する障害原因伝達手段と、 前記障害原因特定手段によって特定された障害原因の情
    報を、当該障害が発生したと判断されたハードウェアモ
    ジュール及びユニットの内部に記録する障害原因記録手
    段と、 前記障害情報検出記録手段によって検出された障害情
    報、および前記障害原因特定手段によって特定された障
    害原因情報を表示する表示手段とを具備したことを特徴
    とする設備障害管理装置。
  2. 【請求項2】 各種機能を持ったハードウェアモジュー
    ル及びユニットを組み合わせて構成されるシステムにお
    ける、前記ハードウェアモジュール及びユニットの障害
    の状況を管理する設備障害管理方法において、 前記ハードウェアモジュール及び前記ユニットの内部の
    障害情報を検出して記録し、 前記検出された障害情報に基づいて、当該障害が発生し
    たハードウェアモジュール及びユニットを判断するとと
    もに、当該障害の原因を特定し、 前記特定された障害原因の情報を、当該障害が発生した
    と判断されたハードウェアモジュール及びユニットヘ伝
    達すると共に、その内部に記録し、 さらに前記障害情報および前記障害原因情報を表示する
    ようにしたことを特徴とする設備障害管理方法。
  3. 【請求項3】 前記請求項1に記載の設備障害管理装置
    において、 前記障害原因特定手段が障害原因を特定することができ
    ない場合に、前記障害情報検出記録手段により検出され
    た障害情報を、前記障害原因記録手段によって同一時間
    帯に障害が発生したハードウェアモジュール及びユニッ
    トに記録することを特徴とする設備障害管理装置。
  4. 【請求項4】 前記請求項2に記載の設備障害管理方法
    において、 前記障害原因を特定することができない場合に、前記検
    出された障害情報を、同一時間帯に障害が発生したハー
    ドウェアモジュール及びユニットに記録するようにした
    ことを特徴とする設備障害管理方法。
  5. 【請求項5】 前記障害情報検出記録手段および前記障
    害原因記録手段を、不揮発性記憶装置によりそれぞれ構
    成したことを特徴とする請求項1または請求項3に記載
    の設備障害管理装置。
  6. 【請求項6】 複数の設備障害管理装置本体を、ネット
    ワークによって相互に接続する構成としたことを特徴と
    する請求項1または請求項3または請求項5に記載の設
    備障害管理装置。
  7. 【請求項7】 各種機能を持ったハードウェアモジュー
    ル及びユニットを組み合わせて構成されるシステムにお
    ける、前記ハードウェアモジュール及びユニットの障害
    の状況を管理するためのプログラムを記憶した記憶媒体
    であって、 前記ハードウェアモジュール及び前記ユニットの内部の
    障害情報を検出し、記録する障害情報検出記録手段、 前記障害情報検出記録手段によって検出された障害情報
    に基づいて、当該障害が発生したハードウェアモジュー
    ル及びユニットを判断するとともに、当該障害の原因を
    特定する障害原因特定手段、 前記障害原因特定手段によって特定された障害原因の情
    報を、当該障害が発生したと判断されたハードウェアモ
    ジュール及びユニットヘ伝達する障害原因伝達手段、 前記障害原因特定手段によって特定された障害原因の情
    報を、当該障害が発生したと判断されたハードウェアモ
    ジュール及びユニットの内部に記録する障害原因記録手
    段、 前記障害情報検出記録手段によって検出された障害情
    報、および前記障害原因特定手段によって特定された障
    害原因情報を表示する表示手段としてコンピュータを機
    能させるためのプログラムを記憶したコンピュータ読み
    取り可能な記憶媒体。
JP06283399A 1999-03-10 1999-03-10 設備障害管理装置および設備障害管理方法、ならびに記憶媒体 Expired - Fee Related JP4087974B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06283399A JP4087974B2 (ja) 1999-03-10 1999-03-10 設備障害管理装置および設備障害管理方法、ならびに記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06283399A JP4087974B2 (ja) 1999-03-10 1999-03-10 設備障害管理装置および設備障害管理方法、ならびに記憶媒体

Publications (2)

Publication Number Publication Date
JP2000259455A true JP2000259455A (ja) 2000-09-22
JP4087974B2 JP4087974B2 (ja) 2008-05-21

Family

ID=13211726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06283399A Expired - Fee Related JP4087974B2 (ja) 1999-03-10 1999-03-10 設備障害管理装置および設備障害管理方法、ならびに記憶媒体

Country Status (1)

Country Link
JP (1) JP4087974B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1729251A1 (en) * 2005-05-30 2006-12-06 Omron Corporation Process management apparatus and process management method
JP2007513425A (ja) * 2003-12-05 2007-05-24 フリースケール セミコンダクター インコーポレイテッド 多数の時間領域群を有するシステムでイベント群を時間順序付けする装置及び方法
US7272535B2 (en) * 2005-03-18 2007-09-18 Kabushiki Kaisha Toshiba Failure history management apparatus
JP2009064107A (ja) * 2007-09-04 2009-03-26 Toshiba Tec Corp ハードウェア監視ユニット
US7589624B2 (en) 2004-10-29 2009-09-15 Nec Corporation Component unit monitoring system and component unit monitoring method
CN110048506A (zh) * 2019-03-21 2019-07-23 首钢京唐钢铁联合有限责任公司 一种电力故障监测系统及方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06336851A (ja) * 1993-05-26 1994-12-06 Yasuyoshi Ochiai パーキングシステム
US11991038B2 (en) * 2020-02-26 2024-05-21 Nippon Telegraph And Telephone Corporation Damaged part identifying apparatus, method and program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007513425A (ja) * 2003-12-05 2007-05-24 フリースケール セミコンダクター インコーポレイテッド 多数の時間領域群を有するシステムでイベント群を時間順序付けする装置及び方法
JP4805163B2 (ja) * 2003-12-05 2011-11-02 フリースケール セミコンダクター インコーポレイテッド 多数の時間領域群を有するシステムでイベント群を時間順序付けする装置及び方法
US7589624B2 (en) 2004-10-29 2009-09-15 Nec Corporation Component unit monitoring system and component unit monitoring method
US7272535B2 (en) * 2005-03-18 2007-09-18 Kabushiki Kaisha Toshiba Failure history management apparatus
CN100462959C (zh) * 2005-03-18 2009-02-18 株式会社东芝 故障履历管理系统
EP1729251A1 (en) * 2005-05-30 2006-12-06 Omron Corporation Process management apparatus and process management method
JP2009064107A (ja) * 2007-09-04 2009-03-26 Toshiba Tec Corp ハードウェア監視ユニット
CN110048506A (zh) * 2019-03-21 2019-07-23 首钢京唐钢铁联合有限责任公司 一种电力故障监测系统及方法

Also Published As

Publication number Publication date
JP4087974B2 (ja) 2008-05-21

Similar Documents

Publication Publication Date Title
CN107463455B (zh) 一种检测内存故障的方法及装置
CN103207820B (zh) 基于raid卡日志的硬盘的故障定位方法及装置
CN105468482B (zh) 一种硬盘盘位识别和故障诊断方法及其服务器设备
US20050229020A1 (en) Error handling in an embedded system
JP2000259455A (ja) 設備障害管理装置および設備障害管理方法、ならびに記憶媒体
JP2006268208A (ja) 故障診断回路とこの故障診断回路を備えた情報処理装置、故障診断システム及び故障診断プログラム
CN101741578B (zh) 用于测试监控单元的测试方法及其服务器与测试系统
JP2005018516A (ja) 記憶装置システム及び記憶装置システムの保守方法
KR19990047323A (ko) 개인용 컴퓨터의 원격 애프터 서비스 제어방법
CN101661780B (zh) 记录重放装置
US9990382B1 (en) Secure erasure and repair of non-mechanical storage media
JP2007199968A (ja) 情報処理装置のログ採取システム
JP2010113463A (ja) 診断システム
US20200065952A1 (en) Robotic mapping for tape libraries
JP5011159B2 (ja) システム監視回路を備えた計算機
US20240184273A1 (en) Systems and methods for diagnosing manufacturing systems
JPH06269066A (ja) 機器の異常監視システム
JP2022121337A (ja) 障害検知システム及びケーブルコネクタ
JPH05324950A (ja) 情報処理装置の論理カード
JP4876639B2 (ja) 画像照合処理システム及びその障害時の環境再現方法
JP2833928B2 (ja) 診断初期化方式
KR100737208B1 (ko) 식별 정보 진단 방법 및 입출력 장치
JP2778343B2 (ja) 監視制御装置
JPH09305429A (ja) 装置診断システム
JPH05199602A (ja) 列車モニタ装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040426

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050107

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050119

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050415

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees