JP4087974B2 - Equipment failure management apparatus, equipment failure management method, and storage medium - Google Patents
Equipment failure management apparatus, equipment failure management method, and storage medium Download PDFInfo
- Publication number
- JP4087974B2 JP4087974B2 JP06283399A JP6283399A JP4087974B2 JP 4087974 B2 JP4087974 B2 JP 4087974B2 JP 06283399 A JP06283399 A JP 06283399A JP 6283399 A JP6283399 A JP 6283399A JP 4087974 B2 JP4087974 B2 JP 4087974B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- cause
- information
- unit
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、例えばインタフェースカードなどのハードウェアモジュールや、プリンタ、ハードディスクドライブなどのユニットを組み合わせて構成されるシステムにおける、各ハードウェアモジュールや各ユニットの障害状況を管理する設備障害管理装置および設備障害管理方法、ならびに記憶媒体に関するものである。
【0002】
【従来の技術】
この種の従来の設備障害管理装置および設備障害管理方法について以下に説明する。
【0003】
すなわち、従来では、インタフェースカードなどのハードウェアモジュール(以下、「モジュール」と称する)や、プリンタ、ハードディスクドライブ(以下、「HDD」と称する)などのユニットを組み合わせて構成されるシステムにおける、各モジュールや各ユニットの障害は、各モジュールや各ユニットに内蔵された診断回路により個別に検出され、その検出結果が、当該システムのヒューマンインタフェース(以下「HMI」と称する)部にて、警報としてシステムの使用者へ通知される。
【0004】
そして、システムの使用者は、この通知された障害情報を見ることにより、システムにどのような障害が発生したのかを判断した上で、障害あるいは故障の発生したモジュールまたはユニットを交換することにより、使用中のシステムを障害から回復させる作業を行う。
【0005】
【発明が解決しようとする課題】
しかしながら、このような従来の設備障害管理装置および設備障害管理方法では、以下のような問題がある。
【0006】
すなわち、多くのモジュール、ユニットから構成されるシステムの場合、システムの使用者は容易に的確な判断をすることができず、システムの回復作業に手間取ることが多かった。
【0007】
また、良品と交換し、システムから取り除かれた障害発生の原因と推定されるモジュール、ユニットは、工場の品質保証部門へ故障解析や修理作業が依頼されるが、工場で再現テストを行っても容易にその原因が突き止められない場合があった。
【0008】
さらに、各モジュールや各ユニットの障害履歴は、各モジュール、各ユニットに情報を記録する手段がないため、各モジュール、各ユニットに添付される障害履歴を所定の様式にて記載した書類の記録に頼ることになる。
【0009】
しかしながら、これらの情報は、障害発見者、またはサービスマンの主観によって記載されるところが多く、客観的な分析が阻害されるという問題があった。特に、伝送路にて互いに接続されたシステム間に発生した障害の解析を行うことは、難題であった。
【0010】
本発明はこのような事情に鑑みてなされたものであり、多くのモジュール、ユニットから構成されるシステムにおいて障害が発生した場合においても、使用者の能力に依存することなく、その回復作業、故障解析、および修理作業を容易に実施することができ、もって、障害監視能力や障害回復能力に優れた設備障害管理装置および設備障害管理方法、ならびに記憶媒体を提供することを目的とする。
【0011】
【課題を解決するための手段】
上記の目的を達成するために、本発明では、以下のような手段を講じる。
【0012】
すなわち、請求項1の発明では、各種機能を持ったハードウェアモジュール及びユニットを組み合わせて構成されるシステムにおける、ハードウェアモジュール及びユニットの障害の状況を管理する設備障害管理装置において、ハードウェアモジュール及びユニットの内部の障害情報を検出し、第1の不揮発性記憶装置に記録する障害情報検出記録手段と、障害情報検出記録手段によって検出された障害情報に基づいて、当該障害が発生したハードウェアモジュール及びユニットを判断するとともに、当該障害の原因を特定する障害原因特定手段と、障害原因特定手段によって特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットヘ伝達する障害原因伝達手段と、障害原因特定手段によって特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットの内部に備えられた第2の不揮発性記憶装置に記録する障害原因記録手段と、障害情報検出記録手段によって検出された障害情報、および障害原因特定手段によって特定された障害原因情報を表示する表示手段とを具備し、障害原因特定手段が障害原因を特定することができない場合に、障害情報検出記録手段により検出された障害情報を、障害原因記録手段によって同一時間帯に障害が発生したハードウェアモジュール及びユニットの内部に備えられた第3の不揮発性記憶装置に記録する。
また、請求項2の発明では、請求項1に記載の設備障害管理装置において、複数の設備障害管理装置本体を、ネットワークによって相互に接続する。
【0013】
また、請求項3の発明では、各種機能を持ったハードウェアモジュール及びユニットを組み合わせて構成されるシステムにおけるハードウェアモジュール及びユニットの障害の状況を管理するプログラムを実行するプロセッサモジュールによって、障害の状況を管理する設備障害管理方法において、プログラムは、プロセッサモジュールに、ハードウェアモジュール及びユニットの障害情報の検出及び記録を行う第1の手順、障害情報に対応する障害発生部の判断及び原因特定を行う第2の手順、障害情報の伝達及び記録を行う第3の手順、障害情報及び特定された原因の表示を行う第4の手順を実行させる。
そして、プロセッサモジュールが、プログラムに従って第1の手順を実行することにより、ハードウェアモジュール及びユニットの内部の障害情報を検出して第1の不揮発性記憶装置に記録し、第2の手順を実行することにより、検出された障害情報に基づいて、当該障害が発生したハードウェアモジュール及びユニットを判断するとともに、当該障害の原因を特定し、第3の手順を実行することにより、特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットヘ伝達すると共に、その内部に備えられた第2の不揮発性記憶装置に記録し、第4の手順を実行することにより、障害情報および障害原因情報を表示する。
更に、第2の手順において原因特定を行うことができない場合には、障害情報を、同一時間帯に障害が発生したハードウェア及びユニットに記録する第5の手順を実行させる。そして、プロセッサモジュールが、プログラムに従って第5の手順を実行することにより、障害原因を特定することができない場合に、検出された障害情報を、同一時間帯に障害が発生したハードウェアモジュール及びユニットの内部に備えられた第3の不揮発性記憶装置に記録する。
【0014】
従って、請求項1および請求項3の発明の設備障害管理装置および設備障害管理方法においては、障害が発生した場合に、その障害の発生時刻、障害が発生したユニットおよびモジュール、障害原因を明確にすることができる。
【0015】
また、障害が発生したユニットおよびモジュールに障害状況を記録することによって、各ユニットおよびモジュール単位での障害履歴の確認することが可能となる。
【0019】
また、障害が発生したユニットおよびモジュールに自身の障害状況のみならず、同一時間帯に障害が発生した全てのユニットおよびモジュールの障害状況を記録することによって、障害原因が特定できない場合においても、ユニットおよびモジュール単体での障害履歴が確認できるため、障害解析に役立てることができる。
【0020】
一方、請求項5の発明では、障害情報検出記録手段および障害原因記録手段を、不揮発性記憶装置によりそれぞれ構成したことを特徴とする請求項1または請求項3の発明の設備障害管理装置とする。
【0021】
従って、請求項5の発明の設備障害管理装置においては、設備障害管理装置本体からモジュール及びユニットを取り外しても、モジュール及びユニットの記録内容が喪失しない。よって、モジュール及びユニットのみを設備障害管理装置本体から取り外し、工場、解析部門へ持ち込んで障害発生の履歴確認及び解析をすることが可能となる。
【0023】
また、特に、請求項2の発明の設備障害管理装置においては、設備障害管理装置の障害データを、公衆回線などを経由して読み出すことができるようになる。その結果、ユーザにおける設備の稼働状況を、メーカの品質管理部門にてリモート診断することが可能となる。
【0024】
さらに、請求項4の発明では、各種機能を持ったハードウェアモジュール及びユニットを組み合わせて構成されるシステムにおける、ハードウェアモジュール及びユニットの障害の状況を管理するためのプログラムを記憶した記憶媒体であって、ハードウェアモジュール及びユニットの内部の障害情報を検出し、第1の不揮発性記憶装置に記録する障害情報検出記録手段、障害情報検出記録手段によって検出された障害情報に基づいて、当該障害が発生したハードウェアモジュール及びユニットを判断するとともに、当該障害の原因を特定する障害原因特定手段、障害原因特定手段によって特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットヘ伝達する障害原因伝達手段、障害原因特定手段によって特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットの内部に備えられた第2の不揮発性記憶装置に記録する障害原因記録手段、障害情報検出記録手段によって検出された障害情報、および障害原因特定手段によって特定された障害原因情報を表示する表示手段、前記障害原因特定手段が障害原因を特定することができない場合に、前記障害情報検出記録手段により検出された障害情報を、前記障害原因記録手段によって同一時間帯に障害が発生したハードウェアモジュール及びユニットの内部に備えられた第3の不揮発性記憶装置に記録する手段としてコンピュータを機能させるためのプログラムを記憶したコンピュータ読み取り可能な記憶媒体とする。
【0025】
このような、請求項4の発明は、請求項1および請求項3に対応する発明をコンピュータに実現させるプログラムを記憶した記憶媒体である。
【0026】
この記憶媒体から読み出されたプログラムより制御されるコンピュータは、請求項1の設備障害管理装置として機能するとともに、請求項3の設備障害管理方法を実現する。
【0027】
【発明の実施の形態】
以下に、本発明の実施の形態について図面を参照しながら説明する。
【0028】
(第1の実施の形態)
本発明の第1の実施の形態を図1と図2とを用いて説明する。
【0029】
図1は、本発明の実施の形態による設備障害管理装置及び設備障害管理方法を適用したシステム構成の一例を示す機能ブロック図である。
【0030】
本装置および本方法は、例えば磁気ディスク等の記憶媒体に記憶されたプログラムを読み込み、このプログラムによって動作が制御されるコンピュータによって実現される。
【0031】
なお、このシステム構成は、パソコンや制御システムのヒューマンインタフェースを想定した例であり、本発明はこの構成に何ら限定されるものではない。
【0032】
図1に示すシステムにおいて、図示一点鎖線で囲まれた範囲は、システムの主装置(以下、単に「主装置」と記す)1である。主装置1の構成要素である、メインプロセッサモジュール2、主メモリモジュール4、SCSI(small computer system interface)インタフェースモジュール5、表示・入力制御モジュール6、伝送制御モジュール7は、内部バス3を介して他の構成要素と互いに各々接続している。
【0033】
メインプロセッサモジュール2は、主メモリモジュール4上に配置されたプログラムを解読、実行し、主装置1に与えられている機能を実行する。
【0034】
SCSIインタフェースモジュール5は、インタフェースケーブル9を介してHDD8と接続している。
【0035】
HDD8は、主装置1の外部記憶装置として動作するものである。主装置1のプログラムは、通常このHDD8に格納されており、SCSIインタフェースモジュール5は、電源投入時に必要なプログラムをHDD8から読み出し、主メモリモジュール4に格納する。主メモリモジュール4に格納されたプログラムは、更にメインプロセッサモジュール2によって逐次読み出され、解読、実行される。
【0036】
表示・入力制御モジュール6は、主装置1の使用者に必要な情報を、使用者が理解できる形にして、インタフェースケーブル12を介して表示装置10に表示する。また、主装置1の使用者は、入力装置11から操作指令を入力することにより、この操作指令をインタフェースケーブル13を介して表示・入力制御モジュール6へ伝えることができる。
【0037】
表示・入力制御モジュール6は、更にこの操作指令を内部バス3を経由して、メインプロセッサモジュール2、主メモリモジュール4へ伝達する。
【0038】
伝送制御モジュール7は、伝送路14を介して他の装置との情報交換を行うためのインタフェースモジュールである。
【0039】
本発明の第1の実施の形態による設備障害管理装置および設備障害管理方法は、システムを構成しているモジュールまたはユニットに組み込まれている。
【0040】
以下、システムを構成しているメインプロセッサモジュール2、主メモリモジュール4、SCSIインタフェースモジュール5、表示・入力制御モジュール6、伝送制御モジュール7、HDD8、表示装置10、入力装置11に組み込んだ本実施の形態による設備障害管理装置および設備障害管理方法の構成について説明する。
【0041】
主装置1内部のモジュールであるメインプロセッサモジュール2、主メモリモジュール4、SCSIインタフェースモジュール5、表示・入力制御モジュール6、伝送制御モジュール7、および主装置1にインターフェイスを介して接続している外部ユニットであるHDD8、表示装置10、入力装置11には、それぞれ内部に発生する障害を検出する障害検出手段20a、20b、20c、20d、20e、20f、20g、20h(以下、「20a〜h」のように表す)、内部に発生した障害情報を記録する障害記録手段21a〜h、後述する障害原因特定プログラム24bによって特定された障害原因を後述する障害原因記録プログラム25bに指定されたモジュール又はユニットに記録する障害原因記録手段22a〜hを個別に備えている。
【0042】
また、主メモリモジュール4には、障害の検出および記録動作をメインプロセッサモジュール2に指示する障害検出・記録プログラム23b、複数の障害情報から障害原因を特定する動作をメインプロセッサモジュール2に指示する障害原因特定プログラム24b、前記障害原因の情報を所定のモジュール又はユニットヘ書き込む指示をメインプロセッサモジュール2に与える障害原因記録プログラム25b、障害の情報および障害原因特定プログラム24bによって決定された障害原因情報を表示装置10から表示する指示をメインプロセッサモジュール2に与える障害情報・障害原因情報読み出し・表示プログラム26bを備えている。更に、主メモリモジュール4は、障害の情報を記録するエリアである障害管理テーブル27bと、障害を判定する基準となるデータを備えている障害判定データベース28bとを備えている。
【0043】
次に、以上のように構成した本実施の形態の設備障害管理方法を適用した設備障害管理装置の作用について、SCSIインタフェースモジュール5にて障害が検出された場合を例として説明する。
【0044】
上述したように、各モジュールおよび各ユニットは、それぞれに障害検出手段20a〜hを備えている。
【0045】
いま、SCSIインタフェースモジュール5において障害が発生すると、SCSIインタフェースモジュール5が備えている障害検出手段20cにて障害が検出される。この障害は、1種類とは限らず、装置、障害の発生状況によっては複数種類の障害が検出される場合もある。
【0046】
このように検出された障害情報、すなわち障害の種類、障害の発生時刻、障害発生時に動作していた作業、などの情報を当該モジュールであるSCSIインタフェースモジュール5に備えられた障害記録手段21cが記録する。
【0047】
また、これら障害情報は、障害が発生すると、メインプロセッサモジュール2へ通知されると共に、主メモリモジュール4上の障害管理テーブル27bへ記録される。障害発生の情報が、メインプロセッサモジュール2に通知されると、障害原因特定プログラム24bが起動し、障害原因特定プログラム24bは複数のモジュールまたはユニットから通知された障害情報を考慮して障害原因の特定を行う。
【0048】
尚、上述した例では、同時に他のモジュールおよびユニットから障害発生の通知がない場合であるが、他のモジュールやユニットにて同時に発生した障害情報がある場合には、障害原因特定プログラム24bは全ての障害の内容を考慮して、どのモジュール、どのユニットに障害の原因が発生したのかを、障害判定データベース28bを参照することにより特定する。
【0049】
この場合、さらに、障害原因記録プログラム25bが起動し、障害原因特定プログラム24bにおいて特定された障害原因を、主メモリモジュール4上の障害管理テーブル27bへ記録する。
【0050】
図2は、障害管理テーブル27bの一例を示す図であり、障害発生時刻、検出されたモジュール又はユニット、原因の発生したモジュールまたはユニット、障害原因、障害発生時に実行されていた処理を記録できるようになっている。使用者は、必要に応じて、このような障害管理テーブル27bを参照することによって、発生した障害の原因を分析することができる。
【0051】
上述したように、本実施の形態の設備障害管理装置および設備障害管理方法においては、上記のような作用により、障害が発生した場合、障害の発生時刻、障害が発生したユニットおよびモジュール、障害原因を明確にすることができる。
【0052】
また、障害が発生したユニットおよびモジュールに障害状況を記録することによって、各ユニットおよびモジュール単位での障害履歴の確認をすることが可能となる。
【0053】
(第2の実施の形態)
すなわち、本発明の第2の実施の形態の設備障害管理装置および設備障害管理方法を適用したシステムは、図1および図2に示す前述した第1の実施の形態において、他のモジュールやユニットにて発生した障害情報があり、これらの情報を基に障害判定データベース28bを参照しても、どのモジュール、どのユニットに原因となる障害が発生したのかを特定できない場合に対処する手段を備えたものである。
【0054】
なお、本実施の形態においても、第1の実施の形態と同様、SCSIインタフェースモジュール5にて障害が検出された場合を例として説明する。
【0055】
すなわち、本実施の形態の設備障害管理装置および設備障害管理方法が適用されるシステムの場合は、図1に示すように、障害原因記録プログラム25bによって障害原因特定プログラム24bへ入力された障害情報の全てを、図2に示すような障害管理テーブル27bへ記録すると共に、同一時間帯に障害の発生したモジュールおよびユニットの障害原因記録手段22に、障害が発生した全てのモジュールおよびユニットを記録するようにする。
【0056】
主装置1の使用者は、必要に応じて、関連するモジュールおよびユニットの障害原因記録手段22から障害の関連情報を取り出すことによって、障害の原因を推定することができる。また、これらの情報は、メインプロセッサモジュール2により表示装置10に表示することもできる。
【0057】
上述したように、本実施の形態の設備障害管理装置および設備障害管理方法を適用したシステムにおいては、上記のような作用により、障害が発生した場合に、その障害の発生時刻、障害が発生したユニットおよびモジュールを明確にすることができる。
【0058】
また、障害が発生したユニットおよびモジュールに自身の障害状況のみならず、同一時間帯に障害が発生した全てのユニットおよびモジュールの障害状況を記録することによって、障害原因が特定できない場合においても、ユニットおよびモジュール単体での障害履歴が確認できるため、障害解析に役立てることができる。
【0059】
(第3の実施の形態)
すなわち、本発明の第3の実施の形態の設備障害管理装置および設備障害管理方法を適用したシステムは、図1および図2に示す前述した第1または第2の実施の形態において、障害記録手段21a〜h、および障害原因記録手段22a〜hを、不揮発性記憶装置によりそれぞれ構成する。
【0060】
本実施の形態の設備障害管理装置および設備障害管理方法を適用したシステムにおいては、以上のような手段を講じることによって、設備障害管理装置本体からモジュール及びユニットを取り外しても、モジュール及びユニットの記録内容が喪失しない。よって、モジュール及びユニットのみを設備障害管理装置本体から取り外し、工場、解析部門へ持ち込んで障害発生の履歴確認及び解析をすることが可能となる。
【0061】
(第4の実施の形態)
本発明の第4の実施の形態を図2、図3を用いて説明する。
【0062】
図3は、本発明の実施の形態による設備障害管理装置および設備障害管理方法を適用したシステムの一例を示す機能ブロック図である。
【0063】
本装置および本方法は、例えば磁気ディスク等の記憶媒体に記憶されたプログラムを読み込み、このプログラムによって動作が制御されるコンピュータによって実現される。
【0064】
すなわち、本発明の第4の実施の形態の設備障害管理装置および設備障害管理方法を適用したシステムは、図3に示す様に、2つの主装置31、41を、伝送路幹線56を介して相互に接続している。また、それぞれの主装置31、41は、内部バス33、43を備えており、この内部バス33、35によって、それぞれ以下の4つのモジュールである、メインプロセッサモジュール32、42、主メモリモジュール34、44、機能モジュール35、45、伝送制御モジュール37、47を互いに接続している。
【0065】
メインプロセッサモジュール32、42は、主メモリモジュール34、44に格納された種々のプログラムを解読、実行し、主装置31、41に与えられた機能を実行するものである。機能モジュール35、45は、特定の機能を実行する機能を有したモジュールである。
【0066】
伝送制御モジュール37、47は、他の装置との情報交換を行うためのインタフェースモジュールであり、おのおの伝送路支線54、55を経由して他の装置との共通ネットワーク幹線である伝送路幹線56と接続している。
【0067】
更に、それぞれの主装置31、41内部の各モジュールには、本実施の形態にある設備障害管理装置が組み込まれている。すなわち、各モジュール内部に発生する障害を検出するための障害検出手段20i、20j、20k、20l、20m、20n、20o、20p(以下、「20i〜p」のように表す)、各モジュール内部に発生した障害情報を当該モジュールに記録する障害記録手段21i〜p、後述する障害原因特定プログラム24j、24nによって特定された障害原因を、後述する障害原因記録プログラム25j、25nによって指定されたモジュールに記録する障害原因記録手段22i〜pを備えている。
【0068】
また、第1の主装置31および第2の主装置41の主メモリモジュール34、44は、障害検出とその記録とをメインプロセッサモジュール32、42に指示するための障害検出・記録プログラム23j、23n、各モジュールから入力された複数の障害情報から真の障害原因を特定する動作をメインプロセッサモジュール32、42に指示するための障害原因特定プログラム24j、24n、特定された障害原因を各モジュールヘ書き込む指示をメインプロセッサモジュール32、42に与える障害原因記録プログラム25j、25n、各モジュールで検出された障害情報および障害原因特定プログラム24j、24nで決定された真の障害原因情報を表示装置(図示せず)に表示する指示をメインプロセッサモジュール32、42に与える障害情報・障害原因情報読み出し・表示プログラム26j、26nを備えている。
【0069】
更に、第1の主装置31および第2の主装置41の主メモリモジュール34、44は、障害情報を記録するエリアである障害管理テーブル27j、27nと、障害を判定する基準となるデータを備えている障害判定データベース28j、28nとを備えている。
【0070】
次に、以上のように構成した本実施の形態の設備障害管理方法が適用された設備障害管理装置の作用について説明する。
【0071】
なお、ここでは、第2の主装置41の伝送制御モジュール47において障害が発生した場合における障害の検出方法を例として説明する。
【0072】
いま、第2の主装置41の伝送制御モジュール47にて動作上の障害が発生すると、伝送制御モジュール47の障害検出手段20oがこの障害を検出する。この障害は、1種類とは限らず、装置や障害の発生状況によって複数種類の障害が検出される場合もある。
【0073】
この場合、第2の主装置41の伝送制御モジュール47が備えている障害記録手段21oに検出された障害情報(障害の種類、障害の発生時刻、障害発生時に動作していた作業など)は、第2の主装置41のメインプロセッサモジュール42へ通知されると共に、第2の主装置41の主メモリモジュール44の障害管理テーブル27nへ記録される。
【0074】
メインプロセッサモジュール42へ障害発生の通知が行われると、障害原因特定プログラム24nが起動し、障害原因特定プログラム24nは複数のモジュールから通知された障害の内容も考慮して、障害原因の特定を行う。
【0075】
尚、上述した例は、同時に他のモジュールから障害発生の通知がない場合であるが、他のモジュールにて発生した障害情報がある場合には、全ての障害の内容を考慮して、どのモジュールに障害の原因が発生したのかを障害判定データベース28nを参照することにより特定する。
【0076】
次に、障害原因記録プログラム25nが起動し、障害原因特定プログラム24nにおいて特定された障害原因を、第2の主装置41の主メモリモジュール44の障害管理テーブル27nへ記録する。更に、この障害原因は伝送路幹線56を介して、接続している他の装置である第1の主装置31の主メモリモジュール34の障害管理テーブル27jにも記録される。
【0077】
図2は、障害管理テーブル27nの一例を示す図であり、障害発生時刻、検出されたモジュール、原因の発生したモジュール、障害原因、障害発生時に実行されていた処理を記録できるようになっていると共に、関連するモジュールの障害原因記録手段22に障害が発生した全てのモジュールを記録するようにする。
【0078】
尚、伝送制御モジュールにおける障害は、障害が発生した当該装置における伝送制御モジュールのみならず、同一ネットワーク上に接続している他の装置における伝送制御モジュールにおいても検出される。
【0079】
すなわち、本実施の形態におけるように、第2の主装置41の伝送制御モジュール47に障害が発生した場合、その障害情報は、第1の主装置31の伝送制御モジュール37の障害検出手段20lにおいても同様に検出され、この障害の種類、障害の発生時刻、障害発生時に動作していた作業などの情報が、障害記録手段21lに記録される。更に、障害検出手段20lにおいて検出された障害情報は、メインプロセッサモジュール32へ通知されると共に、主メモリモジュール34の障害管理テーブル27jに記録される。
【0080】
このようにして、第1の主装置31の主メモリモジュール34の障害管理テーブル27jは、第2の主装置41の伝送制御モジュール47で発生した障害の情報を、第2の主装置41の障害管理テーブル27nから取得する場合と、伝送制御モジュール37を介して取得する場合との2つの情報として取得する。
【0081】
障害情報がメインプロセッサモジュール32へ通知されると、主メモリモジュール34の障害原因特定プログラム24jが起動し、障害原因の特定を行う。
【0082】
尚、ここでは、伝送制御モジュール37、47のうちいずれのモジュールに障害の原因が発生したのかを、障害判定データベース28jを参照することにより特定する。
【0083】
次に、障害原因記録プログラム25jが起動し、障害原因特定プログラム24jにて特定された障害原因を、第1の主装置31の主メモリモジュール34の障害管理テーブル27jへ記録すると共に、伝送制御モジュール37、47の障害原因記録手段22l、22oに、障害発生モジュール、ユニット名、時刻を記録する。
【0084】
また、これら障害情報をシステム全体を管理する特定の主装置を設け、そこで一元管理することも可能である。図3の場合、第1の主装置31を、システム全体を管理する主装置として動作させると、システム内の全ての障害情報は、第1の主装置31へ転送され、主メモリモジュール34の障害管理テーブル27jに反映することができる。これにより、使用者は、障害管理テーブル27jから障害原因情報を取り出すことによって、システム内における障害の全情報を把握することができる。
【0085】
上述したように、本実施の形態の設備障害管理装置および設備障害管理方法を適用したシステムにおいては、上記のような作用により、障害発生時刻と障害の状況だけでなく、障害発生時に実行されていた処理および関連モジュールでの障害検出状況が明確になり、障害発生時の解析を容易に行うことができる。
【0086】
更に、これらの設備障害管理装置が接続しているネットワークに、公衆回線などを利用することにより、ユーザ側で使用されている設備の稼働状況を、メーカの品質管理部門にて、リモート診断することも可能となる。
【0087】
なお、上述した各実施の形態において記載した方法は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フロッピーディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記憶媒体に書き込んで各種装置に適用したり、通信媒体により伝送して各種装置に適用することも可能である。本装置を実現するコンピュータは、記憶媒体に記憶されたプログラムを読み込み、このプログラムによって動作が制御されることにより、上述した処理を実行する。
【0088】
【発明の効果】
以上説明したように、本発明の設備障害管理装置および設備障害管理方法、ならびに記憶媒体によれば、多くのモジュール、ユニットから構成されるシステムにおいて障害が発生した場合においても、システムの使用者の能力に依存することなく、その回復作業、故障解析、および修理作業を容易に実施することができる。
【0089】
以上により、障害履歴の客観的な分析が可能となり、もって、障害監視能力や障害回復能力に優れた設備障害管理装置および設備障害管理方法を実現することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態による設備障害管理装置および設備障害管理方法を適用したシステムの一例を示す図。
【図2】本発明による障害管理テーブルのフォーマットの一例を示す図。
【図3】本発明の第3の実施の形態による設備障害管理装置および設備障害管理方法を適用したシステムの一例を示す構成図。
【符号の説明】
1…システムの主装置、
2…メインプロセッサモジュール、
3…内部バス、
4…主メモリモジュール、
5…SCSIインタフェースモジュール、
6…表示・入力制御モジュール、
7…伝送制御モジュール、
8…HDD、
9、12、13…インタフェースケーブル、
10…表示装置、
11…入力装置、
14…伝送路、
20…障害検出手段、
21…障害記録手段、
22…障害原因記録手段、
23…障害検出・記録プログラム、
24…障害原因特定プログラム、
25…障害原因記録プログラム、
26…障害情報・障害原因情報読み出し・表示プログラム、
27…障害管理テーブル、
28…障害判定データベース、
31…第1の主装置、
32、42…メインプロセッサモジュール、
33、43…内部バス、
34、44…主メモリモジュール、
35、45…機能モジュール、
37、47…伝送制御モジュール、
41…第2の主装置、
54、55…伝送路支線、
56…伝送路幹線。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a facility failure management apparatus and facility failure for managing a failure state of each hardware module and each unit in a system configured by combining hardware modules such as an interface card and units such as a printer and a hard disk drive. The present invention relates to a management method and a storage medium.
[0002]
[Prior art]
This type of conventional equipment failure management apparatus and equipment failure management method will be described below.
[0003]
That is, conventionally, each module in a system configured by combining units such as a hardware module (hereinafter referred to as “module”) such as an interface card, a printer, and a hard disk drive (hereinafter referred to as “HDD”). The failure of each unit is individually detected by a diagnostic circuit built in each module or each unit, and the detection result is reported as an alarm in the human interface (hereinafter referred to as “HMI”) part of the system. The user is notified.
[0004]
Then, the user of the system looks at the notified failure information to determine what kind of failure has occurred in the system, and then replaces the module or unit in which the failure or failure has occurred. Work to recover your system from failure.
[0005]
[Problems to be solved by the invention]
However, such conventional equipment failure management apparatuses and equipment failure management methods have the following problems.
[0006]
That is, in the case of a system composed of many modules and units, the user of the system cannot easily make an accurate determination, and often takes time to recover the system.
[0007]
In addition, modules and units that have been replaced with non-defective products and removed from the system are estimated to be the cause of the failure. Failure analysis and repair work are requested from the factory's quality assurance department. In some cases, the cause could not be easily determined.
[0008]
Furthermore, since there is no means for recording information on the failure history of each module or unit in each module or unit, the failure history attached to each module or unit can be recorded in a document in a prescribed format. Rely on.
[0009]
However, this information is often written by the subject of the person who finds the disability or the service person, and there is a problem that the objective analysis is hindered. In particular, it has been difficult to analyze a failure that has occurred between systems connected to each other via a transmission line.
[0010]
The present invention has been made in view of such circumstances, and even when a failure occurs in a system composed of a large number of modules and units, recovery work and failure without depending on the ability of the user. It is an object of the present invention to provide an equipment failure management apparatus and equipment failure management method, and a storage medium that can easily perform analysis and repair work, and are excellent in failure monitoring capability and failure recovery capability.
[0011]
[Means for Solving the Problems]
In order to achieve the above object, the present invention takes the following measures.
[0012]
That is, according to the first aspect of the present invention, in a facility failure management apparatus that manages the failure status of hardware modules and units in a system configured by combining hardware modules and units having various functions, the hardware modules and Fault information detection recording means for detecting fault information inside the unit and recording it in the first non-volatile storage device, and a hardware module in which the fault has occurred based on the fault information detected by the fault information detection recording means Determining the cause of the failure, and transmitting the cause information of the failure specified by the failure cause specifying means to the hardware module and unit determined to have the failure. Specialized by failure cause transmission means and failure cause identification means The failure cause recording means for recording the failure cause information recorded in the second nonvolatile storage device provided in the hardware module and unit determined to have the failure, and the failure information detection recording means Display means for displaying detected fault information and fault cause information specified by the fault cause specifying meansHowever, when the failure cause identification unit cannot identify the cause of the failure, the failure information detected by the failure information detection recording unit is used for the hardware module and unit in which the failure has occurred in the same time zone by the failure cause recording unit. Recorded in a third non-volatile storage device provided insideTo do.
According to a second aspect of the present invention, in the equipment fault management apparatus according to the first aspect, a plurality of equipment fault management apparatus bodies are connected to each other via a network.
[0013]
Claims3In the invention of the present invention, the facility failure that manages the failure state by the processor module that executes the program that manages the failure state of the hardware module and unit in the system configured by combining the hardware module and unit having various functions. In the management method, the program stores, in the processor module, a first procedure for detecting and recording the fault information of the hardware module and the unit, a second procedure for determining a fault occurrence unit corresponding to the fault information and identifying the cause, A third procedure for transmitting and recording the failure information and a fourth procedure for displaying the failure information and the identified cause are executed.
Then, the processor module executes the first procedure according to the program, thereby detecting fault information inside the hardware module and the unit, recording the fault information in the first nonvolatile storage device, and executing the second procedure. Thus, based on the detected failure information, the hardware module and unit in which the failure has occurred are determined, the cause of the failure is identified, and the third procedure is performed to identify the cause of the failure Is transmitted to the hardware module and unit in which it is determined that the failure has occurred, and is recorded in the second non-volatile storage device provided in the hardware module, and the fourth procedure is executed, thereby Displays information and failure cause information.
Further, if the cause cannot be identified in the second procedure, the fifth procedure for recording the failure information in the hardware and unit in which the failure has occurred in the same time zone is executed. Then, when the processor module executes the fifth procedure according to the program and cannot determine the cause of the failure, the detected failure information is used for the hardware module and unit in which the failure occurred in the same time zone. Recording is performed in a third non-volatile storage device provided inside.
[0014]
Accordingly, claim 1 and claim3In the equipment fault management apparatus and equipment fault management method of the present invention, when a fault occurs, the time of occurrence of the fault, the unit and module in which the fault has occurred, and the cause of the fault can be clarified.
[0015]
Also, by recording the failure status in the unit and module in which the failure has occurred, it is possible to check the failure history for each unit and module.
[0019]
Even if the cause of failure cannot be identified by recording the failure status of all units and modules that have failed during the same time period as well as their own failure status, In addition, since the failure history of a single module can be confirmed, it can be used for failure analysis.
[0020]
On the other hand, in the invention of
[0021]
Therefore, in the equipment failure management apparatus according to the fifth aspect, even if the module and unit are removed from the equipment failure management apparatus main body, the recorded contents of the module and unit are not lost. Therefore, it is possible to remove only the modules and units from the equipment failure management apparatus main body and bring them into the factory or analysis department to check and analyze the history of failure occurrence.
[0023]
In particular,Claim2In the equipment failure management apparatus according to the invention, the trouble data of the equipment trouble management apparatus can be read out via a public line or the like. As a result, it is possible to remotely diagnose the operating status of the facility at the user by the quality control department of the manufacturer.
[0024]
And claims4According to the present invention, there is provided a storage medium storing a program for managing a failure status of a hardware module and a unit in a system configured by combining hardware modules and units having various functions. And failure information detection recording means for detecting failure information inside the unit and recording it in the first nonvolatile storage device, and a hardware module in which the failure has occurred based on the failure information detected by the failure information detection recording means Failure to determine the cause of the failure, and to transmit the information on the cause of failure identified by the failure cause identification unit to the hardware module and unit determined to have the failure. Identified by cause transmission means and failure cause identification means Detected by the failure cause recording means and the failure information detection recording means for recording the failure cause information in the second nonvolatile storage device provided inside the hardware module and unit in which the failure is determined to occur. Display means for displaying fault information and fault cause information specified by the fault cause specifying meansThe failure information detected by the failure information detection recording means when the failure cause identification means cannot identify the failure cause, the hardware module in which the failure has occurred in the same time zone by the failure cause recording means, and Means for recording in a third non-volatile storage device provided inside the unitAs a computer-readable storage medium storing a program for causing a computer to function.
[0025]
Such a claim4The invention of
[0026]
The computer controlled by the program read from the storage medium functions as the equipment failure management apparatus according to
[0027]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
[0028]
(First embodiment)
A first embodiment of the present invention will be described with reference to FIGS.
[0029]
FIG. 1 is a functional block diagram showing an example of a system configuration to which an equipment failure management apparatus and an equipment failure management method according to an embodiment of the present invention are applied.
[0030]
The apparatus and the method are realized by a computer that reads a program stored in a storage medium such as a magnetic disk and whose operation is controlled by the program.
[0031]
This system configuration is an example assuming a human interface of a personal computer or a control system, and the present invention is not limited to this configuration.
[0032]
In the system shown in FIG. 1, a range surrounded by a dashed-dotted line in the figure is a main apparatus (hereinafter simply referred to as “main apparatus”) 1 of the system. A
[0033]
The
[0034]
The
[0035]
The
[0036]
The display /
[0037]
The display /
[0038]
The
[0039]
The equipment failure management apparatus and equipment failure management method according to the first embodiment of the present invention are incorporated in modules or units constituting the system.
[0040]
Hereinafter, the
[0041]
[0042]
The
[0043]
Next, the operation of the equipment failure management apparatus to which the equipment failure management method of the present embodiment configured as described above is applied will be described by taking a case where a failure is detected by the
[0044]
As described above, each module and each unit includes the failure detection means 20a to 20h.
[0045]
Now, when a failure occurs in the
[0046]
The fault recording means 21c provided in the
[0047]
In addition, when the failure occurs, the failure information is notified to the
[0048]
In the above-described example, there is no failure notification from other modules and units at the same time. However, when there is failure information that has occurred simultaneously in other modules and units, the failure
[0049]
In this case, the failure
[0050]
FIG. 2 is a diagram showing an example of the failure management table 27b, so that the failure occurrence time, the detected module or unit, the module or unit in which the cause has occurred, the cause of the failure, and the processing that was executed when the failure occurred can be recorded. It has become. The user can analyze the cause of the failure that has occurred by referring to the failure management table 27b as necessary.
[0051]
As described above, in the equipment fault management apparatus and equipment fault management method according to the present embodiment, when a fault occurs due to the above-described action, the fault occurrence time, the unit and module in which the fault has occurred, the fault cause Can be clarified.
[0052]
Further, by recording the failure status in the unit and module in which the failure has occurred, it is possible to check the failure history for each unit and module.
[0053]
(Second Embodiment)
That is, the system to which the equipment failure management apparatus and the equipment failure management method according to the second embodiment of the present invention are applied is different from the above-described first embodiment shown in FIGS. 1 and 2 in other modules and units. Provided with a means for dealing with a case where it is not possible to identify which module or unit caused the failure even if the
[0054]
In the present embodiment, as in the first embodiment, a case where a failure is detected by the
[0055]
That is, in the case of a system to which the equipment fault management apparatus and equipment fault management method of the present embodiment is applied, as shown in FIG. 1, the fault information input to the fault
[0056]
The user of the
[0057]
As described above, in the system to which the equipment failure management apparatus and the equipment failure management method according to the present embodiment are applied, when a failure occurs due to the above-described operation, the failure occurrence time and the failure occurred. Units and modules can be clarified.
[0058]
Even if the cause of failure cannot be identified by recording the failure status of all units and modules that have failed during the same time period as well as their own failure status, In addition, since the failure history of a single module can be confirmed, it can be used for failure analysis.
[0059]
(Third embodiment)
That is, the system to which the equipment fault management apparatus and equipment fault management method according to the third embodiment of the present invention is applied is the same as the fault recording means in the first or second embodiment described above with reference to FIGS. Each of 21a-h and failure cause recording means 22a-h is configured by a nonvolatile storage device.
[0060]
In the system to which the equipment failure management apparatus and equipment failure management method of the present embodiment is applied, even if the module and unit are removed from the equipment failure management apparatus main body by taking the above-described means, the module and unit records The content is not lost. Therefore, it is possible to remove only the modules and units from the equipment failure management apparatus main body and bring them into the factory or analysis department to check and analyze the history of failure occurrence.
[0061]
(Fourth embodiment)
A fourth embodiment of the present invention will be described with reference to FIGS.
[0062]
FIG. 3 is a functional block diagram showing an example of a system to which the equipment failure management apparatus and the equipment failure management method according to the embodiment of the present invention are applied.
[0063]
The apparatus and the method are realized by a computer that reads a program stored in a storage medium such as a magnetic disk and whose operation is controlled by the program.
[0064]
That is, a system to which the equipment failure management apparatus and equipment failure management method according to the fourth embodiment of the present invention are applied is configured so that two
[0065]
The
[0066]
The
[0067]
Furthermore, the equipment failure management apparatus according to the present embodiment is incorporated in each module inside each
[0068]
Further, the
[0069]
Furthermore, the
[0070]
Next, the operation of the equipment failure management apparatus to which the equipment failure management method of the present embodiment configured as described above is applied will be described.
[0071]
Here, a failure detection method when a failure occurs in the
[0072]
If an operational failure occurs in the
[0073]
In this case, the failure information detected by the failure recording means 21o included in the
[0074]
When the
[0075]
Note that the above example is a case where there is no failure notification from another module at the same time. However, if there is failure information that occurred in another module, which module takes into account the content of all failures. It is specified by referring to the
[0076]
Next, the failure cause recording program 25n is started, and the failure cause specified by the failure
[0077]
FIG. 2 is a diagram showing an example of the failure management table 27n, and it is possible to record the failure occurrence time, the detected module, the module in which the cause has occurred, the cause of the failure, and the processing executed when the failure occurred. At the same time, all the failed modules are recorded in the related module failure cause recording means 22.
[0078]
A failure in the transmission control module is detected not only in the transmission control module in the device in which the failure has occurred, but also in the transmission control module in another device connected on the same network.
[0079]
That is, as in the present embodiment, when a failure occurs in the
[0080]
In this way, the failure management table 27j of the
[0081]
When the failure information is notified to the
[0082]
Here, it is specified by referring to the
[0083]
Next, the failure cause recording program 25j is started, and the failure cause specified by the failure cause specifying program 24j is recorded in the failure management table 27j of the
[0084]
It is also possible to provide a specific main apparatus for managing the failure information for the entire system and centrally manage the information. In the case of FIG. 3, when the first
[0085]
As described above, in the system to which the equipment fault management apparatus and equipment fault management method of the present embodiment is applied, not only the fault occurrence time and the fault status but also the fault execution time is executed by the above-described action. The failure detection status in the processing and related modules is clarified, and the analysis when the failure occurs can be easily performed.
[0086]
Furthermore, by using a public line or the like to the network to which these equipment failure management devices are connected, the operating status of equipment used on the user side can be remotely diagnosed by the manufacturer's quality control department. Is also possible.
[0087]
Note that the method described in each of the embodiments described above is stored as a program that can be executed by a computer, such as a magnetic disk (floppy disk, hard disk, etc.), an optical disk (CD-ROM, DVD, etc.), a semiconductor memory, etc. It is also possible to write on a medium and apply to various apparatuses, or transmit by a communication medium and apply to various apparatuses. A computer that implements this apparatus reads the program stored in the storage medium, and performs the above-described processing by controlling the operation by this program.
[0088]
【The invention's effect】
As described above, according to the equipment failure management apparatus, equipment failure management method, and storage medium of the present invention, even when a failure occurs in a system composed of many modules and units, The recovery work, failure analysis, and repair work can be easily performed without depending on the capability.
[0089]
As described above, an objective analysis of the fault history is possible, and thus an equipment fault management apparatus and equipment fault management method excellent in fault monitoring capability and fault recovery capability can be realized.
[Brief description of the drawings]
FIG. 1 is a diagram showing an example of a system to which an equipment failure management apparatus and an equipment failure management method according to a first embodiment of the present invention are applied.
FIG. 2 is a diagram showing an example of a format of a failure management table according to the present invention.
FIG. 3 is a configuration diagram showing an example of a system to which an equipment failure management apparatus and an equipment failure management method according to a third embodiment of the present invention are applied.
[Explanation of symbols]
1 ... The main device of the system,
2 ... Main processor module,
3 ... Internal bus,
4 ... main memory module,
5 ... SCSI interface module,
6 ... display / input control module,
7: Transmission control module,
8 ... HDD,
9, 12, 13 ... interface cable,
10 ... display device,
11 ... Input device,
14 ... transmission line,
20 ... failure detection means,
21 ... Failure recording means,
22 ... Failure cause recording means,
23 ... Fault detection / recording program,
24 ... Fault cause identification program,
25. Failure cause recording program,
26: Fault information / failure cause information read / display program,
27 ... Failure management table,
28 ... Failure judgment database,
31 ... first main device,
32, 42 ... main processor module,
33, 43 ... Internal bus,
34, 44 ... main memory module,
35, 45 ... functional modules,
37, 47 ... transmission control module,
41 ... second main device,
54, 55 ... transmission line branch line,
56: Transmission line trunk line.
Claims (4)
前記ハードウェアモジュール及び前記ユニットの内部の障害情報を検出し、第1の不揮発性記憶装置に記録する障害情報検出記録手段と、
前記障害情報検出記録手段によって検出された障害情報に基づいて、当該障害が発生したハードウェアモジュール及びユニットを判断するとともに、当該障害の原因を特定する障害原因特定手段と、
前記障害原因特定手段によって特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットヘ伝達する障害原因伝達手段と、
前記障害原因特定手段によって特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットの内部に備えられた第2の不揮発性記憶装置に記録する障害原因記録手段と、
前記障害情報検出記録手段によって検出された障害情報、および前記障害原因特定手段によって特定された障害原因情報を表示する表示手段とを具備し、
前記障害原因特定手段が障害原因を特定することができない場合に、前記障害情報検出記録手段により検出された障害情報を、前記障害原因記録手段によって同一時間帯に障害が発生したハードウェアモジュール及びユニットの内部に備えられた第3の不揮発性記憶装置に記録することを特徴とする設備障害管理装置。In a facility failure management apparatus that manages the failure status of the hardware module and unit in a system configured by combining hardware modules and units having various functions,
Fault information detection recording means for detecting fault information inside the hardware module and the unit and recording the fault information in a first nonvolatile storage device;
Based on the failure information detected by the failure information detection recording means, the hardware module and unit in which the failure has occurred are determined, and a failure cause identifying means for identifying the cause of the failure;
Failure cause transmission means for transmitting information on the cause of failure identified by the failure cause identification means to the hardware module and unit determined to have caused the failure;
Failure cause recording means for recording information on the cause of failure specified by the failure cause specifying means in a second nonvolatile storage device provided inside the hardware module and unit in which the failure has been determined; ,
Display means for displaying the failure information detected by the failure information detection recording means and the failure cause information specified by the failure cause specifying means ;
Hardware module and unit in which failure information detected by the failure information detection recording means is detected by the failure cause recording means in the same time zone when the failure cause identification means cannot specify the failure cause An equipment failure management apparatus, which records in a third non-volatile storage device provided in the inside of the apparatus.
前記プログラムは、前記プロセッサモジュールに、前記ハードウェアモジュール及びユニットの障害情報の検出及び記録を行う第1の手順、前記障害情報に対応する障害発生部の判断及び原因特定を行う第2の手順、前記障害情報の伝達及び記録を行う第3の手順、前記障害情報及び特定された原因の表示を行う第4の手順を実行させ、
前記プロセッサモジュールが、前記プログラムに従って
前記第1の手順を実行することにより、前記ハードウェアモジュール及び前記ユニットの内部の障害情報を検出して第1の不揮発性記憶装置に記録し、
前記第2の手順を実行することにより、前記検出された障害情報に基づいて、当該障害が発生したハードウェアモジュール及びユニットを判断するとともに、当該障害の原因を特定し、
前記第3の手順を実行することにより、前記特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットヘ伝達すると共に、その内部に備えられた第2の不揮発性記憶装置に記録し、
前記第4の手順を実行することにより、前記障害情報および前記障害原因情報を表示し、
前記第2の手順において原因特定を行うことができない場合には、前記障害情報を、同一時間帯に障害が発生したハードウェア及びユニットに記録する第5の手順を実行させ、
前記プロセッサモジュールが、前記プログラムに従って前記第5の手順を実行することにより、前記障害原因を特定することができない場合に、前記検出された障害情報を、同一時間帯に障害が発生したハードウェアモジュール及びユニットの内部に備えられた第3の不揮発性記憶装置に記録するようにしたことを特徴とする設備障害管理方法。Facility failure management method for managing the failure status by a processor module that executes a program for managing the failure status of the hardware module and unit in a system configured by combining hardware modules and units having various functions In
The program includes, in the processor module, a first procedure for detecting and recording fault information of the hardware module and unit, a second procedure for determining a fault occurrence unit corresponding to the fault information and specifying a cause, A third procedure for transmitting and recording the failure information, a fourth procedure for displaying the failure information and the identified cause,
The processor module detects the failure information inside the hardware module and the unit by executing the first procedure according to the program, and records it in the first nonvolatile storage device,
By executing the second procedure, based on the detected failure information, the hardware module and unit in which the failure has occurred are determined, the cause of the failure is identified,
By executing the third procedure, the information of the specified cause of failure is transmitted to the hardware module and unit determined to have the failure, and the second non-volatile provided therein Record in storage,
By executing the fourth procedure, the failure information and the failure cause information are displayed ,
If the cause cannot be identified in the second procedure, the failure information is recorded in the hardware and unit in which the failure occurred in the same time period, and a fifth procedure is executed.
When the processor module executes the fifth procedure according to the program and cannot determine the cause of the failure, the detected failure information is used as the hardware module in which the failure has occurred in the same time period. And a facility failure management method characterized in that the failure is recorded in a third non-volatile storage device provided inside the unit.
前記ハードウェアモジュール及び前記ユニットの内部の障害情報を検出し、第1の不揮発性記憶装置に記録する障害情報検出記録手段、
前記障害情報検出記録手段によって検出された障害情報に基づいて、当該障害が発生したハードウェアモジュール及びユニットを判断するとともに、当該障害の原因を特定する障害原因特定手段、
前記障害原因特定手段によって特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットヘ伝達する障害原因伝達手段、
前記障害原因特定手段によって特定された障害原因の情報を、当該障害が発生したと判断されたハードウェアモジュール及びユニットの内部に備えられた第2の不揮発性記憶装置に記録する障害原因記録手段、
前記障害情報検出記録手段によって検出された障害情報、および前記障害原因特定手段によって特定された障害原因情報を表示する表示手段、
前記障害原因特定手段が障害原因を特定することができない場合に、前記障害情報検出記録手段により検出された障害情報を、前記障害原因記録手段によって同一時間帯に障害が発生したハードウェアモジュール及びユニットの内部に備えられた第3の不揮発性記憶装置に記録する手段
としてコンピュータを機能させるためのプログラムを記憶したコンピュータ読み取り可能な記憶媒体。In a system configured by combining hardware modules and units having various functions, a storage medium storing a program for managing the failure status of the hardware modules and units,
Fault information detection recording means for detecting fault information inside the hardware module and the unit and recording the fault information in a first nonvolatile storage device;
Based on the failure information detected by the failure information detection recording means, the hardware module and unit in which the failure has occurred are determined, and a failure cause identifying means for identifying the cause of the failure,
Failure cause transmission means for transmitting information on the cause of failure identified by the failure cause identification means to the hardware module and unit determined to have the failure;
Failure cause recording means for recording information on the cause of failure specified by the failure cause specifying means in a second nonvolatile storage device provided in the hardware module and unit in which the failure has been determined;
Display means for displaying the fault information detected by the fault information detection recording means and the fault cause information specified by the fault cause specifying means ;
Hardware module and unit in which failure information detected by the failure information detection recording means is detected by the failure cause recording means in the same time zone when the failure cause identification means cannot specify the failure cause A computer-readable storage medium storing a program for causing a computer to function as means for recording in a third non-volatile storage device provided inside the computer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06283399A JP4087974B2 (en) | 1999-03-10 | 1999-03-10 | Equipment failure management apparatus, equipment failure management method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06283399A JP4087974B2 (en) | 1999-03-10 | 1999-03-10 | Equipment failure management apparatus, equipment failure management method, and storage medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000259455A JP2000259455A (en) | 2000-09-22 |
JP4087974B2 true JP4087974B2 (en) | 2008-05-21 |
Family
ID=13211726
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06283399A Expired - Fee Related JP4087974B2 (en) | 1999-03-10 | 1999-03-10 | Equipment failure management apparatus, equipment failure management method, and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4087974B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06336851A (en) * | 1993-05-26 | 1994-12-06 | Yasuyoshi Ochiai | Parking system |
US20230128841A1 (en) * | 2020-02-26 | 2023-04-27 | Nippon Telegraph And Telephone Corporation | Damaged part identifying apparatus, method and program |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7500152B2 (en) * | 2003-12-05 | 2009-03-03 | Freescale Semiconductor, Inc. | Apparatus and method for time ordering events in a system having multiple time domains |
JP4389215B2 (en) | 2004-10-29 | 2009-12-24 | 日本電気株式会社 | Component device monitoring system and component device monitoring method |
JP2006260344A (en) * | 2005-03-18 | 2006-09-28 | Toshiba Corp | Failure history management device |
JP2006331346A (en) * | 2005-05-30 | 2006-12-07 | Omron Corp | Process management apparatus, process management program, recording medium recording process management program, and process management method |
JP5053002B2 (en) * | 2007-09-04 | 2012-10-17 | 東芝テック株式会社 | Hardware monitoring unit |
CN110048506A (en) * | 2019-03-21 | 2019-07-23 | 首钢京唐钢铁联合有限责任公司 | Power failure monitoring system and method |
-
1999
- 1999-03-10 JP JP06283399A patent/JP4087974B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06336851A (en) * | 1993-05-26 | 1994-12-06 | Yasuyoshi Ochiai | Parking system |
US20230128841A1 (en) * | 2020-02-26 | 2023-04-27 | Nippon Telegraph And Telephone Corporation | Damaged part identifying apparatus, method and program |
US11991038B2 (en) * | 2020-02-26 | 2024-05-21 | Nippon Telegraph And Telephone Corporation | Damaged part identifying apparatus, method and program |
Also Published As
Publication number | Publication date |
---|---|
JP2000259455A (en) | 2000-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4087974B2 (en) | Equipment failure management apparatus, equipment failure management method, and storage medium | |
CN109240951A (en) | The system and method for the onboard networks additional storage node of safety are provided | |
JP4356634B2 (en) | Fault diagnosis circuit, information processing apparatus including the fault diagnosis circuit, fault diagnosis system, and fault diagnosis program | |
US7233879B1 (en) | System and method of agent self-repair within an intelligent agent system | |
JP2006061178A (en) | Medical apparatus | |
JP2005018516A (en) | Storage system and method of maintenance thereof | |
JP2006219092A (en) | Vehicle diagnostic system, vehicle diagnostic method, and diagnostic device for vehicle | |
US9990382B1 (en) | Secure erasure and repair of non-mechanical storage media | |
CN101661780B (en) | Recording and replaying device | |
JP2007199968A (en) | Log collection system for information processor | |
JPS5860346A (en) | Controlling system for terminal connection status | |
JP5011159B2 (en) | Computer with system monitoring circuit | |
JP2012174024A (en) | Maintenance system, maintenance method and computer program | |
JPH06269066A (en) | Fault monitor system for device | |
JP2010122134A (en) | System and method of failure cause analysis | |
JP2010231646A (en) | Device, and method for extracting log and program | |
JP3131851B2 (en) | Fault handling device | |
JP2022121337A (en) | Failure detection system and cable connector | |
JPH05199602A (en) | Train monitor | |
JP2833928B2 (en) | Diagnostic initialization method | |
JPH08147531A (en) | Cash processor | |
JPH09305429A (en) | Device diagnostic system | |
JP2002244886A (en) | Logic board with display function | |
KR100737208B1 (en) | Identification information diagnosis method and input and output apparatus | |
JP2778343B2 (en) | Monitoring and control equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040426 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20041109 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050107 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050119 |
|
A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20050415 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080222 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110228 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120229 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |