JP2015162030A - 故障指摘装置、故障指摘方法および故障指摘プログラム - Google Patents

故障指摘装置、故障指摘方法および故障指摘プログラム Download PDF

Info

Publication number
JP2015162030A
JP2015162030A JP2014036091A JP2014036091A JP2015162030A JP 2015162030 A JP2015162030 A JP 2015162030A JP 2014036091 A JP2014036091 A JP 2014036091A JP 2014036091 A JP2014036091 A JP 2014036091A JP 2015162030 A JP2015162030 A JP 2015162030A
Authority
JP
Japan
Prior art keywords
failure
priority
circuit group
alarm
suspect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014036091A
Other languages
English (en)
Inventor
和人 小口
Kazuto Oguchi
和人 小口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014036091A priority Critical patent/JP2015162030A/ja
Publication of JP2015162030A publication Critical patent/JP2015162030A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

【課題】故障実績を基に故障辞書の指摘順位を変更する技術では、装置を停止させない軽微な故障の情報を利用していないため、故障の被疑個所の順位の正確性が、当該情報を利用する場合に比べて、低くなる可能性があるという問題がある。
【解決手段】優先順位を変更する第1の加算値を被疑割合加算テーブルから読みだし、前記重故障と同じ故障事象であって前記故障区分が軽故障である件数が予め定めた閾値を超えた場合に加算する第2の加算値を前記被疑割合加算テーブルから読みだして、優先順位を示す数値に対して、第1の加算値と第2の加算値とを加算し、優先順位を示す数値が高い順番に並べ替えて故障被疑・優先順位テーブルを変更する手段を備える。
【選択図】 図1

Description

本発明は、電子装置の故障指摘装置、故障指摘方法および故障指摘プログラムに関し、発生した故障内容と過去に保守を行った実績とを参照して故障の被疑指摘内容の変更を行うことで、故障個所の指摘の正確性を高くすることができる故障指摘装置、故障指摘方法および故障指摘プログラムに関する。
コンピュータなどの電子装置に故障が発生した場合に、迅速且つ的確に故障箇所を特定し、故障個所の修理等を行う必要がある。
電子装置の故障個所を特定するための技術として、故障辞書を使用する技術が知られている。
例えば、特許文献1には、故障が発生した場合に、その故障内容と被疑部品とをデータベースに記録しておき、故障ログから不良部品が一部品に特定できない故障が発生した場合には、上記データベースに基づき不良部品の交換の優先順位を決定する技術が記載されている。
また、特許文献2には、複数の故障診断システムに対して故障辞書が指摘する被疑の場所が故障である事が的中した回数の実績をホストコンピュータで一元管理し、故障辞書が指摘する被疑の順位を、故障である事が的中した回数の実績を基に故障辞書の指摘する被疑の順位を変更する技術が記載されている。
なお、関連技術として、特許文献3には、情報処理システムの故障履歴情報とエラーコードとに基づいて、故障要因部位の保守作業の難易度を示す保守レベルを含んだ、保守作業の指示情報を出力する技術が記載されている。
また、特許文献4には、装置内でクロック故障が発生した場合に、被疑のクロックカードを検出し、クロックの供給元を現用のクロックカードから待機のクロックカードに、人手の介入なしに切り替える技術が記載されている。
特開2012−103998号公報 特開昭60−250441号公報 特開2013−206105号公報 特開2002−215261号公報
しかしながら、特許文献1および2に記載の技術では、故障個所を修理等しないと装置の運用を継続できないような重大な故障(以下、「重故障」と言う。)に関する情報を用いて、故障辞書に登録されている故障の被疑箇所の順位を示す情報を変更する処理が行われているが、装置を停止させることなく運用を継続できるような軽微な故障(以下、「軽故障」と言う。)に関する情報は使用されていない。
このように、特許文献1及び2に記載の技術では、軽故障の情報を利用していないため、故障の被疑個所の順位の正確性が、当該情報を利用する場合に比べて、低くなる可能性があるという問題がある。
なお、特許文献3及び4に記載には、故障の被疑個所の順位の正確性を向上させる技術は何ら記載されていない。
本発明の目的は、上述した問題点を解決する故障指摘装置、故障指摘方法および故障指摘プログラムを提供することにある。
故障指摘装置は、電子装置を構成する回路群からのアラームを受け取り、故障個所の分析と故障診断をする故障診断解析手段と、前記故障診断解析手段が出力した故障診断の結果を用いて故障被疑指摘の順位を変更する故障被疑優先順位変更処理手段と、記憶手段と
を備え、
前記記憶手段は、交換修理を指摘する被疑割合の優先順位を記載している故障被疑・優先順位テーブルと、被疑割合の優先順位を示す数値に加算して前記優先順位を変更する為の加算値を記載している被疑割合加算テーブルと、作業用の一時記憶部とを含み、
前記アラームは、故障の種類を示す故障事象と、前記電子装置の運転が継続できない重故障であるか、前記電子装置の運転が継続できる軽故障であるかの識別をする故障区分と
を含み、
故障診断解析手段は、前記アラームを受け取ると、前記アラームの情報を前記一時記憶部に記憶し、前記アラームの前記故障区分が軽故障である場合は、前記アラームの受け取りを継続し、前記アラームの前記故障区分が重故障である場合は、前記アラームの前記故障事象を基に前記故障被疑・優先順位テーブルから故障個所の候補となる前記回路群を選択して、当該回路群の修理を指令し、修理の結果から故障の根本原因の前記回路群を抽出して、当該回路群を前記故障被疑優先順位変更処理手段に通知し、
故障被疑優先順位変更処理手段は、前記重故障が根本原因であると判断された回路群の優先順位を変更する為に加算する第1の加算値を前記被疑割合加算テーブルから読みだし、前記重故障と同じ故障事象であって前記故障区分が軽故障である件数が予め定めた閾値を超えた場合に前記優先順位を変更する為に加算する第2の加算値を前記被疑割合加算テーブルから読みだして、前記回路群の、前記故障被疑・優先順位テーブルに記載された優先順位を示す数値に、第1の加算値と第2の加算値とを加算し、前記回路群の優先順位を示す数値が高い順番に並べ替えた優先順位に故障被疑・優先順位テーブルを変更する。
故障指摘方法は、電子装置を構成する回路群から、故障の種類を示す故障事象と、前記電子装置の運転が継続できない重故障であるか、前記電子装置の運転が継続できる軽故障であるかの識別をする故障区分とを含むアラームを受け取り、前記アラームの情報を一時記憶部に記憶し、前記アラームの前記故障区分が前記軽故障である場合は、前記アラームの受け取りを継続し、前記アラームの前記故障区分が前記重故障である場合は、前記アラームの前記故障事象を基に、交換修理を指摘する被疑割合の優先順位を記載している故障被疑・優先順位テーブルから故障個所の候補となる前記回路群を選択して、当該回路群の修理を指令し、修理の結果から故障の根本原因の前記回路群を抽出する第1のステップと、
前記重故障が根本原因であると判断された前記第1のステップで抽出した回路群の優先順位を変更する為に加算する第1の加算値を、被疑割合の優先順位を示す数値に加算して前記優先順位を変更する為の加算値を記載している被疑割合加算テーブルから読みだし、前記重故障と同じ故障事象であって前記故障区分が軽故障である件数が予め定めた閾値を超えた場合に前記優先順位を変更する為に加算する第2の加算値を前記被疑割合加算テーブルから読みだして、前記回路群の、前記故障被疑・優先順位テーブルに記載された優先順位を示す数値に、第1の加算値と第2の加算値とを加算し、前記回路群の優先順位を示す数値が高い順番に並べ替えた優先順位に故障被疑・優先順位テーブルを変更するステップとを含む。
故障指摘プログラムは、電子装置を構成する回路群から、故障の種類を示す故障事象と、前記電子装置の運転が継続できない重故障であるか、前記電子装置の運転が継続できる軽故障であるかの識別をする故障区分とを含むアラームを受け取り、前記アラームの情報を一時記憶部に記憶し、前記アラームの前記故障区分が前記軽故障である場合は、前記アラームの受け取りを継続し、前記アラームの前記故障区分が前記重故障である場合は、前記アラームの前記故障事象を基に、交換修理を指摘する被疑割合の優先順位を記載している故障被疑・優先順位テーブルから故障個所の候補となる前記回路群を選択して、当該回路群の修理を指令し、修理の結果から故障の根本原因の前記回路群を抽出する第1の処理と、
前記重故障が根本原因であると判断された前記第1の処理で抽出した回路群の優先順位を変更する為に加算する第1の加算値を、被疑割合の優先順位を示す数値に加算して前記優先順位を変更する為の加算値を記載している被疑割合加算テーブルから読みだし、前記重故障と同じ故障事象であって前記故障区分が軽故障である件数が予め定めた閾値を超えた場合に前記優先順位を変更する為に加算する第2の加算値を前記被疑割合加算テーブルから読みだして、前記回路群の、前記故障被疑・優先順位テーブルに記載された優先順位を示す数値に、第1の加算値と第2の加算値とを加算し、前記回路群の優先順位を示す数値が高い順番に並べ替えた優先順位に故障被疑・優先順位テーブルを変更する処理とをコンピュータに実行させる。
本発明には、故障内容と過去の修理の実績とを参照して、故障の被疑指摘の内容を変更する際に故障箇所の指摘の正確性を高くすることが出来るという効果がある。
本発明の第1実施の形態における電子装置100の構成を示すブロック図である。 故障ログを示す図である。 故障ログの集計結果を示す図である。 故障ログの故障事象を説明する図である。 故障ログの故障区分を説明する図である。 故障ログの故障内容を説明する図である。 故障被疑・優先順位テーブル3の初期状態を示す図である。 故障診断検出結果テーブルを示す図である。 被疑割合加算テーブル5を示す図である。 優先順位数値の補正テーブルを示す図である。 優先順位数値の加算テーブルを示す図である。 優先順位数値の正規化テーブルを示す図である。 優先順位の並べ替えテーブルを示す図である。 図7の故障被疑・優先順位テーブル3を変更した状態を示す図である。 本発明の故障被疑・優先順位テーブル3の変更処理を示すフローチャートである。 図15の処理の優先順位の変更処理の詳細を示すフローチャートである。 本発明の第2の実施の形態の故障指摘装置1の構成を示すブロック図である。
(第1の実施の形態)
次に、本発明の第1の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の実施形態を示すブロック図である。
本実施形態は電子装置100から構成され、電子装置100は、故障指摘装置1と、入出力部10と、少なくとも一つの電子回路からなる回路群A11と、少なくとも一つの電子回路からなる回路群B12と、少なくとも一つの電子回路からなる回路群C13と、これらの回路群A11、回路群B12および回路群C13と接続された診断インターフェース20とを含む。
故障指摘装置1は、故障診断解析部2と、故障被疑・優先順位テーブル3と、故障被疑優先順位変更処理部4と、被疑割合加算テーブル5と一時記憶部6を有する。
回路群A11は自らの故障を検出する故障検出部A7を有する。回路群B12は自らの故障を検出する故障検出部B8を有する。回路群C13は自らの故障を検出する故障検出部C9を有する。
なお、故障指摘装置1は、専用のハードウエアで実現してもよいし、プログラム制御により動作する一般的なコンピュータで実現してもよい。
入出力部10は、故障指摘装置1からの各種の情報を出力したり、故障指摘装置1に対する指令等の入力を行うために使用される。
次に、本発明の第1の実施の形態の動作について詳細に説明する。
電子装置100に搭載された各々の回路群のそれぞれは自らの故障を検出する故障検出部A7、故障検出部B8及び故障検出部C9のから、故障の発生に対応して、予め定められた故障事象、故障区分、故障内容及び当該故障回路群の識別子を含むアラーム信号を、診断インターフェース20を介して故障診断解析部2に送信する。
故障診断解析部2は、アラーム信号を受け取ると、記憶部14に確保した一時記憶部6に、図2に示す故障ログに、アラーム信号の情報の登録を開始する。
故障ログは、項番欄、発生時刻欄、故障事象欄、故障区分欄、故障内容欄、識別子欄から構成される。故障ログの項番001を見ると、発生時刻は2014年3月20日の8時34分であり、図4の説明によると、この項番に対する故障事象が1であることから、故障事象はデータエラーであり、図5の説明によると故障区分が1であることから軽故障であり、図6の説明によると故障内容は01であることから訂正可能な故障であり、識別子がAであることから、故障が検出された回路群はAすなわち回路群A11である。故障ログには、各々の回路群が出力したアラームの情報が、当該アラームが発生した時刻の順番に登録される。
故障診断解析部2が受け取った故障情報の故障区分が1、すなわち軽故障である場合には、故障診断解析部2が軽故障の情報を電子装置100に送信する。その後、故障診断解析部2は、回路群A11,回路群B12、回路群C13のアラーム信号の発生の監視と当該アラーム信号の故障ログへの登録を継続する。前述の軽障害の情報を受け取った電子装置100は、運転継続の為に当該軽障害の影響を少なくする為の処理を行い、運転を継続する。
次に、図2の故障ログの項番900に示す様に、故障診断解析部2が受け取った故障情報の故障区分が0、すなわち故障区分が重故障である場合には、故障診断解析部2が重故障の発生の情報を電子装置100に送信する。その後、重故障の発生により、故障診断解析部2は故障ログの作成を中断する。前述の重故障が発生した情報を受け取った電子装置100は、運転を停止させる。
さらに、故障診断解析部2が重故障の発生を検出して、当該アラーム信号を故障ログに登録した後に、故障指摘装置1が故障解析、故障個所の修理交換及び故障被疑・優先順位テーブル3の変更作業を開始する。以下に変更作業の詳細を説明する。
まず、故障診断解析部2が図2に示す故障ログから重故障が発生した当該回路群の情報を抽出する。重故障は項番900で、故障事象は1である。次に、故障事象1に関する情報を集計する。集計した例を図3に示す。図3を参照すると、故障区分1、すなわち軽故障は、識別子Aである回路群A11が0件、識別子Bである回路群B12が2件、識別子Cである回路群C13が30件発生している。故障区分0、すなわち重故障については、識別子Aである回路群A11が0件、識別子Bである回路群B12が0件、識別子Cである回路群C13が1件発生している。なお、軽故障の件数の集計については、図2の故障ログの項番900の重故障が発生する以前の一定の期間内(本例では24時間以前)に発生した件数の例である。
次に、故障被疑優先順位変更処理部4は、受け取った重故障の情報と故障被疑・優先順位テーブル3とから、故障個所の解析を開始する。以下でさらに詳細を説明する。
ここで、図7に示す故障被疑・優先順位テーブル3の説明をする。故障被疑・優先順位リスト3は、故障事象欄、故障被疑・優先順位欄から構成される。故障事象欄には、故障事象1から始まる複数の故障事象が登録される。故障被疑・優先順位欄は、さらに優先順位の欄があり、当該優先順位の欄には、回路群A11、回路群A12及び回路群C13の欄と各々の当該回路群に付与された優先順位を示す数値を記述する欄を有する。
例えば、図7の故障事象欄の故障事象1の行を見ると、優先順位1は、回路群Aであり、当該回路群Aに付与された優先順位を示す数値は50%、優先順位2は、回路群Bであり、当該回路群Bに付与された優先順位を示す数値は30%、優先順位3は、回路群Cである。したがって、当該回路群Cに付与された優先順位を示す数値は20%であるから、第1番目の修理候補は回路群Aであり、次に第2番目の修理候補は回路群Bであり、さらに、第3番目の修理候補は回路群Cであることを示す。
次に、故障被疑優先順位変更処理部4は、図7に示す故障被疑・優先順位テーブル3から、前述の故障診断解析部2から受け取った重故障の故障事象と合致する故障事象に登録された被疑候補の中から、優先順位の高い順番に修理候補を選択する。
次に、故障被疑優先順位変更処理部4は、入出力部10を用いて、選択した修理候補の回路群の識別子を、保守員に対して提示することで当該修理箇所の交換修理を指令する。
前述の交換修理の指令を受け取った保守員が、当該箇所の交換修理を行う。
故障被疑優先順位変更処理部4が、電子装置100が再起動したことを検知するか、保守員から入出力部10を経由して当該箇所の交換修理の終了の通知を受け取ると、故障被疑優先順位変更処理部4は故障診断解析部2に電子装置100の動作を確認するために故障診断の実行を故障診断解析部2に指令する。
故障診断解析部2が、電子装置100の故障診断の結果を故障被疑優先順位変更処理部4に出力する。
故障被疑優先順位変更処理部4は、交換修理の原因となった当該故障事象と同じ障事象が再度検出された場合は、交換修理が失敗したと判断し、当該故障事象が解消した場合は、交換修理が成功したと判断する。
交換修理が失敗した場合は、故障被疑優先順位変更処理部4は前述の図7に示す故障被疑・優先順位テーブル3から前述の交換修理を行った回路群の次の順位の回路群の修理対象を新たに選択して保守員に提示する。以上の交換修理作業を故障が解消するまで交換修理及び故障診断を繰り返す。
次に、故障が解消して、故障の根本原因が判明すると、故障診断解析部2は、前述の図3に示した集計内容と、図7の故障被疑・優先順位リスト3の障害事象1の行とから、一時記憶部6に、図8に示す故障診断検出結果テーブルを作成して、故障被疑優先順位変更処理部4に通知する。
ここで、図8に示す故障診断検出結果テーブルを説明する。
図8の故障診断検出結果テーブルは、障害事象の欄と、故障被疑・優先順位の欄で構成される。故障事象1の優先順位の行は、図7に示す故障被疑・優先順位テーブル3から読みだした故障事象1の内容と同じ故障被疑・優先順位の内容が登録されている。故障事象1の重故障の行には、各々の回路群の重故障を検出した件数及び故障の根本原因であるか無関係であるかの情報が記憶されている。さらに故障事象1の軽故障の行には、各々の回路群の軽故障を検出した件数が記憶されている。図8の例では、回路群Cが故障事象1の重故障を検出し、また故障解析の結果、回路群Cが根本原因であることを示す。
次に、故障を修理した実績を基に図7に示す故障被疑・優先順位テーブル3の優先順位を示す数値の変更作業を詳細に説明する。
まず、図9に示す被疑割合テーブル5の詳細を説明する。被疑割合テーブル5は、故障事象の欄、故障分類の欄、項目の欄、優先順位の欄から構成される。故障事象の欄は、図7に示す故障被疑・優先順位テーブル3の故障事象と同じ故障事象が登録されている。故障分類の欄は、重故障と軽故障とに分類されている。項目欄には、重故障の場合は、加算値が、軽故障の場合は、閾値と加算値の二つの項目が記載されている。各々の重故障の行の優先順位1、優先順位2及び優先順位3の欄には、優先順位が低いにも関わらず、故障原因であることが判明した場合に、より正確な被疑指摘の優先順位に変更する為に優先順位を示す数値に加算する値が登録されている。
例えば、故障事象1の行を見ると、故障分類が重故障である場合、故障の根本原因が優先順位1の回路群であった場合には、当該回路群に対する加算値は0%であり、故障の根本原因が優先順位2の回路群であった場合には、当該回路群に対する加算値は10%であり、故障の根本原因が優先順位3の回路群であった場合には、当該回路群に対する加算値は20%が加算値である。
軽故障の行に記載の閾値は、軽故障の発生頻度が多いほど、将来、当該箇所が当該軽故障と同じ故障事象の重故障に悪化する可能性が高いことから、当該軽故障の発生頻度が一定の数値を超えた場合に、故障被疑箇所を決める優先順位を示す数値に反映さて、優先順位の正確性を向上させる処理を行う為の判断基準である。図9に示す例では、軽故障の場合の閾値は、優先順位1の回路群が30件、優先順位2の回路群が20件、優先順位3の回路群が10件を超えた場合に、優先順位の変更を行う。
軽故障の行に記載の加算値は、軽故障が多く発生したことを重故障による加算値にさらに加味することで、より正確な被疑指摘の優先順位に変更する為の加算値が登録されている。図9に示す例では、軽故障の場合の加算値は、優先順位1の回路群の軽故障の発生数が閾値を超えた場合の加算値は0%であり、優先順位2の回路群の場合は15%、優先順位3の回路群の場合は25%が加算値であることを示している。
ここで、故障被疑優先順位変更処理部4が図7に示す故障被疑・優先順位テーブル3を変更する処理を、図2に示す故障ログの項番900において、故障事象が1の重故障が発生して電子装置100が停止し、交換修理の結果、図8の故障診断検出結果テーブルに示したとおり、故障の根本原因が回路群C13である例で説明する。
まず、故障被疑優先順位変更処理部4が、図8に示す故障診断検出結果テーブルと図7の故障被疑・優先順位テーブル3とから、図10に示す優先順位数値の補正テーブルを一時記憶部6に作成する。図10の優先順位数値の補正テーブルには、故障事象の欄に、故障事象1の優先順位の情報と、故障被疑・優先順位欄に、図7に示す故障被疑・優先順位テーブル3の故障事象1の行と同じ情報を読み出して記憶されている。具体的には、回路群A及び回路群Aの優先順位を示す数値50%、回路群B及び回路群Bの優先順位を示す数値30%、回路群C及び回路群Cの優先順位を示す20%である。また、本例で重故障を検出した回路群C13は、図7を参照すると優先順位3である。
次に、前述の様に回路群C13が優先順位3であることから、図9に示す被疑割合加算テーブル5の故障事象1の重故障における優先順位3の欄の数値、すなわち20%を読み出して、図10の優先順位数値補正の故障事象1の重故障補正の行の回路群Cに20%を登録する。
次に、図8に示す故障診断検出結果テーブルの故障事象1の軽故障の行の回路群Cの故障発生件数が30件であり、図9に示す被疑割合加算テーブルの故障事象1の軽故障の優先順位3の欄の閾値の10件を超えていることから、故障順位の変更を行う対象であると故障被疑優先順位変更処理部4が判断し、故障事象1の軽故障の優先順位3の欄の加算値25%を読み出して、図10の優先順位数値補正の故障事象1の軽故障補正の行の回路群Cに25%を登録する。
次に、図10の優先順位数値の補正テーブルの回路群A、回路群B及び回路群Cのそれぞれの欄の数値を加算し、一時記憶部6に作成した図11に示す優先順位数値の加算テーブルを得る。本例では回路群Aは50%、回路群Bは30%、回路群Cは65%である。
次に、図11の優先順位数値の加算テーブルにて得られた各々の回路群の優先順位を示す数値の合計が100%になるように正規化して、図12に示す優先順位数値の正規化テーブルを作成する。
次に、各々の回路群の優先順位を示す数値が大きい順番に順位を入れ替えて、図13に示す優先順位並べ替えテーブルを作成する。この例では、回路群Cの数値が44.8%で優先順位が1位となり、回路群Aの数値が34.5%で優先順位が2位となり、回路群Bの数値が20.7%で優先順位が3位となる。
次に、故障被疑優先順位変更処理部4が、図7に示す故障被疑・優先順位テーブル3の故障事象1の行を、前述の図13で示した優先順位並べ替えテーブルの故障事象1の優先順位の内容に変更する。以上の処理で図14に示す、故障被疑・優先順位テーブル3が生成される。この様に、重故障が発生して、故障修理の実行とともに、故障被疑・優先テーブルの優先順位の変更作業が繰り返される。図2、図8、図10、図11、図12、図13のそれぞれのテーブルは、一時記憶6に確保した作業領域に一時的に作成される。一時記憶6の作業領域は、故障指摘装置1が故障被疑・優先順位テーブル3の変更を終了した後に、内容がリセットされる。
なお、本例では、重故障の発生を起点として、優先順位の変更を開始する処理を説明したが、重故障の発生が無い場合でも、予め定めた期間が経過した時点で軽故障の発生件数が最大となった回路群を基にして、優先順位の変更の作業を開始してもよいし、予め定めた期間の軽故障の発生頻度が予め定めた閾値を超えた回路群を基にして優先順位の変更の作業を開始してもよい。
次に、故障修理の実績を基にして故障被疑・優先順位テーブル3を変更する処理の一例について、図15及び図16のフローチャートを参照して説明する。
回路群A11、回路群B12及び回路群C13のそれぞれは、故障を検出すると、故障情報として、故障事象の種類と自身の識別番号とを診断インターフェース20を介して故障診断解析部2に通知する。
故障診断解析部2が前述の故障情報を受け取ると、故障診断解析部2は、電子装置100の内部にある記憶部14に配置した一時記憶部6に故障ログを作成して、受け取った故障情報を登録する(ステップS100)。
故障診断解析部2が、回路群A11、回路群B12、または回路群C13から受け取ったアラームの故障事象が、重故障であるか、軽故障であるかを故障情報の故障区分を識別して、重故障であるか否かを判定する(ステップS101)。判定結果が重故障でない場合(ステップS101:No)、ステップS100に制御が戻る。
判定結果が重故障である場合(ステップS101:Yes)、故障診断解析部2が、故障被疑・優先順位テーブル3から、当該故障事象1に対する故障被疑候補の最上位順位の回路群を検索する(ステップS102)。図7の故障被疑・優先順位テーブル3を参照すると、故障事象1の優先順位1の欄には、「回路群A」の記述があり、優先順位を示す数値は50.0%であることが読み取れる。
次に、故障診断解析部2が当該被疑候補として検索した回路群A11が第1の修理対象であることを、入出力部10を用いて保守員に提示する(ステップS103)。
保守員が当該故障被疑として入出力部10に提示された回路群A11の修理を実施する(ステップS104)。
当該回路群A11の修理が終了した後に、電子装置100を再起動させると、故障診断解析部2が電子装置100の診断を実行する(ステップS105)。なお、修理に際して、当該回路群A11が活線挿抜にて交換し、電子装置100の電源がオフされていない場合は、電子装置100の再起動ではなく、当該回路群A11の診断のみを実行することでもよい。
故障診断解析部2が、修理が成功したか否かを判断する(ステップS106)。
故障診断解析部2が診断した結果、修理が成功しなかった場合(ステップS106:No)には故障診断解析部2が、故障被疑・優先順位テーブル3から、直前の修理作業で、修理が成功しなかった回路群の次の優先順位である回路群を選択し、ステップS103のステップに戻る(ステップS107)。
故障診断解析部2が診断した結果、修理が成功した場合には(ステップS106:Yes)、当該回路群が根本原因であると判断し、故障診断解析部2が、故障の根本原因である回路群の識別子、すなわち回路群C13を故障被疑優先順位変更処理部4に送信する(ステップS108)。
次に、故障被疑優先順位変更処理部4が故障被疑・優先順位情報の優先順位を変更する作業を行う(ステップS109)。
図16に示すフローで、ステップS109の詳細フローを説明する。
まず、重故障が根本原因である当該回路群(本例では回路群C13)で、軽故障の発生があるか否かを確認する(ステップS200)。
軽故障が無かった場合(ステップS200:No)には、故障被疑優先順位変更処理部4が被疑割合加算テーブル5の当該故障事象1の重故障の行の、故障の根本原因の回路群の識別子の優先順位の欄にある加算値を読みだして(ステップS202)、次のステップS204に進む。
軽故障がある場合(ステップS200:Yes)には、故障被疑優先順位変更処理部4が図8に示す故障診断検出結果テーブルの回路群C13の欄の故障事象1の軽故障の行から、回路群C13の軽故障が30件発生していることを読み取り、さらに被疑割合加算テーブル5の優先順位3の欄の故障事象1の軽故障の閾値の行の数値を読み取り、軽故障の発生数が閾値を超えているか否かを判断する(ステップS201)。
軽故障の発生が閾値を超えていない場合ステップS202を実行する(ステップ202:No)。
軽故障の発生が閾値を超えている場合(ステップS201:Yes)、故障被疑優先順位変更処理部4が、被疑割合加算テーブル5の優先順位3の欄の故障事象1の軽故障の加算値の行の数値を読み取る(ステップS203)。本例では、25%である。
故障被疑・優先順位テーブル3の回路群Cの優先順位を示す数値20%にステップS202にて読みだした重故障の加算値20%とステップS203にて読みだした軽故障の加算値25%とを加算する(ステップS204)。図10にステップS204で説明した回路群C13の優先順位位を示す数値の補正テーブル内容を示す。図11に、回路群C13の優先順位を示す数値の加算結果とその他の回路群の優先順位を示す数値のテーブルを示す。
次に、図11に示したテーブルの故障事象1の優先順位を示すそれぞれの数値の合計が100%になる様に、それぞれの回路群の優先順位を示す数値を正規化する(ステップS205)。図12に、正規化した内容のテーブルを示す。
次に、優先順位を示す数値が大きい順番に、回路群C13、回路群A11、回路群B12を並べ替えて、図13のテーブルを作成する(ステップS206)。
次に、ステップS206で新たに得られた故障事象1の優先順位の内容を用いて、故障被疑・優先順位テーブル3の当該故障事象1の故障被疑・優先順位を示す欄の内容に書き換えた、新たな故障被疑・優先順位テーブル3生成する(ステップS207)。
次に、図8に示す故障診断検出結果テーブル、図10に示す優先順位数値の補正テーブル、図11に示す優先順位数値の加算テーブル、図12に示す故障被疑・優先順位数値の正規化テーブル、図13に示す優先順位並べ替えテーブルに用いた一時記憶の内容を消去する(ステップS110)。その後、ステップS100における処理に戻り、ステップS100からステップS110までの一連の処理が繰り返えされる。
以上説明した様に、故障被疑箇所の指摘において、故障の被疑個所の順位の正確性を向上させることが出来る。その理由は、重故障に加えて、軽故障の発生状況もさらに用いて、故障個所の被疑を示す優先順位を示す数値を変更するからである。
(第2の実施の形態)
本発明の第2の実施の形態について図17を用いて説明する。
故障指摘装置1は、故障診断解析部2と、故障被疑・優先順位テーブル3と、故障被疑優先順位変更処理部4と、被疑割合加算テーブル5と、一時記憶部6を有する。
なお、故障指摘装置1は、専用のハードウエアで実現してもよいし、プログラム制御により動作する一般的なコンピュータで実現してもよい。
故障診断解析手段2が、診断インターフェースから前記アラームを受け取ると、アラームの情報を一時記憶部6に記憶し、アラームの故障区分が軽故障である場合は、アラームの受け取りを継続し、アラームの故障区分が重故障である場合は、アラームの故障事象を基に故障被疑・優先順位テーブル3から故障個所の候補となる回路群を選択して、当該回路群の修理を指令し、修理の結果から故障の根本原因の回路群を抽出して、当該回路群を前記故障被疑優先順位変更処理部4に通知し、
故障被疑優先順位変更処理部が、重故障が根本原因であると判断された回路群の優先順位を変更する為に加算する第1の加算値を被疑割合加算テーブル5から読みだし、重故障と同じ故障事象であって故障区分が軽故障である件数が予め定めた閾値を超えた場合に優先順位を変更する為に加算する第2の加算値を被疑割合加算テーブル5から読みだして、回路群の、故障被疑・優先順位テーブル3に記載された優先順位を示す数値に、第1の加算値と第2の加算値とを加算し、回路群の優先順位を示す数値が高い順番に並べ替えた優先順位に故障被疑・優先順位テーブル3を変更する。
故障指摘装置1は、優先順位の正確性を向上させることが出来る。その理由は、重故障にさらに軽故障の実績を加算値として加えることで、優先順位を変更するからである。
1 故障指摘装置
2 故障診断解析部
3 故障被疑・優先順位テーブル
4 故障被疑優先順位変更処理部
5 被疑割合加算テーブル
6 一時記憶部
7 故障検出部A
8 故障検出部B
9 故障検出部C
10 入出力部
11 回路群A
12 回路群B
13 回路群C
14 記憶部
100 電子装置

Claims (9)

  1. 電子装置を構成する回路群からのアラームを受け取り、故障個所の分析と故障診断をする故障診断解析手段と、
    前記故障診断解析手段が出力した故障診断の結果を用いて故障被疑指摘の順位を変更する故障被疑優先順位変更処理手段と、
    記憶手段と
    を備え、
    前記記憶手段は、交換修理を指摘する被疑割合の優先順位を記載している故障被疑・優先順位テーブルと、被疑割合の優先順位を示す数値に加算して前記優先順位を変更する為の加算値を記載している被疑割合加算テーブルと、作業用の一時記憶部と
    を含み、
    前記アラームは、故障の種類を示す故障事象と、前記電子装置の運転が継続できない重故障であるか、前記電子装置の運転が継続できる軽故障であるかの識別をする故障区分と
    を含み、
    故障診断解析手段は、前記アラームを受け取ると、前記アラームの情報を前記一時記憶部に記憶し、前記アラームの前記故障区分が軽故障である場合は、前記アラームの受け取りを継続し、前記アラームの前記故障区分が重故障である場合は、前記アラームの前記故障事象を基に前記故障被疑・優先順位テーブルから故障個所の候補となる前記回路群を選択して、当該回路群の修理を指令し、修理の結果から故障の根本原因の前記回路群を抽出して、当該回路群を前記故障被疑優先順位変更処理手段に通知し、
    故障被疑優先順位変更処理手段は、前記重故障が根本原因であると判断された回路群の優先順位を変更する為に加算する第1の加算値を前記被疑割合加算テーブルから読みだし、前記重故障と同じ故障事象であって前記故障区分が軽故障である件数が予め定めた閾値を超えた場合に前記優先順位を変更する為に加算する第2の加算値を前記被疑割合加算テーブルから読みだして、前記回路群の、前記故障被疑・優先順位テーブルに記載された優先順位を示す数値に、第1の加算値と第2の加算値とを加算し、前記回路群の優先順位を示す数値が高い順番に並べ替えた優先順位に故障被疑・優先順位テーブルを変更する
    ことを特徴とする、故障指摘装置。
  2. 前記電子装置の運転が一定の期間経過した後、前記期間内に発生した前記軽故障の発生数の一番多い前記回路群を対象にして、予め定めた前記軽故障の発生数の閾値をこえた場合に、前記故障被疑・優先順位テーブルの変更を行うことを特徴とした請求項1の故障指摘装置。
  3. 前記電子装置の運転中において、予め定めた期間内の前記軽故障の発生頻度が予め定めた閾値を超えた前記回路群を対象にして、前記故障被疑・優先順位テーブルの変更を行うことを特徴とした請求項1の故障指摘装置。
  4. 電子装置を構成する回路群から、故障の種類を示す故障事象と、前記電子装置の運転が継続できない重故障であるか、前記電子装置の運転が継続できる軽故障であるかの識別をする故障区分とを含むアラームを受け取り、前記アラームの情報を一時記憶部に記憶し、前記アラームの前記故障区分が前記軽故障である場合は、前記アラームの受け取りを継続し、前記アラームの前記故障区分が前記重故障である場合は、前記アラームの前記故障事象を基に、交換修理を指摘する被疑割合の優先順位を記載している故障被疑・優先順位テーブルから故障個所の候補となる前記回路群を選択して、当該回路群の修理を指令し、修理の結果から故障の根本原因の前記回路群を抽出する第1のステップと、
    前記重故障が根本原因であると判断された前記第1のステップで抽出した回路群の優先順位を変更する為に加算する第1の加算値を、被疑割合の優先順位を示す数値に加算して前記優先順位を変更する為の加算値を記載している被疑割合加算テーブルから読みだし、前記重故障と同じ故障事象であって前記故障区分が軽故障である件数が予め定めた閾値を超えた場合に前記優先順位を変更する為に加算する第2の加算値を前記被疑割合加算テーブルから読みだして、前記回路群の、前記故障被疑・優先順位テーブルに記載された優先順位を示す数値に、第1の加算値と第2の加算値とを加算し、前記回路群の優先順位を示す数値が高い順番に並べ替えた優先順位に故障被疑・優先順位テーブルを変更するステップと
    を含むことを特徴とした故障指摘方法。
  5. 前記軽故障の発生件数は、予め定められた一定の期間経過した後、前記期間内において一番多く発生した数値を選択するステップと
    を含むことを特徴とした請求項4の故障指摘方法。
  6. 前記軽故障の発生件数は、予め定められた一定の期間内で一番発生頻度の高い数値を選択するステップと
    を含むことを特徴とした請求項4の故障指摘方法。
  7. 電子装置を構成する回路群から、故障の種類を示す故障事象と、前記電子装置の運転が継続できない重故障であるか、前記電子装置の運転が継続できる軽故障であるかの識別をする故障区分とを含むアラームを受け取り、前記アラームの情報を一時記憶部に記憶し、前記アラームの前記故障区分が前記軽故障である場合は、前記アラームの受け取りを継続し、前記アラームの前記故障区分が前記重故障である場合は、前記アラームの前記故障事象を基に、交換修理を指摘する被疑割合の優先順位を記載している故障被疑・優先順位テーブルから故障個所の候補となる前記回路群を選択して、当該回路群の修理を指令し、修理の結果から故障の根本原因の前記回路群を抽出する第1の処理と、
    前記重故障が根本原因であると判断された前記第1の処理で抽出した回路群の優先順位を変更する為に加算する第1の加算値を、被疑割合の優先順位を示す数値に加算して前記優先順位を変更する為の加算値を記載している被疑割合加算テーブルから読みだし、前記重故障と同じ故障事象であって前記故障区分が軽故障である件数が予め定めた閾値を超えた場合に前記優先順位を変更する為に加算する第2の加算値を前記被疑割合加算テーブルから読みだして、前記回路群の、前記故障被疑・優先順位テーブルに記載された優先順位を示す数値に、第1の加算値と第2の加算値とを加算し、前記回路群の優先順位を示す数値が高い順番に並べ替えた優先順位に故障被疑・優先順位テーブルを変更する処理と
    をコンピュータに実行させることを特徴とする故障指摘プログラム。
  8. 前記軽故障の発生件数は、予め定められた一定の期間経過した後、前記期間内において一番多く発生した数値を選択する処理と
    をコンピュータに実行させることを特徴とした請求項7の故障指摘プログラム。
  9. 前記軽故障の発生件数は、予め定められた一定の期間内で一番発生頻度の高い数値を選択する処理と
    をコンピュータに実行させることを特徴とする請求項7の故障指摘プログラム。
JP2014036091A 2014-02-27 2014-02-27 故障指摘装置、故障指摘方法および故障指摘プログラム Pending JP2015162030A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014036091A JP2015162030A (ja) 2014-02-27 2014-02-27 故障指摘装置、故障指摘方法および故障指摘プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014036091A JP2015162030A (ja) 2014-02-27 2014-02-27 故障指摘装置、故障指摘方法および故障指摘プログラム

Publications (1)

Publication Number Publication Date
JP2015162030A true JP2015162030A (ja) 2015-09-07

Family

ID=54185097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014036091A Pending JP2015162030A (ja) 2014-02-27 2014-02-27 故障指摘装置、故障指摘方法および故障指摘プログラム

Country Status (1)

Country Link
JP (1) JP2015162030A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116069000A (zh) * 2023-03-06 2023-05-05 宜科(天津)电子有限公司 一种基于塔灯的设备故障识别系统
CN117540284A (zh) * 2024-01-10 2024-02-09 深圳市胜威南方科技有限公司 一种pdu运行故障检测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116069000A (zh) * 2023-03-06 2023-05-05 宜科(天津)电子有限公司 一种基于塔灯的设备故障识别系统
CN116069000B (zh) * 2023-03-06 2023-06-13 宜科(天津)电子有限公司 一种基于塔灯的设备故障识别系统
CN117540284A (zh) * 2024-01-10 2024-02-09 深圳市胜威南方科技有限公司 一种pdu运行故障检测方法
CN117540284B (zh) * 2024-01-10 2024-04-12 深圳市胜威南方科技有限公司 一种pdu运行故障检测方法

Similar Documents

Publication Publication Date Title
CN109783262B (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
US8230259B2 (en) Automatic analysis of log entries through use of clustering
JP4717079B2 (ja) コンピュータ・システムにおける障害の診断および保守のための方法およびシステム(疑わしいコンポーネントの履歴ベースの優先順位付け)
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
US20180351840A1 (en) Influence range identification method and influence range identification apparatus
JP6482743B1 (ja) リスク評価装置、リスク評価システム、リスク評価方法、及び、リスク評価プログラム
JP2014021577A (ja) 故障予測装置、故障予測システム、故障予測方法、及び、故障予測プログラム
JP2015162030A (ja) 故障指摘装置、故障指摘方法および故障指摘プログラム
JPWO2019049521A1 (ja) リスク評価装置、リスク評価システム、リスク評価方法、及び、リスク評価プログラム
JP2016080585A (ja) プラント状態解析装置
CN111309584B (zh) 数据处理方法、装置、电子设备及存储介质
US9690639B2 (en) Failure detecting apparatus and failure detecting method using patterns indicating occurrences of failures
CN116126574A (zh) 一种系统故障诊断方法、装置、设备及存储介质
JP6405851B2 (ja) 予兆検知支援プログラム、方法、装置、及び予兆検知プログラム、
JP2014059664A (ja) フォールトツリー生成プログラム、方法及び装置
WO2020067237A1 (en) System, method, program, and recording medium
CN115427901A (zh) 调试辅助程序、存储介质、调试辅助装置及调试辅助方法
JP6512646B1 (ja) 保守管理装置、システム及びプログラム
CN111125990A (zh) 一种寄生参数结果正确性的判断方法
JP5623950B2 (ja) It障害予兆検知装置及びプログラム
CN102023916B (zh) 电脑系统的检测方法
JP7151579B2 (ja) 提示装置、提示方法および提示プログラム
JP2015005077A (ja) 障害情報管理方法、障害情報管理装置及びプログラム
JP5958987B2 (ja) 情報処理装置、故障診断制御装置、故障判定方法、故障判定プログラム
WO2023047806A1 (ja) 情報処理装置、および自動分析システム