JP2019159475A - Failure detection device and failure analysis method - Google Patents

Failure detection device and failure analysis method Download PDF

Info

Publication number
JP2019159475A
JP2019159475A JP2018041919A JP2018041919A JP2019159475A JP 2019159475 A JP2019159475 A JP 2019159475A JP 2018041919 A JP2018041919 A JP 2018041919A JP 2018041919 A JP2018041919 A JP 2018041919A JP 2019159475 A JP2019159475 A JP 2019159475A
Authority
JP
Japan
Prior art keywords
failure
module
information
fault
association information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018041919A
Other languages
Japanese (ja)
Other versions
JP7057168B2 (en
Inventor
裕治 斎藤
Yuji Saito
裕治 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2018041919A priority Critical patent/JP7057168B2/en
Publication of JP2019159475A publication Critical patent/JP2019159475A/en
Application granted granted Critical
Publication of JP7057168B2 publication Critical patent/JP7057168B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

To provide a failure detection device which, in response to the occurrence of a failure, can exclude modules where only secondary failures occur, to detect the failure.SOLUTION: The failure detection device is configured to comprise failure-related information table storage means 1, failure detection means 2, failure information identification means 3, failure-related information storage means 4, failure identification means 5, and secondary failure determination means 6. The failure-related information table storage means 1 stores therein failure associating information associating failures which may occur, with modules being factors of the failures. The failure detection means 2 detects a module where a failure has occurred. The failure information identification means 3 identifies failure associating information corresponding to the detected failure. The failure-related information storage means 4 stores therein the identified failure associating information and a scheduled time for processing in association with each other. The failure identification means 5 identifies a faulty module on the basis of the failure associating information. The secondary failure determination means 6 determines secondary failures in modules other than the faulty module.SELECTED DRAWING: Figure 1

Description

本発明は、故障解析技術に関するものであり、特に、副次障害の影響を抑制して解析を行う技術に関するものである。   The present invention relates to a failure analysis technique, and more particularly to a technique for performing analysis while suppressing the influence of a secondary failure.

装置を構成する各モジュールに障害が発生した際に、故障箇所を解析して交換部品を提示する故障解析機能を有する情報処理装置が用いられている。そのような機能を有する情報処理装置は、障害発生ごとに各モジュールのログを採取し、採取したログの解析を基に故障が発生している恐れのあるモジュールを指摘する。電源やクロック生成回路のように副次的障害を発生するモジュールに障害が発生した際には、故障の発生していない他のモジュールでも障害が発生する可能性が高い。そのような場合には、実際には故障が発生しておらず副次的な障害のみが生じ、正常に使用可能なモジュールも交換部品として指摘される。よって、本来、交換する必要のないモジュールの部品交換が生じうる。そのため、正常に動作し得る部品の交換を抑制しつつ、交換の必要な部品を指摘する技術があることが望ましく、関連する技術の開発が行われている。   An information processing apparatus having a failure analysis function for analyzing a failure location and presenting a replacement part when a failure occurs in each module constituting the apparatus is used. An information processing apparatus having such a function collects a log of each module every time a failure occurs, and points out a module that may have a failure based on analysis of the collected log. When a failure occurs in a module that causes a secondary failure such as a power supply or a clock generation circuit, there is a high possibility that the failure will occur in another module in which no failure has occurred. In such a case, no fault actually occurs and only a secondary failure occurs, and a normally usable module is also pointed out as a replacement part. Therefore, module replacement of modules that do not need to be replaced can occur. For this reason, it is desirable that there is a technique for pointing out parts that need to be replaced while suppressing replacement of parts that can operate normally, and related techniques have been developed.

特許文献1は、障害が発生した際に障害の影響が及ぶ部品の範囲を特定する障害影響分析装置に関するものである。特許文献の障害影響分析装置は、部品が動作する際に依存する他の部品を表すデータを依存データとして記憶している。また、特許文献1の障害影響分析装置は、障害が発生した部品が他の部品の処理能力に与える影響を分析する機能を有している。   Patent Document 1 relates to a failure impact analysis apparatus that identifies a range of parts that are affected by a failure when a failure occurs. The failure influence analysis apparatus of the patent document stores data representing other parts that depend on when the parts operate as dependence data. Moreover, the failure influence analysis apparatus of Patent Document 1 has a function of analyzing the influence of a failed part on the processing capability of other parts.

特開2011−113122号公報JP 2011-113122 A

しかしながら、特許文献1の技術は次のような点で十分ではない。特許文献1の技術では、障害が発生した部品が存在するときに、その部品の障害が影響を与え得る範囲を特定し、他の部品の処理能力に与える影響を分析している。しかし、特許文献1の障害影響分析装置は、影響の受けている部品の中から正常な部品を判断する機能を有していない。そのため、特許文献1の技術では、副次的な障害のみが発生している部品の交換を抑制する技術としては十分ではない。   However, the technique of Patent Document 1 is not sufficient in the following points. In the technique of Patent Document 1, when a faulted part exists, a range in which the fault of the part can affect is specified, and the influence on the processing capability of other parts is analyzed. However, the failure influence analysis apparatus of Patent Document 1 does not have a function of determining a normal part from among the affected parts. For this reason, the technique of Patent Document 1 is not sufficient as a technique for suppressing replacement of a component in which only a secondary failure has occurred.

本発明は、上記の課題を解決するため、障害が発生した際に、副次障害のみが発生しているモジュールを除外して故障の検出を行うことができる故障検出装置を提供することを目的としている。   In order to solve the above problems, an object of the present invention is to provide a failure detection device capable of detecting a failure by excluding a module in which only a secondary failure has occurred when a failure occurs. It is said.

上記の課題を解決するため、本発明の故障検出装置は、障害関連情報テーブル記憶手段と、障害検出手段と、障害情報特定手段と、障害関連情報記憶手段と、障害特定手段と、副次障害判定手段を備えている。障害関連情報テーブル記憶手段は、装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶している。障害検出手段は、複数のモジュールのうち、障害が発生したモジュールを検出する。障害情報特定手段は、障害検出手段が障害を検出したときに、検出した障害に対応する障害関連付け情報を特定する。障害関連情報記憶手段は、障害情報特定手段が特定した障害関連付け情報と、障害関連付け情報を処理する時刻とを関連づけて記憶する。障害特定手段は、障害関連情報記憶手段に記憶された障害関連付け情報を基に、実際に故障が発生したモジュールを、故障モジュールとして特定する。副次障害判定手段は、故障モジュールを特定した障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた障害関連付け情報に含まれる故障モジュール以外のモジュールの障害を副次的な障害と判定する。   In order to solve the above problems, a failure detection apparatus according to the present invention includes a failure related information table storage unit, a failure detection unit, a failure information identification unit, a failure related information storage unit, a failure identification unit, and a subsidiary failure. Judgment means is provided. The failure-related information table storage unit stores, as failure association information, information that associates another module that causes a failure for each failure that occurs in each of a plurality of modules that constitute the apparatus. The failure detection means detects a module in which a failure has occurred among the plurality of modules. The fault information specifying unit specifies fault association information corresponding to the detected fault when the fault detecting unit detects the fault. The failure related information storage means stores the failure association information specified by the failure information specification means in association with the time at which the failure association information is processed. The failure identifying unit identifies a module in which a failure has actually occurred as a failure module based on the failure association information stored in the failure related information storage unit. The secondary failure determination means subordinates failures of modules other than the failure module included in the failure association information in which the time associated with the failure association information specifying the failed module and the time within a preset time are associated. Is determined to be a serious failure.

本発明の障害検出方法は、装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶している。本発明の障害検出方法は、複数のモジュールのうち、障害が発生したモジュールを検出する。本発明の障害検出方法は、障害を検出したときに、検出した障害に対応する障害関連付け情報を特定する。本発明の障害検出方法は、特定した障害関連付け情報と、障害関連付け情報を処理した時刻とを関連づけて記憶する。本発明の障害検出方法は、記憶された障害関連付け情報を基に、実際に故障が発生した前記モジュールを、故障モジュールとして特定する。本発明の障害検出方法は、故障モジュールを特定した障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた障害関連付け情報に含まれ故障モジュール以外のモジュールの障害を副次的な障害と判定する。   The failure detection method of the present invention stores, as failure association information, information that associates another module that causes a failure for each failure that occurs in each of a plurality of modules constituting the apparatus. The failure detection method of the present invention detects a module in which a failure has occurred among a plurality of modules. When detecting a failure, the failure detection method of the present invention specifies failure association information corresponding to the detected failure. The failure detection method of the present invention stores the identified failure association information and the time when the failure association information is processed in association with each other. In the failure detection method of the present invention, the module in which a failure has actually occurred is identified as a failure module based on the stored failure association information. According to the failure detection method of the present invention, a failure associated with a module other than the failure module included in the failure association information associated with the time associated with the failure association information specifying the failed module and the time within a preset time is subordinated. Is determined to be a failure.

本発明によると、障害が発生した際に、副次障害のみが発生しているモジュールを除外して故障の検出を行うことができる。   According to the present invention, when a failure occurs, it is possible to detect a failure by excluding a module in which only a secondary failure has occurred.

本発明の第1の実施形態の構成の概要を示す図である。It is a figure which shows the outline | summary of a structure of the 1st Embodiment of this invention. 本発明の第2の実施形態の構成の概要を示す図である。It is a figure which shows the outline | summary of a structure of the 2nd Embodiment of this invention. 本発明の第2の実施形態の障害関連付け情報テーブルの例を示す図である。It is a figure which shows the example of the failure correlation information table of the 2nd Embodiment of this invention. 本発明の第2の実施形態の故障解析結果記憶部のデータ構成の例を示す図である。It is a figure which shows the example of a data structure of the failure analysis result memory | storage part of the 2nd Embodiment of this invention. 本発明の第2の実施形態の障害関連付け情報記憶部のデータ構成の例を示す図である。It is a figure which shows the example of a data structure of the failure correlation information storage part of the 2nd Embodiment of this invention. 本発明の第2の実施形態の動作フローの概要を示す図である。It is a figure which shows the outline | summary of the operation | movement flow of the 2nd Embodiment of this invention.

(第1の実施形態)
本発明の第1の実施形態について図を参照して詳細に説明する。図1は、本実施形態の故障検出装置の構成の概要を示したものである。本実施形態の故障検出装置は、障害関連情報テーブル記憶手段1と、障害検出手段2と、障害情報特定手段3と、障害関連情報記憶手段4と、障害特定手段5と、副次障害判定手段6を備えている。障害関連情報テーブル記憶手段1は、装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶している。障害検出手段2は、複数のモジュールのうち、障害が発生したモジュールを検出する。障害情報特定手段3は、障害検出手段2が障害を検出したときに、検出した障害に対応する障害関連付け情報を特定する。障害関連情報記憶手段4は、障害情報特定手段3が特定した障害関連付け情報と、障害関連付け情報を処理する時刻とを関連づけて記憶する。障害特定手段5は、障害関連情報記憶手段4に記憶された障害関連付け情報を基に、実際に故障が発生したモジュールを、故障モジュールとして特定する。副次障害判定手段6は、故障モジュールを特定した障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた障害関連付け情報に含まれる故障モジュール以外のモジュールの障害を副次的な障害と判定する。
(First embodiment)
A first embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 shows an outline of the configuration of the failure detection apparatus according to the present embodiment. The failure detection apparatus according to the present embodiment includes failure related information table storage means 1, failure detection means 2, failure information identification means 3, failure related information storage means 4, failure identification means 5, and secondary failure determination means. 6 is provided. The failure related information table storage unit 1 stores, as failure association information, information that associates another module that causes a failure for each failure that occurs in each of a plurality of modules that constitute the apparatus. The failure detection unit 2 detects a module in which a failure has occurred among the plurality of modules. The fault information specifying unit 3 specifies fault association information corresponding to the detected fault when the fault detecting unit 2 detects the fault. The failure related information storage unit 4 stores the failure association information identified by the failure information identification unit 3 in association with the time at which the failure association information is processed. The failure identification unit 5 identifies a module in which a failure has actually occurred as a failure module based on the failure association information stored in the failure related information storage unit 4. The secondary fault determination means 6 subordinates faults of modules other than the faulty module included in the fault correlation information in which the time associated with the fault correlation information specifying the faulty module and the time within a preset time are associated. Is determined to be a failure.

本実施形態の故障検出装置は、障害関連情報テーブル記憶手段1において装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶している。障害情報特定手段3は、障害検出手段2が障害を検出したときに、検出した障害に対応する障害関連付け情報を特定している。また、副次障害判定手段6は、特定した障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた障害関連付け情報に含まれる故障モジュール以外のモジュールの障害を副次的な障害と判定している。このように、他のモジュールの影響を受ける障害の要因のうち、あらかじめ設定された時間内に生じた障害を副次的な障害とすることで、実際に障害が生じたモジュールと区別することが可能になる。その結果、本実施形態の故障検出装置を用いることで、障害が発生した際に、副次障害のみが発生しているモジュールを除外して故障の検出を行うことができる。   The failure detection device according to the present embodiment stores, as failure association information, information associated with another module that causes a failure for each failure that occurs in each of a plurality of modules constituting the device in the failure related information table storage unit 1. is doing. The fault information specifying unit 3 specifies fault association information corresponding to the detected fault when the fault detecting unit 2 detects the fault. In addition, the secondary failure determination means 6 detects the failures of modules other than the failure module included in the failure association information in which the time associated with the identified failure association information and the time within the preset time are associated. Is determined to be a serious failure. In this way, among the causes of failures that are affected by other modules, failures that occur within a preset time can be identified as secondary failures, so that they can be distinguished from modules that have actually failed. It becomes possible. As a result, by using the failure detection apparatus of this embodiment, when a failure occurs, it is possible to detect a failure by excluding a module in which only a secondary failure has occurred.

(第2の実施形態)
本発明の第2の実施形態について図を参照して詳細に説明する。図2は、本実施形態の情報処理装置の構成の概要を示したものである。本実施形態の情報処理装置は、装置を構成する各モジュールが障害検出機能をそれぞれ有し、障害が発生した際に故障検出装置において故障の生じたモジュールを特定する機能を有する。
(Second Embodiment)
A second embodiment of the present invention will be described in detail with reference to the drawings. FIG. 2 shows an outline of the configuration of the information processing apparatus according to this embodiment. The information processing apparatus according to the present embodiment has a function of identifying a module in which a failure has occurred in the failure detection apparatus when a failure has occurred.

本実施形態の情報処理装置は、機能モジュール11と、機能モジュール12と、電源モジュール13と、電源モジュール14と、クロックモジュール15と、クロックモジュール16と、故障検出装置17を備えている。各モジュール間および各モジュールを故障検出装置17の間は、バスを介して接続されている。   The information processing apparatus according to this embodiment includes a functional module 11, a functional module 12, a power supply module 13, a power supply module 14, a clock module 15, a clock module 16, and a failure detection device 17. The modules are connected to each other and between the failure detection devices 17 through a bus.

機能モジュール11および機能モジュール12は、情報処理装置の用途に基づいた各処理を実行する機能を有する。各機能モジュールは、例えば、CPU(Central Processing Unit)、メモリおよびハードディスクドライブ等で構成され、CPUでコンピュータプログラムを実行することで、入力されたデータの処理を行って結果を出力する。   The function module 11 and the function module 12 have a function of executing each process based on the use of the information processing apparatus. Each functional module includes, for example, a CPU (Central Processing Unit), a memory, a hard disk drive, and the like. The CPU executes a computer program to process input data and output a result.

機能モジュール11および機能モジュール12は、障害検出機能をそれぞれ備えている。各機能モジュールの障害検出機能は、それぞれの自モジュールの障害の有無を監視する。機能モジュール11および機能モジュール12は、自モジュールの障害を検知すると、障害を検知したことを示す情報を障害通知情報として故障検出装置17に送る。   The function module 11 and the function module 12 each have a failure detection function. The fault detection function of each functional module monitors the presence / absence of a fault in its own module. When the functional module 11 and the functional module 12 detect a failure in the own module, the functional module 11 and the functional module 12 send information indicating that the failure has been detected to the failure detection device 17 as failure notification information.

電源モジュール13は、機能モジュール11に電源を供給する。また、電源モジュール14は、機能モジュール11および機能モジュール12に電源を供給する。電源モジュール13および電源モジュール14は、情報処理装置10の外部から電源の供給を受け、各機能モジュールに電源を供給する。電源モジュール13および電源モジュール14は、2次電池等を用いたものであってもよい。各電源モジュールは、障害検出機能を有する。電源モジュール13および電源モジュール14は、自モジュールの障害を検知すると、障害を検知したことを示す情報を障害通知情報として故障検出装置17に送る。   The power supply module 13 supplies power to the functional module 11. The power supply module 14 supplies power to the functional module 11 and the functional module 12. The power supply module 13 and the power supply module 14 are supplied with power from outside the information processing apparatus 10 and supply power to each functional module. The power supply module 13 and the power supply module 14 may use a secondary battery or the like. Each power supply module has a failure detection function. When the power supply module 13 and the power supply module 14 detect a failure of the own module, the power supply module 13 and the power supply module 14 send information indicating that the failure has been detected to the failure detection device 17 as failure notification information.

クロックモジュール15およびクロックモジュール16は、あらかじめ設定された周波数のクロックを生成し、生成したクロックを出力する。クロックモジュール15およびクロックモジュール16は、クロックの生成機能を有する半導体装置によって構成されている。生成するクロックの周波数は、機能モジュールの動作周波数に基づいてあらかじめ設定されている。クロックモジュール15は、生成したクロックを機能モジュール11および機能モジュール12に出力する。クロックモジュール16は、生成したクロックを機能モジュール12に出力する。各クロックモジュールは、障害検出機能を有する。クロックモジュール15およびクロックモジュール16は、自モジュールの障害を検知すると、障害を検知したことを示す情報を障害通知情報として故障検出装置17に送る。   The clock module 15 and the clock module 16 generate a clock having a preset frequency and output the generated clock. The clock module 15 and the clock module 16 are configured by a semiconductor device having a clock generation function. The frequency of the generated clock is set in advance based on the operating frequency of the functional module. The clock module 15 outputs the generated clock to the functional module 11 and the functional module 12. The clock module 16 outputs the generated clock to the functional module 12. Each clock module has a failure detection function. When detecting the failure of the own module, the clock module 15 and the clock module 16 send information indicating that the failure has been detected to the failure detection device 17 as failure notification information.

故障検出装置17は、診断部20と、障害関連付けテーブル記憶部31と、障害関連付け情報記憶部32と、故障解析結果記憶部33をさらに備えている。   The failure detection device 17 further includes a diagnosis unit 20, a failure association table storage unit 31, a failure association information storage unit 32, and a failure analysis result storage unit 33.

診断部20は、故障解析部21と、障害関連付け情報処理部22と、故障解析結果処理部23をさらに備えている。本実施形態の診断部20は、半導体装置によって構成されている。故障解析部21、障害関連付け情報処理部22および故障解析結果処理部23は、同一の半導体装置に形成されていてもよく、それぞれ別の半導体装置が用いられていてもよい。また、診断部20は、CPU等の汎用プロセッサにおいてコンピュータプログラムを実行することで各処理を行う構成であってもよい。   The diagnosis unit 20 further includes a failure analysis unit 21, a failure association information processing unit 22, and a failure analysis result processing unit 23. The diagnosis unit 20 of the present embodiment is configured by a semiconductor device. The failure analysis unit 21, the failure association information processing unit 22, and the failure analysis result processing unit 23 may be formed in the same semiconductor device, or different semiconductor devices may be used. Further, the diagnosis unit 20 may be configured to perform each process by executing a computer program in a general-purpose processor such as a CPU.

故障解析部21は、各モジュールのログのデータを基に、故障箇所を特定する。各モジュールのログは、処理能力、出力の有無および出力状態等のデータによって構成されている。故障解析部21は、各モジュールに生じる障害ごとに基準を記憶し、ログと基準を比較して各モジュールで生じている故障個所や種類を特定する。故障解析部21は、特定した故障箇所等の情報を、故障解析結果処理部23に出力する。また、故障解析部21は、障害関連付けテーブルを参照して、障害要因を特定する。故障解析部21は、特定した障害要因の情報を障害関連付け情報処理部22に出力する。   The failure analysis unit 21 identifies the failure location based on the log data of each module. The log of each module is composed of data such as processing capability, output presence / absence, and output status. The failure analysis unit 21 stores a reference for each failure that occurs in each module, and compares the log with the reference to identify the location and type of failure occurring in each module. The failure analysis unit 21 outputs information such as the specified failure location to the failure analysis result processing unit 23. Further, the failure analysis unit 21 identifies the failure factor with reference to the failure association table. The failure analysis unit 21 outputs information on the identified failure factor to the failure association information processing unit 22.

障害関連付け情報処理部22は、故障解析部21から入力される障害要因の情報を障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、障害要因のうち副次障害の項目を判断する。また、本実施形態の故障解析部21の機能は、第1の実施形態の障害検出手段2、障害関連情報特定手段3および障害特定手段5に相当する。   The failure association information processing unit 22 stores the failure factor information input from the failure analysis unit 21 in the failure association information storage unit 32. Further, the failure association information processing unit 22 determines an item of a secondary failure among the failure factors. The function of the failure analysis unit 21 of the present embodiment corresponds to the failure detection unit 2, the failure related information specifying unit 3 and the failure specifying unit 5 of the first embodiment.

障害関連付け情報処理部22は、あらかじめ設定された基準時間内に生じた障害を副次障害と判定し、障害が発生している箇所から除外する。副次障害を判断する基準となる時間は、副次障害判定時間としたあらかじめ保存されている。副次障害判定時間は、モジュールごとに異なっていてもよく、また、作業者等の入力に基づいて変更可能な構成であってもよい。また、本実施形態の障害関連付け情報処理部22の機能は、第1の実施形態の副次障害判定手段6に相当する。   The failure association information processing unit 22 determines that a failure that has occurred within a preset reference time is a secondary failure, and excludes it from the location where the failure has occurred. The reference time for determining a secondary failure is stored in advance as a secondary failure determination time. The secondary failure determination time may be different for each module, and may be configured to be changeable based on an input from an operator or the like. The function of the failure association information processing unit 22 of the present embodiment corresponds to the secondary failure determination unit 6 of the first embodiment.

故障解析結果処理部23は、故障解析部21から入力される故障箇所の情報を、故障解析結果記憶部33に保存する。   The failure analysis result processing unit 23 stores the failure location information input from the failure analysis unit 21 in the failure analysis result storage unit 33.

障害関連付けテーブル記憶部31は、各モジュールに生じる障害要因ごとに、その障害の発生要因となり得るモジュールの情報が障害関連付けテーブルとして保存されている。図3は、本実施形態の障害関連付けテーブルの構成の例を示したものである。   The failure association table storage unit 31 stores, as a failure association table, information on modules that can be the cause of failure for each failure factor that occurs in each module. FIG. 3 shows an example of the configuration of the failure association table of this embodiment.

図3において、機能モジュール11および機能モジュール12は、機能モジュールAおよび機能モジュールBとして示されている。図3において、電源モジュール13および電源モジュール14は、電源モジュールAおよび電源モジュールBとして示されている。また、図3において、クロックモジュール15およびクロックモジュール16は、クロックモジュールAおよびクロックモジュールBとして示されている。   In FIG. 3, the functional module 11 and the functional module 12 are shown as a functional module A and a functional module B. In FIG. 3, the power supply module 13 and the power supply module 14 are shown as a power supply module A and a power supply module B. In FIG. 3, the clock module 15 and the clock module 16 are shown as a clock module A and a clock module B.

図3に示すように障害関連付けテーブルは、モジュールごとに各モジュールが障害の要因となり得るかの情報が関連付けられている。例えば、障害関連づけテーブルは、各モジュールが障害の要因となる場合には「有効」、障害の要因となる場合には「無効」として情報を保持している。例えば、電源モジュールやクロックモジュールでは、他のモジュールの障害の影響を受けないので、自モジュールのみが障害の要因となる。そのため、電源モジュールやクロックモジュールでは、自モジュールのみが「有効」の設定になっている。   As shown in FIG. 3, the failure association table associates information about whether each module can be a cause of failure for each module. For example, the failure association table holds information as “valid” when each module causes a failure, and “invalid” when a failure causes. For example, since the power supply module and the clock module are not affected by the failure of other modules, only the own module becomes the cause of the failure. Therefore, in the power supply module and the clock module, only the own module is set to “valid”.

また、図3の障害関連付けテーブルは、各モジュールが障害の要因となり得る場合は、「帰属」、障害の要因とならない場合には「非帰属」として情報を保持している。   Further, the failure association table of FIG. 3 holds information as “Attribution” when each module can be a cause of failure, and “Unassigned” when it is not a cause of failure.

故障解析部21は、各モジュールのログの解析結果を基に、生じている障害がどの障害要因に該当するかを判断する。故障解析部21は、ログの解析結果と各モジュールの障害要因との関係のデータをあらかじめ記憶している。また、本実施形態の障害関連付けテーブル記憶部31の機能は、第1の実施形態の障害関連情報テーブル記憶手段1に相当する。   The failure analysis unit 21 determines which failure factor the generated failure corresponds to based on the analysis result of the log of each module. The failure analysis unit 21 stores in advance data on the relationship between the log analysis result and the failure factor of each module. The function of the failure association table storage unit 31 of the present embodiment corresponds to the failure association information table storage unit 1 of the first embodiment.

障害関連付け情報記憶部32は、障害関連付け情報を保存する機能を有する。障害関連付け情報記憶部32は、故障箇所に対応する障害関連情報を記憶している。障害関連付け情報記憶部32は、障害関連付け情報処理部22から入力される障害要因の情報を、保存する時刻と関連付けて障害関連付け情報記憶部32に保存する。   The failure association information storage unit 32 has a function of storing failure association information. The failure association information storage unit 32 stores failure related information corresponding to the failure location. The failure association information storage unit 32 stores the failure factor information input from the failure association information processing unit 22 in the failure association information storage unit 32 in association with the storage time.

図4は、本実施形態の障害関連付け情報の構成の例を示したものである。障害関連付け情報には、障害関連付け情報が保存された時刻と、その障害関連付け情報が有効であるかを示すフラグが関連付けられている。   FIG. 4 shows an example of the configuration of the fault association information of this embodiment. The failure association information is associated with a time when the failure association information is stored and a flag indicating whether the failure association information is valid.

本実施形態の障害関連付け情報記憶部32は、第1の実施形態の障害関連情報記憶手段4に相当する。   The failure association information storage unit 32 according to the present embodiment corresponds to the failure association information storage unit 4 according to the first embodiment.

故障解析結果記憶部33は、故障解析結果処理部23は、故障解析部21から入力される故障解析結果、すなわち、故障箇所の情報を保存する。図5は、故障解析結果記憶部33に保存されている故障解析結果の構成の例を示す図である。図5に示すように故障解析結果記憶部33の各記憶領域に、故障解析結果の情報が順次、保存されている。   The failure analysis result storage unit 33 stores the failure analysis result input from the failure analysis unit 21, that is, the information on the failure location. FIG. 5 is a diagram illustrating an example of a configuration of a failure analysis result stored in the failure analysis result storage unit 33. As shown in FIG. 5, information on failure analysis results is sequentially stored in each storage area of the failure analysis result storage unit 33.

本実施形態の障害関連付けテーブル記憶部31、障害関連付け情報記憶部32および故障解析結果記憶部33は、不揮発性の半導体記憶装置を用いて構成されている。障害関連付けテーブル記憶部31、障害関連付け情報記憶部32および故障解析結果記憶部33は、同一の半導体記憶装置上の領域であってもよく、また、異なる半導体記憶装置を用いて構成されていてもよい。また、障害関連付けテーブル記憶部31、障害関連付け情報記憶部32および故障解析結果記憶部33は、不揮発性の半導体記憶装置に代えてハードディスクドライブ等の他の記憶装置や、それらの組み合わせによって構成されていてもよい。また、障害関連付けテーブル記憶部31、障害関連付け情報記憶部32および故障解析結果記憶部33の一部または全ては、診断部20と同一の半導体装置上に形成されていてもよい。   The failure association table storage unit 31, the failure association information storage unit 32, and the failure analysis result storage unit 33 of the present embodiment are configured using a nonvolatile semiconductor storage device. The failure association table storage unit 31, the failure association information storage unit 32, and the failure analysis result storage unit 33 may be regions on the same semiconductor storage device, or may be configured using different semiconductor storage devices. Good. In addition, the failure association table storage unit 31, the failure association information storage unit 32, and the failure analysis result storage unit 33 are configured by other storage devices such as a hard disk drive or a combination thereof in place of the nonvolatile semiconductor storage device. May be. Further, part or all of the failure association table storage unit 31, the failure association information storage unit 32, and the failure analysis result storage unit 33 may be formed on the same semiconductor device as the diagnosis unit 20.

本実施形態の情報処理装置において障害を検知した際に、副次障害の発生しているモジュールを特定し、故障が発生しているモジュールを特定する際の動作に説明する。図6は、情報処理装置において障害を検知した際に、障害の発生しているモジュールを特定する際の動作フローを示したものである。   An operation for identifying a module in which a secondary failure has occurred when a failure has been detected in the information processing apparatus of the present embodiment and identifying a module in which a failure has occurred will be described. FIG. 6 shows an operation flow when a faulty module is identified when a fault is detected in the information processing apparatus.

情報処理装置を構成するいずれかのモジュールで障害が発生すると、自モジュールで障害を検知したモジュールから障害通知情報が診断部20に入力される(ステップS11)。   When a failure occurs in any of the modules constituting the information processing apparatus, failure notification information is input to the diagnosis unit 20 from the module in which the failure is detected by the own module (step S11).

障害通知情報が診断部20に入力されると、診断部20の故障解析部21は、各モジュールのログを取得する(ステップS12)。各モジュールからログを取得すると、故障解析部21は、ログのデータを基に故障箇所の解析を行う(ステップS13)。   When the failure notification information is input to the diagnosis unit 20, the failure analysis unit 21 of the diagnosis unit 20 acquires a log of each module (step S12). When the log is acquired from each module, the failure analysis unit 21 analyzes the failure location based on the log data (step S13).

故障箇所の解析を行うと、故障解析部21は、故障箇所の解析結果を故障解析結果として故障解析結果処理部23に送る。故障解析結果を受け取ると、故障解析結果処理部23は、故障解析結果を故障解析結果記憶部33に保存する。   When the failure location is analyzed, the failure analysis unit 21 sends the failure location analysis result to the failure analysis result processing unit 23 as a failure analysis result. When receiving the failure analysis result, the failure analysis result processing unit 23 stores the failure analysis result in the failure analysis result storage unit 33.

また、故障解析部21は、障害関連付けテーブル記憶部31を参照し、故障解析の結果を基に対応する障害要因を特定する(ステップS14)。解析結果に対応する障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報と、処理を行う際の時刻、例えば、保存処理を行う時刻とを関連付けて障害関連付け情報記憶部32に保存する(ステップS15)。   Further, the failure analysis unit 21 refers to the failure association table storage unit 31 and identifies a corresponding failure factor based on the result of the failure analysis (step S14). When the failure factor corresponding to the analysis result is specified, the failure analysis unit 21 sends the failure factor information to the failure association information processing unit 22. Upon receiving the failure factor information, the failure association information processing unit 22 stores the received failure factor information in the failure association information storage unit 32 in association with the time at which the processing is performed, for example, the time at which the storage process is performed. (Step S15).

障害要因の障害関連付け情報記憶部32への保存が行われた際に、ログの解析等が未処理の障害通知情報がある場合には(ステップS16でYes)、故障解析部21は、ステップS12からの動作を再度、行う。   When the failure cause information is stored in the failure association information storage unit 32 and there is failure notification information whose log analysis is not yet processed (Yes in step S16), the failure analysis unit 21 performs step S12. The operation from is performed again.

診断部20に入力された障害通知情報に対応するログの解析等が全て終わると(ステップS16でNo)、障害関連付け情報処理部22は、障害関連付け情報記憶部32に保存された障害関連付け情報について副次的障害の有無の判定を行う。   When the analysis and the like of the log corresponding to the failure notification information input to the diagnosis unit 20 are all completed (No in step S16), the failure association information processing unit 22 uses the failure association information stored in the failure association information storage unit 32. Determine if there is a secondary failure.

副次的障害の判定を開始すると、障害関連付け情報処理部22は、実際に障害が発生している箇所を特定する。実際に障害が発生している障害要因を特定すると、障害関連付け情報処理部22は、関連付けられた時刻との差があらかじめ設定された時間内の時刻が関連付けられた障害要因を抽出する。時間差が設定された時間内の障害要因を抽出すると、障害関連付け情報処理部22は、抽出した範囲内が副次障害の範囲であると判定する(ステップS17)。   When the determination of the secondary failure is started, the failure association information processing unit 22 identifies the location where the failure actually occurs. When a failure factor that actually causes a failure is identified, the failure association information processing unit 22 extracts a failure factor associated with a time within a preset time difference from the associated time. When the failure factor within the time for which the time difference is set is extracted, the failure association information processing unit 22 determines that the extracted range is the secondary failure range (step S17).

副次障害の範囲を判定すると、障害関連付け情報処理部22は、判定した範囲内の障害要因に関連付けられているフラグを「無効」設定する(ステップS18)。フラグが「無効」設定されると、フラグが「無効」の障害要因の中で、帰属として設定されているモジュールに発生した障害は、副次障害によるものであると見なされる。   When determining the range of the secondary failure, the failure association information processing unit 22 sets “invalid” for the flag associated with the failure factor within the determined range (step S18). When the flag is set to “invalid”, a failure that has occurred in the module set as belonging among the failure factors with the flag being “invalid” is considered to be due to a secondary failure.

副次障害の判定が終わると、故障解析部21は、フラグが有効の障害要因に含まれるモジュールの情報を、表示装置等に出力することで作業者等に通知する(ステップS19)。   When the determination of the secondary failure is completed, the failure analysis unit 21 notifies the operator or the like by outputting the information of the module included in the failure cause with the flag valid to the display device or the like (step S19).

次に、情報処理装置10の電源モジュール14で障害が発生した場合に副次障害の範囲を判定する際の動作についてより具体的な例を用いて説明する。以下の説明では、電源4で故障が発生し、電源の供給を受けている機能モジュール11および機能モジュール12の動作に不具合が生じた場合の例について説明する。   Next, the operation when determining the range of the secondary failure when a failure occurs in the power supply module 14 of the information processing apparatus 10 will be described using a more specific example. In the following description, an example will be described in which a failure occurs in the power supply 4 and a malfunction occurs in the operation of the function module 11 and the function module 12 receiving power supply.

機能モジュール11は、自モジュールの動作の異常を検出すると、障害通知情報を診断部20に出力する。   When the functional module 11 detects an abnormality in the operation of its own module, the functional module 11 outputs failure notification information to the diagnosis unit 20.

障害通知情報が入力されると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。   When the failure notification information is input, the failure analysis unit 21 of the diagnosis unit 20 acquires log data from each module. The failure analysis unit 21 acquires logs from the functional module 11, the functional module 12, the power supply module 13, the power supply module 14, the clock module 15, and the clock module 16.

各モジュールのログを取得すると、故障解析部21は、ログのデータを解析し故障箇所を特定する。   When the log of each module is acquired, the failure analysis unit 21 analyzes the log data and identifies the failure location.

故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア1の領域に保存する。   When the failure location is specified, the failure analysis unit 21 sends information on the failure analysis result to the failure analysis result processing unit 23. When the failure analysis result information is received, the failure analysis result processing unit 23 stores the received failure analysis result information in the area 1 of the failure analysis result storage unit 33.

また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の機能モジュールA障害要因1が該当するとする。機能モジュールA障害要因1では、電源モジュール13、電源モジュール14およびクロックモジュール15に相当する電源モジュールA、電源モジュールBおよびクロックモジュールAが帰属の状態となる。また、機能モジュールA障害要因1では、クロックモジュール16に相当するクロックモジュール16が非帰属の状態となる。   Further, when the failure analysis unit 21 receives a request for analyzing a failure location, the failure analysis unit 21 refers to the failure association table and identifies a failure factor. At this time, it is assumed that the failure factor corresponds to the failure factor 1 of the functional module A in FIG. In the function module A failure factor 1, the power supply module A, the power supply module B, and the clock module A corresponding to the power supply module 13, the power supply module 14, and the clock module 15 belong to each other. In addition, in the functional module A failure factor 1, the clock module 16 corresponding to the clock module 16 is in an unassigned state.

障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報1として、保存する時刻1と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報1のフラグを「有効」に設定する。   When the failure factor is specified, the failure analysis unit 21 sends information on the failure factor to the failure association information processing unit 22. Upon receiving the failure factor information, the failure association information processing unit 22 stores the received failure factor information as failure association information 1 in the failure association information storage unit 32 in association with the storage time 1. In addition, the failure association information processing unit 22 sets the failure association information 1 flag to “valid” in the received failure cause information.

機能モジュール12は、自モジュールの動作異常を検出すると、障害通知情報を診断部20に出力する。障害通知情報を受け取ると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。診断部20の故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。   When the functional module 12 detects an operation abnormality of its own module, the functional module 12 outputs failure notification information to the diagnosis unit 20. When the failure notification information is received, the failure analysis unit 21 of the diagnosis unit 20 acquires log data from each module. The failure analysis unit 21 of the diagnosis unit 20 acquires logs from the function module 11, the function module 12, the power supply module 13, the power supply module 14, the clock module 15, and the clock module 16.

各モジュールのログを取得すると、故障解析部21は、ログのデータを基に故障箇所を解析する。   When acquiring the log of each module, the failure analysis unit 21 analyzes the failure location based on the log data.

故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア2の領域に保存する。   When the failure location is specified, the failure analysis unit 21 sends information on the failure analysis result to the failure analysis result processing unit 23. When receiving the failure analysis result information, the failure analysis result processing unit 23 stores the received failure analysis result information in the area 2 of the failure analysis result storage unit 33.

また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の機能モジュールB障害要因2が該当するとする。機能モジュールB障害要因2では、電源モジュール14、クロックモジュール15およびクロックモジュールBに相当する、電源モジュールB、クロックモジュールAおよびクロックモジュールBが帰属の状態となる。また、機能モジュールB障害要因2では、電源モジュール13に相当する電源モジュールAが非帰属の状態となる。   Further, when the failure analysis unit 21 receives a request for analyzing a failure location, the failure analysis unit 21 refers to the failure association table and identifies a failure factor. At this time, it is assumed that the failure factor corresponds to the failure factor 2 of the functional module B in FIG. In the functional module B failure factor 2, the power supply module B, the clock module A, and the clock module B corresponding to the power supply module 14, the clock module 15, and the clock module B are assigned. In addition, in the functional module B failure factor 2, the power module A corresponding to the power module 13 is in an unassigned state.

障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報2として、保存する時刻2と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報2のフラグを「有効」に設定する。   When the failure factor is specified, the failure analysis unit 21 sends information on the failure factor to the failure association information processing unit 22. Upon receiving the failure factor information, the failure association information processing unit 22 stores the received failure factor information as failure association information 2 in the failure association information storage unit 32 in association with the save time 2. In addition, the failure association information processing unit 22 sets the failure association information 2 flag to “valid” in the received failure cause information.

電源モジュール14は、自モジュールの障害を検出すると障害通知情報を診断部20に出力する。障害通知情報を受け取ると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。   When the power supply module 14 detects a failure of its own module, it outputs failure notification information to the diagnosis unit 20. When the failure notification information is received, the failure analysis unit 21 of the diagnosis unit 20 acquires log data from each module. The failure analysis unit 21 acquires logs from the functional module 11, the functional module 12, the power supply module 13, the power supply module 14, the clock module 15, and the clock module 16.

各モジュールのログを取得すると、故障解析部21は、ログのデータを基に故障箇所を解析する。   When acquiring the log of each module, the failure analysis unit 21 analyzes the failure location based on the log data.

故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア2の領域に保存する。   When the failure location is specified, the failure analysis unit 21 sends information on the failure analysis result to the failure analysis result processing unit 23. When receiving the failure analysis result information, the failure analysis result processing unit 23 stores the received failure analysis result information in the area 2 of the failure analysis result storage unit 33.

また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の電源モジュールA障害要因1が該当するとする。電源モジュールA障害要因1では、電源モジュール14に相当する電源モジュールBが帰属の状態となる。また、電源モジュールA障害要因1では、電源モジュール13、クロックモジュール15およびクロックモジュール16に相当する、電源モジュールB、クロックモジュールAおよびクロックモジュールBが非帰属の状態となる。   Further, when the failure analysis unit 21 receives a request for analyzing a failure location, the failure analysis unit 21 refers to the failure association table and identifies a failure factor. At this time, it is assumed that the failure factor corresponds to the failure factor 1 of the power supply module A in FIG. In the power module A failure factor 1, the power module B corresponding to the power module 14 belongs. Further, in the power module A failure factor 1, the power module B, the clock module A, and the clock module B corresponding to the power module 13, the clock module 15, and the clock module 16 are in an unassigned state.

障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報3として、保存する時刻3と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報3のフラグを「有効」に設定する。   When the failure factor is specified, the failure analysis unit 21 sends information on the failure factor to the failure association information processing unit 22. Upon receiving the failure factor information, the failure association information processing unit 22 stores the received failure factor information as failure association information 3 in the failure association information storage unit 32 in association with the storage time 3. Further, the failure association information processing unit 22 sets the flag of the failure association information 3 to “valid” for the received failure cause information.

各障害通知情報についてのログの解析が終わり、障害関連付け情報が保存されると、障害関連付け情報処理部22は、障害関連付け情報3の電源モジュール14が「有効」になっていることから電源モジュール14に障害が発生していると判断する。電源モジュール14は、他のモジュールの障害の影響を受けないので、障害関連付け情報処理部22は、電源モジュール14に実際の障害が発生していると判断することができる。電源モジュール14に障害が発生していると判断すると、障害関連付け情報処理部22は、障害関連付け情報記憶部32の各エリアのデータを読み出し、各エリアの保存された時刻と、障害関連付け情報3の時刻3との時間差を比較する。   When the analysis of the log for each piece of failure notification information is completed and the failure association information is stored, the failure association information processing unit 22 determines that the power supply module 14 of the failure association information 3 is “valid” and thus the power supply module 14 Is determined to have failed. Since the power supply module 14 is not affected by the failure of another module, the failure association information processing unit 22 can determine that an actual failure has occurred in the power supply module 14. If it is determined that a failure has occurred in the power supply module 14, the failure association information processing unit 22 reads the data of each area of the failure association information storage unit 32, stores the time stored in each area, and the failure association information 3. The time difference from time 3 is compared.

時刻3と、エリア1およびエリア2の時刻の時間差が副次的障害を判定する基準時間以内であるとき、障害関連付け情報処理部22は、エリア1およびエリア2の障害が副次的障害であると判断する。エリア1およびエリア2の障害が副次的障害であると判断すると、障害関連付け情報処理部22は、障害関連付け情報記憶部32のエリア1およびエリア2のフラグを「無効」に設定する。フラグが無効に設定されることで、障害関連付け情報1および障害関連付け情報2に帰属しているモジュールは、副次的障害に該当し、障害が発生していないモジュールとして扱われる。   When the time difference between the time 3 and the time between the area 1 and the area 2 is within the reference time for determining the secondary failure, the failure association information processing unit 22 indicates that the failure in the area 1 and the area 2 is a secondary failure. Judge. When determining that the failure in area 1 and area 2 is a secondary failure, the failure association information processing unit 22 sets the flags of area 1 and area 2 in the failure association information storage unit 32 to “invalid”. By setting the flag to invalid, the module belonging to the failure association information 1 and the failure association information 2 corresponds to a secondary failure and is treated as a module in which no failure has occurred.

次に本実施形態の情報処理装置において他のパターンの障害が発生した場合に副次障害を判定する例について説明する。以下では、機能モジュール11およびクロックモジュール16で障害が発生し、機能モジュール12で副次障害が発生している場合を例に説明する。   Next, an example in which a secondary failure is determined when a failure of another pattern occurs in the information processing apparatus according to the present embodiment will be described. Hereinafter, a case where a failure has occurred in the functional module 11 and the clock module 16 and a secondary failure has occurred in the functional module 12 will be described as an example.

機能モジュール11は、自モジュールの動作の異常を検出すると、障害通知情報を診断部20に出力する。   When the functional module 11 detects an abnormality in the operation of its own module, the functional module 11 outputs failure notification information to the diagnosis unit 20.

障害通知情報が入力されると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。   When the failure notification information is input, the failure analysis unit 21 of the diagnosis unit 20 acquires log data from each module. The failure analysis unit 21 acquires logs from the functional module 11, the functional module 12, the power supply module 13, the power supply module 14, the clock module 15, and the clock module 16.

各モジュールのログを取得すると、故障解析部21は、ログのデータを解析し故障箇所を特定する。   When the log of each module is acquired, the failure analysis unit 21 analyzes the log data and identifies the failure location.

故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア4の領域に保存する。   When the failure location is specified, the failure analysis unit 21 sends information on the failure analysis result to the failure analysis result processing unit 23. When the failure analysis result information is received, the failure analysis result processing unit 23 stores the received failure analysis result information in the area 4 of the failure analysis result storage unit 33.

また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の機能モジュールA障害要因3が該当するとする。機能モジュールA障害要因3では、電源モジュール14およびクロックモジュール15に相当する電源モジュールBおよびクロックモジュールAが帰属の状態となる。また、機能モジュールA障害要因3では、電源モジュール13およびクロックモジュール16に相当する電源モジュールAおよびクロックモジュール16が非帰属の状態となる。   Further, when the failure analysis unit 21 receives a request for analyzing a failure location, the failure analysis unit 21 refers to the failure association table and identifies a failure factor. At this time, it is assumed that the failure factor corresponds to the failure factor 3 of the functional module A in FIG. In the functional module A failure factor 3, the power module B and the clock module A corresponding to the power module 14 and the clock module 15 belong to each other. Further, in the functional module A failure factor 3, the power module A and the clock module 16 corresponding to the power module 13 and the clock module 16 are in an unassigned state.

障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報4として、保存する時刻4と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報4のフラグを「有効」に設定する。   When the failure factor is specified, the failure analysis unit 21 sends information on the failure factor to the failure association information processing unit 22. Upon receiving the failure factor information, the failure association information processing unit 22 stores the received failure factor information as failure association information 4 in the failure association information storage unit 32 in association with the time 4 to be stored. Further, the failure association information processing unit 22 sets the flag of the failure association information 4 to “valid” in the received failure factor information.

機能モジュール12は、自モジュールの動作異常を検出すると、障害通知情報を診断部20に出力する。障害通知情報を受け取ると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。診断部20の故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。   When the functional module 12 detects an operation abnormality of its own module, the functional module 12 outputs failure notification information to the diagnosis unit 20. When the failure notification information is received, the failure analysis unit 21 of the diagnosis unit 20 acquires log data from each module. The failure analysis unit 21 of the diagnosis unit 20 acquires logs from the function module 11, the function module 12, the power supply module 13, the power supply module 14, the clock module 15, and the clock module 16.

各モジュールのログを取得すると、故障解析部21は、ログのデータを基に故障箇所を解析する。   When acquiring the log of each module, the failure analysis unit 21 analyzes the failure location based on the log data.

故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア5の領域に保存する。   When the failure location is specified, the failure analysis unit 21 sends information on the failure analysis result to the failure analysis result processing unit 23. When receiving the failure analysis result information, the failure analysis result processing unit 23 stores the received failure analysis result information in the area 5 of the failure analysis result storage unit 33.

また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の機能モジュールB障害要因2が該当するとする。機能モジュールB障害要因2では、電源モジュール14、クロックモジュール15およびクロックモジュールBに相当する、電源モジュールB、クロックモジュールAおよびクロックモジュールBが帰属の状態となる。また、機能モジュールB障害要因2では、電源モジュール13に相当する電源モジュールAが非帰属の状態となる。   Further, when the failure analysis unit 21 receives a request for analyzing a failure location, the failure analysis unit 21 refers to the failure association table and identifies a failure factor. At this time, it is assumed that the failure factor corresponds to the failure factor 2 of the functional module B in FIG. In the functional module B failure factor 2, the power supply module B, the clock module A, and the clock module B corresponding to the power supply module 14, the clock module 15, and the clock module B are assigned. In addition, in the functional module B failure factor 2, the power module A corresponding to the power module 13 is in an unassigned state.

障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報5として、保存する時刻5と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報5のフラグを「有効」に設定する。   When the failure factor is specified, the failure analysis unit 21 sends information on the failure factor to the failure association information processing unit 22. Upon receipt of the failure factor information, the failure association information processing unit 22 stores the received failure factor information as failure association information 5 in the failure association information storage unit 32 in association with the save time 5. Further, the failure association information processing unit 22 sets the flag of the failure association information 5 to “valid” for the received failure cause information.

クロックモジュール16は、自モジュールの障害を検出すると障害通知情報を診断部20に出力する。障害通知情報を受け取ると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。   When the clock module 16 detects a failure of its own module, the clock module 16 outputs failure notification information to the diagnosis unit 20. When the failure notification information is received, the failure analysis unit 21 of the diagnosis unit 20 acquires log data from each module. The failure analysis unit 21 acquires logs from the functional module 11, the functional module 12, the power supply module 13, the power supply module 14, the clock module 15, and the clock module 16.

各モジュールのログを取得すると、故障解析部21は、ログのデータを基に故障箇所を解析する。   When acquiring the log of each module, the failure analysis unit 21 analyzes the failure location based on the log data.

故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア6の領域に保存する。   When the failure location is specified, the failure analysis unit 21 sends information on the failure analysis result to the failure analysis result processing unit 23. When receiving the failure analysis result information, the failure analysis result processing unit 23 stores the received failure analysis result information in the area 6 of the failure analysis result storage unit 33.

また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3のクロックモジュールB障害要因1が該当するとする。クロックモジュールB障害要因1では、クロックモジュール16に相当するクロックモジュールBが有効の状態となる。また、クロックモジュールB障害要因1では、電源モジュール13、電源モジュール14およびクロックモジュール15に相当する、電源モジュールA、電源モジュールBおよびクロックモジュールAが無効の状態となる。   Further, when the failure analysis unit 21 receives a request for analyzing a failure location, the failure analysis unit 21 refers to the failure association table and identifies a failure factor. At this time, the failure factor corresponds to the failure factor 1 of the clock module B in FIG. In the clock module B failure factor 1, the clock module B corresponding to the clock module 16 is enabled. Further, in the clock module B failure factor 1, the power supply module A, the power supply module B, and the clock module A corresponding to the power supply module 13, the power supply module 14, and the clock module 15 are disabled.

障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報6として、保存する時刻6と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報6のフラグを「有効」に設定する。   When the failure factor is specified, the failure analysis unit 21 sends information on the failure factor to the failure association information processing unit 22. Upon receiving the failure factor information, the failure association information processing unit 22 stores the received failure factor information as failure association information 6 in the failure association information storage unit 32 in association with the storage time 6. Further, the failure association information processing unit 22 sets the flag of the failure association information 6 to “valid” in the received failure cause information.

各障害通知情報についてのログの解析が終わり、障害関連付け情報が保存されると、障害関連付け情報処理部22は、障害関連付け情報6のクロックモジュール16が「有効」になっていることから電源モジュール14に障害が発生していると判断する。クロックモジュール16は、他のモジュールの障害の影響を受けないので、障害関連付け情報処理部22は、クロックモジュール16に実際の障害が発生していると判断することができる。クロックモジュール16に障害が発生していると判断すると、障害関連付け情報処理部22は、障害関連付け情報記憶部32の各エリアのデータを読み出し保存された時刻と、障害関連付け情報6の時刻6との時間差を比較する。   When the analysis of the log for each failure notification information is completed and the failure association information is stored, the failure association information processing unit 22 determines that the clock module 16 of the failure association information 6 is “valid” and thus the power supply module 14. Is determined to have failed. Since the clock module 16 is not affected by the failure of other modules, the failure association information processing unit 22 can determine that an actual failure has occurred in the clock module 16. If it is determined that a failure has occurred in the clock module 16, the failure association information processing unit 22 calculates the time when the data of each area of the failure association information storage unit 32 is read and stored and the time 6 of the failure association information 6. Compare time differences.

時刻6と、エリア4およびエリア5の時刻の時間差が副次的障害を判定する基準時間以内であるとき、障害関連付け情報処理部22は、エリア4およびエリア5の障害が副次的障害であると判断する。エリア4およびエリア5の障害が副次的障害であると判断すると、障害関連付け情報処理部22は、障害関連付け情報記憶部32のエリア4およびエリア5のフラグを「無効」に設定する。フラグが無効に設定されることで、障害関連付け情報4および障害関連付け情報5に帰属しているモジュールは、副次的障害に該当し、障害が発生していないモジュールとして扱われる。   When the time difference between the time 6 and the time between the area 4 and the area 5 is within the reference time for determining the secondary failure, the failure association information processing unit 22 indicates that the failure in the area 4 and the area 5 is a secondary failure. Judge. When determining that the failure in the areas 4 and 5 is a secondary failure, the failure association information processing unit 22 sets the flags of the area 4 and the area 5 in the failure association information storage unit 32 to “invalid”. By setting the flag to invalid, the module belonging to the failure association information 4 and the failure association information 5 corresponds to a secondary failure and is handled as a module in which no failure has occurred.

本実施形態の情報処理装置は、装置を構成する各モジュールが自モジュールに生じた障害を検知したときに、障害を検出したことを示す障害通知情報を故障検出装置17に出力している。故障検出装置17の故障解析部21は、障害通知情報が入力されたときに、各モジュールからログを取得し、故障箇所の解析を行っている。また、故障検出装置17は、装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールの情報が関連付けられた障害関連付け情報を保持している。また、故障解析部21において行った故障解析を基に、発生した障害に対応する障害関連付け情報を特定し、時刻情報との関連付けを行っている。障害関連付け情報を基に、実際に障害が発生しているとモジュールを特定した場合に、基準時間内の障害関連付け情報に含まれる他のモジュールに生じている障害は副次障害であるとみなしている。このように、副次障害を判定することで、障害が発生していないモジュールの交換を抑制することができる。その結果、本実施形態の情報処理装置は、障害が発生した際に、副次障害のみが発生しているモジュールを除外して故障の検出を行うことができる。   The information processing apparatus according to the present embodiment outputs failure notification information indicating that a failure has been detected to the failure detection device 17 when each module constituting the device detects a failure that has occurred in its own module. When failure notification information is input, the failure analysis unit 21 of the failure detection device 17 acquires a log from each module and analyzes the failure location. Further, the failure detection device 17 holds failure association information in which, for each failure that occurs in each of a plurality of modules constituting the device, information on other modules that cause the failure is associated. Further, based on the failure analysis performed in the failure analysis unit 21, the failure association information corresponding to the failure that has occurred is identified and associated with the time information. When a module is identified as having actually failed based on the failure association information, the failure occurring in another module included in the failure association information within the reference time is regarded as a secondary failure. Yes. As described above, by determining the secondary failure, it is possible to suppress the replacement of the module in which the failure has not occurred. As a result, when a failure occurs, the information processing apparatus according to the present embodiment can detect a failure by excluding a module in which only a secondary failure has occurred.

第2の実施形態では、機能モジュール、電源モジュールおよびクロックモジュールが2個ずつ備えられている構成を例に説明しているが、各モジュールは、単数または3個以上であってもよい。また、各モジュール間の接続関係は、第2の実施形態以外の接続関係であってもよい。例えば、電源モジュール14が機能モジュール12のみに接続されていてもよい。   In the second embodiment, a configuration in which two function modules, two power supply modules, and two clock modules are provided is described as an example. However, each module may be a single module or three or more modules. Further, the connection relationship between the modules may be a connection relationship other than the second embodiment. For example, the power supply module 14 may be connected only to the functional module 12.

第2の実施形態の故障解析部21、障害関連付け情報処理部22および故障解析結果処理部23における処理は、CPU等のプロセッサにおいてコンピュータプログラムを実行することで行われてもよい。また、そのような処理を行うコンピュータプログラムは、記録媒体に記録して頒布することもできる。記録媒体としては、例えば、データ記録用磁気テープや、ハードディスクなどの磁気ディスクを用いることができる。また、記録媒体としては、CD-ROM(Compact Disc Read Only Memory)やDVD(Digital Versatile Disc)などの光ディスク、光磁気ディスクを用いることもできる。不揮発性の半導体記憶装置を記録媒体として用いてもよい。   The processing in the failure analysis unit 21, the failure association information processing unit 22, and the failure analysis result processing unit 23 of the second embodiment may be performed by executing a computer program in a processor such as a CPU. A computer program for performing such processing can be recorded on a recording medium and distributed. As the recording medium, for example, a magnetic tape such as a data recording magnetic tape or a hard disk can be used. As the recording medium, an optical disk such as a CD-ROM (Compact Disc Read Only Memory) or a DVD (Digital Versatile Disc), or a magneto-optical disk may be used. A nonvolatile semiconductor memory device may be used as a recording medium.

1 障害関連情報テーブル記憶手段
2 障害検出手段
3 障害関連情報特定手段
4 障害関連情報記憶手段
5 障害特定手段
6 副次障害判定手段
11 機能モジュール
12 機能モジュール
13 電源モジュール
14 電源モジュール
15 クロックモジュール
16 クロックモジュール
17 故障検出装置
20 診断部
21 故障解析部
22 障害関連付け情報処理部
23 故障解析結果処理部
31 障害関連付けテーブル記憶部
32 障害関連付け情報記憶部
33 故障解析結果記憶部
DESCRIPTION OF SYMBOLS 1 Failure related information table storage means 2 Failure detection means 3 Failure related information identification means 4 Failure related information storage means 5 Failure identification means 6 Secondary failure determination means 11 Functional module 12 Functional module 13 Power supply module 14 Power supply module 15 Clock module 16 Clock Module 17 Failure detection device 20 Diagnosis unit 21 Failure analysis unit 22 Failure association information processing unit 23 Failure analysis result processing unit 31 Failure association table storage unit 32 Failure association information storage unit 33 Failure analysis result storage unit

Claims (10)

装置を構成する複数のモジュールそれぞれに発生する障害ごとに、前記障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶している障害関連情報テーブル記憶手段と、
複数の前記モジュールのうち、障害が発生した前記モジュールを検出する障害検出手段と、
前記障害検出手段が障害を検出したときに、検出した障害に対応する前記障害関連付け情報を特定する障害情報特定手段と、
前記障害情報特定手段が特定した前記障害関連付け情報と、前記障害関連付け情報を処理する時刻とを関連づけて記憶する障害関連情報記憶手段と、
前記障害関連情報記憶手段に記憶された前記障害関連付け情報を基に、実際に故障が発生した前記モジュールを、故障モジュールとして特定する障害特定手段と、
前記故障モジュールを特定した前記障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた前記障害関連付け情報に含まれる前記故障モジュール以外のモジュールの障害を副次的な障害と判定する副次障害判定手段と
を備えることを特徴とする故障検出装置。
For each failure that occurs in each of a plurality of modules constituting the device, a failure related information table storage unit that stores information associating other modules that cause the failure as failure association information;
Fault detection means for detecting the module in which a fault has occurred among the plurality of modules;
Fault information specifying means for specifying the fault association information corresponding to the detected fault when the fault detection means detects a fault;
Fault-related information storage means for storing the fault association information specified by the fault information specifying means and the time for processing the fault correlation information in association with each other;
Based on the fault association information stored in the fault related information storage means, fault specifying means for specifying the module in which a fault has actually occurred as a fault module;
A failure of a module other than the failure module included in the failure association information associated with a time associated with the failure association information that identifies the failed module and a time within a preset time is regarded as a secondary failure. A failure detection apparatus comprising: a secondary failure determination means for determining.
前記モジュールそれぞれからログを取得するログ取得手段と、
前記ログ取得手段が取得した前記ログを基に、故障の派生箇所を解析する故障解析手段と
をさらに備えることを特徴とする請求項1に記載の故障検出装置。
Log acquisition means for acquiring a log from each of the modules;
The failure detection apparatus according to claim 1, further comprising failure analysis means for analyzing a derivation location of a failure based on the log acquired by the log acquisition means.
前記障害関連情報記憶手段は、前記障害情報特定手段によって特定された順に前記障害関連付け情報を記憶し、
前記副次障害判定手段は、前記あらかじめ設定された時間内に相当する領域内に記憶されている前記障害関連付け情報に含まれ前記故障モジュール以外のモジュールの障害を副次的な障害と判定することを特徴とする請求項1または2に記載に故障検出装置。
The failure related information storage means stores the failure association information in the order specified by the failure information specifying means,
The secondary failure determination means determines a failure of a module other than the failed module included in the failure association information stored in an area corresponding to the preset time as a secondary failure. The failure detection device according to claim 1, wherein:
前記障害特定手段が特定した前記障害関連付け情報に含まれるモジュールの情報を出力する情報出力手段をさらに備え、
前記情報出力手段は、前記副次障害判定手段が障害を副次的な障害と判定したモジュールの情報を出力しないことを特徴とする請求項1から3いずれかに記載の故障検出装置。
Further comprising information output means for outputting module information included in the fault association information specified by the fault specifying means;
4. The failure detection apparatus according to claim 1, wherein the information output unit does not output information on a module for which the secondary failure determination unit has determined that the failure is a secondary failure.
前記障害関連付け情報は、前記モジュールごとに他のモジュールが副次障害を誘発するか誘発しないかの情報と関連づけられて生成されていることを特徴とする請求項1から4いずれかに記載の故障検出装置。   The failure according to any one of claims 1 to 4, wherein the failure association information is generated for each module in association with information on whether another module induces a secondary failure or not. Detection device. 入力されたデータを処理し、結果を出力する手段を有する少なくとも1つの情報処理モジュールと、
前記情報処理モジュールに電源を供給する手段を有する少なくとも1つの電源モジュールと、
前記情報処理モジュールにクロックを出力する手段を有する少なくとも1つのクッロクモジュールと、
請求項1から5いずれかに記載の故障検出装置と
を備え、
前記故障検出装置は、前記情報処理モジュール、前記電源モジュールおよび前記クロックモジュールを前記複数のモジュールとして扱うことを特徴とする情報処理装置。
At least one information processing module having means for processing input data and outputting results;
At least one power supply module having means for supplying power to the information processing module;
At least one clock module having means for outputting a clock to the information processing module;
The failure detection device according to claim 1,
The failure detection apparatus handles the information processing module, the power supply module, and the clock module as the plurality of modules.
装置を構成する複数のモジュールそれぞれに発生する障害ごとに、前記障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶し、
複数の前記モジュールのうち、障害が発生した前記モジュールを検出し、
障害を検出したときに、検出した障害に対応する前記障害関連付け情報を特定し、
特定した前記障害関連付け情報と、前記障害関連付け情報を処理した時刻とを関連づけて記憶し、
記憶された前記障害関連付け情報を基に、実際に故障が発生した前記モジュールを、故障モジュールとして特定し、
前記故障モジュールを特定した前記障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた前記障害関連付け情報に含まれ前記故障モジュール以外のモジュールの障害を副次的な障害と判定することを特徴とする障害検出方法。
For each failure that occurs in each of a plurality of modules constituting the device, information that associates other modules that cause the failure is stored as failure association information.
Detecting the failed module among the plurality of modules;
When a failure is detected, the failure association information corresponding to the detected failure is identified,
Storing the identified failure association information and the time at which the failure association information was processed in association with each other;
Based on the stored fault association information, the module in which a fault has actually occurred is identified as a fault module,
A failure of a module other than the failure module included in the failure association information associated with the time associated with the failure association information specifying the failed module and a time within a preset time is regarded as a secondary failure. A failure detection method characterized by determining.
前記モジュールそれぞれからログを取得し、
取得した前記ログを基に、故障の派生箇所を解析することを特徴とする請求項7に記載の障害検出方法。
Get logs from each of the modules,
8. The failure detection method according to claim 7, wherein a failure derivation location is analyzed based on the acquired log.
障害が特定された順に前記障害関連付け情報を記憶し、
前記あらかじめ設定された時間内に相当する領域内に記憶されている前記障害関連付け情報に含まれ前記故障モジュール以外のモジュールの障害を副次的な障害と判定することを特徴とする請求項7または8に記載に障害検出方法。
Storing the fault association information in the order in which faults are identified;
8. The failure of a module other than the failed module included in the failure association information stored in an area corresponding to the preset time is determined as a secondary failure. 8. The fault detection method according to 8.
障害が副次的な障害であると判定したモジュールの情報を出力しない設定とし、
障害を特定した前記障害関連付け情報に含まれるモジュールの情報を出力することを特徴とする請求項7から9いずれかに記載の障害検出方法。
Set to not output the information of the module that has been determined that the failure is a secondary failure,
10. The failure detection method according to claim 7, wherein information on a module included in the failure association information that specifies a failure is output.
JP2018041919A 2018-03-08 2018-03-08 Failure detection device and failure analysis method Active JP7057168B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018041919A JP7057168B2 (en) 2018-03-08 2018-03-08 Failure detection device and failure analysis method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018041919A JP7057168B2 (en) 2018-03-08 2018-03-08 Failure detection device and failure analysis method

Publications (2)

Publication Number Publication Date
JP2019159475A true JP2019159475A (en) 2019-09-19
JP7057168B2 JP7057168B2 (en) 2022-04-19

Family

ID=67994838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018041919A Active JP7057168B2 (en) 2018-03-08 2018-03-08 Failure detection device and failure analysis method

Country Status (1)

Country Link
JP (1) JP7057168B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021174459A (en) * 2020-04-30 2021-11-01 Necプラットフォームズ株式会社 Fault processor, fault processing method and computer program
JP2023074564A (en) * 2021-11-18 2023-05-30 三菱電機株式会社 Control device

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5408218A (en) * 1993-03-19 1995-04-18 Telefonaktiebolaget L M Ericsson Model based alarm coordination
JP2008171057A (en) * 2007-01-09 2008-07-24 Mitsubishi Electric Corp System integration management system
JP2016195321A (en) * 2015-03-31 2016-11-17 Kddi株式会社 Network monitoring device, network monitoring method and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5408218A (en) * 1993-03-19 1995-04-18 Telefonaktiebolaget L M Ericsson Model based alarm coordination
JP2008171057A (en) * 2007-01-09 2008-07-24 Mitsubishi Electric Corp System integration management system
JP2016195321A (en) * 2015-03-31 2016-11-17 Kddi株式会社 Network monitoring device, network monitoring method and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021174459A (en) * 2020-04-30 2021-11-01 Necプラットフォームズ株式会社 Fault processor, fault processing method and computer program
JP7007025B2 (en) 2020-04-30 2022-01-24 Necプラットフォームズ株式会社 Fault handling equipment, fault handling methods and computer programs
JP2023074564A (en) * 2021-11-18 2023-05-30 三菱電機株式会社 Control device
JP7329579B2 (en) 2021-11-18 2023-08-18 三菱電機株式会社 Control device

Also Published As

Publication number Publication date
JP7057168B2 (en) 2022-04-19

Similar Documents

Publication Publication Date Title
CN102279775B (en) Method for processing failure of hard disk under Linux system
US10095576B2 (en) Anomaly recovery method for virtual machine in distributed environment
CN103955417A (en) Computer hard disc data detecting equipment and method
CN112732477B (en) Method for fault isolation by out-of-band self-checking
WO2009110329A1 (en) Failure analysis device, failure analysis method, and recording medium
CN104320308A (en) Method and device for detecting anomalies of server
JP2019159475A (en) Failure detection device and failure analysis method
JP2019057139A (en) Operation management system, monitoring server, method and program
US20190196897A1 (en) Influence range specifying method, influence range specifying apparatus, and storage medium
JP2006268208A (en) Failure diagnosing circuit, information processor equipped with the same, failure diagnosing system, and failure diagnosing program
JP2014021577A (en) Apparatus, system, method, and program for failure prediction
US8451019B2 (en) Method of detecting failure and monitoring apparatus
CN103995759B (en) High-availability computer system failure handling method and device based on core internal-external synergy
CN105224416B (en) Restorative procedure and related electronic device
CN115102838B (en) Emergency processing method and device for server downtime risk and electronic equipment
JP2018180982A (en) Information processing device and log recording method
JP5605672B2 (en) Voltage monitoring system and voltage monitoring method
US7089484B2 (en) Dynamic sparing during normal computer system operation
WO2011051999A1 (en) Information processing device and method for controlling information processing device
JP2020038525A (en) Abnormality detecting device
US20220342788A1 (en) Anomaly location estimating apparatus, method, and program
JP5867962B2 (en) Information processing apparatus and failure diagnosis method
EP2698716A2 (en) Failure detecting device, failure detecting method, and failure detecting program
JP2015162030A (en) Fault indication apparatus, fault indication method and fault indication program
JP2013161211A (en) Information processing apparatus, failure diagnosis control apparatus, failure determination method, and failure determination program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210215

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20211110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220407

R150 Certificate of patent or registration of utility model

Ref document number: 7057168

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150