JP2019159475A - Failure detection device and failure analysis method - Google Patents
Failure detection device and failure analysis method Download PDFInfo
- Publication number
- JP2019159475A JP2019159475A JP2018041919A JP2018041919A JP2019159475A JP 2019159475 A JP2019159475 A JP 2019159475A JP 2018041919 A JP2018041919 A JP 2018041919A JP 2018041919 A JP2018041919 A JP 2018041919A JP 2019159475 A JP2019159475 A JP 2019159475A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- module
- information
- fault
- association information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、故障解析技術に関するものであり、特に、副次障害の影響を抑制して解析を行う技術に関するものである。 The present invention relates to a failure analysis technique, and more particularly to a technique for performing analysis while suppressing the influence of a secondary failure.
装置を構成する各モジュールに障害が発生した際に、故障箇所を解析して交換部品を提示する故障解析機能を有する情報処理装置が用いられている。そのような機能を有する情報処理装置は、障害発生ごとに各モジュールのログを採取し、採取したログの解析を基に故障が発生している恐れのあるモジュールを指摘する。電源やクロック生成回路のように副次的障害を発生するモジュールに障害が発生した際には、故障の発生していない他のモジュールでも障害が発生する可能性が高い。そのような場合には、実際には故障が発生しておらず副次的な障害のみが生じ、正常に使用可能なモジュールも交換部品として指摘される。よって、本来、交換する必要のないモジュールの部品交換が生じうる。そのため、正常に動作し得る部品の交換を抑制しつつ、交換の必要な部品を指摘する技術があることが望ましく、関連する技術の開発が行われている。 An information processing apparatus having a failure analysis function for analyzing a failure location and presenting a replacement part when a failure occurs in each module constituting the apparatus is used. An information processing apparatus having such a function collects a log of each module every time a failure occurs, and points out a module that may have a failure based on analysis of the collected log. When a failure occurs in a module that causes a secondary failure such as a power supply or a clock generation circuit, there is a high possibility that the failure will occur in another module in which no failure has occurred. In such a case, no fault actually occurs and only a secondary failure occurs, and a normally usable module is also pointed out as a replacement part. Therefore, module replacement of modules that do not need to be replaced can occur. For this reason, it is desirable that there is a technique for pointing out parts that need to be replaced while suppressing replacement of parts that can operate normally, and related techniques have been developed.
特許文献1は、障害が発生した際に障害の影響が及ぶ部品の範囲を特定する障害影響分析装置に関するものである。特許文献の障害影響分析装置は、部品が動作する際に依存する他の部品を表すデータを依存データとして記憶している。また、特許文献1の障害影響分析装置は、障害が発生した部品が他の部品の処理能力に与える影響を分析する機能を有している。
しかしながら、特許文献1の技術は次のような点で十分ではない。特許文献1の技術では、障害が発生した部品が存在するときに、その部品の障害が影響を与え得る範囲を特定し、他の部品の処理能力に与える影響を分析している。しかし、特許文献1の障害影響分析装置は、影響の受けている部品の中から正常な部品を判断する機能を有していない。そのため、特許文献1の技術では、副次的な障害のみが発生している部品の交換を抑制する技術としては十分ではない。
However, the technique of
本発明は、上記の課題を解決するため、障害が発生した際に、副次障害のみが発生しているモジュールを除外して故障の検出を行うことができる故障検出装置を提供することを目的としている。 In order to solve the above problems, an object of the present invention is to provide a failure detection device capable of detecting a failure by excluding a module in which only a secondary failure has occurred when a failure occurs. It is said.
上記の課題を解決するため、本発明の故障検出装置は、障害関連情報テーブル記憶手段と、障害検出手段と、障害情報特定手段と、障害関連情報記憶手段と、障害特定手段と、副次障害判定手段を備えている。障害関連情報テーブル記憶手段は、装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶している。障害検出手段は、複数のモジュールのうち、障害が発生したモジュールを検出する。障害情報特定手段は、障害検出手段が障害を検出したときに、検出した障害に対応する障害関連付け情報を特定する。障害関連情報記憶手段は、障害情報特定手段が特定した障害関連付け情報と、障害関連付け情報を処理する時刻とを関連づけて記憶する。障害特定手段は、障害関連情報記憶手段に記憶された障害関連付け情報を基に、実際に故障が発生したモジュールを、故障モジュールとして特定する。副次障害判定手段は、故障モジュールを特定した障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた障害関連付け情報に含まれる故障モジュール以外のモジュールの障害を副次的な障害と判定する。 In order to solve the above problems, a failure detection apparatus according to the present invention includes a failure related information table storage unit, a failure detection unit, a failure information identification unit, a failure related information storage unit, a failure identification unit, and a subsidiary failure. Judgment means is provided. The failure-related information table storage unit stores, as failure association information, information that associates another module that causes a failure for each failure that occurs in each of a plurality of modules that constitute the apparatus. The failure detection means detects a module in which a failure has occurred among the plurality of modules. The fault information specifying unit specifies fault association information corresponding to the detected fault when the fault detecting unit detects the fault. The failure related information storage means stores the failure association information specified by the failure information specification means in association with the time at which the failure association information is processed. The failure identifying unit identifies a module in which a failure has actually occurred as a failure module based on the failure association information stored in the failure related information storage unit. The secondary failure determination means subordinates failures of modules other than the failure module included in the failure association information in which the time associated with the failure association information specifying the failed module and the time within a preset time are associated. Is determined to be a serious failure.
本発明の障害検出方法は、装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶している。本発明の障害検出方法は、複数のモジュールのうち、障害が発生したモジュールを検出する。本発明の障害検出方法は、障害を検出したときに、検出した障害に対応する障害関連付け情報を特定する。本発明の障害検出方法は、特定した障害関連付け情報と、障害関連付け情報を処理した時刻とを関連づけて記憶する。本発明の障害検出方法は、記憶された障害関連付け情報を基に、実際に故障が発生した前記モジュールを、故障モジュールとして特定する。本発明の障害検出方法は、故障モジュールを特定した障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた障害関連付け情報に含まれ故障モジュール以外のモジュールの障害を副次的な障害と判定する。 The failure detection method of the present invention stores, as failure association information, information that associates another module that causes a failure for each failure that occurs in each of a plurality of modules constituting the apparatus. The failure detection method of the present invention detects a module in which a failure has occurred among a plurality of modules. When detecting a failure, the failure detection method of the present invention specifies failure association information corresponding to the detected failure. The failure detection method of the present invention stores the identified failure association information and the time when the failure association information is processed in association with each other. In the failure detection method of the present invention, the module in which a failure has actually occurred is identified as a failure module based on the stored failure association information. According to the failure detection method of the present invention, a failure associated with a module other than the failure module included in the failure association information associated with the time associated with the failure association information specifying the failed module and the time within a preset time is subordinated. Is determined to be a failure.
本発明によると、障害が発生した際に、副次障害のみが発生しているモジュールを除外して故障の検出を行うことができる。 According to the present invention, when a failure occurs, it is possible to detect a failure by excluding a module in which only a secondary failure has occurred.
(第1の実施形態)
本発明の第1の実施形態について図を参照して詳細に説明する。図1は、本実施形態の故障検出装置の構成の概要を示したものである。本実施形態の故障検出装置は、障害関連情報テーブル記憶手段1と、障害検出手段2と、障害情報特定手段3と、障害関連情報記憶手段4と、障害特定手段5と、副次障害判定手段6を備えている。障害関連情報テーブル記憶手段1は、装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶している。障害検出手段2は、複数のモジュールのうち、障害が発生したモジュールを検出する。障害情報特定手段3は、障害検出手段2が障害を検出したときに、検出した障害に対応する障害関連付け情報を特定する。障害関連情報記憶手段4は、障害情報特定手段3が特定した障害関連付け情報と、障害関連付け情報を処理する時刻とを関連づけて記憶する。障害特定手段5は、障害関連情報記憶手段4に記憶された障害関連付け情報を基に、実際に故障が発生したモジュールを、故障モジュールとして特定する。副次障害判定手段6は、故障モジュールを特定した障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた障害関連付け情報に含まれる故障モジュール以外のモジュールの障害を副次的な障害と判定する。
(First embodiment)
A first embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 shows an outline of the configuration of the failure detection apparatus according to the present embodiment. The failure detection apparatus according to the present embodiment includes failure related information table storage means 1, failure detection means 2, failure information identification means 3, failure related information storage means 4, failure identification means 5, and secondary failure determination means. 6 is provided. The failure related information
本実施形態の故障検出装置は、障害関連情報テーブル記憶手段1において装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールを関連付けた情報を障害関連付け情報として記憶している。障害情報特定手段3は、障害検出手段2が障害を検出したときに、検出した障害に対応する障害関連付け情報を特定している。また、副次障害判定手段6は、特定した障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた障害関連付け情報に含まれる故障モジュール以外のモジュールの障害を副次的な障害と判定している。このように、他のモジュールの影響を受ける障害の要因のうち、あらかじめ設定された時間内に生じた障害を副次的な障害とすることで、実際に障害が生じたモジュールと区別することが可能になる。その結果、本実施形態の故障検出装置を用いることで、障害が発生した際に、副次障害のみが発生しているモジュールを除外して故障の検出を行うことができる。
The failure detection device according to the present embodiment stores, as failure association information, information associated with another module that causes a failure for each failure that occurs in each of a plurality of modules constituting the device in the failure related information
(第2の実施形態)
本発明の第2の実施形態について図を参照して詳細に説明する。図2は、本実施形態の情報処理装置の構成の概要を示したものである。本実施形態の情報処理装置は、装置を構成する各モジュールが障害検出機能をそれぞれ有し、障害が発生した際に故障検出装置において故障の生じたモジュールを特定する機能を有する。
(Second Embodiment)
A second embodiment of the present invention will be described in detail with reference to the drawings. FIG. 2 shows an outline of the configuration of the information processing apparatus according to this embodiment. The information processing apparatus according to the present embodiment has a function of identifying a module in which a failure has occurred in the failure detection apparatus when a failure has occurred.
本実施形態の情報処理装置は、機能モジュール11と、機能モジュール12と、電源モジュール13と、電源モジュール14と、クロックモジュール15と、クロックモジュール16と、故障検出装置17を備えている。各モジュール間および各モジュールを故障検出装置17の間は、バスを介して接続されている。
The information processing apparatus according to this embodiment includes a
機能モジュール11および機能モジュール12は、情報処理装置の用途に基づいた各処理を実行する機能を有する。各機能モジュールは、例えば、CPU(Central Processing Unit)、メモリおよびハードディスクドライブ等で構成され、CPUでコンピュータプログラムを実行することで、入力されたデータの処理を行って結果を出力する。
The
機能モジュール11および機能モジュール12は、障害検出機能をそれぞれ備えている。各機能モジュールの障害検出機能は、それぞれの自モジュールの障害の有無を監視する。機能モジュール11および機能モジュール12は、自モジュールの障害を検知すると、障害を検知したことを示す情報を障害通知情報として故障検出装置17に送る。
The
電源モジュール13は、機能モジュール11に電源を供給する。また、電源モジュール14は、機能モジュール11および機能モジュール12に電源を供給する。電源モジュール13および電源モジュール14は、情報処理装置10の外部から電源の供給を受け、各機能モジュールに電源を供給する。電源モジュール13および電源モジュール14は、2次電池等を用いたものであってもよい。各電源モジュールは、障害検出機能を有する。電源モジュール13および電源モジュール14は、自モジュールの障害を検知すると、障害を検知したことを示す情報を障害通知情報として故障検出装置17に送る。
The
クロックモジュール15およびクロックモジュール16は、あらかじめ設定された周波数のクロックを生成し、生成したクロックを出力する。クロックモジュール15およびクロックモジュール16は、クロックの生成機能を有する半導体装置によって構成されている。生成するクロックの周波数は、機能モジュールの動作周波数に基づいてあらかじめ設定されている。クロックモジュール15は、生成したクロックを機能モジュール11および機能モジュール12に出力する。クロックモジュール16は、生成したクロックを機能モジュール12に出力する。各クロックモジュールは、障害検出機能を有する。クロックモジュール15およびクロックモジュール16は、自モジュールの障害を検知すると、障害を検知したことを示す情報を障害通知情報として故障検出装置17に送る。
The
故障検出装置17は、診断部20と、障害関連付けテーブル記憶部31と、障害関連付け情報記憶部32と、故障解析結果記憶部33をさらに備えている。
The
診断部20は、故障解析部21と、障害関連付け情報処理部22と、故障解析結果処理部23をさらに備えている。本実施形態の診断部20は、半導体装置によって構成されている。故障解析部21、障害関連付け情報処理部22および故障解析結果処理部23は、同一の半導体装置に形成されていてもよく、それぞれ別の半導体装置が用いられていてもよい。また、診断部20は、CPU等の汎用プロセッサにおいてコンピュータプログラムを実行することで各処理を行う構成であってもよい。
The
故障解析部21は、各モジュールのログのデータを基に、故障箇所を特定する。各モジュールのログは、処理能力、出力の有無および出力状態等のデータによって構成されている。故障解析部21は、各モジュールに生じる障害ごとに基準を記憶し、ログと基準を比較して各モジュールで生じている故障個所や種類を特定する。故障解析部21は、特定した故障箇所等の情報を、故障解析結果処理部23に出力する。また、故障解析部21は、障害関連付けテーブルを参照して、障害要因を特定する。故障解析部21は、特定した障害要因の情報を障害関連付け情報処理部22に出力する。
The
障害関連付け情報処理部22は、故障解析部21から入力される障害要因の情報を障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、障害要因のうち副次障害の項目を判断する。また、本実施形態の故障解析部21の機能は、第1の実施形態の障害検出手段2、障害関連情報特定手段3および障害特定手段5に相当する。
The failure association
障害関連付け情報処理部22は、あらかじめ設定された基準時間内に生じた障害を副次障害と判定し、障害が発生している箇所から除外する。副次障害を判断する基準となる時間は、副次障害判定時間としたあらかじめ保存されている。副次障害判定時間は、モジュールごとに異なっていてもよく、また、作業者等の入力に基づいて変更可能な構成であってもよい。また、本実施形態の障害関連付け情報処理部22の機能は、第1の実施形態の副次障害判定手段6に相当する。
The failure association
故障解析結果処理部23は、故障解析部21から入力される故障箇所の情報を、故障解析結果記憶部33に保存する。
The failure analysis
障害関連付けテーブル記憶部31は、各モジュールに生じる障害要因ごとに、その障害の発生要因となり得るモジュールの情報が障害関連付けテーブルとして保存されている。図3は、本実施形態の障害関連付けテーブルの構成の例を示したものである。
The failure association
図3において、機能モジュール11および機能モジュール12は、機能モジュールAおよび機能モジュールBとして示されている。図3において、電源モジュール13および電源モジュール14は、電源モジュールAおよび電源モジュールBとして示されている。また、図3において、クロックモジュール15およびクロックモジュール16は、クロックモジュールAおよびクロックモジュールBとして示されている。
In FIG. 3, the
図3に示すように障害関連付けテーブルは、モジュールごとに各モジュールが障害の要因となり得るかの情報が関連付けられている。例えば、障害関連づけテーブルは、各モジュールが障害の要因となる場合には「有効」、障害の要因となる場合には「無効」として情報を保持している。例えば、電源モジュールやクロックモジュールでは、他のモジュールの障害の影響を受けないので、自モジュールのみが障害の要因となる。そのため、電源モジュールやクロックモジュールでは、自モジュールのみが「有効」の設定になっている。 As shown in FIG. 3, the failure association table associates information about whether each module can be a cause of failure for each module. For example, the failure association table holds information as “valid” when each module causes a failure, and “invalid” when a failure causes. For example, since the power supply module and the clock module are not affected by the failure of other modules, only the own module becomes the cause of the failure. Therefore, in the power supply module and the clock module, only the own module is set to “valid”.
また、図3の障害関連付けテーブルは、各モジュールが障害の要因となり得る場合は、「帰属」、障害の要因とならない場合には「非帰属」として情報を保持している。 Further, the failure association table of FIG. 3 holds information as “Attribution” when each module can be a cause of failure, and “Unassigned” when it is not a cause of failure.
故障解析部21は、各モジュールのログの解析結果を基に、生じている障害がどの障害要因に該当するかを判断する。故障解析部21は、ログの解析結果と各モジュールの障害要因との関係のデータをあらかじめ記憶している。また、本実施形態の障害関連付けテーブル記憶部31の機能は、第1の実施形態の障害関連情報テーブル記憶手段1に相当する。
The
障害関連付け情報記憶部32は、障害関連付け情報を保存する機能を有する。障害関連付け情報記憶部32は、故障箇所に対応する障害関連情報を記憶している。障害関連付け情報記憶部32は、障害関連付け情報処理部22から入力される障害要因の情報を、保存する時刻と関連付けて障害関連付け情報記憶部32に保存する。
The failure association
図4は、本実施形態の障害関連付け情報の構成の例を示したものである。障害関連付け情報には、障害関連付け情報が保存された時刻と、その障害関連付け情報が有効であるかを示すフラグが関連付けられている。 FIG. 4 shows an example of the configuration of the fault association information of this embodiment. The failure association information is associated with a time when the failure association information is stored and a flag indicating whether the failure association information is valid.
本実施形態の障害関連付け情報記憶部32は、第1の実施形態の障害関連情報記憶手段4に相当する。
The failure association
故障解析結果記憶部33は、故障解析結果処理部23は、故障解析部21から入力される故障解析結果、すなわち、故障箇所の情報を保存する。図5は、故障解析結果記憶部33に保存されている故障解析結果の構成の例を示す図である。図5に示すように故障解析結果記憶部33の各記憶領域に、故障解析結果の情報が順次、保存されている。
The failure analysis
本実施形態の障害関連付けテーブル記憶部31、障害関連付け情報記憶部32および故障解析結果記憶部33は、不揮発性の半導体記憶装置を用いて構成されている。障害関連付けテーブル記憶部31、障害関連付け情報記憶部32および故障解析結果記憶部33は、同一の半導体記憶装置上の領域であってもよく、また、異なる半導体記憶装置を用いて構成されていてもよい。また、障害関連付けテーブル記憶部31、障害関連付け情報記憶部32および故障解析結果記憶部33は、不揮発性の半導体記憶装置に代えてハードディスクドライブ等の他の記憶装置や、それらの組み合わせによって構成されていてもよい。また、障害関連付けテーブル記憶部31、障害関連付け情報記憶部32および故障解析結果記憶部33の一部または全ては、診断部20と同一の半導体装置上に形成されていてもよい。
The failure association
本実施形態の情報処理装置において障害を検知した際に、副次障害の発生しているモジュールを特定し、故障が発生しているモジュールを特定する際の動作に説明する。図6は、情報処理装置において障害を検知した際に、障害の発生しているモジュールを特定する際の動作フローを示したものである。 An operation for identifying a module in which a secondary failure has occurred when a failure has been detected in the information processing apparatus of the present embodiment and identifying a module in which a failure has occurred will be described. FIG. 6 shows an operation flow when a faulty module is identified when a fault is detected in the information processing apparatus.
情報処理装置を構成するいずれかのモジュールで障害が発生すると、自モジュールで障害を検知したモジュールから障害通知情報が診断部20に入力される(ステップS11)。
When a failure occurs in any of the modules constituting the information processing apparatus, failure notification information is input to the
障害通知情報が診断部20に入力されると、診断部20の故障解析部21は、各モジュールのログを取得する(ステップS12)。各モジュールからログを取得すると、故障解析部21は、ログのデータを基に故障箇所の解析を行う(ステップS13)。
When the failure notification information is input to the
故障箇所の解析を行うと、故障解析部21は、故障箇所の解析結果を故障解析結果として故障解析結果処理部23に送る。故障解析結果を受け取ると、故障解析結果処理部23は、故障解析結果を故障解析結果記憶部33に保存する。
When the failure location is analyzed, the
また、故障解析部21は、障害関連付けテーブル記憶部31を参照し、故障解析の結果を基に対応する障害要因を特定する(ステップS14)。解析結果に対応する障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報と、処理を行う際の時刻、例えば、保存処理を行う時刻とを関連付けて障害関連付け情報記憶部32に保存する(ステップS15)。
Further, the
障害要因の障害関連付け情報記憶部32への保存が行われた際に、ログの解析等が未処理の障害通知情報がある場合には(ステップS16でYes)、故障解析部21は、ステップS12からの動作を再度、行う。
When the failure cause information is stored in the failure association
診断部20に入力された障害通知情報に対応するログの解析等が全て終わると(ステップS16でNo)、障害関連付け情報処理部22は、障害関連付け情報記憶部32に保存された障害関連付け情報について副次的障害の有無の判定を行う。
When the analysis and the like of the log corresponding to the failure notification information input to the
副次的障害の判定を開始すると、障害関連付け情報処理部22は、実際に障害が発生している箇所を特定する。実際に障害が発生している障害要因を特定すると、障害関連付け情報処理部22は、関連付けられた時刻との差があらかじめ設定された時間内の時刻が関連付けられた障害要因を抽出する。時間差が設定された時間内の障害要因を抽出すると、障害関連付け情報処理部22は、抽出した範囲内が副次障害の範囲であると判定する(ステップS17)。
When the determination of the secondary failure is started, the failure association
副次障害の範囲を判定すると、障害関連付け情報処理部22は、判定した範囲内の障害要因に関連付けられているフラグを「無効」設定する(ステップS18)。フラグが「無効」設定されると、フラグが「無効」の障害要因の中で、帰属として設定されているモジュールに発生した障害は、副次障害によるものであると見なされる。
When determining the range of the secondary failure, the failure association
副次障害の判定が終わると、故障解析部21は、フラグが有効の障害要因に含まれるモジュールの情報を、表示装置等に出力することで作業者等に通知する(ステップS19)。
When the determination of the secondary failure is completed, the
次に、情報処理装置10の電源モジュール14で障害が発生した場合に副次障害の範囲を判定する際の動作についてより具体的な例を用いて説明する。以下の説明では、電源4で故障が発生し、電源の供給を受けている機能モジュール11および機能モジュール12の動作に不具合が生じた場合の例について説明する。
Next, the operation when determining the range of the secondary failure when a failure occurs in the
機能モジュール11は、自モジュールの動作の異常を検出すると、障害通知情報を診断部20に出力する。
When the
障害通知情報が入力されると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。
When the failure notification information is input, the
各モジュールのログを取得すると、故障解析部21は、ログのデータを解析し故障箇所を特定する。
When the log of each module is acquired, the
故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア1の領域に保存する。
When the failure location is specified, the
また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の機能モジュールA障害要因1が該当するとする。機能モジュールA障害要因1では、電源モジュール13、電源モジュール14およびクロックモジュール15に相当する電源モジュールA、電源モジュールBおよびクロックモジュールAが帰属の状態となる。また、機能モジュールA障害要因1では、クロックモジュール16に相当するクロックモジュール16が非帰属の状態となる。
Further, when the
障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報1として、保存する時刻1と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報1のフラグを「有効」に設定する。
When the failure factor is specified, the
機能モジュール12は、自モジュールの動作異常を検出すると、障害通知情報を診断部20に出力する。障害通知情報を受け取ると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。診断部20の故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。
When the
各モジュールのログを取得すると、故障解析部21は、ログのデータを基に故障箇所を解析する。
When acquiring the log of each module, the
故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア2の領域に保存する。
When the failure location is specified, the
また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の機能モジュールB障害要因2が該当するとする。機能モジュールB障害要因2では、電源モジュール14、クロックモジュール15およびクロックモジュールBに相当する、電源モジュールB、クロックモジュールAおよびクロックモジュールBが帰属の状態となる。また、機能モジュールB障害要因2では、電源モジュール13に相当する電源モジュールAが非帰属の状態となる。
Further, when the
障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報2として、保存する時刻2と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報2のフラグを「有効」に設定する。
When the failure factor is specified, the
電源モジュール14は、自モジュールの障害を検出すると障害通知情報を診断部20に出力する。障害通知情報を受け取ると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。
When the
各モジュールのログを取得すると、故障解析部21は、ログのデータを基に故障箇所を解析する。
When acquiring the log of each module, the
故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア2の領域に保存する。
When the failure location is specified, the
また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の電源モジュールA障害要因1が該当するとする。電源モジュールA障害要因1では、電源モジュール14に相当する電源モジュールBが帰属の状態となる。また、電源モジュールA障害要因1では、電源モジュール13、クロックモジュール15およびクロックモジュール16に相当する、電源モジュールB、クロックモジュールAおよびクロックモジュールBが非帰属の状態となる。
Further, when the
障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報3として、保存する時刻3と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報3のフラグを「有効」に設定する。
When the failure factor is specified, the
各障害通知情報についてのログの解析が終わり、障害関連付け情報が保存されると、障害関連付け情報処理部22は、障害関連付け情報3の電源モジュール14が「有効」になっていることから電源モジュール14に障害が発生していると判断する。電源モジュール14は、他のモジュールの障害の影響を受けないので、障害関連付け情報処理部22は、電源モジュール14に実際の障害が発生していると判断することができる。電源モジュール14に障害が発生していると判断すると、障害関連付け情報処理部22は、障害関連付け情報記憶部32の各エリアのデータを読み出し、各エリアの保存された時刻と、障害関連付け情報3の時刻3との時間差を比較する。
When the analysis of the log for each piece of failure notification information is completed and the failure association information is stored, the failure association
時刻3と、エリア1およびエリア2の時刻の時間差が副次的障害を判定する基準時間以内であるとき、障害関連付け情報処理部22は、エリア1およびエリア2の障害が副次的障害であると判断する。エリア1およびエリア2の障害が副次的障害であると判断すると、障害関連付け情報処理部22は、障害関連付け情報記憶部32のエリア1およびエリア2のフラグを「無効」に設定する。フラグが無効に設定されることで、障害関連付け情報1および障害関連付け情報2に帰属しているモジュールは、副次的障害に該当し、障害が発生していないモジュールとして扱われる。
When the time difference between the
次に本実施形態の情報処理装置において他のパターンの障害が発生した場合に副次障害を判定する例について説明する。以下では、機能モジュール11およびクロックモジュール16で障害が発生し、機能モジュール12で副次障害が発生している場合を例に説明する。
Next, an example in which a secondary failure is determined when a failure of another pattern occurs in the information processing apparatus according to the present embodiment will be described. Hereinafter, a case where a failure has occurred in the
機能モジュール11は、自モジュールの動作の異常を検出すると、障害通知情報を診断部20に出力する。
When the
障害通知情報が入力されると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。
When the failure notification information is input, the
各モジュールのログを取得すると、故障解析部21は、ログのデータを解析し故障箇所を特定する。
When the log of each module is acquired, the
故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア4の領域に保存する。
When the failure location is specified, the
また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の機能モジュールA障害要因3が該当するとする。機能モジュールA障害要因3では、電源モジュール14およびクロックモジュール15に相当する電源モジュールBおよびクロックモジュールAが帰属の状態となる。また、機能モジュールA障害要因3では、電源モジュール13およびクロックモジュール16に相当する電源モジュールAおよびクロックモジュール16が非帰属の状態となる。
Further, when the
障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報4として、保存する時刻4と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報4のフラグを「有効」に設定する。
When the failure factor is specified, the
機能モジュール12は、自モジュールの動作異常を検出すると、障害通知情報を診断部20に出力する。障害通知情報を受け取ると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。診断部20の故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。
When the
各モジュールのログを取得すると、故障解析部21は、ログのデータを基に故障箇所を解析する。
When acquiring the log of each module, the
故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア5の領域に保存する。
When the failure location is specified, the
また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3の機能モジュールB障害要因2が該当するとする。機能モジュールB障害要因2では、電源モジュール14、クロックモジュール15およびクロックモジュールBに相当する、電源モジュールB、クロックモジュールAおよびクロックモジュールBが帰属の状態となる。また、機能モジュールB障害要因2では、電源モジュール13に相当する電源モジュールAが非帰属の状態となる。
Further, when the
障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報5として、保存する時刻5と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報5のフラグを「有効」に設定する。
When the failure factor is specified, the
クロックモジュール16は、自モジュールの障害を検出すると障害通知情報を診断部20に出力する。障害通知情報を受け取ると、診断部20の故障解析部21は、各モジュールからログのデータを取得する。故障解析部21は、機能モジュール11、機能モジュール12、電源モジュール13、電源モジュール14、クロックモジュール15およびクロックモジュール16からログを取得する。
When the
各モジュールのログを取得すると、故障解析部21は、ログのデータを基に故障箇所を解析する。
When acquiring the log of each module, the
故障箇所を特定すると、故障解析部21は、故障解析結果の情報を故障解析結果処理部23に送る。故障解析結果の情報を受け取ると、故障解析結果処理部23は、受け取った故障解析結果の情報を故障解析結果記憶部33のエリア6の領域に保存する。
When the failure location is specified, the
また、故障解析部21は、故障箇所を解析する要求を受け取った際に、障害関連付けテーブルを参照して、障害要因を特定する。このとき、障害要因は、図3のクロックモジュールB障害要因1が該当するとする。クロックモジュールB障害要因1では、クロックモジュール16に相当するクロックモジュールBが有効の状態となる。また、クロックモジュールB障害要因1では、電源モジュール13、電源モジュール14およびクロックモジュール15に相当する、電源モジュールA、電源モジュールBおよびクロックモジュールAが無効の状態となる。
Further, when the
障害要因を特定すると、故障解析部21は、障害要因の情報を障害関連付け情報処理部22に送る。障害要因の情報を受け取ると、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報6として、保存する時刻6と関連付けて障害関連付け情報記憶部32に保存する。また、障害関連付け情報処理部22は、受け取った障害要因の情報を障害関連付け情報6のフラグを「有効」に設定する。
When the failure factor is specified, the
各障害通知情報についてのログの解析が終わり、障害関連付け情報が保存されると、障害関連付け情報処理部22は、障害関連付け情報6のクロックモジュール16が「有効」になっていることから電源モジュール14に障害が発生していると判断する。クロックモジュール16は、他のモジュールの障害の影響を受けないので、障害関連付け情報処理部22は、クロックモジュール16に実際の障害が発生していると判断することができる。クロックモジュール16に障害が発生していると判断すると、障害関連付け情報処理部22は、障害関連付け情報記憶部32の各エリアのデータを読み出し保存された時刻と、障害関連付け情報6の時刻6との時間差を比較する。
When the analysis of the log for each failure notification information is completed and the failure association information is stored, the failure association
時刻6と、エリア4およびエリア5の時刻の時間差が副次的障害を判定する基準時間以内であるとき、障害関連付け情報処理部22は、エリア4およびエリア5の障害が副次的障害であると判断する。エリア4およびエリア5の障害が副次的障害であると判断すると、障害関連付け情報処理部22は、障害関連付け情報記憶部32のエリア4およびエリア5のフラグを「無効」に設定する。フラグが無効に設定されることで、障害関連付け情報4および障害関連付け情報5に帰属しているモジュールは、副次的障害に該当し、障害が発生していないモジュールとして扱われる。
When the time difference between the
本実施形態の情報処理装置は、装置を構成する各モジュールが自モジュールに生じた障害を検知したときに、障害を検出したことを示す障害通知情報を故障検出装置17に出力している。故障検出装置17の故障解析部21は、障害通知情報が入力されたときに、各モジュールからログを取得し、故障箇所の解析を行っている。また、故障検出装置17は、装置を構成する複数のモジュールそれぞれに発生する障害ごとに、障害の要因となる他のモジュールの情報が関連付けられた障害関連付け情報を保持している。また、故障解析部21において行った故障解析を基に、発生した障害に対応する障害関連付け情報を特定し、時刻情報との関連付けを行っている。障害関連付け情報を基に、実際に障害が発生しているとモジュールを特定した場合に、基準時間内の障害関連付け情報に含まれる他のモジュールに生じている障害は副次障害であるとみなしている。このように、副次障害を判定することで、障害が発生していないモジュールの交換を抑制することができる。その結果、本実施形態の情報処理装置は、障害が発生した際に、副次障害のみが発生しているモジュールを除外して故障の検出を行うことができる。
The information processing apparatus according to the present embodiment outputs failure notification information indicating that a failure has been detected to the
第2の実施形態では、機能モジュール、電源モジュールおよびクロックモジュールが2個ずつ備えられている構成を例に説明しているが、各モジュールは、単数または3個以上であってもよい。また、各モジュール間の接続関係は、第2の実施形態以外の接続関係であってもよい。例えば、電源モジュール14が機能モジュール12のみに接続されていてもよい。
In the second embodiment, a configuration in which two function modules, two power supply modules, and two clock modules are provided is described as an example. However, each module may be a single module or three or more modules. Further, the connection relationship between the modules may be a connection relationship other than the second embodiment. For example, the
第2の実施形態の故障解析部21、障害関連付け情報処理部22および故障解析結果処理部23における処理は、CPU等のプロセッサにおいてコンピュータプログラムを実行することで行われてもよい。また、そのような処理を行うコンピュータプログラムは、記録媒体に記録して頒布することもできる。記録媒体としては、例えば、データ記録用磁気テープや、ハードディスクなどの磁気ディスクを用いることができる。また、記録媒体としては、CD-ROM(Compact Disc Read Only Memory)やDVD(Digital Versatile Disc)などの光ディスク、光磁気ディスクを用いることもできる。不揮発性の半導体記憶装置を記録媒体として用いてもよい。
The processing in the
1 障害関連情報テーブル記憶手段
2 障害検出手段
3 障害関連情報特定手段
4 障害関連情報記憶手段
5 障害特定手段
6 副次障害判定手段
11 機能モジュール
12 機能モジュール
13 電源モジュール
14 電源モジュール
15 クロックモジュール
16 クロックモジュール
17 故障検出装置
20 診断部
21 故障解析部
22 障害関連付け情報処理部
23 故障解析結果処理部
31 障害関連付けテーブル記憶部
32 障害関連付け情報記憶部
33 故障解析結果記憶部
DESCRIPTION OF
Claims (10)
複数の前記モジュールのうち、障害が発生した前記モジュールを検出する障害検出手段と、
前記障害検出手段が障害を検出したときに、検出した障害に対応する前記障害関連付け情報を特定する障害情報特定手段と、
前記障害情報特定手段が特定した前記障害関連付け情報と、前記障害関連付け情報を処理する時刻とを関連づけて記憶する障害関連情報記憶手段と、
前記障害関連情報記憶手段に記憶された前記障害関連付け情報を基に、実際に故障が発生した前記モジュールを、故障モジュールとして特定する障害特定手段と、
前記故障モジュールを特定した前記障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた前記障害関連付け情報に含まれる前記故障モジュール以外のモジュールの障害を副次的な障害と判定する副次障害判定手段と
を備えることを特徴とする故障検出装置。 For each failure that occurs in each of a plurality of modules constituting the device, a failure related information table storage unit that stores information associating other modules that cause the failure as failure association information;
Fault detection means for detecting the module in which a fault has occurred among the plurality of modules;
Fault information specifying means for specifying the fault association information corresponding to the detected fault when the fault detection means detects a fault;
Fault-related information storage means for storing the fault association information specified by the fault information specifying means and the time for processing the fault correlation information in association with each other;
Based on the fault association information stored in the fault related information storage means, fault specifying means for specifying the module in which a fault has actually occurred as a fault module;
A failure of a module other than the failure module included in the failure association information associated with a time associated with the failure association information that identifies the failed module and a time within a preset time is regarded as a secondary failure. A failure detection apparatus comprising: a secondary failure determination means for determining.
前記ログ取得手段が取得した前記ログを基に、故障の派生箇所を解析する故障解析手段と
をさらに備えることを特徴とする請求項1に記載の故障検出装置。 Log acquisition means for acquiring a log from each of the modules;
The failure detection apparatus according to claim 1, further comprising failure analysis means for analyzing a derivation location of a failure based on the log acquired by the log acquisition means.
前記副次障害判定手段は、前記あらかじめ設定された時間内に相当する領域内に記憶されている前記障害関連付け情報に含まれ前記故障モジュール以外のモジュールの障害を副次的な障害と判定することを特徴とする請求項1または2に記載に故障検出装置。 The failure related information storage means stores the failure association information in the order specified by the failure information specifying means,
The secondary failure determination means determines a failure of a module other than the failed module included in the failure association information stored in an area corresponding to the preset time as a secondary failure. The failure detection device according to claim 1, wherein:
前記情報出力手段は、前記副次障害判定手段が障害を副次的な障害と判定したモジュールの情報を出力しないことを特徴とする請求項1から3いずれかに記載の故障検出装置。 Further comprising information output means for outputting module information included in the fault association information specified by the fault specifying means;
4. The failure detection apparatus according to claim 1, wherein the information output unit does not output information on a module for which the secondary failure determination unit has determined that the failure is a secondary failure.
前記情報処理モジュールに電源を供給する手段を有する少なくとも1つの電源モジュールと、
前記情報処理モジュールにクロックを出力する手段を有する少なくとも1つのクッロクモジュールと、
請求項1から5いずれかに記載の故障検出装置と
を備え、
前記故障検出装置は、前記情報処理モジュール、前記電源モジュールおよび前記クロックモジュールを前記複数のモジュールとして扱うことを特徴とする情報処理装置。 At least one information processing module having means for processing input data and outputting results;
At least one power supply module having means for supplying power to the information processing module;
At least one clock module having means for outputting a clock to the information processing module;
The failure detection device according to claim 1,
The failure detection apparatus handles the information processing module, the power supply module, and the clock module as the plurality of modules.
複数の前記モジュールのうち、障害が発生した前記モジュールを検出し、
障害を検出したときに、検出した障害に対応する前記障害関連付け情報を特定し、
特定した前記障害関連付け情報と、前記障害関連付け情報を処理した時刻とを関連づけて記憶し、
記憶された前記障害関連付け情報を基に、実際に故障が発生した前記モジュールを、故障モジュールとして特定し、
前記故障モジュールを特定した前記障害関連付け情報に関連づけられた時刻とあらかじめ設定された時間内の時刻が関連づけられた前記障害関連付け情報に含まれ前記故障モジュール以外のモジュールの障害を副次的な障害と判定することを特徴とする障害検出方法。 For each failure that occurs in each of a plurality of modules constituting the device, information that associates other modules that cause the failure is stored as failure association information.
Detecting the failed module among the plurality of modules;
When a failure is detected, the failure association information corresponding to the detected failure is identified,
Storing the identified failure association information and the time at which the failure association information was processed in association with each other;
Based on the stored fault association information, the module in which a fault has actually occurred is identified as a fault module,
A failure of a module other than the failure module included in the failure association information associated with the time associated with the failure association information specifying the failed module and a time within a preset time is regarded as a secondary failure. A failure detection method characterized by determining.
取得した前記ログを基に、故障の派生箇所を解析することを特徴とする請求項7に記載の障害検出方法。 Get logs from each of the modules,
8. The failure detection method according to claim 7, wherein a failure derivation location is analyzed based on the acquired log.
前記あらかじめ設定された時間内に相当する領域内に記憶されている前記障害関連付け情報に含まれ前記故障モジュール以外のモジュールの障害を副次的な障害と判定することを特徴とする請求項7または8に記載に障害検出方法。 Storing the fault association information in the order in which faults are identified;
8. The failure of a module other than the failed module included in the failure association information stored in an area corresponding to the preset time is determined as a secondary failure. 8. The fault detection method according to 8.
障害を特定した前記障害関連付け情報に含まれるモジュールの情報を出力することを特徴とする請求項7から9いずれかに記載の障害検出方法。 Set to not output the information of the module that has been determined that the failure is a secondary failure,
10. The failure detection method according to claim 7, wherein information on a module included in the failure association information that specifies a failure is output.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018041919A JP7057168B2 (en) | 2018-03-08 | 2018-03-08 | Failure detection device and failure analysis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018041919A JP7057168B2 (en) | 2018-03-08 | 2018-03-08 | Failure detection device and failure analysis method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019159475A true JP2019159475A (en) | 2019-09-19 |
JP7057168B2 JP7057168B2 (en) | 2022-04-19 |
Family
ID=67994838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018041919A Active JP7057168B2 (en) | 2018-03-08 | 2018-03-08 | Failure detection device and failure analysis method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7057168B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021174459A (en) * | 2020-04-30 | 2021-11-01 | Necプラットフォームズ株式会社 | Fault processor, fault processing method and computer program |
JP2023074564A (en) * | 2021-11-18 | 2023-05-30 | 三菱電機株式会社 | Control device |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5408218A (en) * | 1993-03-19 | 1995-04-18 | Telefonaktiebolaget L M Ericsson | Model based alarm coordination |
JP2008171057A (en) * | 2007-01-09 | 2008-07-24 | Mitsubishi Electric Corp | System integration management system |
JP2016195321A (en) * | 2015-03-31 | 2016-11-17 | Kddi株式会社 | Network monitoring device, network monitoring method and program |
-
2018
- 2018-03-08 JP JP2018041919A patent/JP7057168B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5408218A (en) * | 1993-03-19 | 1995-04-18 | Telefonaktiebolaget L M Ericsson | Model based alarm coordination |
JP2008171057A (en) * | 2007-01-09 | 2008-07-24 | Mitsubishi Electric Corp | System integration management system |
JP2016195321A (en) * | 2015-03-31 | 2016-11-17 | Kddi株式会社 | Network monitoring device, network monitoring method and program |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021174459A (en) * | 2020-04-30 | 2021-11-01 | Necプラットフォームズ株式会社 | Fault processor, fault processing method and computer program |
JP7007025B2 (en) | 2020-04-30 | 2022-01-24 | Necプラットフォームズ株式会社 | Fault handling equipment, fault handling methods and computer programs |
JP2023074564A (en) * | 2021-11-18 | 2023-05-30 | 三菱電機株式会社 | Control device |
JP7329579B2 (en) | 2021-11-18 | 2023-08-18 | 三菱電機株式会社 | Control device |
Also Published As
Publication number | Publication date |
---|---|
JP7057168B2 (en) | 2022-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102279775B (en) | Method for processing failure of hard disk under Linux system | |
US10095576B2 (en) | Anomaly recovery method for virtual machine in distributed environment | |
CN103955417A (en) | Computer hard disc data detecting equipment and method | |
CN112732477B (en) | Method for fault isolation by out-of-band self-checking | |
WO2009110329A1 (en) | Failure analysis device, failure analysis method, and recording medium | |
CN104320308A (en) | Method and device for detecting anomalies of server | |
JP2019159475A (en) | Failure detection device and failure analysis method | |
JP2019057139A (en) | Operation management system, monitoring server, method and program | |
US20190196897A1 (en) | Influence range specifying method, influence range specifying apparatus, and storage medium | |
JP2006268208A (en) | Failure diagnosing circuit, information processor equipped with the same, failure diagnosing system, and failure diagnosing program | |
JP2014021577A (en) | Apparatus, system, method, and program for failure prediction | |
US8451019B2 (en) | Method of detecting failure and monitoring apparatus | |
CN103995759B (en) | High-availability computer system failure handling method and device based on core internal-external synergy | |
CN105224416B (en) | Restorative procedure and related electronic device | |
CN115102838B (en) | Emergency processing method and device for server downtime risk and electronic equipment | |
JP2018180982A (en) | Information processing device and log recording method | |
JP5605672B2 (en) | Voltage monitoring system and voltage monitoring method | |
US7089484B2 (en) | Dynamic sparing during normal computer system operation | |
WO2011051999A1 (en) | Information processing device and method for controlling information processing device | |
JP2020038525A (en) | Abnormality detecting device | |
US20220342788A1 (en) | Anomaly location estimating apparatus, method, and program | |
JP5867962B2 (en) | Information processing apparatus and failure diagnosis method | |
EP2698716A2 (en) | Failure detecting device, failure detecting method, and failure detecting program | |
JP2015162030A (en) | Fault indication apparatus, fault indication method and fault indication program | |
JP2013161211A (en) | Information processing apparatus, failure diagnosis control apparatus, failure determination method, and failure determination program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210215 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20211110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211208 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220407 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7057168 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |