JP2009211658A - Failure detection device, failure detection method and program therefor - Google Patents
Failure detection device, failure detection method and program therefor Download PDFInfo
- Publication number
- JP2009211658A JP2009211658A JP2008056746A JP2008056746A JP2009211658A JP 2009211658 A JP2009211658 A JP 2009211658A JP 2008056746 A JP2008056746 A JP 2008056746A JP 2008056746 A JP2008056746 A JP 2008056746A JP 2009211658 A JP2009211658 A JP 2009211658A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- determination
- score
- monitoring
- threshold value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、被監視装置からの監視情報に基づいて被監視装置の障害を検知し通報する障害検知装置、障害検知方法及びプログラムに関する。 The present invention relates to a failure detection device, a failure detection method, and a program for detecting and reporting a failure of a monitored device based on monitoring information from the monitored device.
システムの運用管理においては、システムを構成するコンピュータ等の被監視装置から採取した監視情報に基づいて被監視装置の障害を検知する方法が採用されている。 In system operation management, a method of detecting a failure of a monitored device based on monitoring information collected from the monitored device such as a computer constituting the system is adopted.
このような障害検知においては、一般的に、被監視装置のソフトウェア又はハードウェアに関する個々の監視項目についての監視情報を採取し、個々の監視項目毎に、障害(問題)が発生しているかどうかを判断する手法が用いられている。 In such failure detection, generally, monitoring information about individual monitoring items related to software or hardware of the monitored device is collected, and whether or not a failure (problem) has occurred for each monitoring item. A method is used to determine the above.
例えば、この種の障害監視装置の関連技術が特許文献1に開示されている。この特許文献1には、監視対象(項目)の障害状態にあらかじめ重み付けを行っておき、監視対象について障害が発生した場合でもその障害より大きな重み付けの障害が以前に通知されている場合には通知を抑制して、不要な障害通報を抑止させる技術が記載されている。
システムの運用管理においては、個々の監視項目についての監視情報から検知する障害単独では大きな問題とならない場合でも、複数の監視項目に対する障害が複合的に組み合わさった場合に緊急性の高い重大な問題が発生する可能性ある。 In system operation management, even if a failure detected from the monitoring information for each monitoring item alone does not cause a major problem, a serious problem with a high degree of urgency occurs when a combination of failures for multiple monitoring items is combined. May occur.
上述した特許文献1等に記載される関連技術の障害検知方法では、個々の管理項目についての監視情報に基づいて監視項目毎に障害を検知しているため、上述したような複数の監視項目が複合的に組み合わさって重大な問題が発生した場合に、原因の特定が困難であるという問題があった。特に、システムの監視対象(監視項目)が多くなればなるほど原因の究明に時間がかかるという問題があった。 In the related art failure detection method described in Patent Document 1 and the like described above, since a failure is detected for each monitoring item based on the monitoring information about each management item, there are a plurality of monitoring items as described above. When a serious problem occurs in combination, there is a problem that it is difficult to identify the cause. In particular, there is a problem that as the number of system monitoring targets (monitoring items) increases, it takes time to investigate the cause.
(発明の目的)
本発明の目的は、個々の監視項目についての監視情報だけでなく、複数の監視項目の組み合わせについての複合的な情報に基づいて、監視項目が複合的に組み合わさって発生する障害を検出することが可能な障害検知装置、障害検知方法及びそのプログラムを提供することにある。
(Object of invention)
An object of the present invention is to detect a failure caused by a combination of monitoring items based on not only monitoring information about individual monitoring items but also composite information about a combination of a plurality of monitoring items. It is an object of the present invention to provide a failure detection device, a failure detection method, and a program thereof.
本発明による障害検知装置は、被監視対象から取得した所定の監視項目に対する監視情報に基づいて、被監視対象の障害の発生を検知する障害検知装置であって、監視項目に対する監視情報毎に、所定のルール条件に従って点数を付与する手段と、複数の監視項目のグループ毎に、点数を累積する点数累積手段と、累積した点数と、グループ毎に設定した閾値とを比較することにより、被監視対象の障害の有無を判定する判定手段とを含む。 The failure detection device according to the present invention is a failure detection device that detects the occurrence of a failure of a monitored target based on monitoring information for a predetermined monitoring item acquired from the monitored target, and for each monitoring information for the monitored item, By comparing the means for assigning points according to a predetermined rule condition, the point accumulating means for accumulating points for each group of a plurality of monitoring items, and the threshold value set for each group to be monitored Determination means for determining the presence or absence of a target failure.
本発明による障害検知方法は、被監視対象から取得した所定の監視項目に対する監視情報に基づいて、被監視対象の障害の発生を検知する障害検知方法であって、監視項目に対する監視情報毎に、所定のルール条件に従って点数を付与するステップと、複数の監視項目のグループ毎に、点数を累積するステップと、累積した点数と、グループ毎に設定した閾値とを比較することにより、被監視対象の障害の有無を判定する判定ステップとを含む。 The failure detection method according to the present invention is a failure detection method for detecting the occurrence of a failure of a monitored target based on monitoring information for a predetermined monitoring item acquired from the monitored target, and for each monitoring information for the monitored item, A step of assigning points according to a predetermined rule condition, a step of accumulating points for each group of a plurality of monitoring items, and comparing the accumulated points with a threshold set for each group, A determination step of determining the presence or absence of a failure.
本発明によるプログラムは、コンピュータ上で実行され、被監視対象から取得した所定の監視項目に対する監視情報に基づいて、被監視対象の障害の発生を検知するプログラムであって、コンピュータに、監視項目に対する監視情報毎に、所定のルール条件に従って点数を付与する処理と、複数の監視項目のグループ毎に、点数を累積する処理と、累積した点数と、グループ毎に設定した閾値とを比較することにより、被監視対象の障害の有無を判定する判定処理を、実行させる。 A program according to the present invention is a program that is executed on a computer and detects occurrence of a failure of a monitored object based on monitoring information for a predetermined monitoring item acquired from the monitored object. By comparing the process of assigning points according to a predetermined rule condition for each monitoring information, the process of accumulating points for each group of a plurality of monitoring items, and the threshold value set for each group A determination process for determining the presence or absence of a failure to be monitored is executed.
本発明によれば、監視項目が複合的に組み合わさって発生する障害を検出することが可能となる。
According to the present invention, it is possible to detect a failure that occurs due to a combination of monitoring items.
次に、本発明の実施の形態について図面を参照して詳細に説明する。 Next, embodiments of the present invention will be described in detail with reference to the drawings.
(第1の実施の形態)
図1を参照すると、本発明の第1の実施の形態による障害検知通報システムは、障害監視を行う対象である被監視装置100と、被監視装置100の障害を検知して通報する障害検知通報装置10を備えて構成される。
(First embodiment)
Referring to FIG. 1, the failure detection notification system according to the first exemplary embodiment of the present invention is a monitored
被監視装置100は、コンピュータ、ルータ、ハブ、ファイアウオール装置などの機器であり、障害検知通報装置10は、被監視装置100から収集した監視情報に基づいて障害の検知と通報までの処理を行う装置である。被監視装置100と障害検知通報装置10は、互いにローカルエリアネットワーク(LAN)やインターネットを介して相互に接続さている。
The monitored
被監視装置100は、被監視装置100上のハードウェア、ソフトウェアに関する監視情報を採取する監視情報採取部101を有している。この監視情報採取部101は、プログラムによって実現され、例えばハードウェア、ソフトウェアに関する監視情報をOS(オペレーションシステム)の機能を利用して採取する機能を有する。
The monitored
監視情報採取部101が監視情報には、被監視装置100の温度、電圧、ファン、CPU、メモリ、ディスク(DBテーブル)、ネットワーク、プロセス、メッセージログ(アプリケーションログ、イベントログ、システムログ)、死活監視等に関する情報が含まれる。
Monitoring information collected by the monitoring
障害検知通報装置10は、監視情報取得部11と、監視情報記録処理部12と、点数累積処理部13と、障害判定処理部14と、通報実行部15と、点数付与ルールテーブル21と、データ記憶部22と、問題判定テーブル23と、点数更新用情報テーブル24と、累積点数記憶部25を含んで構成される。
The failure
監視情報取得部11は、監視情報採取部101で採取した被監視装置100の監視情報をLAN、インターネット等を通じて取得する機能を有する。
The monitoring information acquisition unit 11 has a function of acquiring monitoring information of the monitored
監視情報記録処理部12は、監視情報取得部11で取得した監視情報を受け取り、点数付与ルールテーブル21を参照して監視情報に累積対象フラグと点数を付け加えると共に、そのデータをデータ記憶部22に格納する機能を有する。
The monitoring information
点数累積処理部13は、監視情報記録処理部12で監視情報に付加された点数を設定された所定時間の間、一時記憶領域として機能する累積点数記憶部25に加算していく機能を有する。
The score
障害判定処理部14は、監視情報記録処理部12又は点数累積処理部13から送付された累積点数を、問題判定テーブル23の閾値点数と比較することによって、障害発生の有無を検知し、障害有りの判定をした場合に、通報方法を決定する機能を有する。また、障害判定処理部14は、点数更新用情報テーブル24を参照することによって、誤った判定がなされた場合に問題判定テーブル23中の閾値点数の補正を行う機能も有している。
The failure
通報実行部15は、障害判定処理部14で決定した通報方法に従って通報を実行する機能を有する。
The
点数付与ルールテーブル21は、「サーバ(システム名)」、「監視種類」、「ルール条件」、「累積対象フラグ」、「累積グループ名」、「付与点数」のフィールドを有する。 The score assignment rule table 21 has fields of “server (system name)”, “monitoring type”, “rule condition”, “cumulative target flag”, “cumulative group name”, and “granted score”.
サーバ(システム名)には、被監視装置100のサーバ名又はシステム名が登録されている。
In the server (system name), the server name or system name of the monitored
監視種類には、温度、電圧、ファン(回転数)、CPU、メモリ、ディスク(DBテーブル)、ネットワーク、プロセス、メッセージログ(アプリケーションログ、イベントログ、シスログ)、死活監視等の監視項目の種類が登録されている。 Types of monitoring include types of monitoring items such as temperature, voltage, fan (rotation speed), CPU, memory, disk (DB table), network, process, message log (application log, event log, syslog), and life / death monitoring. It is registered.
ルール条件には、監視種類で指定された監視項目の状態に対する閾値条件や文字列条件が登録されている。 In the rule condition, a threshold condition and a character string condition for the state of the monitoring item specified by the monitoring type are registered.
閾値条件としては、上限又は下限の一方、或いは上限と下限の両方を指摘することが可能である。例えば、CPUの負荷率の場合であれば、「上限:80%以上」、「下限:20%以下」、或いは「上限:80%以上、下限:20%以下」のように指定することができる。また、文字列条件としては、メッセージログ等に含まれる所定の文字列が指定される。 As the threshold condition, it is possible to point out either the upper limit or the lower limit, or both the upper limit and the lower limit. For example, in the case of the load factor of the CPU, it can be specified as “upper limit: 80% or more”, “lower limit: 20% or less”, or “upper limit: 80% or more, lower limit: 20% or less”. . As the character string condition, a predetermined character string included in a message log or the like is designated.
累積対象フラグには、当該監視種類で指定された監視項目が点数を累積する対象であるかどうかを示すフラグとして、YES又はNOが登録されている。 In the accumulation target flag, YES or NO is registered as a flag indicating whether or not the monitoring item specified by the monitoring type is a target for accumulating points.
累積グループ名には、点数の累積を行う単位となるグループを示す名称が登録されている。例えば、ある監視項目単独では重大な事態が発生しないが、他の監視項目と組み合わさった場合に重大な事態が発生すると想定できる場合、その組み合わせに含まれる複数の監視項目を1つのグループとし、そのグループを累積グループ名で区別する。 In the cumulative group name, a name indicating a group that is a unit for accumulating points is registered. For example, if a certain monitoring item alone does not cause a serious situation, but it can be assumed that a serious situation will occur when combined with other monitoring items, a plurality of monitoring items included in the combination are grouped together, The group is distinguished by the cumulative group name.
例えば、監視項目のうち、「温度」、「電圧」、「ファン」をグループとして、累積グループ名を「AA1」のように登録してある。 For example, among the monitoring items, “temperature”, “voltage”, and “fan” are registered as a group, and the cumulative group name is registered as “AA1”.
監視項目が累積対象でない場合(累積グループに属さない場合)には、累積グループ名に、「default」の文字列が登録されている。 When the monitoring item is not the accumulation target (when it does not belong to the accumulation group), the character string “default” is registered in the accumulation group name.
付与点数には、監視項目又は累積グループ毎に付与する点数(1、2、3、・・・)が指定されている。 The number of points (1, 2, 3,...) To be assigned for each monitoring item or cumulative group is designated as the number of points to be assigned.
データ記憶部22の記録情報は、「ID」、「サーバ(システム名)」、「監視種類」、「発生時刻」、「監視情報詳細」、「累積対象フラグ」、「点数」のフィールドを有する。
The recorded information in the
IDには、監視情報記録処理部12が付与した監視情報を一意に識別する識別番号(例えば、ID1、ID2、ID3、・・・)を登録する。
In the ID, an identification number (for example, ID1, ID2, ID3,...) That uniquely identifies the monitoring information assigned by the monitoring information
発生時刻には、監視情報が発生した時刻が指定され、監視情報詳細には、監視情報の詳細な内容を登録する。 The time at which the monitoring information is generated is specified as the occurrence time, and the detailed contents of the monitoring information are registered in the monitoring information details.
点数には、点数付与ルールテーブル21に基づいて付与された点数を登録する。 In the score, the score given based on the score granting rule table 21 is registered.
サーバ(システム名)、監視種類、累積対象フラグについては、点数付与ルールテーブル21の対応するフィールドと同様である。 The server (system name), the monitoring type, and the accumulation target flag are the same as the corresponding fields in the score assignment rule table 21.
問題判定テーブル23は、「累積グループ名」、「閾値点数」、「問題ランク」、「通報方法」のフィールドを有する。累積グループ名については、上述した通りである。 The problem determination table 23 includes fields of “cumulative group name”, “threshold score”, “problem rank”, and “report method”. The cumulative group name is as described above.
閾値点数には、監視項目又は累積グループ毎の点数(累積点数)の閾値が記載されている。この閾値点数には、重要度の違いに応じて幾つかの段階に分けた閾値を設定することが可能である。
障害判定処理部14は、監視項目又は累積グループの点数又は累積点数が、閾値点数に登録された値を上回る場合に、被監視装置100に障害が発生している(通報の必要有り)と判定する。
In the threshold score, a threshold of the score (cumulative score) for each monitoring item or cumulative group is described. In this threshold score, a threshold divided into several stages can be set according to the difference in importance.
The failure
問題ランクには、上記点数の閾値に応じた問題の重要度(例えば、重要度が高い順に、A、B、C・・・等)が記載されている。 The problem rank describes the importance of the problem according to the score threshold (for example, A, B, C... In descending order of importance).
通報方法には、パトランプの点灯、電子メールによる通知、他のアプリケーションへの通知、電話による通知又はそれらの組み合わせ等の問題の通報方法が記載されている。 The reporting method includes a reporting method for problems such as lighting of a patrol lamp, notification by e-mail, notification to another application, notification by telephone, or a combination thereof.
点数更新用情報テーブル24は、「累積グループ名」、「待機時間」、「サーバ(システム名)」、「監視種類」、「ルール条件」、「補正係数」のフィールドを有する。この点数更新用情報テーブル24の累積グループ、サーバ(システム名)、監視種類、ルール条件のフィールドについては、点数付与ルールテーブル21の各フィールドと同じデータが記載され、さらに、以下の待機時間と、補正係数のフィールドが追加されている。 The score update information table 24 has fields of “cumulative group name”, “standby time”, “server (system name)”, “monitoring type”, “rule condition”, and “correction coefficient”. For the cumulative group, server (system name), monitoring type, and rule condition fields of the score update information table 24, the same data as each field of the score assignment rule table 21 is described. A correction factor field has been added.
待機時間には、更新用情報の待ち合わせ時間が指定されている。 The waiting time for the update information is designated as the waiting time.
補正係数には、問題判定テーブル23の「閾値点数」フィールドの点数を補正するための係数が記載される。 In the correction coefficient, a coefficient for correcting the score in the “threshold score” field of the problem determination table 23 is described.
累積点数記憶部25は、「累積グループ名」、「累積点数」、「ID」のフィールドを有する。累積グループ名については、上述した通りである。
The cumulative
累積点数には、一定の設定時間の間に加算された点数が記載される。 In the cumulative score, the score added during a certain set time is described.
IDには、加算の対象になった監視情報のIDが記載される。 In the ID, the ID of the monitoring information to be added is described.
次に、上記障害検知通知装置10のハードウェア構成例について、図10を参照して説明する。
Next, a hardware configuration example of the failure
図10を参照すると、障害検知通知装置10は、一般的なコンピュータ装置と同様のハードウェア構成によって実現することができ、CPU(Central Processing Unit)401、RAM(Random Access Memory)等のメインメモリであり、データの作業領域やデータの一時退避領域に用いられる主記憶部402、ネットワーク600を介してデータの送受信を行う通信部403、外部装置と接続してデータの送受信を行う入出力インタフェース部404、ROM(Read Only Memory)、磁気ディスク、半導体メモリ等の不揮発性メモリから構成されるハードディスク装置である補助記憶部405(例えば、点数付与ルールテーブル21、データ記憶部22、問題判定テーブル23、点数更新用情報テーブル24、累積点数記憶部25は、この補助記憶部405上に構築される)、本情報処理装置の上記各構成要素を相互に接続するシステムバス406、ディスプレイ装置等の出力装置407及びキーボード等の入力装置408を備えている。
Referring to FIG. 10, the failure
本実施の形態による障害検知通知装置10は、障害の検知と通報を実行するプログラムを組み込んだ、LSI(Large Scale Integration)等のハードウェア部品である回路部品を実装することにより、その動作をハードウェア的に実現することは勿論として、監視情報取得部11、監視情報記録処理部12、点数累積処理部13、障害判定処理部14、通報実行部15の各機能を提供するプログラムを、補助記憶部405に格納し、そのプログラムを主記憶部402にロードしてCPU401で実行することにより、ソフトウェア的に実現することも可能である。
The failure
(実施の形態による動作)
次に、上記のように構成される本実施の形態による障害検知通知装置10の動作について、図1、図2〜図6及び図7を参照して説明する。図7、図8は、障害検知通知装置10の動作内容を説明するフローチャートである。
(Operation according to the embodiment)
Next, the operation of the failure
図7を参照すると、監視情報取得部11が、採取した被監視装置100の監視情報を監視情報採取部101からLAN、インターネットを介して取得し、取得情報に不正がないかを確認した後、監視情報記録処理部12に渡す(ステップS101)。
Referring to FIG. 7, after the monitoring information acquisition unit 11 acquires the collected monitoring information of the monitored
監視情報記録処理部12は、点数付与ルールテーブル21を参照して、「サーバ(システム)名」、「監視種類」、「ルール条件」に合致するかどうかを監視情報取得部11から渡された監視情報1件1件に対して照合する(ステップS102)。
The monitoring information
条件に合致した場合、監視情報記録処理部12は、監視情報に、点数付与ルールテーブル21に設定している「累積対象フラグ」(YES又はNO)、「累積グループ名」、「付与点数」の情報を付加する。
When the condition is met, the monitoring information
条件に合致するものがなかった場合には、監視情報に、「累積対象フラグ」(=NO)、「累積グループ」(=default)、「付与点数」の情報を付加する。 If there is no item that matches the condition, information of “accumulation target flag” (= NO), “accumulation group” (= default), and “granting number” is added to the monitoring information.
点数付与ルールテーブル21との照合が終了すると、監視情報記録処理部12は、その監視情報に関して、ID、サーバ(システム)名、監視種類、発生時刻、監視情報詳細、累積対象フラグ、点数の情報を、図3に示すように記録情報としてデータ記録部22に登録する(ステップS103)。
When the collation with the score assignment rule table 21 is completed, the monitoring information
また、監視情報記録処理部12は、付加された「累積対象フラグ」を参照して(ステップS104)、累積対象フラグ=YESであればデータ記録部22に記録した情報を点数累積処理部13へ送付し(ステップS105)、累積対象フラグ=NOの場合には、情報を障害判定処理部14へ送付する(ステップS106)。
The monitoring information
点数累積処理部13は、送付された記録情報を受け取ると、累積グループ名単位で累積点数記憶部25の記録情報と同じ累積グループ名に対応する累積点数に、記録情報に付与された点数を加算する(ステップS107〜S109)。
Upon receiving the sent recording information, the score
点数累積処理部13による点数の加算は、予め設定した一定の設定時間間隔で行う。この設定時間については、監視する被監視装置100の種類や稼動状況等に応じて任意の時間を予め設定するものとする。
The addition of the points by the point
点数累積処理部13は、最初に情報を受け取ったときから累積グループ名毎に設定時間のカウントを開始し(ステップS107)、設定時間の間待ち合わせを行い、カウントが終了するまで(ステップS109)、記録情報に付加された点数を累積点数記憶部25の「累積点数」に累積していく(ステップS108)。
The score
カウントが終了すると、累積点数記憶部25の累積点数と、カウント開始から終了までに到着した記録情報を障害判定処理部14へ送付する(ステップS110)。
When the counting is completed, the cumulative score in the cumulative
なお、設定時間のカウントが終了後、新たな情報を受け取った場合、累積点数記憶部25は、受け取り次第再び設定時間のカウントを開始して、点数を累積する。
When new information is received after the set time has been counted, the accumulated
障害判定処理部14では、累積点数を受け取ると、問題判定テーブル23に基づいて、通報の必要性、問題の重要度、通報方法を判定する(ステップS111)。
When receiving the cumulative score, the failure
障害判定処理部14による判定処理の詳細について以下に説明する。
(1)記録情報が累積対象フラグ=NOである場合(監視情報記録処理部12から送付された記録情報の場合)
問題判定テーブル23の「累積グループ名」=defaultのフィールドを参照して、その「閾値点数」と送付された記録情報に記録されている「点数」とを比較して、「点数」が「閾値点数」を上回っている場合に被監視装置100に障害が発生していると判定し、通報の必要有りの決定をする。
(2)情報が累積対象フラグ=YESである場合(点数累積処理部13から送付された記録情報の場合)
問題判定テーブル23の該当する「累積グループ名」を参照して、対応する「閾値点数」と点数累積処理部13から送られてきた「累積点数」とを比較して、「累積点数」が「閾値点数」を上回っている場合に被監視装置100に障害が発生していると判定し、通報の必要有りの決定をする。
Details of the determination processing by the failure
(1) When the recording information is the accumulation target flag = NO (in the case of the recording information sent from the monitoring information recording processing unit 12)
Referring to the field of “cumulative group name” = default in the problem determination table 23, the “threshold score” is compared with the “score” recorded in the sent record information, and the “score” is set to “threshold value”. If it exceeds the “score”, it is determined that a failure has occurred in the monitored
(2) When the information is the accumulation target flag = YES (in the case of recording information sent from the point accumulation processing unit 13)
With reference to the corresponding “cumulative group name” in the problem determination table 23, the corresponding “threshold score” is compared with the “cumulative score” sent from the score
通報の必要有りと決定した場合、障害判定処理部14は、問題判定テーブル23を参照し、「問題ランク」に記載された重要度と、「通報方法」に記載された通報方法を指定し、通報実行部15に対して通報を指示する。
When it is determined that the report is necessary, the failure
例えば、重要度が低い場合には、通報方法としてパトランプの点灯を指定し、重要度が高い場合には、通報方法としてパトランプの点灯に加えて、電子メールによる通報を指定することが考えられる。 For example, when the importance level is low, it is possible to designate the lighting of the patrol lamp as the reporting method, and when the importance level is high, it is possible to designate the reporting by e-mail in addition to the lighting of the patrol lamp as the reporting method.
なお、上記何れの場合にも、点数又は累積点数が問題判定テーブル23を「閾値点数」を下回っている場合には、障害が発生していないと判定し、通報の必要無しと決定し、通報は行わない。 In any of the above cases, if the score or the cumulative score is below the “threshold score” in the problem determination table 23, it is determined that no failure has occurred, and it is determined that there is no need for notification. Do not do.
障害判定処理部14から通報の指示を受けると、通報実行部15が指示された通報方法で通報を実施する(ステップS112)。
When receiving a notification instruction from the failure
その際、電子メール、他アプリケーションへの通知、電話での通報に関しては、監視情報についてデータ記録部22に記録した記録情報の内容を添付して通知を行う。さらに、点数の累積対象である監視情報に関しては、累積グループに含まれる全ての監視項目の内容を添付して通知する。
At that time, with respect to e-mail, notification to other applications, and telephone notification, the contents of the recorded information recorded in the
また、パトランプの点灯によって障害を通報するようにしてもよい。さらに、パトランプの点灯は、電子メールや他アプリケーションへの通知と併せて、行うようにしてもよい。 Moreover, you may make it report a failure by lighting of a patrol lamp. Furthermore, the patrol lamp may be turned on in conjunction with e-mail or notification to other applications.
次に、障害判定処理部14による問題判定テーブル23の「閾値点数」の補正処理について、図8及び図9を参照して説明する。
Next, correction processing of the “threshold score” of the problem determination table 23 by the failure
まず、障害有り(通報の必要有り)の判定が誤判定であった場合の補正処理について、図8のフローチャートを参照して説明する。 First, a correction process in the case where the determination that there is a failure (need to report) is an erroneous determination will be described with reference to the flowchart of FIG.
障害判定処理部14は、障害有り(通報の必要有り)と判定し通報を実施した後、点数更新用情報テーブル24を参照して「待機時間」に指定された時間の間、想定される障害が発生したかどうかを、すなわち、通報した累積グループ名と同じ累積グループ名の記録情報が、待機時間の間に点数累積処理部13から到着したかどうかを判定する(ステップS201〜203)。
The failure
通報した累積グループ名と同じ累積グループ名の記録情報が、待機時間の間に到着した場合には、障害有り(通報の必要有り)の判定が適切であったと判断できるので、閾値点数の補正処理を行わない。 If the recorded information of the same cumulative group name as the reported cumulative group name arrives during the waiting time, it can be determined that the determination of fault (need to report) is appropriate, so the threshold score correction process Do not do.
通報した累積グループ名と同じ累積グループ名の記録情報が、待機時間の間に到着しない場合には、障害有り(通報の必要有り)の判定が誤判定であったと判断できるので、点数更新用情報テーブル24の同じ累積グループ名に対応する「補正係数」を使用して算出した補正点数αを問題判定テーブル23の「閾値点数」フィールドに加算することによって、「閾値点数」の点数を補正する(ステップS204)。 If the recorded information of the same cumulative group name as the reported cumulative group name does not arrive during the waiting time, it can be determined that the determination of fault (need to be reported) was an erroneous determination, so the information for updating the score The score of the “threshold score” is corrected by adding the correction score α calculated using the “correction coefficient” corresponding to the same cumulative group name in the table 24 to the “threshold score” field of the problem determination table 23 ( Step S204).
この補正点数αは、例えば下記の式に基づいて算出する。
補正点数α=(X−Y)*F
ここで、X:累積点数記憶部25の「累積点数」の値、Y:問題判定テーブル23の「閾値点数」の値、F:点数更新用情報テーブル24の「補正係数」の値である。
The correction score α is calculated based on the following formula, for example.
Number of correction points α = (X−Y) * F
Here, X is the value of “cumulative score” in the cumulative
次に、障害無し(通報の必要無し)の判定が誤判定であった場合の補正処理について、図9のフローチャートを参照して説明する。 Next, correction processing when the determination of no failure (no need for notification) is an erroneous determination will be described with reference to the flowchart of FIG.
障害判定処理部14は、障害無し(通報の必要無し)と判定した後、点数更新用情報テーブル24に登録している障害が発生したかどうかを判定する。すなわち、障害判定処理部14は、点数累積処理部13から監視情報が到着すると、到着した監視情報が、点数更新用情報テーブル24の同じ累積グループ名のルール条件に合致するかどうかを判定する(ステップS301)。
After determining that there is no failure (no need for notification), the failure
到着した監視情報が、点数更新用情報テーブル24のルール条件に合致しない場合には、点数更新用情報テーブル24に登録している障害は発生していない(障害無し(通報の必要無し)の判定が適切)と判断し、処理を終了する。 If the arrived monitoring information does not match the rule conditions of the score update information table 24, the failure registered in the score update information table 24 has not occurred (no failure (no report required) determination) And the process is terminated.
到着した監視情報が、点数更新用情報テーブル24の同じ累積グループ名のルール条件に合致する場合、点数累積処理部13において点数の累積(図7のステップS107〜S109)が行われているかどうかを判定する(ステップS302)。 When the arrived monitoring information matches the rule condition of the same cumulative group name in the score update information table 24, it is determined whether or not the score is accumulated in the score accumulation processing unit 13 (steps S107 to S109 in FIG. 7). Determination is made (step S302).
点数の累積が行われている場合には、設定時間のカウントが終了するまで待ち合わせる。 If the points have been accumulated, the process waits until the set time has been counted.
点数の累積が行われていない場合には、さらに、点数更新用情報テーブル24の「待機時間」の待ち合わせ中であるかを判定する(ステップS303)。待機時間の待ち合わせ中であれば、障害有り(通報の必要有り)と判定した場合であるので、処理を終了する。 If the points are not accumulated, it is further determined whether or not the “waiting time” in the point update information table 24 is being waited for (step S303). If the waiting time is waiting, it is determined that there is a failure (need to report), so the processing is terminated.
待機時間の待ち合わせ中でなければ、障害無し(通報の必要無し)の判定を行ったにもかかわらず、点数更新用情報テーブル24に登録している障害が発生したと判断することができる。すなわち、障害無しの判定が誤判定であったと判断できるので、点数更新用情報テーブル24の「補正係数」を参照して算出した補正点数βを、問題判定テーブル23の「閾値点数」フィールドから減算することにより、「閾値点数」の点数を補正する(ステップS304)。 If it is not waiting for the waiting time, it can be determined that a failure registered in the score update information table 24 has occurred despite the determination of no failure (no need for notification). That is, since it can be determined that the determination of no failure is an erroneous determination, the correction score β calculated with reference to the “correction coefficient” in the score update information table 24 is subtracted from the “threshold score” field of the problem determination table 23. As a result, the score of “threshold score” is corrected (step S304).
この補正点数βは、例えば下記の式に基づいて算出する。
補正点数β = Y * F
This correction score β is calculated based on the following equation, for example.
Number of correction points β = Y * F
(第1の実施の形態による効果)
本実施の形態によれば、監視項目に対する監視情報毎に、点数付与ルールテーブル21のルール条件に従って点数を付与すると共に、複数の監視項目の組み合わせたグループ毎に、点数を累積し、累積した点数に基づいて障害の有無を検知するため、監視項目が複合的に組み合わさって発生する障害を検出し、通報することが可能となる。
(Effects of the first embodiment)
According to this embodiment, for each piece of monitoring information for a monitoring item, points are assigned according to the rule conditions of the point assignment rule table 21, and the points are accumulated for each group of a plurality of monitoring items combined. Therefore, it is possible to detect and report a failure that occurs when monitoring items are combined in combination.
また、監視項目のグループ毎に、障害の重要度に応じた通報方法を設定しておくことにより、障害の重要度に応じた適切な通報方法を選択することができる。 In addition, by setting a notification method according to the importance of the failure for each monitoring item group, an appropriate notification method according to the importance of the failure can be selected.
以上好ましい実施の形態と実施例をあげて本発明を説明したが、本発明は必ずしも、上記実施の形態及び実施例に限定されるものでなく、その技術的思想の範囲内において様々に変形して実施することができる。 Although the present invention has been described with reference to the preferred embodiments and examples, the present invention is not necessarily limited to the above-described embodiments and examples, and various modifications can be made within the scope of the technical idea. Can be implemented.
上記の実施の形態は、障害の検知と通報を行う障害検知通報装置について説明したが、上述した方法によって障害の検知だけを行い、通報については、通報実行部15として機能する外部の装置に通報を指示する構成とすることも可能である。
In the above embodiment, the failure detection notification device that detects and reports a failure is described. However, only the failure detection is performed by the above-described method, and the notification is sent to an external device that functions as the
10:障害検知通報装置
11: 監視情報取得部
12:監視情報記録処理部
13:点数累積処理部
14:障害判定処理部
15:通報実行部
21:点数付与ルールテーブル
22:データ記憶部22
23:問題判定テーブル
24:点数更新用情報テーブル
25:累積点数記憶部
100:被監視装置
101:監視情報採取部
10: Failure detection notification device 11: Monitoring information acquisition unit 12: Monitoring information recording processing unit 13: Score accumulation processing unit 14: Failure determination processing unit 15: Notification execution unit 21: Score assignment rule table 22:
23: Problem determination table 24: Score update information table 25: Cumulative score storage unit 100: Monitored device 101: Monitoring information collection unit
Claims (30)
前記監視項目に対する監視情報毎に、所定のルール条件に従って点数を付与する手段と、
複数の前記監視項目のグループ毎に、前記点数を累積する点数累積手段と、
累積した点数と、前記グループ毎に設定した閾値とを比較することにより、前記被監視対象の障害の有無を判定する判定手段と
を備えることを特徴とする障害検知装置。 A failure detection device that detects the occurrence of a failure in the monitored target based on monitoring information for a predetermined monitoring item acquired from the monitored target,
Means for assigning points according to a predetermined rule condition for each monitoring information for the monitoring item;
Point accumulation means for accumulating the points for each group of a plurality of the monitoring items;
A failure detection apparatus comprising: a determination unit that determines whether there is a failure of the monitored target by comparing the accumulated score with a threshold set for each group.
前記判定手段は、前記障害有りと判定した場合に、前記グループの種類毎に設定された通報方法を選択し、前記通報実行手段に指示することを特徴とする請求項1に記載の障害検知装置。 Provided with a report execution means for executing a report when the failure is determined;
The failure detection apparatus according to claim 1, wherein when the determination unit determines that the failure is present, the determination unit selects a notification method set for each type of the group and instructs the notification execution unit. .
前記判定手段は、前記累積した点数が上回った閾値に応じて通報方法を選択して、前記通報実行手段に指示することを特徴とする請求項2に記載の障害検知装置。 Different notification methods are set for each threshold set in stages.
3. The failure detection apparatus according to claim 2, wherein the determination unit selects a notification method according to a threshold value where the accumulated score exceeds, and instructs the notification execution unit.
前記点数を付与する手段は、前記監視情報を取得すると、前記ルールテーブルを参照し、前記監視情報に示される前記監視項目の値が前記ルール条件を満たし、かつ、累積対象フラグに累積対象であることが示されている場合に、前記監視情報に、前記ルールテーブルに登録されている点数を付与することを特徴とする請求項1から請求項6の何れかに記載の障害検知装置。 For each monitoring item, a rule condition indicating whether or not points are assigned, an accumulation target flag indicating whether or not points are accumulated, a group name, and a rule table in which points to be assigned are registered,
When the monitoring information is acquired, the means for assigning the score refers to the rule table, the value of the monitoring item indicated in the monitoring information satisfies the rule condition, and the accumulation target flag is the accumulation target. The failure detection apparatus according to any one of claims 1 to 6, wherein, in the case where the information is indicated, the score registered in the rule table is added to the monitoring information.
前記点数累積手段は、前記監視情報に付与された点数を、前記累積点数記憶手段の累積点数に累積し、
前記判定手段は、前記累積点数記憶手段の前記累積点数を、前記問題判定テーブルの前記閾値と比較することで、障害の有無を判定し、障害有りの判定の場合に、前記問題ランクの重要度に応じて前記通報方法を選択することを特徴とする請求項2から請求項7の何れかに記載の障害検知装置。 Cumulative score storage means for recording the cumulative score for each group, the threshold value, the problem rank indicating the importance of the failure, and at least one notification method according to the problem rank for each group Provide a problem determination table,
The score accumulating means accumulates the score given to the monitoring information to the accumulated score of the accumulated score storage means,
The determination means determines the presence or absence of a failure by comparing the cumulative score of the cumulative score storage means with the threshold value of the problem determination table. The failure detection device according to claim 2, wherein the notification method is selected according to the method.
前記判定手段は、
障害有りの判定をした場合、所定の待機時間の間に、障害有りの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得しない場合に、前記障害有りの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値に加算し、
障害無しの判定をした場合、障害無しの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得した場合に、前記障害無しの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値から減算することを特徴とする請求項4又は請求項5に記載の障害検知装置。 An update table in which a correction coefficient for correcting the threshold is registered for each group,
The determination means includes
When it is determined that there is a failure, the determination that there is a failure is determined to be an erroneous determination when the monitoring information for the monitoring item included in the group that has been determined to have a failure is not acquired during a predetermined waiting time. And adding the value calculated using the correction coefficient of the update table to the threshold value,
When it is determined that there is no failure, when the monitoring information for the monitoring item included in the group that is determined as having no failure is acquired, the determination that there is no failure is determined as an erroneous determination, and the update table is corrected. 6. The failure detection apparatus according to claim 4, wherein a value calculated using a coefficient is subtracted from the threshold value.
前記監視項目に対する監視情報毎に、所定のルール条件に従って点数を付与するステップと、
複数の前記監視項目のグループ毎に、前記点数を累積するステップと、
累積した点数と、前記グループ毎に設定した閾値とを比較することにより、前記被監視対象の障害の有無を判定する判定ステップと
を含むことを特徴とする障害検知方法。 A failure detection method for detecting the occurrence of a failure of the monitored object based on monitoring information for a predetermined monitoring item acquired from the monitored object,
For each piece of monitoring information for the monitoring item, assigning a score according to a predetermined rule condition;
Accumulating the score for each group of a plurality of the monitoring items;
A failure detection method comprising: a determination step of determining the presence or absence of a failure of the monitored target by comparing the accumulated score and a threshold set for each group.
前記判定ステップで、前記累積した点数が上回った閾値に応じて通報方法を選択して、前記通報ステップで、選択した通報方法によって通報を実行することを特徴とする請求項12に記載の障害検知方法。 Different notification methods are set for each threshold set in stages.
13. The fault detection according to claim 12, wherein in the determination step, a notification method is selected according to a threshold value where the accumulated score exceeds, and the notification is executed in the notification step by the selected notification method. Method.
前記点数を付与するステップにおいて、前記監視情報を取得すると、前記ルールテーブルを参照し、前記監視情報に示される前記監視項目の値が前記ルール条件を満たし、かつ、累積対象フラグに累積対象であることが示されている場合に、前記監視情報に、前記ルールテーブルに登録されている点数を付与することを特徴とする請求項11から請求項16の何れかに記載の障害検知方法。 For each monitoring item, a rule condition indicating whether or not points are assigned, an accumulation target flag indicating whether or not points are accumulated, a group name, and a rule table in which points to be assigned are registered,
In the step of assigning points, when the monitoring information is acquired, the value of the monitoring item indicated in the monitoring information satisfies the rule condition with reference to the rule table, and the accumulation target flag is an accumulation target The failure detection method according to any one of claims 11 to 16, wherein a point registered in the rule table is assigned to the monitoring information.
前記点数を累積するステップにおいて、前記監視情報に付与された点数を、前記累積点数記憶手段の累積点数に累積し、
前記判定ステップにおいて、前記累積点数記憶手段の前記累積点数を、前記問題判定テーブルの前記閾値と比較することで、障害の有無を判定し、障害有りの判定の場合に、前記問題ランクの重要度に応じて前記通報方法を選択することを特徴とする請求項12から請求項17の何れかに記載の障害検知方法。 Cumulative score storage means for recording the cumulative score for each group, the threshold value, the problem rank indicating the importance of the failure, and at least one notification method according to the problem rank for each group Provide a problem determination table,
In the step of accumulating the score, the score given to the monitoring information is accumulated in the accumulated score of the accumulated score storage means,
In the determination step, the cumulative score of the cumulative score storage means is compared with the threshold value of the problem determination table to determine whether there is a failure. The failure detection method according to any one of claims 12 to 17, wherein the notification method is selected in accordance with the method.
前記判定ステップにおいて、
障害有りの判定をした場合、所定の待機時間の間に、障害有りの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得しない場合に、前記障害有りの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値に加算し、
障害無しの判定をした場合、障害無しの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得した場合に、前記障害無しの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値から減算することを特徴とする請求項14又は請求項15に記載の障害検知方法。 An update table in which a correction coefficient for correcting the threshold is registered for each group,
In the determination step,
When it is determined that there is a failure, the determination that there is a failure is determined to be an erroneous determination when the monitoring information for the monitoring item included in the group that has been determined to have a failure is not acquired during a predetermined waiting time. And adding the value calculated using the correction coefficient of the update table to the threshold value,
When it is determined that there is no failure, when the monitoring information for the monitoring item included in the group that is determined as having no failure is acquired, the determination that there is no failure is determined as an erroneous determination, and the update table is corrected. The failure detection method according to claim 14 or 15, wherein a value calculated using a coefficient is subtracted from the threshold.
前記コンピュータに、
前記監視項目に対する監視情報毎に、所定のルール条件に従って点数を付与する処理と、
複数の前記監視項目のグループ毎に、前記点数を累積する処理と、
累積した点数と、前記グループ毎に設定した閾値とを比較することにより、前記被監視対象の障害の有無を判定する判定処理を、実行させることを特徴とするプログラム。 A program that is executed on a computer and detects occurrence of a failure of the monitored object based on monitoring information for a predetermined monitoring item acquired from the monitored object,
In the computer,
A process of assigning points according to a predetermined rule condition for each monitoring information for the monitoring item;
A process of accumulating the score for each group of a plurality of the monitoring items;
A program for executing a determination process for determining the presence or absence of a failure of the monitored object by comparing the accumulated score and a threshold set for each group.
前記判定処理で、前記累積した点数が上回った閾値に応じて通報方法を選択して、前記通報処理で、選択した通報方法によって通報を行うことを特徴とする請求項22に記載のプログラム。 Different notification methods are set for each threshold set in stages.
The program according to claim 22, wherein a notification method is selected in accordance with a threshold value in which the accumulated score exceeds in the determination process, and a notification is performed by the selected notification method in the notification process.
前記点数を付与する処理において、前記監視情報を取得すると、前記ルールテーブルを参照し、前記監視情報に示される前記監視項目の値が前記ルール条件を満たし、かつ、累積対象フラグに累積対象であることが示されている場合に、前記監視情報に、前記ルールテーブルに登録されている点数を付与することを特徴とする請求項21から請求項26の何れかに記載のプログラム。 For each monitoring item, a rule condition indicating whether or not points are assigned, an accumulation target flag indicating whether or not points are accumulated, a group name, and a rule table in which points to be assigned are registered,
In the process of assigning points, when the monitoring information is acquired, the rule table is referred to, the value of the monitoring item indicated in the monitoring information satisfies the rule condition, and the accumulation target flag is an accumulation target 27. The program according to any one of claims 21 to 26, wherein a point registered in the rule table is added to the monitoring information when the information is indicated.
前記点数を累積する処理において、前記監視情報に付与された点数を、前記累積点数記憶手段の累積点数に累積し、
前記判定処理において、前記累積点数記憶手段の前記累積点数を、前記問題判定テーブルの前記閾値と比較することで、障害の有無を判定し、障害有りの判定の場合に、前記問題ランクの重要度に応じて前記通報方法を選択することを特徴とする請求項22から請求項27の何れかに記載のプログラム。 Cumulative score storage means for recording the cumulative score for each group, the threshold value, the problem rank indicating the importance of the failure, and at least one notification method according to the problem rank for each group Provide a problem determination table,
In the process of accumulating the score, the score given to the monitoring information is accumulated in the accumulated score of the accumulated score storage means,
In the determination process, the cumulative score of the cumulative score storage means is compared with the threshold value of the problem determination table to determine whether or not there is a failure. The program according to any one of claims 22 to 27, wherein the notification method is selected according to the method.
前記判定処理において、
障害有りの判定をした場合、所定の待機時間の間に、障害有りの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得しない場合に、前記障害有りの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値に加算し、
障害無しの判定をした場合、障害無しの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得した場合に、前記障害無しの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値から減算することを特徴とする請求項24又は請求項25に記載のプログラム。 An update table in which a correction coefficient for correcting the threshold is registered for each group,
In the determination process,
When it is determined that there is a failure, the determination that there is a failure is determined to be an erroneous determination when the monitoring information for the monitoring item included in the group that has been determined to have a failure is not acquired during a predetermined waiting time. And adding the value calculated using the correction coefficient of the update table to the threshold value,
When it is determined that there is no failure, when the monitoring information for the monitoring item included in the group that is determined as having no failure is acquired, the determination that there is no failure is determined as an erroneous determination, and the update table is corrected. The program according to claim 24 or 25, wherein a value calculated using a coefficient is subtracted from the threshold value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008056746A JP4826831B2 (en) | 2008-03-06 | 2008-03-06 | Fault detection device, fault detection method and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008056746A JP4826831B2 (en) | 2008-03-06 | 2008-03-06 | Fault detection device, fault detection method and program thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009211658A true JP2009211658A (en) | 2009-09-17 |
JP4826831B2 JP4826831B2 (en) | 2011-11-30 |
Family
ID=41184703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008056746A Expired - Fee Related JP4826831B2 (en) | 2008-03-06 | 2008-03-06 | Fault detection device, fault detection method and program thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4826831B2 (en) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011244381A (en) * | 2010-05-21 | 2011-12-01 | Ricoh Co Ltd | Information processing unit, information processing system, information processing method and program thereof |
WO2013035266A1 (en) * | 2011-09-05 | 2013-03-14 | 日本電気株式会社 | Monitoring device, monitoring method and program |
WO2013035264A1 (en) * | 2011-09-05 | 2013-03-14 | 日本電気株式会社 | Monitoring device, monitoring method and program |
CN104572391A (en) * | 2013-10-16 | 2015-04-29 | 深圳市腾讯计算机系统有限公司 | Monitoring alarm strategy collocation method and device and monitoring alarm method and device |
WO2016129275A1 (en) * | 2015-02-10 | 2016-08-18 | 日本電気株式会社 | Information processing device, log management system, log management method, and program recording medium |
WO2016159039A1 (en) * | 2015-04-03 | 2016-10-06 | 三菱電機ビルテクノサービス株式会社 | Relay device and program |
CN111242323A (en) * | 2018-11-27 | 2020-06-05 | 普雷森索股份有限公司 | Proactive automated system and method for repairing sub-optimal operation of a machine |
CN111556992A (en) * | 2018-01-15 | 2020-08-18 | 三菱电机株式会社 | Fault detection device, monitoring control system, and fault detection method |
CN111566643A (en) * | 2018-01-17 | 2020-08-21 | 三菱电机株式会社 | Attack detection device, attack detection method, and attack detection program |
CN116016123A (en) * | 2022-12-09 | 2023-04-25 | 京东科技信息技术有限公司 | Fault processing method, device, equipment and medium |
CN117148091A (en) * | 2023-11-01 | 2023-12-01 | 杭州高坤电子科技有限公司 | Semiconductor test method, system, terminal and storage medium |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002171304A (en) * | 2000-11-30 | 2002-06-14 | Hitachi Information Technology Co Ltd | Fault report processing method and monitoring device |
JP2003241999A (en) * | 2002-02-14 | 2003-08-29 | Hitachi Ltd | Maintenance management system |
-
2008
- 2008-03-06 JP JP2008056746A patent/JP4826831B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002171304A (en) * | 2000-11-30 | 2002-06-14 | Hitachi Information Technology Co Ltd | Fault report processing method and monitoring device |
JP2003241999A (en) * | 2002-02-14 | 2003-08-29 | Hitachi Ltd | Maintenance management system |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011244381A (en) * | 2010-05-21 | 2011-12-01 | Ricoh Co Ltd | Information processing unit, information processing system, information processing method and program thereof |
WO2013035266A1 (en) * | 2011-09-05 | 2013-03-14 | 日本電気株式会社 | Monitoring device, monitoring method and program |
WO2013035264A1 (en) * | 2011-09-05 | 2013-03-14 | 日本電気株式会社 | Monitoring device, monitoring method and program |
JPWO2013035266A1 (en) * | 2011-09-05 | 2015-03-23 | 日本電気株式会社 | Monitoring device, monitoring method and program |
US9356848B2 (en) | 2011-09-05 | 2016-05-31 | Nec Corporation | Monitoring apparatus, monitoring method, and non-transitory storage medium |
CN104572391A (en) * | 2013-10-16 | 2015-04-29 | 深圳市腾讯计算机系统有限公司 | Monitoring alarm strategy collocation method and device and monitoring alarm method and device |
CN104572391B (en) * | 2013-10-16 | 2019-03-15 | 深圳市腾讯计算机系统有限公司 | Monitoring alarm tactics configuring method and device, monitoring alarm method and device |
JPWO2016129275A1 (en) * | 2015-02-10 | 2017-12-28 | 日本電気株式会社 | Information processing apparatus, log management system, log management method, and program |
WO2016129275A1 (en) * | 2015-02-10 | 2016-08-18 | 日本電気株式会社 | Information processing device, log management system, log management method, and program recording medium |
CN107533492A (en) * | 2015-04-03 | 2018-01-02 | 三菱电机大楼技术服务株式会社 | Relay and program |
JP2016197309A (en) * | 2015-04-03 | 2016-11-24 | 三菱電機ビルテクノサービス株式会社 | Relay and program |
WO2016159039A1 (en) * | 2015-04-03 | 2016-10-06 | 三菱電機ビルテクノサービス株式会社 | Relay device and program |
CN107533492B (en) * | 2015-04-03 | 2021-02-26 | 三菱电机大楼技术服务株式会社 | Relay device and program |
CN111556992A (en) * | 2018-01-15 | 2020-08-18 | 三菱电机株式会社 | Fault detection device, monitoring control system, and fault detection method |
CN111566643A (en) * | 2018-01-17 | 2020-08-21 | 三菱电机株式会社 | Attack detection device, attack detection method, and attack detection program |
CN111566643B (en) * | 2018-01-17 | 2023-08-08 | 三菱电机株式会社 | Attack detection device, attack detection method, and computer-readable recording medium |
CN111242323A (en) * | 2018-11-27 | 2020-06-05 | 普雷森索股份有限公司 | Proactive automated system and method for repairing sub-optimal operation of a machine |
CN111242323B (en) * | 2018-11-27 | 2024-01-26 | 斯凯孚公司 | Active automatic system and method for repairing suboptimal operation of a machine |
CN116016123A (en) * | 2022-12-09 | 2023-04-25 | 京东科技信息技术有限公司 | Fault processing method, device, equipment and medium |
CN117148091A (en) * | 2023-11-01 | 2023-12-01 | 杭州高坤电子科技有限公司 | Semiconductor test method, system, terminal and storage medium |
CN117148091B (en) * | 2023-11-01 | 2024-02-06 | 杭州高坤电子科技有限公司 | Semiconductor test method, system, terminal and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP4826831B2 (en) | 2011-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4826831B2 (en) | Fault detection device, fault detection method and program thereof | |
CN110213068B (en) | Message middleware monitoring method and related equipment | |
EP2523115B1 (en) | Operation management device, operation management method, and program storage medium | |
US9176803B2 (en) | Collecting data from a system in response to an event based on an identification in a file of the data to collect | |
US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
US8819220B2 (en) | Management method of computer system and management system | |
US8429455B2 (en) | Computer system management method and management system | |
CN107608860B (en) | Method, device and equipment for classified storage of error logs | |
US9658908B2 (en) | Failure symptom report device and method for detecting failure symptom | |
JP2007323193A (en) | System, method and program for detecting abnormality of performance load | |
JP5862403B2 (en) | Failure importance processing server device, network management system, failure importance estimation method and program | |
CN110990245A (en) | Micro-service operation state judgment method and device based on call chain data | |
CN111327685A (en) | Data processing method, device and equipment of distributed storage system and storage medium | |
EP2562651A1 (en) | Management system and management method for computer system | |
JP4449929B2 (en) | Transaction apparatus, delay fault detection apparatus and method, and program | |
JP5588295B2 (en) | Information processing apparatus and failure recovery method | |
CN110659147B (en) | Self-repairing method and system based on module self-checking behavior | |
JP5417264B2 (en) | Method of providing analysis information | |
JP6269199B2 (en) | Management server, failure recovery method, and computer program | |
US20130227135A1 (en) | Monitoring resource congestion in a network processor | |
CN108964992B (en) | Node fault detection method and device and computer readable storage medium | |
CN113064765B (en) | Node exception handling method, device, electronic equipment and machine-readable storage medium | |
JP2020021432A (en) | Control method, control unit, and control program | |
JP6572722B2 (en) | Event occurrence notification program, event occurrence notification method, and event occurrence notification device | |
US20150101036A1 (en) | Network filtering device, network filtering method and computer-readable recording medium having stored therein a program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110817 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |