JP4826831B2 - 障害検知装置、障害検知方法及びそのプログラム - Google Patents
障害検知装置、障害検知方法及びそのプログラム Download PDFInfo
- Publication number
- JP4826831B2 JP4826831B2 JP2008056746A JP2008056746A JP4826831B2 JP 4826831 B2 JP4826831 B2 JP 4826831B2 JP 2008056746 A JP2008056746 A JP 2008056746A JP 2008056746 A JP2008056746 A JP 2008056746A JP 4826831 B2 JP4826831 B2 JP 4826831B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- determination
- score
- threshold value
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
- Maintenance And Management Of Digital Transmission (AREA)
Description
本発明の目的は、個々の監視項目についての監視情報だけでなく、複数の監視項目の組み合わせについての複合的な情報に基づいて、監視項目が複合的に組み合わさって発生する障害を検出することが可能な障害検知装置、障害検知方法及びそのプログラムを提供することにある。
図1を参照すると、本発明の第1の実施の形態による障害検知通報システムは、障害監視を行う対象である被監視装置100と、被監視装置100の障害を検知して通報する障害検知通報装置10を備えて構成される。
障害判定処理部14は、監視項目又は累積グループの点数又は累積点数が、閾値点数に登録された値を上回る場合に、被監視装置100に障害が発生している(通報の必要有り)と判定する。
次に、上記のように構成される本実施の形態による障害検知通知装置10の動作について、図1、図2〜図6及び図7を参照して説明する。図7、図8は、障害検知通知装置10の動作内容を説明するフローチャートである。
(1)記録情報が累積対象フラグ=NOである場合(監視情報記録処理部12から送付された記録情報の場合)
問題判定テーブル23の「累積グループ名」=defaultのフィールドを参照して、その「閾値点数」と送付された記録情報に記録されている「点数」とを比較して、「点数」が「閾値点数」を上回っている場合に被監視装置100に障害が発生していると判定し、通報の必要有りの決定をする。
(2)情報が累積対象フラグ=YESである場合(点数累積処理部13から送付された記録情報の場合)
問題判定テーブル23の該当する「累積グループ名」を参照して、対応する「閾値点数」と点数累積処理部13から送られてきた「累積点数」とを比較して、「累積点数」が「閾値点数」を上回っている場合に被監視装置100に障害が発生していると判定し、通報の必要有りの決定をする。
補正点数α=(X−Y)*F
ここで、X:累積点数記憶部25の「累積点数」の値、Y:問題判定テーブル23の「閾値点数」の値、F:点数更新用情報テーブル24の「補正係数」の値である。
補正点数β = Y * F
本実施の形態によれば、監視項目に対する監視情報毎に、点数付与ルールテーブル21のルール条件に従って点数を付与すると共に、複数の監視項目の組み合わせたグループ毎に、点数を累積し、累積した点数に基づいて障害の有無を検知するため、監視項目が複合的に組み合わさって発生する障害を検出し、通報することが可能となる。
11: 監視情報取得部
12:監視情報記録処理部
13:点数累積処理部
14:障害判定処理部
15:通報実行部
21:点数付与ルールテーブル
22:データ記憶部22
23:問題判定テーブル
24:点数更新用情報テーブル
25:累積点数記憶部
100:被監視装置
101:監視情報採取部
Claims (30)
- 被監視対象から取得した所定の監視項目に対する監視情報に基づいて、前記被監視対象の障害の発生を検知する障害検知装置であって、
前記監視項目に対する監視情報毎に、所定のルール条件に従って点数を付与する手段と、
複数の前記監視項目のグループ毎に、前記点数を累積する点数累積手段と、
累積した点数と、前記グループ毎に設定した閾値とを比較することにより、前記被監視対象の障害の有無を判定する判定手段と
を備えることを特徴とする障害検知装置。 - 前記障害と判定した場合に通報を実行する通報実行手段を備え、
前記判定手段は、前記障害有りと判定した場合に、前記グループの種類毎に設定された通報方法を選択し、前記通報実行手段に指示することを特徴とする請求項1に記載の障害検知装置。 - 段階的に複数設定された閾値毎に異なる通報方法が設定され、
前記判定手段は、前記累積した点数が上回った閾値に応じて通報方法を選択して、前記通報実行手段に指示することを特徴とする請求項2に記載の障害検知装置。 - 前記判定手段は、障害の有無の判定が誤判定であった場合、所定の補正係数に基づいて、前記閾値を増減することを特徴とする請求項1から請求項3の何れかに記載の障害検知装置。
- 前記判定手段は、障害有りの判定が誤判定であった場合、所定の補正係数を使用して算出した値を前記閾値に加算することにより、前記閾値を補正することを特徴とする請求項4に記載の障害検知装置。
- 前記判定手段は、障害無しの判定が誤判定であった場合、所定の補正係数を使用して算出した値を、前記閾値から減算することにより、前記閾値を補正することを特徴とする請求項4に記載の障害検知装置。
- 前記監視項目毎に、点数を付与するか否かを示すルール条件と、点数を累積するか否かを示す累積対象フラグと、グループ名と、付与する点数を登録したルールテーブルを備え、
前記点数を付与する手段は、前記監視情報を取得すると、前記ルールテーブルを参照し、前記監視情報に示される前記監視項目の値が前記ルール条件を満たし、かつ、累積対象フラグに累積対象であることが示されている場合に、前記監視情報に、前記ルールテーブルに登録されている点数を付与することを特徴とする請求項1から請求項6の何れかに記載の障害検知装置。 - 前記グループ毎に、累積点数を記録する累積点数記憶手段と、前記グループ毎に、前記閾値と、障害の重要度を示す問題ランクと、前記問題ランクに応じて少なくとも1の前記通報方法を登録した問題判定テーブルを備え、
前記点数累積手段は、前記監視情報に付与された点数を、前記累積点数記憶手段の累積点数に累積し、
前記判定手段は、前記累積点数記憶手段の前記累積点数を、前記問題判定テーブルの前記閾値と比較することで、障害の有無を判定し、障害有りの判定の場合に、前記問題ランクの重要度に応じて前記通報方法を選択することを特徴とする請求項2から請求項7の何れかに記載の障害検知装置。 - 前記判定手段は、予め定めた設定時間の間に累積した点数を、前記閾値と比較することで、前記障害の有無を判定することを特徴とする請求項1から請求項8の何れかに記載の障害検知装置。
- 前記グループ毎に、前記閾値を補正するための補正係数を登録した更新用テーブルを備え、
前記判定手段は、
障害有りの判定をした場合、所定の待機時間の間に、障害有りの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得しない場合に、前記障害有りの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値に加算し、
障害無しの判定をした場合、障害無しの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得した場合に、前記障害無しの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値から減算することを特徴とする請求項4又は請求項5に記載の障害検知装置。 - 被監視対象から取得した所定の監視項目に対する監視情報に基づいて、前記被監視対象の障害の発生を検知する障害検知方法であって、
前記監視項目に対する監視情報毎に、所定のルール条件に従って点数を付与するステップと、
複数の前記監視項目のグループ毎に、前記点数を累積するステップと、
累積した点数と、前記グループ毎に設定した閾値とを比較することにより、前記被監視対象の障害の有無を判定する判定ステップと
を含むことを特徴とする障害検知方法。 - 前記判定ステップで前記障害有りと判定した場合に、前記グループの種類毎に設定された通報方法によって通報を実行する通報ステップを含むことを特徴とする請求項11に記載の障害検知方法。
- 段階的に複数設定された閾値毎に異なる通報方法が設定され、
前記判定ステップで、前記累積した点数が上回った閾値に応じて通報方法を選択して、前記通報ステップで、選択した通報方法によって通報を実行することを特徴とする請求項12に記載の障害検知方法。 - 前記判定ステップが、障害の有無の判定が誤判定であった場合、所定の補正係数に基づいて、前記閾値を増減するステップを含むことを特徴とする請求項11から請求項13の何れかに記載の障害検知方法。
- 前記判定ステップが、障害有りの判定が誤判定であった場合、所定の補正係数を使用して算出した値を前記閾値に加算することにより、前記閾値を補正するステップを含むことを特徴とする請求項14に記載の障害検知方法。
- 前記判定ステップが、障害無しの判定が誤判定であった場合、所定の補正係数を使用して算出した値を、前記閾値から減算することにより、前記閾値を補正するステップを含むことを特徴とする請求項14に記載の障害検知方法。
- 前記監視項目毎に、点数を付与するか否かを示すルール条件と、点数を累積するか否かを示す累積対象フラグと、グループ名と、付与する点数を登録したルールテーブルを備え、
前記点数を付与するステップにおいて、前記監視情報を取得すると、前記ルールテーブルを参照し、前記監視情報に示される前記監視項目の値が前記ルール条件を満たし、かつ、累積対象フラグに累積対象であることが示されている場合に、前記監視情報に、前記ルールテーブルに登録されている点数を付与することを特徴とする請求項11から請求項16の何れかに記載の障害検知方法。 - 前記グループ毎に、累積点数を記録する累積点数記憶手段と、前記グループ毎に、前記閾値と、障害の重要度を示す問題ランクと、前記問題ランクに応じて少なくとも1の前記通報方法を登録した問題判定テーブルを備え、
前記点数を累積するステップにおいて、前記監視情報に付与された点数を、前記累積点数記憶手段の累積点数に累積し、
前記判定ステップにおいて、前記累積点数記憶手段の前記累積点数を、前記問題判定テーブルの前記閾値と比較することで、障害の有無を判定し、障害有りの判定の場合に、前記問題ランクの重要度に応じて前記通報方法を選択することを特徴とする請求項12から請求項17の何れかに記載の障害検知方法。 - 前記判定ステップで、予め定めた設定時間の間に累積した点数を、前記閾値と比較することで、前記障害の有無を判定することを特徴とする請求項11から請求項18の何れかに記載の障害検知方法。
- 前記グループ毎に、前記閾値を補正するための補正係数を登録した更新用テーブルを備え、
前記判定ステップにおいて、
障害有りの判定をした場合、所定の待機時間の間に、障害有りの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得しない場合に、前記障害有りの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値に加算し、
障害無しの判定をした場合、障害無しの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得した場合に、前記障害無しの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値から減算することを特徴とする請求項14又は請求項15に記載の障害検知方法。 - コンピュータ上で実行され、被監視対象から取得した所定の監視項目に対する監視情報に基づいて、前記被監視対象の障害の発生を検知するプログラムであって、
前記コンピュータに、
前記監視項目に対する監視情報毎に、所定のルール条件に従って点数を付与する処理と、
複数の前記監視項目のグループ毎に、前記点数を累積する処理と、
累積した点数と、前記グループ毎に設定した閾値とを比較することにより、前記被監視対象の障害の有無を判定する判定処理を、実行させることを特徴とするプログラム。 - 前記判定処理で前記障害有りと判定した場合に、前記グループの種類毎に設定された通報方法によって通報を実行する通報処理を実行させることを特徴とする請求項21に記載のプログラム。
- 段階的に複数設定された閾値毎に異なる通報方法が設定され、
前記判定処理で、前記累積した点数が上回った閾値に応じて通報方法を選択して、前記通報処理で、選択した通報方法によって通報を行うことを特徴とする請求項22に記載のプログラム。 - 前記判定処理が、障害の有無の判定が誤判定であった場合、所定の補正係数に基づいて、前記閾値を増減する処理を含むことを特徴とする請求項21から請求項23の何れかに記載のプログラム。
- 前記判定処理が、障害有りの判定が誤判定であった場合、所定の補正係数を使用して算出した値を前記閾値に加算することにより、前記閾値を補正する処理を含むことを特徴とする請求項24に記載のプログラム。
- 前記判定処理が、障害無しの判定が誤判定であった場合、所定の補正係数を使用して算出した値を、前記閾値から減算することにより、前記閾値を補正する処理を含むことを特徴とする請求項24に記載のプログラム。
- 前記監視項目毎に、点数を付与するか否かを示すルール条件と、点数を累積するか否かを示す累積対象フラグと、グループ名と、付与する点数を登録したルールテーブルを備え、
前記点数を付与する処理において、前記監視情報を取得すると、前記ルールテーブルを参照し、前記監視情報に示される前記監視項目の値が前記ルール条件を満たし、かつ、累積対象フラグに累積対象であることが示されている場合に、前記監視情報に、前記ルールテーブルに登録されている点数を付与することを特徴とする請求項21から請求項26の何れかに記載のプログラム。 - 前記グループ毎に、累積点数を記録する累積点数記憶手段と、前記グループ毎に、前記閾値と、障害の重要度を示す問題ランクと、前記問題ランクに応じて少なくとも1の前記通報方法を登録した問題判定テーブルを備え、
前記点数を累積する処理において、前記監視情報に付与された点数を、前記累積点数記憶手段の累積点数に累積し、
前記判定処理において、前記累積点数記憶手段の前記累積点数を、前記問題判定テーブルの前記閾値と比較することで、障害の有無を判定し、障害有りの判定の場合に、前記問題ランクの重要度に応じて前記通報方法を選択することを特徴とする請求項22から請求項27の何れかに記載のプログラム。 - 前記判定処理で、予め定めた設定時間の間に累積した点数を、前記閾値と比較することで、前記障害の有無を判定することを特徴とする請求項21から請求項28の何れかに記載のプログラム。
- 前記グループ毎に、前記閾値を補正するための補正係数を登録した更新用テーブルを備え、
前記判定処理において、
障害有りの判定をした場合、所定の待機時間の間に、障害有りの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得しない場合に、前記障害有りの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値に加算し、
障害無しの判定をした場合、障害無しの判定をした前記グループに含まれる監視項目に対する前記監視情報を取得した場合に、前記障害無しの判定が誤判定と判断して、前記更新用テーブルの補正係数を使用して算出した値を前記閾値から減算することを特徴とする請求項24又は請求項25に記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008056746A JP4826831B2 (ja) | 2008-03-06 | 2008-03-06 | 障害検知装置、障害検知方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008056746A JP4826831B2 (ja) | 2008-03-06 | 2008-03-06 | 障害検知装置、障害検知方法及びそのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009211658A JP2009211658A (ja) | 2009-09-17 |
JP4826831B2 true JP4826831B2 (ja) | 2011-11-30 |
Family
ID=41184703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008056746A Expired - Fee Related JP4826831B2 (ja) | 2008-03-06 | 2008-03-06 | 障害検知装置、障害検知方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4826831B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011244381A (ja) * | 2010-05-21 | 2011-12-01 | Ricoh Co Ltd | 情報処理装置、情報処理システム、情報処理方法およびそのプログラム |
WO2013035266A1 (ja) * | 2011-09-05 | 2013-03-14 | 日本電気株式会社 | 監視装置、監視方法およびプログラム |
JPWO2013035264A1 (ja) * | 2011-09-05 | 2015-03-23 | 日本電気株式会社 | 監視装置、監視方法およびプログラム |
CN104572391B (zh) * | 2013-10-16 | 2019-03-15 | 深圳市腾讯计算机系统有限公司 | 监控告警策略配置方法及装置、监控告警方法及装置 |
WO2016129275A1 (ja) * | 2015-02-10 | 2016-08-18 | 日本電気株式会社 | 情報処理装置、ログ管理システム、ログ管理方法及びプログラム記録媒体 |
JP6223380B2 (ja) * | 2015-04-03 | 2017-11-01 | 三菱電機ビルテクノサービス株式会社 | 中継装置及びプログラム |
CN111556992A (zh) * | 2018-01-15 | 2020-08-18 | 三菱电机株式会社 | 故障检测装置、监视控制系统及故障检测方法 |
EP3731122B1 (en) * | 2018-01-17 | 2021-09-01 | Mitsubishi Electric Corporation | Attack detection apparatus, attack detection method, and attack detection program |
DE102019218138A1 (de) * | 2018-11-27 | 2020-05-28 | Presenso Ltd. | Ein proaktives und automatisiertes System und Verfahren davon zum Reparieren eines suboptimalen Betriebs einer Maschine |
CN116016123A (zh) * | 2022-12-09 | 2023-04-25 | 京东科技信息技术有限公司 | 故障处理方法、装置、设备及介质 |
CN117148091B (zh) * | 2023-11-01 | 2024-02-06 | 杭州高坤电子科技有限公司 | 一种半导体测试方法、系统、终端及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3681634B2 (ja) * | 2000-11-30 | 2005-08-10 | 株式会社日立インフォメーションテクノロジー | 障害通報処理方法および監視装置 |
JP2003241999A (ja) * | 2002-02-14 | 2003-08-29 | Hitachi Ltd | 保守管理システム |
-
2008
- 2008-03-06 JP JP2008056746A patent/JP4826831B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009211658A (ja) | 2009-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4826831B2 (ja) | 障害検知装置、障害検知方法及びそのプログラム | |
EP2523115B1 (en) | Operation management device, operation management method, and program storage medium | |
CN110213068B (zh) | 一种消息中间件的监控方法及相关设备 | |
US9760468B2 (en) | Methods and arrangements to collect data | |
US8819220B2 (en) | Management method of computer system and management system | |
US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
US8429455B2 (en) | Computer system management method and management system | |
JP4573179B2 (ja) | 性能負荷異常検出システム、性能負荷異常検出方法、及びプログラム | |
JP6387747B2 (ja) | 情報処理装置、障害回避方法およびコンピュータプログラム | |
US9658908B2 (en) | Failure symptom report device and method for detecting failure symptom | |
JP5862403B2 (ja) | 障害重要度処理サーバ装置、ネットワーク管理システム、障害重要度推定方法およびプログラム | |
JP5588295B2 (ja) | 情報処理装置、および障害復旧方法 | |
CN110659147B (zh) | 一种基于模块自检行为的自修复方法和系统 | |
CN110990245A (zh) | 基于调用链数据的微服务运行状态判断方法及装置 | |
CN111327685A (zh) | 分布式存储系统数据处理方法、装置及设备和存储介质 | |
US7694179B2 (en) | Suspected place identifying apparatus and processing method | |
JP4449929B2 (ja) | トランザクション装置、遅延障害検出装置及び方法、並びにプログラム | |
EP2562651A1 (en) | Management system and management method for computer system | |
JP5417264B2 (ja) | 分析情報提供方法 | |
US8976803B2 (en) | Monitoring resource congestion in a network processor | |
JP6269199B2 (ja) | 管理サーバおよび障害復旧方法、並びにコンピュータ・プログラム | |
CN108964992B (zh) | 一种节点故障检测方法、装置和计算机可读存储介质 | |
CN110955587A (zh) | 一种待更换设备确定方法及装置 | |
US20200196172A1 (en) | Network fault discovery | |
JP2020021432A (ja) | 制御方法、制御装置および制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110817 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |