JP5428934B2 - 障害パターン生成プログラムおよび障害パターン生成装置 - Google Patents
障害パターン生成プログラムおよび障害パターン生成装置 Download PDFInfo
- Publication number
- JP5428934B2 JP5428934B2 JP2010036512A JP2010036512A JP5428934B2 JP 5428934 B2 JP5428934 B2 JP 5428934B2 JP 2010036512 A JP2010036512 A JP 2010036512A JP 2010036512 A JP2010036512 A JP 2010036512A JP 5428934 B2 JP5428934 B2 JP 5428934B2
- Authority
- JP
- Japan
- Prior art keywords
- message
- failure
- learning
- unit
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
Description
まず、図2を用いて障害検出装置の構成を説明する。図2は、実施例2に係る障害検出装置の構成を示すブロック図である。図2に示すように、障害検出装置10は、通信制御I/F部11と入力部12と表示部13と、各種データベース14〜19と、制御部20とを有する。そして、各種データベースであるCMDB14、メッセージDB15、障害情報DB16、重み係数決定DB17、学習回数決定DB18、障害パターンDB19は、半導体メモリ素子、または、ハードディスクなどの記憶装置である。
次に、図12〜図17を用いて、実施例2に係る障害検出装置における処理の流れを説明する。ここでは、重み係数決定処理、重み係数決定処理における構成要素間のホップ数による重み決定処理、ホップ数による重み決定処理における経路両端の構成要素の重み決定処理を順に説明する。さらに、重みつき学習処理、ベイズ推定による学習実施処理、障害検出処理についても順に説明する。
まず、図12を用いて、重み係数決定処理について説明する。図12は、実施例2に係る障害検出装置における重み係数決定処理の流れを示すフローチャートである。
続いて、図13を用いて、構成要素間のホップ数による重み決定処理について説明する。図13は、重み係数決定処理における構成要素間のホップ数による重み決定処理の流れを示すフローチャートであり、この処理は、図12のステップS104で実行される処理である。
続いて、図14を用いて、経路両端の構成要素の重み計算処理について説明する。図14は、構成要素間のホップ数による重み決定処理における経路両端の構成要素の重み計算処理の流れを示すフローチャートであり、この処理は、図13のステップS206で実行される処理である。
次に、図15を用いて、重みつき学習処理について説明する。図15は、実施例2に係る障害検出装置における重みつき学習処理の流れを示すフローチャートである。
次に、図16を用いて、ベイズ推定による学習実施処理について説明する。図16は、重みつき学習処理におけるベイズ推定による学習実施処理の流れを示すフローチャートである。なお、この処理は、図15のステップS404で実行される処理である。
次に、図17を用いて、図12〜図16を実行して生成された障害メッセージパターンを用いた障害検出処理について説明する。図17は、実施例2に係る障害検出装置における障害検出処理の流れを示すフローチャートである。なお、この処理は、図12〜図16と同期を取る必要はなく、メッセージが発生するたびに実行される。
このように、実施例2によれば、本願が開示する障害パターン生成装置を組み込んだ障害検出装置を用いた場合、障害検知精度の高い障害メッセージパターンを短時間で生成することが可能であるとともに、障害検知まで実施することができる。また、関係のない構成要素が出力するノイズの影響を減らし、少ない学習回数で障害メッセージパターンを生成することができる。
上述した実施例では、障害である確率を学習する手法として、ベイズ推定を用いた例を説明したが、これに限定されるものではなく、繰り返し学習を実施できる他の手法を用いることもできる。また、障害である確率の代わりに、障害でない確率を算出するようにしてもよい。
また、本実施例において説明した各処理のうち、自動的におこなわれるものとして説明した処理の全部または一部を手動的におこなうこともできる。あるいは、手動的におこなわれるものとして説明した処理の全部または一部を公知の方法で自動的におこなうこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、例えば図3〜図11等に示した各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
ところで、上記の実施例で説明した各種の処理は、あらかじめ用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータシステムで実行することによって実現することができる。そこで、以下では、上記の実施例と同様の機能を有するプログラムを実行するコンピュータシステムの一例を説明する。
1a 構成要素抽出部
1b 関連度算出部
1c 学習実行部
1d パターン生成部
10 障害検出装置
11 通信制御I/F部
12 入力部
13 表示部
14 CMDB
15 メッセージDB
16 障害情報DB
17 重み係数決定DB
18 学習回数決定DB
19 障害パターンDB
20 制御部
21 メッセージ分類部
22 構成要素抽出部
23 関連度算出部
24 重み算出部
25 学習回数決定部
26 学習実行部
27 パターン生成部
28 障害検出部
Claims (4)
- 複数の構成要素を有する情報システムが所定期間内に出力した複数のログメッセージから、当該ログメッセージ各々を発信した構成要素を抽出する構成要素抽出手順と、
前記構成要素抽出手順によって抽出された構成要素間の関連度を算出する関連度算出手順と、
前記関連度算出手順によって算出された関連度が閾値以上である構成要素の組に対し、前記算出された関連度を用いて、当該構成要素各々の重みを算出する重み算出手順と、
前記重み算出手順によって算出された構成要素各々の重みを用いて、前記複数のログメッセージが、前記情報システムに障害が発生した時に出力されるメッセージの組み合わせである確率を繰り返し算出する回数を決定する学習回数決定手順と、
前記複数のログメッセージが出力された回数のうち前記情報システムに障害が発生していた回数の割合を、前記学習回数決定手順によって決定された回数学習して、前記確率を算出する学習実行手順と、
前記学習実行手順によって算出された確率と、前記ログメッセージの組み合わせとを対応付けた障害パターンメッセージを生成するパターン生成手順と
をコンピュータに実行させることを特徴とする障害パターン生成プログラム。 - 前記学習回数決定手順は、前記複数のログメッセージの発信元の構成要素各々を計数し、当該発信元の構成要素ごとに、前記重み算出手順によって重みと計数した数とを乗算し、乗算して得られた発信元の構成要素ごとの重みを加算し、加算した結果を前記複数のログメッセージの総数で除算して、前記複数のログメッセージの全体の重みを算出し、算出した前記複数のログメッセージの全体の重みを用いて、前記回数を決定することを特徴とする請求項1に記載の障害パターン生成プログラム。
- 前記情報システムからログメッセージが新たに出力された場合に、当該新たに出力されたメッセージから所定時間前までに出力されたメッセージを取得し、取得されたメッセージが前記パターン生成手順によって生成された障害パターンメッセージと一致するか否かを判定する障害判定手順と、
前記障害判定手順によって、前記取得されたメッセージが前記障害パターンメッセージと一致すると判定された場合に、当該メッセージに対応する前記確率が閾値以上であるか否かを判定する確率判定手順と、
前記確率判定手順によって、前記取得されたメッセージに対応する前記確率が閾値以上であると判定された場合に、障害が発生したと検知する障害検知手順とをさらにコンピュータに実行させることを特徴とする請求項1に記載の障害パターン生成プログラム。 - 複数の構成要素を有する情報システムが所定期間内に出力した複数のログメッセージから、当該ログメッセージ各々を発信した構成要素を抽出する構成要素抽出部と、
前記構成要素抽出部によって抽出された構成要素間の関連度を算出する関連度算出部と、
前記関連度算出部によって算出された関連度が閾値以上である構成要素の組に対し、前記算出された関連度を用いて、当該構成要素各々の重みを算出する重み算出部と、
前記重み算出部によって算出された構成要素各々の重みを用いて、前記複数のログメッセージが、前記情報システムに障害が発生した時に出力されるメッセージの組み合わせである確率を繰り返し算出する回数を決定する学習回数決定部と、
前記複数のログメッセージが出力された回数のうち前記情報システムに障害が発生していた回数の割合を、前記学習回数決定部によって決定された回数学習して、前記確率を算出する学習実行部と、
前記学習実行部によって算出された確率と、前記ログメッセージの組み合わせとを対応付けた障害パターンメッセージを生成するパターン生成部と
を有することを特徴とする障害パターン生成装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010036512A JP5428934B2 (ja) | 2010-02-22 | 2010-02-22 | 障害パターン生成プログラムおよび障害パターン生成装置 |
US13/029,931 US8751417B2 (en) | 2010-02-22 | 2011-02-17 | Trouble pattern creating program and trouble pattern creating apparatus |
GB1103038.4A GB2478066B (en) | 2010-02-22 | 2011-02-22 | Trouble pattern creating program and trouble pattern creating apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010036512A JP5428934B2 (ja) | 2010-02-22 | 2010-02-22 | 障害パターン生成プログラムおよび障害パターン生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011170802A JP2011170802A (ja) | 2011-09-01 |
JP5428934B2 true JP5428934B2 (ja) | 2014-02-26 |
Family
ID=43881486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010036512A Expired - Fee Related JP5428934B2 (ja) | 2010-02-22 | 2010-02-22 | 障害パターン生成プログラムおよび障害パターン生成装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8751417B2 (ja) |
JP (1) | JP5428934B2 (ja) |
GB (1) | GB2478066B (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5541130B2 (ja) | 2010-12-10 | 2014-07-09 | 富士通株式会社 | 管理装置、管理方法および管理用プログラム |
US9612892B2 (en) * | 2011-04-04 | 2017-04-04 | Hewlett Packard Enterprise Development Lp | Creating a correlation rule defining a relationship between event types |
US9389946B2 (en) | 2011-09-19 | 2016-07-12 | Nec Corporation | Operation management apparatus, operation management method, and program |
US10540354B2 (en) | 2011-10-17 | 2020-01-21 | Micro Focus Llc | Discovering representative composite CI patterns in an it system |
JP5692414B2 (ja) * | 2011-12-15 | 2015-04-01 | 富士通株式会社 | 検知装置、検知プログラムおよび検知方法 |
JP5741418B2 (ja) | 2011-12-19 | 2015-07-01 | 富士通株式会社 | 障害検出方法および障害検出システム |
JP5935890B2 (ja) * | 2012-08-08 | 2016-06-15 | 富士通株式会社 | 障害検出装置、障害検出プログラムおよび障害検出方法 |
WO2014103071A1 (ja) * | 2012-12-28 | 2014-07-03 | 富士通株式会社 | 対処方法作成プログラム、対処方法作成方法、及び情報処理装置 |
JP6503679B2 (ja) * | 2014-10-06 | 2019-04-24 | 富士通株式会社 | フィルタルール作成装置、フィルタルール作成方法、およびプログラム |
JP6451483B2 (ja) | 2015-05-11 | 2019-01-16 | 富士通株式会社 | 予兆検知プログラム、装置、及び方法 |
WO2017085921A1 (ja) * | 2015-11-17 | 2017-05-26 | 日本電気株式会社 | ログ分析システム、方法およびプログラム |
JP6741216B2 (ja) * | 2015-11-30 | 2020-08-19 | 日本電気株式会社 | ログ分析システム、方法およびプログラム |
JP6693010B2 (ja) * | 2016-02-08 | 2020-05-13 | ブレインズコンサルティング株式会社 | 障害対応支援装置、障害対応支援プログラム及び記憶媒体 |
EP3591532B1 (en) * | 2017-04-03 | 2022-09-07 | Nippon Telegraph And Telephone Corporation | Analysis device, analysis method, and analysis program |
US20220398143A1 (en) * | 2019-11-20 | 2022-12-15 | Nippon Telegraph And Telephone Corporation | Network monitoring apparatus, method, and program |
JP7401764B2 (ja) * | 2020-03-11 | 2023-12-20 | 富士通株式会社 | 制御プログラム、制御方法および制御装置 |
CN115374658B (zh) * | 2022-10-25 | 2023-02-14 | 中国人民解放军海军工程大学 | 一种电子设备最少耗时故障排查次序优化方法和系统 |
CN116502846B (zh) * | 2023-04-27 | 2023-12-26 | 中国人民解放军海军工程大学 | 一种考虑维修耗时的电子件备件平均消耗数量估计方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5321795A (en) * | 1991-05-24 | 1994-06-14 | Alvarez De Toledo Santiago | Pattern association central subsystem and a perception learning system |
JPH09298544A (ja) * | 1996-05-08 | 1997-11-18 | Fujitsu Ltd | ネットワーク運用管理装置 |
JP2000010805A (ja) * | 1998-06-19 | 2000-01-14 | Hitachi Ltd | コンソールメッセージのルーティング方法およびコンソールシステム |
US20040199828A1 (en) * | 2003-04-01 | 2004-10-07 | International Business Machines Corporation | Method and apparatus for tracing troubleshooting events for aiding technical assistance |
JP3682778B2 (ja) * | 2003-06-04 | 2005-08-10 | 株式会社エヌ・ティ・ティ・ドコモ | 故障措置システム、及び、故障要因特定方法 |
US7689872B2 (en) * | 2003-07-01 | 2010-03-30 | International Business Machines Corporation | Autonomic program error detection and correction |
WO2006003874A1 (ja) * | 2004-06-30 | 2006-01-12 | Matsushita Electric Industrial Co., Ltd. | 通信装置、通信設定方法、通信設定プログラム及び通信設定プログラムを記録した記録媒体 |
US7469375B2 (en) * | 2005-01-18 | 2008-12-23 | International Business Machines Corporation | Systems and methods for managing error dependencies |
JP4944391B2 (ja) | 2005-05-11 | 2012-05-30 | 富士通株式会社 | メッセージ異常自動判別装置、方法、及びプログラム |
US7676695B2 (en) * | 2007-06-05 | 2010-03-09 | Compuware Corporation | Resolution of computer operations problems using fault trend analysis |
JP5035417B2 (ja) * | 2008-07-04 | 2012-09-26 | 富士通株式会社 | 情報処理装置、情報処理プログラム、情報処理方法 |
-
2010
- 2010-02-22 JP JP2010036512A patent/JP5428934B2/ja not_active Expired - Fee Related
-
2011
- 2011-02-17 US US13/029,931 patent/US8751417B2/en not_active Expired - Fee Related
- 2011-02-22 GB GB1103038.4A patent/GB2478066B/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
GB201103038D0 (en) | 2011-04-06 |
US20110208679A1 (en) | 2011-08-25 |
GB2478066A (en) | 2011-08-24 |
GB2478066B (en) | 2014-09-24 |
US8751417B2 (en) | 2014-06-10 |
JP2011170802A (ja) | 2011-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5428934B2 (ja) | 障害パターン生成プログラムおよび障害パターン生成装置 | |
JP6126891B2 (ja) | 検出方法、検出プログラム、および検出装置 | |
US8751874B2 (en) | Managing apparatus, managing method | |
US11061756B2 (en) | Enabling symptom verification | |
US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
EP3338191B1 (en) | Diagnostic framework in computing systems | |
US9246777B2 (en) | Computer program and monitoring apparatus | |
WO2014013603A1 (ja) | 監視システム及び監視プログラム | |
JP6160064B2 (ja) | 適用判定プログラム、障害検出装置および適用判定方法 | |
CN113328872B (zh) | 故障修复方法、装置和存储介质 | |
JP2017500791A (ja) | リアルタイムまたは準リアルタイムの改善フィードバックを供給するパフォーマンス・モニタリング | |
US10360090B2 (en) | Determination method, determination apparatus, and recording medium | |
JP2011154483A (ja) | 異常検出装置、プログラム、及び異常検出方法 | |
JP6988304B2 (ja) | 運用管理システム、監視サーバ、方法およびプログラム | |
JP6280862B2 (ja) | イベント分析システムおよび方法 | |
US20150113337A1 (en) | Failure symptom report device and method for detecting failure symptom | |
JPWO2018142703A1 (ja) | 異常要因推定装置、異常要因推定方法及びプログラム | |
JP2012186667A (ja) | ネットワーク障害検出装置、ネットワーク障害検出装置のネットワーク障害検出方法およびネットワーク障害検出プログラム | |
CN114257493A (zh) | 网络节点的故障预警方法、装置、介质及电子设备 | |
US9886498B2 (en) | Title standardization | |
US20220038467A1 (en) | Impact range estimation apparatus, impact range estimation method, and computer-readable recording medium | |
US8798982B2 (en) | Information processing device, information processing method, and program | |
JPWO2013114911A1 (ja) | リスク評価システム、リスク評価方法、及びプログラム | |
JP6060123B2 (ja) | 影響範囲特定装置、影響範囲特定方法、及びプログラム | |
JP2012044373A (ja) | ネットワーク故障評価システム、ネットワーク故障評価方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130730 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130930 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131118 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |