JP2012203684A - It障害予兆検知装置及びプログラム - Google Patents
It障害予兆検知装置及びプログラム Download PDFInfo
- Publication number
- JP2012203684A JP2012203684A JP2011068233A JP2011068233A JP2012203684A JP 2012203684 A JP2012203684 A JP 2012203684A JP 2011068233 A JP2011068233 A JP 2011068233A JP 2011068233 A JP2011068233 A JP 2011068233A JP 2012203684 A JP2012203684 A JP 2012203684A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- event block
- event
- predictive
- events
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
- Computer Hardware Design (AREA)
Abstract
【解決手段】IT障害を監視する監視サーバが生成したイベントを逐次取得して予兆イベントブロック又はIT障害イベントブロックに分類する。次に、取得した予兆イベントブロックに類似する特徴情報を有する予兆イベントブロックを過去ログから検索する。続いて、各予兆イベントブロックの発生から一定期間に発生するIT障害イベントブロックをIT障害イベントブロックログから検索する。この後、予兆イベントブロックとIT障害イベントブロックとの間で共起関係を判定し、共起関係が認められたIT障害イベントブロックを、取得された予兆イベントブロックに対する予測IT障害と判定する。
【選択図】図9
Description
(1)広範囲なIT障害への対応
性能負荷を利用する予兆検知方法は、コンピュータを構成するプロセッサ等の構成要素に影響するIT障害を検知することができる。しかし、これらに影響を与えないIT障害を検知することができない。例えばプロセス停止等のアプリケーションエラーやOSエラーは、必ずしも性能負荷に影響が表れるとは限らず、適切に対応することはできない。
IT障害を事前に防ぐには、IT障害が発生する前に事前に予兆を検知し、発生するIT障害を特定する必要がある。しかし、特許文献3の方法は、現在発生している振る舞いが過去の障害の振る舞いが似ていることを示すだけであり、IT障害の発生を事前に検知することはできない。一般に、性能負荷を利用する方法は、対象が単純な数値データであり、予兆と障害を区別することが困難である。
図1に、予兆検知コンピュータ103を実装する予兆検知システムの構成例を示す。図1に示す予兆検知システムは、監視対象サーバ群101と、そのコンピュータの状態を監視し、その状態に基づいて監視イベントを生成する監視サーバ102と、監視サーバ102が生成した監視イベントを解析し、IT障害やその予兆を検知する予兆検知コンピュータ103と、監視イベントのうちIT障害に関わる情報を格納するIT障害DB104と、予兆に関わる情報を格納する予兆DB105とを有している。
図6〜8に、予兆検知コンピュータ103に接続される表示装置331に表示される予兆検知プログラム311のGUI画面例を示す。
図4は、IT障害DB104が保持するIT障害イベントブロックテーブル400及びIT障害特徴テーブル410のデータ構造例を示す。IT障害イベントブロックテーブル400は、イベントブロックを一意に特定するイベントブロックID401と、イベントブロックに含まれる単数又は複数のIT障害イベント402から構成される。
図9に、予兆検知システム全体の予兆検知プロセスの概略を示す。
予兆検知コンピュータ103は、予兆検知プログラムの設定画面600において開始ボタン605のクリック入力を検出すると、設定画面600を通じて設定された属性値を採り込み、予兆検知プログラム311に基づいた予兆検知処理の実行を開始する。
予兆検知コンピュータ103は、監視サーバ102から通信装置332を介して監視イベントを受信する。
予兆検知コンピュータ103は、ステップ901で受信した監視イベントの属性「種類」204を取得し、この監視イベントがIT障害イベントか、予兆イベントか判定する。属性「種類」204の値が、設定画面600の予兆イベント種類入力部601に入力された値に含まれていれば予兆イベントであり、IT障害イベント種類入力部602に入力された値に含まれていればIT障害イベントである。予兆イベントでもIT障害イベントでもない監視イベントは、作業領域312、データ格納領域322から削除する。
予兆検知コンピュータ103は、IT障害イベントからIT障害イベント402(図4)を生成し、その後、IT障害イベントブロックの特徴412(図4)を計算する。さらに、予兆検知コンピュータ103は、通信装置332を介してIT障害DB104のIT障害イベントブロックテーブル400及びIT障害特徴テーブル410を更新する。
予兆検知コンピュータ103は、IT障害DB104のIT障害特徴テーブル410を参照し、IT障害イベントブロックと同じ特徴412を持つイベントブロックIDを、イベントブロックIDリスト413から取得する。すなわち、特徴が類似するIT障害イベントブロックを取得する。
で与える。
予兆検知コンピュータ103は、表示装置331を介し、IT障害の検知結果を予兆検知プログラム画面700(図7)のIT障害検知タブ701に表示する。具体的には、今回検知した検知日時をIT障害テーブル710の検知日時712に表示する。
予兆検知コンピュータ103は、ステップ903と同様に、検出された予兆イベントに対して、予兆イベントブロック502(図5)及び予兆イベントブロックの特徴512(図5)を計算する。さらに、予兆検知コンピュータ103は、通信装置332を介して予兆DB105の予兆イベントブロックテーブル500及び予兆特徴テーブル510を更新する。
予兆検知コンピュータ103は、ステップ905と同様に、予兆DB105の予兆特徴テーブル510を参照し、予兆イベントブロックと同じ特徴512を持つイベントブロックIDリスト513を取得する。すなわち、特徴が類似する予兆イベントブロックを取得する。
予兆検知コンピュータ103は、ステップ909で得られた各予兆イベントブロックに対し、想定されるIT障害を予測する。
(P1 1, F1 1)
(P20 1, F14 7, F15 1, F16 13)
(P31 1, F35 8, F36 6, F37 7)
(P1 1 , F1 1)
(P20 1, P21 7, P22 8, P23 7, F15 1)
(P41 5, P42 5, F30 1)
予兆検知コンピュータ103は、ステップ906と同様、表示装置331を介し、予兆結果を予兆検知プログラム画面(図8)の予兆検知タブ801に表示する。具体的には、検知した予兆の日時を予兆テーブル810の検知日時812に追加する。
以上説明したように、本実施例に係る予兆検知装置の場合には、監視イベントの一部を予兆イベントに使用し、検出された予兆イベントと共起する可能性が高い障害イベントを、当該障害イベントの発生前に、自動的に検出することができる。
本発明は上述した形態例に限定されるものでなく、様々な変形例が含まれる。例えば、上述した形態例は、本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある形態例の一部を他の形態例の構成に置き換えることが可能であり、また、ある形態例の構成に他の形態例の構成を加えることも可能である。また、各形態例の構成の一部について、他の構成を追加、削除又は置換することも可能である。
102…監視サーバ
103…予兆検知コンピュータ
104…IT障害DB
105…予兆DB
311…予兆検知プログラム
400…IT障害イベントブロックテーブル
410…IT障害特徴テーブル
500…予兆イベントブロックテーブル
510…予兆特徴テーブル
600…設定画面
601…予兆イベント種類入力部
602…IT障害イベント種類入力部
603…最大イベント時間間隔入力部
604…IT障害検索範囲入力部
701…IT障害検知タブ
801…予兆検知タブ
Claims (6)
- IT障害を監視する監視サーバが生成したイベントを逐次取得して予兆イベント又はIT障害イベントに分類する第一の処理部と、
一つの原因に伴い発生した単数又は複数のイベントから構成される予兆イベントブロック及びIT障害イベントブロックを生成する第二の処理部と、
予兆イベントブロックに属するイベントに頻出する属性値をもとにした特徴情報及びIT障害イベントブロックに属するイベントに頻出する属性値をもとにした特徴情報を求める第三の処理部と、
取得した予兆イベントブロックと特徴情報が類似する予兆イベントブロックを、予兆イベントブロックログから検索する第四の処理部と、
類似する各予兆イベントブロックの発生から一定期間に発生するIT障害イベントブロックを、IT障害イベントブロックログから検索する第五の処理部と、
前記予兆イベントブロックと前記IT障害イベントブロックとの間で共起関係を判定する第六の処理部と、
共起関係が認められたIT障害イベントブロックを、取得された予兆イベントブロックに対する予測IT障害と判定する第七の処理部と
を有することを特徴とするIT障害予兆検知装置。 - 請求項1に記載のIT障害予兆検知装置において、
前記第六の処理部は、ある共通の特徴情報を有する前記予兆イベントブロックと、ある共通の特徴情報を有する前記IT障害イベントブロックとの間で共起関係を判定する
ことを特徴とするIT障害予兆検知装置。 - 請求項2に記載のIT障害予兆検知装置において、
前記第六の処理部は、前記共起関係を与える確率が閾値を越える場合に共起関係が存在すると判定する
ことを特徴とするIT障害予兆検知装置。 - 請求項1に記載のIT障害予兆検知装置において、
共起関係のある予兆イベントブロックとIT障害イベントブロックの発生時間間隔を求め、その最小値を共起関係のあるIT障害イベントブロックが発生するまでの予測時間とする
こととを特徴とするIT障害予兆検知装置。 - 請求項1に記載のIT障害予兆検知装置において、
前記予測IT障害を表示装置に表示する
ことを特徴とするIT障害予兆検知装置。 - コンピュータに、
IT障害を監視する監視サーバが生成したイベントを逐次取得して予兆イベント又はIT障害イベントに分類する第一の処理と、
一つの原因に伴い発生した単数又は複数のイベントから構成される予兆イベントブロック及びIT障害イベントブロックを生成する第二の処理と、
予兆イベントブロックに属するイベントに頻出する属性値をもとにした特徴情報及びIT障害イベントブロックに属するイベントに頻出する属性値をもとにした特徴情報を求める第三の処理と、
取得した予兆イベントブロックと特徴情報が類似する予兆イベントブロックを、予兆イベントブロックログから検索する第四の処理と、
類似する各予兆イベントブロックの発生から一定期間に発生するIT障害イベントブロックを、IT障害イベントブロックログから検索する第五の処理と、
前記予兆イベントブロックと前記IT障害イベントブロックとの間で共起関係を判定する第六の処理と、
共起関係が認められたIT障害イベントブロックを、取得された予兆イベントブロックに対する予測IT障害と判定する第七の処理と
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011068233A JP5623950B2 (ja) | 2011-03-25 | 2011-03-25 | It障害予兆検知装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011068233A JP5623950B2 (ja) | 2011-03-25 | 2011-03-25 | It障害予兆検知装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012203684A true JP2012203684A (ja) | 2012-10-22 |
JP5623950B2 JP5623950B2 (ja) | 2014-11-12 |
Family
ID=47184625
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011068233A Active JP5623950B2 (ja) | 2011-03-25 | 2011-03-25 | It障害予兆検知装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5623950B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017220139A (ja) * | 2016-06-10 | 2017-12-14 | 三菱電機株式会社 | ログ解析装置、ログ解析方法及びログ解析プログラム |
KR101858377B1 (ko) | 2014-02-28 | 2018-05-15 | 미츠비시 쥬고 기카이 시스템 가부시키가이샤 | 감시 장치, 감시 방법 및 프로그램 |
CN111542846A (zh) * | 2018-01-19 | 2020-08-14 | 株式会社日立制作所 | 故障预测系统和故障预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007172131A (ja) * | 2005-12-20 | 2007-07-05 | Nec Fielding Ltd | 障害予測システム、障害予測方法、障害予測プログラム |
JP2010128661A (ja) * | 2008-11-26 | 2010-06-10 | Fujitsu Ltd | 故障原因推測方法、故障原因推測装置、及びプログラム |
-
2011
- 2011-03-25 JP JP2011068233A patent/JP5623950B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007172131A (ja) * | 2005-12-20 | 2007-07-05 | Nec Fielding Ltd | 障害予測システム、障害予測方法、障害予測プログラム |
JP2010128661A (ja) * | 2008-11-26 | 2010-06-10 | Fujitsu Ltd | 故障原因推測方法、故障原因推測装置、及びプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101858377B1 (ko) | 2014-02-28 | 2018-05-15 | 미츠비시 쥬고 기카이 시스템 가부시키가이샤 | 감시 장치, 감시 방법 및 프로그램 |
JP2017220139A (ja) * | 2016-06-10 | 2017-12-14 | 三菱電機株式会社 | ログ解析装置、ログ解析方法及びログ解析プログラム |
CN111542846A (zh) * | 2018-01-19 | 2020-08-14 | 株式会社日立制作所 | 故障预测系统和故障预测方法 |
CN111542846B (zh) * | 2018-01-19 | 2023-08-29 | 株式会社日立制作所 | 故障预测系统和故障预测方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5623950B2 (ja) | 2014-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10868744B2 (en) | Influence range identification method and influence range identification apparatus | |
US20180234328A1 (en) | Service analyzer interface | |
US9424157B2 (en) | Early detection of failing computers | |
US7856575B2 (en) | Collaborative troubleshooting computer systems using fault tree analysis | |
US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
JP6048038B2 (ja) | 情報処理装置,プログラム,情報処理方法 | |
US20170097863A1 (en) | Detection method and information processing device | |
US8516499B2 (en) | Assistance in performing action responsive to detected event | |
US20150121136A1 (en) | System and method for automatically managing fault events of data center | |
JP6260130B2 (ja) | ジョブ遅延検知方法、情報処理装置、およびプログラム | |
US20110314138A1 (en) | Method and apparatus for cause analysis configuration change | |
US20140025995A1 (en) | Large log file diagnostics system | |
JP5521807B2 (ja) | 障害原因推定装置、障害原因推定プログラム及び障害原因推定方法 | |
JP6988304B2 (ja) | 運用管理システム、監視サーバ、方法およびプログラム | |
US20200225938A1 (en) | Version management system and version management method | |
US20190196897A1 (en) | Influence range specifying method, influence range specifying apparatus, and storage medium | |
CN111327685A (zh) | 分布式存储系统数据处理方法、装置及设备和存储介质 | |
JP2014134956A (ja) | 障害分析支援装置、障害分析支援方法、及びプログラム | |
JP5623950B2 (ja) | It障害予兆検知装置及びプログラム | |
US11165665B2 (en) | Apparatus and method to improve precision of identifying a range of effects of a failure in a system providing a multilayer structure of services | |
US20160098473A1 (en) | Grouping method and apparatus | |
JP2014153736A (ja) | 障害予兆検出方法、プログラムおよび装置 | |
JP2016051447A (ja) | 障害分析システム | |
US8688606B2 (en) | Smarter business intelligence systems | |
JP2011209908A (ja) | 障害原因解析システムにおけるルール生成装置及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130724 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140925 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5623950 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |