JP2008204134A - 異常兆候検出対処システム - Google Patents

異常兆候検出対処システム Download PDF

Info

Publication number
JP2008204134A
JP2008204134A JP2007038968A JP2007038968A JP2008204134A JP 2008204134 A JP2008204134 A JP 2008204134A JP 2007038968 A JP2007038968 A JP 2007038968A JP 2007038968 A JP2007038968 A JP 2007038968A JP 2008204134 A JP2008204134 A JP 2008204134A
Authority
JP
Japan
Prior art keywords
policy
failure
abnormality
countermeasure
coping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007038968A
Other languages
English (en)
Inventor
Akira Sasaki
朗 佐々木
Yoshiyuki Hirakawa
喜之 平川
Hiroyuki Koga
弘之 小賀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Electronics Services Co Ltd
Original Assignee
Hitachi Electronics Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Electronics Services Co Ltd filed Critical Hitachi Electronics Services Co Ltd
Priority to JP2007038968A priority Critical patent/JP2008204134A/ja
Publication of JP2008204134A publication Critical patent/JP2008204134A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】障害発生の予測内容に対応したポリシーの自動実行が可能となり、対応したポリシーがない場合はポリシーの作成を促し、ポリシーを登録させることができ、ポリシー実行した効果を測定することにより、効果がないと判断した場合は、ポリシーを変更させることができるシステムを提供する。
【解決手段】顧客コンピュータシステムの異常の兆候を検出する予兆検知システム54と、予兆検知システムにより検出されたその異常の兆候により予測される障害内容を事前対処により回避するためにポリシーを自動選択して、選択したポリシーを顧客コンピュータ11,12で自動的に実行する自動対処システム13と、を備える異常兆候検出対処システム。
【選択図】図1

Description

本発明は、異常兆候検出対処システムに関し、特にコンピュータシステムの異常の兆候を検出して、その異常を回避するためのポリシーを自動選択して自動的に実行することにより異常の兆候に対して対処することができる異常兆候検出対処システムに関する。
現行の監視システム等がコンピュータシステムを監視する場合には、コンピュータ業務の異常が発生した後において異常状態の検知や業務のしきい値(利用率、業務遅延等)を越えることにより、コンピュータ業務の異常検出をすることができる。しかし、コンピュータ業務が正常に稼動している段階では、異常につながる兆候を検出することができない。
システムの自動運転においては、業務の異常検出を以下の方法で実現しているために、異常を検知した後に、ポリシーによる自動対処が実施される。
(1)業務からの異常メッセージによる業務の異常検出。
(2)業務の異常終了による業務の異常検出。
(3)リソース、および業務のしきい値(利用率、業務遅延等)越えによる異常検出。
さらに、障害発生後に行う対処の決定方法および実行する技術としては、障害事例を検索して、その事例から対処方法を決定して実行する技術が存在する(例えば、特許文献1を参照)。
特開2005−222377号公報
従来のシステムは、以下の問題があった。
(1)障害が発生した後の回復操作を行うポリシーや代替手段等を確保するポリシーでは、事前対処に適用できない。
(2)事前対処のポリシーに効果があるかを確認する必要があり、効果がなかった場合にはポリシーを変更する必要がある。
本発明は、システムの異常の兆候を検知した後に、その異常を回避するためのポリシーを自動選択し、選択したポリシーをお客様コンピュータで自動的に実行することにより、障害発生を未然に防ぐことができ、ポリシーが用意されていない場合は、管理者に新たにポリシーの作成を促し、作成されたポリシーを実施して、ポリシー実行の効果を判定し、判定の結果効果がなかった場合は、管理者にポリシーの変更を促し、次回以降、同様の障害を予兆した場合には変更されたポリシーを実行することができる異常兆候検出対処システムを提供することを目的とする。
本発明は、顧客コンピュータシステムの異常の兆候を検出する予兆検知システムと、前記予兆検知システムにより検出されたその前記異常の兆候により予測される障害内容を事前対処により回避するためにポリシーを自動選択して、選択した前記ポリシーを顧客コンピュータで自動的に実行する自動対処システムと、を備える異常兆候検出対処システムである。
また、本発明は、前記自動対処システムが、前記事前対処のための前記ポリシーを実行した結果、前記ポリシーの実施の効果があるかを測定するための効果判定部を有する異常兆候検出対処システムである。
そして、本発明は、前記自動対処システムが、前記事前対処のために予測された障害内容に対する前記ポリシーが存在しない場合に、前記障害内容に対応付けられたポリシーを作成し、作成されたポリシーを前記障害内容に対応付けるための対処ポリシー設定部を有する異常兆候検出対処システムである。
更に、本発明は、前記自動対処システムが、実行したポリシーに実行効果が無かった場合に、前記ポリシーを変更し、変更したポリシーを前記障害内容に対応付けるための対処ポリシー設定部を有する異常兆候検出対処システムである。
本発明によれば、システムの異常の兆候を検知した後に、その異常を回避するためのポリシーを自動選択し、選択したポリシーをお客様コンピュータで自動的に実行することにより、障害発生を未然に防ぐことができる。
本発明を実施するための最良の形態を説明する。
本発明の異常兆候検出対処システムの実施例について、図面を用いて説明する。図1は、実施例の異常兆候検出対処システムを示している。本実施例の異常兆候検出対処システムは、お客様(顧客)システム10と保守サービス会社50に設置された監視システム49を備える。
お客様システム10は、複数のお客様コンピュータ11,12と、自動対処システム13と、管理者用コンピュータ25を有する。複数のお客様コンピュータ11,12と自動対処システム13は、システムバス14により接続されている。自動対処システム13は、対処ポリシー設定部20、対処方法決定部21、対処処理実行部22及び効果判定部23を有する。
自動対処システム13は、DB(データベース)26を接続しており、DB26は対処27とポリシー28を格納する。
一方、保守サービス会社50には監視システム49が設置されており、監視システム49は、情報収集部51、障害検知部52、DB53及び予兆検知システム54を有している。
DB53は、稼働データ60と障害データ61を格納する。情報収集部51から稼働データが供給される。障害検知部52から障害データ61が供給される。DB53は、予兆検知システム54に接続される。
予兆検知システム54は、障害監視部62と異常兆候監視部63と過去の障害の照合64を有している。予兆監視システム54からは、メールにより障害の兆候通知70を管理者に通知できる。また、予兆監視システム54からは、メールにより障害の兆候通知71を自動対処システム13に通知できる。障害検知部52からは、メールにより障害通知72を自動対処システム13に通知できる。
図2は、異常兆候検出対処システムをより具体的に示す具体例1を示している。図3は、具体例1における対処方法決定部21と対処処理実行部22による処理手順の説明図である。具体例1における対処方法決定部21と対処処理実行部22による処理手順を、図2及び図3を参照しながら説明する。ステップS1で、管理者は、保守サービス会社50の監視システム49の予兆検知システム54から障害の兆候通知70のメールを受信する。次に、ステップS2で、管理者は、障害の兆候通知70のメールの種類が障害予測メール80であるか障害発生メール81であるかを判断するか、またはイベントが発生したかどうかを判断する。
ステップS2において、障害予測メール80が送られたと判断すると、ステップS3において、対処方法決定部21はポリシーデータベース28から予測された障害内容に対応づけられたポリシーの取り出しを行う。ステップS4で、予測された障害内容にポリシーが対応付けられているかどうかを判断して、予測された障害内容にポリシーが対応付けられている場合には、ステップS5において、ポリシーがすでに登録済みであるかを判断する。
ポリシーが登録済みである場合には、対処処理実行部22は、ステップS6において、ポリシーをお客様システム10のコンピュータ11、12に対して実施し、ステップS7で、障害予測メールの予測時間を過ぎるとイベントを発生させることができる時間オーバーイベント発生処理を登録し、処理を終了する。この場合の予兆データの管理テーブル100の一例が図2に示されている。
ステップS4において、予測された障害内容にポリシーが対応付けされていないと、この後は図4の対処ポリシー設定部20における処理に移る。
図4は、具体例1における対処ポリシー設定部20による障害とポリシー対応付け処理の説明図である。ステップS10で、障害内容とポリシーの対応付け依頼を管理者にメールで通知する。ステップS11で、管理者は、ポリシー対応付け機能を起動し、ポリシー対応付け作業を行って障害内容とポリシーを対応付ける。ステップS12で、ポリシー対応付け内容を対処DB27に登録し、処理を終了する。
ステップS5において、ポリシーが登録済みで無い場合には、図5の対処ポリシー設定部20による処理に移る。
図5は、具体例1における対処ポリシー設定部20によるポリシー作成処理の説明図である。具体例1における対処ポリシー設定部20によるポリシー作成処理を、図2と図5のフロー図を参照しながら説明する。ステップS20で、ポリシー作成依頼を管理者にメールで通知する。ステップS21で、管理者は、ポリシー作成機能を起動して、ポリシー作成作業によりポリシーを作成する。そして、ステップS22で、新たにできあがったポリシーをポリシーDB28に登録し、処理を終了する。
ステップS2において、メールの種類の判断またはイベントが発生したかどうかの判断をし、図6に示す障害発生メール72が送られる場合には、図6に示す具体例2に移る。
図6は、本実施例の異常兆候検出対処システムにおける具体例2の説明図である。図7は、具体例2における対処ポリシー設定部20によるポリシー変更処理の説明図である。異常兆候検出対処システムにおける具体例2を、図6と図7のフロー図を参照して説明する。
図7において、ステップS30で、ポリシー実施の効果がないと判断し、時間オーバーイベント発生処理を削除する。ステップS31で、ポリシー変更依頼を管理者にメールで通知する。ステップS32で、管理者は、ポリシーの変更機能を起動してポリシーの変更作業を行ってポリシーを変更し、ステップS33で、ポリシー変更内容をポリシーデータベース28に記録し、処理を終了する。
ステップS2において時間オーバーイベントが発生すると、効果判定部23は、ステップS8においてポリシー実施の効果が有ると判断し、時間オーバーイベント発生処理を削除する。そして、ステップS9において、ポリシー実行により障害を回避できたことを、障害の予兆に対する対処成功報告として、管理者にメールで通知し、処理を終了する。
上述したように、本発明の実施例では、次のように処理を行うことができる。
(1)予兆検知システム54によりシステムの異常の兆候を検知すると、障害予測メールを自動対処システム13側に通知する。予兆検知システム54からの障害予測メールを受信すると、自動対処システム13の対処方法決定部21は、事前対処用のデータベース26のポリシーデータベース28から、障害予測内容にあらかじめ対応づけられたポリシーを取り出して、対処処理実行部22で実行する。
事前対処用のデータベース26のポリシーデータベース28にはポリシーが対応付けられていない場合や、あるいはポリシーが登録されていない場合には、対処ポリシー設定部20が管理者に対してポリシーの登録を促して、ポリシーの対応付けやポリシーの登録を行う。
効果判定部23において、障害予測メールの障害発生予測時間までの間に、監視システム49から障害発生メールが届かなければ、ポリシー実施の効果ありとして判断する。逆に、障害発生メールが障害発生予測時間までに届いた場合、ポリシー実施の効果なしとして判断し、対処ポリシー設定部20が管理者に対し、ポリシーの変更を促してポリシーを変更する。
実施例の異常兆候検出対処システムは、日々の業務の稼働状態を把握して、通常の稼働状態として記録しておき、過去の稼働状態と現在の稼働状態を比較することで、業務が停止もしくは処理に異常が発生する前にこの異常の兆候を掴み、過去の対処内容や対応ポリシーを基にして、自動的に異常の兆候に対処する。このため、システムの異常の兆候を検知した後に、その異常を回避するためのポリシーを自動選択し、選択したポリシーをお客様コンピュータ11,12で自動的に実行することにより、障害発生を未然に防ぐことができる。
なお、ポリシーが用意されていない場合は、管理者に新たにポリシーの作成を促して、作成されたポリシーを実施することができる。
また、ポリシー実行の効果を判定して、ポリシー実行の効果がなかった場合には、管理者にポリシーの変更を促して、次回以降では同様の障害を予兆した場合には変更されたポリシーを実行する。
実施例の異常兆候検出対処システムは、お客様コンピュータシステムの異常の兆候を検出する予兆検知システム54と、予兆検知システムにより検出されたその異常の兆候により予測される障害内容を事前対処により回避するためにポリシーを自動選択して、選択したポリシーをお客様コンピュータ11,12で自動的に実行する自動対処システム13と、を備える。これにより、システムの異常の兆候を検知した後に、その異常を回避するためのポリシーを自動選択し、選択したポリシーをお客様コンピュータで自動的に実行することにより、障害発生を未然に防ぐことができ、障害発生の予測内容に対応したポリシーの自動的な実行が可能になる。
また、実施例の異常兆候検出対処システムでは、自動対処システム13は、事前対処のためのポリシーを実行した結果、ポリシーの実施の効果があるかを測定するための効果判定部23を有する。これにより、ポリシー実行した効果を測定することにより、効果が無いと判断した場合には、ポリシーを変更させることができる。
そして、実施例の異常兆候検出対処システムでは、自動対処システム13は、事前対処のために予測された障害内容に対するポリシーが存在しない場合には、障害内容に対応付けられたポリシーを作成してこの作成されたポリシーを障害内容に対応付けるための対処ポリシー設定部20を有する。これにより、対応したポリシーが無い場合には、ポリシーの作成を促し、ポリシーを登録させることができる。
更に、実施例の異常兆候検出対処システムでは、自動対処システム13は、実行したポリシーにこのポリシーの実行の効果が無かった場合には、ポリシーを変更してこの変更したポリシーを前記障害内容に対応付けるための対処ポリシー設定部20を有する。これにより、ポリシーの実行の効果が無かった場合には、ポリシーを変更して障害内容に対応させることができ、次回以降、同様の障害を予兆した場合には変更されたポリシーを実行することができる。
ところで、本発明は、上記実施例に限定されず、特許請求の範囲を逸脱しない範囲で、種々の変形例を採用できる。
実施例の異常兆候検出対処システムの説明図。 実施例の異常兆候検出対処システムにおける具体例1の説明図。 具体例1における対処方法決定部による処理手順の説明図。 具体例1における対処ポリシー設定部による障害とポリシー対応付け処理の説明図。 具体例1における対処ポリシー設定部によるポリシー作成処理の説明図。 実施例の異常兆候検出対処システムにおける具体例2の説明図。 具体例2における対処ポリシー設定部によるポリシー変更処理の説明図。
符号の説明
10 お客様システム
11,12 お客様コンピュータ
13 自動対処システム
20 対処ポリシー設定部
21 対処方法決定部
22 対処処理実行部
23 効果判定部
25 管理者用コンピュータ
27 対処データベース
28 ポリシーデータベース
49 監視システム
50 保守サービス会社側システム
54 予兆検知システム

Claims (4)

  1. 顧客コンピュータシステムの異常の兆候を検出する予兆検知システムと、前記予兆検知システムにより検出されたその前記異常の兆候により予測される障害内容を事前対処により回避するためにポリシーを自動選択して、選択した前記ポリシーを顧客コンピュータで自動的に実行する自動対処システムと、を備えることを特徴とする異常兆候検出対処システム。
  2. 前記自動対処システムは、前記事前対処のための前記ポリシーを実行した結果、前記ポリシーの実施の効果があるかを測定するための効果判定部を有する請求項1に記載の異常兆候検出対処システム。
  3. 前記自動対処システムは、前記事前対処のために予測された障害内容に対する前記ポリシーが存在しない場合に、前記障害内容に対応付けられたポリシーを作成し、作成されたポリシーを前記障害内容に対応付けるための対処ポリシー設定部を有する請求項1または請求項2に記載の異常兆候検出対処システム。
  4. 前記自動対処システムは、実行したポリシーに実行効果が無かった場合に、前記ポリシーを変更し、変更したポリシーを前記障害内容に対応付けるための対処ポリシー設定部を有する請求項3に記載の異常兆候検出対処システム。
JP2007038968A 2007-02-20 2007-02-20 異常兆候検出対処システム Pending JP2008204134A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007038968A JP2008204134A (ja) 2007-02-20 2007-02-20 異常兆候検出対処システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007038968A JP2008204134A (ja) 2007-02-20 2007-02-20 異常兆候検出対処システム

Publications (1)

Publication Number Publication Date
JP2008204134A true JP2008204134A (ja) 2008-09-04

Family

ID=39781583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007038968A Pending JP2008204134A (ja) 2007-02-20 2007-02-20 異常兆候検出対処システム

Country Status (1)

Country Link
JP (1) JP2008204134A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017220139A (ja) * 2016-06-10 2017-12-14 三菱電機株式会社 ログ解析装置、ログ解析方法及びログ解析プログラム
WO2018163280A1 (ja) * 2017-03-07 2018-09-13 株式会社日立製作所 予兆検知装置及び予兆検知方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148538A (ja) * 1998-11-09 2000-05-30 Ntt Data Corp コンピュータ障害の対処方法、障害対処システム
JP2005346331A (ja) * 2004-06-02 2005-12-15 Nec Corp 障害復旧装置および障害復旧方法、マネージャ装置並びにプログラム
JP2007034739A (ja) * 2005-07-27 2007-02-08 Nec Corp 管理支援システム、管理支援方法、および管理支援プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148538A (ja) * 1998-11-09 2000-05-30 Ntt Data Corp コンピュータ障害の対処方法、障害対処システム
JP2005346331A (ja) * 2004-06-02 2005-12-15 Nec Corp 障害復旧装置および障害復旧方法、マネージャ装置並びにプログラム
JP2007034739A (ja) * 2005-07-27 2007-02-08 Nec Corp 管理支援システム、管理支援方法、および管理支援プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017220139A (ja) * 2016-06-10 2017-12-14 三菱電機株式会社 ログ解析装置、ログ解析方法及びログ解析プログラム
WO2018163280A1 (ja) * 2017-03-07 2018-09-13 株式会社日立製作所 予兆検知装置及び予兆検知方法

Similar Documents

Publication Publication Date Title
EP3356985B1 (en) Detection of security incidents with low confidence security events
US10462027B2 (en) Cloud network stability
JP4892367B2 (ja) 異常兆候検出システム
WO2015169199A1 (zh) 分布式环境下虚拟机异常恢复方法
CA2734169A1 (en) Protecting a virtualization system against computer attacks
US7716527B2 (en) Repair system
US20070168201A1 (en) Formula for automatic prioritization of the business impact based on a failure on a service in a loosely coupled application
CN109062723A (zh) 服务器故障的处理方法和装置
US20140372803A1 (en) Apparatus and method for analyzing abnormal states of component-based system
WO2018035765A1 (zh) 网络异常的检测方法及装置
JP2008204134A (ja) 異常兆候検出対処システム
JP5503177B2 (ja) 障害情報収集装置
CN109271270A (zh) 存储系统中底层硬件的故障排除方法、系统及相关装置
JP5240709B2 (ja) シンプトンを評価するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
US20160224406A1 (en) Automated remote network target computing device issue resolution
JP5803246B2 (ja) ネットワーク運用管理システム、ネットワーク監視サーバ、ネットワーク監視方法およびプログラム
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备
EP2495660A1 (en) Information processing device and method for controlling information processing device
US20220309171A1 (en) Endpoint Security using an Action Prediction Model
JP5613570B2 (ja) バッチジョブ遅延警告自動発報システムおよび自動発報方法、ならびにそのためのプログラム
JP2018028798A (ja) 情報処理装置及びプログラム
JP6041727B2 (ja) 管理装置、管理方法及び管理プログラム
JP2001022717A (ja) 分散環境の運用管理システムに関する誤操作判別方法
US20150101036A1 (en) Network filtering device, network filtering method and computer-readable recording medium having stored therein a program
JP5978804B2 (ja) システムを管理するためのプログラム、方法及び情報処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081024

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110509

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111129