JP2012059063A5 - - Google Patents

Download PDF

Info

Publication number
JP2012059063A5
JP2012059063A5 JP2010202274A JP2010202274A JP2012059063A5 JP 2012059063 A5 JP2012059063 A5 JP 2012059063A5 JP 2010202274 A JP2010202274 A JP 2010202274A JP 2010202274 A JP2010202274 A JP 2010202274A JP 2012059063 A5 JP2012059063 A5 JP 2012059063A5
Authority
JP
Japan
Prior art keywords
event
conclusion
cause candidate
failure
management system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010202274A
Other languages
English (en)
Other versions
JP5432867B2 (ja
JP2012059063A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2010202274A priority Critical patent/JP5432867B2/ja
Priority claimed from JP2010202274A external-priority patent/JP5432867B2/ja
Priority to PCT/JP2010/068130 priority patent/WO2012032676A1/ja
Priority to US13/055,440 priority patent/US8819220B2/en
Publication of JP2012059063A publication Critical patent/JP2012059063A/ja
Publication of JP2012059063A5 publication Critical patent/JP2012059063A5/ja
Application granted granted Critical
Publication of JP5432867B2 publication Critical patent/JP5432867B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (13)

  1. 監視の対象となるノード装置と、ネットワークを介して前記ノード装置に接続され、前記ノード装置を監視及び管理する管理システムと、を有する計算機システムの管理方法であって、
    前記管理システムが、前記ノード装置の処理性能を示す処理性能値を取得し、当該取得した処理性能値から前記ノード装置に障害が発生したことを検知し、
    前記管理システムが、前記検知した障害を、前記ノード装置で発生し得る1つ以上の条件イベントの組み合わせと前記条件イベントの組み合わせの障害原因とされる結論イベントとの関係を示す解析ルールに適用し、前記ノード装置における障害の発生の可能性を示す情報である確信度を算出し、
    前記管理システムが、複数の障害原因とされる結論イベントの1つを起点原因候補として選択し、前記起点原因候補に関係する前記条件イベントを抽出し、
    前記管理システムが、抽出された前記条件イベントに関係する結論イベントであって、前記起点原因候補の結論イベントとは異なる1つ又は複数の障害原因とされる結論イベントを関連原因候補として選択し、
    前記管理システムが、前記起点原因候補の結論イベントと前記関連原因候補の結論イベントを、他の結論イベントとは別個に分類処理し、
    前記管理システムが、前記分類された結論イベントを表示画面に表示する、
    ことを特徴とする計算機システムの管理方法。
  2. 請求項1において、
    前記管理システムは、前記起点原因候補及び前記関連原因候補に対応する結論イベントの分類結果に従って、前記障害原因とされる結論イベントを分類結果ごとに区別して前記表示画面に表示することを特徴とする計算機システムの管理方法。
  3. 請求項1又は2において、
    前記管理システムは、前記起点原因候補の結論イベントに関係する前記条件イベントと同一の条件イベントを前記解析ルールに少なくとも1つ含む前記関連原因候補の結論イベントを、前記起点原因候補の結論イベントと同一のグループとして分類することを特徴とする計算機システムの管理方法。
  4. 請求項1乃至3の何れか1項において、
    前記管理システムは、前記確信度が最も高い前記結論イベントを前記起点原因候補として選択し、当該起点原因候補の結論イベントに関係する前記条件イベントによって前記関連原因候補の結論イベントを分類することを特徴とする計算機システムの管理方法。
  5. 請求項1乃至4の何れか1項において、
    前記管理システムは、前記複数の障害原因とされる結論イベントにおいて前記起点原因候補を変えて結論イベントの分類処理を繰り返し、全ての前記障害原因とされる結論イベントを分類した後、前記起点原因候補として選択された結論イベント以外の結論イベントが前記起点原因候補として選択された結論イベントに含まれる前記条件イベント以外の条件イベントである残余条件イベントを含むか否か判断し、前記残余条件イベントを含む結論イベントを前記起点原因候補としてさらに分類処理を実行することを特徴とする計算機システムの管理方法。
  6. 請求項2において、
    前記管理システムは、複数の分類グループを含む前記分類結果において、障害対応時にどの分類グループに含まれる前記結論イベントが管理者によって選択されたかについての情報に基づいて、再度分類処理を実行するか決定することを特徴とする計算機システムの管理方法。
  7. 請求項6において、
    前記管理システムは、前記障害対応時に選択された前記結論イベントを前記起点原因候補として前記分類処理を再度実行することを特徴とする計算機システムの管理方法。
  8. 監視対象のノード装置とネットワークを介して接続され、前記ノード装置を管理する管理システムであって、
    前記ノード装置の処理性能を示す処理性能値を取得し、当該取得した処理性能値から前記ノード装置の状態を検知するプロセッサと、
    前記ノード装置で発生し得る1つ以上の条件イベントの組み合わせと前記条件イベントの組み合わせの障害原因とされる結論イベントとの関係を示す解析ルールを格納するメモリと、を有し、
    前記プロセッサは、
    前記検知した状態を前記解析ルールに適用し、前記ノード装置における障害の発生の可能性を示す情報である確信度を算出し、
    複数の障害原因とされる結論イベントの1つを起点原因候補として選択し、前記起点原因候補に関係する前記条件イベントを抽出し、
    抽出された前記条件イベントに関係する結論イベントであって、前記起点原因候補の結論イベントとは異なる1つ又は複数の障害原因とされる結論イベントを関連原因候補として選択し、
    前記起点原因候補の結論イベントと前記関連原因候補の結論イベントを、他の結論イベントとは別個に分類処理し、
    前記分類された結論イベントを表示画面に表示する、
    ことを特徴とする管理システム。
  9. 請求項8において、
    前記プロセッサは、前記起点原因候補及び前記関連原因候補に対応する結論イベントの分類結果に従って、前記障害原因とされる結論イベントを分類結果ごとに区別して前記表示画面に表示することを特徴とする管理システム。
  10. 請求項8又は9において、
    前記プロセッサは、前記起点原因候補の結論イベントに関係する前記条件イベントと同一の条件イベントを前記解析ルールに少なくとも1つ含む前記関連原因候補の結論イベントを、前記起点原因候補の結論イベントと同一のグループとして分類することを特徴とする管理システム。
  11. 請求項8乃至10の何れか1項において、
    前記プロセッサは、前記確信度が最も高い前記結論イベントを前記起点原因候補として選択し、当該起点原因候補の結論イベントに関係する前記条件イベントによって前記関連原因候補の結論イベントを分類することを特徴とする管理システム。
  12. 請求項8乃至11の何れか1項において、
    前記プロセッサは、前記複数の障害原因とされる結論イベントにおいて前記起点原因候補を変えて結論イベントの分類処理を繰り返し、全ての前記障害原因とされる結論イベントを分類した後、前記起点原因候補として選択された結論イベント以外の結論イベントが前記起点原因候補として選択された結論イベントに含まれる前記条件イベント以外の条件イベントである残余条件イベントを含むか否か判断し、前記残余条件イベントを含む結論イベントを前記起点原因候補としてさらに分類処理を実行することを特徴とする管理システム。
  13. 請求項9において、
    前記プロセッサは、複数の分類グループを含む前記分類結果において、障害対応時にどの分類グループに含まれる前記結論イベントが管理者によって選択されたかについての情報に基づいて、再度分類処理を実行するか決定し、前記分類処理を再度実行すると決定した場合には、前記障害対応時に選択された前記結論イベントを前記起点原因候補として前記分類処理を再度実行することを特徴とする管理システム。
JP2010202274A 2010-09-09 2010-09-09 計算機システムの管理方法、及び管理システム Active JP5432867B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010202274A JP5432867B2 (ja) 2010-09-09 2010-09-09 計算機システムの管理方法、及び管理システム
PCT/JP2010/068130 WO2012032676A1 (ja) 2010-09-09 2010-10-15 計算機システムの管理方法、及び管理システム
US13/055,440 US8819220B2 (en) 2010-09-09 2010-10-15 Management method of computer system and management system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010202274A JP5432867B2 (ja) 2010-09-09 2010-09-09 計算機システムの管理方法、及び管理システム

Publications (3)

Publication Number Publication Date
JP2012059063A JP2012059063A (ja) 2012-03-22
JP2012059063A5 true JP2012059063A5 (ja) 2013-03-07
JP5432867B2 JP5432867B2 (ja) 2014-03-05

Family

ID=45810290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010202274A Active JP5432867B2 (ja) 2010-09-09 2010-09-09 計算機システムの管理方法、及び管理システム

Country Status (2)

Country Link
JP (1) JP5432867B2 (ja)
WO (1) WO2012032676A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014013603A1 (ja) * 2012-07-20 2014-01-23 株式会社日立製作所 監視システム及び監視プログラム
US9244800B2 (en) 2012-09-03 2016-01-26 Hitachi, Ltd. Management system for managing computer system comprising multiple monitoring-target devices
JP6080862B2 (ja) * 2012-10-30 2017-02-15 株式会社日立製作所 管理計算機およびルール生成方法
JP2014126948A (ja) 2012-12-25 2014-07-07 International Business Maschines Corporation 管理対象の状態に基づいて管理情報を出力する装置、方法およびプログラム
CN104583968B (zh) * 2013-04-05 2017-08-04 株式会社日立制作所 管理系统及管理程序
CN104903866B (zh) * 2013-11-29 2017-12-15 株式会社日立制作所 对事件根本原因的分析予以支援的管理系统以及方法
JP5993052B2 (ja) * 2015-03-23 2016-09-14 株式会社日立製作所 複数の監視対象デバイスを有する計算機システムの管理を行う管理システム
EP3323046A4 (en) * 2015-07-14 2019-04-24 Sios Technology Corporation DEVICE AND METHOD FOR USING MACHINE LEARNING BASICS FOR CAUSE ANALYSIS AND CORRECTION IN COMPUTER ENVIRONMENTS
JP6181134B2 (ja) * 2015-11-02 2017-08-16 株式会社東芝 要因解析装置、要因解析方法、及びプログラム
JP7025646B2 (ja) * 2018-11-02 2022-02-25 日本電信電話株式会社 監視保守方法、監視保守装置及び監視保守プログラム
JP7208505B2 (ja) * 2019-03-11 2023-01-19 富士通株式会社 判定方法、情報処理装置および判定プログラム
CN113361722B (zh) * 2020-03-06 2024-05-31 华晨宝马汽车有限公司 辅助解决生产设备故障的方法和装置及存储介质
JP7012778B2 (ja) * 2020-05-14 2022-01-28 株式会社日立製作所 監視システム、監視装置及び監視方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03145846A (ja) * 1989-11-01 1991-06-21 Hitachi Ltd 障害診断方法
JP2000020428A (ja) * 1998-07-07 2000-01-21 Sumitomo Electric Ind Ltd ネットワーク管理システム
JP4584853B2 (ja) * 2006-03-17 2010-11-24 富士通株式会社 被疑箇所特定装置および処理方法
JP2008059102A (ja) * 2006-08-30 2008-03-13 Fujitsu Ltd コンピュータ資源監視プログラム
JP5215895B2 (ja) * 2009-02-04 2013-06-19 株式会社日立ソリューションズ 障害原因解析システム及びプログラム

Similar Documents

Publication Publication Date Title
JP2012059063A5 (ja)
CN106104496B (zh) 用于任意时序的不受监督的异常检测
US11516237B2 (en) Visualization and control of remotely monitored hosts
CN104410535B (zh) 一种云资源智能监控告警方法
US10354197B2 (en) Pattern analytics for real-time detection of known significant pattern signatures
US20170139759A1 (en) Pattern analytics for real-time detection of known significant pattern signatures
JP2013084074A5 (ja)
US10642818B2 (en) Causal analysis device, causal analysis method, and non-transitory computer readable storage medium
JP2018173970A5 (ja)
US9736031B2 (en) Information system construction assistance device, information system construction assistance method, and information system construction assistance program
JP2013114356A5 (ja)
JP2015207106A (ja) イベント発生場所推定方法、イベント発生場所推定プログラムおよびイベント発生場所推定装置
US20140215056A1 (en) Methods and systems for online monitoring using a variable data sampling rate
JP2016531352A5 (ja)
JP2019121162A (ja) 監視装置、監視方法および監視プログラム
JP2018190029A (ja) 施設監視装置
RU2017102903A (ru) Система и способ для идентификации релевантной информации для предприятия
US10002041B1 (en) System and method for maintaining the health of a machine
US20200233734A1 (en) Wait-and-see candidate identification apparatus, wait-and-see candidate identification method, and computer readable medium
JP2019067139A (ja) 監視装置、監視方法、監視プログラム、表示装置、表示方法および表示プログラム
JP2014153736A (ja) 障害予兆検出方法、プログラムおよび装置
JP2020197777A (ja) 監視装置、および監視システム
JP6060123B2 (ja) 影響範囲特定装置、影響範囲特定方法、及びプログラム
CN115102838A (zh) 服务器宕机风险的应急处理方法和装置、电子设备
JP6223897B2 (ja) 異常検知装置及び異常検知システム