JP5910727B2 - 運用管理装置、運用管理方法、及び、プログラム - Google Patents
運用管理装置、運用管理方法、及び、プログラム Download PDFInfo
- Publication number
- JP5910727B2 JP5910727B2 JP2014504679A JP2014504679A JP5910727B2 JP 5910727 B2 JP5910727 B2 JP 5910727B2 JP 2014504679 A JP2014504679 A JP 2014504679A JP 2014504679 A JP2014504679 A JP 2014504679A JP 5910727 B2 JP5910727 B2 JP 5910727B2
- Authority
- JP
- Japan
- Prior art keywords
- correlation
- configuration change
- destruction
- monitored device
- correlation destruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M99/00—Subject matter not provided for in other groups of this subclass
- G01M99/008—Subject matter not provided for in other groups of this subclass by doing functionality tests
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M99/00—Subject matter not provided for in other groups of this subclass
- G01M99/005—Testing of complete machines, e.g. washing-machines or mobile phones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
Description
次に、本発明の第1の実施の形態について説明する。
次に、本発明の第2の実施の形態について説明する。本発明の第2の実施の形態においては、構成変更検出部107が、相関モデル122をもとに構成変更を検出する点において、本発明の第1の実施の形態と異なる。
100 運用管理装置
101 情報収集部
102 相関モデル生成部
103 相関破壊検出部
104 障害分析部
105 対話部
106 対処実行部
107 構成変更検出部
108 相関破壊パターン更新部
111 性能情報記憶部
112 相関モデル記憶部
113 相関破壊記憶部
114 相関破壊パターン記憶部
117 構成情報記憶部
121 性能系列情報
122 相関モデル
123 相関破壊情報
124 相関破壊パターン
125 構成変更検出ルール
126 相関破壊パターン更新ルール
127 構成情報
128 相関マップ
200 分析対象システム
201 被監視装置
300 構成変更検出画面
301 異常度グラフ
302 構成変更検出情報
303 ボタン
304 相関関係変化情報
310 分析結果出力画面
311 障害候補情報
Claims (10)
- システムの複数のメトリックの内の異なる2つのメトリック間の相関関係を示す相関関数を1以上含む相関モデルを生成する相関モデル生成手段と、
前記システムの構成変更の有無を検出する構成変更検出手段と、
前記構成変更検出手段により前記システムの構成変更が検出された場合に、前記システムの構成変更後の前記複数のメトリックの計測値をもとに生成された相関モデルを用いて、前記システムの障害要因を特定する障害分析手段と
を含む運用管理装置。 - 相関モデルに含まれる相関関係の破壊を相関破壊と定義したときに、
前記障害分析手段は、前記複数のメトリックの新たな計測値に対して検出された相関破壊の状態と、前記システムの過去の障害時における相関破壊の状態を示す相関破壊パターンと、を比較することにより、前記システムの障害要因を特定し、
さらに、前記構成変更検出手段により前記システムの構成変更が検出された場合に、前記相関破壊パターンを、前記構成変更後に用いられる相関モデルに適合するように補正する、相関破壊パターン更新手段を含む
請求項1に記載の運用管理装置。 - 前記構成変更検出手段は、前記システムに含まれる1以上の被監視装置の各々の属性情報の変化をもとに、前記システムの構成変更の有無を検出する
請求項1に記載の運用管理装置。 - 前記構成変更検出手段は、前記相関モデル生成手段により生成される相関モデルの変化をもとに、前記システムの構成変更の有無を検出する
請求項1に記載の運用管理装置。 - 相関モデルに含まれる相関関係の破壊を相関破壊と定義したときに、
前記障害分析手段は、前記複数のメトリックの新たな計測値に対して検出された相関破壊の状態と、前記システムの過去の障害時における相関破壊の状態を示す相関破壊パターンと、を比較することにより、前記システムの障害要因を特定し、
さらに、前記構成変更検出手段により前記システムの構成変更が検出された場合に、前記相関破壊パターンを、前記構成変更後に用いられる相関モデルに適合するように補正する、相関破壊パターン更新手段を含み、
前記相関破壊パターンは、相関モデルに含まれる1以上の相関関係の各々の相関破壊の有無を示し、
前記相関破壊パターン更新手段は、
前記構成変更検出手段により前記システムに含まれる第1の被監視装置の、当該第1の被監視装置と同じ構成を有する第2の被監視装置との置換が検出された場合、前記相関破壊パターンにおける当該第1の被監視装置に係る相関関係の相関破壊の有無の情報を、当該第2の被監視装置に係る相関関係の相関破壊の有無の情報に修正し、
前記構成変更検出手段により前記システムに含まれる第1の被監視装置と同じ構成を有する第2の被監視装置の追加が検出された場合、前記相関破壊パターンにおける当該第1の被監視装置に係る相関関係の相関破壊の有無の情報から、当該第2の被監視装置に係る相関関係の相関破壊の有無の情報を生成して、前記相関破壊パターンに追加する
請求項3または4に記載の運用管理装置。 - 相関モデルに含まれる相関関係の破壊を相関破壊と定義したときに、
前記障害分析手段は、前記複数のメトリックの新たな計測値に対して検出された相関破壊の状態と、前記システムの過去の障害時における相関破壊の状態を示す相関破壊パターンと、を比較することにより、前記システムの障害要因を特定し、
さらに、前記構成変更検出手段により前記システムの構成変更が検出された場合に、前記相関破壊パターンを、前記構成変更後に用いられる相関モデルに適合するように補正する、相関破壊パターン更新手段を含み、
前記相関破壊パターンは、相関モデルに含まれる1以上の相関関係の各々の相関破壊の有無を示し、
前記相関破壊パターン更新手段は、
前記構成変更検出手段により前記システムに含まれる第1の被監視装置と第2の被監視装置との間の相関関係の当該第1の被監視装置と第3の被監視装置との間への移動が検出された場合、前記相関破壊パターンにおける当該第1の被監視装置と当該第2の被監視装置との間の相関関係の相関破壊の有無の情報を、当該第1の被監視装置と当該第3の被監視装置との間へ移動した相関関係の相関破壊の有無の情報に修正し、
前記構成変更検出手段により前記システムに含まれる第1の被監視装置と第2の被監視装置との間の相関関係の当該第1の被監視装置と第3の被監視装置との間への追加が検出された場合、前記相関破壊パターンにおける当該第1の被監視装置と当該第2の被監視装置との間の相関関係の相関破壊の有無の情報から、当該第1の被監視装置と当該第3の被監視装置との間の追加された相関関係の相関破壊の有無の情報を生成して、前記相関破壊パターンに追加する
請求項4に記載の運用管理装置。 - システムの複数のメトリックの内の異なる2つのメトリック間の相関関係を示す相関関数を1以上含む相関モデルを生成し、
前記システムの構成変更の有無を検出し、
前記システムの構成変更が検出された場合に、前記システムの構成変更後の前記複数のメトリックの計測値をもとに生成された相関モデルを用いて、前記システムの障害要因を特定する
運用管理方法。 - 相関モデルに含まれる相関関係の破壊を相関破壊と定義したときに、
前記システムの構成変更が検出された場合に、前記システムの過去の障害時における相関破壊の状態を示す相関破壊パターンを、前記構成変更後に用いられる相関モデルに適合するように補正し、
前記複数のメトリックの新たな計測値に対して検出された相関破壊の状態と、前記相関破壊パターンと、を比較することにより、前記システムの障害要因を特定する
請求項7に記載の運用管理方法。 - コンピュータに、
システムの複数のメトリックの内の異なる2つのメトリック間の相関関係を示す相関関数を1以上含む相関モデルを生成し、
前記システムの構成変更の有無を検出し、
前記システムの構成変更が検出された場合に、前記システムの構成変更後の前記複数のメトリックの計測値をもとに生成された相関モデルを用いて、前記システムの障害要因を特定する
処理を実行させるプログラム。 - 相関モデルに含まれる相関関係の破壊を相関破壊と定義したときに、
前記システムの構成変更が検出された場合に、前記システムの過去の障害時における相関破壊の状態を示す相関破壊パターンを、前記構成変更後に用いられる相関モデルに適合するように補正し、
前記複数のメトリックの新たな計測値に対して検出された相関破壊の状態と、前記相関破壊パターンと、を比較することにより、前記システムの障害要因を特定する処理を実行させる
請求項9に記載のプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012057337 | 2012-03-14 | ||
JP2012057337 | 2012-03-14 | ||
PCT/JP2013/001480 WO2013136739A1 (ja) | 2012-03-14 | 2013-03-08 | 運用管理装置、運用管理方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2013136739A1 JPWO2013136739A1 (ja) | 2015-08-03 |
JP5910727B2 true JP5910727B2 (ja) | 2016-04-27 |
Family
ID=49160671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014504679A Active JP5910727B2 (ja) | 2012-03-14 | 2013-03-08 | 運用管理装置、運用管理方法、及び、プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20150046123A1 (ja) |
EP (1) | EP2827251B1 (ja) |
JP (1) | JP5910727B2 (ja) |
CN (1) | CN104205063B (ja) |
WO (1) | WO2013136739A1 (ja) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5375829B2 (ja) * | 2008-09-18 | 2013-12-25 | 日本電気株式会社 | 運用管理装置、運用管理方法、および運用管理プログラム |
JP5267736B2 (ja) * | 2010-06-07 | 2013-08-21 | 日本電気株式会社 | 障害検出装置、障害検出方法およびプログラム記録媒体 |
EP3239839A4 (en) | 2014-12-22 | 2018-08-22 | Nec Corporation | Operation management device, operation management method, and recording medium in which operation management program is recorded |
US9853873B2 (en) | 2015-01-10 | 2017-12-26 | Cisco Technology, Inc. | Diagnosis and throughput measurement of fibre channel ports in a storage area network environment |
US9900250B2 (en) | 2015-03-26 | 2018-02-20 | Cisco Technology, Inc. | Scalable handling of BGP route information in VXLAN with EVPN control plane |
US10222986B2 (en) | 2015-05-15 | 2019-03-05 | Cisco Technology, Inc. | Tenant-level sharding of disks with tenant-specific storage modules to enable policies per tenant in a distributed storage system |
US11588783B2 (en) | 2015-06-10 | 2023-02-21 | Cisco Technology, Inc. | Techniques for implementing IPV6-based distributed storage space |
US10630561B1 (en) * | 2015-06-17 | 2020-04-21 | EMC IP Holding Company LLC | System monitoring with metrics correlation for data center |
US9575828B2 (en) * | 2015-07-08 | 2017-02-21 | Cisco Technology, Inc. | Correctly identifying potential anomalies in a distributed storage system |
US10778765B2 (en) | 2015-07-15 | 2020-09-15 | Cisco Technology, Inc. | Bid/ask protocol in scale-out NVMe storage |
US9892075B2 (en) | 2015-12-10 | 2018-02-13 | Cisco Technology, Inc. | Policy driven storage in a microserver computing environment |
US10699211B2 (en) | 2016-02-29 | 2020-06-30 | Oracle International Corporation | Supervised method for classifying seasonal patterns |
US10867421B2 (en) | 2016-02-29 | 2020-12-15 | Oracle International Corporation | Seasonal aware method for forecasting and capacity planning |
US10331802B2 (en) | 2016-02-29 | 2019-06-25 | Oracle International Corporation | System for detecting and characterizing seasons |
US10885461B2 (en) | 2016-02-29 | 2021-01-05 | Oracle International Corporation | Unsupervised method for classifying seasonal patterns |
US10198339B2 (en) * | 2016-05-16 | 2019-02-05 | Oracle International Corporation | Correlation-based analytic for time-series data |
US10140172B2 (en) | 2016-05-18 | 2018-11-27 | Cisco Technology, Inc. | Network-aware storage repairs |
US20170351639A1 (en) | 2016-06-06 | 2017-12-07 | Cisco Technology, Inc. | Remote memory access using memory mapped addressing among multiple compute nodes |
US10664169B2 (en) | 2016-06-24 | 2020-05-26 | Cisco Technology, Inc. | Performance of object storage system by reconfiguring storage devices based on latency that includes identifying a number of fragments that has a particular storage device as its primary storage device and another number of fragments that has said particular storage device as its replica storage device |
US10146609B1 (en) * | 2016-07-08 | 2018-12-04 | Splunk Inc. | Configuration of continuous anomaly detection service |
US10200262B1 (en) | 2016-07-08 | 2019-02-05 | Splunk Inc. | Continuous anomaly detection service |
US10635563B2 (en) | 2016-08-04 | 2020-04-28 | Oracle International Corporation | Unsupervised method for baselining and anomaly detection in time-series data for enterprise systems |
US11082439B2 (en) | 2016-08-04 | 2021-08-03 | Oracle International Corporation | Unsupervised method for baselining and anomaly detection in time-series data for enterprise systems |
US11563695B2 (en) | 2016-08-29 | 2023-01-24 | Cisco Technology, Inc. | Queue protection using a shared global memory reserve |
US10338986B2 (en) * | 2016-10-28 | 2019-07-02 | Microsoft Technology Licensing, Llc | Systems and methods for correlating errors to processing steps and data records to facilitate understanding of errors |
US10545914B2 (en) | 2017-01-17 | 2020-01-28 | Cisco Technology, Inc. | Distributed object storage |
US10243823B1 (en) | 2017-02-24 | 2019-03-26 | Cisco Technology, Inc. | Techniques for using frame deep loopback capabilities for extended link diagnostics in fibre channel storage area networks |
US10949436B2 (en) | 2017-02-24 | 2021-03-16 | Oracle International Corporation | Optimization for scalable analytics using time series models |
US10915830B2 (en) | 2017-02-24 | 2021-02-09 | Oracle International Corporation | Multiscale method for predictive alerting |
US10713203B2 (en) | 2017-02-28 | 2020-07-14 | Cisco Technology, Inc. | Dynamic partition of PCIe disk arrays based on software configuration / policy distribution |
US10254991B2 (en) | 2017-03-06 | 2019-04-09 | Cisco Technology, Inc. | Storage area network based extended I/O metrics computation for deep insight into application performance |
US10817803B2 (en) | 2017-06-02 | 2020-10-27 | Oracle International Corporation | Data driven methods and systems for what if analysis |
US10303534B2 (en) | 2017-07-20 | 2019-05-28 | Cisco Technology, Inc. | System and method for self-healing of application centric infrastructure fabric memory |
US10404596B2 (en) | 2017-10-03 | 2019-09-03 | Cisco Technology, Inc. | Dynamic route profile storage in a hardware trie routing table |
US10942666B2 (en) | 2017-10-13 | 2021-03-09 | Cisco Technology, Inc. | Using network device replication in distributed storage clusters |
US10963346B2 (en) | 2018-06-05 | 2021-03-30 | Oracle International Corporation | Scalable methods and systems for approximating statistical distributions |
US10997517B2 (en) | 2018-06-05 | 2021-05-04 | Oracle International Corporation | Methods and systems for aggregating distribution approximations |
US11138090B2 (en) | 2018-10-23 | 2021-10-05 | Oracle International Corporation | Systems and methods for forecasting time series with variable seasonality |
US10855548B2 (en) | 2019-02-15 | 2020-12-01 | Oracle International Corporation | Systems and methods for automatically detecting, summarizing, and responding to anomalies |
US11533326B2 (en) | 2019-05-01 | 2022-12-20 | Oracle International Corporation | Systems and methods for multivariate anomaly detection in software monitoring |
US11537940B2 (en) | 2019-05-13 | 2022-12-27 | Oracle International Corporation | Systems and methods for unsupervised anomaly detection using non-parametric tolerance intervals over a sliding window of t-digests |
US11887015B2 (en) | 2019-09-13 | 2024-01-30 | Oracle International Corporation | Automatically-generated labels for time series data and numerical lists to use in analytic and machine learning systems |
CN111858120B (zh) * | 2020-07-20 | 2023-07-28 | 北京百度网讯科技有限公司 | 故障预测方法、装置、电子设备及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7076695B2 (en) * | 2001-07-20 | 2006-07-11 | Opnet Technologies, Inc. | System and methods for adaptive threshold determination for performance metrics |
US8332908B2 (en) * | 2006-06-22 | 2012-12-11 | Nec Corporation | Sharing management system, sharing management method and program |
US9021464B2 (en) * | 2006-08-07 | 2015-04-28 | Netiq Corporation | Methods, systems and computer program products for rationalization of computer system configuration change data through correlation with product installation activity |
JP4872944B2 (ja) | 2008-02-25 | 2012-02-08 | 日本電気株式会社 | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム |
JP5375829B2 (ja) | 2008-09-18 | 2013-12-25 | 日本電気株式会社 | 運用管理装置、運用管理方法、および運用管理プログラム |
US8868987B2 (en) * | 2010-02-05 | 2014-10-21 | Tripwire, Inc. | Systems and methods for visual correlation of log events, configuration changes and conditions producing alerts in a virtual infrastructure |
JP5416833B2 (ja) * | 2010-04-06 | 2014-02-12 | 株式会社日立製作所 | 性能監視装置,方法,プログラム |
JP5267736B2 (ja) | 2010-06-07 | 2013-08-21 | 日本電気株式会社 | 障害検出装置、障害検出方法およびプログラム記録媒体 |
-
2013
- 2013-03-08 CN CN201380014367.2A patent/CN104205063B/zh active Active
- 2013-03-08 JP JP2014504679A patent/JP5910727B2/ja active Active
- 2013-03-08 WO PCT/JP2013/001480 patent/WO2013136739A1/ja active Application Filing
- 2013-03-08 EP EP13761770.0A patent/EP2827251B1/en active Active
- 2013-03-08 US US14/384,197 patent/US20150046123A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP2827251B1 (en) | 2020-02-12 |
CN104205063B (zh) | 2017-05-24 |
EP2827251A4 (en) | 2015-08-12 |
WO2013136739A1 (ja) | 2013-09-19 |
US20150046123A1 (en) | 2015-02-12 |
EP2827251A1 (en) | 2015-01-21 |
CN104205063A (zh) | 2014-12-10 |
JPWO2013136739A1 (ja) | 2015-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5910727B2 (ja) | 運用管理装置、運用管理方法、及び、プログラム | |
JP6394726B2 (ja) | 運用管理装置、運用管理方法、及びプログラム | |
JP5874936B2 (ja) | 運用管理装置、運用管理方法、及びプログラム | |
JP5532150B2 (ja) | 運用管理装置、運用管理方法、及びプログラム | |
JP6875179B2 (ja) | システム分析装置、及びシステム分析方法 | |
JP6183450B2 (ja) | システム分析装置、及び、システム分析方法 | |
JP6183449B2 (ja) | システム分析装置、及び、システム分析方法 | |
US10430268B2 (en) | Operations management system, operations management method and program thereof | |
WO2009110329A1 (ja) | 障害分析装置、障害分析方法および記録媒体 | |
WO2006117833A1 (ja) | 監視シミュレーション装置,方法およびそのプログラム | |
JP5971395B2 (ja) | システム分析装置、及び、システム分析方法 | |
US10157113B2 (en) | Information processing device, analysis method, and recording medium | |
US9690639B2 (en) | Failure detecting apparatus and failure detecting method using patterns indicating occurrences of failures | |
WO2015182072A1 (ja) | 因果構造推定システム、因果構造推定方法およびプログラム記録媒体 | |
CN114629785B (zh) | 一种告警位置的检测与预测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160314 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5910727 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |