JP6689995B2 - コンピュータシステムの監視装置および方法 - Google Patents
コンピュータシステムの監視装置および方法 Download PDFInfo
- Publication number
- JP6689995B2 JP6689995B2 JP2018538896A JP2018538896A JP6689995B2 JP 6689995 B2 JP6689995 B2 JP 6689995B2 JP 2018538896 A JP2018538896 A JP 2018538896A JP 2018538896 A JP2018538896 A JP 2018538896A JP 6689995 B2 JP6689995 B2 JP 6689995B2
- Authority
- JP
- Japan
- Prior art keywords
- performance
- performance data
- data
- computer system
- deterioration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3447—Performance evaluation by modeling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3495—Performance evaluation by tracing or monitoring for systems
Description
Claims (11)
- コンピュータシステムを監視する監視装置であって、
前記コンピュータシステムの性能に係る複数の性能項目に関する性能データを収集するデータ収集部と、
原因事象と、前記原因事象によって劣化する一以上の性能項目である劣化性能項目とを関連付けた性能劣化原因モデルと、
前記原因事象について、前記一以上の劣化性能項目の性能データの正常範囲が予め定められていて、前記データ収集部により収集された前記劣化性能項目の性能データである対象性能データが前記正常範囲から外れるとき、その外れ度合いを特定する外れ度合い特定部と、
前記外れ度合いの経時変化に基づいて、前記原因事象に関する情報を出力する出力部と、を有するコンピュータシステムの監視装置。 - 前記コンピュータシステムで実行されたジョブの種類及びジョブの実行期間を含むジョブ実行履歴を有し、
前記外れ度合い特定部は、前記ジョブ実行履歴及び前記対象性能データに基づいて、ジョブの種類別及びジョブの実行期間別に前記外れ度合いを特定する、請求項1記載のコンピュータシステムの監視装置。 - 複数の原因事象に係る複数の性能劣化原因モデルを有し、
前記外れ度合い特定部は、ジョブの種類別及びジョブの実行期間別に、前記複数の原因事象別の前記外れ度合いを特定し、
前記監視装置は、
前記複数の原因事象別の外れ度合いの経時変化のうち、各ジョブの実行に要した時間である所要時間の長さの変化と最もマッチする経時変化に係る原因事象を特定する分析部をさらに有し、
前記出力部は、前記分析部で特定された原因事象を示す情報を出力する、請求項2記載のコンピュータシステムの監視装置。 - 前記原因事象が生じていないときの前記一以上の劣化性能項目の過去の性能データに基づいて前記正常範囲を特定する正常範囲特定部を、さらに有する請求項1記載のコンピュータシステムの監視装置。
- コンピュータシステムを監視する監視装置であって、
前記コンピュータシステムの性能に係る複数の性能項目に関する性能データを収集するデータ収集部と、
前記コンピュータシステムの評価指標と、前記評価指標と関連する複数の性能項目である関連性能項目とを関連付けた評価指標モデルと、
前記評価指標が劣化しているときの、前記複数の関連性能項目の性能データをグルーピングして得られた複数の性能データグループであって、それぞれが有する特徴に基づくラベルを有する前記複数の性能データグループと、前記データ収集部により収集された前記関連性能項目の性能データである対象性能データとの類似度を判定する類似度判定部と、
前記対象性能データに最も類似する性能データグループ及びその性能データグループのラベルを出力する出力部と、を有するコンピュータシステムの監視装置。 - 前記出力部は、前記評価指標の劣化に寄与している複数の関連性能項目の性能データに基づいて、各関連性能項目の前記評価指標の劣化への寄与度を示す情報を出力する、請求項5記載のコンピュータシステムの監視装置。
- 前記劣化への寄与度を示す情報は、各関連性能項目のそれぞれの寄与度が長さで示された1次元のグラフである、請求項6記載のコンピュータシステムの監視装置。
- 前記1次元のグラフには、前記劣化への寄与度が所定よりも大きい関連性能項目の前記劣化への寄与度が含まれる、請求項7記載のコンピュータシステムの監視装置。
- 前記対象性能データが、前記複数の性能データグループのいずれとも類似しないとき、
前記出力部は、前記評価指標の劣化に寄与している複数の関連性能項目の性能データに基づいて、各関連性能項目の前記評価指標の劣化への寄与度を示す情報を出力し、前記対象性能データが属する新たな性能データグループに付与するラベルに関する情報の入力を受け付ける画面を出力する、請求項5記載のコンピュータシステムの監視装置。 - 前記評価指標が劣化しているときの前記一以上の関連性能項目の過去の性能データを前記性能データが有する特徴に基づいてグルーピングして前記複数の性能データグループを生成し、生成された性能データグループに各性能データグループの特徴に基づく前記ラベルを付与するグループ生成部を、さらに有する請求項5記載のコンピュータシステムの監視装置。
- コンピュータシステムを監視する監視装置が行う方法であって、
前記監視装置は、原因事象と、前記原因事象によって劣化する一以上の性能項目である劣化性能項目とを関連付けた性能劣化原因モデルを有し、
前記コンピュータシステムの性能に係る複数の性能項目に関する性能データを収集するステップと、
前記原因事象について、前記一以上の劣化性能項目の性能データの正常範囲が予め定められていて、データ収集部により収集された前記劣化性能項目の性能データである対象性能データが前記正常範囲から外れるとき、その外れ度合いを特定するステップと、
前記外れ度合いの経時変化に基づいて、前記原因事象に関する情報を出力するステップと、を行うコンピュータシステムの監視方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/004327 WO2018146714A1 (ja) | 2017-02-07 | 2017-02-07 | コンピュータシステムの監視装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018146714A1 JPWO2018146714A1 (ja) | 2019-02-14 |
JP6689995B2 true JP6689995B2 (ja) | 2020-04-28 |
Family
ID=63107289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018538896A Active JP6689995B2 (ja) | 2017-02-07 | 2017-02-07 | コンピュータシステムの監視装置および方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11080126B2 (ja) |
JP (1) | JP6689995B2 (ja) |
WO (1) | WO2018146714A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10853221B2 (en) * | 2018-05-04 | 2020-12-01 | EMC IP Holding Company LLC | Performance evaluation and comparison of storage systems |
US20210103830A1 (en) * | 2019-10-08 | 2021-04-08 | At&T Intellectual Property I, L.P. | Machine learning based clustering and patterning system and method for network traffic data and its application |
CN113422690A (zh) * | 2020-03-02 | 2021-09-21 | 烽火通信科技股份有限公司 | 一种业务质量劣化预测方法及系统 |
JP7285798B2 (ja) * | 2020-03-09 | 2023-06-02 | 株式会社日立製作所 | 性能分析装置、性能分析方法、及び性能分析プログラム |
JP7401764B2 (ja) * | 2020-03-11 | 2023-12-20 | 富士通株式会社 | 制御プログラム、制御方法および制御装置 |
JP2021149132A (ja) * | 2020-03-16 | 2021-09-27 | 日本電気株式会社 | 監視装置,監視方法及び監視プログラム |
JP7214054B2 (ja) * | 2020-09-03 | 2023-01-27 | 三菱電機株式会社 | 機器分析装置、機器分析方法および機器分析プログラム |
US20230031331A1 (en) * | 2021-07-30 | 2023-02-02 | EMC IP Holding Company LLC | Storage media scrubber |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004145536A (ja) * | 2002-10-23 | 2004-05-20 | Hitachi Ltd | 管理システム |
JP4430989B2 (ja) * | 2004-06-28 | 2010-03-10 | 株式会社日立製作所 | 運用管理支援システムおよび性能情報表示方法 |
JP4872945B2 (ja) | 2008-02-25 | 2012-02-08 | 日本電気株式会社 | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム |
WO2013111560A1 (ja) * | 2012-01-23 | 2013-08-01 | 日本電気株式会社 | 運用管理装置、運用管理方法、及びプログラム |
US11010220B2 (en) * | 2013-04-29 | 2021-05-18 | Moogsoft, Inc. | System and methods for decomposing events from managed infrastructures that includes a feedback signalizer functor |
WO2014184934A1 (ja) * | 2013-05-16 | 2014-11-20 | 株式会社日立製作所 | 障害分析方法、障害分析システム及び記憶媒体 |
US9355007B1 (en) * | 2013-07-15 | 2016-05-31 | Amazon Technologies, Inc. | Identifying abnormal hosts using cluster processing |
US9558056B2 (en) * | 2013-07-28 | 2017-01-31 | OpsClarity Inc. | Organizing network performance metrics into historical anomaly dependency data |
US10209956B2 (en) * | 2014-10-09 | 2019-02-19 | Splunk Inc. | Automatic event group actions |
US10261851B2 (en) * | 2015-01-23 | 2019-04-16 | Lightbend, Inc. | Anomaly detection using circumstance-specific detectors |
US10592328B1 (en) * | 2015-03-26 | 2020-03-17 | Amazon Technologies, Inc. | Using cluster processing to identify sets of similarly failing hosts |
US10228996B2 (en) * | 2015-10-08 | 2019-03-12 | Lightbend, Inc. | Context-aware rule engine for anomaly detection |
US9471778B1 (en) * | 2015-11-30 | 2016-10-18 | International Business Machines Corporation | Automatic baselining of anomalous event activity in time series data |
US10984053B2 (en) * | 2017-06-05 | 2021-04-20 | Hitachi, Ltd. | Operation assistance system and method |
US10963330B2 (en) * | 2017-11-24 | 2021-03-30 | Microsoft Technology Licensing, Llc | Correlating failures with performance in application telemetry data |
-
2017
- 2017-02-07 US US16/095,015 patent/US11080126B2/en active Active
- 2017-02-07 WO PCT/JP2017/004327 patent/WO2018146714A1/ja active Application Filing
- 2017-02-07 JP JP2018538896A patent/JP6689995B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US11080126B2 (en) | 2021-08-03 |
WO2018146714A1 (ja) | 2018-08-16 |
JPWO2018146714A1 (ja) | 2019-02-14 |
US20190121687A1 (en) | 2019-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6689995B2 (ja) | コンピュータシステムの監視装置および方法 | |
US10860939B2 (en) | Application performance analyzer and corresponding method | |
US10810107B2 (en) | User interface for specifying data stream processing language programs for analyzing instrumented software | |
US11657309B2 (en) | Behavior analysis and visualization for a computer infrastructure | |
US10592308B2 (en) | Aggregation based event identification | |
US11956137B1 (en) | Analyzing servers based on data streams generated by instrumented software executing on the servers | |
US11151014B2 (en) | System operational analytics using additional features for health score computation | |
US9921937B2 (en) | Behavior clustering analysis and alerting system for computer applications | |
US8635498B2 (en) | Performance analysis of applications | |
US7502971B2 (en) | Determining a recurrent problem of a computer resource using signatures | |
US10452458B2 (en) | Computer performance prediction using search technologies | |
US7676695B2 (en) | Resolution of computer operations problems using fault trend analysis | |
US20150205691A1 (en) | Event prediction using historical time series observations of a computer application | |
US8676818B2 (en) | Dynamic storage and retrieval of process graphs representative of business processes and extraction of formal process models therefrom | |
US9870294B2 (en) | Visualization of behavior clustering of computer applications | |
US20110267351A1 (en) | Dynamic Adaptive Process Discovery and Compliance | |
EP3097494A1 (en) | Computer performance prediction using search technologies | |
CN110275878A (zh) | 业务数据检测方法、装置、计算机设备及存储介质 | |
US20130198147A1 (en) | Detecting statistical variation from unclassified process log | |
JP5532782B2 (ja) | トレーサビリティシステムおよび製造工程異常検出方法 | |
JPWO2017094263A1 (ja) | ログ分析システム、方法およびプログラム | |
JP2007164346A (ja) | 決定木変更方法、異常性判定方法およびプログラム | |
US20220107858A1 (en) | Methods and systems for multi-resource outage detection for a system of networked computing devices and root cause identification | |
JP2023036469A (ja) | 外れ値検出装置及び方法 | |
JP2011186706A (ja) | 情報処理装置、情報処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6689995 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |