JPWO2018146714A1 - コンピュータシステムの監視装置および方法 - Google Patents
コンピュータシステムの監視装置および方法 Download PDFInfo
- Publication number
- JPWO2018146714A1 JPWO2018146714A1 JP2018538896A JP2018538896A JPWO2018146714A1 JP WO2018146714 A1 JPWO2018146714 A1 JP WO2018146714A1 JP 2018538896 A JP2018538896 A JP 2018538896A JP 2018538896 A JP2018538896 A JP 2018538896A JP WO2018146714 A1 JPWO2018146714 A1 JP WO2018146714A1
- Authority
- JP
- Japan
- Prior art keywords
- performance
- performance data
- data
- computer system
- items
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 title claims description 41
- 230000006866 deterioration Effects 0.000 claims abstract description 79
- 230000008859 change Effects 0.000 claims abstract description 38
- 238000013480 data collection Methods 0.000 claims abstract description 11
- 230000002123 temporal effect Effects 0.000 claims abstract description 9
- 230000015556 catabolic process Effects 0.000 claims description 55
- 238000006731 degradation reaction Methods 0.000 claims description 55
- 238000004458 analytical method Methods 0.000 claims description 28
- 238000011156 evaluation Methods 0.000 claims description 22
- 230000001364 causal effect Effects 0.000 claims description 14
- 238000012806 monitoring device Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 description 34
- 230000008569 process Effects 0.000 description 23
- 238000005259 measurement Methods 0.000 description 21
- 238000004422 calculation algorithm Methods 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000000611 regression analysis Methods 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004138 cluster model Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 208000018910 keratinopathic ichthyosis Diseases 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3447—Performance evaluation by modeling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3495—Performance evaluation by tracing or monitoring for systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Debugging And Monitoring (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
Abstract
Description
Claims (11)
- コンピュータシステムを監視する監視装置であって、
前記コンピュータシステムの性能に係る複数の性能項目に関する性能データを収集するデータ収集部と、
原因事象と、前記原因事象によって劣化する一以上の性能項目である劣化性能項目とを関連付けた性能劣化原因モデルと、
前記原因事象について、前記一以上の劣化性能項目の性能データの正常範囲が予め定められていて、前記データ収集部により収集された前記劣化性能項目の性能データである対象性能データが前記正常範囲から外れるとき、その外れ度合いを特定する外れ度合い特定部と、
前記外れ度合いの経時変化に基づいて、前記原因事象に関する情報を出力する出力部と、を有するコンピュータシステムの監視装置。 - 前記コンピュータシステムで実行されたジョブの種類及びジョブの実行期間を含むジョブ実行履歴を有し、
前記外れ度合い特定部は、前記ジョブ実行履歴及び前記対象性能データに基づいて、ジョブの種類別及びジョブの実行期間別に前記外れ度合いを特定する、請求項1記載のコンピュータシステムの監視装置。 - 複数の原因事象に係る複数の性能劣化原因モデルを有し、
前記外れ度合い特定部は、ジョブの種類別及びジョブの実行期間別に、前記複数の原因事象別の前記外れ度合いを特定し、
前記監視装置は、
前記複数の原因事象別の外れ度合いの経時変化のうち、各ジョブの実行に要した時間である所要時間の長さの変化と最もマッチする経時変化に係る原因事象を特定する分析部をさらに有し、
前記出力部は、前記分析部で特定された原因事象を示す情報を出力する、請求項2記載のコンピュータシステムの監視装置。 - 前記原因事象が生じていないときの前記一以上の劣化性能項目の過去の性能データに基づいて前記正常範囲を特定する正常範囲特定部を、さらに有する請求項1記載のコンピュータシステムの監視装置。
- コンピュータシステムを監視する監視装置であって、
前記コンピュータシステムの性能に係る複数の性能項目に関する性能データを収集するデータ収集部と、
前記コンピュータシステムの評価指標と、前記評価指標と関連する複数の性能項目である関連性能項目とを関連付けた評価指標モデルと、
前記評価指標が劣化しているときの、前記複数の関連性能項目の性能データをグルーピングして得られた複数の性能データグループであって、それぞれが有する特徴に基づくラベルを有する前記複数の性能データグループと、前記データ収集部により収集された前記関連性能項目の性能データである対象性能データとの類似度を判定する類似度判定部と、
前記対象性能データに最も類似する性能データグループ及びその性能データグループのラベルを出力する出力部と、を有するコンピュータシステムの監視装置。 - 前記出力部は、前記評価指標の劣化に寄与している複数の関連性能項目の性能データに基づいて、各関連性能項目の前記評価指標の劣化への寄与度を示す情報を出力する、請求項5記載のコンピュータシステムの監視装置。
- 前記劣化への寄与度を示す情報は、各関連性能項目のそれぞれの寄与度が長さで示された1次元のグラフである、請求項6記載のコンピュータシステムの監視装置。
- 前記1次元のグラフには、前記劣化への寄与度が所定よりも大きい関連性能項目の前記劣化への寄与度が含まれる、請求項7記載のコンピュータシステムの監視装置。
- 前記対象性能データが、前記複数の性能データグループのいずれとも類似しないとき、
前記出力部は、前記評価指標の劣化に寄与している複数の関連性能項目の性能データに基づいて、各関連性能項目の前記評価指標の劣化への寄与度を示す情報を出力し、前記対象性能データが属する新たな性能データグループに付与するラベルに関する情報の入力を受け付ける画面を出力する、請求項5記載のコンピュータシステムの監視装置。 - 前記評価指標が劣化しているときの前記一以上の関連性能項目の過去の性能データを前記性能データが有する特徴に基づいてグルーピングして前記複数の性能データグループを生成し、生成された性能データグループに各性能データグループの特徴に基づく前記ラベルを付与するグループ生成部を、さらに有する請求項5記載のコンピュータシステムの監視装置。
- コンピュータシステムを監視する監視装置が行う方法であって、
前記監視装置は、原因事象と、前記原因事象によって劣化する一以上の性能項目である劣化性能項目とを関連付けた性能劣化原因モデルを有し、
前記コンピュータシステムの性能に係る複数の性能項目に関する性能データを収集するステップと、
前記原因事象について、前記一以上の劣化性能項目の性能データの正常範囲が予め定められていて、前記データ収集部により収集された前記劣化性能項目の性能データである対象性能データが前記正常範囲から外れるとき、その外れ度合いを特定するステップと、
前記外れ度合いの経時変化に基づいて、前記原因事象に関する情報を出力するステップと、を行うコンピュータシステムの監視方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/004327 WO2018146714A1 (ja) | 2017-02-07 | 2017-02-07 | コンピュータシステムの監視装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018146714A1 true JPWO2018146714A1 (ja) | 2019-02-14 |
JP6689995B2 JP6689995B2 (ja) | 2020-04-28 |
Family
ID=63107289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018538896A Active JP6689995B2 (ja) | 2017-02-07 | 2017-02-07 | コンピュータシステムの監視装置および方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11080126B2 (ja) |
JP (1) | JP6689995B2 (ja) |
WO (1) | WO2018146714A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10853221B2 (en) * | 2018-05-04 | 2020-12-01 | EMC IP Holding Company LLC | Performance evaluation and comparison of storage systems |
US20210103830A1 (en) * | 2019-10-08 | 2021-04-08 | At&T Intellectual Property I, L.P. | Machine learning based clustering and patterning system and method for network traffic data and its application |
CN113422690A (zh) * | 2020-03-02 | 2021-09-21 | 烽火通信科技股份有限公司 | 一种业务质量劣化预测方法及系统 |
JP7285798B2 (ja) * | 2020-03-09 | 2023-06-02 | 株式会社日立製作所 | 性能分析装置、性能分析方法、及び性能分析プログラム |
JP7401764B2 (ja) * | 2020-03-11 | 2023-12-20 | 富士通株式会社 | 制御プログラム、制御方法および制御装置 |
JP7556199B2 (ja) * | 2020-03-16 | 2024-09-26 | 日本電気株式会社 | 監視装置,監視方法及び監視プログラム |
JP7214054B2 (ja) * | 2020-09-03 | 2023-01-27 | 三菱電機株式会社 | 機器分析装置、機器分析方法および機器分析プログラム |
CN114666221A (zh) * | 2020-12-07 | 2022-06-24 | 中兴通讯股份有限公司 | 网络切片子网运维管理方法、装置、系统、设备及介质 |
US12056385B2 (en) * | 2021-07-30 | 2024-08-06 | EMC IP Holding Company LLC | Storage media scrubber |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004145536A (ja) * | 2002-10-23 | 2004-05-20 | Hitachi Ltd | 管理システム |
JP2006011902A (ja) * | 2004-06-28 | 2006-01-12 | Hitachi Ltd | 運用管理支援システムおよび性能情報表示方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4872945B2 (ja) | 2008-02-25 | 2012-02-08 | 日本電気株式会社 | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム |
CN104137078B (zh) * | 2012-01-23 | 2017-03-22 | 日本电气株式会社 | 操作管理设备、操作管理方法和程序 |
US11010220B2 (en) * | 2013-04-29 | 2021-05-18 | Moogsoft, Inc. | System and methods for decomposing events from managed infrastructures that includes a feedback signalizer functor |
US20160055044A1 (en) * | 2013-05-16 | 2016-02-25 | Hitachi, Ltd. | Fault analysis method, fault analysis system, and storage medium |
US9355007B1 (en) * | 2013-07-15 | 2016-05-31 | Amazon Technologies, Inc. | Identifying abnormal hosts using cluster processing |
US9558056B2 (en) * | 2013-07-28 | 2017-01-31 | OpsClarity Inc. | Organizing network performance metrics into historical anomaly dependency data |
US10209956B2 (en) * | 2014-10-09 | 2019-02-19 | Splunk Inc. | Automatic event group actions |
US10261851B2 (en) * | 2015-01-23 | 2019-04-16 | Lightbend, Inc. | Anomaly detection using circumstance-specific detectors |
US10592328B1 (en) * | 2015-03-26 | 2020-03-17 | Amazon Technologies, Inc. | Using cluster processing to identify sets of similarly failing hosts |
US10210038B2 (en) * | 2015-10-08 | 2019-02-19 | Lightbend, Inc. | Tuning context-aware rule engine for anomaly detection |
US9471778B1 (en) * | 2015-11-30 | 2016-10-18 | International Business Machines Corporation | Automatic baselining of anomalous event activity in time series data |
WO2018225115A1 (ja) * | 2017-06-05 | 2018-12-13 | 株式会社日立製作所 | 運用支援システム及び方法 |
US10963330B2 (en) * | 2017-11-24 | 2021-03-30 | Microsoft Technology Licensing, Llc | Correlating failures with performance in application telemetry data |
-
2017
- 2017-02-07 WO PCT/JP2017/004327 patent/WO2018146714A1/ja active Application Filing
- 2017-02-07 JP JP2018538896A patent/JP6689995B2/ja active Active
- 2017-02-07 US US16/095,015 patent/US11080126B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004145536A (ja) * | 2002-10-23 | 2004-05-20 | Hitachi Ltd | 管理システム |
JP2006011902A (ja) * | 2004-06-28 | 2006-01-12 | Hitachi Ltd | 運用管理支援システムおよび性能情報表示方法 |
Also Published As
Publication number | Publication date |
---|---|
US11080126B2 (en) | 2021-08-03 |
WO2018146714A1 (ja) | 2018-08-16 |
JP6689995B2 (ja) | 2020-04-28 |
US20190121687A1 (en) | 2019-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6689995B2 (ja) | コンピュータシステムの監視装置および方法 | |
US20200358826A1 (en) | Methods and apparatus to assess compliance of a virtual computing environment | |
US11956137B1 (en) | Analyzing servers based on data streams generated by instrumented software executing on the servers | |
US10592308B2 (en) | Aggregation based event identification | |
JP6555061B2 (ja) | クラスタリングプログラム、クラスタリング方法、および情報処理装置 | |
US20200293946A1 (en) | Machine learning based incident classification and resolution | |
US9921937B2 (en) | Behavior clustering analysis and alerting system for computer applications | |
US8635498B2 (en) | Performance analysis of applications | |
US7676695B2 (en) | Resolution of computer operations problems using fault trend analysis | |
US10452458B2 (en) | Computer performance prediction using search technologies | |
US20150205691A1 (en) | Event prediction using historical time series observations of a computer application | |
JP5285084B2 (ja) | 検出イベントに応じたアクション実行を支援するシステム、検出イベントに応じたアクション実行を支援する方法、支援装置及びコンピュータプログラム | |
US9870294B2 (en) | Visualization of behavior clustering of computer applications | |
US20110270853A1 (en) | Dynamic Storage and Retrieval of Process Graphs | |
US20150356489A1 (en) | Behavior-Based Evaluation Of Crowd Worker Quality | |
US11030258B1 (en) | Ranking anomalies associated with populations of users based on relevance | |
US20220107858A1 (en) | Methods and systems for multi-resource outage detection for a system of networked computing devices and root cause identification | |
US9860109B2 (en) | Automatic alert generation | |
WO2015110873A1 (en) | Computer performance prediction using search technologies | |
US8543552B2 (en) | Detecting statistical variation from unclassified process log | |
US20080126283A1 (en) | Method of capturing Problem Resolution for Subsequent Use in Managed Distributed Computer Systems | |
JP2011186706A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2007164346A (ja) | 決定木変更方法、異常性判定方法およびプログラム | |
JP2021135541A (ja) | モデル生成装置、モデル生成方法、及びモデル生成プログラム | |
JP2016099688A (ja) | リスク評価方法およびリスク評価装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180725 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6689995 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |