JP5564941B2 - 障害箇所推定システム、障害箇所推定装置および障害箇所推定方法 - Google Patents
障害箇所推定システム、障害箇所推定装置および障害箇所推定方法 Download PDFInfo
- Publication number
- JP5564941B2 JP5564941B2 JP2009298877A JP2009298877A JP5564941B2 JP 5564941 B2 JP5564941 B2 JP 5564941B2 JP 2009298877 A JP2009298877 A JP 2009298877A JP 2009298877 A JP2009298877 A JP 2009298877A JP 5564941 B2 JP5564941 B2 JP 5564941B2
- Authority
- JP
- Japan
- Prior art keywords
- class
- abnormality
- failure
- components
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/006—Identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/065—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computer Hardware Design (AREA)
- Environmental & Geological Engineering (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
- Debugging And Monitoring (AREA)
- Telephonic Communication Services (AREA)
Description
関連re101はCIva01がソース、CIpm11がターゲットである。
関連re102はCIpm11がソース、CIva01がターゲットである。
関連re103はCIpm11がソース、CIvb01がターゲットである。
関連re104はCIvb01がソース、CIpm11がターゲットである。
関連re105はCIva02がソース、CIpm12がターゲットである。
関連re106はCIpm12がソース、CIva02がターゲットである。
関連re107はCIpm12がソース、CIvb02がターゲットである。
関連re108はCIvb02がソース、CIpm12がターゲットである。
関連re109はCIva03がソース、CIpm13がターゲットである。
関連re110はCIpm13がソース、CIva03がターゲットである。
関連re111はCIpm13がソース、CIvb03がターゲットである。
関連re112はCIvb03がソース、CIpm13がターゲットである。
関連re113はCIva01がソース、CITaがターゲットである。
関連re114はCIva02がソース、CITaがターゲットである。
関連re115はCIva03がソース、CITaがターゲットである。
関連re116はCIvb01がソース、CITbがターゲットである。
関連re117はCIvb02がソース、CITbがターゲットである。
関連re118はCIvb03がソース、CITbがターゲットである。
関連re119はCIva02がソース、CIva01がターゲットである。
関連re120はCIva03がソース、CIva02がターゲットである。
関連re121はCIvb02がソース、CIvb01がターゲットである。
関連re122はCIvb03がソース、CIvb02がターゲットである。
関連re123はCIva01がソース、CITaがターゲットである。
関連re124はCIvb01がソース、CITbがターゲットである。
前記構成要素に発生する異常の種別と当該異常の原因調査時に辿るべき関連クラス及び方向とを対応付けた調査内容を参照し、異常が発生した構成要素の各々について前記調査範囲に従って辿った構成要素及び関連を調査範囲限定ツリーとして求める調査範囲限定部と、
前記異常が発生した構成要素の各々について求めた調査範囲限定ツリーにおける前記構成要素の出現頻度に基づいて前記異常の原因となる障害が発生した箇所の候補を推定する障害発生箇所候補推定部と
を備えたことを特徴とする障害箇所推定システム。
前記構成要素に発生する異常の種別と当該異常の原因調査時に辿るべき関連クラス及び方向とを対応付けた調査内容を参照し、異常が発生した構成要素の各々について前記調査範囲に従って辿った構成要素及び関連を調査範囲限定ツリーとして求める調査範囲限定部と、
前記異常が発生した構成要素の各々について求めた調査範囲限定ツリーにおける前記構成要素の出現頻度に基づいて前記異常の原因となる障害が発生した箇所の候補を推定する障害発生箇所候補推定部と
を備えたことを特徴とする障害箇所推定装置。
前記構成要素に発生する異常の種別と当該異常の原因調査時に辿るべき関連クラス及び方向とを対応付けた調査内容を参照し、異常が発生した構成要素の各々について前記調査範囲に従って辿った構成要素及び関連を調査範囲限定ツリーとして求める調査範囲限定ステップと、
前記異常が発生した構成要素の各々について求めた調査範囲限定ツリーにおける前記構成要素の出現頻度に基づいて前記異常の原因となる障害が発生した箇所の候補を推定する障害発生箇所候補推定ステップと
を含んだことを特徴とする障害箇所推定方法。
11 関連クラス適用部
12 調査範囲限定部
13 障害発生箇所候補推定部
21 構成情報
22 関連クラス適用ルール
23 関連クラス
24 調査内容
25 異常検知情報
26 システム稼動情報
27 操作経路履歴情報
28 障害対処情報
30 障害箇所推定装置
31 CMDB
32 障害情報DB
40 トラブル調査システム
41 異常検知部
42 障害箇所推定部
43 障害原因特定部
44 対処実施部
pm11〜13,va01〜03,vb01〜03,Ta,Tb CI
rel01〜24 関連
Claims (7)
- システムの構成情報に含まれる構成要素の種別に基づいて構成要素間の関連を分類する関連クラス適用ルールを参照し、前記構成情報に含まれる構成要素間関係に関連クラスを適用する関連クラス適用部と、
前記構成要素に発生する異常の種別と当該異常の原因調査時に辿るべき関連クラス及び方向とを対応付けた調査内容情報を参照し、異常が発生した構成要素の各々について前記調査内容情報に従って辿った構成要素及び関連クラスを調査範囲として決定する調査範囲決定部と、
前記異常が発生した構成要素の各々について求めた調査範囲における前記構成要素の出現頻度に基づいて前記異常の原因となる障害発生箇所を推定する障害発生箇所推定部と
を備えたことを特徴とする障害箇所推定システム。 - 前記システムは、前記構成要素として物理マシン、仮想マシン、サービスを有する仮想ネットワークである
ことを特徴とする請求項1に記載の障害箇所推定システム。 - 前記関連クラスは、前記関連のソースとなる構成要素の停止が当該関連のターゲットとなる構成要素の停止を引き起こす依存クラス、前記関連のソースとなる構成要素の性能異常が当該関連のターゲットとなる構成要素の性能に影響を与える影響クラス、前記関連のターゲットとなる構成要素が当該関連のソースを利用する利用クラスのうち、少なくともいずれかを含む
ことを特徴とする請求項1または2に記載の障害箇所推定システム。 - 前記調査内容情報は、前記異常の種別が構成要素の停止である場合に前記依存クラスの関連をソース側に辿ることを規定し、前記異常の種別が構成要素の性能異常である場合に前記影響クラスの関連をソース側に辿ることを規定し、前記異常の種別が構成要素の動作遅延である場合に前記利用クラスの関連をソース側に辿り、当該ソース側の構成要素から前記影響クラスの関連をターゲット側に辿ることを規定する
ことを特徴とする請求項3に記載の障害箇所推定システム。 - 前記関連クラス適用ルールは、構成要素間関係をさらに用いて構成要素間の関連に前記関連クラスのいずれを適用するかを定め、前記関連クラス適用部は、前記システムの稼動情報を参照して構成要素間関係に対応する稼動状態が存在する場合に前記関連クラスの適用を行なう
ことを特徴とする請求項1〜4のいずれか一つに記載の障害箇所推定システム。 - システムの構成情報に含まれる構成要素の種別に基づいて構成要素間の関連を分類する関連クラス適用ルールを参照し、前記構成情報に含まれる構成要素間関係に関連クラスを適用する関連クラス適用部と、
前記構成要素に発生する異常の種別と当該異常の原因調査時に辿るべき関連クラス及び方向とを対応付けた調査内容情報を参照し、異常が発生した構成要素の各々について前記調査内容情報に従って辿った構成要素及び関連クラスを調査範囲として決定する調査範囲決定部と、
前記異常が発生した構成要素の各々について求めた調査範囲における前記構成要素の出現頻度に基づいて前記異常の原因となる障害発生箇所を推定する障害発生箇所推定部と
を備えたことを特徴とする障害箇所推定装置。 - コンピュータが、
システムの構成情報に含まれる構成要素の種別に基づいて構成要素間の関連を分類する関連クラス適用ルールを参照し、前記構成情報に含まれる構成要素間関係に関連クラスを適用し、
前記構成要素に発生する異常の種別と当該異常の原因調査時に辿るべき関連クラス及び方向とを対応付けた調査内容情報を参照し、異常が発生した構成要素の各々について前記調査内容情報に従って辿った構成要素及び関連クラスを調査範囲として決定し、
前記異常が発生した構成要素の各々について求めた調査範囲における前記構成要素の出現頻度に基づいて前記異常の原因となる障害発生箇所を推定する
各処理を含んだことを特徴とする障害箇所推定方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009298877A JP5564941B2 (ja) | 2009-12-28 | 2009-12-28 | 障害箇所推定システム、障害箇所推定装置および障害箇所推定方法 |
GB1021781.8A GB2476578B (en) | 2009-12-28 | 2010-12-22 | Apparatus and method for selecting candidate for failure component |
US12/977,583 US8984337B2 (en) | 2009-12-28 | 2010-12-23 | Apparatus and method for selecting candidate for failure component |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009298877A JP5564941B2 (ja) | 2009-12-28 | 2009-12-28 | 障害箇所推定システム、障害箇所推定装置および障害箇所推定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011138405A JP2011138405A (ja) | 2011-07-14 |
JP5564941B2 true JP5564941B2 (ja) | 2014-08-06 |
Family
ID=44188955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009298877A Expired - Fee Related JP5564941B2 (ja) | 2009-12-28 | 2009-12-28 | 障害箇所推定システム、障害箇所推定装置および障害箇所推定方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8984337B2 (ja) |
JP (1) | JP5564941B2 (ja) |
GB (1) | GB2476578B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103562863A (zh) * | 2011-04-04 | 2014-02-05 | 惠普发展公司,有限责任合伙企业 | 创建定义事件类型之间关系的相关规则 |
US9003222B2 (en) * | 2011-09-30 | 2015-04-07 | International Business Machines Corporation | Configuration fault localization in shared resource environments |
US9069892B2 (en) * | 2013-05-10 | 2015-06-30 | International Business Machines Corporation | Reducing false-positive errors in a software change-impact analysis |
JP6024448B2 (ja) * | 2012-12-26 | 2016-11-16 | 富士通株式会社 | 情報処理プログラム、情報処理方法及び装置 |
CN108039964B (zh) * | 2014-04-09 | 2021-02-23 | 华为技术有限公司 | 基于网络功能虚拟化的故障处理方法及装置、系统 |
JP6454133B2 (ja) * | 2014-11-07 | 2019-01-16 | 株式会社日立製作所 | 品質分析方法、品質分析装置、及びネットワークシステム |
EP3041283B1 (en) | 2014-12-30 | 2019-05-29 | Comptel Corporation | Prediction of failures in cellular radio access networks and scheduling of preemptive maintenance |
JP6419010B2 (ja) * | 2015-03-31 | 2018-11-07 | Kddi株式会社 | ネットワーク監視装置、ネットワーク監視方法およびプログラム |
CN105208226B (zh) * | 2015-08-14 | 2018-04-24 | 上海银赛计算机科技有限公司 | 服务录音的合规检查方法及装置 |
JP2017111601A (ja) | 2015-12-16 | 2017-06-22 | 富士通株式会社 | 調査対象特定プログラム、および調査対象特定方法 |
US10819584B2 (en) | 2018-05-03 | 2020-10-27 | Servicenow, Inc. | System and method for performing actions based on future predicted metric values generated from time-series data |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02244338A (ja) | 1989-03-17 | 1990-09-28 | Hitachi Ltd | データ処理装置の試験方式 |
US5309448A (en) * | 1992-01-03 | 1994-05-03 | International Business Machines Corporation | Methods and systems for alarm correlation and fault localization in communication networks |
JPH06324904A (ja) | 1993-05-18 | 1994-11-25 | Fujitsu Ltd | 試験命令の補正方法 |
US5483637A (en) * | 1994-06-27 | 1996-01-09 | International Business Machines Corporation | Expert based system and method for managing error events in a local area network |
US6243746B1 (en) * | 1998-12-04 | 2001-06-05 | Sun Microsystems, Inc. | Method and implementation for using computer network topology objects |
JP2001222442A (ja) | 2000-02-08 | 2001-08-17 | Fujitsu Ltd | パイプライン試験方法、パイプライン試験命令生成方法及びその記憶媒体 |
US6701459B2 (en) * | 2000-12-27 | 2004-03-02 | Egurkha Pte Ltd | Root-cause approach to problem diagnosis in data networks |
US7215360B2 (en) * | 2001-04-06 | 2007-05-08 | Triveni Digital, Inc. | Error propagation tree technology |
JP2003050701A (ja) * | 2001-08-06 | 2003-02-21 | Toyota Motor Corp | 故障原因特定過程支援装置 |
GB2391132B (en) * | 2002-07-19 | 2005-09-21 | Hewlett Packard Co | Fault diagnosis in a network |
US7603458B1 (en) * | 2003-09-30 | 2009-10-13 | Emc Corporation | System and methods for processing and displaying aggregate status events for remote nodes |
GB2409297A (en) * | 2003-12-16 | 2005-06-22 | Ibm | Method of assessing the impact of the failure of a component on the temporal activity of the services supported by the component |
DE102004024262A1 (de) * | 2004-05-15 | 2005-12-01 | Daimlerchrysler Ag | Wissensbasiertes Diagnosesystem für ein komplexes technisches System mit zwei getrennten Wissensbasen zur Verarbeitung technischer Systemdaten und zur Verarbeitung von Kundenbeanstandungen |
US7631222B2 (en) * | 2004-08-23 | 2009-12-08 | Cisco Technology, Inc. | Method and apparatus for correlating events in a network |
JP2007011823A (ja) | 2005-07-01 | 2007-01-18 | Yokogawa Electric Corp | 分散コンピューティング環境における管理システム |
JP4562713B2 (ja) | 2006-10-05 | 2010-10-13 | ルネサスエレクトロニクス株式会社 | 論理回路における多重故障の故障箇所推定システム、故障箇所推定方法および故障箇所推定用プログラム |
US7529974B2 (en) * | 2006-11-30 | 2009-05-05 | Microsoft Corporation | Grouping failures to infer common causes |
JP4893828B2 (ja) * | 2007-06-29 | 2012-03-07 | 富士通株式会社 | ネットワーク障害検知システム |
US8301755B2 (en) * | 2007-12-14 | 2012-10-30 | Bmc Software, Inc. | Impact propagation in a directed acyclic graph |
-
2009
- 2009-12-28 JP JP2009298877A patent/JP5564941B2/ja not_active Expired - Fee Related
-
2010
- 2010-12-22 GB GB1021781.8A patent/GB2476578B/en not_active Expired - Fee Related
- 2010-12-23 US US12/977,583 patent/US8984337B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
GB2476578A (en) | 2011-06-29 |
JP2011138405A (ja) | 2011-07-14 |
GB2476578B (en) | 2015-06-24 |
GB201021781D0 (en) | 2011-02-02 |
GB2476578A8 (en) | 2013-09-04 |
US8984337B2 (en) | 2015-03-17 |
US20110161740A1 (en) | 2011-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5564941B2 (ja) | 障害箇所推定システム、障害箇所推定装置および障害箇所推定方法 | |
US11347578B2 (en) | Tracking error propagation across microservices-based applications | |
EP2759938B1 (en) | Operations management device, operations management method, and program | |
US9990501B2 (en) | Diagnosing and tracking product vulnerabilities for telecommunication devices via a database | |
US20210021644A1 (en) | Advanced cybersecurity threat mitigation using software supply chain analysis | |
US20180107528A1 (en) | Aggregation based event identification | |
JP5446894B2 (ja) | ネットワーク管理支援システム、ネットワーク管理支援装置、ネットワーク管理支援方法およびプログラム | |
CN107329894B (zh) | 应用程序系统测试方法、装置及电子设备 | |
CN103562863A (zh) | 创建定义事件类型之间关系的相关规则 | |
AU2019253836A1 (en) | Processing data utilizing a corpus | |
US10659312B2 (en) | Network anomaly detection | |
CN107832446B (zh) | 一种配置项信息的搜索方法及计算设备 | |
CN112231187B (zh) | 微服务异常分析方法及装置 | |
US9915940B2 (en) | Bi-directional association and graphical acquisition of time-based equipment sensor data and material-based metrology statistical process control data | |
US20170168884A1 (en) | Generic alarm correlation by means of normalized alarm codes | |
Azizi et al. | Retest: A cost effective test case selection technique for modern software development | |
CN102546205B (zh) | 一种故障关系生成及故障确定方法及装置 | |
Ali et al. | [Retracted] Classification and Prediction of Software Incidents Using Machine Learning Techniques | |
US20200065233A1 (en) | Automatically establishing significance of static analysis results | |
CN106155736B (zh) | 软件安装启动类型检测方法、装置及用户终端 | |
US20170024745A1 (en) | Network management event escalation | |
US8423575B1 (en) | Presenting information from heterogeneous and distributed data sources with real time updates | |
Sheakh et al. | Taxonomical study of software reliability growth models | |
CN117950891A (zh) | 业务异常的处理方法、装置、电子设备及存储介质 | |
CN117009415A (zh) | 一种工业设备关键参数挖掘方法、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140520 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140602 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5564941 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |