WO2011132730A1 - ランタイムシステムの故障の木解析の方法、システム及びプログラム - Google Patents
ランタイムシステムの故障の木解析の方法、システム及びプログラム Download PDFInfo
- Publication number
- WO2011132730A1 WO2011132730A1 PCT/JP2011/059794 JP2011059794W WO2011132730A1 WO 2011132730 A1 WO2011132730 A1 WO 2011132730A1 JP 2011059794 W JP2011059794 W JP 2011059794W WO 2011132730 A1 WO2011132730 A1 WO 2011132730A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- mcs
- component
- failure
- original
- runtime
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Definitions
- the present invention has been invented in view of the above problems, and its object is to provide a method and system for analyzing system reliability when a component fails and recovers and finding a critical component at runtime. It is to be.
- a fault tree of the system is input by the fault tree input means 110 (step A1).
- the original MCS of the fault tree is calculated by the fault tree analyzing means 120 (step A2).
- the system scans for conditional events in the original MCS in addition to the component failure of the original MCS that is the object of search by the history monitoring means 130 and lists it as a guard condition (GC). (Step A3).
- GC guard condition
- the fault tree analysis input unit 110, the history and monitoring unit 130, and the output unit 140 have the same configuration as in the first embodiment.
- the system detects any event that a component fails or recovers (step B6). If the event is a component failure, the system further checks whether the GC has been changed due to a component failure. If the GC is not changed, the current MCS can be calculated based on the latest MCS stored in the storage unit 122 (step B7). If the GC is changed, the current MCS is the original MCS. It is also necessary to calculate based on the current search values of CMS and GC. (Step B8).
- the calculated current MCS is stored in the storage unit 122 as the latest MCS and is used for the next calculation.
- the current MCS is calculated by the runtime MCS analysis means 123.
- This embodiment includes storage means for storing the latest MCS and separated original MCS / runtime MCS analysis means. Since the latest MCS is generally a subset of the original MCS, the efficiency of calculating the current MCS can be improved, particularly in the case of a large complex system in which the original MCS is quite complex.
- FIG. 1 A simple exemplary dual system system model is shown in FIG.
- the first embodiment can be viewed as a simplification of the second embodiment and is generally less efficient for large systems.
- the procedure described in the second embodiment will be followed (FIGS. 3 and 4).
- the top event (root) T of the fault tree ie, the system is faulty
- E1 component C1 is not active
- E2 component C2 is not active
- Event E3 can be broken down into two sub-events E5 (switch stuck to C2) and C2 (component C2 has failed) than priority AND (PAND), and E5 occurs prior to C2 Then, E3 is generated.
- the PAND gate represents the recognition depicted in the system model shown in FIG. 5, i.e., if event C2 occurs prior to event E5, switch S causes component C1 so that top event E3 does not occur. To switch to component C1.
- conditional events are provided in the original MCS, and the combination of sub-events of the PAND gate constitutes the MCS of the PAND gate, regardless of their occurrence.
- the rationale for the above explanation is that if a sub-event occurs prior to some other sub-event in an order that the PAND gate does not allow, then such an “illegal” occurrence of the event And / or some parts of the top event must be denied.
- a negated part is represented as a number of sub-conditional events of the appropriate sub-event and / or top event that are the targets of the search at runtime.
- the subconditional event G2 of event E5 ie, the switch is connected to component C2
- the MCS of the PAND gate ie, S ⁇ G2 ⁇ C2
- the system scans the original MCS, and the conditional event of the original MCS is extracted as a guard condition searched by the history and the monitoring means 130 (step B3).
- the guard condition is switch states G1 and G2, that is, whether the switch is connected to component C1 or the switch is connected to component C2.
- the initial MCS is stored in the storage means 122 as the latest MCS, and is used for further calculation of the runtime MCS (step B5).
- the original history is a sequence of component failure and component recovery
- the simplified history consists of a combination of only component failures, in which the component fails in its current state.
- the calculation of the runtime is actually based on a history that is simplified by searching for guard conditions as necessary, and the method depends on a sequence of component failures, for example, a method using temporal MCS. More efficient than.
- the present invention includes a failure tree analysis means for generating an original MCS of a system failure tree, a history and monitoring means for searching for component failure, component recovery and guard condition states,
- the runtime analysis means for calculating the MCS When executed by the runtime analysis means for calculating the MCS, the system reliability can be analyzed in a quantitative manner, and a critical component (at the time of operation) in the runtime can be found.
- each unit is configured by hardware, but may be configured by a program and a CPU that perform the same operation as the operation of each unit.
- Original MCS analysis means for calculating original MCS; Storage means for storing the calculated latest MCS; The runtime MCS analysis means for calculating the current MCS of the fault tree based on the original MCS or the latest MCS and improving the calculation efficiency instead of the fault tree analysis means. system.
- Appendix 4 The report according to any one of appendix 1 to appendix 3, which has an output unit for reporting the result of the runtime analysis unit to a user or converting it to another appropriate format for further analysis system.
- Fault tree input means 120 Fault tree analysis means 130 History monitoring means 140 Output means 121 Original MCS analysis means 122 Storage means 123 Runtime MCS analysis means
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
Description
異なる所は、オリジナルMCSが、本実施の形態のオリジナルMCS解析手段121により算出されることである。(ステップB2)。ステップB4の後、その結果の初期MCSが最新MCSとして記憶手段122内に保存され、更なる算出に供される(ステップB5)。
解析するシステムの故障の木を入力する故障の木入力手段と、
システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出する故障の木解析手段と、
コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する履歴監視手段と
有するシステム。
算出された最新のMCSを保存する記憶手段と、
前記故障の木解析手段に代わり、前記オリジナルのMCS又は最新のMCSを基づいて、故障の木の現状のMCSを算出し、算出の効率を向上するランタイムMCS解析手段と
を有する付記1に記載のシステム。
前記履歴監視手段の代わりに、前記オリジナルのMCSに含まれたコンポーネントの故障状態及びガード条件の状態のすべてを探索する監視手段を有する
付記1又は付記2のシステム。
解析するシステムの故障の木を入力し、
システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出し、
コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する
故障の木解析の方法。
算出された最新のMCSを保存し、
前記故障の木解析手段に代わり、前記オリジナルのMCS又は最新のMCSを基づいて、故障の木の現状のMCSを算出し、算出の効率を向上する
を有する付記5に記載の故障の木解析の方法。
前記オリジナルのMCSに含まれたコンポーネントの故障状態及びガード条件の状態のすべてを探索する
付記5又は付記6の故障の木解析の方法。
付記5から付記7のいずれかに記載の故障の木解析の方法。
解析するシステムの故障の木を入力する処理と、
システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出する処理と、
コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する処理と
を情報処理装置に実行させるプログラム。
120 故障の木解析手段
130 履歴監視手段
140 出力手段
121 オリジナルMCS解析手段
122 記憶手段
123 ランタイムMCS解析手段
Claims (9)
- ランタイムにおけるシステムの信頼性を解析し、コンポーネント故障とコンポーネント回復の履歴と、いくつかのコンポーネントの正常な状態であるいくつかのガード条件を必要に応じ探索することとを基にして重大なコンポーネントを発見するシステムであって、
解析するシステムの故障の木を入力する故障の木入力手段と、
システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出する故障の木解析手段と、
コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する履歴監視手段と
有するシステム。 - オリジナルのMCSを算出するオリジナルMCS解析手段と、
算出された最新のMCSを保存する記憶手段と、
前記故障の木解析手段に代わり、前記オリジナルのMCS又は最新のMCSを基づいて、故障の木の現状のMCSを算出し、算出の効率を向上するランタイムMCS解析手段と
を有する請求項1に記載のシステム。 - コンポーネント故障とコンポーネント回復の前記履歴は、コンポーネント故障の探索のセットにより示され、
前記履歴監視手段の代わりに、前記オリジナルのMCSに含まれたコンポーネントの故障状態及びガード条件の状態のすべてを探索する監視手段を有する
請求項1又は請求項2のシステム。 - 前記ランタイム解析手段による結果を、利用者に報告するため、又は、更なる解析のための他の適切なフォーマットに変換する出力手段を有する請求項1から請求項3のいずれかに記載のシステム。
- ランタイムにおけるシステムの信頼性を解析し、コンポーネント故障とコンポーネント回復の履歴と、いくつかのコンポーネントの正常な状態であるいくつかのガード条件を必要に応じ探索することとを基にして重大なコンポーネントを発見する故障の木解析の方法であって、
解析するシステムの故障の木を入力し、
システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出し、
コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する
故障の木解析の方法。 - オリジナルのMCSを算出し、
算出された最新のMCSを保存し、
前記故障の木解析手段に代わり、前記オリジナルのMCS又は最新のMCSを基づいて、故障の木の現状のMCSを算出し、算出の効率を向上する
を有する請求項5に記載の故障の木解析の方法。 - コンポーネント故障とコンポーネント回復の前記履歴は、コンポーネント故障の探索のセットにより示され、
前記オリジナルのMCSに含まれたコンポーネントの故障状態及びガード条件の状態のすべてを探索する
請求項5又は請求項6の故障の木解析の方法。 - 前記ランタイム解析による結果を、利用者に報告するため、又は、更なる解析のための他の適切なフォーマットに変換する
請求項5から請求項7のいずれかに記載の故障の木解析の方法。 - ランタイムにおけるシステムの信頼性を解析し、コンポーネント故障とコンポーネント回復の履歴と、いくつかのコンポーネントの正常な状態であるいくつかのガード条件を必要に応じ探索することとを基にして重大なコンポーネントを発見する故障の木解析の方法のプログラムであって、
解析するシステムの故障の木を入力する処理と、
システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出する処理と、
コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する処理と
を情報処理装置に実行させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/642,301 US8990625B2 (en) | 2010-04-22 | 2011-04-21 | Runtime system fault tree analysis method, system and program |
JP2012511694A JP5880866B2 (ja) | 2010-04-22 | 2011-04-21 | ランタイムシステムの故障の木解析の方法、システム及びプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010-099259 | 2010-04-22 | ||
JP2010099259 | 2010-04-22 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2011132730A1 true WO2011132730A1 (ja) | 2011-10-27 |
Family
ID=44834246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2011/059794 WO2011132730A1 (ja) | 2010-04-22 | 2011-04-21 | ランタイムシステムの故障の木解析の方法、システム及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8990625B2 (ja) |
JP (1) | JP5880866B2 (ja) |
WO (1) | WO2011132730A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012113582A (ja) * | 2010-11-26 | 2012-06-14 | Nec Corp | 故障の木の最小カットセットを効率的に評価する方法とシステム |
WO2013172325A1 (ja) * | 2012-05-17 | 2013-11-21 | 日本電気株式会社 | 識別システム、識別方法及びプログラム |
JP5454826B2 (ja) * | 2011-02-22 | 2014-03-26 | 日本電気株式会社 | 故障の木システム信頼性分析システム、故障の木システム信頼性分析方法及びプログラム |
CN111556992A (zh) * | 2018-01-15 | 2020-08-18 | 三菱电机株式会社 | 故障检测装置、监视控制系统及故障检测方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016521384A (ja) * | 2013-05-15 | 2016-07-21 | 日本電気株式会社 | 永続部品および永続システムを識別するためのシステム、方法、およびプログラム |
JP6066081B2 (ja) * | 2013-09-03 | 2017-01-25 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | フォールトツリーを生成する装置及び方法 |
US11665145B1 (en) * | 2014-05-02 | 2023-05-30 | Navroop Mitter | Method of providing end to end encryption with auditability |
EP3151122A1 (en) * | 2015-10-02 | 2017-04-05 | Siemens Aktiengesellschaft | Method and apparatus for generating a fault tree |
CN107491532B (zh) * | 2017-08-21 | 2020-06-19 | 北京航天发射技术研究所 | 一种基于经验向量和特征向量的故障树优化检索方法 |
WO2019061364A1 (zh) * | 2017-09-29 | 2019-04-04 | 华为技术有限公司 | 故障分析方法及相关设备 |
CN108509290A (zh) * | 2018-02-11 | 2018-09-07 | 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) | 数据驱动的故障树分析方法、装置及系统 |
US11658889B1 (en) | 2022-03-27 | 2023-05-23 | Bank Of America Corporation | Computer network architecture mapping using metadata |
US11595245B1 (en) | 2022-03-27 | 2023-02-28 | Bank Of America Corporation | Computer network troubleshooting and diagnostics using metadata |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000235507A (ja) * | 1999-02-16 | 2000-08-29 | Toshiba Corp | システムの信頼性設計装置及び方法並びにシステムの信頼性設計用ソフトウェアを記録した記録媒体 |
JP2003216923A (ja) * | 2002-11-29 | 2003-07-31 | Fuji Heavy Ind Ltd | 故障診断装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04302027A (ja) * | 1991-03-29 | 1992-10-26 | Ricoh Co Ltd | 事例データベース構築装置 |
JPH04302364A (ja) * | 1991-03-29 | 1992-10-26 | Nippon Telegr & Teleph Corp <Ntt> | 故障解析方式 |
JP2985505B2 (ja) * | 1991-07-08 | 1999-12-06 | 株式会社日立製作所 | 品質情報収集診断システム及びその方法 |
AU2000239591A1 (en) * | 2000-01-29 | 2001-08-07 | Abb Research Ltd | Method for automatic fault tree synthesis |
JP4174497B2 (ja) * | 2004-09-30 | 2008-10-29 | 東芝ソリューション株式会社 | 情報システムの信頼性評価システム、信頼性評価方法、信頼性評価プログラム |
WO2006077590A2 (en) * | 2005-01-19 | 2006-07-27 | Favoweb Ltd. | A system and method for bouncing failure analysis |
US7681086B2 (en) * | 2007-09-20 | 2010-03-16 | Embraer- Empresa Brasileira De Aeronautica S.A. | Fault tree map generation |
US7856575B2 (en) * | 2007-10-26 | 2010-12-21 | International Business Machines Corporation | Collaborative troubleshooting computer systems using fault tree analysis |
US8121042B2 (en) * | 2008-06-30 | 2012-02-21 | The Boeing Company | Reliability estimation methods for large networked systems |
-
2011
- 2011-04-21 JP JP2012511694A patent/JP5880866B2/ja active Active
- 2011-04-21 WO PCT/JP2011/059794 patent/WO2011132730A1/ja active Application Filing
- 2011-04-21 US US13/642,301 patent/US8990625B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000235507A (ja) * | 1999-02-16 | 2000-08-29 | Toshiba Corp | システムの信頼性設計装置及び方法並びにシステムの信頼性設計用ソフトウェアを記録した記録媒体 |
JP2003216923A (ja) * | 2002-11-29 | 2003-07-31 | Fuji Heavy Ind Ltd | 故障診断装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012113582A (ja) * | 2010-11-26 | 2012-06-14 | Nec Corp | 故障の木の最小カットセットを効率的に評価する方法とシステム |
JP5454826B2 (ja) * | 2011-02-22 | 2014-03-26 | 日本電気株式会社 | 故障の木システム信頼性分析システム、故障の木システム信頼性分析方法及びプログラム |
US8909991B2 (en) | 2011-02-22 | 2014-12-09 | Nec Corporation | Fault tree system reliability analysis system, fault tree system reliability analysis method, and program therefor |
WO2013172325A1 (ja) * | 2012-05-17 | 2013-11-21 | 日本電気株式会社 | 識別システム、識別方法及びプログラム |
CN111556992A (zh) * | 2018-01-15 | 2020-08-18 | 三菱电机株式会社 | 故障检测装置、监视控制系统及故障检测方法 |
Also Published As
Publication number | Publication date |
---|---|
US20130042167A1 (en) | 2013-02-14 |
JPWO2011132730A1 (ja) | 2013-07-18 |
US8990625B2 (en) | 2015-03-24 |
JP5880866B2 (ja) | 2016-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2011132730A1 (ja) | ランタイムシステムの故障の木解析の方法、システム及びプログラム | |
Das et al. | Desh: deep learning for system health prediction of lead times to failure in hpc | |
US20210049092A1 (en) | Analyzing software test failures using natural language processing and machine learning | |
Bertero et al. | Experience report: Log mining using natural language processing and application to anomaly detection | |
US20150121136A1 (en) | System and method for automatically managing fault events of data center | |
Bao et al. | Execution anomaly detection in large-scale systems through console log analysis | |
Gainaru et al. | Fault prediction under the microscope: A closer look into HPC systems | |
US8219512B2 (en) | Higher order logic applied to expert systems for alarm analysis, filtering, correlation and root causes which converts a specification proof into a program language | |
US20110083123A1 (en) | Automatically localizing root error through log analysis | |
US9471655B2 (en) | Enabling symptom verification | |
Wu et al. | Performance diagnosis in cloud microservices using deep learning | |
Lou et al. | Experience report on applying software analytics in incident management of online service | |
Reidemeister et al. | Identifying symptoms of recurrent faults in log files of distributed information systems | |
Makanju et al. | Investigating event log analysis with minimum apriori information | |
KR101993635B1 (ko) | 지능형 자율 시스템에서의 사고 원인 추적 시스템 | |
US20140372803A1 (en) | Apparatus and method for analyzing abnormal states of component-based system | |
Chen et al. | Automatic root cause analysis via large language models for cloud incidents | |
US20120109639A1 (en) | Method, computer program and apparatus for analyzing symbols in a computer system | |
Elimelech et al. | Structural abstraction for model-based diagnosis with a strong fault model | |
WO2013172325A1 (ja) | 識別システム、識別方法及びプログラム | |
Kubacki et al. | Holistic processing and exploring event logs | |
Soualhia et al. | Automated traces-based anomaly detection and root cause analysis in cloud platforms | |
Liu et al. | CUBA: interprocedural context-unbounded analysis of concurrent programs | |
Schuppan | Towards a notion of unsatisfiable cores for LTL | |
Kuang et al. | Knowledge-aware Alert Aggregation in Large-scale Cloud Systems: a Hybrid Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 11772062 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 13642301 Country of ref document: US Ref document number: 2012511694 Country of ref document: JP |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 11772062 Country of ref document: EP Kind code of ref document: A1 |