JP5880866B2 - ランタイムシステムの故障の木解析の方法、システム及びプログラム - Google Patents

ランタイムシステムの故障の木解析の方法、システム及びプログラム Download PDF

Info

Publication number
JP5880866B2
JP5880866B2 JP2012511694A JP2012511694A JP5880866B2 JP 5880866 B2 JP5880866 B2 JP 5880866B2 JP 2012511694 A JP2012511694 A JP 2012511694A JP 2012511694 A JP2012511694 A JP 2012511694A JP 5880866 B2 JP5880866 B2 JP 5880866B2
Authority
JP
Japan
Prior art keywords
mcs
failure
component
minimum cut
cut set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012511694A
Other languages
English (en)
Other versions
JPWO2011132730A1 (ja
Inventor
剣文 向
剣文 向
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012511694A priority Critical patent/JP5880866B2/ja
Publication of JPWO2011132730A1 publication Critical patent/JPWO2011132730A1/ja
Application granted granted Critical
Publication of JP5880866B2 publication Critical patent/JP5880866B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Description

本発明は、ランタイム(稼働時)にけるシステムの信頼性を定量的に解析する方法とシステムに関し、特に、コンポーネントが故障し回復する際のランタイム(稼働時)においてシステムの単一故障点などの重大なコンポーネントを算出する解析する方法、システム及びプログラムに関する。
本発明に関連する品質情報診断が特許文献1に開示されている。図11と図12に示すように、かかる従来の方法は故障の木を使用して、利用者が報告したいくつかの特殊なシステム故障に関して潜在的なコンポーネント故障を診断する。これはトップダウン方法における故障の木解析(FTA:fault tree analysis)の一般的な応用である。
しかしながら、この方法は逆の質問に答えることができない、即ち、実際上、故障トレラントシステムの特別な主要な関心である、ランタイムにおけるいくつかの他のコンポーネントが故障し回復する際の現状の重大なコンポーネントは、なにかという質問に答えることができなかった。
ボトムアップ方法において関連するFTAを直接適用することは、当該問題を解決する際のトラブルになる。その理由は、関連するFTAは、最小カットセット(MCS)において、条件付き事象(即ち、故障と見なされない正常な事象)を考慮しておらず、その単純なブール論理上のセマンティックにより、異なる事象間の系列依存性を取り扱う際のトラブルになる。これを示すために、非特許文献1を参照すると、非特許文献1では最小カットセットは、コンポーネント故障がすべて発生すれば、頂上事象を発生させるコンポーネント故障の最小の組み合わせとして定義される。ここで、頂上事象は一般的に最も高いレベルの望ましくないシステムハザード、即ち、故障の木の根元として理解される。故障の木における必須な条件付き事象を考慮しないと、かかる定義はランタイムMCSの分析では失敗する。ここで、ランタイムMCSとは、いくつかのコンポーネントが故障し、回復する際における故障の木の現状のMCSを意味し、それはランタイムにおいてシステムの現状の重大なコンポーネントを予測するのに重要である。
非特許文献2に記載されているような、時相故障の木は、関連する故障の木の系列依存性問題を解決するのに役立つかもしれない。
しかしながら、時相演算子を故障の木のMCSに導入することは、コンポーネント故障の組み合わせよりも、むしろコンポーネント故障の系列を一般的には考慮することが必要であるので、ランタイムMCSを算出する複雑さと費用の増大とをもたらすことになる。
特開平5−165853号公報 (第5−7頁、図1と図6)
W.E. Vesely, F.F. Goldberg, N.H.Roberts, and D.F. Haasl, Fault Tree Handbook, U.S. Nuclear Regulatory Commission, NUREG-0492, Jan. 1981, pp. VII-15. K.M. Hansen, A.P. Ravn, and V. Stavridou, From Safety Analysis to Software Requirements, IEEE Transactions on Software Engineering, Vol. 24, No. 7, July 1998.
上述した発明の課題は、FTAのMCSがむしろインフォーマルなやり方で定義され、当該MCSが障の木の頂上事象に対する必要且つ十分な条件すべてをとらえていないことにある。その理由は、関連する故障の木(FT)がMCSにおいて正常な条件付き事象を考慮せず、当該FTが、優先AND(PAND)ゲートなどの系列依存性ゲートのMCSについて明確に定義されていないからである。PANDゲートは特殊なANDゲートで、当該ゲートではその出力事象が、すべてのサブ事象が左から右の特別な順序で発生した時及びその時のみ、発生する。その結果、ランタイムMCSを解析し、重大なコンポーネントを正しいやり方で発見することは、特に、故障の木が条件付き事象及び/又はPANDゲートを備える時、困難又は不可能である。
そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、コンポーネントが故障し回復する際のシステム信頼性を解析し、重大なコンポーネントをランタイムにおいて発見する方法とシステムを提供することである。
上記課題を解決する本発明は、ランタイムにおけるシステムの信頼性を解析し、コンポーネント故障とコンポーネント回復の履歴と、いくつかのコンポーネントの正常な状態であるいくつかのガード条件を必要に応じ探索することとを基にして重大なコンポーネントを発見するシステムであって、解析するシステムの故障の木を入力する故障の木入力手段と、システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出する故障の木解析手段と、コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する履歴監視手段と有するシステムである。
上記課題を解決する本発明は、ランタイムにおけるシステムの信頼性を解析し、コンポーネント故障とコンポーネント回復の履歴と、いくつかのコンポーネントの正常な状態であるいくつかのガード条件を必要に応じ探索することとを基にして重大なコンポーネントを発見する故障の木解析の方法であって、解析するシステムの故障の木を入力し、システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出し、コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する故障の木解析の方法である。
上記課題を解決する本発明は、ランタイムにおけるシステムの信頼性を解析し、コンポーネント故障とコンポーネント回復の履歴と、いくつかのコンポーネントの正常な状態であるいくつかのガード条件を必要に応じ探索することとを基にして重大なコンポーネントを発見する故障の木解析の方法のプログラムであって、解析するシステムの故障の木を入力する処理と、システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出する処理と、コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する処理とを情報処理装置に実行させるプログラムである。
本発明は、故障の木と、コンポーネント故障とコンポーネント回復の履歴並びにいくつかのガード条件を必要に応じて探索すること、とが与えられると、システムのMCSと重大なコンポーネンとをランタイム(稼働時)において算出できる。その理由は、ランタイムMCSは、コンポーネント故障とコンポーネント回復の履歴を探索することと、故障の木のオリジナルのMCSに含まれた必須なガード条件の状態とを基にして算出できるからである。
図1は本発明の第1の発明を実施するための最良の形態の構成を示すブロック図である。 図2は第1の発明を実施するための最良の形態の動作を示す流れ図である。 図3は本発明の第2の発明を実施するための最良の形態の構成を示すプロック図である。 図4は第2の発明を実施するための最良の形態の動作を示す流れ図である。 図5は発明を実施するための最良の形態の動作の具体例のシステムモデルを示す図である。 図6は具体例の故障の木である。 図7は故障の木の異なったMCSを示す図である。 図8はINHIBITとPANDゲートのMCSの異なった算出方法を示す図である。 図9はランタイム解析結果の例を示す図である。 図10はランタイムMCSの算出パターンを示す図である。 図11は特許文献1の発明を実施した場合のシステムの全体構成図である。 図12は特許文献1の故障診断において、探索の対象となる故障の因果関係を表した樹木の階層構造を示す図である。
本発明の概要を説明する。
提案するランタイムシステムの信頼性を解析する方法とシステムは、故障の木入力手段と、故障の木解析手段と、履歴監視手段とを備える。故障の木入力手段を使用し、解析するシステムの故障の木を入力する。故障の木解析手段を使用し、以下の前記履歴と監視手段が提供した探索値を基にして故障の木入力手段から入力された故障の木のオリジナルのMCSと、故障の木のランタイムMCSとを算出する。前記故障の木のオリジナルのMCSは探索値の空セットを基にして算出されること、即ち、システムの初期化では前記履歴監視手段において探索が利用できないことにと注目する。
履歴監視手段を使用して、コンポーネント故障とコンポーネント回復の履歴を記録し、ガード条件の状態を監視することにより、故障の木ランタイムMCSを算出するための探索値のセットを提供するようにする。探索されたコンポーネントとガード条件は、前記オリジナルの故障の木のMCSにおいて基本故障事象と条件付き事象としてそれぞれ表記されることに注目する。
かかる構造により、コンポーネントが故障し回復する際に、システムのMCS並びに重大コンポーネントはランタイムにおいて算出することができる。
次に、本発明の実施の形態について図面を参照して詳細に説明する。
図1を参照すると、本発明の第1の実施の形態は、故障の木入力手段110と、故障の木解析手段120と、履歴監視手段130と、出力手段140とを備える。
これらの手段はそれぞれ概略つぎのように動作する。
故障の木入力手段110は、解析するシステムの故障の木を入力する。
故障の木解析手段120は、故障の木入力手段110から入力された故障の木のオリジナルのMCSとランタイムMCSとを算出する。
履歴監視手段130は、コンポーネント故障とコンポーネント回復の履歴を記録し、前記故障の木解析手段120により算出されたオリジナルのMCSに含まれたガード条件の現状状態を監視する。履歴監視手段130の探索値も使用して、故障の木解析手段120は、ランタイムMCSを算出する。
出力手段140は、故障の木解析手段120により算出された現状のMCS(即ち、オリジナルのMCSとランタイムMCS)が他のコンポーネントに転送され、表示及び更なる解析(例えば、システム信頼性を定量的に解析)に供されるようにする。
次に、図1及び図2のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。
先ず、システムの故障の木が前記故障の木入力手段110により入力される(ステップA1)。故障の木のオリジナルのMCSは故障の木解析手段120により算出される(ステップA2)。オリジナルのMCSを入手後、システムは、履歴監視手段130による探索の対象であるオリジナルのMCSのコンポーネント故障の他に、オリジナルのMCSにおいて条件付き事象を走査し、ガード条件(GC)としてリストアップする(ステップA3)。
特定のシステム初期状態に従い、GCをブール値偽又は真で初期化することにより、GSが初期化された状態のオリジナルのMCSに関して、システムの初期MCSを算出することができる(ステップA4)。初期MCSは評価(即ち、初期化)されており、初期MCSの値は別個のGCの探索により表記されているので、初期MCSは条件付き事象を含まないことに注目する。それを示すために、例示的な初期MCSをオリジナルのMCSと対比して図7に示す。系列ランタイムMCSのすべてはこの関心の分離のルールに従う。初期MCSは、システム初期状態における現状のMCSでもあるので、出力手段140に転送することができる。
初期化後、システムはコンポーネント故障又はコンポーネント回復のいかなる事象も検出する(ステップA5)。かかる事象が発生すると、システムは、GSの必須な探索値と、前記履歴監視手段130により探索されたコンポーネント故障とを使い、前記オリジナルのMCSを基に現状のMCSを算出する(ステップA6)。算出は故障の木解析手段120により行われる。
最後に、現状のMCSの結果は、前記出力手段140に転送され、出力又は更なる解析に供される(ステップA7)。
次に、本実施の形態の効果について説明する。
本実施形態はオリジナルのMCSを算出し、コンポーネント故障とコンポーネント回復を検出し、ガード条件を探索するので、現状のMCSを算出することができる。
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。
図3を参照すると、本発明の第2の実施の形態は第1の実施形態の拡張であり、第1の実施の形態の故障の木解析手段120がオリジナルMCS解析手段121と、記憶手段122と、ランタイムMCS解析手段123とに置き換わり、ランタイムMCSを算出する効率を向上させている。
これらの手段はそれぞれ概略つぎのように動作する。
故障の木入力手段110と、履歴監視手段130と、出力手段140とは第1の実施形態と同様な構成である。
オリジナルMCS解析手段121は、故障の木入力手段110から入力された故障の木のオリジナルMCSを算出する。
記憶手段122は、オリジナルMCS解析手段121により算出されたオリジナルのMCSと、ランタイムMCS解析手段123により算出された最新のMCSとを保存する。
ランタイムMCS解析手段123は、履歴監視手段130が探索したコンポーネント故障とコンポーネント回復の履歴並びにガード条件の現状の状態と、前記記憶手段122内で保存されている最新MCS又はオリジナルのMCSとを基に現状MCSを算出する。その結果を使用し、前記記憶手段122の最新のMCSを更新する。
次に、図3及び図4のフローチャートを参照して本実施の形態の全体の動作について詳細に説明する。
ステップB1からB4は、第1の実施の形態のステップA1からA4とは同様なものについては説明を省略し、異なる所を説明する
異なる所は、オリジナルMCSが、本実施の形態のオリジナルMCS解析手段121により算出されることである。(ステップB2)。ステップB4の後、その結果の初期MCSが最新MCSとして記憶手段122内に保存され、更なる算出に供される(ステップB5)。
初期化後、システムはコンポーネントが故障又回復するいかなる事象も検出する(ステップB6)。事象がコンポーネント故障であれば、システムは、GCがコンポーネント故障により変更されたか更にチェックする。GCが変更されていなければ、現状のMCSは記憶手段122内に保存された最新MCSを基にして算出することができ(ステップB7)、GCが変更されていれば、現状のMCSは、オリジナルのCMSとGCの現状の探索値を基にして算出する必要もある。(ステップB8)。
再度、算出された現状のMCSは最新MCSとして記憶手段122内に保存され、次の算出に供される。現状のMCSの算出は、ランタイムMCS解析手段123によりなされる。
最新のMCSの結果は、出力手段140に転送され、出力又は更なる解析に供されることができる(ステップB9)。
記憶手段122内に保存された最新MCSを出力する代わりに、算出された初期MCSと現状のMCSを直接出力手段140に転送でき、それらは図4のダッシュ矢印により表記される。
次に、本実施の形態の効果について説明する。
本実施の形態は、最新のMCSを保存する記憶手段と、分離済みオリジナルMCS/ランタイムMCS解析手段とを備える。最新MCSは、一般に、オリジナルMCSのサブセットであるので、特に、オリジナルMCSがかなり複雑である大きな複雑なシステムの場合、現状のMCSを算出効率を向上することができる。
次に、具体的な実施例を用いて本発明を実施するための最良の形態の動作を説明する。
簡単な例示的なデュアルシステムのシステムモデルを図5に示す。
システムは2つコンポーネントC1とC2とから成り立ち、システムは、2つコンポーネントのいずれかが作動する時作動すると仮定する。これらの2つのコンポーネントのいずれかが故障した時、スイッチSと他のコンポーネントが故障していなければ、スイッチSは他のコンポーネントに切り替え、作動する。また、スイッチは最初にコンポーネントC1に接続されていると仮定する。
本発明をより理解するために、第1の実施の形態は第2の実施の形態を単純化したものと見なすことができ、一般に、大きいシステムに対してはより効率的ではないので、本発明の第2の実施の形態で描がかれた手順に従うことにする(図3と図4)。
例示的なシステムの故障の木が図6に示されていると仮定する。故障の木の頂上事象(根元)T(即ち、システムが故障している)は、ANDゲートにより2つのサブ事象E1(コンポーネントC1は作動していない)と、E2(コンポーネントC2が作動していない)とに分解することができる。
事象E1はORゲートにより2つのサブ事象C1(コンポーネントC1が故障している)と、E3(コンポーネントC1は故障したが作動している)に分解することができる。事象C1は、更に分解する必要がないコンポーネント故障の基本事象であることに注目する。
事象E3は、優先AND(PAND)より更に2つのサブ事象E5(スイッチがC2に固着している)と、C2(コンポーネントC2が故障している)とに分解でき、E5がC2に先立って発生すれば、E3が発生する。逆の観点から、PANDゲートは図5に示すシステムモデルに描かれた認識を表す、即ち、事象C2が事象E5より先だって発生すれば、スイッチSは、事象E3が発生しないように、コンポーネントC1に切り替え、コンポーネントC1を作動させる。
事象E5は、INHIBITゲートにより、条件付き事象G2(スイッチSはC2に接続されている)と、基本事象S(スイッチが故障している)とに更に分解することができる。即ち、スイッチSがコンポーネントC2に接続されているとき、スイッチが故障すれば、C2に接続されたままである。事象E1の左側サブ木の一種のデユアル木と見なすことができる、頂上事象の右側のサブ木は同様なやり方で解析することができる。
図7に示すように、3種類のMCSが、図6の故障の木を基にして、従来のFTAによるものと、時相論理によるものと、本発明の方法によるものとに関してそれぞれ算出することができる。条件付き事象について、INHIBITゲーとPANDゲートが算出する、これら3つの方法のMCSパターンを図8に示し比較する。
故障の木ハンドブックでは最小カットセットはコンポーネント故障のみの最小の組み合わせと定義されているので、図7と図8において、従来のFTAは、MCSにおいて条件付き事象を含まないことに注目する。この定義に従い、従来のFTAの結果得られるMCSは、頂上事象に対して必要のみで十分な条件ではない。更に、単に、従来のFTAの理論的根拠、即ち、ブール論理は、異なる事象間系列依存性(時相関係)を表すのが困難であるため、PANDゲートのMCSについて明確な定義がされていない。オープンFTAなどのいくつかの現存するFTAツールは、MCSを算出するANDゲートとして単にPANDゲートを取り扱うが、正式に証明しない又は正式に説明しないかかる単純化はセマンティックな矛盾や概念上の誤解を引き起こす。即ち、PANDゲートのサブ事象が、PANDゲートで規定された特定な順序で発生しなくとも、頂上事象は依然として発生する。
時相論理を使用して事象間系列依存性を取り扱うことができ、例示的な故障の木に対する候補時相MCSとPANDゲートとを図7と図8にそれぞれ示す。いつか成り立つ線形の時相演算子<>を時相MCSに使用していることに着目する。時相MCSの1つの潜在的トラブルは、ランタイムMCSを算出することは、一般に計算費用の増大が避けられない、コンポーネント故障の組み合わせよりもコンポーネント故障の系列を探索することが必要になることです。
本発明では、条件付き事象がオリジナルのMCSに含まれる。PANDゲートに関して、PANDゲートは、入力事象と潜在的な条件付き事象(入力事象に含まれていない)の組み合わせとして解釈することができ、動的なシステムがマルコフ性を満足することができる。言い換えれば、PANDゲートは、潜在的な条件付き事象を持つ標準的なANDゲートに変換することができる。入力事象が、PANDゲートによって許されない異なる順序で発生した場合は、条件付きの事象のいくつかは否定されなければならないが、異なる順序もマルコフ性に従ってPANDゲートの出力事象となり、PANDゲートは否定されることとなる。入力事象と条件付きの事象を観察することによって、PANDゲートの入力事象の順序は、故障の木のランタイム解析から省略することができる。例えば、図6に示すE3に接続される事象E5とC2を入力とするPANDゲートに関して、潜在的な条件付き事象はG2(スイッチSがコンポーネントC2に固着されている)であり、PANDゲートは、
Figure 0005880866
として解釈することができる。
C2(即ち、コンポーネントC2が故障している)がE5(即ち、スイッチSがコンポーネントC2に固着している)に先立って発生すれば、スイッチSは、図5に描かれたシステム動作上のセマンティックに従いコンポーネント1に切り替わる。この場合、条件付き事象G2は否定され、PANDゲート
Figure 0005880866
のMCSは故障の木のMCSにおいて破棄される。
オリジナルのMCSを算出後、システムはオリジナルのMCSを走査し、オリジナルのMCSの条件付き事象が、前記履歴監視手段130が探索するガード条件として抽出される(ステップB3)。この例では、ガード条件はスイッチの状態G1とG2、即ち、スイッチはコンポーネントC1に接続されているか又はスイッチはコンポーネントC2接続されているかである。スイッチが最初にC1に接続されていると仮定すると、故障の木の初期MCSが、図9に示すG1=真及びG2=偽、即ち、
Figure 0005880866
という評価でオリジナルのMCSを削減することにより算出できる(ステップB4)。初期のMCSは、最新MCSとして前記記憶手段122に保存され、更なるランタイムMCSの算出に供される(ステップB5)。
初期化後、前記履歴監視手段130により探索された最初の事象はC1、即ち、コンポーネントC1は故障している(ステップB6)、及びガード条件のG1からG2への変更も検出されていると仮定すると、現状のMCSは、G2=真、G1=偽、及び単純化された履歴C1=真という評価という評価でオリジナルのMCSを削減することにより算出できる(ステップB8)。その結果は、システムの唯一の単一故障点でもあるC2である、即ちコンポーネントC2がこの状況下で故障していれば、システムが故障する(図9の状態1.1参照)。
システムで検出された第2の事象がS、即ち、スイッチが故障している、及びガード条件への変更がなされていないと仮定すると、現状のMCSは、最新事象S=真という評価で最新のMCSを削減することにより算出することができ(ステップB7)、その結果はC2のままである(図9の状態1.1.1参照)。
システムで検出された第3の事象が¬S(単純化のため、コンポーネントの回復を表記す否定記号¬を使用する)、即ち、スイッチは回復(修理)され、及び現状のガード条件はG2であると仮定すると、現状のMCSは、G2=真および単純化された履歴C1=真という評価でオリジナルのMCSを削減することにより算出することができ(ステップB8)、その結果はC2のままである(図9の状態1.1.1.1参照)。
オリジナルの履歴は、コンポーネント故障とコンポーネント回復の系列であるが、一方、単純化された履歴は、コンポーネントの故障のみの組み合わせから構成され、当該単純化された履歴においてコンポーネントは現状の状態では故障していることに注目する。ランタイムの算出は、実際には、ガード条件を必要に応じて探索して単純化された履歴を基にしており、その方法は、コンポーネント故障の系列に頼る方法、例えば、時相MCSを使う方法よりも一層効率的である。
上記3つのケースに関するランタイムMCSを算出するパターンは図10に示す。
本発明は、システムの故障の木のオリジナルのMCSを発生する故障の木解析手段と、コンポーネント故障とコンポーネント回復並びにガード条件の状態を探索する履歴と監視手段と、ランタイムにおける(稼働時)現状のMCSを算出する前記ランタイム解析手段とが実行することにより、システム信頼性を定量的なやり方で解析し、ランタイムにおける(稼働時)重大なコンポーネントを発見することができる。
また、上述した実施の形態では、各部をハードウェアで構成したが、各部の動作と同様な動作を行うプログラムとCPUとで構成しても良い。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1) ランタイムにおけるシステムの信頼性を解析し、コンポーネント故障とコンポーネント回復の履歴と、いくつかのコンポーネントの正常な状態であるいくつかのガード条件を必要に応じ探索することとを基にして重大なコンポーネントを発見するシステムであって、
解析するシステムの故障の木を入力する故障の木入力手段と、
システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出する故障の木解析手段と、
コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する履歴監視手段と
有するシステム。
(付記2) オリジナルのMCSを算出するオリジナルMCS解析手段と、
算出された最新のMCSを保存する記憶手段と、
前記故障の木解析手段に代わり、前記オリジナルのMCS又は最新のMCSを基づいて、故障の木の現状のMCSを算出し、算出の効率を向上するランタイムMCS解析手段と
を有する付記1に記載のシステム。
(付記3) コンポーネント故障とコンポーネント回復の前記履歴は、コンポーネント故障の探索のセットにより示され、
前記履歴監視手段の代わりに、前記オリジナルのMCSに含まれたコンポーネントの故障状態及びガード条件の状態のすべてを探索する監視手段を有する
付記1又は付記2のシステム。
(付記4) 前記ランタイム解析手段による結果を、利用者に報告するため、又は、更なる解析のための他の適切なフォーマットに変換する出力手段を有する付記1から付記3のいずれかに記載のシステム。
(付記5) ランタイムにおけるシステムの信頼性を解析し、コンポーネント故障とコンポーネント回復の履歴と、いくつかのコンポーネントの正常な状態であるいくつかのガード条件を必要に応じ探索することとを基にして重大なコンポーネントを発見する故障の木解析の方法であって、
解析するシステムの故障の木を入力し、
システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出し、
コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する
故障の木解析の方法。
(付記6) オリジナルのMCSを算出し、
算出された最新のMCSを保存し、
前記故障の木解析手段に代わり、前記オリジナルのMCS又は最新のMCSを基づいて、故障の木の現状のMCSを算出し、算出の効率を向上する
を有する付記5に記載の故障の木解析の方法。
(付記7) コンポーネント故障とコンポーネント回復の前記履歴は、コンポーネント故障の探索のセットにより示され、
前記オリジナルのMCSに含まれたコンポーネントの故障状態及びガード条件の状態のすべてを探索する
付記5又は付記6の故障の木解析の方法。
(付記8) 前記ランタイム解析による結果を、利用者に報告するため、又は、更なる解析のための他の適切なフォーマットに変換する
付記5から付記7のいずれかに記載の故障の木解析の方法。
(付記9) ランタイムにおけるシステムの信頼性を解析し、コンポーネント故障とコンポーネント回復の履歴と、いくつかのコンポーネントの正常な状態であるいくつかのガード条件を必要に応じ探索することとを基にして重大なコンポーネントを発見する故障の木解析の方法のプログラムであって、
解析するシステムの故障の木を入力する処理と、
システムの故障の木のオリジナルの最小カットセット(MCS)とランタイム最小カットセットとを算出する処理と、
コンポーネント故障とコンポーネント回復の履歴とを記録し、前記オリジナルのMCSに含まれたガード条件の状態を探索する処理と
を情報処理装置に実行させるプログラム。
以上好ましい実施の形態をあげて本発明を説明したが、本発明は必ずしも上記実施の形態に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
本出願は、2010年4月22日に出願された日本出願特願2010−099259号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
110 故障の木入力手段
120 故障の木解析手段
130 履歴監視手段
140 出力手段
121 オリジナルMCS解析手段
122 記憶手段
123 ランタイムMCS解析手段

Claims (7)

  1. ランタイムにおけるシステムの信頼性を解析するシステムであって、
    解析するシステムの故障の木を入力する故障の木入力手段と、
    システムの故障の木のオリジナルの最小カットセット(MCS)を算出し、前記オリジナルの最小カットセット(MCS)から条件付き事象をガード条件として算出し、コンポーネント故障又はコンポーネント回復の前の初期最小カットセットを算出して記憶する故障の木解析手段と、
    コンポーネント故障とコンポーネント回復の履歴とを記録し、前記履歴からガード条件の変更を判定する履歴監視手段と有し、
    前記故障の木解析手段は、前記ガード条件を変更する場合は、前記変更後のカード条件により、前記オリジナルの最小カットセット(MCS)から、ランタイム後のコンポーネント故障又はコンポーネント回復後の現状のシステムの最小カットセットを算出し、前記ガード条件を変更しない場合は、前記カード条件により、前記初期最小カットセットから、ランタイム後の現状のシステムの最小カットセットを算出する
    システム。
  2. コンポーネント故障とコンポーネント回復の前記履歴は、コンポーネント故障の探索のセットにより示され、
    前記履歴監視手段の代わりに、前記オリジナルのMCSに含まれたコンポーネントの故障状態及びガード条件の状態のすべてを探索する監視手段を有する
    請求項1に記載のシステム。
  3. 前記故障の木解析手段による結果を、利用者に報告するため、又は、更なる解析のための他の適切なフォーマットに変換する出力手段を有する請求項1又は請求項2に記載のシステム。
  4. ランタイムにおけるシステムの信頼性を解析する故障の木解析システムの故障の木解析の方法であって、
    前記故障の木解析システムは、解析するシステムの故障の木を入力し、
    前記故障の木解析システムは、システムの故障の木のオリジナルの最小カットセット(MCS)を算出し、前記オリジナルの最小カットセット(MCS)から条件付き事象をガード条件として算出し、ランタイム後のコンポーネント故障又はコンポーネント回復の前の初期最小カットセットを算出して記憶し
    前記故障の木解析システムは、コンポーネント故障とコンポーネント回復の履歴とを記録し、前記履歴からガード条件の変更を判定し、
    前記故障の木解析システムは、前記ガード条件を変更する場合は、前記変更後のカード条件により、前記オリジナルの最小カットセット(MCS)から、コンポーネント故障又はコンポーネント回復後の現状のシステムの最小カットセットを算出し、前記ガード条件を変更しない場合は、前記カード条件により、前記初期最小カットセットから、ランタイム後の現状のシステムの最小カットセットを算出する
    故障の木解析の方法。
  5. コンポーネント故障とコンポーネント回復の前記履歴は、コンポーネント故障の探索のセットにより示され、
    前記故障の木解析システムは、前記オリジナルのMCSに含まれたコンポーネントの故障状態及びガード条件の状態のすべてを探索する
    請求項4に記載の故障の木解析の方法。
  6. 前記故障の木解析システムは、前記算出された故障の木の現状の最小カットセットの結果を、利用者に報告するため、又は、更なる解析のための他の適切なフォーマットに変換する
    請求項4又は請求項5に記載の故障の木解析の方法。
  7. ランタイムにおけるシステムの信頼性を解析する故障の木解析の方法のプログラムであって、
    解析するシステムの故障の木を入力する処理と、
    システムの故障の木のオリジナルの最小カットセット(MCS)を算出し、前記オリジナルの最小カットセット(MCS)から条件付き事象をガード条件として算出し、ランタイム後のコンポーネント故障又はコンポーネント回復の前の初期最小カットセットを算出して記憶する処理と、
    コンポーネント故障とコンポーネント回復の履歴とを記録し、前記履歴からガード条件の変更を判定する処理と
    前記ガード条件を変更する場合は、前記変更後のカード条件により、前記オリジナルの最小カットセット(MCS)から、コンポーネント故障又はコンポーネント回復後の現状のシステムの最小カットセットを算出し、前記ガード条件を変更しない場合は、前記カード条件により、前記初期最小カットセットから、ランタイム後の現状のシステムの最小カットセットを算出する処理と
    を情報処理装置に実行させるプログラム。
JP2012511694A 2010-04-22 2011-04-21 ランタイムシステムの故障の木解析の方法、システム及びプログラム Active JP5880866B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012511694A JP5880866B2 (ja) 2010-04-22 2011-04-21 ランタイムシステムの故障の木解析の方法、システム及びプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2010099259 2010-04-22
JP2010099259 2010-04-22
PCT/JP2011/059794 WO2011132730A1 (ja) 2010-04-22 2011-04-21 ランタイムシステムの故障の木解析の方法、システム及びプログラム
JP2012511694A JP5880866B2 (ja) 2010-04-22 2011-04-21 ランタイムシステムの故障の木解析の方法、システム及びプログラム

Publications (2)

Publication Number Publication Date
JPWO2011132730A1 JPWO2011132730A1 (ja) 2013-07-18
JP5880866B2 true JP5880866B2 (ja) 2016-03-09

Family

ID=44834246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012511694A Active JP5880866B2 (ja) 2010-04-22 2011-04-21 ランタイムシステムの故障の木解析の方法、システム及びプログラム

Country Status (3)

Country Link
US (1) US8990625B2 (ja)
JP (1) JP5880866B2 (ja)
WO (1) WO2011132730A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5601468B2 (ja) * 2010-11-26 2014-10-08 日本電気株式会社 故障の木の最小カットセットを効率的に評価する方法とシステム
JP5454826B2 (ja) * 2011-02-22 2014-03-26 日本電気株式会社 故障の木システム信頼性分析システム、故障の木システム信頼性分析方法及びプログラム
JPWO2013172325A1 (ja) * 2012-05-17 2016-01-12 日本電気株式会社 識別システム、識別方法及びプログラム
WO2014184823A1 (en) * 2013-05-15 2014-11-20 Nec Corporation System, method, and program for identifying persistent components and persistent systems
JP6066081B2 (ja) * 2013-09-03 2017-01-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation フォールトツリーを生成する装置及び方法
US11665145B1 (en) * 2014-05-02 2023-05-30 Navroop Mitter Method of providing end to end encryption with auditability
EP3151122A1 (en) * 2015-10-02 2017-04-05 Siemens Aktiengesellschaft Method and apparatus for generating a fault tree
CN107491532B (zh) * 2017-08-21 2020-06-19 北京航天发射技术研究所 一种基于经验向量和特征向量的故障树优化检索方法
CN111108481B (zh) * 2017-09-29 2021-08-13 华为技术有限公司 故障分析方法及相关设备
CN111556992A (zh) * 2018-01-15 2020-08-18 三菱电机株式会社 故障检测装置、监视控制系统及故障检测方法
CN108509290A (zh) * 2018-02-11 2018-09-07 中国电子产品可靠性与环境试验研究所((工业和信息化部电子第五研究所)(中国赛宝实验室)) 数据驱动的故障树分析方法、装置及系统
US11595245B1 (en) 2022-03-27 2023-02-28 Bank Of America Corporation Computer network troubleshooting and diagnostics using metadata
US11658889B1 (en) 2022-03-27 2023-05-23 Bank Of America Corporation Computer network architecture mapping using metadata

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04302364A (ja) * 1991-03-29 1992-10-26 Nippon Telegr & Teleph Corp <Ntt> 故障解析方式
JPH04302027A (ja) * 1991-03-29 1992-10-26 Ricoh Co Ltd 事例データベース構築装置
JPH05165853A (ja) * 1991-07-08 1993-07-02 Hitachi Ltd 品質情報診断解析方法
JP2000235507A (ja) * 1999-02-16 2000-08-29 Toshiba Corp システムの信頼性設計装置及び方法並びにシステムの信頼性設計用ソフトウェアを記録した記録媒体
JP2003216923A (ja) * 2002-11-29 2003-07-31 Fuji Heavy Ind Ltd 故障診断装置
JP2006127464A (ja) * 2004-09-30 2006-05-18 Toshiba Solutions Corp 情報システムの信頼性評価システム、信頼性評価方法、信頼性評価プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1252556B1 (de) * 2000-01-29 2003-06-04 ABB Research Ltd. Verfahren zum automatisierten generieren einer fehlerbaumstruktur
EP1842191A4 (en) * 2005-01-19 2012-05-09 Favoweb Ltd SYSTEM AND METHOD FOR ANALYSIS OF REPEATED FAILURES
US7681086B2 (en) * 2007-09-20 2010-03-16 Embraer- Empresa Brasileira De Aeronautica S.A. Fault tree map generation
US7856575B2 (en) * 2007-10-26 2010-12-21 International Business Machines Corporation Collaborative troubleshooting computer systems using fault tree analysis
US8121042B2 (en) * 2008-06-30 2012-02-21 The Boeing Company Reliability estimation methods for large networked systems

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04302364A (ja) * 1991-03-29 1992-10-26 Nippon Telegr & Teleph Corp <Ntt> 故障解析方式
JPH04302027A (ja) * 1991-03-29 1992-10-26 Ricoh Co Ltd 事例データベース構築装置
JPH05165853A (ja) * 1991-07-08 1993-07-02 Hitachi Ltd 品質情報診断解析方法
JP2000235507A (ja) * 1999-02-16 2000-08-29 Toshiba Corp システムの信頼性設計装置及び方法並びにシステムの信頼性設計用ソフトウェアを記録した記録媒体
JP2003216923A (ja) * 2002-11-29 2003-07-31 Fuji Heavy Ind Ltd 故障診断装置
JP2006127464A (ja) * 2004-09-30 2006-05-18 Toshiba Solutions Corp 情報システムの信頼性評価システム、信頼性評価方法、信頼性評価プログラム

Also Published As

Publication number Publication date
WO2011132730A1 (ja) 2011-10-27
US8990625B2 (en) 2015-03-24
JPWO2011132730A1 (ja) 2013-07-18
US20130042167A1 (en) 2013-02-14

Similar Documents

Publication Publication Date Title
JP5880866B2 (ja) ランタイムシステムの故障の木解析の方法、システム及びプログラム
US9652318B2 (en) System and method for automatically managing fault events of data center
He et al. A survey on automated log analysis for reliability engineering
Das et al. Desh: deep learning for system health prediction of lead times to failure in hpc
JP5444673B2 (ja) ログ管理方法、ログ管理装置、ログ管理装置を備えた情報処理装置、及びプログラム
US9298538B2 (en) Methods and systems for abnormality analysis of streamed log data
Le et al. Rclinker: Automated linking of issue reports and commits leveraging rich contextual information
JP5946423B2 (ja) システム・ログの分類方法、プログラム及びシステム
Aharon et al. One graph is worth a thousand logs: Uncovering hidden structures in massive system event logs
JP5274565B2 (ja) 検出ルール生成装置、検出ルール生成方法及びコンピュータプログラム
Aussel et al. Improving performances of log mining for anomaly prediction through nlp-based log parsing
US20110083123A1 (en) Automatically localizing root error through log analysis
US20170262360A1 (en) Analyzing software test failures using natural language processing and machine learning
US20150089309A1 (en) Troubleshooting based on log similarity
US20160124792A1 (en) Fault analysis apparatus, fault analysis method, and recording medium
JP4862446B2 (ja) 障害原因推定システム、方法、及び、プログラム
Bhanage et al. It infrastructure anomaly detection and failure handling: A systematic literature review focusing on datasets, log preprocessing, machine & deep learning approaches and automated tool
Lal et al. Root cause analysis of software bugs using machine learning techniques
WO2017214613A1 (en) Streaming data decision-making using distributions with noise reduction
US9600572B2 (en) Method, computer program and apparatus for analyzing symbols in a computer system
Makanju et al. Investigating event log analysis with minimum apriori information
Zheng et al. iFeedback: Exploiting user feedback for real-time issue detection in large-scale online service systems
Shao et al. Griffon: Reasoning about job anomalies with unlabeled data in cloud-based platforms
Huang et al. Symptom-based problem determination using log data abstraction
Gu et al. Online failure forecast for fault-tolerant data stream processing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150325

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150826

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160119

R150 Certificate of patent or registration of utility model

Ref document number: 5880866

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150