JP2018124829A - 状態判定装置、状態判定方法及びプログラム - Google Patents

状態判定装置、状態判定方法及びプログラム Download PDF

Info

Publication number
JP2018124829A
JP2018124829A JP2017016995A JP2017016995A JP2018124829A JP 2018124829 A JP2018124829 A JP 2018124829A JP 2017016995 A JP2017016995 A JP 2017016995A JP 2017016995 A JP2017016995 A JP 2017016995A JP 2018124829 A JP2018124829 A JP 2018124829A
Authority
JP
Japan
Prior art keywords
state
layer
observation information
component
causal graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017016995A
Other languages
English (en)
Other versions
JP6649294B2 (ja
Inventor
松尾 洋一
Yoichi Matsuo
洋一 松尾
中野 雄介
Yusuke Nakano
雄介 中野
暁 渡邉
Akira Watanabe
暁 渡邉
敬志郎 渡辺
Keishiro Watanabe
敬志郎 渡辺
石橋 圭介
Keisuke Ishibashi
圭介 石橋
川原 亮一
Ryoichi Kawahara
亮一 川原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017016995A priority Critical patent/JP6649294B2/ja
Publication of JP2018124829A publication Critical patent/JP2018124829A/ja
Application granted granted Critical
Publication of JP6649294B2 publication Critical patent/JP6649294B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】システムの異常の原因箇所・要因の推定精度を向上させること。【解決手段】状態判定装置は、システムの各構成要素の状態に対応する第1の層と前記システムにおける第1の層の各構成要素から出る観測情報の状態に対応する第2の層との関係を示す第1の因果グラフに対して、前記第1の層の各構成要素から出る観測情報に対する変換によって得られる第2の観測情報の状態に対応する第3の層を前記第1の層と前記第2の層との間に追加した第2の因果グラフと、前記第1の層と前記第3の層との間のエッジの重みを操作する関数fの集合Fと、前記変換を行う関数gの集合Gとに基づいて、前記システムから収集される観測情報の状態への尤度が最大である前記各構成要素の状態を判定する判定部と、前記判定部によって判定された前記各構成要素の状態を出力する出力部と、を有する。【選択図】図4

Description

本発明は、状態判定装置、状態判定方法及びプログラムに関する。
コンピュータシステムの運用におい異常が発生した際に、オペレータは、CPU使用率やエラーログ、トラヒックログなどシステムの機器から得られる様々な観測情報の観測値と、これまでの知識と経験をもとに原因箇所・要因の特定を行い、原因箇所に対処を行っていた。オペレータの判断を支援する手法の1つとして因果グラフを用いた分析手法がある。
因果グラフを用いた異常発生原因箇所・要因推定手法とは、システムの構成要素の一部に異常が発生した場合に与える影響関係を記述した因果グラフを用いて迅速に原因箇所・要因を特定する手法である(例えば、非特許文献1〜3)。これらの手法は主に事前構築、学習フェーズと推論フェーズの二つのパートに分けられる。
学習フェーズにおいては、システムの構成要素1つ1つ(例:ルータ、サーバ)を機器状態・要因層のノードとし、各ノードで異常が発生した場合、影響を与える観測層のノード(例:アラート、パケットエラー、CPU使用率なのどのシステムの構成要素から取得できる観測情報)に向かってある重み付きのエッジを張る。システムの専門家の知識や過去の事例をもとに全てのノードに対し行うことで、システム全体の影響関係を記述した因果グラフが完成する。
図1は、因果グラフを説明するための図である。図1において、X(x,x,…x)は、システムの構成要素となるn個の機器のそれぞれの状態を表し、各xは、0(正常状態)又は1(異常状態)の値をとる。Y(y,y,…y)は、m個の観測情報の状態を表し、例えば、Yがパケットエラーの発生の有無を表す観測層であれば、各yは0(パケットエラーなし)又は1(パケットエラー発生)を表す。エッジの重みは、条件付き確率Pで定義され、例えば、P(y=1|x=1)は、xが1をとったときyも1になる確率を表す。
推論フェーズでは、システム内で異常が発生したとき、構築された因果グラフの中で異常が観測されているノードに向かってきているエッジを逆にたどることにより、真因となっている原因箇所・要因を特定する。
Srikanth Kandula, Dina Katabi, and Jean-philippe Vasseur. Shrink: A tool for failure diagnosis in IP networks. Proceedings of the 2005 ACM SIGCOMM workshop on Mining network data, pages 173-178, 2005. R.R. Kompella, J. Yates, A. Greenberg, and A.C. Snoeren. IP Fault Localization via Risk Modeling. IEEE Transactions on Dependable and Secure Computing, 7(4):1-14, 2010. He Yan, Lee Breslau, Zihui Ge, Dan Massey, Dan Pei, and Jennifer Yates. G-RCA: A Generic Root Cause Analysis Platform for Service Quality Management in Large IP Networks. IEEE/ACM Transactions on Networking, 20(6):1734-1747, 2012.
従来技術では、学習フェーズで、専門家の知識や過去の故障事例、システムの観測データから相関関係などをもとに因果グラフを構築するための手法が提案されているが、過去に起こっていない異常が発生したときの影響関係は記述できない。
また、システムのマシンを新しくすることにより、ノードの影響範囲が変わるということもあり、学習フェーズのみにおいてシステムの因果関係を正確に記述するようなグラフを構築することは難しい。
また、異常が発生しても機器がアラートを発しなかったり、観測値の分析ミスにより誤って観測層のノードを異常状態と判定したりと必ずしも本来の観測情報の状態を簡単に判断できない。
このように、正確な因果グラフを構築できていない場合、また観測層の状態を正確に判定できていない場合には原因箇所・要因の推定精度が低下する可能性が有る。
本発明は、上記の点に鑑みてなされたものであって、システムの異常の原因箇所・要因の推定精度を向上させること目的とする。
そこで上記課題を解決するため、状態判定装置は、システムの各構成要素の状態に対応する第1の層と前記システムにおける第1の層の各構成要素から出る観測情報の状態に対応する第2の層との関係を示す第1の因果グラフに対して、前記第1の層の各構成要素から出る観測情報に対する変換によって得られる第2の観測情報の状態に対応する第3の層を前記第1の層と前記第2の層との間に追加した第2の因果グラフと、前記第1の層と前記第3の層との間のエッジの重みを操作する関数fの集合Fと、前記変換を行う関数gの集合Gとに基づいて、前記システムから収集される観測情報の状態への尤度が最大である前記各構成要素の状態を判定する判定部と、前記判定部によって判定された前記各構成要素の状態を出力する出力部と、を有する。
システムの異常の原因箇所・要因の推定精度を向上させることができる。
因果グラフを説明するための図である。 本発明の実施の形態におけるシステム構成例を示す図である。 本発明の実施の形態における推定装置10のハードウェア構成例を示す図である。 本発明の実施の形態における推定装置10の機能構成例を示す図である。 本発明の実施の形態における因果グラフの構成例を示す図である。 推定装置10が実行する処理手順の一例を説明するためのフローチャートである。 ノードとエッジの関係を表現したテキストファイルの一例を示す図である。 Xの状態列の出力例を示す図である。 機器・要因状態層Xの状態の推定処理の処理手順の一例を説明するためのフローチャートである。
以下、図面に基づいて本発明の実施の形態を説明する。本実施の形態では、学習フェーズにおいて、従来の因果グラフに対して拡張した因果グラフを構築する。また、推論フェーズにおいて、因果グラフのエッジと観測情報の状態の修正を行う。そうすることで、因果グラフや観測情報の正確性が低い場合においても高精度な原因箇所・要因の推定を可能とする。
図2は、本発明の実施の形態におけるシステム構成例を示す図である。図2において、推定装置10は、複数の機器20とネットワークを介して接続される。
各機器20は、推定装置10によって観測対象とされる運用システムの構成要素である。運用システムは、ネットワークシステム又はコンピュータシステム等、様々なシステムであってよい。
推定装置10は、運用システムにおいて異常が発生した場合に、運用システムから観測情報を収集し、当該観測情報に基づいて、異常の原因箇所・要因の推定を行う1以上のコンピュータである。なお、本実施の形態において、観測情報とは、運用システムにおける観測項目又は観測対象の観測結果を示す情報をいう。観測結果は、観測値そのものであってもよいし、或る現象の有無あってもよい。或る現象とは、例えば、特定のメッセージ(例えば、パケットエラーを示すメッセージ)を含むログの出力である。
図3は、本発明の実施の形態における推定装置10のハードウェア構成例を示す図である。図3の推定装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、インタフェース装置105、表示装置106、及び入力装置107等を有する。
推定装置10での処理を実現するプログラムは、CD−ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って推定装置10に係る機能を実現する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。表示装置106はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置107はキーボード及びマウス等で構成され、様々な操作指示を入力させるために用いられる。
図4は、本発明の実施の形態における推定装置10の機能構成例を示す図である。図4において、推定装置10は、UI部11、因果グラフ構築部12、修正候補構築部13、異常度計算部14及び推論部15等を有する。これら各部は、推定装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。推定装置10は、また、因果グラフDB16及び修正候補DB17等のデータベースを利用する。これら各データベースは、例えば、補助記憶装置102、又は推定装置10にネットワークを介して接続可能な記憶装置等を用いて実現可能である。
UI部11は、運用システムの中の異常発生箇所・要因の推定を支援する情報として、各機器20の状態(正常又は異常)を示す情報を出力する。UI部11は、また、運用システムに新たに機器20が追加された際などは、因果グラフへのノードの追加やそれに伴う因果関係の変更指示を利用者から受け付け、因果グラフを修正する。
因果グラフ構築部12は、従来の因果グラフを拡張し、新しい層と、関数を導入可能なモデル(因果グラフ)を構築(生成)する。
図5は、本発明の実施の形態における因果グラフの構成例を示す図である。本実施の形態では、観測情報の状態層Y=y(j=1,…,m)と機器・要因状態層X=x(i=1,…,n)とを結んだ有向マルコフモデル(従来の因果グラフ)における、観測情報の状態層Yが、ノイズを含んだ観測情報(実際に観測される観測情報)の状態層Yとされ、真の観測情報の状態層Z=z(j=1,…,m)がYとXとの間に追加される。
真の観測情報の状態層Zは、本来であれば観測されうる観測情報の状態を表す。すなわち、真の観測情報とは、実際に観測される観測情報からノイズを除去する変換を行うことで得られる観測情報をいう。ノイズとは、例えば、観測ミスである。観測ミスは、観測情報が出力されているにも関わらず、何らかの原因により当該観測情報を捕捉できないことや、機器20側の設定ミスにより、本来であれば出力されるべき観測情報が出力されないこと等である。例えば、真の観測情報の状態層Zは、「故障Aは、観測層のノードB、C、Dに影響が出る」という故障について、実際にノードB、C、Dに影響が出ている状態である。
また、当該因果グラフは、xからzへのエッジeijの重みの値を変更する関数の集合F=I+U',u'ij∈[0,±1]と、真の観測情報の状態zにノイズを加えyに出力する関数の集合G=I+U'',u''ij∈[0,±1]との導入が予定される。なお、Iは、単位行列のような恒等写像を示す。
因果グラフ構築部12によって構築された因果グラフは、因果グラフDB16に記憶される。
修正候補構築部13は、関数の集合F及びGを構築する。関数の集合F及びGの構築とは、F又はGに属する各関数の実体(式)を生成することをいう。具体的には、修正候補構築部13は、因果グラフDB16に記憶された因果グラフに対し、fを、因果グラフの中で変換が可能な任意のエッジの重みに作用する関数とし、変換可能な全てのパターンを網羅した関数の集合をFとする。fは、XとZとからなる完全二部グラフのk番目の部分グラフに作用する関数である。kは完全二部グラフの部分グラフの個数だけ存在する。なお、変換とは、任意のXとZのノードxとzとの間のエッジの重みを変更する操作をいう。例えば、本実施の形態では、エッジの重みを0又は1にする場合について説明する。エッジの重みを0にすることは、当該エッジを削除することと等価であり、エッジの重みを1にすることは、当該エッジを追加することと等価である。但し、エッジの重みは、多値又は連続値であってもよい。
修正候補構築部13は、また、真の観測情報の状態層Zの全ての部分集合のそれぞれについて、要素の状態値を変換する関数をgとし(s=1,…,m)、Gをgの集合とする。なお、mは、真の観測情報の状態層Zの全ての部分集合の個数である。
修正候補構築部13によって構築された関数の集合F及びGは、修正候補DB17に記憶される。
異常度計算部14は、運用システム内の機器20に対するコマンド操作により観測情報を機器20から収集し、当該観測情報について異常度を計算する。異常度の計算手法は、閾値を超えたか否かに基づいて、0又は1で判定されてもよいし、local outlier factorなどの外れ値計算手法、自己回帰モデルなどの一般的な時系列分析等を用いて計算されてもよい。異常度計算部14は、更に、異常度に基づいて、ノイズを含んだ観測情報の観測層Yのノードyの状態を判定する。yが、正常(0)又は異常(1)の値をとるのであれば、異常度計算部14は、計算した異常度に基づいて、yが0又は1のいずれの状態に該当するのかを判定する。yが、正常(0)、異常(1)、又は部分的に異常(0.5)の3値をとるのであれば、異常度計算部14は、計算した異常度に基づいて、yが当該3値のうちのどの状態になるのかを判定する。判定には、閾値との比較やt−検定等が用いられてもよい。yの状態が0から1までの連続値を取りうるのであれば、計算された異常値が0から1に正規化され、正規化後の値がyの値とされてもよい。
推論部15は、因果グラフDB16に記憶された因果グラフ、修正候補DB17に記憶された関数の集合F及びGに対し、異常度計算部14によって、観測情報に基づいて計算された、ノイズを含んだ観測情報の状態層yの状態を当てはめて、状態層yの状態を最も良く表す(状態層yの状態に対して尤度が最高である)xの状態を推定する。
以下、推定装置10が実行する処理手順について説明する。図6は、推定装置10が実行する処理手順の一例を説明するためのフローチャートである。
ステップS101において、因果グラフ構築部12は、既存技術(例えば、非特許文献1〜3)で構築可能な因果グラフのエッジの重みをx、yの辺ごとに動的に変化させることができるような因果グラフを構築(生成)する。当該因果グラフの機器・要因状態層X及びノイズを含んだ観測情報の状態層Yの各ノードやエッジの重みの初期値は、運用システムの構成情報や過去の異常発生事例等に基づいて計算される。当該因果グラフでは、新たに真の観測情報の状態層Zが導入され、真の観測情報の状態層Zにノイズを与えてYに写像する関数の集合Gの適用が可能とされる。yは、zにノイズを付与した観測情報となる。換言すれば、zは、yからノイズを除去した観測情報である。
また、当該因果グラフでは、x、zに対してエッジの重みに作用する関数の集合Fの適用が可能とされる。Fによって、当該因果グラフは事前に想定した範囲外への影響が発生することも考慮できるモデルとなる。例えば、関数の集合Fによりエッジの重みを後から変更できるようにすることで、当該因果グラフは、運用システムの構成情報が間違っていた場合や、過去に起きたことがない故障に対しても対応可能となる。
因果グラフ構築部12は、以上のように様々な状態を表現できる因果グラフを構築すると、当該因果グラフの各層のノードとエッジとの関係が記載されたテキストファイルを因果グラフDB16に記憶する。
図7は、ノードとエッジの関係を表現したテキストファイルの一例を示す図である。図7の左側には、因果グラフの一例が示されている。図7の右側には、当該因果グラフに対応するテキストファイルが示されている。当該テキストファイルには、エッジ名とそのエッジがつなぐノードの関係と、エッジに対する重みとが記述される。
エッジ名とそのエッジがつなぐノードの関係は、例えば、eASL1:ASpine1、Link1のように記述される。当該記述は、エッジ名eASL1のエッジが、XのノードASpine1とYのノードLink1とを接続することを示す。
エッジに対する重みは、例えば、eASL1:1、0のように記述される。当該記述は、条件付き確率P(y=1|x=1)=1、P(y=0|x=1)=0というように、条件付き確率の値を示す。すなわち、「eASL1:1、0」におけるコロン(:)の後の最初の数値は、条件付き確率P(y=1|x=1)を示し、2番目の数値は、条件付き確率P(y=0|x=1)を示す。なお、図7では、便宜上、ノイズを含んだ観測情報の状態層Yのノードは省略されている。
続いて、修正候補構築部13は、関数の集合Fを以下の方法で構築(生成)する(S102)。まず、修正候補構築部13は、因果グラフのデータ(図7のテキストファイル)を因果グラフDB16から取得する。続いて、修正候補構築部13は、エッジの重みが1又は0の場合において、fを、1と0を入れ替える変換とし、fを、因果グラフのXからZの任意のエッジの部分集合に対し作用する関数とする。ここで、任意のエッジの部分集合は、重みが0のエッジも含む。重みが0のエッジとは、例えば、図7の例では表現されていないエッジをいい、全ての条件付き確率が0となるエッジをいう。例えば、図7では、ASpine1とLink2との間のエッジ、及びBLeaf1とLink1との間のエッジが、重みが0のエッジに該当する。したがって、任意のエッジの部分集合はXとZからなる完全二部グラフの部分集合の個数だけ存在し、fも同じだけ存在する。fは、k番目の部分集合に対して、重みが1のエッジは0に、重みが0のエッジは1とする関数である。修正候補構築部13は、fをまとめた集合をFとする。修正候補構築部13は、構築した関数の集合Fを修正候補DB17へ記憶する。なお、重みが多値の場合、又は連続値の場合には、それぞれに応じた関数が定義されればよい。
続いて、修正候補構築部13は、関数の集合Gを構築(生成)する(S103)。具体的には、修正候補構築部13は、真の観測情報の状態層Z上の観測情報の状態zが、0が正常、1が異常というような{0,1}の2値を取る場合に、gを0、1を反転させる関数とし、gを真の観測情報の状態層Zの要素がs個の任意の部分集合に対して、要素の状態値(0又は1)を反転させる関数とする(s=1,…,m)。修正候補構築部13は、gをまとめた集合をGとする。修正候補構築部13は、構築した関数の集合Gを修正候補DB17へ記憶する。なお、観測情報の状態が多値又は連続値をとる場合、それぞれに応じた関数が定義されればよい。
なお、ステップS101〜S103は、運用システムにおける異常の発生とは無関係に予め実行されてよい。
運用システム内で異常が発生した際に、UI部11が利用者から分析実行指示を受け付けると、ステップS104以降が実行される。
ステップS104において、異常度計算部14は、システム内の各機器20に対するコマンド操作により、各機器20から観測情報を収集する。
続いて、異常度計算部14は、収集された各観測情報をについて異常度を計算し、当該異常度に基づいて各観測情報の状態y(すなわち、ノイズを含んだ観測情報の状態層Y)判定する(S105)。
続いて、推論部15は、因果グラフDB16に記憶されている因果グラフの情報と、修正候補DB17に記憶されている関数の集合F及びGと、異常度計算部14による、ノイズを含んだ観測情報の状態層Yの判定結果とに基づき、機器・要因状態層Xの状態の推定を行う(S106)。すなわち、ノイズを含んだ観測情報の状態層Yに対して尤度が最高である機器・要因状態層Xの状態が推定される。
続いて、UI部11は、推論部15によって推定されたXの状態列を異常発生箇所・要因を示す情報として出力する(S107)。例えば、図8に示されるようなテキストファイルが出力されてもよい。
図8は、Xの状態列の出力例を示す図である。図8には、図7に示した機器・要因状態層Xの各ノードの状態が0(正常状態)又は1(異常状態)によって示されている。図8の例では、ノードBspine1が1(異常状態)となっており、このノードが異常発生箇所、要因と推定される。
続いて、ステップS106の詳細について説明する。図9は、機器・要因状態層Xの状態の推定処理の処理手順の一例を説明するためのフローチャートである。
ステップS201において、推論部15は、FとGとを恒等写像Iとした状態で、最大事後確率p=maxF(P(X│G−1(Y)))を、収集されたYに基づいて計算する。この計算は、既存の因果グラフと同様に、既存手法にて、操作を加える前の最大事後確率p=maxP(X│Y)を計算することと等価である。したがって、計算方法としては、例えば、非特許文献1に記載された方法が用いられてもよい。
続いて、推論部15は、FとGとを用いて因果グラフを変更して、最大事後確率p'=maxF(P(X│G−1(Y)))を計算する(S202)。具体的には、推論部15は、f∈Fと、g∈Gとの組み合わせごとに、最大事後確率p'ks=f(P(X│g −1(Y)))を計算すると共に、Yに対して最も尤度の高いXの状態列を求める。したがって、Fの要素数及びGの要素数の少なくともいずれか一方が複数であれば、複数のp'ksが算出され、p'ksごとにXの状態列が求められる。
続いて、推論部15は、ステップS202の中から、p'ks/pが閾値τ(τ>1)を超えるp'ks(すなわち、少なくともpより大きいp'ks)を抽出し、抽出されたp'ksに対応するXの状態列を解の候補として出力する(S203)。すなわち、pに対する大きさの程度が閾値τを超えるp'ksに対応するXの状態列が解の候補として出力される。出力される解の候補は、閾値τ>1を満たしており、既存の因果グラフによる手法よりも、最大事後確率が大きいXの状態列である。すなわち、既存手法よりも精度よく異常発生の原因箇所・要因を示した解が抽出される。
なお、p'ks/pが閾値τ(τ>1)を超えるが否かの判定の際、推論部15は、fによる因果グラフの変更の度合い(例えば、重みを変更したエッジの本数(追加したエッジの本数又は削除したエッジの本数等))に応じて、閾値τの値を変化させてペナルティを与えることで、fによる変更の自由度を制限する。
ペナルティを与えるというのは、例えば、閾値τを変更の度合に応じて変化させることをいい、fによる因果グラフの変更の度合いが相対的に小さい場合には、閾値τを小さくし、fによる因果グラフの変更の度合いが相対的に大きい場合には、閾値τを大きくすることをいう。そうすることで、変更の度合いが小幅な場合には最大事後確率pに対する最大事後確率p'の上昇がわずかな場合でも解の候補とすることができ、変更の度合いが大幅な場合には最大事後確率pに対する最大事後確率p'の上昇が大きい場合のみ解の候補となるようにすることができる。
閾値τの変化のさせ方は特定の方法に限定されないが、例えば、fやgが作用する部分集合の要素数をsとしたとき、τのs乗とする方法がある。
なお、図8は、解の候補が1つの場合に対応するが、解の候補は複数の場合が有る。この場合、例えば、最大事後確率p'ksに基づいて出力対象が絞り込まれてもよい。例えば、最大事後確率p'ksが上位N個(N≧1)である解の候補が出力対象とされてもよい。また、最大事後確率p'ksに基づいて、解の候補がソートされて出力されてもよい。また、解の候補ごとに、対応する最大事後確率p'ksが出力されてもよい。
上述したように、本実施の形態によれば、Fの変換によりエッジの加減を考慮しながら最大事後確率を計算することで、事前に構築した因果グラフが不正確な場合でもそれを修正しつつ、機器・要因状態層Xの状態を正しく推定することができる。同様に、Gの変換によりノイズの付加を考慮しながら最大事後確率を計算することで、観測情報の状態判定が不正確だった場合でも修正しながら状態層Xの状態を正しく推定することができる。その結果、システムの異常の原因箇所・要因の推定精度を向上させることができる。したがって、利用者は、高精度に原因箇所・要因を特定し、対処を行うために本実施の形態を利用することができる。
なお、本実施の形態において、推定装置10は、状態判定装置の一例である。既存手法の因果グラフは、第1の因果グラフの一例である。図5に示されるような因果グラフは、第2の因果グラフの一例である。推論部15は、判定部の一例である。UI部11は、出力部の一例である。異常度計算部14は、計算部の一例である。機器・要因状態層Xは、第1の層の一例である。ノイズを含んだ観測情報の状態層Yは、第2の層の一例である。真の観測情報の状態層Zは、第3の層の一例である。ノイズを含んだ観測情報は、第1の観測情報の一例である。真の観測情報は、第2の観測情報の一例である。最大事後確率pは、第1の最大事後確率の一例である。最大事後確率p'は、第2の最大事後確率の一例である。
以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
10 推定装置
11 UI部
12 因果グラフ構築部
13 修正候補構築部
14 異常度計算部
15 推論部
16 因果グラフDB
17 修正候補DB
20 機器
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
106 表示装置
107 入力装置
B バス

Claims (6)

  1. システムの各構成要素の状態に対応する第1の層と前記システムにおける第1の層の各構成要素から出る観測情報の状態に対応する第2の層との関係を示す第1の因果グラフに対して、前記第1の層の各構成要素から出る観測情報に対する変換によって得られる第2の観測情報の状態に対応する第3の層を前記第1の層と前記第2の層との間に追加した第2の因果グラフと、前記第1の層と前記第3の層との間のエッジの重みを操作する関数fの集合Fと、前記変換を行う関数gの集合Gとに基づいて、前記システムから収集される観測情報の状態への尤度が最大である前記各構成要素の状態を判定する判定部と、
    前記判定部によって判定された前記各構成要素の状態を出力する出力部と、
    を有することを特徴とする状態判定装置。
  2. 前記判定部は、前記第1の因果グラフに基づいて、前記システムから収集される観測情報の状態に関して第1の最大事後確率を計算し、前記関数fと前記関数gとの組み合わせごとに、前記第2の因果グラフに基づいて、当該組み合わせにおける第2の最大事後確率を計算すると共に当該組み合わせにおける前記各構成要素の状態を判定し、
    前記出力部は、前記第2の最大事後確率の中で、前記第1の最大事後確率よりも大きな第2の最大事後確率に関して判定された前記各構成要素の状態を出力する、
    ことを特徴とする請求項1記載の状態判定装置。
  3. 前記出力部は、前記第2の最大事後確率の中で、前記第1の最大事後確率に対する大きさの程度が閾値を超える第2の最大事後確率に関して判定された前記各構成要素の状態を出力し、
    前記重みの操作の度合いが大きい前記関数fに係る前記組み合わせほど、前記閾値が大きくされる、
    ことを特徴とする請求項2記載の状態判定装置。
  4. 前記システムから収集される観測情報について異常度を計算し、当該異常度に基づいて、当該観測情報の状態を判定する計算部、
    を有することを特徴とする請求項1乃至3いずれか一項記載の状態判定装置。
  5. システムの各構成要素の状態に対応する第1の層と前記システムにおける第1の層の各構成要素から出る観測情報の状態に対応する第2の層との関係を示す第1の因果グラフに対して、前記第1の層の各構成要素から出る観測情報に対する変換によって得られる第2の観測情報の状態に対応する第3の層を前記第1の層と前記第2の層との間に追加した第2の因果グラフと、前記第1の層と前記第3の層との間のエッジの重みを操作する関数fの集合Fと、前記変換を行う関数gの集合Gとに基づいて、前記システムから収集される観測情報の状態への尤度が最大である前記各構成要素の状態を判定する判定手順と、
    前記判定手順において判定された前記各構成要素の状態を出力する出力手順と、
    をコンピュータが実行することを特徴とする状態判定方法。
  6. 請求項1乃至4いずれか一項記載の各部としてコンピュータを機能させることを特徴とするプログラム。
JP2017016995A 2017-02-01 2017-02-01 状態判定装置、状態判定方法及びプログラム Active JP6649294B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017016995A JP6649294B2 (ja) 2017-02-01 2017-02-01 状態判定装置、状態判定方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017016995A JP6649294B2 (ja) 2017-02-01 2017-02-01 状態判定装置、状態判定方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2018124829A true JP2018124829A (ja) 2018-08-09
JP6649294B2 JP6649294B2 (ja) 2020-02-19

Family

ID=63109008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017016995A Active JP6649294B2 (ja) 2017-02-01 2017-02-01 状態判定装置、状態判定方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6649294B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020153150A1 (ja) * 2019-01-23 2020-07-30 日本電信電話株式会社 グラフ要約装置、グラフ要約方法及びプログラム
WO2022249224A1 (ja) * 2021-05-24 2022-12-01 日本電信電話株式会社 情報処理装置、情報処理方法、およびプログラム
WO2022249369A1 (ja) * 2021-05-26 2022-12-01 日本電信電話株式会社 プロセス情報解析装置、プロセス情報解析方法およびプログラム
WO2023170760A1 (ja) * 2022-03-07 2023-09-14 日本電信電話株式会社 異常箇所推定装置、異常箇所推定方法、及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122751A (ja) * 2008-11-17 2010-06-03 Nec Corp 状況推定システム、状況推定方法、状況推定プログラム
US20150081614A1 (en) * 2013-09-18 2015-03-19 Rohde & Schwarz Gmbh & Co. Kg Automated evaluation of test logs

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010122751A (ja) * 2008-11-17 2010-06-03 Nec Corp 状況推定システム、状況推定方法、状況推定プログラム
US20150081614A1 (en) * 2013-09-18 2015-03-19 Rohde & Schwarz Gmbh & Co. Kg Automated evaluation of test logs

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大鑄史男: "隠れた階層構造を見いだす-試論-", オペレーションズ・リサーチ, vol. 58, no. 9, JPN6020000232, 1 September 2013 (2013-09-01), JP, pages 21 - 27, ISSN: 0004189880 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020153150A1 (ja) * 2019-01-23 2020-07-30 日本電信電話株式会社 グラフ要約装置、グラフ要約方法及びプログラム
JP2020119261A (ja) * 2019-01-23 2020-08-06 日本電信電話株式会社 グラフ要約装置、グラフ要約方法及びプログラム
JP7120043B2 (ja) 2019-01-23 2022-08-17 日本電信電話株式会社 グラフ要約装置、グラフ要約方法及びプログラム
WO2022249224A1 (ja) * 2021-05-24 2022-12-01 日本電信電話株式会社 情報処理装置、情報処理方法、およびプログラム
WO2022249369A1 (ja) * 2021-05-26 2022-12-01 日本電信電話株式会社 プロセス情報解析装置、プロセス情報解析方法およびプログラム
WO2023170760A1 (ja) * 2022-03-07 2023-09-14 日本電信電話株式会社 異常箇所推定装置、異常箇所推定方法、及びプログラム

Also Published As

Publication number Publication date
JP6649294B2 (ja) 2020-02-19

Similar Documents

Publication Publication Date Title
JP6307453B2 (ja) リスク評価システムおよびリスク評価方法
JP6649294B2 (ja) 状態判定装置、状態判定方法及びプログラム
US9400731B1 (en) Forecasting server behavior
CN109726066B (zh) 用于标识存储系统中的问题部件的方法和设备
US20180174072A1 (en) Method and system for predicting future states of a datacenter
JP7081741B2 (ja) ネットワークデバイスの状態を判定するための方法及び装置
JP2023534696A (ja) ネットワークトポロジーにおけるアノマリー検知
JP2019174870A (ja) 情報処理装置、情報処理方法、及びプログラム
JP6954379B2 (ja) 異常箇所特定装置、異常箇所特定方法及びプログラム
CN117909864A (zh) 一种电力故障预测系统及方法
CN111144572B (zh) 一种基于树形贝叶斯网络的配电网灾情推断方法及系统
JP6835702B2 (ja) 異常推定装置、異常推定方法及びプログラム
JP2010231762A (ja) 不整合オントロジーの修復方法とその装置
US8798982B2 (en) Information processing device, information processing method, and program
JP7414135B2 (ja) モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム
JP7327493B2 (ja) 異常対処支援装置、方法およびプログラム
JP2019101711A (ja) 異常種別判定装置、異常種別判定方法及びプログラム
JP5836316B2 (ja) 障害監視システム、障害監視方法、及び障害監視プログラム
US11973658B2 (en) Model construction apparatus, estimation apparatus, model construction method, estimation method and program
WO2020008632A1 (ja) 仮説推論装置、仮説推論方法、及びコンピュータ読み取り可能な記録媒体
JP6407205B2 (ja) ラベル列生成装置、ラベル列生成方法、及びプログラム
JP2016218636A (ja) システムモデル生成支援装置、システムモデル生成支援方法、及び、プログラム
Paixao et al. A recoverable robust approach for the next release problem
WO2024034024A1 (ja) 因果モデル構築装置、異常箇所推定装置、因果モデル構築方法、異常箇所推定方法、及びプログラム
WO2019240229A1 (ja) システム状態推定装置、システム状態推定方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190304

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191226

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200116

R150 Certificate of patent or registration of utility model

Ref document number: 6649294

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150