WO2021245854A1

WO2021245854A1 - モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム

Info

Publication number: WO2021245854A1
Application number: PCT/JP2020/022009
Authority: WO
Inventors: 洋一松尾; 敬志郎渡辺
Original assignee: 日本電信電話株式会社
Priority date: 2020-06-03
Filing date: 2020-06-03
Publication date: 2021-12-09
Also published as: JP7414136B2; US20230208723A1; US11973658B2; JPWO2021245854A1

Abstract

一実施形態に係るモデル構築装置は、異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第１の観測データを収集する第１の収集部と、前記通信ネットワークシステムで提供される複数のサービスに関する第２の観測データを収集する第２の収集部と、前記第１の観測データと前記第２の観測データとを用いて、前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを構築するモデル構築部と、を有することを特徴とする。

Description

モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラム

　本発明は、モデル構築装置、推定装置、モデル構築方法、推定方法及びプログラムに関する。

　通信事業者にとって、通信ネットワークシステム内で発生する異常の状態を把握し、その対応を迅速に行うことは重要な業務である。こうした中で、通信ネットワークシステム内で発生した異常を早期に検知するための手法や異常箇所・要因を推定するための手法等の研究が従来から行われている。

　異常箇所・要因を推定するための手法として、異常箇所・要因とこの異常によって引き起こされる通信ネットワークシステム内のデータ（以下、「観測データ」ともいう。）の変化との関係性を因果モデルとしてベイジアンネットワークによりモデル化し、異常時の観測データから異常箇所・要因を推定する手法が提案されている（非特許文献１～３）。このような手法の１つとして、ルールベース手法が知られている。

　ルールベース手法では、エキスパート（例えば、通信ネットワークシステムのオペレータ等）の知識を用いて、異常箇所・要因と観測データの変化との関係性をモデル化する。例えば、非特許文献１では、ルータの正常・異常は隣接しているリンクの観測データのみに影響するというルールをエキスパートの知識から作成し、このルールと通信ネットワークシステムのトポロジーにおける隣接関係とを用いて因果モデルを構築している。また、非特許文献２では、テンプレートという抽象的なルールを作成することで、因果モデルの構築を容易するための提案がなされている。また、非特許文献３では、ＶＰＮ（Virtual Private Network）等の仮想的な通信ネットワークを対象として、或るＶＰＮのルートになっている機器群を抽出し、その機器群で発生した異常の要因や異常が発生した機器と観測データとの関係性をモデル化している。

　ところで、通信ネットワークシステムでは、通信機能に加えて、ＶＰＮや各種アプリケーション等の様々なサービスが提供されている。特に、近年では、仮想化技術等により通信ネットワークシステムで提供されるサービスの数が増大している。このため、複数のサービスを統合的に監視し、どのサービスで異常が発生し、どのサービスに影響が出ているのかを把握することは通信ネットワークシステムの運用上極めて重要である。これは、サービスによって異常や影響に対する対処方法が異なるためである。

Srikanth Kandula, Dina Katabi, and Jean-philippe Vasseur. Shrink: A tool for failure diagnosis in IP networks. Proceedings of the 2005 ACM SIGCOMM workshop on Mining network data, pages 173-178, 2005. He Yan, Lee Breslau, Zihui Ge, Dan Massey, Dan Pei, and Jennifer Yates. G-RCA: A Generic Root Cause Analysis Platform for Service Quality Management in Large IP Networks. IEEE/ACM Transactions on Networking, 20(6):1734-1747, 2012. Leila Bennacer, Yacine Amirat,Abdelghani Chibani, Abdelham id Mellouk, and Laurent Ciavaglia, Self-diagnosis technique for virtual private networks combining bayesian networks and case-based reasoning, IEEE Transactions on Automation Science and Engineering, vol: 12(1) pp: 354-366, 2015.

　しかしながら、異常箇所・要因を推定するための従来手法では、通信ネットワークシステムで提供される複数のサービスとの関係性も含めて、統合的にモデル化することができなかった。

　本発明の一実施形態は、上記の点に鑑みてなされたもので、通信ネットワークシステムで提供される複数サービスの異常も含めて異常箇所・要因を推定するための因果モデルを構築することを目的とする。

　上記目的を達成するため、一実施形態に係るモデル構築装置は、異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第１の観測データを収集する第１の収集部と、前記通信ネットワークシステムで提供される複数のサービスに関する第２の観測データを収集する第２の収集部と、前記第１の観測データと前記第２の観測データとを用いて、前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを構築するモデル構築部と、を有することを特徴とする。

　通信ネットワークシステムで提供される複数サービスの異常も含めて異常箇所・要因を推定するための因果モデルを構築することができる。

グラフィカルモデルの一例を示す図である。本実施形態に係る推定装置の機能構成の一例を示す図である。本実施形態に係る因果モデル構築処理の一例を示すフローチャートである。本実施形態に係る異常箇所・要因推定処理の一例を示すフローチャートである。本実施形態に係る推定装置のハードウェア構成の一例を示す図である。

　以下、本発明の一実施形態について説明する。本実施形態では、通信ネットワークシステムにおける観測データから因果モデルを構築し、この因果モデルにより通信ネットワークシステムの異常箇所・要因と当該通信ネットワークシステムで提供される複数のサービスの異常とを推定する推定装置１０について説明する。ここで、本実施形態に係る推定装置１０には、過去の観測データから因果モデルを構築する「モデル構築フェーズ」と、この因果モデルを用いて異常発生時の観測データから異常箇所・要因（異常があるサービスも含む）を推定する「推定フェーズ」とが存在する。なお、モデル構築フェーズにおける推定装置１０は、例えば、「モデル構築装置」等と称されてもよい。また、通信ネットワークシステムは種々の機器（例えば、ルータやサーバ等）をノード、通信経路等をリンクとする通信ネットワーク環境を実現するシステムであり、ＩＣＴ（Information and Communication Technology）システム等と称されてもよい。

　＜理論的構成＞
　まず、モデル構築フェーズにおける因果モデル構築と、推定フェーズにおける異常箇所・要因推定との理論的構成について説明する。

　本実施形態では、グラフィカルモデルの１つであるベイジアンネットワークで表される因果モデルを構築する際にベイジアンネットワークを多層化することで、通信ネットワークシステムを構成する機器や異常要因等と観測データとの関係性に加えて、当該通信ネットワークシステムで提供される複数サービスとの関係性も含めた統合的な関係性を表す因果モデルを構築する。これにより、この因果モデルにより観測データから異常箇所・要因（異常があるサービスも含む）の推定を可能にする。すなわち、通信ネットワークシステムにおける異常箇所又は異常要因と当該通信ネットワークシステムで提供される複数のサービスのうちで異常があるサービス（以下、「異常サービス」ともいう。）とを推定することを可能にする。なお、通信ネットワークで提供されるサービスとしては、ＶＰＮや各種アプリケーション（例えば、ＶｏＩＰ（Voice over Internet Protocol）による音声通話サービス、ファイル転送サービス、動画配信サービス等）等が挙げられる。

　以降では、一例として、通信ネットワークシステムの異常箇所を推定する場合を想定し、その箇所として異常が発生した機器を推定する場合について説明する。ただし、後述する機器ｉを要因ｉとすることで、異常要因を推定する場合についても同様に適用可能である。また、ｉを機器と要因の両方を表すものとすれば、異常箇所と異常要因の両方を同時に推定することも可能である。

　通信ネットワークシステムの機器ｉの状態をｘ_ｉ，ｉ∈｛１，・・・，Ｎ_ｘ｝とし、通信ネットワークに関する観測データｊの状態をｙ_ｊ，ｊ∈｛１，・・・，Ｍ_ｙ｝とする。通信ネットワークに関する観測データｊは通信ネットワークシステム全体の状態等を表す情報であり、例えば、syslogやトラヒック情報等が挙げられる。Ｎ_ｘは通信ネットワークシステムを構成する機器の数、Ｍ_ｙは通信ネットワークに関する観測データの数である。各ｘ_ｉ及びｙ_ｊは０（正常状態）又は１（異常状態）のいずれかの値を取るものとする。ただし、０又は１の２値ではなく、３値以上の多値を取るとすることも可能であるし、連続値を取るとすることも可能である。

　なお、通信ネットワークに関する観測データｊとしては、syslogやトラヒック情報等以外にも、例えば、参考文献「Yasuhiro Ikeda, Keisuke Ishibashi, Yuusuke Nakano, Keishiro Watanabe, Ryoichi Kawahara, "Anomaly Detection and Interpretation using Multimodal Autoencoder and Sparse Optimization", arXiv:1812.07136 [stat.ML]」中に記載されている要因度が用いられてもよい。

　通信ネットワークに関する観測データｊの状態ｙ_ｊは、例えば、通信ネットワークに関する観測データｊ（要因度も含む）が連続値の場合には、正常時の観測データｊの値から閾値を決定し、この閾値以上（又は以下）となる観測データｊの状態ｙ_ｊの値を１、それ以外の観測データｊの状態ｙ_ｊの値を０としてもよいし、正常時の観測データｊの分散を計算し、Ｌ（ただし、Ｌは予め決定された任意の自然数）シグマ以上外れた観測データｊの状態ｙ_ｊの値を１、それ以外の観測データｊの状態ｙ_ｊの値を０としてもよい。

　また、通信ネットワークシステムで提供されるサービスｋの状態をｚ_ｋ，ｋ∈｛１，・・・，Ｎ_ｚ｝とし、サービスに関する観測データｈの状態をｗ_ｈ，ｈ∈｛１，・・・，Ｍ_ｗ｝とする。サービスに関する観測データｈは通信ネットワークシステムで提供されるサービスの状態等を表す情報であり、例えば、サービスに関連するログ情報等が挙げられる。Ｎ_ｚは通信ネットワークシステムで提供されるサービスの数、Ｍ_ｗはサービスに関する観測データの数である。各ｚ_ｋ及びｗ_ｈは０（正常状態）又は１（異常状態）のいずれかの値を取るものとする。ただし、ｘ_ｉ及びｙ_ｊと同様に、０又は１の２値ではなく、３値以上の多値を取るとすることも可能であるし、連続値を取るとすることも可能である。サービスに関する観測データｈの状態ｗ_ｈは、例えば、ログ情報の内容等から特定又は計算（例えば、エラーメッセージやエラーコード等が含まれる場合には状態ｗ_ｈの値を１、そうでない場合には０にする等）すればよい。

　本実施形態では、従来の因果モデルで用いられていたｘ_ｉ及びｙ_ｊに加えて、サービスに関する変数ｚ_ｋ及びｗ_ｈも用いて因果モデルを構築する。すなわち、通信ネットワークに関する機器ｉの状態ｘ_ｉとサービスｋの状態ｚ_ｋとが得られた時の観測データｊの状態ｙ_ｊとサービスに関する観測データｈの状態ｗ_ｈの確率Ｐ（ｙ_ｊ，ｗ_ｈ｜ｘ_ｉ，ｚ_ｋ）を因果モデルとして構築する。この因果モデルは条件付き確率の定義より、確率Ｐ（ｘ_ｉ，ｚ_ｋ，ｙ_ｊ，ｗ_ｈ）と事前確率Ｐ（ｘ_ｉ）と事前確率Ｐ（ｚ_ｋ）から規定される。実際には、ベイズの定理を用いて、観測データｊの状態ｙ_ｊとサービスに関する観測データｈの状態ｗ_ｈとが得られた時の機器ｉの状態ｘ_ｉとサービスｋの状態ｚ_ｋの事後確率Ｐ（ｘ_ｉ，ｚ_ｋ｜ｙ_ｊ，ｗ_ｈ）を計算する。つまり、ベイズの定理により事後確率Ｐ（ｘ_ｉ，ｚ_ｋ｜ｙ_ｊ，ｗ_ｈ）を因果モデルから計算する。

　ここで、通信ネットワークシステムで提供されるサービスは、当該通信ネットワークシステムに含まれる機器を使って通信を行うため、サービスｋに関連するパケットが通る機器に異常があれば当該サービスｋにも影響があり、また、当該サービスｋに関連する観測データｈの状態ｗ_ｈにも影響が出る。また、通信ネットワークシステムを構成する機器に異常がなかった場合にも、サービスｋに異常があれば、当該サービスｋに関連する観測データｈの状態ｗ_ｈに影響が出る。したがって、これらのことから確率Ｐ（ｘ_ｉ，ｚ_ｋ，ｙ_ｊ，ｗ_ｈ）は、以下のように定式化することができる。

　このように、確率Ｐ（ｘ_ｉ，ｚ_ｋ，ｙ_ｊ，ｗ_ｈ）は、条件付き確率Ｐ（ｙ_ｊ｜ｘ_ｉ）、Ｐ（ｚ_ｋ｜ｘ_ｉ）及びＰ（ｗ_ｈ｜ｘ_ｉ，ｚ_ｋ）と、事前確率Ｐ（ｚ_ｋ）及びＰ（ｘ_ｉ）とで規定することができる。ここで、状態ｘ_ｉと状態ｚ_ｋと状態ｙ_ｊと状態ｗ_ｈとをそれぞれノードとして、その因果モデルを表すグラフィカルモデル（ベイジアンネットワーク）の一例を図１に示す。図１に示す例では、状態ｘ_ｉをEquipment nodes、状態ｚ_ｋをService nodes、状態ｙ_ｊ及びｗ_ｈをObservation nodesと表している。この因果モデルにより、上記の数１に示す定式化が得られる。

　確率Ｐ（ｘ_ｉ，ｚ_ｋ，ｙ_ｊ，ｗ_ｈ）の実際の確率値は様々な方法で規定することができるが、例えば、予め決められた定数α_ｘ、α_ｚ、β_ｙ、β_ｗ及びγを用いて、以下のように定義することができる。

　ここで、δは真であれば１、そうでなければ０を返す関数である。φ^ｘｙはｘ_ｉとｙ_ｊの因果関係を表す分布であり、ｘ_ｉとｙ_ｊに関係性があれば（ｉ，ｊ）要素が１、そうでなければ（ｉ，ｊ）要素が０であるＮ_ｘ×Ｍ_ｙの行列である。同様に、φ^ｘｚはｘ_ｉとｚ_ｋの因果関係を表す分布であり、ｘ_ｉとｚ_ｋに関係性があれば（ｉ，ｋ）要素が１、そうでなければ（ｉ，ｋ）要素が０であるＮ_ｘ×Ｎ_ｚの行列である。また、Φは以下で表される。

　ただし、

である。また、φ^ｘｚｗはｘ_ｉとｚ_ｋとｗ_ｈの因果関係を表す分布であり、ｘ_ｉとｚ_ｋとｗ_ｈに関係性があれば（ｉ，ｋ，ｈ）要素が１、そうでなければ（ｉ，ｋ，ｈ）要素が０であるＮ_ｘ×Ｎ_ｚ×Ｍ_ｗのテンソルである。

　以上により、確率Ｐ（ｘ_ｉ，ｚ_ｋ，ｙ_ｊ，ｗ_ｈ）を計算することができるため、因果モデルを構築することができ、通信ネットワークに関する観測データｊの状態ｙ_ｊとサービスに関する観測データｈの状態ｗ_ｈとが得られたときの機器ｉの状態ｘ_ｉとサービスｋの状態ｚ_ｋの事後確率Ｐ（ｘ_ｉ，ｚ_ｋ｜ｙ_ｊ，ｗ_ｈ）を因果モデルから計算することができる。なお、事前確率Ｐ（ｙ_ｊ，ｗ_ｈ）は通信ネットワークに関する観測データｊの状態ｙ_ｊとサービスに関する観測データｈの状態ｗ_ｈから計算することができる。

　このように、通信ネットワークを構成する機器ｉの状態ｘ_ｉと観測データｊの状態ｙ_ｊとの関係性だけなく、通信ネットワークで提供されるサービスｋの状態ｚ_ｋとサービスに関連する観測データｈの状態ｗ_ｈとの関係性、サービスｋの状態ｚ_ｋとこのサービスｋに関連する機器ｉの状態ｘ_ｉとの関係性、サービスｋの状態ｚ_ｋと観測データｊの状態ｙ_ｊとの関係性もベイジアンネットワークでモデル化（つまり、多層のベイジアンネットワークでモデル化）し、このベイジアンネットワークで表される因果モデルを構築する。これにより、通信ネットワークシステムにおける異常機器（又は異常要因）だけなく、異常サービスも推定することが可能となる。

　＜機能構成＞
　次に、本実施形態に係る推定装置１０の機能構成について、図２を参照しながら説明する。図２は、本実施形態に係る推定装置１０の機能構成の一例を示す図である。

　図２に示すように、本実施形態に係る推定装置１０は、ネットワークデータ収集部１０１と、サービスデータ収集部１０２と、因果モデル構築部１０３と、推定部１０４と、ユーザインタフェース部１０５と、ネットワークデータＤＢ２０１と、サービスデータＤＢ２０２と、因果モデルＤＢ２０３とを有する。

　ネットワークデータ収集部１０１は、ネットワーク構成データと通信ネットワークに関する観測データとを通信ネットワークシステムから収集する。ネットワークデータ収集部１０１によって収集されたネットワーク構成データ及び観測データはネットワークデータＤＢ２０１に格納される。ここで、ネットワーク構成データとは、通信ネットワークのトポロジーを表す情報（つまり、通信ネットワークシステムを構成する機器と機器間の接続関係等を表す情報）である。ネットワーク構成データにより機器ｉ，ｉ∈｛１，・・・，Ｎ_ｘ｝が特定される。

　サービスデータ収集部１０２は、サービス関連データとサービスに関する観測データとを通信ネットワークシステムから収集する。サービスデータ収集部１０２によって収集されたサービス関連データ及び観測データはサービスデータＤＢ２０２に格納される。ここで、サービス関連データとは通信ネットワークシステムが提供するサービスを表す情報（例えば、サービスＩＤ等）である。サービス関連データによりサービスｋ，ｋ∈｛１，・・・，Ｎ_ｚ｝が特定される。

　因果モデル構築部１０３は、通信ネットワークに関する各観測データの状態とサービスに関する各観測データの状態とが得られたときの各機器の状態と各サービスの状態の事後確率を計算するための因果モデルを構築する。因果モデル構築部１０３によって構築される因果モデルは因果モデルＤＢ２０３に格納される。

　推定部１０４は、因果モデルＤＢ２０３に格納されている因果モデルにより通信ネットワークシステムの異常箇所又は異常要因と異常サービスとを推定する。

　ユーザインタフェース部１０５は、推定部１０４により推定された推定結果（異常箇所又は異常要因、異常サービス）とその確率とをユーザ（例えば、通信ネットワークシステムのオペレータ等）に提示する。

　＜因果モデル構築処理＞
　次に、モデル構築フェーズにおいて、本実施形態に係る推定装置１０が因果モデルを構築する場合の処理について、図３を参照しながら説明する。図３は、本実施形態に係る因果モデル構築処理の一例を示すフローチャートである。なお、以降では、ネットワークデータ収集部１０１によって収集されたネットワーク構成データ及び観測データがネットワークデータＤＢ２０１に格納されていると共に、サービスデータ収集部１０２によって収集されたサービス関連データ及び観測データがサービスデータＤＢ２０２に格納されているものとする。また、ネットワークデータ収集部１０１によって収集された観測データｊはその状態ｙ_ｊの値が計算され、観測データｊとその状態ｙ_ｊとが対応付けられてネットワークデータＤＢ２０１に格納されているものとする。同様に、サービスデータ収集部１０２によって収集された観測データｈはその状態ｗ_ｈの値が計算又は特定され、観測データｈとその状態ｗ_ｈとが対応付けられてサービスデータＤＢ２０２に格納されているものとする。

　ステップＳ１０１：因果モデル構築部１０３は、モデル構築に用いる過去の観測データｊ及びその状態ｙ_ｊとネットワーク構成データとをネットワークデータＤＢ２０１から入力すると共に、モデル構築に用いる過去の観測データｈ及びその状態ｗ_ｈとサービス関連データとをサービスデータＤＢ２０２から入力する。

　ステップＳ１０２：そして、因果モデル構築部１０３は、上記のステップＳ１０１で入力した観測データｊ及びその状態ｙ_ｊとネットワーク構成データと観測データｈ及びその状態ｗ_ｈとサービス関連データとを用いて、確率Ｐ（ｙ_ｊ，ｗ_ｈ｜ｘ_ｉ，ｚ_ｋ）を因果モデルとして構築する。なお、この因果モデルは因果モデルＤＢ２０３に格納される。

　以上により、モデル構築フェーズにおいて、本実施形態に係る推定装置１０は、通信ネットワークを構成する機器ｉの状態ｘ_ｉと観測データｊの状態ｙ_ｊとの関係性と、通信ネットワークで提供されるサービスｋの状態ｚ_ｋとサービスに関連する観測データｈの状態ｗ_ｈとの関係性と、サービスｋの状態ｚ_ｋとこのサービスｋに関連する機器ｉの状態ｘ_ｉとの関係性と、サービスｋの状態ｚ_ｋと観測データｊの状態ｙ_ｊとの関係性とを表す因果モデルを構築する。これにより、通信ネットワークシステムにおける異常機器（又は異常要因）だけなく、異常サービスも推定することが可能な因果モデルを得ることができる。

　＜異常箇所・要因推定処理＞
　次に、推定フェーズにおいて、本実施形態に係る推定装置１０が異常箇所・要因（異常サービスも含む）を推定する場合の処理について、図４を参照しながら説明する。図４は、本実施形態に係る異常箇所・要因推定処理の一例を示すフローチャートである。なお、以降では、ネットワークデータ収集部１０１によって収集されたネットワーク構成データ及び観測データがネットワークデータＤＢ２０１に格納されていると共に、サービスデータ収集部１０２によって収集されたサービス関連データ及び観測データがサービスデータＤＢ２０２に格納されているものとする。また、ネットワークデータ収集部１０１によって収集された観測データｊはその状態ｙ_ｊの値が計算され、観測データｊとその状態ｙ_ｊとが対応付けられてネットワークデータＤＢ２０１に格納されているものとする。同様に、サービスデータ収集部１０２によって収集された観測データｈはその状態ｗ_ｈの値が計算又は特定され、観測データｈとその状態ｗ_ｈとが対応付けられてサービスデータＤＢ２０２に格納されているものとする。

　ステップＳ２０１：推定部１０４は、異常箇所・要因（異常サービスも含む）の推定に用いる観測データｊ及びその状態ｙ_ｊとネットワーク構成データとをネットワークデータＤＢ２０１から入力すると共に、異常箇所・要因（異常サービスも含む）の推定に用いる観測データｈ及びその状態ｗ_ｈとサービス関連データとをサービスデータＤＢ２０２から入力する。なお、観測データｊ及び観測データｈとしては、例えば、通信ネットワークシステムで何等かの異常が発生したり、この通信ネットワークシステムで提供されるサービスに何等かの異常が発生したりしたときの観測データｊ及び観測データｈを入力することが考えられる。

　ステップＳ２０２：次に、推定部１０４は、上記のステップＳ２０１で入力した観測データｊの状態ｙ_ｊと観測データｈの状態ｗ_ｈとを用いて、因果モデルＤＢ２０３に格納されている因果モデルにより異常箇所・要因又は異常サービスを推定する。すなわち、推定部１０４は、ベイズの定理によりこの因果モデルから事後確率Ｐ（ｘ_ｉ，ｚ_ｋ｜ｙ_ｊ，ｗ_ｈ）を計算し、その確率が最大となる異常箇所・要因又は異常サービスを推定する。なお、或るｘ_ｉで事後確率Ｐ（ｘ_ｉ，ｚ_ｋ｜ｙ_ｊ，ｗ_ｈ）が最大となる場合は当該ｘ_ｉに対応する機器ｉ（又は要因ｉ）が異常箇所（又は異常要因）と推定され、或るｚ_ｋで事後確率Ｐ（ｘ_ｉ，ｚ_ｋ｜ｙ_ｊ，ｗ_ｈ）が最大となる場合は当該ｚ_ｋに対応するサービスｋが異常サービスと推定される。

　ステップＳ２０３：ユーザインタフェース部１０５は、上記のステップＳ２０２の推定結果（つまり、異常箇所・要因又は異常サービスとその確率）をディスプレイ等に出力し、ユーザに提示する。

　以上により、推定フェーズにおいて、本実施形態に係る推定装置１０は、モデル構築フェーズで構築した因果モデルにより異常箇所・要因及び異常サービスを推定することができる。これにより、例えば、通信ネットワークシステムのオペレータ等のユーザは、通信ネットワークシステムの異常箇所・要因だけでなく、複数のサービスを統合的に監視し、どのサービスで異常が起きていて、どのサービスに影響が出ているのかを把握することが可能になる。

　＜ハードウェア構成＞
　最後に、本実施形態に係る推定装置１０のハードウェア構成について、図５を参照しながら説明する。図５は、本実施形態に係る推定装置１０のハードウェア構成の一例を示す図である。

　図５に示すように、本実施形態に係る推定装置１０は一般的なコンピュータ又はコンピュータシステムで実現され、入力装置３０１と、表示装置３０２と、外部Ｉ／Ｆ３０３と、通信Ｉ／Ｆ３０４と、プロセッサ３０５と、メモリ装置３０６とを有する。これら各ハードウェアは、それぞれがバス３０７を介して通信可能に接続されている。

　入力装置３０１は、例えば、キーボードやマウス、タッチパネル等である。表示装置３０２は、例えば、ディスプレイ等である。なお、推定装置１０は、入力装置３０１及び表示装置３０２のうちの少なくとも一方を有していなくてもよい。

　外部Ｉ／Ｆ３０３は、記録媒体３０３ａ等の外部装置とのインタフェースである。推定装置１０は、外部Ｉ／Ｆ３０３を介して、記録媒体３０３ａの読み取りや書き込み等を行うことができる。記録媒体３０３ａには、例えば、推定装置１０が有する各機能部（ネットワークデータ収集部１０１、サービスデータ収集部１０２、因果モデル構築部１０３、推定部１０４及びユーザインタフェース部１０５）を実現する１以上のプログラムが格納されていてもよい。なお、記録媒体３０３ａとしては、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disk）、ＳＤメモリカード（Secure Digital memory card）、ＵＳＢ（Universal Serial Bus）メモリカード等がある。

　通信Ｉ／Ｆ３０４は、推定装置１０を通信ネットワークに接続するためのインタフェースである。なお、推定装置１０が有する各機能部を実現する１以上のプログラムは、通信Ｉ／Ｆ３０４を介して、所定のサーバ装置等から取得（ダウンロード）されてもよい。

　プロセッサ３０５は、例えば、ＣＰＵ（Central Processing Unit）等の各種演算装置である。推定装置１０が有する各機能部は、例えば、メモリ装置３０６に格納されている１以上のプログラムがプロセッサ３０５に実行させる処理により実現される。

　メモリ装置３０６は、例えば、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ等の各種記憶装置である。推定装置１０が有する各ＤＢ（ネットワークデータＤＢ２０１、サービスデータＤＢ２０２及び因果モデルＤＢ２０３）は、メモリ装置３０６により実現可能である。ただし、これら各ＤＢのうちの少なくとも１つのＤＢが、推定装置１０と通信ネットワークを介して接続される記憶装置（例えば、データベースサーバ等）により実現されていてもよい。

　本実施形態に係る推定装置１０は、図５に示すハードウェア構成を有することにより、上述した因果モデル構築処理及び異常箇所・要因推定処理を実現することができる。なお、図５に示すハードウェア構成は一例であって、推定装置１０は、他のハードウェア構成を有していてもよい。例えば、推定装置１０は、複数のプロセッサ３０５を有していてもよいし、複数のメモリ装置３０６を有していてもよい。

　本発明は、具体的に開示された上記の実施形態に限定されるものではなく、請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。

　１０　　　　推定装置
　１０１　　　ネットワークデータ収集部
　１０２　　　サービスデータ収集部
　１０３　　　因果モデル構築部
　１０４　　　推定部
　１０５　　　ユーザインタフェース部
　２０１　　　ネットワークデータＤＢ
　２０２　　　サービスデータＤＢ
　２０３　　　因果モデルＤＢ
　３０１　　　入力装置
　３０２　　　表示装置
　３０３　　　外部Ｉ／Ｆ
　３０３ａ　　記録媒体
　３０４　　　通信Ｉ／Ｆ
　３０５　　　プロセッサ
　３０６　　　メモリ装置
　３０７　　　バス

Claims

　異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第１の観測データを収集する第１の収集部と、
　前記通信ネットワークシステムで提供される複数のサービスに関する第２の観測データを収集する第２の収集部と、
　前記第１の観測データと前記第２の観測データとを用いて、前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを構築するモデル構築部と、
　を有することを特徴とするモデル構築装置。
　前記モデル構築部は、
　前記通信ネットワークシステムで異常箇所又は異常要因となる箇所又は要因の状態と前記第１の観測データの状態との関係性、前記サービスの状態と前記第２の観測データとの関係性、前記サービスの状態と該サービスに関連する前記箇所又は要因の状態との関係性、及び前記サービスの状態と前記第１の観測データの状態との関係性をベイジアンネットワークによりモデル化した確率モデルを前記因果モデルとして構築する、ことを特徴とする請求項１に記載のモデル構築装置。
　前記因果モデルは、前記第１の観測データの状態と前記第２の観測データの状態とが得られたときにおける前記箇所又は要因の状態と前記サービスの状態とを表す事後確率をベイズの定理により計算可能な確率モデルである、ことを特徴とする請求項２に記載のモデル構築装置。
　異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第１の観測データを収集する第１の収集部と、
　前記通信ネットワークシステムで提供される複数のサービスに関する第２の観測データを収集する第２の収集部と、
　前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを記憶する記憶部と、
　前記第１の観測データと前記第２の観測データとを用いて、前記因果モデルにより前記異常箇所又は異常要因と前記異常サービスとを推定する推定部と、
　を有することを特徴とする推定装置。
　異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第１の観測データを収集する第１の収集手順と、
　前記通信ネットワークシステムで提供される複数のサービスに関する第２の観測データを収集する第２の収集手順と、
　前記第１の観測データと前記第２の観測データとを用いて、前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを構築するモデル構築手順と、
　をコンピュータが実行することを特徴とするモデル構築方法。
　異常箇所又は異常要因の推定対象となる通信ネットワークシステムに関する第１の観測データを収集する第１の収集手順と、
　前記通信ネットワークシステムで提供される複数のサービスに関する第２の観測データを収集する第２の収集手順と、
　前記異常箇所又は異常要因と前記複数のサービスのうちの異常サービスとを推定するための因果モデルを記憶部に記憶する記憶手順と、
　前記第１の観測データと前記第２の観測データとを用いて、前記因果モデルにより前記異常箇所又は異常要因と前記異常サービスとを推定する推定手順と、
　をコンピュータが実行することを特徴とする推定方法。
　コンピュータに、請求項５に記載のモデル構築方法又は請求項６に記載の推定方法を実行させるプログラム。