WO2016136198A1

WO2016136198A1 - システム監視装置、システム監視方法、及び、システム監視プログラムが記録された記録媒体

Info

Publication number: WO2016136198A1
Application number: PCT/JP2016/000827
Authority: WO
Inventors: 毅彦溝口
Original assignee: 日本電気株式会社
Priority date: 2015-02-25
Filing date: 2016-02-17
Publication date: 2016-09-01
Also published as: US10539468B2; US20180245987A1; JPWO2016136198A1; JP6828679B2

Abstract

システム監視装置（２０１）は、監視対象に関して、第１期間に測定された複数セットの第１時系列データに成り立つ関係を表す関係性が、第２期間に測定された該複数セットの第２時系列データについて成り立つか否かを判定する判定部（２０２）と、判定部（２０２）が成り立つと判定する該関係性と、判定部（２０２）が成り立たないと判定する該関係性とに基づき、該第２時系列データが異常である程度を表す異常度を算出する異常度算出部（２０３）と、該第２時系列データに関して算出された該異常度に基づき、該第２時系列データが正常または異常である場合において該異常度が特定の値である程度を表す第１程度を算出する第１程度算出部（２０４）と、該第１期間に関する該関係性に基づき、該複数セットの該第２時系列データが関連している程度を表す第２程度を算出する第２程度算出部（２０５）と、該第１程度と、該第２程度とに基づき、該第２時系列データが正常であるか異常であるかを求める状態算出部（２０６）とを有する。

Description

システム監視装置、システム監視方法、及び、システム監視プログラムが記録された記録媒体

　本発明は、監視対象に関する不具合を特定可能なシステム監視装置等に関する。

　原子力プラントや化学プラント等の大規模で複雑な物理システムに関して、温度計等のセンサ（検出端）を用いて、該物理システム等に関する状態値（測定値、性能値）は測定される。測定された状態値は、たとえば、測定に用いたセンサごとに、測定された時刻に関連付けされることにより、性能情報として保存される。性能情報から、ある期間における測定値が抽出されることにより、該性能情報に関する時系列データ（時系列な情報、時系列レコード）は抽出される。

　監視対象である物理システムを監視する場合には、たとえば、相関分析等の解析手法を用いて、該性能情報に含まれる複数の測定値の間に成り立つ関係性が解析される。相関分析は、多数のサーバや、通信ネットワーク機器を含む大規模な情報システムに関して、異常を検出する手法としても利用される。

　特許文献１に開示された運用管理装置は、異なる２つの性能情報（「第１性能情報」、「第２性能情報」と表す）から、それぞれ、物理システムが正常に稼働している期間における測定値を時系列データとして読み取る。該運用管理装置は、読み取った２つの時系列データの間に成り立つ数理的な関係式を導出することにより、相関モデルを作成する。該運用管理装置は、たとえば、第１性能情報から、物理システムを監視する監視期間における測定値を第１時系列データとして読み取り、第２性能情報から、該監視期間における測定値を第２時系列データとして読み取る。

　該運用管理装置は、作成した相関モデルを第１時系列データに適用することにより、第２時系列データを推定する。該運用管理装置は、読み取った第２時系列データと、推定した第２時系列データとを比較し、比較した結果に基づき、作成した相関モデルが監視期間における時系列データに関しても成り立つか否かを判定する。すなわち、該運用管理装置は、作成した相関モデルが、監視期間に関する時系列データに関しても維持されているか否かを判定する。

　特許文献２に開示された運用管理装置は、監視対象である装置に関して、それぞれ、複数の性能指標に関する測定値を測定し、測定した測定値が異常であるか否かを判定する。該運用管理装置は、測定値が異常であると判定する場合に、該測定値に関する性能指標を異常項目として抽出する。該運用管理装置は、それぞれの異常項目から、全ての監視対象である装置に関して抽出された異常項目を除外する。これにより、該運用管理装置は、複数のサーバが異常を検知した場合に、該異常の原因を特定するのに要する時間を短縮することができる。

　特許文献３に開示された運用管理装置は、センサ等の複数の被管理装置によって測定される複数の性能情報に関して時系列データの変化を導出し、導出した複数の時系列データに関する変化の間の関係性を表す相関モデルを算出するモデル生成部を有する。該運用管理装置は、さらに、新たに検出される該性能情報に関して時系列データを算出し、算出した時系列データに基づき、算出した相関モデルが成り立つか否かを判定する分析部を有する。これにより、該運用管理装置は、相関モデルが成り立つか否かに基づき、障害を検出(判定)することができる。

　特許文献４に開示された遠隔監視システムは、監視対象が正常に稼働している期間に、監視対象に関して測定される複数の測定値の間に成り立つ第１の相関関係と、一部の測定値間に成り立つ第２の相関関係とを求めるモデル構築部を有する。さらに、該遠隔監視システムは、監視対象に関して監視期間中に測定される測定値に、第１の相関関係と、第２の相関関係とを、それぞれ、適用し、算出される結果に基づき、監視対象が故障しているか否かを検知する検知部を有する。

特開２００９－１９９５３３号公報国際公開第２０１１／０８３６８７号特開２００９－２１１４７２号公報特開２００６－１３５４１２号公報

　特許文献１乃至特許文献４に開示された装置は、少なくとも２つの時系列データの間における相関関係を算出するが、どの時系列データが、監視対象に関する不具合の要因であるのかを特定することはできない。

　そこで、本発明の主たる目的は、監視対象に関する不具合の要因を特定することが可能なシステム監視装置等を提供することである。

　前述の目的を達成するために、本発明の一態様において、システム監視装置は、
　監視対象に関して、第１期間に測定された複数セットの第１時系列データに成り立つ関係を表す関係性が、第２期間に測定された前記複数セットの第２時系列データについて成り立つか否かを判定する判定手段と、
　前記判定手段が成り立つと判定する前記関係性と、前記判定手段が成り立たないと判定する前記関係性とに基づき、前記第２時系列データが異常である程度を表す異常度を算出する異常度算出手段と、
　前記第２時系列データに関して算出された前記異常度に基づき、前記第２時系列データが正常または異常である場合において前記異常度が特定の値である程度を表す第１程度を算出する第１程度算出手段と、
　前記第１期間に関する前記関係性に基づき、前記複数セットの前記第２時系列データが関連している程度を表す第２程度を算出する第２程度算出手段と、
　前記第１程度と、前記第２程度とに基づき、前記第２時系列データが正常であるか異常であるかを求める状態算出手段と
　を備える。

　また、本発明の他の見地として、システム監視方法は、
　監視対象に関して、第１期間に測定された複数セットの第１時系列データに成り立つ関係を表す関係性が、第２期間に測定された前記複数セットの第２時系列データについて成り立つか否かを判定し、
　成り立つと判定された前記関係性と、成り立たないと判定する前記関係性とに基づき、前記第２時系列データが異常である程度を表す異常度を算出し、
　前記第２時系列データに関して算出された前記異常度に基づき、前記第２時系列データが正常または異常である場合において前記異常度が特定の値である程度を表す第１程度を算出し、
　前記第１期間に関する前記関係性に基づき、前記複数セットの前記第２時系列データが関連する程度を表す第２程度を算出し、
　前記第１程度と、前記第２程度とに基づき、前記第２時系列データが正常であるか異常であるかを求める。

　また、本発明の他の見地として、システム監視プログラムは、
　監視対象に関して、第１期間に測定された複数セットの第１時系列データに成り立つ関係を表す関係性が、第２期間に測定された前記複数セットの第２時系列データについて成り立つか否かを判定する判定機能と、
　前記判定機能によって成り立つと判定された前記関係性と、前記判定機能によって成り立たないと判定された前記関係性とに基づき、前記第２時系列データが異常である程度を表す異常度を算出する異常度算出機能と、
　前記第２時系列データに関して算出された前記異常度に基づき、前記第２時系列データが正常または異常である場合において前記異常度が特定の値である程度を表す第１程度を算出する第１程度算出機能と、
　前記第１期間に関する前記関係性に基づき、前記複数セットの前記第２時系列データが関連している程度を表す第２程度を算出する第２程度算出機能と、
　前記第１程度と、前記第２程度とに基づき、前記第２時系列データが正常であるか異常であるかを求める状態算出機能と
　をコンピュータに実現させる。

　さらに、同目的は、係るシステム監視プログラムを記録するコンピュータ読み取り可能な記録媒体によっても実現される。

　本発明に係るシステム監視装置等によれば、監視対象に関する不具合の要因を特定することができる。

本発明の各実施形態に係るシステム監視装置が参照する測定情報の一例を概念的に表す図である。本発明の第１の実施形態に係るシステム監視装置が有する構成を示すブロック図である。本発明の各実施形態に係るシステム監視装置が参照する時系列情報の一例を概念的に表す図である。本発明の各実施形態に係るシステム監視装置が参照する相関モデル情報の一例を概念的に表す図である。第１の実施形態に係るシステム監視装置が確率モデルを作成する処理の流れを示すフローチャートである。第１の実施形態に係るシステム監視装置が、時系列データに関して異常であるか否かを判定する処理の流れを示すフローチャートである。関連情報の一例を概念的に表す図である。関連情報の一例を概念的に表す図である。確率モデルの一例を概念的に表す図である。関連情報の一例を概念的に表す図である。異常度情報の一例を概念的に表す図である。異常判定部が算出する判定情報を概念的に表す図である。本発明の第２の実施形態に係るシステム監視装置が有する構成を示すブロック図である。本発明の各実施形態に係るシステム監視装置を実現可能な計算処理装置のハードウェア構成例を、概略的に示すブロック図である。

　まず、図１を参照しながら、本願明細書において用いる用語を定義する。図１は、本発明の各実施形態に係るシステム監視装置が参照する測定情報の一例を概念的に表す図である。

　監視する対象を表す監視対象（被分析装置、被分析システム、情報システム、物理システム）に関して、たとえば、該監視対象を測定するセンサは、温度、室温、湿度等の指標（測定項目、性能指標）に関する値（測定値）を測定する。測定された値は、たとえば、システム監視装置に送信され、図１に例示されているような測定情報として格納される。図１は、本発明の各実施形態に係るシステム監視装置が参照する測定情報の一例を概念的に表す図である。

　図１に例示された測定情報によって、たとえば、センサが測定する測定項目（上部温度、室温、湿度等）に関する測定値と、該測定値が測定された日時と、該測定値が測定されたタイミングにおける監視対象の状態（正常、または、異常）とが関連付けされている。尚、図１において、下部温度、上部温度、及び、室温の単位は、摂氏温度（℃）である。また、湿度の単位は、「％」である。以降の説明において、単位に関しては、記載を省略する。図１に例示された測定情報によって、日付「２０１４／２／６」、時刻「０：００」、状態「正常」、下部温度「２３」、及び、上部温度「２８」等が関連付けされている。これは、日付「２０１４／２／６」の時刻「０：００」にて、センサが測定した上部温度が２８（℃）であり、センサが測定した下部温度が２３（℃）であり、かつ、監視対象が正常であることを表す。

　測定情報に基づき、特定の期間に関して、各測定値を時刻順に抽出することにより該測定値に関する時系列データ（時系列データセット、時系列な情報、時系列レコード）は、抽出される。たとえば、日付「２０１４／２／６」に関する下部温度を抽出することにより、下部温度に関する時系列データとして、「２３、２５、３０、２２」が抽出される。

　以降、時系列データセットを、単に、「時系列データ」とも表す。

　たとえば、状態「異常」に関連付けされた期間（２０１４／２／７の１２：００から２０１４／２／８の０：００まで）における湿度を抽出することにより、湿度に関する時系列データとして、「４６、４１、４３、４６」が抽出される。すなわち、抽出された時系列データは、監視対象が異常な状態である期間（異常期間）における室温に関する測定値を表す。

　たとえば、状態「正常」に関連付けされた期間（２０１４／２／６の０：００から２０１４／２／７の６：００まで）における室温を抽出することにより、室温に関する時系列データ「２２、２３、２５、２４、２２、２３」を抽出することができる。すなわち、該時系列データは、監視対象が正常な状態である（正常に稼働している）期間（正常期間）における室温に関する測定値を表す。

　相関モデルは、たとえば、正常期間における２つの測定値（たとえば、室温と下部温度）に関する時系列データに対して、一方の時系列データと、他方の時系列データとの間に成り立つ関係性を数理的に表すモデル（関係式）を表す。たとえば、相関モデル（異なる性能指標の、ある期間における相関）は、相関係数ＡｕｔｏＲｅｇｒｅｓｓｉｖｅ＿ｅＸｏｇｅｎｅｏｕｓ（ＡＲＸ）モデル等の数理的なモデルを含む。

　相関モデルの破壊とは、ある期間における時系列データに基づき算出される相関モデルが、該ある期間と異なる期間における時系列データに適用された場合に、推定される時系列データと、ある期間における時系列データとが乖離することを表す。乖離しているか否かに関する判定は、たとえば、推定される時系列データと、ある期間における時系列データとの差異（すなわち、推定誤差、予測誤差）が所定の閾値を超えているか否か（すなわち、所定の条件を満たしているか否か）に基づく。尚、破壊は、「ｂｒｅａｋ」，「ｄｅｓｔｒｕｃｔｉｏｎ」と表される。

　時系列データは、たとえば、監視対象の一例である情報処理システムに関する運用情報に含まれる、演算装置の使用率、メモリの使用率、ディスクアクセスの頻度等の測定値に関する時系列データであってもよい。また、時系列データは、たとえば、消費電力量や演算回数等の測定値に関する時系列データであってもよい。時系列データは、たとえば、情報処理システムを稼働している期間に測定される性能指標等の値に関する時系列データであってもよい。また、時系列データは、必ずしも、数値である必要はなく、記号、符号等であってもよい。時系列データは、上述した例に限定されない。

　次に、本発明を実施する実施形態について図面を参照しながら詳細に説明する。

　＜第１の実施形態＞
　本実施形態においては、監視対象における異常な箇所（要因）を特定する場合の例を用いながら、本実施形態に係るシステム監視装置について説明する。尚、本実施形態においては、監視対象を測定しているセンサを介して、該監視対象に関する複数の測定値（たとえば、温度、湿度等）を測定できるとする。

　図２を参照しながら、本発明の第１の実施形態に係るシステム監視装置１０１が有する構成について説明する。図２は、本発明の第１の実施形態に係るシステム監視装置１０１が有する構成を示すブロック図である。

　本実施形態に係るシステム監視装置１０１は、情報作成部（モデル作成部）１０３と、異常算出部１０６とを有する。システム監視装置１０１は、さらに、指標入力部１０２と、異常箇所出力部１１０とを有してもよい。システム監視装置１０１は、時系列記憶部１１２と、情報記憶部１１３と、異常記憶部１１６とを含む記憶部１１１に接続されていてもよい。

　第１の実施形態に係るシステム監視装置１０１は、監視対象１２１に関して、複数のセンサ（被分析装置）１２０によって測定された性能、または、測定値等が格納されている記憶部１１１を読み取ることができる。第１の実施形態に係るシステム監視装置１０１は、センサ１２０が送信する情報を受信する態様によって実現されていてもよい。以降の説明においては、説明の便宜上、システム監視装置１０１は、センサ１２０が送信する情報を受信することができるとする。

　センサ１２０は、たとえば、監視対象１２１に関する性能等を、一定の時間間隔にて、測定値として測定する。センサ１２０は、監視対象１２１に関して測定した測定値をシステム監視装置１０１に送信する。

　測定値は、たとえば、監視対象１２１に関して測定される、中央演算処理装置（ＣＰＵ）における使用率、メモリに関する使用率、ディスクアクセスに関する頻度等の運用情報や、消費電力量、演算回数等の性能情報等を表す。測定値は、たとえば、整数や小数等の数値、「ＯＮ」、「ＯＦＦ」等の符号、または、「Ｔｒｕｅ」、「Ｆａｌｓｅ」等の記号を用いて表される。

　指標入力部１０２は、センサ１２０が送信する測定値を受信し、たとえば、図１に例示されているような測定情報として、受信した測定値を記憶部１１１に格納する。指標入力部１０２は、該測定情報（図１に例示）から、特定の（たとえば、状態が正常である）期間における測定値を時系列データとして抽出し、抽出した時系列データを時系列記憶部１１２に格納する。さらに、指標入力部１０２は、たとえば、該測定情報から、監視期間（ある期間）における測定値を時系列データとして抽出し、抽出した時系列データを、図３に例示されているような時系列情報として時系列記憶部１１２に格納する。図３は、本発明の各実施形態に係るシステム監視装置が参照する時系列情報の一例を概念的に表す図である。

　図３に例示された時系列情報を参照すると、時系列データを識別する時系列識別子（以降、識別子を「ＩＤ」と表す）と、測定項目と、監視対象に関する状態と、時系列データとが関連付けされている。たとえば、時系列ＩＤ「１」と、測定項目「温度」と、状態「正常」と、時系列データ「４０、４５、４１、・・・」とが関連付けされている。これは、時系列データ「４０、４５、４１、・・・」を識別可能な時系列ＩＤが「１」であることを表す。さらに、これは、該時系列データに関して、測定項目が温度であり、監視対象に関する状態が正常である場合に測定された測定値であることを表す。

　図２を参照すると、情報作成部１０３は、２つの時系列データにおける関係性を表す相関モデル等を作成するモデル情報作成部１０４を有する。さらに、情報作成部１０３は、作成した相関モデルに基づき、該時系列データに関して正常であるか否かを表す状態を算出可能な確率モデル（図９を参照しながら後述する）を作成する確率情報作成部１０５を有する。

　モデル情報作成部１０４は、時系列記憶部１１２から、監視対象１２１が正常に稼働している期間における測定項目（センサ１２０）に関する時系列データを読み取る。モデル情報作成部１０４は、読み取った時系列データのうち、２つの時系列データ間に関する組み合わせに対して、該組み合わせに関して成り立つ関係性（たとえば、相関関係）を、相関モデルとして作成する。モデル情報作成部１０４は、作成した相関モデルを、図４に例示されているような相関モデル情報として、モデル情報記憶部１１４に格納する。図４は、本発明の各実施形態に係るシステム監視装置が参照する相関モデル情報の一例を概念的に表す図である。

　図４を参照すると、相関モデル情報によって、相関モデルを一意に識別可能な相関モデルＩＤと、相関モデルとが関連付けされている。たとえば、相関モデル情報によって、相関モデルＩＤ「１」と、相関モデル「（時系列データ１）＝（時系列データ６）×３＋１」とが関連付けされている。これは、相関モデルＩＤ「１」に関して、時系列ＩＤ「１」が表す時系列データと、時系列ＩＤ「６」が表す時系列データとに基づき算出された相関モデルが「（時系列データ１）＝（時系列データ６）×３＋１」であることを表す。モデル情報作成部１０４は、任意の時系列データ間における組み合わせに関して、該相関モデル（関係性）を作成してもよい。相関モデルを作成する具体的な処理（たとえば、最小二乗法）については後述する。

　確率情報作成部１０５は、モデル情報記憶部１１４に格納されている相関モデルを読み取り、読み取った相関モデルに基づき、時系列データに関して正常であるか否かを表す状態を算出可能な確率モデル（図９を参照しながら後述する）を作成する。確率情報作成部１０５が確率モデルを作成する処理については、図５を参照しながら後述する。

　図２を参照すると、異常算出部１０６は、破壊検出部１０７と、異常度算出部１０８と、異常判定部１０９とを有する。

　破壊検出部１０７は、たとえば、時系列記憶部１１２から、監視期間における測定値に関する時系列データを読み取る。破壊検出部１０７は、たとえば、モデル情報記憶部１１４から、該時系列データに関連する相関モデル（図４に例示）を読み取る。破壊検出部１０７は、読み取った相関モデルに関連する時系列データを時系列記憶部１１２から読み取ってもよい。

　さらに、破壊検出部１０７は、読み取った相関モデルに基づき作成された確率モデル（図９を参照しながら後述する）を確率情報記憶部１１５から読み取る。破壊検出部１０７は、読み取った時系列データ、読み取った相関モデル、及び、読み取った確率モデルに基づき、ある期間における異常の原因（要因）を検出する。

　破壊検出部１０７は、時系列記憶部１１２から、ある期間における測定値に関する時系列データを読み取る。破壊検出部１０７は、読み取った時系列データに関連する相関モデル（図４に例示）を、モデル情報記憶部１１４から読み取る。破壊検出部１０７は、読み取った各相関モデルが、読み取った時系列データに関して成立しているか否かを判定する。たとえば、破壊検出部１０７は、読み取った相関モデルに基づき、該ある期間における測定値に関する時系列データを推定し、推定した時系列データと、読み取った時系列データとの差異（予測誤差）を算出する。

　破壊検出部１０７は、算出した予測誤差が所定の閾値を超える（すなわち、予測誤差が所定の条件を満たさない）場合に、読み取った相関モデルが成立しない（維持されなくなった、破壊された）と判定する。破壊検出部１０７は、破壊された相関モデルを、破壊モデルとして破壊モデル記憶部１１７に格納する。たとえば、破壊検出部１０７は、破壊モデルを表す相関モデルＩＤを破壊モデル記憶部１１７に格納してもよい。

　異常度算出部１０８は、破壊モデル記憶部１１７から、破壊モデルを読み取る。次に、異常度算出部１０８は、読み取った破壊モデルに基づき、時系列データが破壊モデルに関連している程度を表す異常度を算出する。異常度を算出する方法に関しては、図７を参照しながら後述する。

　異常判定部１０９は、確率情報記憶部１１５から確率モデル（図９を参照しながら後述する）を読み取る。異常判定部１０９は、破壊モデル記憶部１１７から、読み取った確率モデルに関する破壊モデルを読み取る。さらに、異常判定部１０９は、異常度記憶部１１８から節点（センサ）に関する異常度を読み取る。異常判定部１０９は、読み取った異常度に最も適合する状態を推定することにより、異常が生じる要因であるセンサを特定する。異常判定部１０９が、異常が生じる要因となるセンサを特定する処理手順に関しては、図６を参照しながら後述する。

　情報記憶部１１３は、モデル情報作成部１０４が作成した相関モデルを記憶可能なモデル情報記憶部１１４と、確率情報作成部１０５が作成した確率モデル（図９を参照しながら後述する）を記憶可能な確率情報記憶部１１５とを有する。

　異常記憶部１１６は、破壊検出部１０７が作成した破壊モデルを記憶可能な破壊モデル記憶部１１７と、異常度算出部１０８が算出した異常度を記憶可能な異常度記憶部１１８とを有する。さらに、異常記憶部１１６は、異常判定部１０９が特定した異常の要因を表す時系列データに関するセンサを、異常箇所として記憶可能な異常箇所記憶部１１９を有する。

　異常箇所出力部１１０は、異常箇所記憶部１１９から、異常の要因を表す項目を読み取り、読み取った項目を出力する。

　図５を参照しながら、第１の実施形態に係るシステム監視装置１０１における処理について説明する。図５は、第１の実施形態に係るシステム監視装置１０１が確率モデルを作成する処理の流れを示すフローチャートである。

　まず、図５に示されたフローチャートを参照しながら、システム監視装置１０１が確率モデルを作成する処理について説明する。

　指標入力部１０２は、センサ１２０が送信する測定値（測定情報）を受信する（ステップＳ１０１）。指標入力部１０２は、たとえば、受信した測定値を時刻順に並べることにより、図１に例示されているような測定情報を作成し、作成した測定情報を記憶部１１１に格納する。次に、指標入力部１０２は、測定情報に基づき、ある期間における測定値を時系列データとして抽出することにより、図３に例示されているような時系列情報を作成し、作成した時系列情報を時系列記憶部１１２に格納する（ステップＳ１０２）。

　たとえば、すべてのセンサ１２０から測定値を受信する処理を実行する場合に、指標入力部１０２は、すべてのセンサ１２０から測定値を受信したか否かを判定する（ステップＳ１０３）。まだ、受信していない測定値がある場合に（ステップＳ１０３にてＮＯ）、指標入力部１０２は、ステップＳ１０１及びステップＳ１０２に示された処理を繰り返す。

　すべての測定値を受信した場合に（ステップＳ１０３にてＹＥＳ）、モデル情報作成部１０４は、時系列記憶部１１２に格納されている時系列データを複数個、読み取る（ステップＳ１０４）。

　モデル情報作成部１０４は、読み取った複数個の時系列データ間の関係性を表す相関モデルを作成する（ステップＳ１０５）。たとえば、時系列データｘと、時系列データｙとの関係が、「ｙ＝ａ×ｘ＋ｂ」（ただし、ａ及びｂは、定数を表す）で表現される場合に、モデル情報作成部１０４は、読み取った複数の時系列データに基づき、最小二乗法等の手順に従い、係数ａ及びｂを算出する。モデル情報作成部１０４は、算出した相関モデルを、モデル情報記憶部１１４に格納する（ステップＳ１０６）。

　たとえば、時系列記憶部１１２に格納されている、すべての時系列データ間における組み合わせに関して、相関モデルを作成する場合に、モデル情報作成部１０４は、すべての時系列データ間における組み合わせに関して相関モデルを作成したか否かを判定する（ステップＳ１０７）。相関モデルを作成していない組み合わせが存在する場合に（ステップＳ１０７にてＮＯ）に、モデル情報作成部１０４は、ステップＳ１０５及びステップＳ１０６に示された処理を繰り返す。

　たとえば、時系列データに関する全ての組み合わせに関して相関モデルを作成した場合に（ステップＳ１０７にてＹＥＳ）、確率情報作成部１０５は、モデル情報記憶部１１４から相関モデルを読み取る（ステップＳ１０８）。

　確率情報作成部１０５は、読み取った相関モデルに基づき、時系列データに関して正常であるか異常であるかを表す状態を算出可能な確率モデル（図９を参照しながら後述する）を作成する（ステップＳ１０９）。すべての相関モデルに関して確率モデルを作成する場合に、確率情報作成部１０５は、モデル情報記憶部１１４からすべての相関モデルを読み取り、読み取った相関モデルに基づき、確率モデルを作成してもよい。確率情報作成部１０５は、作成した確率モデルを確率情報記憶部１１５に格納する。尚、確率モデル及び確率モデルを作成する処理に関しては図９を参照しながら後述する。

　次に、図６を参照しながら、第１の実施形態に係るシステム監視装置１０１が、各測定値（時系列データ）に関して異常であるか否かを判定する処理について説明する。図６は、第１の実施形態に係るシステム監視装置１０１が、時系列データに関して異常であるか否かを判定する処理の流れを示すフローチャートである。

　以降の説明においては、説明の便宜上、モデル情報記憶部１１４には、相関モデルが格納されており、確率情報記憶部１１５には、確率モデルが格納されているとする。また、指標入力部１０２は、ある期間（監視期間）における測定値をセンサ１２０から受信するとする。尚、指標入力部１０２は、時系列記憶部１１２から、ある期間における時系列データを読み取ってもよい。

　指標入力部１０２は、ある期間における測定値（性能情報、観測値）を、センサ１２０から受信する（ステップＳ２０１）。指標入力部１０２は、たとえば、受信した測定値を、時刻順に時系列データとして時系列記憶部１１２に格納する（ステップＳ２０２）。

　たとえば、すべてのセンサ１２０から測定値を受信する場合に、指標入力部１０２は、すべてのセンサ１２０から測定値を受信したか否かを判定する（ステップＳ２０３）。受信していないセンサ１２０がある場合に（ステップＳ２０３にてＮＯ）、指標入力部１０２は、ステップＳ２０１及びステップＳ２０２に示された処理を繰り返す。

　すべてのセンサ１２０から測定値を受信した場合に（ステップＳ２０３にてＹＥＳ）、破壊検出部１０７は、図４に例示されているような相関モデル情報を記憶可能なモデル情報記憶部１１４から相関モデルを読み取る。

　破壊検出部１０７は、読み取った相関モデル（図４に例示）に関連する時系列データ（図３に例示）を、時系列記憶部１１２から読み取る（ステップＳ２０４）。たとえば、破壊検出部１０７は、相関モデルを一意に識別可能な相関モデルＩＤ「２」が表す相関モデルに関して、時系列ＩＤ「２」が表す時系列データ、及び、時系列ＩＤ「５」が表す時系列データを読み取る。たとえば、図３を参照すると、時系列ＩＤ「２」が表す時系列データは、時系列ＩＤ「２」に関連付けされた測定項目（すなわち、センサ）「湿度」に関する、ある期間における時系列データである。

　破壊検出部１０７は、読み取った相関モデルが、ある期間における時系列データに関して成り立つか否かを判定する（ステップＳ２０５）。たとえば、破壊検出部１０７は、ある期間における時系列データ（たとえば、時系列ＩＤ「５」）に、読み取った相関モデル（図４における相関モデルID「２」に例示）を適用することにより、時系列データ（たとえば、時系列ＩＤ「２」）を推定する。破壊検出部１０７は、ある期間における時系列データと、推定した時系列データとの誤差を算出し、算出した誤差に基づき、読み取った相関モデルが成り立つか否かを判定する。

　ある期間における時系列データに関して相関モデルが成り立たない（成立しない）場合に（ステップＳ２０５にてＮＯ）、破壊検出部１０７は、読み取った相関モデルを、ある期間における時系列データに関して成立しないことを表す破壊モデルに設定する。破壊検出部１０７は、該破壊モデルを、破壊モデル記憶部１１７に格納する（ステップＳ２０６）。

　すべての相関モデルに関して相関モデルが成立しているか否かを判定する場合に、破壊検出部１０７は、すべての相関モデルについて、相関モデルが成立しているか否かを判定する（ステップＳ２０７）。すなわち、破壊検出部１０７は、すべての相関モデルについて、ある期間における時系列データに基づき、相関破壊が生じているのか否かを判定する。

　まだ、相関破壊が生じているのか否かが判定されていない相関モデルが存在する場合に（ステップＳ２０７にてＮＯ）、破壊検出部１０７は、ステップＳ２０４乃至ステップＳ２０６に示された処理を繰り返す。

　すべての相関モデルについて相関破壊が生じているのか否かを判定した場合に（ステップＳ２０７にてＹＥＳ）、破壊検出部１０７は、破壊モデル記憶部１１７を参照する等の処理により、破壊モデルが存在するのか否かを判定する（ステップＳ２０８）。

　破壊モデルが存在しない場合に（ステップＳ２０８にてNO）、システム監視装置１０１は、「異常箇所なし」であるメッセージを出力（たとえば、表示）する（ステップＳ２１２）。

　破壊モデルが存在する場合に（ステップＳ２０８にてYES）、異常度算出部１０８は、相関モデルが破壊モデルであるか否か等に基づき、時系列データに関して異常度を算出する（ステップＳ２０９）。尚、異常度、及び、異常度を算出する処理に関しては、図７を参照しながら後述する。

　異常判定部１０９は、確率情報記憶部１１５から、確率モデル（図９に例示）を読み取る（ステップＳ２１０）。異常判定部１０９は、異常度算出部１０８が算出した異常度と、読み取った確率モデルに基づき、確率モデルに含まれている各節点（たとえば、センサ１２０）が異常であるか否かを算出する（ステップＳ２１１）。尚、確率モデルの詳細については、図９を参照しながら後述する。

　異常箇所出力部１１０は、たとえば、異常判定部１０９が異常であると判定した時系列データに関する項目（箇所、センサ１２０）を出力する（ステップＳ２１３）。

　次に、一例を参照しながら、相関モデル、確率モデル、及び、破壊モデルについて詳細に説明する。まず、相関モデル、及び、相関モデルを作成する処理について説明する。

　説明の便宜上、２つの時系列データは、時系列データｘ、時系列データｙであるとする。また、時系列データｘと、時系列データｙとの関係性は、相関モデル「ｙ＝ａ×ｘ＋ｂ」（ただし、ａ、ｂは、定数を表す）にて表されるとする。

　モデル情報作成部１０４は、読み取った時系列データ（たとえば、正常期間における時系列データ）に基づき、相関モデルに関する誤差の二乗和を最小にする手順（すなわち、最小二乗法）に従い、定数「ａ、ｂ」を算出する。モデル情報作成部１０４は、算出した定数「ａ、ｂ」に関して、たとえば、図４に例示されているような相関モデル情報を作成し、作成した相関モデル情報をモデル情報記憶部１１４に格納する。尚、ｘを入力とした場合におけるｙの近似値（予測値）ｚは、「ａ×ｘ＋ｂ」に従い算出することができ、また、誤差は、ｙとｚとの差異として算出することができる。

　モデル情報作成部１０４は、さらに、誤差の二乗和が所定の条件を満たすか否か（たとえば、誤差の二乗和が所定の閾値以下であるか否か）に応じて、算出した相関モデルが適切であるか否かを判定してもよい。たとえば、モデル情報作成部１０４は、誤差の二乗和が所定の閾値よりも大きい場合に、算出した相関モデルが時系列データを推定する相関モデルとして適切でないと判定する。この場合に、モデル情報作成部１０４は、該相関モデルをモデル情報記憶部１１４に格納しなくてもよい。

　また、モデル情報作成部１０４は、時系列データを推定する相関モデルとして適切な相関モデルを概念的に表す関連情報（図７）を作成してもよい。図７は、関連情報の一例を概念的に表す図である。

　図７に例示された関連情報において、複数の節点（ノード、○に囲まれた数字）と、節点を接続する枝（エッジ、数字を結ぶ線）とが示されている。節点は、ある時系列データ（または、該時系列データを算出するセンサ１２０）を表す。枝は、該枝の両端における節点が表す時系列データの間に成り立つ相関モデルが、時系列データを推定する相関モデルとして適切であることを表す。モデル情報作成部１０４は、上述した誤差の二乗和が所定の閾値よりも大きいか否かに応じて、該相関モデルに関連する時系列データ（または、該時系列データを算出するセンサ１２０）を表す２つの節点の間に枝を設定する。

　関連情報においては、たとえば、図８に示されているように、センサ（○に囲まれたアラビア数字）と、時系列データ（○に囲まれたローマ数字）とが、それぞれ、節点として表されてもよい。図８は、関連情報の一例を概念的に表す図である。

　図８に例示された関連情報において、センサを表す節点は、時系列データを表す節点に隣接している。これは、センサ（○に囲まれたアラビア数字）が、該節点に隣接する節点（○に囲まれたローマ数字）にて表される時系列データを測定することを表す。また、○に囲まれたアラビア数字にて表す節点間を繋ぐ枝は、該節点が表すセンサが測定する時系列データ間における相関モデルに関する誤差の二乗和が、所定の条件を満たしていることを表す。

　すなわち、図７及び図８に例示された関連情報において、枝の両端に接続する節点は、該節点が表す時系列データが所定の条件を満たす関係性（相関性）を有することを表す。

　次に、図９を参照しながら、確率モデル、及び、確率モデルを作成する処理について説明する。図９は、確率モデルの一例を概念的に表す図である。

　確率モデルは、作成した相関モデル（関連情報、図７、図８に例示）に基づき算出される。確率モデルにおける節点は、図７に示された節点（時系列データ、または、センサを表す）と、２つの節点（すなわち、節点Ｓと節点Ｄ）とを含む。尚、説明の便宜上、図９においては、節点２、節点６、節点７、及び、該３つの節点を結ぶ枝の記載が省略されている。また、確率モデルにおける枝は、作成した関連情報における枝（すなわち、所定の条件を満たす相関モデル）と、節点Ｓ及び関連情報（図７に例示）における各節点を結ぶ枝と、節点Ｄ及び関連情報における各節点を結ぶ枝とを含む。

　説明の便宜上、節点Ｓ及び関連情報における各節点を結ぶ枝を第２枝と表し、節点Ｄ及び関連情報における各節点を結ぶ枝を第１枝と表し、関連情報（図７に例示）における各節点を結ぶ枝を第３枝と表すとする。節点Ｓを、第２節点と表すこともある。節点Ｄを、第３節点と表すこともある。また、関連情報（図７に例示）に含まれる節点を、第１節点と表すこともある。

　確率モデル内の各枝は、後述する処理に従い、重みが付与される。たとえば、第２枝、及び、第３枝に付与される重みは、上述した異常度に基づく重みが付与される。また、たとえば、第１枝に付与される重みは、該枝が存在するか否かに基づく重みが付与される。重みを付与する処理については後述する。

　確率モデルにおける枝の重みについて説明するにあたり、本実施形態にて用いるマルコフ確率場について説明する。

　マルコフ確率場は、相互に隣接している節点のみが確率的に影響を及ぼし合うという確率モデルである。

　たとえば、作成した確率モデルが、マルコフ確率場であることを仮定する。節点をｖと表し、確率モデルに含まれる節点の集合をＶと表すとする。節点の集合Ｖのうち、節点ｖ以外の節点の集合を「Ｖ＼｛ｖ｝」と表すとする。さらに、節点ｖに隣接している節点の集合をTで表すとする。

　マルコフ確率場である場合、隣接している節点のみが確率的に影響を及ぼし合うので、式１が成立する。すなわち、
　　　ｐ（ｖ｜Ｖ＼｛ｖ｝）＝ｐ（ｖ｜T）・・・（式１）、
　（ただし、ｐは確率を表す。「｜」は条件付き確率を表す）。

　たとえば、図８に例示された関連情報に関する確率モデルにて、節点２は、節点１、節点３、節点４、節点５、節点６、節点７、及び、節点「ＩＩ」に隣接している。節点２は、節点８、及び、節点９等の節点に隣接していない。この結果、マルコフ確率場であることを仮定する場合には、式２が成立する。すなわち、
　　　ｐ（２｜Ｖ＼｛２｝）＝ｐ（２｜ＩＩ，１，３，４，５，６，７）・・・（式２）。

　次に、図７に例示された関連情報を参照しながら、異常度、及び、異常度を算出する処理について詳細に説明する。

　モデル情報作成部１０４が図７に例示された関連情報を作成する場合に、破壊検出部１０７は、上述したように、該関連情報に含まれる枝が表す相関モデルが、それぞれ、ある期間における時系列データに関して成り立つか否かを判定する。

　説明の便宜上、破壊検出部１０７は、以下の９つの枝を含む相関モデルに関して、ある期間における時系列データに対して成り立たないと判定したとする。すなわち、
　　　節点３及び節点５間、
　　　節点３及び節点６間、
　　　節点６及び節点７間、
　　　節点２及び節点５間、
　　　節点５及び節点７間、
　　　節点２及び節点７間、
　　　節点８及び節点９間、
　　　節点１及び節点４間、
　　　節点１及び節点７間。

　この場合、破壊モデルである相関モデルを区別する（点線を用いて表す等）態様により、破壊検出部１０７は、図１０に例示されているような関連情報を作成してもよい。図１０は、関連情報の一例を概念的に表す図である。

　たとえば、関連情報における節点ｘに関する異常度Ａを、式３に従い算出することもできる。すなわち、
　　　（異常度Ａ）＝（ｘに接続している破壊モデルを表す枝数）÷（ｘに接続しているすべての枝数）・・・（式３）。

　すなわち、式３に例示した異常度Ａは、節点ｘに接続している枝のうち、破壊モデルを表す枝の割合を表している。たとえば、図１０における節点７に関する異常度は、式３に従い、約０．６６７（＝４÷６）と算出することができる。

　破壊検出部１０７は、たとえば、関連情報における節点に関する異常度を算出し、算出した異常度と、該節点を表す節点ＩＤ（時系列ＩＤ、または、測定項目（指標））とを関連付けすることにより、図１１に例示されているような異常度情報を作成する。図１１は、異常度情報の一例を概念的に表す図である。尚、図１１に例示された異常度情報における異常度は、図１０に例示された関連情報に基づき算出された異常度ではなく、説明の便宜上、設定された異常度である。

　異常度情報によって、節点ＩＤ（言い換えれば、時系列ＩＤ、または、測定項目（指標）等）と、該節点ＩＤが表す節点の異常度とは関連付けされている。たとえば、図１１に例示された異常度情報によって、節点ＩＤ「１」は、異常度「０．３３３３３３」に関連付けされている。これは、破壊検出部１０７が、節点ＩＤ「１」が表す節点に関して、たとえば、式３に従い算出する異常度が、「０．３３３３３３」であることを表す。

　次に、確率モデルにおける第２枝、第１枝、及び、第３枝に重みを付与する処理、及び、異常判定部１０９が、時系列データを測定するセンサ１２０に関して異常であるか否かを判定する処理について説明する。

　説明の便宜上、節点数はＮであるとする。また、節点ｉ（ただし、１≦ｉ≦Ｎ）に関する異常度をｘ_ｉと表し、節点ｉに関する状態をｙ_ｉと表すとする。すなわち、ｙ_ｉは、正常（たとえば、０）であるか、異常（たとえば、１）であるかを識別可能なラベルを表すとする。

　異常判定部１０９は、異常度がｘ_ｉ（ただし、１≦ｉ≦Ｎ）である場合に、たとえば、最も高い確率にて生じるｙ_ｉ（ただし、１≦ｉ≦Ｎ）を算出する。すなわち、異常判定部１０９は、事後確率ｐ（ｙ_１，ｙ_２，・・・，ｙ_Ｎ｜ｘ_１，ｘ_２，・・・，ｘ_Ｎ）を最大にするｙ_１，ｙ_２，・・・，ｙ_Ｎを算出する。

　ベイズの定理に従えば、ｐ（ｙ_１，ｙ_２，・・・，ｙ_Ｎ｜ｘ_１，ｘ_２，・・・，ｘ_Ｎ）を、式４に変形することができる。ただし、∝は、比例関係を表す。

　確率モデルがマルコフ確率場であることを仮定すると、図９に例示されているような確率モデルにおいて、各節点は、該節点に隣接している節点のみに確率的に影響を及ぼし合う。式４の最右辺の対数は、式５で与えられる。ただし、対数関数の底は、たとえば、ネイピア数である。

　εは、確率モデルにおける枝（エッジ）の集合を表す。

　異常判定部１０９は、式５に従い算出される値が最大である場合におけるｙ_１，ｙ_２，・・・，ｙ_Ｎを求める。尚、「式５×（－１）」は、エネルギー関数と呼ばれる。式５に対して、ｐ（ｘ_ｉ｜ｙ_ｉ）、及び、ｐ（ｙ_ｍ，ｙ_ｎ）を与えることにより、式５を最大にするｙ_１，ｙ_２，・・・，ｙ_Ｎは、重み付けされたグラフに関する最大流を求める問題に帰着させることができる。すなわち、式５を最大にするｙ_１，ｙ_２，・・・，ｙ_Ｎは、算出した重み付けされたグラフを２つに分離する場合に、カットする重みを最小にする最小カットを求める問題に帰着させることができる。

　この場合に、式５を最大にするｙ_１，ｙ_２，・・・，ｙ_Ｎを求める問題は、たとえば、図９に例示された確率モデルに基づき、節点Ｓから節点Ｄに至る最大流を求める問題に帰着される。すなわち、該問題は、切断される枝の重みを最小にしつつ、図９に例示されたグラフを２つに分離する最小カット問題に帰着される。この場合に、ｐ（ｘ_ｉ｜ｙ_ｉ）は、確率モデルにおける第２枝及び第３枝に関する重みに対応する。また、この場合に、ｐ（ｙ_ｍ，ｙ_ｎ）は、確率モデルにおける第１枝に関する重みに対応する。

　ここで、ｐ（ｘ_ｉ｜ｙ_ｉ）を規定する確率分布として、たとえば、式６に示された確率密度を用いて定義されるベータ分布や、式７に示された確率密度を用いて定義されるガンマ分布を用いることができる。

　ただし、Γはガンマ関数を表す。また、「／」は、除算を表す。また、ａ、ｂ、ｋ、及び、θは、定数を表す。

　すなわち、ｐ（ｘ_ｉ｜ｙ_ｉ）は、式６または式７におけるｘを異常度として設定した場合に算出される値である。たとえば、異常判定部１０９は、節点に関する異常度が大きな値である場合に、式６に従い算出される大きな値をｐ（ｘ_ｉ｜ｙ_ｉ）として設定してもよい。また、たとえば、異常判定部１０９は、節点に関する異常度が小さな値である場合に、式６に従い算出される小さな値をｐ（ｘ_ｉ｜ｙ_ｉ）として設定してもよい。

　以降、ｐ（ｘ_ｉ｜ｙ_ｉ）を第１程度と表すこともある。第１程度は、節点（時系列データ、センサ）が特定の状態である場合に、異常度が特定の値である程度（確率）を表す。すなわち、第１程度は、たとえば、節点（時系列データ、センサ）が正常である場合に、異常度が特定の値である程度（確率）を表す。また、第１程度は、たとえば、節点（時系列データ、センサ）が異常である場合に、異常度が特定の値である程度（確率）を表す。

　たとえば、式３に従い異常度を算出した場合に、異常度は、０以上１以下の値である。一方、ベータ分布に関する入力は、０以上１以下の値でなければならない。したがって、異常判定部１０９は、式３に従い異常度を算出する場合に、式６に示されたベータ分布に従いｐ（ｘ_ｉ｜ｙ_ｉ）を算出してもよい。また、異常度が、０以上１以下でない場合に、異常判定部１０９は、式７に示されたガンマ分布に従い、ｐ（ｘ_ｉ｜ｙ_ｉ）を算出してもよい。

　また、異常判定部１０９は、式６に従いｐ（ｘ_ｉ｜ｙ_ｉ）を算出する場合に、定数ａ、及び、定数ｂを、異常度の平均と、該異常度の分散とに基づき算出してもよい。異常判定部１０９は、式７に従いｐ（ｘ_ｉ｜ｙ_ｉ）を算出する場合に、最尤推定する手順に従い、定数ｋ、及び、定数θを算出してもよい。

　また、ｐ（ｙ_ｍ，ｙ_ｎ）を規定するモデルとして、式８に示されたイジング（Ｉｓｉｎｇ）モデルを用いることができる。

　ただし、ｅは、自然対数の底（ネイピア数）を表す。Ｗ_ｍ，ｎは、節点ｍと、節点ｎとが関係している程度を表す。

　尚、イジングモデルは、相互に隣接している複数の節点（たとえば、節点ｍと、節点ｎ）は、ｙ_ｍ及びｙ_ｎが同じ値になりやすいという性質を有する。

　式８に従い算出されるｐ（ｙ_ｍ，ｙ_ｎ）は、たとえば、相互に隣接している節点に関するｙ_ｍ及びｙ_ｎが同じであるのか、異なっているのかに応じて、算出される値である。たとえば、式８に関して、ｙ_ｍ及びｙ_ｎが同じ値である場合には、ｙ_ｍ及びｙ_ｎが異なる値である場合よりも高い値を算出する。

　以降、ｐ（ｙ_ｍ，ｙ_ｎ）を第２程度と表すこともある。すなわち、第２程度は、節点（時系列データ、センサ）が相互に関連する程度を表す。

　上述したように、異常判定部１０９は、図９に例示されているような確率モデルに含まれる枝の重みを算出し、算出した重み付きの確率モデルに、最大流問題を解くアルゴリズムを適用することにより、図１２に例示されているようなｙ_１，ｙ_２，・・・，ｙ_Ｎを求める。図１２は、異常判定部１０９が算出する判定情報を概念的に表す図である。

　尚、異常判定部１０９は、図９に例示された確率モデル（グラフ）を表示部１２２に表示してもよい。また、異常判定部１０９は、グラフに含まれる枝の近傍に、該枝に関する重みを表示する態様により、表示部１２２に該確率モデルを表示してもよい。

　図１２に例示された判定情報によって、節点ＩＤ「２」は、状態「正常」に関連付けされている。これは、上述した処理に従い、異常判定部１０９が節点ＩＤ「２」に関して算出された状態が正常であることを表す。節点ＩＤは、図１１に関する説明と同様に、時系列ＩＤ、測定項目、または、性能指標を識別可能な識別子を表す。

　システム監視装置１０１は、上述した処理を実行することにより、たとえば、相関破壊が集中している節点ＩＤ「７」に関する該時系列データを異常と判定する。また、システム監視装置１０１は、節点ＩＤ「５」に関して、監視対象１２１における異常とは無関係な相関破壊が起きている場合であっても異常とは判定しない。さらに、システム監視装置１０１は、上述したような式５を最大にするｙ_１，ｙ_２，・・・，ｙ_Ｎを求めることにより、正常であるか異常であるかを算出するので、なんら、正常及び異常を判定する閾値を設定していない。

　すなわち、本実施形態に係るシステム監視装置１０１によれば、監視対象１２１における異常とは無関係な相関破壊が起きる場合であっても、閾値を設定することなく異常箇所を特定することができる。この理由は、性能指標（節点）間に関する相関モデル（依存関係）を用いることにより、実際に生じている異常とは関係ない相関モデルの破壊が起きる場合であっても、隣接している性能指標に関する情報に基づき、破壊の影響を軽減することができるからである。また、この理由は、システム監視装置１０１が、式５に示されているような事後確率が最大である状態を算出することによって、正常または異常を判定する閾値がない場合であっても、確率的に最も妥当な状態を算出することができるからである。

　すなわち、本実施形態に係るシステム監視装置１０１によれば、監視対象における不具合の要因を特定することができる。

　この理由は、システム監視装置１０１が異常度と、複数のセンサ１２０間における関係性に基づき、センサ１２０の状態を算出するからである。

　＜第２の実施形態＞
　次に、上述した第１の実施形態における主要な機能を実現する本発明の第２の実施形態について説明する。

　以降の説明においては、本実施形態に係る特徴的な部分を中心に説明すると共に、上述した第１の実施形態と同様な構成については、同一の参照番号を付すことにより、重複する説明を省略する。

　図１３を参照しながら、第２の実施形態に係るシステム監視装置２０１が有する構成について説明する。図１３は、本発明の第２の実施形態に係るシステム監視装置２０１が有する構成を示すブロック図である。

　第２の実施形態に係るシステム監視装置２０１は、判定部２０２と、異常度算出部２０３と、第１程度算出部２０４と、第２程度算出部２０５と、状態算出部２０６とを有する。

　判定部２０２は、たとえば、監視対象が第１期間（たとえば、正常期間）に測定された複数セットの時系列データ（「第１時系列データ」と表す）間における関係性を表す相関モデルを受信する。さらに、判定部２０２は、受信した相関モデルに関連する時系列データに関して、第２期間（たとえば、監視期間）に測定された時系列データ（「第２時系列データ」と表す）を受信する。尚、セットは、ある種類の複数のセンサによって、ある期間に測定された時系列データも含む表現である。

　判定部２０２は、受信した第２時系列データに関して、受信した相関モデルを適用することにより、時系列データを推定し、受信した第２時系列データと、推定した時系列データとの誤差を算出する。

　この場合に、判定部２０２は、たとえば、図４に例示されているような相関モデル情報に基づき、相関モデルに関連付けされた時系列ＩＤを読み取り、図３に例示されているような時系列情報に基づき、読み取った時系列ＩＤに関連付けされた測定項目を抽出する。次に、判定部２０２は、抽出した測定項目（センサ１２０）が第２期間に測定する時系列データに、該相関モデルを適用することにより、時系列データを推定する。

　判定部２０２は、算出した誤差が所定の閾値以上であるか否かに基づき、受信した相関モデルが成り立っているか否かを判定する。たとえば、判定部２０２は、算出した誤差が所定の閾値以上である場合に、第２期間に測定された時系列データに関して、相関モデルが成り立っていないと判定する。また、判定部２０２は、算出した誤差が所定の閾値未満である場合に、第２期間に測定された時系列データに関して、相関モデルが成り立っていると判定する。

　たとえば、判定部２０２は、第１の実施形態に係るシステム監視装置１０１における、破壊検出部１０７を用いて実現することができる。

　次に、異常度算出部２０３は、受信した相関モデルの個数と、第２期間に測定された時系列データに関して成り立っていないと判定する相関モデルの個数とに基づき、第２時系列データが成り立っていない（異常である）関係性に関連する程度を表す異常度を算出する。

　たとえば、異常度算出部２０３は、第１の実施形態に係るシステム監視装置１０１における、異常算出部１０６によって実現することができる。

　次に、第１程度算出部２０４は、異常度算出部２０３が算出した異常度に基づき、第２時系列データが正常または異常である場合に、異常度算出部２０３が算出した異常度が特定の値である程度を表す第１程度を算出する。

　たとえば、第１程度算出部２０４は、第１の実施形態に係るシステム監視装置１０１における異常判定部１０９が、式６、または、式７に従いｐ（ｘ_ｉ｜ｙ_ｉ）の値を算出する処理によって、第１程度を算出する処理を実現することができる。

　次に、第２程度算出部２０５は、受信した相関モデルに基づき、該相関モデルに関連する第２時系列データ同士が関係する程度を表す第２程度を算出する。

　たとえば、第２程度算出部２０５は、第１の実施形態に係るシステム監視装置１０１における異常判定部１０９が、相関モデルに基づき、式８に従いｐ（ｙ_ｍ，ｙ_ｎ）の値を算出する処理によって、第２程度を算出する処理を実現することができる。

　次に、状態算出部２０６は、第１程度算出部２０４が算出した第１程度と、第２程度算出部２０５が算出した第２程度とに基づき、第１時系列データが正常あるか否かを算出する。

　たとえば、状態算出部２０６は、システム監視装置１０１における異常判定部１０９が、図９に例示されているような確率モデルに基づき、たとえば、最小カットを求める手順に従い、式５を最大にするｙ_１，ｙ_２，・・・，ｙ_Ｎを求める処理によって実現することができる。

　次に、第２の実施形態に係るシステム監視装置２０１に関する効果について説明する。

　本実施形態に係るシステム監視装置２０１によれば、監視対象における不具合の要因を特定することができる。

　この理由は、システム監視装置２０１が異常度と、複数のセンサ１２０間における関係性に基づき、センサ１２０の状態を算出するからである。

　（ハードウェア構成例）
　上述した本発明の各実施形態におけるシステム監視装置を、１つの計算処理装置（情報処理装置、コンピュータ）を用いて実現するハードウェア資源の構成例について説明する。但し、係るシステム監視装置は、物理的または機能的に少なくとも２つの計算処理装置を用いて実現してもよい。また、係るシステム監視装置は、専用の装置として実現してもよい。

　図１４は、第１の実施形態及び第２の実施形態に係るシステム監視装置を実現可能な計算処理装置のハードウェア構成例を概略的に示す図である。計算処理装置２０は、中央処理演算装置（Ｃｅｎｔｒａｌ＿Ｐｒｏｃｅｓｓｉｎｇ＿Ｕｎｉｔ、以降「ＣＰＵ」と表す）２１、メモリ２２、ディスク２３、及び、不揮発性記録媒体２４を有する。計算処理装置２０は、さらに、通信インターフェース（以降、「通信ＩＦ」と表す）２７、及び、ディスプレー２８を有する。計算処理装置２０は、入力装置２５、及び、出力装置２６に接続されていてもよい。計算処理装置２０は、通信ＩＦ２７を介して、他の計算処理装置、及び、通信装置と情報を送受信することができる。

　不揮発性記録媒体２４は、コンピュータが読み取り可能な、たとえば、コンパクトディスク（Ｃｏｍｐａｃｔ＿Ｄｉｓｃ）、デジタルバーサタイルディスク（Ｄｉｇｉｔａｌ＿Ｖｅｒｓａｔｉｌｅ＿Ｄｉｓｃ）である。また、不揮発性記録媒体２４は、ユニバーサルシリアルバスメモリ（ＵＳＢメモリ）、ソリッドステートドライブ（Ｓｏｌｉｄ＿Ｓｔａｔｅ＿Ｄｒｉｖｅ）等であってもよい。不揮発性記録媒体２４は、電源を供給しなくても係るプログラムを保持し、持ち運びを可能にする。不揮発性記録媒体２４は、上述した媒体に限定されない。また、不揮発性記録媒体２４の代わりに、通信ＩＦ２７を介して、通信ネットワークを介して係るプログラムを持ち運びしてもよい。

　すなわち、ＣＰＵ２１は、ディスク２３が記憶するソフトウェア・プログラム（コンピュータ・プログラム：以下、単に「プログラム」と称する）を、実行する際にメモリ２２にコピーし、演算処理を実行する。ＣＰＵ２１は、プログラム実行に必要なデータをメモリ２２から読み取る。表示が必要な場合には、ＣＰＵ２１は、ディスプレー２８に出力結果を表示する。外部への出力が必要な場合には、ＣＰＵ２１は、出力装置２６に出力結果を出力する。外部からプログラムを入力する場合、ＣＰＵ２１は、入力装置２５からプログラムを読み取る。ＣＰＵ２１は、上述した図２、または、図１３に示された各部が表す機能（処理）に対応するところのメモリ２２にあるシステム監視プログラム（図５、または、図６）を解釈し実行する。ＣＰＵ２１は、上述した本発明の各実施形態において説明した処理を順次行う。

　すなわち、このような場合、本発明は、係るシステム監視プログラムによっても成し得ると捉えることができる。更に、係るシステム監視プログラムが記録されたコンピュータ読み取り可能な不揮発性の記録媒体によっても、本発明は成し得ると捉えることができる。

　以上、上述した実施形態を模範的な例として本発明を説明した。しかし、本発明は、上述した実施形態には限定されない。すなわち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。

　この出願は、２０１５年２月２５日に出願された日本出願特願２０１５－０３４６３１を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　２０　　計算処理装置
　２１　　ＣＰＵ
　２２　　メモリ
　２３　　ディスク
　２４　　不揮発性記録媒体
　２５　　入力装置
　２６　　出力装置
　２７　　通信ＩＦ
　２８　　ディスプレー
　１０１　システム監視装置
　１０２　指標入力部
　１０３　情報作成部
　１０４　モデル情報作成部
　１０５　確率情報作成部
　１０６　異常算出部
　１０７　破壊検出部
　１０８　異常度算出部
　１０９　異常判定部
　１１０　異常箇所出力部
　１１１　記憶部
　１１２　時系列記憶部
　１１３　情報記憶部
　１１４　モデル情報記憶部
　１１５　確率情報記憶部
　１１６　異常記憶部
　１１７　破壊モデル記憶部
　１１８　異常度記憶部
　１１９　異常箇所記憶部
　１２０　センサ
　１２１　監視対象
　１２２　表示部
　２０１　システム監視装置
　２０２　判定部
　２０３　異常度算出部
　２０４　第１程度算出部
　２０５　第２程度算出部
　２０６　状態算出部

Claims

　監視対象に関して、第１期間に測定された複数セットの第１時系列データに成り立つ関係を表す関係性が、第２期間に測定された前記複数セットの第２時系列データについて成り立つか否かを判定する判定手段と、
　前記判定手段が成り立つと判定する前記関係性と、前記判定手段が成り立たないと判定する前記関係性とに基づき、前記第２時系列データが異常である程度を表す異常度を算出する異常度算出手段と、
　前記第２時系列データに関して算出された前記異常度に基づき、前記第２時系列データが正常または異常である場合において前記異常度が特定の値である程度を表す第１程度を算出する第１程度算出手段と、
　前記第１期間に関する前記関係性に基づき、前記複数セットの前記第２時系列データが関連している程度を表す第２程度を算出する第２程度算出手段と、
　前記第１程度と、前記第２程度とに基づき、前記第２時系列データが正常であるか異常であるかを求める状態算出手段と
　を備えるシステム監視装置。
　前記判定手段は、前記第２時系列データに前記関係性を適用することにより算出された値に関する誤差に基づき、前記関係性が成り立つか否かを判定する
　請求項１に記載のシステム監視装置。
　前記第２程度算出手段は、複数の前記第２時系列データが前記関係性に関連しているか否かに応じて、前記第２程度を算出する
　請求項１または請求項２に記載のシステム監視装置。
　前記第１程度算出手段は、前記異常度にベータ分布を適用することにより、前記第１程度を算出する
　請求項１乃至請求項３のいずれかに記載のシステム監視装置。
　前記第１程度算出手段は、前記異常度にガンマ分布を適用することにより、前記第１程度を算出する
　請求項１乃至請求項３のいずれかに記載のシステム監視装置。
　前記第２程度算出手段は、前記関係性に基づくイジングモデルに従い、前記第２程度を算出する
　請求項１乃至請求項５のいずれかに記載のシステム監視装置。
　前記状態算出手段は、前記第２時系列データを表す第１節点と、前記第１節点とは異なる第２節点と、前記第１節点及び前記第２節点とは異なる第３節点とを含む節点と、複数の前記第１節点の間を結ぶ第１枝と、前記第１節点及び前記第２節点を結ぶ第２枝と、前記第１節点及び前記第３節点とを結ぶ第３枝からなるグラフに関して、前記第１枝に関する重みを、前記第２程度に基づき算出し、前記第２枝及び前記第３枝に関する前記重みを、前記第１程度に基づき算出し、重み付けされた前記グラフを２つに分離する場合に切断される前記重みを最小にする最小カットを算出し、算出された結果に基づき、正常であるか否かを算出する
　請求項１乃至請求項６のいずれかに記載のシステム監視装置。
　前記グラフを表示可能な表示手段
　をさらに備え、
　前記状態算出手段は、重み付けされた前記グラフを前記表示手段に表示する
　請求項７に記載のシステム監視装置。
　監視対象に関して、第１期間に測定された複数セットの第１時系列データに成り立つ関係を表す関係性が、第２期間に測定された前記複数セットの第２時系列データについて成り立つか否かを判定し、
　成り立つと判定された前記関係性と、成り立たないと判定する前記関係性とに基づき、前記第２時系列データが異常である程度を表す異常度を算出し、
　前記第２時系列データに関して算出された前記異常度に基づき、前記第２時系列データが正常または異常である場合において前記異常度が特定の値である程度を表す第１程度を算出し、
　前記第１期間に関する前記関係性に基づき、前記複数セットの前記第２時系列データが関連する程度を表す第２程度を算出し、
　前記第１程度と、前記第２程度とに基づき、前記第２時系列データが正常であるか異常であるかを求めるシステム監視方法。
　監視対象に関して、第１期間に測定された複数セットの第１時系列データに成り立つ関係を表す関係性が、第２期間に測定された前記複数セットの第２時系列データについて成り立つか否かを判定する判定機能と、
　前記判定機能によって成り立つと判定された前記関係性と、前記判定機能によって成り立たないと判定された前記関係性とに基づき、前記第２時系列データが異常である程度を表す異常度を算出する異常度算出機能と、
　前記第２時系列データに関して算出された前記異常度に基づき、前記第２時系列データが正常または異常である場合において前記異常度が特定の値である程度を表す第１程度を算出する第１程度算出機能と、
　前記第１期間に関する前記関係性に基づき、前記複数セットの前記第２時系列データが関連している程度を表す第２程度を算出する第２程度算出機能と、
　前記第１程度と、前記第２程度とに基づき、前記第２時系列データが正常であるか異常であるかを求める状態算出機能と
　をコンピュータに実現させるシステム監視プログラムが記録された記録媒体。