以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(第1の実施の形態)
本発明の第1の実施の形態としてのシステム分析装置1の機能ブロック構成を図1に示す。図1において、システム分析装置1は、分析モデル取得部11と、標準寄与率取得部12と、状態情報収集部13と、モデル破壊検出部14と、異常要因抽出部15とを備える。また、異常要因抽出部15は、再予測値算出部151と、部分異常度算出部152と、異常統計値算出部153とを有する。また、システム分析装置1は、被監視システム9に接続される。
システム分析装置1は、被監視システム9を分析することにより、被監視システム9の異常要因を出力する装置である。なお、図1において、破線の矩形は、当該破線で囲まれた各機能ブロックが、分析モデル取得部11、標準寄与率取得部12および状態情報収集部13によって取得された情報を用いて動作することを表している。なお、図1において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。
被監視システム9は、システム分析装置1によって監視されるシステムである。被監視システム9は、1つ以上の被監視装置90を含む。例えば、被監視システム9の一例としては、発電プラントシステムが挙げられる。この場合、被監視装置90は、例えば、タービン、給水加熱器、復水器などである。また、被監視装置90には、例えば、配管や信号線など、装置間を接続する要素が含まれていてもよい。また、被監視システム9は、上述の発電プラントシステムのようにシステム全体であってもよいし、あるシステムにおいてその一部の機能を実現する部分であってもよい。
被監視装置90の各々は、自装置で得られるセンサ値を所定タイミング毎に計測し、システム分析装置1に送信する。以下では、通常の計測機器のようにハードウェアとしての実態があるものだけではなく、ソフトセンサや、制御信号等もセンサと呼ぶこととする。センサ値は、センサから得られる値である。センサ値の例としては、弁の開度、液面高さ、温度、流量、圧力、電流、電圧等、設備に設置された計測機器によって計測される計測値が挙げられる。また、センサ値の他の例としては、該計測値から算出される予測値が挙げられる。また、センサ値の他の例としては、制御信号の値が挙げられる。以下では、各センサ値は、整数や小数といった数値で表されるものとする。
また、本実施の形態では、各被監視装置90から得られるセンサ値に対応するセンサごとに、1つのデータ項目を割り当てるものとする。また、各被監視装置90から同一と見なされるタイミングで収集されたセンサ値の集合を、状態情報と呼ぶ。また、状態情報に含まれるセンサ値に対応するデータ項目の集合を、データ項目群と呼ぶ。つまり、状態情報は、複数のデータ項目によって構成される。ここで、「同一と見なされるタイミングで収集される」とは、各被監視装置90で同一時刻または所定範囲内の時刻に計測されることであってもよい。また、「同一と見なされるタイミングで収集される」とは、システム分析装置1による一連の収集処理によって収集されることであってもよい。なお、被監視装置90とシステム分析装置1との間に、被監視装置90が取得したセンサ値を記憶する記憶装置(図示せず)が設けられていてもよい。そのような記憶装置とは、例えば、データサーバ、DCS(Distributed Control System)、または、プロセスコンピュータ等であってもよい。そのような場合には、被監視装置90は、任意のタイミングでセンサ値を取得して記憶装置に記憶させる。そして、システム分析装置1は、記憶装置に記憶されているセンサ値を所定タイミングで読み出せばよい。
ここで、システム分析装置1は、図2に示すようなハードウェア要素を含むコンピュータ装置によって構成可能である。図2において、システム分析装置1は、CPU(Central Processing Unit)1001、メモリ1002、出力装置1003、入力装置1004、および、ネットワークインタフェース1005を含む。メモリ1002は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置(ハードディスク等)等によって構成される。出力装置1003は、ディスプレイ装置やプリンタ等のように、情報を出力する装置によって構成される。入力装置1004は、キーボードやマウス等のように、ユーザ操作の入力を受け付ける装置によって構成される。ネットワークインタフェース1005は、ネットワークに接続するインタフェースである。この場合、システム分析装置1の各機能ブロックは、メモリ1002に格納されるコンピュータ・プログラムを読み込んで実行するとともに出力装置1003、入力装置1004、ネットワークインタフェース1005を制御するCPU1001によって構成される。なお、システム分析装置1およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
次に、システム分析装置1の各機能ブロックの詳細について説明する。
分析モデル取得部11は、被監視システム9の分析モデルを取得する。分析モデルは、被監視システム9の状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを、1つ以上含むモデルである。ここで、相関モデルとは、データ項目間の関係を定義した回帰式と、該回帰式の予測誤差の許容範囲とを含む情報をいうものとする。また、多体相関モデルとは、そのような相関モデルのうち、3つ以上のデータ項目を用いて構成される回帰式を含む相関モデルをいうものとする。また、そのような分析モデルは、被監視システム9について得られた状態情報の時系列に基づき生成されたものであってもよい。
例えば、分析モデル取得部11は、メモリ1002に記憶された分析モデルを取得してもよい。また、分析モデル取得部11は、入力装置1004、ネットワークインタフェース1005、または、可搬型記録媒体等を介して、外部から入力される分析モデルを取得してもよい。
標準寄与率取得部12は、各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数として含まれる各データ項目が寄与する割合(標準寄与率)を取得する。例えば、標準寄与率は、分析モデルの生成に用いられた状態情報の時系列を用いてあらかじめ算出されたものであってもよい。なお、以降では、回帰式に説明変数として含まれるデータ項目を、説明変数データ項目とも記載する。また、回帰式に目的変数として含まれるデータ項目を、目的変数データ項目とも記載する。
例えば、標準寄与率取得部12は、各多体相関モデルについて、各説明変数データ項目の標準寄与率として、メモリ1002に記憶された情報を取得してもよい。また、標準寄与率取得部12は、入力装置1004、ネットワークインタフェース1005、または、可搬型記録媒体等を介して、外部から入力される標準寄与率を取得してもよい。
状態情報収集部13は、被監視システム9から状態情報を収集する。
モデル破壊検出部14は、収集された状態情報に対して分析モデルを適用することにより、各多体相関モデルにモデル破壊が発生したか否かを検出する。具体的には、モデル破壊検出部14は、収集された状態情報を構成するデータ項目のセンサ値を、分析モデルに含まれる各多体相関モデルの回帰式に適用する。ここで、状態情報の適用により多体相関モデルにモデル破壊が発生する場合がある。モデル破壊とは、その回帰式の予測値および実測値の差(予測誤差)が、その許容範囲を超える現象をいう。モデル破壊検出部14は、各多体相関モデルについて、状態情報の適用によりこのようなモデル破壊が発生したか否かを検出する。
異常要因抽出部15は、後述の再予測値算出部151と、後述の部分異常度算出部152と、後述の異常統計値算出部153とを用いて、データ項目別の異常統計値を算出する。また、異常要因抽出部15は、データ項目別の異常統計値に基づいて、被監視システム9の異常要因の候補となるデータ項目を抽出する。そして、異常要因抽出部15は、抽出したデータ項目を表す情報を通知する。例えば、異常要因抽出部15は、異常要因の候補となるデータ項目の名称を、出力装置1003等に出力してもよい。
ここで、異常要因の候補として抽出・通知するデータ項目の個数は、異常時に確認することが好ましいデータ項目の数として、運用者によって任意の数が設定されていてもよい。なお、障害の原因を見つけられる可能性を高め、障害全体の状況を把握するという観点からは、異常要因候補として抽出・通知するデータ項目の個数は、多いほど好ましい。また、誤報が発生したときの調査時間を短縮するという観点からは、抽出・通知するデータ項目の個数は、少ないほど好ましい。
再予測値算出部151は、モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、再予測値を算出する。再予測値の算出は、当該データ項目の状態情報および標準寄与率に基づいて行われる。ここで、再予測値により該当する多体相関モデルにモデル破壊が発生する場合と、発生しない場合とがある。
部分異常度算出部152は、各再予測値により多体相関モデルにモデル破壊が発生したか否かに基づいて、多体相関モデルごとにデータ項目別の異常度(部分異常度)を算出する。
例えば、この回帰式において、全ての説明変数データ項目による再予測値についてモデル破壊が発生したとする。この場合、部分異常度算出部152は、目的変数データ項目の部分異常度を、この回帰式における他のデータ項目の部分異常度より高くなるように算出してもよい。また、例えば、この回帰式において、少なくとも1つの再予測値ではモデル破壊が発生せず、少なくとも1つの再予測値ではモデル破壊が発生したとする。この場合、部分異常度算出部152は、再予測値によるモデル破壊を発生させた説明変数データ項目の部分異常度を、この回帰式における他のデータ項目の部分異常度より高くなるように算出してもよい。
異常統計値算出部153は、部分異常度をデータ項目別に集計して異常統計値を算出する。
以上のように構成されたシステム分析装置1の動作について、図面を参照して説明する。まず、システム分析装置1の動作の概略を図3に示す。なお、以下では、被監視システム9の分析モデルは、分析モデル取得部11によってあらかじめ取得されているものとする。また、その分析モデルに含まれる各多体相関モデルについて、その回帰式に含まれる各説明変数データ項目の標準寄与率は、標準寄与率取得部12によってあらかじめ取得されているものとする。
図3では、まず、状態情報収集部13は、被監視システム9から状態情報を収集する(ステップS1)。
次に、モデル破壊検出部14は、収集された状態情報を用いて、分析モデルに含まれる各多体相関モデルにモデル破壊が発生したか否かを検出する(ステップS2)。
モデル破壊の発生が検出された場合、異常要因抽出部15は、モデル破壊の発生状況に基づいて、異常要因の候補となるデータ項目を抽出し、出力する(ステップS3)。このステップの詳細については後述する。
以上の動作を、システム分析装置1は、運用終了まで(ステップS4でYes)継続する。
なお、ステップS4において、システム分析装置1は、入力装置1004からの入力に基づいて、運用終了するか否かの判断を行ってもよい。あるいは、システム分析装置1は、あらかじめ定められたタイミングであるか否かに基づいて、判断を行ってもよい。あるいは、システム分析装置1は、被監視システム9から得られる各種情報があらかじめ定められた条件を満たすか否かに基づいて、判断を行ってもよい。また、これに限らず、システム分析装置1は、ステップS4における判断処理を、その他の方法により行ってもよい。
次に、ステップS3における異常要因抽出動作の詳細を、図4に示す。
図4では、まず、システム分析装置1は、モデル破壊が発生した多体相関モデルごとに、ステップS11〜S13の動作を繰り返す。
ここでは、まず、再予測値算出部151は、この多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、再予測値を算出する(ステップS11)。再予測値の算出には、モデル破壊が発生した際に用いられた当該データ項目の状態情報と、当該データ項目の標準寄与率とが用いられる。
次に、部分異常度算出部152は、各再予測値について、再予測値でもこの多体相関モデルにモデル破壊が発生するか否かを評価する(ステップS12)。
具体的には、部分異常度算出部152は、各説明変数データ項目による再予測値と、モデル破壊が発生した際に用いられた状態情報における目的変数データ項目に対応するセンサ値との差が、その多体相関モデルの予測誤差の許容範囲内かどうか評価すればよい。
次に、部分異常度算出部152は、この多体相関モデルの回帰式において、各再予測値によるモデル破壊の発生状況に基づいて、目的変数データ項目の部分異常度と、説明変数データ項目の部分異常度とを算出する(ステップS13)。
モデル破壊が発生した全ての多体相関モデルの回帰式ごとにデータ項目別の部分異常度の算出を完了すると、異常統計値算出部153は、次のステップを実行する。すなわち、異常統計値算出部153は、各多体相関モデルの回帰式において算出した各データ項目の部分異常度を、全ての回帰式にわたってデータ項目別に集計する。そして、異常統計値算出部153は、集計により算出した統計値を、異常統計値とする(ステップS14)。
次に、異常要因抽出部15は、異常統計値に基づいて、被監視システム9の異常要因の候補となるデータ項目を抽出し、出力する(ステップS15)。例えば、異常要因抽出部15は、異常統計値の高い順に所定数までのデータ項目を出力してもよい。
以上で、システム分析装置1は、異常要因抽出動作を終了する。
次に、本発明の第1の実施の形態の効果について述べる。
本発明の第1の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出することができる。
その理由について説明する。
1つ目の理由は、本実施の形態では、分析モデルとして、被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを1つ以上含む分析モデルを用いるからである。このような分析モデルを用いることにより、本実施の形態は、多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、多体相関モデルのモデル破壊を再評価できる。その結果、本実施の形態は、どのデータ項目が異常なのかを、多体相関モデルの回帰式ごとに評価でき、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目を適切に切り分けることができる。このようにして、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。
2つ目の理由は、上述のような分析モデルは、1種類の目的変数に対して複数個の回帰式(多体相関モデル)を含み得るためである。このような分析モデルを用いることにより、本実施の形態は、異常検知精度を低下させるデータ項目がある場合にも対応可能となる。例えば、センサ値に含まれるセンサノイズが大きいデータ項目は、異常検知精度を低下させる。ここで、分析モデルに、あるデータ項目を目的変数として、異常検知精度を低下させるデータ項目が説明変数として含まれる回帰式が含まれるとする。このような場合でも、本実施の形態の分析モデルは、同じデータ項目を目的変数として、異常検知精度を低下させるデータ項目が説明変数として含まれない回帰式を含み得る。その結果、本実施の形態は、異常検知精度を低下させるデータ項目が回帰式に含まれることによる異常検知漏れを防ぐことができる。換言すると、分析モデルにおいて、1種類の目的変数に対する回帰式が1つに限られないため、本実施の形態は、異常によるセンサ値の変化が僅かであったとしても、異常検知漏れを防ぐことができる。さらに、1種類の目的変数に対する回帰式が1つに限られないため、ある回帰式が、その回帰式における目的変数としてのデータ項目が異常の影響を受けているかどうかの判断結果に寄与する割合が小さくなる。したがって、異常検知精度を低下させるデータ項目と同様に、異常要因の特定精度を低下させるデータ項目があったとしても、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目とを適切に切り分けることができる。このようにして、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。
3つ目の理由は、本実施の形態では、個々の回帰式における個々の説明変数データ項目について、標準寄与率を用いた再予測値に基づき部分異常度を算出し、さらに、部分異常度をデータ項目別に集計して異常統計値を算出するからである。このように、本実施の形態は、どのデータ項目が異常である可能性が高いかを多体相関モデルの回帰式ごとに評価した部分異常度を、さらに複数の多体相関モデルにわたって集計した異常統計値を用いる。その結果、本実施の形態は、回帰式単位で異常を検出する関連技術や、データ項目全体を1つのモデルに含めて監視する関連技術に比べて、異常要因の候補となるデータ項目をより精度よく抽出できる。
(第2の実施の形態)
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第2の実施の形態としてのシステム分析装置2の機能ブロック構成を図5に示す。図5において、システム分析装置2は、分析モデル取得部21と、標準寄与率取得部22と、状態情報収集部23と、モデル破壊検出部24と、異常要因抽出部25と、異常判定部29とを備える。また、分析モデル取得部21は、多体相関モデル生成部211およびモデル抽出部212を有する。また、異常要因抽出部25は、再予測値算出部251と、部分異常度算出部252と、異常統計値算出部253とを有する。また、システム分析装置2は、分析モデル記憶部201と、状態情報記憶部203と、モデル破壊情報記憶部204とを含む。なお、分析モデル記憶部201は、本発明の分析モデル取得部の一部の一実施形態を構成する。また、状態情報記憶部203は、本発明の状態情報収集部の一部の一実施形態を構成する。また、モデル破壊情報記憶部204は、本発明のモデル破壊検出部の一部の一実施形態を構成する。また、システム分析装置2は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図5において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置2およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置2およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
システム分析装置2は、被監視システム9の状態情報を所定タイミングで取得しながら、被監視システム9の分析モデルを構築し、構築した分析モデルを用いて被監視システム9の状態を分析する装置である。
状態情報収集部23は、被監視システム9の状態情報を所定タイミングで収集し、状態情報記憶部203に保存する。以下、状態情報の時系列データを、状態系列情報とも記載する。
状態情報記憶部203は、状態情報収集部23が収集した状態情報を時系列に沿って記憶する。換言すると、状態情報記憶部203は、状態情報収集部23によって収集された状態情報を、状態系列情報として記憶する。状態情報記憶部203は、例えば、収集時間を示す情報と、状態情報とを対応づけて記憶してもよい。状態情報は、より具体的には、収集されたセンサ値の集合である。例えば、状態情報は、収集対象とされたセンサ値が所定の順序で並んだ情報であってもよい。状態情報記憶部203は、少なくとも所定期間分の状態系列情報を記憶するための記憶領域を有する。
分析モデル取得部21は、多体相関モデル生成部211およびモデル抽出部212を用いて、状態情報記憶部203に記憶されている所定期間分の状態系列情報に基づいて、被監視システム9の分析モデルを生成する。分析モデル取得部21に含まれるこれらの各機能ブロックの詳細については後述する。生成される分析モデルは、1つ以上の多体相関モデルを含む。各多体相関モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを含む。換言すると、分析モデルは、1つ以上の多体相関モデルの集合である。また、分析モデル取得部21は、生成した分析モデルを、分析モデル記憶部201に保存する。
ここで、分析モデル取得部21によって分析モデルの生成に用いられる状態系列情報の所定期間としては、被監視システム9において障害が発生していない任意の期間が、運用者によって設定される。当該所定期間は、異常検知の感度を高めるという観点からは、被監視システム9の経年的な変化による影響を受けないように、できるだけ短い期間とすることが好ましい。例えば、被監視システム9のメンテナンスサイクルが1年だとすると、当該所定期間を、それより十分短い、1か月、1週間、1日などの期間としてもよい。なお、このとき、当該所定期間に、通常起こりうるシステムの状態変化の要因の中で、最も多くのセンサ値に大きな変化をもたらす要因によるセンサ値への影響が含まれることが好ましい。一方、当該所定期間は、被監視システム9の状態変化による誤検知を減らすという観点からは、主要な内的または外的要因によるセンサ値の変化を網羅的に含むように、できるだけ長い期間を用いることが好ましい。例えば、被監視システム9が季節の影響を強く受ける場合は、当該所定期間を、9か月、1年などの期間としてもよい。
分析モデル記憶部201は、分析モデル取得部21によって生成された分析モデルを表す分析モデル情報を記憶する。分析モデル情報は、例えば、分析モデルに含まれる各多体相関モデルについてのモデル情報の集合であってもよい。モデル情報は、例えば、当該多体相関モデルの識別子と、当該多体相関モデルの回帰式の情報と、該回帰式の予測誤差の許容範囲を示す情報とを含んでいてもよい。回帰式の情報は、例えば、目的変数に用いられるデータ項目の情報、説明変数に用いられるデータ項目の情報、およびデータ項目間の関係式の情報等を含んでいてもよい。また、モデル情報は、さらに回帰式の優良さを表す指標(優良度)を含んでいてもよい。
なお、モデル情報に含まれる必要がある情報は、後述の警報条件や、データ項目の異常度の算出方法等に依存する。ここで、警報条件とは、後述の異常判定部29により異常が通知される際の条件(警報条件)である。また、データ項目の異常度とは、後述の部分異常度算出部252により算出される部分異常度や、後述の異常統計値算出部253により算出される異常統計値などをいう。例えば、警報条件または異常度の算出手法が、回帰式の優良度にかかわるものであれば、モデル情報に、回帰式の優良度を含ませればよい。
標準寄与率取得部22は、状態情報記憶部203に記憶されている状態系列情報に基づいて、分析モデルに含まれる多体相関モデルの回帰式ごとに、各説明変数データ項目が予測値に寄与する割合(寄与率)の統計量を計算する。以降、寄与率の統計量を、標準寄与率という。ここで、標準寄与率として用いる統計量は、寄与率の平均的な値が得られる統計量であればよい。例えば、当該統計量は、寄与率の平均値または中央値であってもよい。また、例えば、当該統計量は、寄与率の数値ごとに所定の重みを付けた加重平均値、または、寄与率の数値ごとに所定の重みを付けた加重中央値等であってもよい。
ここで、標準寄与率の計算に用いる状態系列情報の期間としては、障害を含まない任意の期間が設定される。ここで、分析モデルによる分析結果との整合性を高くし、異常要因データ項目抽出時の解釈性を損なわないという観点を考える。このような観点からは、分析モデルの生成に用いられた所定期間の状態系列情報を、標準寄与率の計算に用いることが好ましい。分析モデルの生成に用いられた所定期間の状態系列情報を標準寄与率の計算に用いることは、設定すべきパラメータが少ないため、汎用性という観点からも好ましい。この場合、標準寄与率取得部22は、分析モデル取得部21による分析モデルの生成時に、標準寄与率を算出しておくことが可能である。
また、異常要因データ項目抽出の精度を高めるという観点を考える。このような観点からは、モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に近い値を持つ期間の状態系列情報を、標準寄与率の計算に用いることが好ましい。ここで、「近い値」とは、そのような目的変数に対応するデータ項目の値に対して近いことを示す所定条件を満たす値をいう。なお、モデル破壊は、後述のモデル破壊検出部24によって検出される。この場合、状態情報記憶部203に、そのような近い値を持つ状態情報が十分多く記憶されていることが前提となる。例えば、モデル破壊した多体相関モデルの目的変数に対応するデータ項目xの実測値が、モデル破壊した時刻でx1だったと仮定する。この場合、標準寄与率取得部22は、状態情報記憶部203に記憶されている状態情報のうち、そのデータ項目xの値がx1に近い値である期間の状態系列情報を抽出すればよい。そのような期間は、複数の期間であってもよい。また、抽出期間の長さは、運用者等によってあらかじめ定められているものとする。そして、標準寄与率取得部22は、抽出した期間の状態系列情報を用いて、モデル破壊した多体相関モデルにおける各説明変数データ項目の標準寄与率を算出する。この場合、標準寄与率取得部22は、後述のモデル破壊検出部24によるモデル破壊の検出時点より後に、標準寄与率を算出すればよい。
なお、標準寄与率の計算に用いられる状態系列情報は、連続している1つの期間から抽出される必要はない。この場合、標準寄与率の計算に用いられる状態情報の数は、システムごとに好適な数が、システム分析の結果に基づいて設定されていてもよい。例えば、標準寄与率の計算に用いられる状態情報の数は、あらかじめ設定された所定の数であってもよい。あるいは、標準寄与率の計算に用いられる状態情報の数は、モデル破壊の発生した多体相関モデルの回帰式ごとに、標準寄与率の計算に用いた期間の予測精度が、あらかじめ設定された範囲内におさまる状態情報の数であってもよい。
また、多体相関モデルに含まれるデータ項目間の関係性に軽微な変化が既に発生している状況で、発生したモデル破壊に対する異常要因データ項目抽出の精度低下を防ぐという観点を考える。このような観点からは、モデル破壊時刻を含まない直前の所定期間にわたる状態系列情報を、標準寄与率の計算に用いることが好ましい。この場合、直前の所定期間の長さは、あらかじめ設定されていてもよい。この場合も、標準寄与率取得部22は、後述のモデル破壊検出部24によるモデル破壊の検出時点より後に、標準寄与率を算出すればよい。
モデル破壊検出部24は、新たな状態情報が収集されると、分析モデルに含まれる各多体相関モデルについて、モデル破壊の発生の有無を検出する。前述のように、モデル破壊とは、多体相関モデルの回帰式の予測誤差が許容範囲を超える現象である。
本実施の形態では、このようなモデル破壊の発生を、その回帰式の目的変数とされたデータ項目に対応するセンサ値の変化に、通常変化とは無関係なセンサ値の変化による影響が含まれていることを示す指標として用いる。なお、通常変化とは、通常起こりうるシステムの状態変化に伴うセンサ値の変化をいう。
モデル破壊検出部24は、例えば、状態情報記憶部203に記憶されている最新の状態情報を含む状態系列情報と、分析モデルとを用いて、分析モデルに含まれる各多体相関モデルについてモデル破壊の発生の有無を検出する。具体的には、モデル破壊検出部24は、当該多体相関モデルの回帰式の目的変数に対する少なくとも最新の時刻における予測値を算出する。そして、モデル破壊検出部24は、算出した目的変数の予測値と、最新の状態情報に含まれる実際のセンサ値との差である予測誤差を算出する。そして、モデル破壊検出部24は、算出された予測誤差が許容範囲を満たしているか否かを判定することによって、モデル破壊の発生の有無を検出すればよい。そして、モデル破壊検出部24は、モデル破壊の検出結果を、モデル破壊情報として出力する。
モデル破壊情報は、分析モデルに含まれる各多体相関モデルのモデル破壊の状況を示す情報である。具体的には、モデル破壊情報は、モデル破壊が発生した多体相関モデルを特定可能な情報を含んでいてもよい。逆に、モデル破壊情報は、モデル破壊が発生しなかった多体相関モデルを特定可能な情報を含んでいてもよい。その他、モデル破壊情報は、モデル破壊が発生した(あるいは発生しなかった)多体相関モデルから得られる各種情報を含んでいてもよい。そのような情報は、例えば、該多体相関モデルの回帰式に含まれるデータ項目の情報や、算出された予測誤差等であってもよい。あるいは、モデル破壊情報は、これらの情報の組合せを含んでいてもよい。
なお、モデル破壊情報に含まれる必要がある情報は、警報条件やデータ項目の異常度の算出方法に依存する。例えば、警報条件またはデータ項目の異常度の算出方法が、モデル破壊の発生した多体相関モデルの数(モデル破壊数)にかかわるものであるとする。この場合、モデル破壊情報は、モデル破壊数を特定可能な情報を含んでいればよい。例えば、モデル破壊情報に、分析モデルに含まれる各多体相関モデルについてのモデル破壊の有無を表す情報が含まれていれば、モデル破壊数が特定可能となる。また、モデル破壊情報に、モデル破壊が発生した多体相関モデルの識別子の集合が含まれていれば、モデル破壊数が特定可能となる。
また、例えば、警報条件またはデータ項目の異常度の算出方法が、モデル破壊の発生した多体相関モデルの回帰式の優良度にかかわるものであるとする。この場合、モデル破壊情報は、モデル破壊が発生した多体相関モデルの回帰式の優良度を特定可能な情報を含んでいればよい。例えば、モデル破壊情報には、モデル破壊が発生した多体相関モデルの回帰式の優良度そのものが含まれていてもよい。あるいは、モデル破壊情報に、モデル破壊が発生した多体相関モデルの識別子の集合が含まれていれば、各識別子が示す多体相関モデルの回帰式の優良度が特定可能となる。
また、例えば、警報条件またはデータ項目の異常度の算出手法が、モデル破壊の発生した多体相関モデルの予測誤差にかかわるものであるとする。この場合、モデル破壊情報は、モデル破壊が発生した多体相関モデルの予測誤差を特定可能な情報を含んでいればよい。例えば、モデル破壊情報には、モデル破壊が発生した多体相関モデルの予測誤差そのものが含まれていてもよい。あるいは、モデル破壊情報に、モデル破壊が発生した多体相関モデルの識別子の集合が含まれていれば、各識別子が示す多体相関モデルの予測誤差が特定可能となる。
異常判定部29は、モデル破壊検出部24から出力されたモデル破壊情報を基に、分析モデルのモデル破壊の状況が警報条件を満たしているか否かを判定する。また、異常判定部29は、判定の結果、警報条件を満たしていれば、被監視システム9の状態を異常と判定し、判定結果を通知する。通知先は、例えば、出力装置1003または被監視システム9等であってもよい。また、例えば、異常判定部29は、警報条件を満たす場合に、モデル破壊検出部24から出力されたモデル破壊情報をモデル破壊情報記憶部204に保存してもよい。
警報条件には、例えば、以下の式(1)を用いることができる。
Na>Ta ・・・(1)
ここで、Naは、分析モデルに含まれる多体相関モデルのうちモデル破壊が発生した多体相関モデルの数を表す。また、Taは、許容されるモデル破壊の数である。例えば、Ta=3であったとする。このとき、分析モデルに含まれる多体相関モデルのうち、モデル破壊が発生した数が4以上であった場合、異常判定部29は、被監視システム9の状態が異常であると判定し、異常の発生を通知する。
モデル破壊情報記憶部204は、上述のモデル破壊情報を記憶する。さらに、モデル破壊情報記憶部204は、モデル破壊に関連する情報を記憶してもよい。モデル破壊に関連する情報とは、例えば、異常判定部29により異常と判定された際にモデル破壊を発生させた状態情報の計測時刻等であってもよい。
異常要因抽出部25は、異常判定部29によって被監視システム9の状態が異常と判定されると次のように動作するよう構成される。なお、上述したように、異常判定部29によってモデル破壊情報のモデル破壊情報記憶部204への登録が行われる場合、異常要因抽出部25は、モデル破壊情報記憶部204にモデル破壊情報が新たに追加されると動作するよう構成される。具体的には、異常要因抽出部25は、後述の再予測値算出部251と、後述の部分異常度算出部252と、後述の異常統計値算出部253とを用いて、データ項目別の異常統計値を算出する。異常要因抽出部25に含まれる各機能ブロックの構成の詳細については後述する。そして、異常要因抽出部25は、データ項目別の異常統計値がより高いものから順に、被監視システム9の異常要因の候補となるデータ項目を抽出する。例えば、異常要因抽出部25は、異常統計値が閾値以上のデータ項目を、異常要因の候補となるデータ項目として抽出してもよい。また、例えば、異常要因抽出部25は、異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出してもよい。
次に、分析モデル取得部21に含まれる多体相関モデル生成部211およびモデル抽出部212の構成の詳細について説明する。
多体相関モデル生成部211は、状態情報に含まれるデータ項目群のうち、任意の1つのデータ項目を目的変数として選出し、任意の2つ以上のデータ項目を説明変数として選出する。そして、多体相関モデル生成部211は、選出した目的変数および2つ以上の説明変数の全ての組合せについて、3つ以上のデータ項目を用いて構成される回帰式を構築する。また、多体相関モデル生成部211は、該回帰式の予測誤差の許容範囲を算出する。そして、多体相関モデル生成部211は、構築した回帰式と、該回帰式の予測誤差の許容範囲とを含む多体相関モデルを生成する。多体相関モデルの回帰式に含まれる説明変数としてのデータ項目の数は、センサノイズによる検知感度低下の防止や異常要因データ項目の絞り込みの容易さの観点からは、少ない方が好ましく、2つが最も好ましい。一方、システムの状態が変化しても高い予測精度を維持できるという観点からは、多体相関モデルの回帰式に含まれる説明変数データ項目の数は、多い方が好ましい。
多体相関モデル生成部211は、このような多体相関モデルの回帰式として、例えば、以下の式(2)に示されるような4つのデータ項目を用いて構成される回帰式を用いてもよい。
ここで、tは、状態情報のインデックスを表している。状態情報のインデックスtには、状態情報を古い順に並べたとき、古い方から新しい方に向かって、値が増える連番の整数が与えられる。また、x(t)は、状態情報のインデックスがtのときの、データ項目xの値を表している。また、式(2)において、1つ目の等号の左側にあるハット付きのu(t)は、目的変数に相当し、状態情報のインデックスがtのときのデータ項目uの予測値となる。また、2つ目の等号の右側にあるx(t)i、y(t)i、z(t)iは、説明変数に相当し、状態情報のインデックスがtのときのデータ項目x、y、zのセンサ値をi乗した値を表す。また、1番目の等号と2番目の等号との間にあるf(x、y、z)は、当該回帰式がx、y、zの3つのデータ項目を説明変数に用いた関数であることを表している。また、N、KおよびMは、任意の整数である。
また、多体相関モデル生成部211は、式(2)のパラメータとしてのa
i、b
i、c
i、d、K、N、Mを、当該回帰式の優良度Fが最大となるように決定する。回帰式の優良度Fには、例えば、以下の式(3)に示されるような、回帰式の予測精度を用いることができる。式(3)において、u(t)は、状態情報のインデックスがtのときの、データ項目uの値を表している。また、バー付きのuは、状態系列情報に含まれる所定期間中における目的変数の平均値を表す。なお、所定期間とは、これらのパラメータを決定するための学習期間であり、状態情報のインデックスがN0〜N1の間(N0≦N1)である。ここで、N0は、当該回帰式の構築に用いられた状態情報の最も古い時刻を示すインデックスを表す。また、N1は、当該回帰式の構築に用いられた状態情報の最も新しい時刻を示すインデックスを表す。
回帰式の優良さには、予測精度の高さと、汎化誤差の低さという2つの観点がある。上記式(3)の例は、予測精度の高さの観点から定めた優良度の例である。一方、汎化誤差の低さの観点から優良度を定めることも可能である。そのような場合には、例えば、回帰式の優良度Fは、情報量基準を用いて算出可能である。なお、回帰式の優良度は、これらの観点による算出手法を組合せたものであってもよい。
優良度Fが最大となるパラメータは、例えば、K,N,Mの組に対して優良度Fが最大となるようにai、bi、ci、d、を決定し、その後、優良度Fが最大となるK,N,Mの組を選択することで決定できる。本実施の形態では、パラメータai、bi、ci、d、を決定する方法として、部分最小二乗法(Partial Least Squares:PLS)を用いる。具体的には、まず、多体相関モデル生成部211は、K、N、Mの最大値をそれぞれ設定し、K、N、Mの値の組合せごとに回帰式を定式化する。そして、多体相関モデル生成部211は、それぞれの回帰式に対して、PLS回帰を用いて、パラメータai、bi、ci、d、を決定する。PLS回帰の成分数は、例えば、次のようにして決定できる。多体相関モデル生成部211は、PLS回帰の成分数を1から順に増やしたときに、分析モデルの生成に用いた状態系列情報に対する予測誤差の最大値が、減少から増加に転じる前までの成分数を決定すればよい。最後に、多体相関モデル生成部211は、回帰式ごとに、優良度Fを算出し、最大の優良度Fをもつ、回帰式のパラメータai、bi、ci、d、N、M、K、を選択すればよい。これにより、所望の回帰式が得られる。ここで、N,M,Kの最大値は、運用者によって任意に設定可能である。
なお、パラメータai、bi、ci、d、を決定する方法は、PLSに限らない。ここで、データ項目間の関係性が変化しないことを前提とする。この前提である限り、これらパラメータの決定方法には、各パラメータの値がセンサノイズの影響をあまり受けずにほぼ同じ値を安定的に得られる方法で、かつ、多体相関モデルの回帰式に寄与率の絶対値の小さい説明変数データ項目が含まれない方法を採用可能である。
なお、本実施の形態でPLSを利用する1つ目の理由は、多重共線現象(multicollinearity)が発生する場合でも、安定してパラメータを求めることができるためである。多重共線現象が発生する場合、最小二乗法では、真のセンサ値に重畳するノイズが僅か変化するだけでも、パラメータの値が大きく変化するため、安定してパラメータを求めることができない。システム内のセンサ値を使って回帰分析する場合、多重共線性現象が発生する可能性が高い。これはシステムを構成する機器などの要素が、他の要素と連動して動作することで、システムの構成要素から得られるセンサ値も同様に、他のセンサ値と連動して変化することが考えられるためである。
また、本実施の形態でPLSを利用する2つ目の理由は、潜在変数(PLS回帰の各成分)として、データ項目間の主成分を抽出するためである。この特長によって、寄与率の絶対値の小さい説明変数データ項目が含まれない回帰式を含む多体相関モデルを生成できる。
また、本実施の形態でPLSを利用する3つ目の理由は、回帰式を定式化した際のデータ項目数が、パラメータを決定した後でも変わらないためである。これによって、定式化の時点で、回帰式に含まれるデータ項目の数が3つ以上となることを確定できる。このため、後述のモデル抽出部212が、回帰式に含まれるデータ項目の数を確認する必要がなく、システム構成を簡便にできる。
このようにして、多体相関モデル生成部211は、状態情報に含まれるデータ項目群のうち任意の1つのデータ項目を目的変数とし、任意の2つ以上のデータ項目を説明変数とする全ての組合せについて、回帰式を構築する。
また、多体相関モデル生成部211は、構築した多体相関モデルの回帰式の予測誤差の許容範囲として、例えば、以下の式(4)および式(5)の両方が満たされる範囲を生成する。
ri≦T1 ・・・(4)
ri≧T2 ・・・(5)
ここで、T1は予測誤差に対する上限閾値である。また、T2は予測誤差に対する下限閾値である。また、riは当該多体相関モデルの回帰式を用いて算出される目的変数のi番目の時刻での予測誤差である。ここで、iは状態系列情報における時刻の識別子を表している。より具体的には、iは、ある基準時刻から該当する時刻までの状態情報を昇順または降順で並べたときの並び番号である。例えば、iは、監視開始からi番目の時刻を表すものとしてもよい。
また、多体相関モデル生成部211は、式(4)および式(5)における上限閾値T1および下限閾値T2を、例えば、次式(6)および次式(7)を用いて決定してもよい。
T1=max{|RN0|,・・・,|RN1|} ・・・(6)
T2=−T1 ・・・(7)
ここで、max{}は入力された数値の中から最大値を出力する関数である。また、|x|はxの絶対値を抽出する演算子である。また、Ri(i=N0〜N1)は、当該多体相関モデルの回帰式の構築に用いた状態系列情報から算出される目的変数のi番目の時刻の予測誤差を表している。また、N0は、該回帰式の構築に用いられた状態情報の最も古い時刻を示すインデックスを表す。また、N1は、該回帰式の構築に用いられた状態情報の最も新しい時刻を示すインデックスを表す。
つまり、式(6)では、許容範囲の上限値T1として、該回帰式の構築に用いられた状態系列情報の期間にわたって算出される予測誤差(以下、算出期間中の予測誤差という)の絶対値の最大値が適用されている。また、式(7)では、許容範囲の下限値T2として、同算出期間中の予測誤差の絶対値の最大値に−1をかけた値が適用されている。
式(6)および式(7)に限らず、多体相関モデル生成部211は、上述の算出期間中の予測誤差RN0〜RN1の平均値と標準偏差とを用いて、上限閾値T1および下限閾値T2を決定してもよい。例えば、多体相関モデル生成部211は、予測誤差の平均値に標準偏差の3倍を足した値を上限閾値T1としてもよい。また、この場合、多体相関モデル生成部211は、予測誤差の平均値から標準偏差の3倍を引いた値を下限閾値T2としてもよい。
このようにして、多体相関モデル生成部211は、状態情報に含まれるデータ項目群のうち任意の1つのデータ項目を目的変数とし、任意の2つ以上のデータ項目を説明変数とする全ての組合せについて構築した各回帰式について、予測誤差の許容範囲を決定する。そして、多体相関モデル生成部211は、各回帰式およびその予測誤差の許容範囲を含む多体相関モデル群を生成する。生成された多体相関モデル群は、分析モデルとして用いられる多体相関モデルの候補となる。
モデル抽出部212は、多体相関モデル生成部211が生成した多体相関モデル群の中から、分析モデルに用いる多体相関モデルを抽出する。例えば、モデル抽出部212は、多体相関モデル群の中から、その回帰式の優良度に基づいて、1つ以上の多体相関モデルを抽出してもよい。
具体的には、モデル抽出部212は、多体相関モデル生成部211によって生成される多体相関モデル群から、所定の優良モデル条件を満たす多体相関モデルを優良多体相関モデルとして抽出してもよい。そして、モデル抽出部212は、抽出した優良多体相関モデルの集合である優良多体相関モデル群を、分析モデルとしてもよい。また、モデル抽出部212は、抽出した各優良多体相関モデルのモデル情報を含む分析モデル情報を分析モデル記憶部201に記憶する。
例えば、モデル抽出部212は、優良モデル条件として、以下の式(8)を用いてもよい。なお、Fthは回帰式の優良度Fに対する閾値を表している。
F > Fth ・・・(8)
ここで、回帰式の優良度Fに対する閾値Fthは、運用者によって任意の値が設定可能である。異常検知の対象範囲を広げるという観点からは、閾値Fthは、低く設定されることが好ましい。一方、システムの状態変化等による誤検知を減らすという観点からは、閾値Fthは、高く設定されることが好ましい。例えば、優良度Fが0〜1の値を取るとする。この場合、誤検知を減らすという観点からは、閾値Fthは、例えば、0.7から1までの値が好ましい。
また、例えば、モデル抽出部212は、多体相関モデル群の中から、相互相関モデルの優良度に基づいて、1つ以上の多体相関モデルを抽出してもよい。ここで、相互相関モデルとは、2つのデータ項目を含む回帰式をいうものとする。
具体的には、まず、モデル抽出部212は、多体相関モデル生成部211による多体相関モデル群の生成処理と同様の手順で、データ項目のすべての組み合わせに対して相互相関モデルを生成する。そして、モデル抽出部212は、各相互相関モデルに対して回帰式の優良度Fを求める。次に、モデル抽出部212は、所定の優良モデル条件を満たす相互相関モデルである優良相互相関モデルを抽出する。例えば、モデル抽出部212は、優良モデル条件として、式(8)を用いてもよい。モデル抽出部212は、優良相互相関モデルに含まれるデータ項目を回帰式に含む多体相関モデル群を、優良多体相関モデル群として抽出してもよい。
また、例えば、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルが、多体相関モデル生成部211によって生成される多体相関モデル群に含まれる場合を想定する。この場合、モデル抽出部212は、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルの一部を、優良多体相関モデルとして抽出してもよい。例えば、モデル抽出部212は、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルのうちの1つを、優良多体相関モデルとして抽出してもよい。例えば、モデル抽出部212は、回帰式の優良度に基づいて、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデル群から、優良多体相関モデル群に含める多体相関モデルを抽出してもよい。この場合、回帰式の優良度としては、回帰式の優良度Fを用いてもよい。一例として、モデル抽出部212は、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルのうち、回帰式の優良度Fが最も高いものを、優良多体相関モデル群に含める多体相関モデルとして抽出してもよい。
次に、異常要因抽出部25に含まれる再予測値算出部251、部分異常度算出部252、異常統計値算出部253の構成の詳細について説明する。
再予測値算出部251は、モデル破壊情報記憶部204に新たに追加されたモデル破壊情報を参照し、モデル破壊が発生した各多体相関モデルについて、次の処理を行う。すなわち、再予測値算出部251は、モデル破壊が発生した各多体相関モデルの回帰式について、説明変数データ項目ごとに、当該データ項目の状態情報および標準寄与率に基づいて、当該回帰式の目的変数の予測値を再予測値として算出する。
例えば、再予測値算出部251は、再予測値の算出に、次式(9)を用いてもよい。式(9)では、再予測値は、1つのデータ項目にかかわる成分の値を、当該回帰式における当該データ項目の寄与率で割った値として得られる。
ここで、データ項目x
iは、当該多体相関モデルの回帰式rに含まれる説明変数データ項目を表す。また、ハット付きのu
kriは、説明変数データ項目x
iによる、目的変数データ項目u
kの再予測値を表す。また、g
rは、回帰式rのうち特定のデータ項目にかかわる成分の値を取り出す関数である。したがって、g
r(x
i)は、回帰式rのうち、データ項目x
iに関する成分の値を示す。また、q
riは、説明変数データ項目x
iの標準寄与率である。また、データ項目u
kを目的変数とする多体相関モデルの回帰式rは、g
rを用いて書きなおすと、次式(10)のように表すことができる。
ここで、ハット付きのukrは、当該多体相関モデルの回帰式rによるデータ項目ukの予測値である。また、cはデータ項目に依存しない定数項である。
再予測値算出部251による再予測値の具体的な計算方法について説明する。ここでは、式(2)に示した多体相関モデルの回帰式を例とする。また、異常判定部29により異常と判定された時刻に対応する状態情報のインデックスを、tとする。この場合、式(2)のデータ項目ごとの再予測値は、次式(11)、次式(12)、次式(13)のように表される。
ここで、x、y、zは、当該回帰式に含まれる説明変数データ項目を表す。また、ハット付きのux、uy、uzは、それぞれ説明変数データ項目x、y、zごとの再予測値である。また、qx、qy、qzは、説明変数データ項目x、y、zの標準寄与率である。
部分異常度算出部252は、第1のモデル破壊発生状況となった多体相関モデルと、第2のモデル破壊発生状況となった多体相関モデルとで、該多体相関モデルに含まれる各データ項目に対する部分異常度の割り当て方を変更する。ここで、第1のモデル破壊発生状況とは、その多体相関モデルにおいて各説明変数データ項目についての再予測値が全てモデル破壊となった場合をいうものとする。また、第2のモデル破壊発生状況とは、その多体相関モデルにおいて各説明変数データ項目についての再予測値の少なくとも1つがモデル破壊とならず少なくとも1つがモデル破壊となった場合をいうものとする。
具体的には、部分異常度算出部252は、第1のモデル破壊発生状況となった多体相関モデルにおいて、次のように部分異常度を割り当てる。この場合、部分異常度算出部252は、目的変数データ項目の部分異常度が、説明変数データ項目の部分異常度より高くなるよう各部分異常度の数値を割り当てる。割り当てる部分異常度は、本実施の形態では、2値であるものとする。例えば、この場合、部分異常度算出部252は、目的変数データ項目の部分異常度に1を割り当てる。また、部分異常度算出部252は、説明変数データ項目の部分異常度に0を割り当てる。
また、部分異常度算出部252は、第2のモデル破壊発生状況となった多体相関モデルにおいて、次のように部分異常度を割り当てる。この場合、部分異常度算出部252は、再予測値がモデル破壊となった説明変数データ項目の部分異常度が、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数データ項目の部分異常度より高くなるよう、部分異常度の数値を割り当てる。例えば、部分異常度算出部252は、再予測値がモデル破壊となった説明変数のデータ項目の部分異常度に1を割り当てる。また、部分異常度算出部252は、目的変数のデータ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てる。
異常統計値算出部253は、部分異常度算出部252から得られる部分異常度を、モデル破壊を検出した全ての多体相関モデルにわたって集計する。これにより、データ項目別の異常度の統計値である異常統計値が算出される。本実施の形態では、当該統計値として、平均値を用いるものとする。ただし、異常統計値に用いる統計量は、平均値に限らず、その他の統計量であってもよい。本実施の形態では、異常統計値算出部253は、異常統計値がより高いほど、異常要因である可能性が高いとみなす。
異常統計値に用いる統計量の他の例としては、累積和や、中央値等がある。以降、特段の説明がない場合は、異常統計値は高ければ高いほど、そのデータ項目が異常であることを示すこととする。
以上のように構成されたシステム分析装置2の動作について、図面を参照して説明する。なお、以下の動作の説明では、標準寄与率は、分析モデルの生成に用いられた所定期間の状態系列情報を用いて算出されるものとする。
まず、システム分析装置2の動作の一例の概略を図6に示す。
図6では、まず、状態情報収集部23は、被監視システム9から状態情報を収集し、状態情報記憶部203に記憶する(ステップS101)。
なお、状態情報収集部23は、運用を終了するという判断(ステップS110でYes)が与えられるまで、ステップS101の動作を繰り返す。また、状態情報収集部23は、ステップS102〜ステップS109の動作が行われている間も、所定周期毎に状態情報を収集し、状態情報記憶部203に記憶する動作を行う。
ここで、現在のタイミングが分析モデルを生成するタイミングでない場合(ステップS102でNo)、システム分析装置2の動作は、ステップS105に進む。
一方、現在のタイミングが分析モデルを生成するタイミングである場合について説明する(ステップS102でYes)。
この場合、分析モデル取得部21は、分析モデルの生成に用いる所定期間の状態系列情報を、状態情報記憶部203から取得する。そして、分析モデル取得部21は、取得した状態系列情報を用いて、分析モデルを生成する(ステップS103)。このステップの詳細については後述する。
そして、標準寄与率取得部22は、分析モデルの生成に用いられた所定期間の状態系列情報を用いて、分析モデルに含まれる各多体相関モデルの回帰式において、各説明変数データ項目の標準寄与率を算出する(ステップS104)。
次に、現在の分析モデルを用いて対象システムを監視するという判断が与えられなければ(ステップS105でNo)、システム分析装置2は、ステップS101からの動作を繰り返す。
一方、現在の分析モデルを用いて対象システムを監視するという判断が与えられた場合(ステップS105でYes)について説明する。この場合、モデル破壊検出部24は、状態情報収集部23により新たに収集された状態情報を用いて、分析モデル記憶部201に記憶されている分析モデル情報によって示される分析モデルについて、モデル破壊の発生を検出する(ステップS106)。
前述のように、モデル破壊検出部24は、分析モデルに含まれる各多体相関モデルについて、新たに収集された状態情報を適用した場合の予測誤差がその許容範囲を超えているか否かを判断すればよい。そして、モデル破壊検出部24は、各多体相関モデルのモデル破壊評価結果を示すモデル破壊情報を生成する。
次に、異常判定部29は、モデル破壊検出部24から得られるモデル破壊情報に基づいて、モデル破壊の状況が警報条件を満たしているか否かを判定する(ステップS107)。
ここで、モデル破壊の状況が警報条件を満たしていれば(ステップS107でYes)、異常判定部29は、判定結果を通知する(ステップS108)。このとき、異常判定部29は、モデル破壊の状況を示すモデル破壊情報を併せて通知してもよい。また、このとき、異常判定部29は、該当するモデル破壊情報を、モデル破壊情報記憶部204に記憶する。そして、システム分析装置2の動作は、ステップS109に進む。
一方、モデル破壊の状況が警報条件を満たしていなければ(ステップS107でNo)、異常判定部29は、システムに異常は検知されなかったとして特に何もせず、ステップS101からの動作を繰り返す。
次に、システム分析装置2は、モデル破壊情報記憶部204に新たに記憶されたモデル破壊情報に基づいて、1つ以上の異常要因候補データ項目を抽出し、抽出した異常要因候補データ項目群を示す情報を通知する(ステップS109)。このステップの詳細については後述する。
システム分析装置2は、運用を終了するという判断(ステップS110でYes)が与えられるまで、上記の動作を繰り返す。
なお、ステップS102、S105およびS110において、システム分析装置2は、入力装置1004からの入力に基づいて、該当する判断を行ってもよい。あるいは、システム分析装置2は、あらかじめ定められたタイミングであるか否かに基づいて、該当する判断を行ってもよい。あるいは、システム分析装置2は、被監視システム9から得られる各種情報があらかじめ定められた条件を満たすか否かに基づいて、該当する判断を行ってもよい。また、これに限らず、システム分析装置2は、これらのステップにおける判断処理を、その他の方法により行ってもよい。
次に、ステップS103における分析モデル生成動作の一例の詳細を、図7に示す。
図7では、まず、多体相関モデル生成部211は、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶部203から取得する(ステップS201)。
次に、多体相関モデル生成部211は、取得した状態系列情報を用いて、分析モデルの候補である多体相関モデル群を生成する(ステップS202)。
ここでは、前述のように、多体相関モデル生成部211は、データ項目群から任意の1つのデータ項目を目的変数として選出し、目的変数とは異なる任意の2つ以上のデータ項目を、説明変数として選出する。なお、説明変数として選出するデータ項目数は、2つ以上の数があらかじめ定められている。そして、多体相関モデル生成部211は、目的変数および説明変数の全ての組合せについて、目的変数データ項目と説明変数データ項目とを用いた回帰式を構築する。また、多体相関モデル生成部211は、構築した各回帰式について、その予測誤差の許容範囲を算出する。そして、多体相関モデル生成部211は、回帰式および予測誤差の許容範囲を含む多体相関モデルを生成すればよい。これにより、多体相関モデル群が生成される。
次に、モデル抽出部212は、生成された多体相関モデル群から、所定の優良モデル条件に基づいて、優良多体相関モデル群を抽出する(ステップS203)。
次に、モデル抽出部212は、得られた優良多体相関モデル群を表す分析モデル情報を、分析モデル記憶部201に記憶する(ステップS204)。
以上で、システム分析装置2は、分析モデル生成動作を終了する。
次に、図6のステップS109における異常要因抽出動作の詳細を、図8に示す。
ここでは、システム分析装置2は、モデル破壊が発生した多体相関モデルの回帰式ごとに、ステップS301〜S308の処理を繰り返す。
まず、再予測値算出部251は、モデル破壊情報記憶部204からモデル破壊情報と、状態情報記憶部203から、異常判定部29により異常と判定された時点の状態情報とを取得する。そして、再予測値算出部251は、モデル破壊が発生したこの多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、再予測値を計算する(ステップS301)。
次に、部分異常度算出部252は、再予測値算出部251によって算出された再予測値ごとに、再予測値とセンサ値との差が、その多体相関モデルの予測誤差の許容範囲内かどうか評価する。つまり、部分異常度算出部252は、再予測値ごとに、再予測値でもモデル破壊が発生するか否かを評価する(ステップS302)。
ここで、この多体相関モデルの回帰式において、全ての再予測値でモデル破壊が発生している場合(第1のモデル破壊発生状況)について説明する(ステップS303でYes)。この場合、部分異常度算出部252は、目的変数データ項目の部分異常度に1を割り当てる(ステップS304)。また、さらに、部分異常度算出部252は、全ての説明変数データ項目の部分異常度に0を割り当てる(ステップS305)。
一方、この多体相関モデルの回帰式において、モデル破壊が発生しない再予測値が少なくとも1つあり、モデル破壊が発生した再予測値が少なくとも1つある場合(第2のモデル破壊発生状況)について説明する(ステップS303でNo)。この場合、部分異常度算出部252は、目的変数データ項目の部分異常度に0を割り当てる(ステップS306)。また、さらに、部分異常度算出部252は、モデル破壊が発生した再予測値の計算に用いた説明変数データ項目の部分異常度に1を割り当てる(ステップS307)。また、さらに、部分異常度算出部252は、モデル破壊が発生しなかった再予測値の計算に用いた説明変数データ項目の部分異常度に0を割り当てる(ステップS308)。
モデル破壊が発生した全ての多体相関モデルの回帰式ごとにデータ項目別の部分異常度の算出を完了すると、システム分析装置2の動作は、ステップS309に進む。
ステップS309では、異常統計値算出部253は、部分異常度算出部252から取得した部分異常度を全ての当該回帰式にわたってデータ項目ごとに集計し、異常統計値を算出する(ステップS309)。
次に、異常要因抽出部25は、各データ項目の異常統計値に基づいて、異常要因の候補となるデータ項目を抽出し、通知する(ステップS310)。例えば、前述のように、異常要因抽出部25は、異常統計値が閾値より高いものを抽出し、異常要因候補として通知してもよい。また、例えば、異常要因抽出部25は、異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出し通知してもよい。
以上で、システム分析装置2は、異常要因抽出動作を終了する。
次に、具体例を用いて本実施の形態を説明する。
まず、本実施の形態における分析モデル生成動作について、具体例を示す。
ここでは、多体相関モデルの回帰式の優良度Fに予測精度を用いるものとする。また、多体相関モデルに対する優良モデル条件を「F>0.6」とする。また、説明変数に含まれるデータ項目の数を2とする。
図9は、本実施の形態における分析モデル生成動作を説明するための図である。図9において、符号9aは、多体相関モデル生成部211によって生成された多体相関モデル群を示している。また、符号9bは、多体相関モデルに対する優良モデル条件を示している。また、符号9cは、モデル抽出部212によって抽出され、分析モデルとなった優良多体相関モデル群を示している。なお、多体相関モデルには、回帰式の予測誤差の許容範囲も含まれるが、回帰式の予測誤差の許容範囲は優良多体相関モデルの抽出には利用されないため、図示を省略している。以下、他の説明においても、説明に利用されない値を図から省略することがある。
この具体例では、まず、多体相関モデル生成部211は、状態情報記憶部203から状態系列情報を取得し、多体相関モデル群9aを生成する。多体相関モデル群9aは、12個の多体相関モデルで構成されている。また、多体相関モデル群9aの生成に用いられた状態系列情報に含まれるデータ項目群は、データ項目u1、データ項目u2、データ項目u3およびデータ項目u4からなる。多体相関モデル群9aを構成する12個の多体相関モデルの回帰式は、それぞれu1=f123(u2,u3)、u1=f134(u3,u4)、u1=f124(u2,u4)、u2=f213(u1,u3)、u2=f214(u1,u4)、u2=f234(u3,u4)、u3=f312(u1,u2)、u3=f314(u1,u4)、u3=f324(u2,u4)、u4=f412(u1,u2)、u4=f413(u1,u3)、u4=f423(u2,u3)である。ここで、fj()は、カッコ内に含まれる説明変数データ項目から、左辺に示す目的変数データ項目の予測値を算出するための関数である。なお、jは、回帰式を識別するための識別子である。そのような関数の説明変数には、カッコ内に含まれるデータ項目について、状態情報記憶部203に記憶されている状態系列情報に含まれる該データ項目の値(センサ値)が適用される。なお、説明変数としては、データ項目の値そのものに限らず、該データ項目を用いて算出される変換値が適用されてもよい。
次に、モデル抽出部212は、多体相関モデル群9aから、優良モデル条件9bを満たす優良多体相関モデルを抽出し、分析モデルである優良多体相関モデル群9cを得る。本例の優良モデル条件9bは、図9に示されるように「回帰式の優良度F>0.6」である。そこで、モデル抽出部212は、多体相関モデル群9aを構成する12個の多体相関モデルのうち、回帰式の優良度Fが0.6を超える多体相関モデルを、優良多体相関モデルとして抽出する。本例では、以下の9つの回帰式、u1=f134(u3,u4)、u1=f124(u2,u4)、u2=f214(u1,u4)、u2=f234(u3,u4)、u3=f314(u1,u4)、u3=f324(u2,u4)、u4=f412(u1,u2)、u4=f413(u1,u3)、u4=f423(u2,u3)にかかわる多体相関モデルが抽出されたものとする。このようにして、9つの多体相関モデルから構成される優良多体相関モデル群9cが、分析モデルとして生成された。
次に、本実施の形態における異常要因抽出動作について、具体例を示す。
なお、以下に示す具体例では、異常の影響はデータ項目u2およびデータ項目u3に現れているものとした。
図10は、本実施の形態における異常要因抽出動作の具体例を説明するための図である。図10において、データセット10aは、分析モデルに含まれる上述の9つの多体相関モデルについて、再予測値の予測誤差と、再予測値によるモデル破壊評価結果と、部分異常度とを示している。また、データセット10bは、データ項目ごとの異常統計値を示している。図10のデータセット10aにおいて、「モデル破壊」の列には、モデル破壊の評価結果が示されている。この列では、モデル破壊となった回帰式には「○」印がついている。また、「説明変数データ項目による再予測値に対する予測誤差」の「第1」、「第2」の列には、第1説明変数データ項目および第2説明変数データ項目について算出された再予測値に対する予測誤差の数値が示されている。ただし、該当する多体相関モデルがモデル破壊とならなかったために計算が不要であった項目には、「−」が記されている。ここでは、説明の便宜上、関数fj()の説明変数データ項目を、括弧内の左から順に、第1説明変数データ項目、第2説明変数データ項目と呼ぶ。また、「説明変数データ項目によるモデル破壊評価結果」の「第1」、「第2」の列には、各再予測値によるモデル破壊の有無が示されている。この列では、再予測値によりモデル破壊となった回帰式には「○」印がついている。また、「部分異常度」の列には、0または1の部分異常度が示されている。ただし、該当する多体相関モデルが相関破壊とならなかったために計算が不要であった項目には、「−」が記されている。
例えば、u1=f134(u3,u4)を回帰式として含む多体相関モデルは、モデル破壊とならなかったために、「モデル破壊」の列に「○」印がついていない。したがって、u1=f134(u3,u4)に対応する「説明変数データ項目による再予測値に対する予測誤差」、「部分異常度」の箇所には、「−」が記されている。
また、例えば、u1=f124(u2,u4)を回帰式として含む多体相関モデルは、モデル破壊となったために、「モデル破壊」の列に「○」印がついている。そこで、再予測値算出部251は、このu1=f124(u2,u4)について、「説明変数データ項目による再予測値に対する予測誤差」の「第1」、「第2」の列に示す再予測値を算出している。ここで、この多体相関モデルについて、第1説明変数データ項目による再予測値に対する予測誤差が、その許容範囲から外れている。また、第2説明変数データ項目による再予測値に対する予測誤差は、その許容範囲から外れていない。つまり、少なくとも1つの再予測値に関してモデル破壊が発生しておらず、少なくとも1つの再予測値に関してモデル破壊が発生しており、第2のモデル破壊発生状況となっている。そこで、部分異常度算出部252は、部分異常度として、再予測値がモデル破壊となった第1説明変数データ項目u2に、1を割り当てている。また、部分異常度算出部252は、部分異常度として、その他の説明変数データ項目u1および目的変数データ項目u4には、0を割り当てている。
また、u2=f214(u1,u4)を回帰式として含む多体相関モデルも、モデル破壊となったために、「モデル破壊」の列に「○」印がついている。そこで、再予測値算出部251は、このu2=f214(u1,u4)について、「説明変数データ項目による再予測値に対する予測誤差」の「第1」、「第2」の列に示す再予測値を算出している。また、この多体相関モデルでは、第1説明変数データ項目による再予測値に対する予測誤差と、第2説明変数データ項目による再予測値に対する予測誤差との両方が、その許容範囲から外れている。つまり、全ての再予測値によりモデル破壊が発生しており、第1のモデル破壊発生状況となっている。そこで、部分異常度算出部252は、部分異常度として、目的変数データ項目u2に、1を割り当てている。また、部分異常度算出部252は、部分異常度として、全ての説明変数データ項目u1およびu4に、0を割り当てている。
このようにして、データセット10aに示すように、他の多体相関モデルに含まれるデータ項目についても、部分異常度が算出されたとする。
次に、異常統計値算出部253は、図10のデータセット10bに示すように、異常統計値を算出する。データセット10bに示す異常統計値は、データセット10aに示した部分異常度がデータ項目別に集計された平均値である。異常統計値算出部253は、データ項目別に部分異常度が数値であるものを対象として、それらの平均値を計算している。例えば、データ項目u2については、4つの多体相関モデルにおいて部分異常度1が割り当てられ、1つの多体相関モデルにおいて部分異常度0が割り当てられている。したがって、異常統計値算出部253は、データ項目u2の異常統計値として、約0.67を計算する。同様に、異常統計値算出部253は、他のデータ項目についても、データセット10bに示すように、異常統計値を算出する。この例では、異常の影響が現れたデータ項目u2およびデータ項目u3については、高い異常統計値が得られていることが確認された。一方で、異常の影響が現れていないデータ項目u1やu4については、低い異常統計値が得られていることが確認された。
このように、本具体例は、異常の影響が現れたデータ項目と、異常の影響が現れていないデータ項目とを、明確に区別可能な異常統計値を算出している。
次に、異常要因抽出部25は、例えば、異常統計値に閾値を設定し、閾値より異常統計値が高いデータ項目を、異常要因の候補として抽出し出力すればよい。これにより、本具体例は、異常統計値のより高いものに注目させるような通知を行うことができる。
次に、本発明の第2の実施の形態の効果について述べる。
本発明の第2の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出することができる。
その理由を5つ述べる。
1つ目の理由は、分析モデル取得部が、分析モデルとして多体相関モデルを生成しているからである。この結果、本実施の形態は、多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、多体相関モデルのモデル破壊を再評価できる。これにより、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目とを、より適切に切り分けることができる。換言すると、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。
2つ目の理由は、多体相関モデル生成部が、多体相関モデルの回帰式に含まれるデータ項目が少数となるように回帰式を構成し得るからである。この結果、本実施の形態は、データ項目のセンサ値に含まれるノイズが予測値に重畳する量を、回帰式に含まれるデータ項目が多い場合に比べて減らすことができる。これにより、本実施の形態は、異常検知精度の高い多体相関モデルを構成でき、異常検知漏れを防ぐことができる。換言すると、本実施の形態は、異常によるセンサ値の変化が僅かであっても、異常要因特定に有用な情報を的確に抽出できる。
3つ目の理由は、多体相関モデル生成部が、分析モデルとして、1種類の目的変数に対して複数個の回帰式を構築し得るためである。この結果、本実施の形態は、異常検知精度を低下させるデータ項目があったとしても、ある1種類の目的変数データ項目を予測する回帰式に対して、その異常検知精度を低下させるデータ項目を含まない回帰式を構築できる可能性がある。なお、異常検知精度を低下させるデータ項目とは、センサ値に含まれるセンサノイズが大きなデータ項目などである。これにより、本実施の形態は、異常検知精度を低下させるデータ項目が回帰式に含まれることによる異常検知漏れを防ぐことができる。換言すると、本実施の形態は、1種類の目的変数に対して構築される回帰式が1つに限られないため、異常によるセンサ値の変化が僅かであったとしても、異常検知漏れを防ぐことができる。さらに、1種類の目的変数に対する回帰式が1つに限られないため、ある回帰式が、その回帰式における目的変数としてのデータ項目が異常の影響を受けているかどうかの判断結果に寄与する割合が小さくなる。したがって、異常検知精度を低下させるデータ項目と同様に、異常要因の特定精度を低下させるデータ項目があったとしても、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目とを適切に切り分けることができる。このようにして、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。
4つ目の理由は、再予測値算出部および部分異常度算出部が、個々の回帰式における個々の説明変数データ項目について、標準寄与率を用いた再予測値によるモデル破壊の発生状況に基づいて部分異常度を算出するからである。そして、異常統計値算出部が、この部分異常度をデータ項目別に集計して異常統計値を算出するからである。これにより、本実施の形態は、どのデータ項目が異常なのかを多体相関モデルの回帰式ごとに評価した上で、それを集計することができる。その結果、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目を適切に切り分けることができる。換言すると、本実施の形態は、異常によるセンサ値の変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出できる。
5つ目の理由は、多体相関モデル生成部が、多体相関モデルの回帰式に寄与率の絶対値の小さい説明変数データ項目が含まれないように、多体相関モデルの回帰式のパラメータを決定するからである。これにより、本実施の形態は、個々の回帰式における個々の説明変数データ項目の標準寄与率に基づいて、目的変数の再予測値を安定的に算出することができる。また、これにより、上述の4つ目の理由を確実にする。
なお、本実施の形態において、多体相関モデルの回帰式の例として、目的変数および説明変数にデータ項目の値を用いる例を中心に説明した。これに限らず、各回帰式において、目的変数および説明変数には、データ項目の値を数値変換したものを用いてもよい。なお、データ項目の値を数値変換したものの例としては、階差、べき乗、所定の時間幅における状態系列情報の平均値などが挙げられる。
また、本実施の形態において、分析モデルを生成する際に用いる状態系列情報の期間は、時間的に連続する1つの期間である例を中心に説明した。これに限らず、分析モデルの生成に用いる状態系列情報の期間は、必ずしも連続していなくてもよい。例えば、分析モデルの生成には、期間同士が連続していない複数の期間に含まれる状態系列情報を用いてもよい。
また、本実施の形態において、多体相関モデル生成部が、式(2)に示した回帰式の生成方法の例として、優良度である予測精度の値が最大となるように各パラメータを決定する例を示した。これに限らず、多体相関モデル生成部は、目的に応じて他の優良度を用いてもよい。例えば、回帰式の優良度として、AIC(Akaike's Information Criterion)や、BIC(Bayesian Information Criterion)などの情報量基準の逆数を適用してもよい。この場合も、多体相関モデル生成部は、そのような優良度が最大となるように各パラメータを決定してもよい。
また、本実施の形態において、式(2)に示した回帰式のパラメータであるai,bi,ci,d,N,M,Kを決定する際に、PLS回帰の成分数の決定方法として、次の方法を示した。すなわち、PLS回帰の成分数を1から順に増やしたときに、モデル構築に用いた状態系列情報に対する予測誤差の最大値が、減少から増加に転じる前までの成分数とする例を示した。これに限らず、多体相関モデル生成部は、World's R criterion,Krzanowski's W criterion,Osten's F criterion等の技術を用いて、PLS回帰の成分数を決定してもよい。
また、本実施の形態において、N、M、Kを固定した時の回帰式のパラメータai,bi,ci,dの決定方法の例として、PLS回帰を用いる例を示した。これに限らず、多体相関モデル生成部は、主成分回帰(Principal Component Regression:PCR)等、説明変数間の多重共線性による影響を回避可能な別の方法を用いて、これらパラメータを決定してもよい。または、多体相関モデル生成部は、Lasso(least absolute shrinkage and selection operator)やリッジ回帰等で用いられる正則化パラメータ付きの損失関数を用いて、正則化パラメータ付きの損失関数が最小となるようこれらパラメータを決定してもよい。または、多体相関モデル生成部は、説明変数間に多重共線性による影響が発生しない場合には、式(3)の第二項の分子が最小になるように、最小二乗法を用いてパラメータai,bi、ci,d,を決定してもよい。
また、本実施の形態において、多体相関モデル群を生成する際に、全てのデータ項目は目的変数データ項目および説明変数データ項目のどちらとしても利用できるものとして説明した。これに限らず、目的変数データ項目としてのみ利用可能なデータ項目や、説明変数データ項目としてのみ利用可能なデータ項目が規定されていてもよい。
また、本実施の形態において、多体相関モデル生成部は、説明変数として含まれるデータ項目の数が全て同一の多体相関モデル群を生成する例について説明した。これに限らず、多体相関モデル生成部によって生成される多体相関モデル群は、その回帰式に説明変数として含まれるデータ項目の数が必ずしも同一でなくてもよい。すなわち、ある回帰式に説明変数として含まれるデータ項目の数は、他の少なくとも1つの回帰式に説明変数として含まれるデータ項目の数と異なっていてもよい。例えば、多体相関モデル生成部は、説明変数データ項目が2つの多体相関モデルと、説明変数データ項目が3つの多体相関モデルを組合せて生成してもよい。この場合、モデル抽出部は、説明変数データ項目が3つおよび2つの多体相関モデルの中から、優良多体相関モデルを抽出すればよい。なお、多体相関モデルの回帰式に説明変数として含まれるデータ項目の数は、運用者によって任意に設定されてもよい。
また、本実施の形態において、システム分析装置が、1つの分析モデルを用いて、被監視システムの状態を監視する例を示した。ここで、1つの分析モデルとは、同じ状態系列情報から生成された多体相関モデル群からなる分析モデルをいう。これに限らず、分析モデル取得部は、収集期間の異なる状態系列情報を用いて複数の分析モデルを作成してもよい。そのような場合に、システム分析装置は、複数の分析モデルを適宜切り替えながら、被監視システムの状態を監視してもよい。
また、本実施の形態において、システム分析装置が、分析モデルを一度だけ構築する例を中心に示した。これに限らず、システム分析装置は、分析モデルを逐次、再構築してもよい。
また、本実施の形態において、システム分析装置が、分析モデルに含まれる全ての回帰式をモデル破壊の検出に用いて、被監視システムの状態を監視する例を示した。これに限らず、システム分析装置は、分析モデルに含まれる一部の回帰式を用いて、被監視システムの状態の例えば一部を監視してもよい。
また、本実施の形態において、標準寄与率が、説明変数に含まれるデータ項目別の予測値に対する割合である例を示した。これに限らず、標準寄与率は、所定の期間について、多体相関モデルに含まれる任意の1つの説明変数データ項目による再予測値と、多体相関モデルの予測値とが、同等の精度を持つような他の手法により算出されてもよい。なお、所定の期間としては、例えば、標準寄与率の計算に用いられる期間として上述した各種期間が利用可能である。例えば、標準寄与率は、多体相関モデルの回帰式において、「任意の1つの説明変数データ項目に関する成分/定数項を除く全成分」として算出されてもよい。なお「/」は除算を表す。この標準寄与率の定義を用いる場合、再予測値算出部は、多体相関モデルの定数項の値と、説明変数データ項目の標準寄与率およびセンサ値とから、目的変数データ項目の再予測値を計算すればよい。
また、本実施の形態において、多体相関モデルの回帰式として、式(2)の回帰式を例として説明した。式(2)は、説明変数としてデータ項目の過去の値(過去値)を用いてもよい。この場合、多体相関モデルの回帰式は、目的変数の過去値も説明変数として含むケースがある。このようなケースでは、標準寄与率取得部は、例えば、目的変数の過去値に関わる成分の値を定数項と同様に処理して、標準寄与率を算出する。つまり、多体相関モデルに説明変数として含まれる目的変数の過去値は、説明変数データ項目とみなされないため、再予測の対象にならない。
また、本実施の形態において、標準寄与率が、「任意の1つの説明変数データ項目に関する成分/予測値」の統計値である例を示した。ただし、多体相関モデルの回帰式のうち、再予測の対象になるデータ項目に関する成分の占める割合が低くなると、再予測の精度が低下することがある。その場合、標準寄与率は、「任意の1つの説明変数データ項目に関する成分/再予測の対象になるデータ項目に関する成分の総和」の統計値とすることが好ましい。多体相関モデルの回帰式の説明変数に目的変数の過去値を含まない場合、再予測の対象になるデータ項目に関する成分の総和は、定数項を除く全成分に相当する。また、多体相関モデルの回帰式の説明変数に目的変数の過去値を含む場合、再予測の対象になるデータ項目に関する成分の総和は、目的変数の過去値の成分および定数項を除く全成分に相当する。この標準寄与率の定義を用いる場合、再予測値算出部は、多体相関モデルの定数項の値と、目的変数の過去値に関わる成分の値と、説明変数データ項目の標準寄与率およびセンサ値とから、目的変数データ項目の再予測値を計算すればよい。このときの再予測値は、次式(14)で表される。
ここで、データ項目xiは、当該多体相関モデルの回帰式rに含まれる説明変数データ項目を表す。また、データ項目ukは、当該多体相関モデルの回帰式rに含まれる目的変数データ項目を表す。また、ハット付きのukriは、説明変数データ項目xiによる、目的変数データ項目ukの再予測値を表す。また、grは、回帰式rのうち特定のデータ項目にかかわる成分の値を取り出す関数である。したがって、gr(xi)は、回帰式rのうち、データ項目xiに関する成分の値を示す。また、したがって、gr(uk)は、回帰式rのうち、データ項目ukに関する成分の値、すなわち目的変数の過去値に関わる成分の値を示す。また、qriは、説明変数データ項目xiの標準寄与率である。また、cは、回帰式rの定数項である。
また、本実施の形態において、異常判定部によって用いられる警報条件の例として、「モデル破壊が発生した相関モデルの数が、所定の数を超えたとき」といった条件を用いる例を示した。これに限らず、異常判定部は、他の警報条件を用いてもよい。例えば、警報条件は、「モデル破壊が発生した相関モデルの回帰式の優良度の累積値が、所定の値(警報閾値)を超えたとき」といった条件であってもよい。また、例えば、警報条件は、「あらかじめ設定された所定の期間にわたって、上述の優良度の累積値が警報閾値を超えたとき」といった条件であってもよい。このように、異常判定部は、警報条件として、モデル破壊情報に基づく様々な条件を適用可能である。
また、本実施の形態において、部分異常度算出部が、再予測値でもモデル破壊が発生するか否かを評価する手法として、再予測値とセンサ値との差が、その多体相関モデルの予測誤差の許容範囲内かどうか評価する例を中心に説明した。これに限らず、部分異常度算出部は、データ項目ごとに算出された再予測値用の予測誤差の許容範囲(再予測値用の閾値)を用いて、再予測値でもモデル破壊が発生するか否かを評価してもよい。つまり、同一のデータ項目であっても、多体相関モデルが異なる場合は、それぞれに対して、再予測値用の閾値を設定してもよい。この場合、部分異常度算出部は、再予測値用の閾値を、標準寄与率の算出に用いた所定の期間に対して、多体相関モデルの予測誤差の許容範囲と同じ方法で算出してもよい。
また、本実施の形態において、部分異常度算出部は、部分異常度として、0または1の2値のうち、部分異常度が高いものに1を割り当て、低いものに0を割り当てる例を中心に説明した。これに限らず、部分異常度算出部は、2値ではない値(連続値や離散値など)を部分異常度として割り当ててもよい。例えば、部分異常度算出部は、部分異常度として、本実施の形態で説明した2値の部分異常度に重みをかけたものを、部分異常度としてもよい。重みとしては、例えば、モデル破壊発生時の予測値の乖離度や、回帰式の優良度等を適用してもよい。なお、ここでいう予測値の乖離度とは、例えば、「予測誤差/予測誤差の許容範囲の下限」と「予測誤差/予測誤差の許容範囲の上限」との大きい方の値であってもよい。例えば、重みとして、モデル破壊発生時の予測値の乖離度をかける場合の部分異常度は、0または乖離度となる。なお、汎用的に異常要因特定に有用な情報を的確に抽出するという観点からは、部分異常度の定義としては、本実施の形態のように2値の定義が好ましい。一方で、特定のシステムに特化させ、より的確な情報を抽出するという観点からは、部分異常度に重みをかける方が好ましい。部分異常度にかける重みは、対象システムに対する知見に基づき、運用者によって任意の定義を設定可能である。
また、本実施の形態において、異常統計値算出部は、異常統計値として、データ項目別に部分異常度の平均値を算出する例を説明した。これに限らず、異常統計値は、異常の要因である可能性の高さと関係のある指標であればよい。例えば、異常統計値算出部は、異常統計値として、データ項目別の部分異常度の合計値を算出してもよい。なお、分析モデルの多体相関モデルに含まれる数が多いデータ項目を異常要因として抽出しやすくするという観点からは、異常統計値として、合計値を用いるのが好ましい。一方で、分析モデルの多体相関モデルに含まれる数が少ないデータ項目であっても異常要因として抽出しやすくするという観点からは、異常統計値として、平均値を用いるのが好ましい。
また、本実施の形態において、異常統計値算出部は、異常統計値として、異常要因である可能性がより高いデータ項目についてより高い値を示す異常統計値を算出するとして説明した。これに限らず、異常統計値は、異常の要因である可能性の高さと関係のある指標であればよい。例えば、異常統計値算出部は、異常統計値として、異常要因である可能性がより高いデータ項目についてより低い値を示す異常統計値を算出してもよい。
(第3の実施の形態)
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第3の実施の形態としてのシステム分析装置3の機能ブロック構成を図11に示す。図11において、システム分析装置3は、本発明の第2の実施の形態としてのシステム分析装置2に対して、分析モデル取得部21に替えて分析モデル取得部31と、異常要因抽出部25に替えて異常要因抽出部35とを備える点が異なる。分析モデル取得部31は、本発明の第2の実施の形態における分析モデル21と同一の構成に加えて、データ項目分類部313を有する。また、システム分析装置3は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図11において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置3およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置3およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
データ項目分類部313は、状態情報に含まれるデータ項目群を分類する。分類は、分析モデルに含まれる優良多体相関モデルの少なくとも1つの回帰式に、目的変数または説明変数として含まれるデータ項目が、同一のグループとなるように行われる。なお、データ項目分類部313は、データ項目の分類手法として、特願2014−65120に記載の技術を適用してもよい。以降、同一の分類とされたデータ項目のグループを、データ項目グループとも記載する。そして、データ項目分類部313は、データ項目グループの情報を、分析モデル情報に加えて分析モデル記憶部201に保存する。
異常要因抽出部35は、分析モデル記憶部201からデータ項目グループの情報を取得する。そして、異常要因抽出部35は、データ項目グループごとに、異常要因の候補となるデータ項目を抽出して出力する。具体的には、異常要因抽出部35は、各データ項目グループに関する多体相関モデルのうちモデル破壊が発生した多体相関モデルについて、再予測値算出部251および部分異常度算出部252を用いて、説明変数データ項目別の部分異常度を算出する。ここで、各データ項目グループに関する多体相関モデルとは、そのデータ項目グループに含まれるデータ項目に関する回帰式の多体相関モデルである。そして、異常要因抽出部35は、異常統計値算出部253を用いて、データ項目グループ毎に、データ項目別に部分異常度を集計して異常統計値を算出する。そして、異常要因抽出部35は、データ項目グループ毎に、異常統計値に基づき異常要因の候補となるデータ項目を抽出する。そして、異常要因抽出部35は、データ項目グループ別に抽出した異常要因の候補となるデータ項目を、データ項目グループ別に出力する。
また、例えば、異常要因抽出部35は、データ項目グループに優先順位をつけてもよい。この場合、異常要因抽出部35は、優先順位の高いデータ項目グループから順に、異常統計値に基づき異常要因の候補として抽出したデータ項目を出力してもよい。このとき、データ項目グループの優先順位としては、そのデータ項目グループに関する多体相関モデル数が多い(または少ない)順が設定されてもよい。あるいは、データ項目グループの優先順位は、運用者によってあらかじめ定められた重要度の順であってもよい。
ここで、異常要因抽出部35が通知対象とするデータ項目グループの数は、例えば、運用者によって任意の数が設定されていてもよい。通知対象とするデータ項目グループの個数は、障害の原因を見つけられる可能性を高め、障害の全体の状況を把握するという観点からは、多いほど好ましい。一方で、誤報が発生したときの調査時間を短縮するという観点からは、通知対象とするデータ項目グループの個数は、少ないほど好ましい。
以上のように構成されたシステム分析装置3の動作について説明する。システム分析装置3の動作の概略は、図6を参照して説明した本発明の第2の実施の形態としてのシステム分析装置2の動作の概略と同様である。ただし、ステップS103における分析モデル生成動作と、ステップS109における異常要因抽出動作の詳細が異なる。
ステップS103での分析モデル生成動作の詳細を、図12に示す。
図12では、システム分析装置3は、ステップS201〜S203まで、本発明の第2の実施の形態におけるシステム分析装置2と同様に動作して、優良多体相関モデル群を生成する。
次に、データ項目分類部313は、状態情報に含まれるデータ項目群を分類する(ステップS404)。前述のように、分類は、分析モデルに含まれる優良多体相関モデルの少なくとも1つの回帰式に、目的変数または説明変数として含まれるデータ項目が、同一のグループとなるように行われる。
次に、データ項目分類部313は、ステップS203で生成された優良多体相関モデル群からなる分析モデル情報とあわせて、データ項目グループ情報を、分析モデル記憶部201に保存する(ステップS405)。
以上で、システム分析装置3は、分析モデル生成動作を終了する。
次に、ステップS109での異常要因抽出動作の詳細について説明する。システム分析装置3は、データ項目グループごとに、図8を参照して説明した本発明の第2の実施の形態における異常要因抽出動作を実行する。もし、データ項目グループに優先順位をつけている場合、システム分析装置3は、優先順位の高いデータ項目グループから順に、通知対象として定められた所定のグループ数まで、図8の動作を繰り返せばよい。
以上で、システム分析装置3は、異常要因抽出動作を終了する。
次に、本発明の第3の実施の形態の効果について述べる。
本発明の第3の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より把握しやすく通知することができる。
その理由について述べる。本実施の形態では、データ項目分類部が、被監視システムを表す状態情報を構成するデータ項目を分類してデータ項目グループを生成する。この分類は、分析モデルに含まれる優良多体相関モデルの少なくとも1つの回帰式に、目的変数または説明変数として含まれたデータ項目が、同一のグループとなるように行われる。つまり、同一のデータ項目グループには、回帰式の観点から依存関係にあるデータ項目が含まれる。また、回帰式の観点から依存関係にないデータ項目同士は、異なるデータ項目グループに含まれることになる。そして、異常要因抽出部が、データ項目グループ別に、異常要因の候補となるデータ項目を抽出して出力する。これにより、本実施の形態は、回帰式の観点から依存関係にないデータ項目を区別して、異常要因の候補となるデータ項目を通知できる。したがって、本実施の形態は、障害が複数のデータ項目グループに及ぶ場合であっても、障害全体の状況をより把握しやすく通知することができる。また、何らかの理由で、特定のデータ項目グループにおける異常統計値が、正確に計算されないケースも考えられる。このような場合でも、本実施の形態は、他のデータ項目グループで高い異常統計値をもつデータ項目を通知することができるため、異常の原因を特定するのに有用な情報を提供できる可能性を高める。
なお、本実施の形態において、データ項目分類部は、分析モデルに含まれる優良多体相関モデルの少なくとも1つの回帰式に、目的変数または説明変数として含まれるデータ項目が、同一のグループとなるようにデータ項目を分類する例を示した。これに限らず、データ項目分類部は、他のデータ項目分類手法を用いてもよい。例えば、データ項目分類部は、あらかじめ運用者によって対象システムの専門知識に基づきデータ項目が分類された結果を用いて、データ項目グループを生成してもよい。
他の例として、データ項目分類部は、K平均法やスペクトラルクラスタリングなど、データマイニングでデータ項目を分類するために用いられる手法を用いて、データ項目グループを生成してもよい。
(第4の実施の形態)
次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第4の実施の形態としてのシステム分析装置4の機能ブロック構成を図13に示す。図13において、システム分析装置4は、本発明の第2の実施の形態としてのシステム分析装置2に対して、異常要因抽出部25に替えて異常要因抽出部45を備える点が異なる。異常要因抽出部45は、異常要因抽出部25に対して、部分異常度算出部252に替えて、部分異常度算出部452を備える点が異なる。システム分析装置4は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図13において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置4およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置4およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
部分異常度算出部452は、第1のモデル破壊発生状況となった多体相関モデルと、第2のモデル破壊発生状況となった多体相関モデルとの間で、割り当てる部分異常度の最大値の比を調整する。具体的には、部分異常度算出部452は、第1のモデル破壊発生状況での多体相関モデルにおける部分異常度の最大値が、第2のモデル破壊発生状況での多体相関モデルにおける部分異常度の最大値よりも大きくなるように、部分異常度を割り当てる。前述のように、第1のモデル破壊発生状況とは、多体相関モデルにおいて、各説明変数データ項目についての再予測値が全てモデル破壊となった場合をいう。また、第2のモデル破壊発生状況とは、多体相関モデルにおいて、各説明変数データ項目についての再予測値の少なくとも1つがモデル破壊とならず、少なくとも1つがモデル破壊となった場合をいう。
例えば、部分異常度算出部452は、第1のモデル破壊発生状況となった多体相関モデルでは、次のように部分異常度を割り当てる。この場合、部分異常度算出部452は、目的変数データ項目の部分異常度が、説明変数データ項目の部分異常度より高くなるよう各部分異常度の数値を割り当てる。
また、部分異常度算出部452は、第2のモデル破壊発生状況となった多体相関モデルでは、次のように部分異常度を割り当てる。この場合、部分異常度算出部452は、再予測値がモデル破壊となった説明変数データ項目の部分異常度が、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数データ項目の部分異常度以上となるようにする。さらに、部分異常度算出部452は、再予測値がモデル破壊となった説明変数データ項目の部分異常度が、第1のモデル破壊発生状況において目的変数データ項目に割り当てられる部分異常度未満となるよう、部分異常度の数値を割り当てる。
具体例として、第1のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、目的変数データ項目の部分異常度に1を割り当て、説明変数データ項目の部分異常度に0を割り当てる。また、第2のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、再予測値がモデル破壊となった説明変数データ項目の部分異常度に0を割り当てる。また、第2のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てる。これにより、第1のモデル破壊発生状況での部分異常度の最大値(目的変数データ項目の部分異常度1)は、第2のモデル破壊発生状況での部分異常度の最大値(再予測値がモデル破壊となった説明変数データ項目の部分異常度0)より大きくなる。
また、他の具体例として、第1のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、目的変数データ項目の部分異常度に1を割り当て、説明変数データ項目の部分異常度に0を割り当てる。また、第2のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、再予測値がモデル破壊となった説明変数データ項目の部分異常度に0.5を割り当てる。また、第2のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てる。これにより、第1のモデル破壊発生状況での部分異常度の最大値(目的変数データ項目の部分異常度1)は、第2のモデル破壊発生状況での部分異常度の最大値(再予測値がモデル破壊となった説明変数データ項目の部分異常度0.5)より大きくなる。
ここで、異常要因として絞り込んだ結果に正常なデータ項目が混入する可能性を低くするという観点について考える。このような観点からは、第1のモデル破壊発生状況での部分異常度の最大値を、第2のモデル破壊発生状況での部分異常度の最大値で割った値の絶対値が大きいほど好ましい。例えば、第2のモデル破壊発生状況での部分異常度の最大値を0とすることが最も好ましい。
また、異常要因として絞り込んだ結果に異常なデータ項目が網羅される可能性を高くするという観点について考える。このような観点からは、第1のモデル破壊発生状況での部分異常度の最大値を、第2のモデル破壊発生状況での部分異常度の最大値で割った値の絶対値が1に近いほど好ましい。
なお、部分異常度として割り当てる値は、運用者やシステムの目的に合わせて任意の定義を設定可能である。被監視システム9が異常なときのデータの蓄積がある場合には、そのデータを分析した結果から、部分異常度として割り当てる値を決定してもよい。例えば、前述の具体例のように、部分異常度算出部452は、第1のモデル破壊発生状況において、目的変数データ項目の部分異常度に1を割り当て、説明変数データ項目の部分異常度に0を割り当てるとする。また、部分異常度算出部452は、第2のモデル破壊発生状況において、目的変数のデータ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てるとする。このとき、第2のモデル破壊発生状況において、再予測値がモデル破壊となった説明変数のデータ項目の部分異常度にいくらを割り当てればよいか、被監視システム9が異常なときのデータを分析して決定することを考える。この場合、まず、異常要因として絞り込んだ結果に正常なデータ項目が混入する確率の上限値と、異常要因として絞り込んだ結果に異常なデータ項目が入らない確率の上限値とを設定する。その次に、第2のモデル破壊発生状況において、再予測値がモデル破壊となった説明変数のデータ項目に割り当てる部分異常度を0から1まで変化させる。そして、変化させた部分異常度を用いて異常要因を抽出し、異常要因として絞り込んだ結果に正常なデータ項目が混入する確率と、異常要因として絞り込んだ結果に異常なデータ項目が入らない確率とを算出する。ここで、変化させた部分異常度のうち、異常要因として絞り込んだ結果に正常なデータ項目が混入する確率が、設定した上限値を下回り、異常要因として絞り込んだ結果に異常なデータ項目が入らない確率が、設定した上限値を下回るものがあるとする。この場合、そのような部分異常度の中から、第2のモデル破壊発生状況において再予測値がモデル破壊となった説明変数のデータ項目の部分異常度に割り当てる値を選択することができる。もし、上述の上限値の少なくとも一方が満たされない場合は、その上限値を再設定するか、データ分析の条件を変更する。そして、設定した上限値の両方を満たすよう、第2のモデル破壊発生状況において再予測値がモデル破壊となった説明変数のデータ項目に割り当てる部分異常度を探索する。
また、部分異常度算出部452は、上述した部分異常度に重みをかけたものを、部分異常度としてもよい。重みとしては、例えば、モデル破壊発生時の予測値の乖離度や、回帰式の優良度等を適用してもよい。なお、ここでいう予測値の乖離度とは、例えば、「予測誤差/予測誤差の許容範囲の下限」と「予測誤差/予測誤差の許容範囲の上限」との大きい方の値であってもよい。例えば、重みとして、モデル破壊発生時の予測値の乖離度をかける場合の部分異常度は、0または乖離度となる。なお、汎用的に異常要因特定に有用な情報を的確に抽出するという観点からは、部分異常度の定義としては、2値の定義が好ましい。一方で、特定のシステムに特化させ、より的確な情報を抽出するという観点からは、部分異常度に重みをかける方が好ましい。部分異常度にかける重みは、対象システムに対する知見に基づき、運用者によって任意の定義を設定可能である。
以上のように構成されたシステム分析装置4の動作について説明する。なお、システム分析装置4の動作の概略は、図6を参照して説明した本発明の第2の実施の形態としてのシステム分析装置2の動作の概略と略同様である。ただし、ステップS109における異常要因抽出動作の詳細が異なる。
本実施の形態における異常要因抽出動作の詳細を、図14に示す。ここでは、部分異常度算出部452は、第1のモデル破壊発生状況では、目的変数データ項目の部分異常度に1を割り当て、説明変数データ項目の部分異常度に0を割り当てることとする。また、部分異常度算出部452は、第2のモデル破壊発生状況では、再予測値がモデル破壊となった説明変数のデータ項目の部分異常度に0を割り当てることとする。また、部分異常度算出部452は、第2のモデル破壊発生状況では、目的変数のデータ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てることとする。
図14において、システム分析装置4の異常要因抽出動作では、図8を参照して説明した本発明の第2の実施の形態における異常要因抽出動作に対して、ステップS307に替えて、ステップS407が実行される点が異なる。
S407では、部分異常度算出部452は、モデル破壊が発生した再予測値の計算に用いた説明変数データ項目の部分異常度に0を割り当てる。
以上で、システム分析装置4は、異常要因抽出動作を終了する。
次に、本発明の第4の実施の形態の効果について述べる。
本発明の第4の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、運用者の嗜好に合わせてより的確に抽出することができる。つまり、本実施の形態は、異常要因として絞り込んだ結果において、正常なデータ項目が混入する可能性と、異常なデータ項目が網羅される可能性との度合いを、運用者の嗜好に合わせて調整したうえで、異常要因特定に有用な情報を、的確に抽出することができる。
その理由について述べる。本実施の形態では、本発明の第2の実施の形態と略同一の構成に加え、部分異常度算出部が、第1のモデル破壊発生状況での部分異常度の最大値より、第2のモデル破壊発生状況での部分異常度の最大値が小さくなるように、部分異常度を割り当てる。このように、本実施の形態は、再予測値によるモデル破壊の発生状況が異なる多体相関モデル間で部分異常度の最大値の差を調整する。その結果、本実施の形態は、異常要因として絞り込んだ結果に正常なデータ項目が混入する可能性と、異常要因として絞り込んだ結果に異常なデータ項目が網羅される可能性の度合いとを調整することができ、上述の効果を奏する。
(第5の実施の形態)
次に、本発明の第5の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第5の実施の形態としてのシステム分析装置5の機能ブロック構成を図15に示す。図15において、システム分析装置5は、本発明の第2の実施の形態としてのシステム分析装置2に対して、分析モデル取得部21に替えて分析モデル取得部51を備える点が異なる。また、分析モデル取得部51は、分析モデル取得部21に対して、多体相関モデル生成部211に替えて、多体相関モデル生成部511を備える点が異なる。システム分析装置5は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図15において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置5およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置5およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
多体相関モデル生成部511は、後述する代表データ項目が含まれるように回帰式を構成することを除いて、多体相関モデル生成部211と同様に構成される。
多体相関モデル生成部511は、状態情報に含まれるデータ項目群から、データ項目群の代表となるデータ項目である代表データ項目を選出する。そして、多体相関モデル生成部511は、その代表データ項目と、状態情報に含まれるデータ項目群のうち、その代表データ項目を除く任意の2つ以上のデータ項目とを用いて、多体相関モデルを生成する。そして、多体相関モデル生成部511は、選出した代表データ項目およびその代表データ項目を除く2つ以上のデータ項目の全ての組合せについて、3つ以上のデータ項目を用いて構成される回帰式を構築する。ここで、多体相関モデル生成部511は、それぞれの多体相関モデルを構成するために選出したデータ項目の組合せについて、すべてのデータ項目が目的変数となるようにデータ項目を入れ替えて、多体相関モデルを生成する。
なお、代表データ項目としては、その代表データ項目を含むことで、すべての多体相関モデルの予測精度を全体的に高くするものが選ばれることが望ましい。例えば、多体相関モデル生成部511は、代表データ項目の選択手法として、特願2014−65120に記載の技術を適用してもよい。
以上のように構成されたシステム分析装置5の動作について説明する。システム分析装置5の動作の概略は、図6を参照して説明した本発明の第2の実施の形態としてのシステム分析装置2の動作の概略と略同様である。ただし、ステップS103における分析モデル生成動作の詳細が異なる。
本実施の形態における分析モデル生成動作の詳細を、図16に示す。
図16では、まず、多体相関モデル生成部511は、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶部203から取得する(ステップS201)。
次に、多体相関モデル生成部511は、取得した状態系列情報を用いて、代表データ項目を選出する。そして、多体相関モデル生成部511は、代表データ項目および代表データ項目を除く2つ以上のデータ項目を含む回帰式で構成される多体相関モデル群を、分析モデルの候補として生成する(ステップS502)。
次に、モデル抽出部212は、生成された多体相関モデル群から、所定の優良モデル条件に基づいて、優良多体相関モデル群を抽出する(ステップS203)。
次に、モデル抽出部212は、得られた優良多体相関モデル群を表す分析モデル情報を、分析モデル記憶部201に記憶する(ステップS204)。
以上で、システム分析装置5は、分析モデル生成動作を終了する。
次に、本発明の第5の実施の形態の効果について述べる。
本発明の第5の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、的確に抽出することができる。
その理由について述べる。本実施の形態では、本発明の第2の実施の形態と略同一の構成に加え、多体相関モデル生成部511が、代表データ項目を含むように回帰式を生成するからである。これにより、本実施の形態は、データ項目の組み合わせ数を減らし、分析モデルの候補となる多体相関モデルの数を減らすことができる。その結果、本実施の形態は、より少ない計算資源で、分析モデルの生成および分析が可能となり、上述の効果を奏する。
(第6の実施の形態)
次に、本発明の第6の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第6の実施の形態としてのシステム分析装置6の機能ブロック構成を図17に示す。図17において、システム分析装置6は、本発明の第2の実施の形態としてのシステム分析装置2に対して、分析モデル取得部21に替えて分析モデル取得部61を備える点が異なる。分析モデル取得部61は、分析モデル取得部21に対して、多体相関モデル生成部211に替えて、多体相関モデル生成部611を備える点が異なる。さらに、分析モデル取得部61は、データ項目分類部613を有する。また、システム分析装置6は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図17において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置6およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置6およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
データ項目分類部613は、状態情報に含まれるデータ項目群を分類する。分類は、データ項目の類似度に応じて行われる。以降、同一の分類とされたデータ項目のグループを、データ項目グループとも記載する。さらにデータ項目分類部613は、データ項目グループごとに、データ項目グループの代表となるデータ項目である代表データ項目を1つ選出する。代表データ項目としては、その代表データ項目を含むことで、代表データ項目と同一データ項目グループ内のすべての多体相関モデルの予測精度を全体的に高くするものが選ばれることが望ましい。
また、データ項目分類部613は、データ項目グループの情報を、分析モデル情報に加えて分析モデル記憶部201に保存する。データ項目グループの情報には、データ項目グループの識別子と、各データ項目グループに含まれるデータ項目および代表データ項目の識別子が含まれる。
なお、データ項目分類部613は、データ項目の分類手法として、例えば、K近傍法、スペクトラルクラスタリング、または、特願2014−65120に記載の技術などのように、データの特徴からデータ項目を分類する方法を採用可能である。また、データ項目分類部613は、データ項目の分類手法として、データ項目を被監視システム9のサブシステムごとに分類する等のように、被監視システム9に対する専門知識に基づいてデータ項目を分類する方法を採用可能である。また、データ項目分類部613は、これらの分類手法を組み合わせる方法を用いてもよい。
また、データ項目分類部613は、それぞれのデータ項目グループに対する代表データ項目を選出する手法として、例えば、特願2014−65120に記載の技術など、データの特徴から代表データ項目を選出する方法を採用可能である。また、データ項目分類部613は、それぞれのデータ項目グループに対する代表データ項目を選出する手法として、被監視システム9に対する専門知識に基づいて代表データ項目を選出する方法を採用可能である。また、データ項目分類部613は、これらの選出手法を組み合わせる方法を適用してもよい。
多体相関モデル生成部611は、データ項目グループごとに、代表データ項目が含まれるように回帰式を構成することを除いて、多体相関モデル生成部211と同様に構成される。
具体的には、多体相関モデル生成部611は、データ項目分類部613からデータ項目グループと、それぞれのデータ項目グループの代表データ項目を取得する。そして、多体相関モデル生成部611は、データ項目グループごとに、次のようにして、多体相関モデルを生成する。具体的には、多体相関モデル生成部611は、そのデータ項目グループに含まれるデータ項目を対象として、代表データ項目およびその代表データ項目を除く2つ以上のデータ項目の全ての組合せについて、3つ以上のデータ項目を用いて構成される回帰式を構築する。ここで、多体相関モデル生成部611は、それぞれの多体相関モデルを構成するために選出されたデータ項目に対して、すべてのデータ項目が目的変数となるようにデータ項目を入れ替えて、多体相関モデルを生成する。
以上のように構成されたシステム分析装置6の動作について説明する。システム分析装置6の動作の概略は、図6を参照して説明した本発明の第2の実施の形態としてのシステム分析装置2の動作の概略と略同様である。ただし、ステップS103における分析モデル生成動作が異なる。
本実施の形態における分析モデル生成動作の詳細を、図18に示す。
図18では、まず、分析モデル取得部61は、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶部203から取得する(ステップS201)。
次に、データ項目分類部613は、取得した状態系列情報を用いて、データ項目をデータ項目グループに分類し、データ項目グループごとに代表データ項目を選出する。さらに、データ項目分類部613は、データ項目グループの情報を、分析モデル情報に加えて分析モデル記憶部201に保存する(ステップS601)。
次に、多体相関モデル生成部611は、データ項目分類部613から、データ項目グループの情報を取得する。データ項目グループの情報には、データ項目グループを表す情報と、それぞれのデータ項目グループの代表データ項目を表す情報とが含まれる。そして、多体相関モデル生成部611は、取得したデータ項目グループの情報と状態系列情報とを用いて、データ項目グループごとに、分析モデルの候補となる多体相関モデル群を生成する。具体的には、多体相関モデル生成部611は、各データ項目グループについて、代表データ項目および代表データ項目を除く2つ以上のデータ項目を含む多体相関モデル群を、分析モデルの候補として生成する(ステップS602)。
次に、モデル抽出部212は、生成された多体相関モデル群から、所定の優良モデル条件に基づいて、優良多体相関モデル群を抽出する(ステップS203)。
次に、モデル抽出部212は、得られた優良多体相関モデル群を表す分析モデル情報を、分析モデル記憶部201に記憶する(ステップS204)。
以上で、システム分析装置6は、分析モデル生成動作を終了する。
次に、本発明の第6の実施の形態の効果について述べる。
本発明の第6の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、的確に抽出することができる。
その理由について述べる。本実施の形態では、本発明の第2の実施の形態と略同一の構成に加え、データ項目分類部が、データ項目を分類するとともに、データ項目グループごとに代表データ項目を選出する。さらに、多体相関モデル生成部が、それぞれのデータ項目グループでその代表データ項目を含むように多体相関モデルを生成する。この構成により、本実施の形態は、データ項目グループ間に跨るデータ項目の組み合わせと、代表データ項目を含まないデータ項目の組み合わせとについては、多体相関モデルを生成しない。その結果、そのような組合せについての多体相関モデルは、分析モデルにも含まれない。さらに、異常検知および異常要因特定の算出過程において、利用される多体相関モデルの数が減ることになる。その結果、これらの処理をより少ない計算資源で実行できる可能性が高まる。したがって、本実施の形態は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、的確に抽出することができる、という第2の実施形態の効果を、より少ない計算資源で奏する。
(第7の実施の形態)
次に、本発明の第7の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜5の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第7の実施の形態としてのシステム分析装置7の機能ブロック構成を図19に示す。図19において、システム分析装置7は、本発明の第5の実施の形態としてのシステム分析装置5に対して、標準寄与率取得部22に替えて標準寄与率取得部72と、異常要因抽出部25に替えて異常要因抽出部75とを備える点が異なる。異常要因抽出部75は、異常要因抽出部25に対して、再予測値算出部251に替えて再予測値算出部751を備える点が異なる。さらに、異常要因抽出部75は、モデル破壊再検出部754を備える。また、システム分析装置7は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図19において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置7およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置7およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
標準寄与率取得部72は、分析モデルに含まれる各多体相関モデルに加えて、後述の再生成モデルに含まれる各再生成多体相関モデルにおいて、各説明変数データ項目の標準寄与率を取得する。
異常要因抽出部75は、異常判定部29によって被監視システム9の状態が異常と判定されると次のように動作するよう構成される。なお、上述したように、異常判定部29によってモデル破壊情報のモデル破壊情報記憶部204への登録が行われる場合、異常要因抽出部75は、モデル破壊情報記憶部204にモデル破壊情報が新たに追加されると動作するよう構成される。具体的には、異常要因抽出部75は、後述のモデル破壊再検出部754と、後述の再予測値算出部751と、部分異常度算出部252と、異常統計値算出部253とを用いて、データ項目別の異常統計値を算出する。異常要因抽出部75に含まれる各機能ブロックの構成の詳細については後述する。そして、異常要因抽出部75は、データ項目別の異常統計値がより高いものから順に、被監視システム9の異常要因の候補となるデータ項目を抽出する。例えば、異常要因抽出部75は、異常統計値が閾値以上のデータ項目を、異常要因の候補となるデータ項目として抽出してもよい。また、例えば、異常要因抽出部75は、異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出してもよい。
次に、異常要因抽出部75に含まれるモデル破壊再検出部754、再予測値算出部751の構成の詳細について説明する。
モデル破壊再検出部754は、多体相関モデル再生成部7541を含んで構成される。多体相関モデル再生成部7541は、モデル破壊情報記憶部204に新たに追加された分析モデルのモデル破壊情報に基づいて、再生成モデルを生成する。
また、モデル破壊再検出部754は、分析モデルのモデル破壊が検知された時刻における再生成モデルのモデル破壊情報を生成する。なお、再生成モデルについて生成されるモデル破壊情報は、モデル破壊情報記憶部204に記憶されるモデル破壊情報と同じ種類の情報で構成される。
多体相関モデル再生成部7541は、取得した分析モデル情報と、取得した分析モデルのモデル破壊情報とに基づいて、代表データ項目の次に代表データ項目として適したデータ項目である二次代表データ項目を選出する。そして、多体相関モデル再生成部7541は、二次代表データ項目を回帰式に含む再生成多体相関モデル群を生成する。そして、多体相関モデル再生成部7541は、再生成多体相関モデル群のうち所定の優良条件を満たす再生成優良多体相関モデル群を、再生成モデルとして生成する。再生成モデルの生成処理の詳細については、本発明の第5の実施の形態において、図16を参照して説明した代表データ項目を用いた分析モデル生成処理の説明において、代表データ項目を二次代表データ項目と読み替えることにより、同様に説明される。なお、二次代表データ項目は、回帰式に含めることで、再生成モデルの全体的な予測精度を高められるものであり、モデル破壊が検知された時刻において正常なデータ項目であることが望ましい。
多体相関モデル再生成部7541は、上記の条件にあてはまるデータ項目を二次代表データ項目として選出するための指標として、例えば、各データ項目について代表スコアおよび破壊スコアを算出してもよい。
まず、代表スコアについて説明する。多体相関モデル再生成部7541は、分析モデル情報に基づいて、代表データ項目を除くデータ項目ごとに、代表スコアを算出する。代表スコアは、そのデータ項目を含むように再生成モデルを生成することで、再生成モデルの全体的な予測精度を高められる度合を定量化したものである。例えば、代表スコアとして、特願2014−65120に記載の技術において代表データ項目を選定する際の指標を用いてもよい。
また、例えば、多体相関モデル再生成部7541は、優良相互相関モデルの回帰式の優良度Fを用いて、各データ項目の代表スコアを算出してもよい。具体的には、多体相関モデル再生成部7541は、分析モデル情報に含まれる分析モデルの学習期間の情報に基づき、分析モデルの学習期間と同じ期間の状態系列情報を状態情報記憶部203から取得する。そして、多体相関モデル再生成部7541は、その状態系列情報を用いて、2つのデータ項目を含む回帰式(相互相関モデル)を構成する。相互相関モデルの生成処理は、データ項目のすべての組み合わせに対して、本発明の第2の実施の形態において説明した相互相関モデル群生成処理と同様の手順で行われる。そして、多体相関モデル再生成部7541は、相互相関モデルの回帰式に対して、回帰式の優良度を求める。次に、多体相関モデル再生成部7541は、所定の優良モデル条件を満たす相互相関モデル群である優良相互相関モデル群を抽出する。例えば、多体相関モデル再生成部7541は、優良相互相関モデル群を抽出するための回帰式の優良度として、前述の回帰式の優良度Fを用い、優良モデル条件として、式(8)を用いてもよい。そして、多体相関モデル再生成部7541は、優良相互相関モデルの回帰式の優良度Fに基づいて、データ項目別の統計値を算出し、それを代表スコアとしてもよい。詳細には、多体相関モデル再生成部7541は、優良相互相関モデル群に含まれる相互相関モデルの回帰式の優良度Fをデータ項目ごとに累積する。つまり、多体相関モデル再生成部7541は、当該相互相関モデル群に含まれる各相互相関モデルの回帰式の優良度を、目的変数に用いられるデータ項目および説明変数に用いられるデータ項目に対応づける。そして、多体相関モデル再生成部7541は、各データ項目に対応付けた回帰式の優良度Fを累積して加算すればよい。そして、多体相関モデル再生成部7541は、このようにして各データ項目について、回帰式の優良度Fの累計値(統計値)を、代表スコアとすればよい。
次に、破壊スコアについて説明する。多体相関モデル再生成部7541は、取得した分析モデルのモデル破壊情報に基づいて、代表データ項目を除くデータ項目ごとに、破壊スコアを算出する。破壊スコアは、そのデータ項目に異常の影響が表れているとみなす確信度を定量化したものである。例えば、破壊スコアには、第4の実施の形態の異常統計値を用いてもよい。具体的には、多体相関モデル再生成部7541が、第4の実施の形態の異常統計値を算出する処理を実行し、そのデータ項目ごとの異常統計値を破壊スコアとする。また、この場合の異常統計値としては、例えば、第2の実施の形態の異常統計値を用いてもよい。
このようにして求めた代表スコアおよび破壊スコアを用いて、多体相関モデル再生成部7541は、二次代表データ項目の選出を行う。具体的には、多体相関モデル再生成部7541は、データ項目の破壊スコアが最小で、代表スコアが最大であるデータ項目を二次代表データ項目として選出する。そのようなデータ項目が複数ある場合には、例えば、多体相関モデル再生成部7541は、それらのデータ項目からランダムに二次代表データ項目を選出してもよい。
再予測値算出部751は、再予測値の算出に用いる標準寄与率とモデル情報とモデル破壊情報とが異なる点を除いて、再予測値算出部251と同様に構成される。
具体的には、再予測値算出部751は、多体相関モデル再生成部7541によって生成された再生成モデルの標準寄与率を、標準寄与率取得部72から取得する。
また、再予測値算出部751は、多体相関モデル再生成部7541によって生成された再生成モデルのモデル情報を、モデル破壊再検出部754から取得する。
また、再予測値算出部751は、取得した標準寄与率と再生成モデルのモデル情報とに基づいて、再予測値の算出式を生成する。具体的には、再予測値算出部751は、再生成モデルに含まれる再生成多体相関モデルの回帰式ごとに、再予測値の閾値と、その回帰式に含まれる各データ項目に対する再予測値の算出式とを生成する。また、再予測値算出部751は、モデル破壊再検出部754から、再生成モデルのモデル破壊情報を取得する。そして、再予測値算出部751は、再生成モデルのうちモデル破壊が発生した各再生成多体相関モデルについて、再予測値算出部251と同様の処理を行う。すなわち、再予測値算出部751は、モデル破壊が発生した各再生成多体相関モデルの回帰式について、説明変数データ項目ごとに、当該データ項目の状態情報および標準寄与率に基づいて、当該回帰式の目的変数の予測値を再予測値として算出する。
以上のように構成されたシステム分析装置7の動作について図20を用いて説明する。
図20では、まず、システム分析装置7は、ステップS101〜S108まで、本発明の第5の実施の形態と同様に動作する。なお、本発明の第5の実施の形態で説明したように、ステップS103における分析モデルの生成動作の詳細は、本発明の第2の実施の形態におけるステップS103とは異なり、図16に示した通りである。
次に、多体相関モデル再生成部754は、モデル破壊情報記憶部204に新たに記憶された分析モデルのモデル破壊情報に基づいて、再生成モデルのモデル情報を生成する。そして、モデル破壊再検出部7541は、モデル破壊情報記憶部204に新たに記憶された分析モデルのモデル破壊情報の発生時刻における、再生成モデルのモデル破壊情報を生成する(ステップS711)。このステップの詳細については後述する。
次に、標準寄与率取得部72は、再生成モデルに含まれる各再生成多体相関モデルに対する各説明変数データ項目の標準寄与率を算出する(ステップS712)。
次に、異常要因抽出部75は、1つ以上の異常要因候補データ項目を抽出する(ステップS713)。このステップの動作は、本発明の第5(第2)の実施の形態におけるステップS109の異常要因候補データ項目抽出動作に対して、異常要因抽出動作時に利用する標準寄与率とモデル情報とモデル破壊情報とが異なる。具体的には、本発明の第5(第2)の実施の形態では、異常要因抽出部25は、分析モデルの標準寄与率と、分析モデルのモデル情報と、分析モデルにおけるモデル破壊情報とを利用してステップS109を実行していた。これに対して、本実施の形態では、異常要因抽出部75は、再生成モデルの標準寄与率と、再生成モデルのモデル情報と、再生成モデルにおけるモデル破壊情報とを利用してこのステップを実行する。この点を除いて、本実施の形態におけるステップS713の動作は、本発明の第5の実施の形態におけるステップS109と処理内容が同様である。このため、ステップS713の詳細については、本実施の形態における説明を省略する。
そして、システム分析装置7は、運用を終了するという判断(ステップS110でYes)が与えられるまで、上記の動作を繰り返す。
ここで、ステップS711での再生成モデルにおけるモデル破壊情報を生成する動作の詳細を、図21に示す。
図21では、まず、モデル破壊再検出部754は、分析モデル記憶部201から分析モデル情報を取得するとともに、モデル破壊情報記憶部204からモデル破壊情報を取得する(ステップS701)。このステップで取得されるモデル破壊情報は、分析モデルについて検出されたモデル破壊情報である。
次に、モデル破壊再検出部754は、取得した分析モデル情報から、分析モデルの生成に用いられた学習期間を取得する。そして、モデル破壊再検出部754は、その学習期間に対応する状態系列情報を、状態情報記憶部203から取得する(ステップS702)。
次に、多体相関モデル再生成部7541は、モデル破壊再検出部754が取得した状態系列情報を用いて、二次代表データ項目を選出する。そして多体相関モデル再生成部7541は、選出した二次代表データ項目を含む回帰式で構成される再生成多体相関モデル群を生成する(ステップS703)。
次に、多体相関モデル再生成部7541は、再生成多体相関モデル群に対して、本発明の第2の実施の形態と略同様にステップS203を実行する。これにより、多体相関モデル再生成部7541は、再生成多体相関モデル群から、所定の優良モデル条件に基づいて再生成優良多体相関モデル群を抽出し、再生成モデルとする(ステップS203)。
次に、多体相関モデル再生成部7541は、再生成モデルのモデル情報を生成する(ステップS704)。
次に、モデル破壊再検出部754は、多体相関モデル再生成部7541から再生成モデルのモデル情報を取得する。また、モデル破壊再検出部754は、ステップS701で取得した分析モデルのモデル破壊情報から、モデル破壊の発生した時刻を取得する。そして、モデル破壊再検出部754は、分析モデルのモデル破壊発生時刻における再生成モデルのモデル破壊の有無を評価するために必要な状態系列情報を、状態情報記憶部203からモデル破壊評価用状態系列情報として取得する(ステップS705)。
次に、モデル破壊再検出部754は、再生成モデルのモデル情報とモデル破壊評価用状態系列情報とを用いて、分析モデルのモデル破壊発生時刻と同時刻のモデル破壊を評価する。そして、モデル破壊再検出部754は、評価結果に基づいて、再生成モデルのモデル破壊情報を生成し、再生成モデルのモデル情報と共に再予測値算出部751に出力する(ステップS706)。
以上で、システム分析装置7は、再生成モデルについてモデル破壊情報を生成する動作を終了する。
次に、本発明の第7の実施の形態の効果について述べる。
本発明の第7の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、より的確に抽出することができる。
その理由について述べる。本実施の形態は、本発明の第5の実施の形態との略同一の構成に加え、次のように構成される。すなわち、異常要因抽出部75は、二次代表データ項目を選出する。二次代表データ項目は、回帰式に含めることで、再生成モデルの全体的な予測精度を高められると同時に、モデル破壊が検知された時刻において正常と思われるデータ項目である。そして、異常要因抽出部75は、その二次代表データ項目を、多体相関モデルの回帰式に共通して含まれるように再生成モデルを生成する。そして、異常要因抽出部75は、その再生成モデルを用いて、異常要因にかかわるデータ項目を抽出するからである。このような構成により、本実施の形態は、個々の回帰式に含まれるデータ項目のうち、少なくとも1つは、正常なデータ項目である可能性を高めることができる。その結果、本実施の形態は、部分異常度をより正確に算出することができる可能性を高める。より正確な部分異常度の算出は、より正確な異常統計値の算出につながる。したがって、本実施の形態は、上述の効果を奏する。
なお、本実施の形態では、モデル破壊情報記憶部に、分析モデルについてのモデル破壊情報が新たに追加されたときに、異常要因抽出部が状態系列情報から再生成モデルを生成する例について説明した。これに限らず、異常要因抽出部は、あらかじめ、所定の状態系列情報から再生成モデルの候補を生成しておいてもよい。この場合、多体相関モデル再生成部は、図21に示した動作において、ステップS703およびS203に替えて、再生成モデルの候補から、選定した二次代表データ項目を有する候補を、再生成モデルとして抽出する動作を実行すればよい。また、このように、あらかじめ、所定の状態系列情報から再生成モデルの候補を生成しておく場合、各候補についての標準寄与率も同様にあらかじめ算出しておくことが可能となる。この場合、標準寄与率取得部は、図20に示した動作において、ステップS712に替えて、ステップS711で候補から抽出された再生成モデルについて、算出しておいた標準寄与率を取得する動作を実行すればよい。
また、本実施の形態では、再生成モデルを用いて異常要因の候補を抽出する例について説明した。もし、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、例えば、分析モデルを用いて異常要因の候補を抽出してもよい。
また、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、次のような情報を運用者等に通知してもよい。通知する情報は、例えば、分析モデルのうちモデル破壊が発生した優良多体相関モデルに含まれるデータ項目であってもよい。また、通知する情報は、再生成モデルのうちモデル破壊が発生した再生成優良多体相関モデルに含まれるデータ項目であってもよい。また、通知する情報は、これら双方のデータ項目であってもよい。この際に、本実施の形態は、適切に異常要因を絞り込めなかったことを合わせて通知することが望ましい。
また、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、例えば、異常要因の候補がない旨を、運用者等に通知してもよい。
また、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、新たな二次代表データ項目を選出してもよい。例えば、この場合、本実施の形態は、分析モデルの多体相関モデル群に含まれる回帰式に共通して含ませていないデータ項目のうち、二次代表データ項目によりふさわしいデータ項目を選出してもよい。そして、本実施の形態は、新たな二次代表データ項目を含む新たな再生成モデルを生成し、異常統計値を算出してもよい。さらに、本実施の形態は、このような処理を、異常要因の候補が出るまで繰り返すことにより、その結果得られた異常要因の候補を運用者等に通知してもよい。
また、本実施の形態では、データ項目に異常の影響が表れているとみなす確信度として前述の破壊スコアを算出する例について説明した。この他、本実施の形態は、データ項目に異常の影響が表れているとみなす確信度として、他の定義にしたがう指標を算出してもよい。例えば、そのような確信度は、データ項目を1つまたは2つ含むモデルによって構成される分析モデルのモデル破壊情報から算出されることも可能である。
また、上述した本発明の各実施の形態では、異常要因の候補のみ、または異常要因の候補をそのスコアと共に運用者等に通知する方法を説明した。さらに、本実施の形態では、これらの情報に加えて、二次代表データ項目の破壊スコアを、二次代表データ項目の破壊スコアと分かるように運用者等に通知してもよい。破壊スコアを確認することで、運用者は、二次代表データ項目に求められる条件を満たしているか確認できる。
また、本実施の形態では、本発明の第5の実施の形態に対して、再生成モデルに基づき異常要因の候補を抽出する構成を適用する例について説明した。この他、再生成モデルに基づき異常要因の候補を抽出する本実施の形態の構成は、本発明の第6の実施の形態に対して適用することもできる。この場合、多体相関モデル再生成部は、データ項目グループごとに、二次代表データ項目を選出し、データ項目グループ毎の再生成優良多体相関モデル群を合せて再生成モデルとすればよい。
(第8の実施の形態)
次に、本発明の第8の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜7の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第8の実施の形態としてのシステム分析装置8の機能ブロック構成を図22に示す。図22において、システム分析装置8は、本発明の第7の実施の形態としてのシステム分析装置7に対して、異常要因抽出部75に替えて異常要因抽出部85を備える点が異なる。異常要因抽出部85は、異常要因抽出部75に対して、再予測値算出部751に替えて再予測値算出部851を備える点が異なる。また、システム分析装置8は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図22において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置8およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置8およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
異常要因抽出部85は、異常判定部29によって被監視システム9の状態が異常と判定されると動作するよう構成される。なお、上述したように、異常判定部29によってモデル破壊情報のモデル破壊情報記憶部204への登録が行われる場合、異常要因抽出部85は、モデル破壊情報記憶部204にモデル破壊情報が新たに追加されると動作するよう構成される。具体的には、異常要因抽出部85は、同一時刻に対する複数のモデル破壊情報の各々に対して、モデル破壊再検出部754と、後述の再予測値算出部851と、部分異常度算出部252と、異常統計値算出部253とを用いて、データ項目別の異常統計値を算出する。
ここで、同一時刻に対する複数のモデル破壊情報とは、被監視システム9の状態情報に基づく異なる構成の複数の多体相関モデル群について、同一時刻において検出されるモデル破壊を表す情報である。例えば、同一時刻に対する複数のモデル破壊情報は、分析モデルについてのモデル破壊情報と、再生成モデルについてのモデル破壊情報とであってもよい。本発明の第7の実施の形態で説明したように、再生成モデルについてのモデル破壊情報は、分析モデルについてのモデル破壊情報のモデル破壊発生時刻に関して生成されたものである。したがって、これらのモデル破壊情報は、同一時刻に対する複数のモデル破壊情報に相当する。
また、異常要因抽出部85は、各モデル破壊情報に基づき算出されたデータ項目別の異常統計値に基づいて、データ項目別の最終的な異常統計値を算出する。異常要因抽出部85に含まれる各機能ブロックの構成の詳細については後述する。そして、異常要因抽出部85は、データ項目別の最終的な異常統計値がより高いものから順に、被監視システム9の異常要因の候補となるデータ項目を抽出する。例えば、異常要因抽出部85は、最終的な異常統計値が所定の閾値以上のデータ項目を、異常要因の候補となるデータ項目として抽出してもよい。また、例えば、異常要因抽出部85は、最終的な異常統計値が高いものから順に所定数のデータ項目を、異常要因候補として抽出してもよい。異常要因の候補となるデータ項目を抽出する際の、最終的な異常統計値に関する閾値やデータ項目数は、運用者が任意の数値を設定することができる。
ここで、同一時刻に対する複数のモデル破壊情報から、データ項目別の最終的な異常統計値を算出する処理の具体例について説明する。例えば、異常要因抽出部85は、全てのモデル破壊情報にわたってその異常統計値が閾値以上となっているデータ項目については、全てのモデル破壊情報におけるそのデータ項目についての異常統計値の統計量を、そのデータ項目の最終的な異常統計値とする。また、異常要因抽出部85は、少なくとも一部のモデル破壊情報でその異常統計値が閾値以上となっていないデータ項目については、異常統計値がとりうる最小値を、そのデータ項目の最終的な異常統計値とする。このとき、一部のモデル破壊情報から当該データ項目の異常統計値が算出されない場合、異常要因抽出部85は、そのデータ項目の異常統計値に異常統計値がとりうる最小値を割り当てた後、上述の処理を実行する。なお、最終的な異常統計値を求めるための異常統計値の統計量としては、複数のモデル破壊情報のそれぞれに対するデータ項目別の異常統計値に基づいて、より異常と思われるデータ項目の異常統計値が高くなる統計量であれば、どのような統計量を用いてもよい。例えば、異常統計値の統計量としては、総和、最大値、最小値、平均値、中央値のいずれか一つを用いてもよい。
また、同一時刻に対する複数のモデル破壊情報からデータ項目別の最終的な異常統計値を算出する処理の他の具体例について説明する。この具体例は、同一時刻に対する複数のモデル破壊情報を生成した各モデルが、本発明の第5〜7の実施の形態のように、代表データ項目を含むように生成される場合に用いることが可能である。統一的に説明するため、データ項目が分類され、そのデータ項目グループごとに、代表データ項目が選出されるものとして説明する。データ項目が分類されない場合は、データ項目グループの数が1つの場合に対応する。ここで、データ項目グループごとに、代表データ項目がN個選出されたとする(Nは整数)。つまり、例えば、多体相関モデル再生成部7541が、データ項目グループ毎に、分析モデルの生成に用いられた代表データ項目(一次代表データ項目)以外のデータ項目のうち、二次代表データ項目からN次代表データ項目までを選出したとする。そして、多体相関モデル再生成部7541が、データ項目グループ毎に、二次代表データ項目からN次代表データ項目までをそれぞれ代表データ項目として、N−1個の再生成優良多体相関モデル群を生成したとする。そして、モデル破壊再検出部754が、データ項目グループ毎のN−1個の再生成優良多体相関モデル群のそれぞれにおいて、分析モデルでのモデル破壊発生時刻と同一時刻におけるモデル破壊情報を生成したとする。なお、モデル破壊検出部24は、データ項目グループ毎に一次代表データ項目を代表データ項目として生成された優良多体相関モデル群について、それぞれモデル破壊情報を生成しているとする。これにより、データ項目グループ毎に、同一時刻に対するN個のモデル破壊情報が生成される。ここでは、各データ項目グループの一次代表データ項目を代表データ項目として生成された優良多体相関モデル群のモデル破壊情報を、「一次代表データ項目に基づくモデル破壊情報」とも記載する。また、各データ項目グループのn次代表データ項目を代表データ項目として生成された再生成優良多体相関モデル群のモデル破壊情報を、「n次代表データ項目に基づくモデル破壊情報」とも記載する。ただし、nは、2以上N以下の整数である。このとき、異常要因抽出部85は、データ項目別の最終的な異常統計値を、以下のように算出してもよい。例えば、異常要因抽出部85は、あるデータ項目グループのn次代表データ項目に基づくモデル破壊情報におけるn次データ項目の異常統計値と、そのデータ項目グループの一次代表データ項目に基づくモデル破壊情報におけるn次代表データ項目の異常統計値とを比較する。そして、異常要因抽出部85は、それらの異常統計値のうち最小値を、そのデータ項目グループのn次代表データ項目の最終的な異常統計値とする。この処理の例を、データ項目グループが1つであり、二次代表データ項目までが選出され、一次代表データ項目に基づくモデル破壊情報および二次代表データ項目に基づくモデル破壊情報が生成された場合について、具体的に説明する。この場合、異常要因抽出部85は、一次代表データ項目に基づくモデル破壊情報における二次代表データ項目の異常統計値と、二次代表データ項目に基づくモデル破壊情報における二次代表データ項目の異常統計値とを比較する。そして、異常要因抽出部85は、これらの異常統計値のより小さい方を、二次代表データ項目の最終的な異常統計値とする。同様に、異常要因抽出部85は、各データ項目について、このような処理を用いて最終的な異常統計値を算出してもよい。
次に、異常要因抽出部85に含まれる再予測値算出部851の構成の詳細について説明する。
再予測値算出部851は、同一時刻に対する複数のモデル破壊情報のそれぞれに対して、データ項目別の再予測値を算出する。例えば、前述のように、同一時刻に対する複数のモデル破壊情報として、分析モデルについてのモデル破壊情報と、再生成モデルについてのモデル破壊情報とを適用する場合を想定する。この場合、再予測値算出部851は、本発明の第2の実施の形態における再予測値算出部251と同様に、モデル破壊情報記憶部204へ新たに登録された分析モデルのモデル破壊情報について、再予測値を算出する。また、さらに、再予測値算出部851は、本発明の第7の実施の形態における再予測値算出部751と同様に、分析モデルのモデル破壊情報と同一のモデル破壊発生時刻に対応する再生成モデルのモデル破壊情報について、再予測値を算出する。
以上のように構成されたシステム分析装置8の動作について図面を参照して説明する。なお、システム分析装置8の動作の概略については、図20を参照して説明した本発明の第7の実施の形態としてのシステム分析装置7の動作の概略と略同様である。ただし、ステップS713における異常要因抽出動作の詳細が異なる。
本実施の形態における異常要因抽出動作を図23に示す。
まず、異常要因抽出部85は、モデル破壊情報記憶部204へ新たに登録された分析モデルのモデル破壊情報に基づいて、データ項目別の異常統計値を算出する(ステップS801)。このステップの詳細は、再予測値算出部851と、部分異常度算出部252と、異常統計値算出部253とによって、図8に示したステップS301〜S309と略同様に実行される。
次に、異常要因抽出部85は、モデル破壊情報記憶部204へ新たに登録された分析モデルと同一のモデル破壊発生時刻に対応して生成された再生成モデルのモデル破壊情報に基づいて、データ項目別の異常統計値を算出する(ステップS802)。このステップの詳細は、再予測値算出部851と、部分異常度算出部252と、異常統計値算出部253とによって、再生成モデルに関して、図8に示したステップS301〜S309と略同様に実行される。
次に、異常要因抽出部85は、ステップS801およびS802でそれぞれ算出されたデータ項目別の異常統計値に基づいて、データ項目別の最終的な異常統計値を算出する(ステップS803)。
次に、異常要因抽出部85は、各データ項目の最終的な異常統計値に基づいて、異常要因の候補となるデータ項目を抽出し、通知する(ステップS804)。例えば、前述のように、異常要因抽出部85は、最終的な異常統計値が閾値より高いものを抽出し、異常要因候補として通知してもよい。また、例えば、異常要因抽出部85は、最終的な異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出し通知してもよい。
以上で、異常要因抽出部85は、異常要因抽出動作を終了する。
なお、本実施の形態では、本発明の第7の実施の形態に対して、複数のモデル破壊情報に基づいて最終的な異常要因の候補を抽出する構成を適用する例について説明した。これに限らず、複数のモデル破壊情報に基づいて最終的な異常要因の候補を抽出する本実施の形態の構成を、本発明の第6の実施の形態に対して適用してもよい。この場合、多体相関モデル再生成部は、データ項目グループごとに、二次代表以降の代表データ項目を選出する。そして、多体相関モデル再生成部は、データ項目グループごとに二次代表以降の代表データ項目ごとに生成される複数の再生成優良多体相関モデル群を合わせて、本実施の形態における再生成モデルとすればよい。ただし、最終的な異常統計値を出す処理によっては、それぞれの再生成優良多体相関モデル群は、いずれのデータ項目を代表データ項目として生成されたものであるかを区別できるようになっている必要がある。
次に、本発明の第8の実施の形態の効果について述べる。
本発明の第8の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、より的確に抽出することができる。
その理由について述べる。本実施の形態では、本発明の第7の実施の形態と略同一の構成に加え、異常要因抽出部が、代表データ項目の異なる優良多体相関モデル群に対する複数のモデル破壊情報から、最終的な異常要因の候補を抽出する。このように、本実施の形態は、同一時刻に対する複数のモデル破壊情報を用いることにより、多面的異常をとらえることができる。また、それだけではなく、本実施の形態では、それら複数のモデル破壊情報が、モデル破壊情報による異常要因の抽出結果の精度が高くなるように構成された優良多体相関モデル群および再生成優良多体相関モデル群から算出されたものである。したがって、本実施の形態において、それら複数のモデル破壊情報を総合して得られた異常要因の抽出結果は、より的確な結果である可能性が高まる。よって本実施の形態は上述の効果を奏する。
なお、本実施の形態では、同一時刻に対する複数のモデル破壊情報として、分析モデルについてのモデル破壊情報と、再生成モデルについてのモデル破壊情報とを用いる例について説明したが、これらに限らない。例えば、同一時刻に対する複数のモデル破壊情報として、これらのモデル破壊情報に加えて、代表データ項目または二次代表データ項目が異なる優良多体相関モデル群についてのモデル破壊情報を加えてもよい。例えば、具体的には、多体相関モデル再生成部は、代表データ項目または二次代表データ項目として選出されていないデータ項目から、既に選出済みの二次代表データ項目よりふさわしいデータ項目を、新たな二次代表データ項目として選出してもよい。そして、多体相関モデル再生成部は、新たな二次代表データ項目を含む新たな再生成モデルを生成してもよい。これにより、モデル破壊再検出部は、新たな再生成モデルについてモデル破壊情報を生成してもよい。このような処理を所定の回数、繰り返すことにより、本実施の形態は、同一時刻に対して、3つ以上のモデル破壊情報を生成可能となる。なお、この処理の繰り返し回数は、運用者が任意に設定してもよい。ただし、新たに選出された二次代表データ項目の破壊スコアが、最初に選出された二次代表データ項目の破壊スコアと等しくなければ、その新たに選出された二次代表データ項目による異常要因の抽出結果の精度が低下する。その観点では、上記処理の繰り返し処理は、新たに選出された二次代表データ項目の破壊スコアと、最初に選出された二次代表データ項目の破壊スコアとが略同一である範囲に限定することが好ましい。また、二次代表データ項目の代表スコアは高いほど、異常要因の抽出結果の精度が高いことが期待できる。そこで、新たに選出された二次代表データ項目の代表スコアと、最初に選出された二次代表データ項目の代表スコアとの差が大きい場合は、新たに選出された二次代表データ項目を用いたモデル破壊情報の生成を中止した方が好ましい。
また、本発明の第2および第3の実施の形態において、標準寄与率が、分析モデルの生成に用いられた所定期間の状態系列情報を用いて算出される場合を中心に説明した。この場合、標準寄与率取得部は、図6において、ステップS103で分析モデルを生成後、ステップS104で標準寄与率を算出していた。これに限らず、標準寄与率取得部は、モデル破壊検出後に、モデル破壊が発生した各多体相関モデルについて標準寄与率を算出してもよい。例えば、前述のように、標準寄与率は、モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に対して所定条件を満たす値を持つ期間の状態系列情報を用いて算出可能である。あるいは、前述のように、標準寄与率は、モデル破壊の発生した時点より以前の(例えば直前の)所定期間の状態系列情報を用いて算出可能である。このような場合、各実施の形態における標準寄与率取得部は、図6のステップS104で標準寄与率を算出する代わり、図8における多体相関モデル毎の繰り返し処理において、ステップS301の再予測値算出処理の前に、標準寄与率算出処理を行えばよい。
また、本発明の第2から第8の実施の形態において、優良多体相関モデルの回帰式の優良度が、当該モデルの構築に用いられた状態情報から算出される場合を説明した。これに限らず、優良多体相関モデルの回帰式の優良度は、当該モデルの構築に用いられていない状態情報から算出されてもよい。例えば、各実施の形態において、分析モデル取得部またはモデル破壊再検出部は、当該モデルの構築に用いられていない状態情報から、個々の回帰式の優良度Fを算出してもよい。他の例として、分析モデル取得部またはモデル破壊再検出部は、当該モデルの構築に用いられていない状態情報から、多体相関モデルのモデル破壊情報を生成し、そのモデル破壊情報から、個々の回帰式の優良度を算出してもよい。モデル破壊情報から個々の回帰式の優良度を求める場合、例えば、1−(当該回帰式がモデル破壊となった頻度)/(モデル破壊情報の生成に用いられた状態情報のインデックス数)を回帰式の優良度とすることが可能である。状態情報のインデックス数の考え方は、優良度Fの算出方法を説明した箇所に具体的な説明がある。また、分析モデル取得部またはモデル破壊再検出部は、当該モデルの構築に用いられた状態情報から算出された個々の回帰式の優良度と、当該モデルの構築に用いられていない状態情報から算出された個々の回帰式の優良度とに基づいて、優良多体相関モデルを抽出してもよい。複数の優良度を用いて優良多体相関モデルを抽出する場合の例について説明する。ここでは、2つの優良度を用いることを想定する。1つめの優良度は優良度Fであり、2つめの優良度は、1−(当該回帰式がモデル破壊となった頻度)/(モデル破壊情報の生成に用いられた状態情報のインデックス数)であるとする。この場合、分析モデル取得部またはモデル破壊再検出部は、それら2つの優良度が、それぞれの優良度に対してあらかじめ設定された閾値を超えたものを優良多体相関モデルとしてよい。これらの閾値は、運用者によって任意に設定可能である。
また、本発明の第4から第8の実施の形態において、標準寄与率が、分析モデルの生成に用いられた所定期間の状態系列情報を用いて算出される場合を中心に説明した。この場合、標準寄与率取得部は、図6において、ステップS103で分析モデルを生成後、ステップS104で標準寄与率を算出していた。これに限らず、標準寄与率取得部は、モデル破壊検出後に、モデル破壊が発生した各多体相関モデルについて標準寄与率を算出してもよい。例えば、前述のように、標準寄与率は、モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に対して所定条件を満たす値を持つ期間の状態系列情報を用いて算出可能である。あるいは、前述のように、標準寄与率は、モデル破壊の発生した時点より以前の(例えば直前の)所定期間の状態系列情報を用いて算出可能である。このような場合、各実施の形態における標準寄与率取得部は、図6のステップS104で標準寄与率を算出する代わり、図8における多体相関モデル毎の繰り返し処理において、ステップS301の再予測値算出処理の前に、標準寄与率算出処理を行えばよい。
また、上述した本発明の各実施の形態において、異常要因抽出部は、異常要因の候補となるデータ項目群を示す情報として、データ項目の名称を通知する例を示した。さらに、異常要因抽出部は、異常要因の候補となるデータ項目について異常統計値も通知するようにしてもよい。この場合、本実施の形態は、通知対象の運用者等に対して、より優先的に確認すべきデータ項目を示すことができる。その他、各実施の形態の異常要因抽出部は、異常要因の候補となるデータ項目群を表す情報として、他の情報を出力してもよい。
また、上述した本発明の各実施の形態において、被監視システムが発電プラントである例を示した。これに限らず、被監視システムは、その状態を示す情報から1つ以上の多体相関モデルを生成可能であり、かつ、1つ以上の多体相関モデルのモデル破壊により異常の発生有無を判定可能なシステムであれば、その他のシステムであってもよい。例えば、被監視システムは、IT(Information Technology)システム、プラントシステム、構造物、輸送機器等であってもよい。この場合でも、各実施の形態のシステム分析装置は、そのような被監視システムの状態を示す情報に含まれるデータの種目をデータ項目として、分析モデルを生成し、モデル破壊の検出および異常要因データ項目の抽出を行うことが可能である。
また、上述した本発明の各実施の形態において、システム分析装置の各機能ブロックが、記憶装置またはROMに記憶されたコンピュータ・プログラムを実行するCPUによって実現される例を中心に説明した。これに限らず、各機能ブロックの一部、全部、または、それらの組合せが専用のハードウェアにより実現されていてもよい。
また、上述した本発明の各実施の形態において、情報受信装置の機能ブロックは、複数の装置に分散されて実現されてもよい。
また、上述した本発明の各実施の形態において、各フローチャートを参照して説明したシステム分析装置の動作を、本発明のコンピュータ・プログラムとしてコンピュータ装置の記憶装置(記憶媒体)に格納しておいてもよい。そして、係るコンピュータ・プログラムを当該CPUが読み出して実行するようにしてもよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコードあるいは記憶媒体によって構成される。
また、上述した各実施の形態は、適宜組合せて実施されることが可能である。
以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
この出願は、2014年12月5日に出願された日本出願特願2014−246936号および2015年2月17日に出願された日本出願特願2015−028450を基礎とする優先権を主張し、その開示の全てをここに取り込む。