JPWO2016088362A1

JPWO2016088362A1 - システム分析装置、システム分析方法および記憶媒体

Info

Publication number: JPWO2016088362A1
Application number: JP2016562301A
Authority: JP
Inventors: 昌尚棗田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2014-12-05
Filing date: 2015-12-01
Publication date: 2017-09-07
Anticipated expiration: 2035-12-01
Also published as: JP6658540B2; US10719577B2; WO2016088362A1; US20170315961A1

Abstract

本発明は、異常によるセンサ値の変化が僅かでその変化が複数センサに現れたとしても、異常要因特定に有用な情報を的確に抽出する。分析モデル取得部１１は、１以上の多体相関モデルを含む分析モデルを取得する。標準寄与率取得部１２は、各多体相関モデルについて各説明変数データ項目の標準寄与率を取得する。状態情報収集部１３は、状態情報を収集する。モデル破壊検出部１４は、各多体相関モデルのモデル破壊を検出する。再予測値算出部１５１は、モデル破壊した各多体相関モデルについて説明変数データ項目毎に再予測値を算出する。部分異常度算出部１５２は、各再予測値によるモデル破壊の発生有無に基づいて多体相関モデル毎にデータ項目別の部分異常度を算出する。異常統計値算出部１５３は、部分異常度をデータ項目別に集計して異常統計値を算出する。異常要因抽出部１５は、異常統計値に基づき異常要因候補のデータ項目を抽出する。

Description

本発明は、システムの状態を分析するシステム分析装置、システム分析方法およびシステム分析プログラムに関する。

システムの構成要素から得られるセンサ値に基づいて、システムの状態を分析する処理を実行するシステム分析装置が利用されている。

例えば、特許文献１には、被監視装置の複数種目の性能値の実測データに基づいて、異常の検出能力が高い相関モデルを生成する技術が記載されている。

また、特許文献２には、移動機から送信されたデータに基づいて、所定の事象の評価や予測を行う相関モデルを抽出する技術が記載されている。

また、特許文献３には、製造物の製造工程において測定される複数の特性値の測定データに基づいて、測定項目間の階層的な関係を自動的に可視化する技術が記載されている。

このような分析処理は、システムを安全かつ効率的に運用する目的で行われる。その分析処理のひとつに、センサ値を多変量解析することにより、システムの状態が正常か異常かを判定する処理がある。このような分析処理は、システムの状態が異常であると判定した場合に、異常要因特定に有用な情報を、運用者やシステムに通知する。異常要因特定に有用な情報として、例えば、異常の影響が表れているセンサを通知するだけでも、異常要因特定の初動を早めることに有効である。

ここで、システムは、例えば、ＩＣＴ（Information and Communication Technology）システム、化学プラント、発電所、動力設備等、相互に影響を及ぼしあう要素から構成される、まとまりや仕組みである。

また、センサ値は、システムの構成要素から得られる各種の値である。例えば、センサ値は、システムの構成要素に設けられたセンサを通して取得される計測値である。そのような計測値としては、弁の開度、液面高さ、温度、流量、圧力、電流、電圧等がある。また、例えば、センサ値は、そのような計測値を用いて算出される予測値である。また、例えば、センサ値は、システムを所望の稼働状態に変更するために情報処理装置によって発せられる制御信号である。以下、システムの構成要素から得られる各種の値を、その種別を区別することなく、単にセンサ値と呼ぶ。

特に、障害の発生が経済や人命等へ及ぼす影響が大きいシステムでは、そのシステムで過去に発生していない異常について、その要因特定に有用な情報を通知する機能が重要となる。これは、システム障害の影響が大きければ大きいほど、障害の発生を未然に防ぐ対策が施されるため、発生する異常が、そのシステム分析装置にとって未知の異常となる可能性が高くなるためである。

過去に同様の異常が発生していることを前提とせずに、異常要因特定に有用な情報を通知するシステム分析技術の一例が、特許文献４〜特許文献７に記載されている。

特許文献４に記載の関連技術は、複数の回帰式を用いてシステムを分析する。そして、この関連技術は、各回帰式について、該回帰式について設定された閾値を予測誤差が超えたか否かを判断する。そして、この関連技術は、予測誤差が閾値を超えた回帰式を、予測誤差の大きい順に、異常発生原因の候補として出力する。

また、特許文献５に記載の関連技術は、マハラノビス・タグチメソッドを用いてシステムを分析する。そして、この関連技術は、マハラノビス距離への各データ項目の貢献度を、異常度として出力する。

また、特許文献６に記載の関連技術は、主成分分析を用いてシステムを分析する。そして、この関連技術は、Ｑ統計量またはホテリングＴ２分散への各データ項目の寄与度を、異常度として出力する。

また、特許文献７に記載の関連技術は、複数の製造装置からなる製造システムにおけるプロセスの異常を検出する。この関連技術は、プロセス実行時に得られるプロセスデータの特徴量から、そのプロセスに適用する異常検出要因分析ルールを特定する。そして、この関連技術は、その異常検出要因分析ルールにより求まる予測値が異常を示す場合、その異常に対する各データ項目の寄与度と共に、異常発生を通知する。

なお、ここでは、「データ項目」とは、システムの構成要素から得られる複数種のセンサ値の各種目に対応する情報である。例えば、「データ項目」とは、その種目に対応するセンサ値の集合を表すものであってもよい。また、例えば、「データ項目」とは、対応するセンサ値を識別する識別情報を表すものであってもよい。

国際公開第２０１４／１３２６１２号特開２０１２−２２６３９０号公報特開２０１１−１５０４９６号公報特許第５１０８１１６号公報特開２００７−２１３１９４号公報特許第４４６８２６９号公報特開２００９−５４８４３号公報

ここで、システム停止や事故を回避するためには、障害が発生する兆候となるシステムの状態異常をできる限り早く発見し、異常要因を特定する必要がある。このとき、異常の影響は、複数のセンサ値に現れる可能性が高い。これは、システムを構成する機器などの要素が、情報処理や、化学製品の生産、エネルギー変換等のシステムの目的を達成するために、他の要素と連動して動作するからである。そのため、システムの構成要素から得られるセンサ値も同様に、他のセンサ値と連動して変化するためである。

つまり、システム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出できる必要がある。

ここで、特許文献４に記載された関連技術は、異常要因特定に有用な情報として、予測誤差が閾値を超えた回帰式を予測誤差の大きい順に並べた結果を提供する。しかし、回帰式に含まれるデータ項目に、ひとつでも異常と関係ないものが含まれている場合、提供される結果には、異常と関係ないデータ項目が、異常と関係あるデータ項目として含まれることになる。これは、回帰式に含まれるデータ項目の数や、予測誤差が閾値を超えた回帰式の数が多くなるにしたがって、異常の影響を受けているデータ項目の特定を難しくする原因となる。なお、特許文献４には、グラフィカルモデリングや相互相関関数による絞り込み処理に関する記載がある。しかしながら、これらの処理は、正常と異常とを区別せずに、現象の伝搬方向を示すものである。したがって、これらの処理は、異常の影響を受けているデータ項目の絞り込みに直接寄与しない。

また、特許文献５〜６に記載された関連技術は、全てのデータ項目を含む１つのモデルでシステムを監視する。また、特許文献７に記載された関連技術は、１つのプロセスについて適用可能な１つのルールでそのプロセスの異常を検知する。このため、これら特許文献５〜７に記載された関連技術は、最もセンサノイズの大きなデータ項目によって、異常検知感度が制限される。その結果、この関連技術は、複数のセンサに異常の影響が現れたとしても、異常の影響が現れたセンサを全て抽出できないことがある。

また、特許文献１〜３には、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れた場合に、異常要因を特定する技術については記載がない。

本発明は、上述の課題を解決するためになされたものである。すなわち、本発明は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出できるシステム分析技術を提供することを目的とする。

上記目的を達成するために、本発明のシステム分析装置は、被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを１つ以上含む分析モデルを取得する分析モデル取得手段と、前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得する標準寄与率取得手段と、前記状態情報を収集する状態情報収集手段と、収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出するモデル破壊検出手段と、前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出する再予測値算出手段と、前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出する部分異常度算出手段と、前記部分異常度を前記データ項目別に集計して異常統計値を算出する異常統計値算出手段と、前記再予測値算出手段、前記部分異常度算出手段および前記異常統計値算出手段を用いて、前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する異常要因抽出手段と、を備える。

また、本発明のシステム分析方法は、コンピュータ装置が、被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを１つ以上含む分析モデルを取得し、前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得し、前記状態情報を収集し、収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出し、前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出し、前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出し、前記部分異常度を前記データ項目別に集計して異常統計値を算出し、前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する。

また、本発明の記憶媒体は、被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを１つ以上含む分析モデルを取得する分析モデル取得ステップと、前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得する標準寄与率取得ステップと、前記状態情報を収集する状態情報収集ステップと、収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出するモデル破壊検出ステップと、前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出する再予測値算出ステップと、前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出する部分異常度算出ステップと、前記部分異常度を前記データ項目別に集計して異常統計値を算出する異常統計値算出ステップと、前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する異常要因抽出ステップと、をコンピュータ装置に実行させるシステム分析プログラムを記憶している。

本発明は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出できるシステム分析技術を提供することができる。

本発明の第１の実施の形態としてのシステム分析装置の機能ブロック図である。本発明の第１の実施の形態としてのシステム分析装置のハードウェア構成の一例を示す図である。本発明の第１の実施の形態としてのシステム分析装置の動作の概略を説明するフローチャートである。本発明の第１の実施の形態としてのシステム分析装置の異常要因抽出動作の詳細を説明するフローチャートである。本発明の第２の実施の形態としてのシステム分析装置の機能ブロック図である。本発明の第２の実施の形態としてのシステム分析装置の動作の概略を説明するフローチャートである。本発明の第２の実施の形態としてのシステム分析装置の分析モデル生成動作の詳細を説明するフローチャートである。本発明の第２の実施の形態としてのシステム分析装置の異常要因抽出動作の詳細を説明するフローチャートである。本発明の第２の実施の形態における分析モデル生成動作の具体例を説明する図である。本発明の第２の実施の形態における異常要因抽出動作の具体例を説明する図である。本発明の第３の実施の形態としてのシステム分析装置の機能ブロック図である。本発明の第３の実施の形態としてのシステム分析装置の分析モデル生成動作の詳細を説明するフローチャートである。本発明の第４の実施の形態としてのシステム分析装置の機能ブロック図である。本発明の第４の実施の形態としてのシステム分析装置の異常要因抽出動作の詳細を説明するフローチャートである。本発明の第５の実施の形態としてのシステム分析装置の機能ブロック図である。本発明の第５の実施の形態としてのシステム分析装置の分析モデル生成動作の詳細を説明するフローチャートである。本発明の第６の実施の形態としてのシステム分析装置の機能ブロック図である。本発明の第６の実施の形態としてのシステム分析装置の分析モデル生成動作の詳細を説明するフローチャートである。本発明の第７の実施の形態としてのシステム分析装置の機能ブロック図である。本発明の第７の実施の形態としてのシステム分析装置の動作の概略を説明するフローチャートである。本発明の第７の実施の形態としてのシステム分析装置の再生成優良多体相関モデル群のモデル情報およびモデル破壊情報の生成動作の詳細を説明するフローチャートである。本発明の第８の実施の形態としてのシステム分析装置の機能ブロック図である。本発明の第８の実施の形態としてのシステム分析装置の異常要因抽出動作の詳細を説明するフローチャートである。

以下、本発明の実施の形態について、図面を参照して詳細に説明する。

（第１の実施の形態）
本発明の第１の実施の形態としてのシステム分析装置１の機能ブロック構成を図１に示す。図１において、システム分析装置１は、分析モデル取得部１１と、標準寄与率取得部１２と、状態情報収集部１３と、モデル破壊検出部１４と、異常要因抽出部１５とを備える。また、異常要因抽出部１５は、再予測値算出部１５１と、部分異常度算出部１５２と、異常統計値算出部１５３とを有する。また、システム分析装置１は、被監視システム９に接続される。

システム分析装置１は、被監視システム９を分析することにより、被監視システム９の異常要因を出力する装置である。なお、図１において、破線の矩形は、当該破線で囲まれた各機能ブロックが、分析モデル取得部１１、標準寄与率取得部１２および状態情報収集部１３によって取得された情報を用いて動作することを表している。なお、図１において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。

被監視システム９は、システム分析装置１によって監視されるシステムである。被監視システム９は、１つ以上の被監視装置９０を含む。例えば、被監視システム９の一例としては、発電プラントシステムが挙げられる。この場合、被監視装置９０は、例えば、タービン、給水加熱器、復水器などである。また、被監視装置９０には、例えば、配管や信号線など、装置間を接続する要素が含まれていてもよい。また、被監視システム９は、上述の発電プラントシステムのようにシステム全体であってもよいし、あるシステムにおいてその一部の機能を実現する部分であってもよい。

被監視装置９０の各々は、自装置で得られるセンサ値を所定タイミング毎に計測し、システム分析装置１に送信する。以下では、通常の計測機器のようにハードウェアとしての実態があるものだけではなく、ソフトセンサや、制御信号等もセンサと呼ぶこととする。センサ値は、センサから得られる値である。センサ値の例としては、弁の開度、液面高さ、温度、流量、圧力、電流、電圧等、設備に設置された計測機器によって計測される計測値が挙げられる。また、センサ値の他の例としては、該計測値から算出される予測値が挙げられる。また、センサ値の他の例としては、制御信号の値が挙げられる。以下では、各センサ値は、整数や小数といった数値で表されるものとする。

また、本実施の形態では、各被監視装置９０から得られるセンサ値に対応するセンサごとに、１つのデータ項目を割り当てるものとする。また、各被監視装置９０から同一と見なされるタイミングで収集されたセンサ値の集合を、状態情報と呼ぶ。また、状態情報に含まれるセンサ値に対応するデータ項目の集合を、データ項目群と呼ぶ。つまり、状態情報は、複数のデータ項目によって構成される。ここで、「同一と見なされるタイミングで収集される」とは、各被監視装置９０で同一時刻または所定範囲内の時刻に計測されることであってもよい。また、「同一と見なされるタイミングで収集される」とは、システム分析装置１による一連の収集処理によって収集されることであってもよい。なお、被監視装置９０とシステム分析装置１との間に、被監視装置９０が取得したセンサ値を記憶する記憶装置（図示せず）が設けられていてもよい。そのような記憶装置とは、例えば、データサーバ、ＤＣＳ（Distributed Control System）、または、プロセスコンピュータ等であってもよい。そのような場合には、被監視装置９０は、任意のタイミングでセンサ値を取得して記憶装置に記憶させる。そして、システム分析装置１は、記憶装置に記憶されているセンサ値を所定タイミングで読み出せばよい。

ここで、システム分析装置１は、図２に示すようなハードウェア要素を含むコンピュータ装置によって構成可能である。図２において、システム分析装置１は、ＣＰＵ（Central Processing Unit）１００１、メモリ１００２、出力装置１００３、入力装置１００４、および、ネットワークインタフェース１００５を含む。メモリ１００２は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、補助記憶装置（ハードディスク等）等によって構成される。出力装置１００３は、ディスプレイ装置やプリンタ等のように、情報を出力する装置によって構成される。入力装置１００４は、キーボードやマウス等のように、ユーザ操作の入力を受け付ける装置によって構成される。ネットワークインタフェース１００５は、ネットワークに接続するインタフェースである。この場合、システム分析装置１の各機能ブロックは、メモリ１００２に格納されるコンピュータ・プログラムを読み込んで実行するとともに出力装置１００３、入力装置１００４、ネットワークインタフェース１００５を制御するＣＰＵ１００１によって構成される。なお、システム分析装置１およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

次に、システム分析装置１の各機能ブロックの詳細について説明する。

分析モデル取得部１１は、被監視システム９の分析モデルを取得する。分析モデルは、被監視システム９の状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを、１つ以上含むモデルである。ここで、相関モデルとは、データ項目間の関係を定義した回帰式と、該回帰式の予測誤差の許容範囲とを含む情報をいうものとする。また、多体相関モデルとは、そのような相関モデルのうち、３つ以上のデータ項目を用いて構成される回帰式を含む相関モデルをいうものとする。また、そのような分析モデルは、被監視システム９について得られた状態情報の時系列に基づき生成されたものであってもよい。

例えば、分析モデル取得部１１は、メモリ１００２に記憶された分析モデルを取得してもよい。また、分析モデル取得部１１は、入力装置１００４、ネットワークインタフェース１００５、または、可搬型記録媒体等を介して、外部から入力される分析モデルを取得してもよい。

標準寄与率取得部１２は、各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数として含まれる各データ項目が寄与する割合（標準寄与率）を取得する。例えば、標準寄与率は、分析モデルの生成に用いられた状態情報の時系列を用いてあらかじめ算出されたものであってもよい。なお、以降では、回帰式に説明変数として含まれるデータ項目を、説明変数データ項目とも記載する。また、回帰式に目的変数として含まれるデータ項目を、目的変数データ項目とも記載する。

例えば、標準寄与率取得部１２は、各多体相関モデルについて、各説明変数データ項目の標準寄与率として、メモリ１００２に記憶された情報を取得してもよい。また、標準寄与率取得部１２は、入力装置１００４、ネットワークインタフェース１００５、または、可搬型記録媒体等を介して、外部から入力される標準寄与率を取得してもよい。

状態情報収集部１３は、被監視システム９から状態情報を収集する。

モデル破壊検出部１４は、収集された状態情報に対して分析モデルを適用することにより、各多体相関モデルにモデル破壊が発生したか否かを検出する。具体的には、モデル破壊検出部１４は、収集された状態情報を構成するデータ項目のセンサ値を、分析モデルに含まれる各多体相関モデルの回帰式に適用する。ここで、状態情報の適用により多体相関モデルにモデル破壊が発生する場合がある。モデル破壊とは、その回帰式の予測値および実測値の差（予測誤差）が、その許容範囲を超える現象をいう。モデル破壊検出部１４は、各多体相関モデルについて、状態情報の適用によりこのようなモデル破壊が発生したか否かを検出する。

異常要因抽出部１５は、後述の再予測値算出部１５１と、後述の部分異常度算出部１５２と、後述の異常統計値算出部１５３とを用いて、データ項目別の異常統計値を算出する。また、異常要因抽出部１５は、データ項目別の異常統計値に基づいて、被監視システム９の異常要因の候補となるデータ項目を抽出する。そして、異常要因抽出部１５は、抽出したデータ項目を表す情報を通知する。例えば、異常要因抽出部１５は、異常要因の候補となるデータ項目の名称を、出力装置１００３等に出力してもよい。

ここで、異常要因の候補として抽出・通知するデータ項目の個数は、異常時に確認することが好ましいデータ項目の数として、運用者によって任意の数が設定されていてもよい。なお、障害の原因を見つけられる可能性を高め、障害全体の状況を把握するという観点からは、異常要因候補として抽出・通知するデータ項目の個数は、多いほど好ましい。また、誤報が発生したときの調査時間を短縮するという観点からは、抽出・通知するデータ項目の個数は、少ないほど好ましい。

再予測値算出部１５１は、モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、再予測値を算出する。再予測値の算出は、当該データ項目の状態情報および標準寄与率に基づいて行われる。ここで、再予測値により該当する多体相関モデルにモデル破壊が発生する場合と、発生しない場合とがある。

部分異常度算出部１５２は、各再予測値により多体相関モデルにモデル破壊が発生したか否かに基づいて、多体相関モデルごとにデータ項目別の異常度（部分異常度）を算出する。

例えば、この回帰式において、全ての説明変数データ項目による再予測値についてモデル破壊が発生したとする。この場合、部分異常度算出部１５２は、目的変数データ項目の部分異常度を、この回帰式における他のデータ項目の部分異常度より高くなるように算出してもよい。また、例えば、この回帰式において、少なくとも１つの再予測値ではモデル破壊が発生せず、少なくとも１つの再予測値ではモデル破壊が発生したとする。この場合、部分異常度算出部１５２は、再予測値によるモデル破壊を発生させた説明変数データ項目の部分異常度を、この回帰式における他のデータ項目の部分異常度より高くなるように算出してもよい。

異常統計値算出部１５３は、部分異常度をデータ項目別に集計して異常統計値を算出する。

以上のように構成されたシステム分析装置１の動作について、図面を参照して説明する。まず、システム分析装置１の動作の概略を図３に示す。なお、以下では、被監視システム９の分析モデルは、分析モデル取得部１１によってあらかじめ取得されているものとする。また、その分析モデルに含まれる各多体相関モデルについて、その回帰式に含まれる各説明変数データ項目の標準寄与率は、標準寄与率取得部１２によってあらかじめ取得されているものとする。

図３では、まず、状態情報収集部１３は、被監視システム９から状態情報を収集する（ステップＳ１）。

次に、モデル破壊検出部１４は、収集された状態情報を用いて、分析モデルに含まれる各多体相関モデルにモデル破壊が発生したか否かを検出する（ステップＳ２）。

モデル破壊の発生が検出された場合、異常要因抽出部１５は、モデル破壊の発生状況に基づいて、異常要因の候補となるデータ項目を抽出し、出力する（ステップＳ３）。このステップの詳細については後述する。

以上の動作を、システム分析装置１は、運用終了まで（ステップＳ４でＹｅｓ）継続する。

なお、ステップＳ４において、システム分析装置１は、入力装置１００４からの入力に基づいて、運用終了するか否かの判断を行ってもよい。あるいは、システム分析装置１は、あらかじめ定められたタイミングであるか否かに基づいて、判断を行ってもよい。あるいは、システム分析装置１は、被監視システム９から得られる各種情報があらかじめ定められた条件を満たすか否かに基づいて、判断を行ってもよい。また、これに限らず、システム分析装置１は、ステップＳ４における判断処理を、その他の方法により行ってもよい。

次に、ステップＳ３における異常要因抽出動作の詳細を、図４に示す。

図４では、まず、システム分析装置１は、モデル破壊が発生した多体相関モデルごとに、ステップＳ１１〜Ｓ１３の動作を繰り返す。

ここでは、まず、再予測値算出部１５１は、この多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、再予測値を算出する（ステップＳ１１）。再予測値の算出には、モデル破壊が発生した際に用いられた当該データ項目の状態情報と、当該データ項目の標準寄与率とが用いられる。

次に、部分異常度算出部１５２は、各再予測値について、再予測値でもこの多体相関モデルにモデル破壊が発生するか否かを評価する（ステップＳ１２）。

具体的には、部分異常度算出部１５２は、各説明変数データ項目による再予測値と、モデル破壊が発生した際に用いられた状態情報における目的変数データ項目に対応するセンサ値との差が、その多体相関モデルの予測誤差の許容範囲内かどうか評価すればよい。

次に、部分異常度算出部１５２は、この多体相関モデルの回帰式において、各再予測値によるモデル破壊の発生状況に基づいて、目的変数データ項目の部分異常度と、説明変数データ項目の部分異常度とを算出する（ステップＳ１３）。

モデル破壊が発生した全ての多体相関モデルの回帰式ごとにデータ項目別の部分異常度の算出を完了すると、異常統計値算出部１５３は、次のステップを実行する。すなわち、異常統計値算出部１５３は、各多体相関モデルの回帰式において算出した各データ項目の部分異常度を、全ての回帰式にわたってデータ項目別に集計する。そして、異常統計値算出部１５３は、集計により算出した統計値を、異常統計値とする（ステップＳ１４）。

次に、異常要因抽出部１５は、異常統計値に基づいて、被監視システム９の異常要因の候補となるデータ項目を抽出し、出力する（ステップＳ１５）。例えば、異常要因抽出部１５は、異常統計値の高い順に所定数までのデータ項目を出力してもよい。

以上で、システム分析装置１は、異常要因抽出動作を終了する。

次に、本発明の第１の実施の形態の効果について述べる。

本発明の第１の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出することができる。

その理由について説明する。

１つ目の理由は、本実施の形態では、分析モデルとして、被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを１つ以上含む分析モデルを用いるからである。このような分析モデルを用いることにより、本実施の形態は、多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、多体相関モデルのモデル破壊を再評価できる。その結果、本実施の形態は、どのデータ項目が異常なのかを、多体相関モデルの回帰式ごとに評価でき、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目を適切に切り分けることができる。このようにして、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。

２つ目の理由は、上述のような分析モデルは、１種類の目的変数に対して複数個の回帰式（多体相関モデル）を含み得るためである。このような分析モデルを用いることにより、本実施の形態は、異常検知精度を低下させるデータ項目がある場合にも対応可能となる。例えば、センサ値に含まれるセンサノイズが大きいデータ項目は、異常検知精度を低下させる。ここで、分析モデルに、あるデータ項目を目的変数として、異常検知精度を低下させるデータ項目が説明変数として含まれる回帰式が含まれるとする。このような場合でも、本実施の形態の分析モデルは、同じデータ項目を目的変数として、異常検知精度を低下させるデータ項目が説明変数として含まれない回帰式を含み得る。その結果、本実施の形態は、異常検知精度を低下させるデータ項目が回帰式に含まれることによる異常検知漏れを防ぐことができる。換言すると、分析モデルにおいて、１種類の目的変数に対する回帰式が１つに限られないため、本実施の形態は、異常によるセンサ値の変化が僅かであったとしても、異常検知漏れを防ぐことができる。さらに、１種類の目的変数に対する回帰式が１つに限られないため、ある回帰式が、その回帰式における目的変数としてのデータ項目が異常の影響を受けているかどうかの判断結果に寄与する割合が小さくなる。したがって、異常検知精度を低下させるデータ項目と同様に、異常要因の特定精度を低下させるデータ項目があったとしても、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目とを適切に切り分けることができる。このようにして、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。

３つ目の理由は、本実施の形態では、個々の回帰式における個々の説明変数データ項目について、標準寄与率を用いた再予測値に基づき部分異常度を算出し、さらに、部分異常度をデータ項目別に集計して異常統計値を算出するからである。このように、本実施の形態は、どのデータ項目が異常である可能性が高いかを多体相関モデルの回帰式ごとに評価した部分異常度を、さらに複数の多体相関モデルにわたって集計した異常統計値を用いる。その結果、本実施の形態は、回帰式単位で異常を検出する関連技術や、データ項目全体を１つのモデルに含めて監視する関連技術に比べて、異常要因の候補となるデータ項目をより精度よく抽出できる。

（第２の実施の形態）
次に、本発明の第２の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第１の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。

本発明の第２の実施の形態としてのシステム分析装置２の機能ブロック構成を図５に示す。図５において、システム分析装置２は、分析モデル取得部２１と、標準寄与率取得部２２と、状態情報収集部２３と、モデル破壊検出部２４と、異常要因抽出部２５と、異常判定部２９とを備える。また、分析モデル取得部２１は、多体相関モデル生成部２１１およびモデル抽出部２１２を有する。また、異常要因抽出部２５は、再予測値算出部２５１と、部分異常度算出部２５２と、異常統計値算出部２５３とを有する。また、システム分析装置２は、分析モデル記憶部２０１と、状態情報記憶部２０３と、モデル破壊情報記憶部２０４とを含む。なお、分析モデル記憶部２０１は、本発明の分析モデル取得部の一部の一実施形態を構成する。また、状態情報記憶部２０３は、本発明の状態情報収集部の一部の一実施形態を構成する。また、モデル破壊情報記憶部２０４は、本発明のモデル破壊検出部の一部の一実施形態を構成する。また、システム分析装置２は、被監視システム９に接続される。なお、被監視システム９の詳細については、本発明の第１の実施の形態における被監視システム９と同様の構成であるため、本実施の形態における説明を省略する。また、図５において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置２およびその各機能ブロックは、図２を参照して説明した本発明の第１の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置２およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

システム分析装置２は、被監視システム９の状態情報を所定タイミングで取得しながら、被監視システム９の分析モデルを構築し、構築した分析モデルを用いて被監視システム９の状態を分析する装置である。

状態情報収集部２３は、被監視システム９の状態情報を所定タイミングで収集し、状態情報記憶部２０３に保存する。以下、状態情報の時系列データを、状態系列情報とも記載する。

状態情報記憶部２０３は、状態情報収集部２３が収集した状態情報を時系列に沿って記憶する。換言すると、状態情報記憶部２０３は、状態情報収集部２３によって収集された状態情報を、状態系列情報として記憶する。状態情報記憶部２０３は、例えば、収集時間を示す情報と、状態情報とを対応づけて記憶してもよい。状態情報は、より具体的には、収集されたセンサ値の集合である。例えば、状態情報は、収集対象とされたセンサ値が所定の順序で並んだ情報であってもよい。状態情報記憶部２０３は、少なくとも所定期間分の状態系列情報を記憶するための記憶領域を有する。

分析モデル取得部２１は、多体相関モデル生成部２１１およびモデル抽出部２１２を用いて、状態情報記憶部２０３に記憶されている所定期間分の状態系列情報に基づいて、被監視システム９の分析モデルを生成する。分析モデル取得部２１に含まれるこれらの各機能ブロックの詳細については後述する。生成される分析モデルは、１つ以上の多体相関モデルを含む。各多体相関モデルは、３つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを含む。換言すると、分析モデルは、１つ以上の多体相関モデルの集合である。また、分析モデル取得部２１は、生成した分析モデルを、分析モデル記憶部２０１に保存する。

ここで、分析モデル取得部２１によって分析モデルの生成に用いられる状態系列情報の所定期間としては、被監視システム９において障害が発生していない任意の期間が、運用者によって設定される。当該所定期間は、異常検知の感度を高めるという観点からは、被監視システム９の経年的な変化による影響を受けないように、できるだけ短い期間とすることが好ましい。例えば、被監視システム９のメンテナンスサイクルが１年だとすると、当該所定期間を、それより十分短い、１か月、１週間、１日などの期間としてもよい。なお、このとき、当該所定期間に、通常起こりうるシステムの状態変化の要因の中で、最も多くのセンサ値に大きな変化をもたらす要因によるセンサ値への影響が含まれることが好ましい。一方、当該所定期間は、被監視システム９の状態変化による誤検知を減らすという観点からは、主要な内的または外的要因によるセンサ値の変化を網羅的に含むように、できるだけ長い期間を用いることが好ましい。例えば、被監視システム９が季節の影響を強く受ける場合は、当該所定期間を、９か月、１年などの期間としてもよい。

分析モデル記憶部２０１は、分析モデル取得部２１によって生成された分析モデルを表す分析モデル情報を記憶する。分析モデル情報は、例えば、分析モデルに含まれる各多体相関モデルについてのモデル情報の集合であってもよい。モデル情報は、例えば、当該多体相関モデルの識別子と、当該多体相関モデルの回帰式の情報と、該回帰式の予測誤差の許容範囲を示す情報とを含んでいてもよい。回帰式の情報は、例えば、目的変数に用いられるデータ項目の情報、説明変数に用いられるデータ項目の情報、およびデータ項目間の関係式の情報等を含んでいてもよい。また、モデル情報は、さらに回帰式の優良さを表す指標（優良度）を含んでいてもよい。

なお、モデル情報に含まれる必要がある情報は、後述の警報条件や、データ項目の異常度の算出方法等に依存する。ここで、警報条件とは、後述の異常判定部２９により異常が通知される際の条件（警報条件）である。また、データ項目の異常度とは、後述の部分異常度算出部２５２により算出される部分異常度や、後述の異常統計値算出部２５３により算出される異常統計値などをいう。例えば、警報条件または異常度の算出手法が、回帰式の優良度にかかわるものであれば、モデル情報に、回帰式の優良度を含ませればよい。

標準寄与率取得部２２は、状態情報記憶部２０３に記憶されている状態系列情報に基づいて、分析モデルに含まれる多体相関モデルの回帰式ごとに、各説明変数データ項目が予測値に寄与する割合（寄与率）の統計量を計算する。以降、寄与率の統計量を、標準寄与率という。ここで、標準寄与率として用いる統計量は、寄与率の平均的な値が得られる統計量であればよい。例えば、当該統計量は、寄与率の平均値または中央値であってもよい。また、例えば、当該統計量は、寄与率の数値ごとに所定の重みを付けた加重平均値、または、寄与率の数値ごとに所定の重みを付けた加重中央値等であってもよい。

ここで、標準寄与率の計算に用いる状態系列情報の期間としては、障害を含まない任意の期間が設定される。ここで、分析モデルによる分析結果との整合性を高くし、異常要因データ項目抽出時の解釈性を損なわないという観点を考える。このような観点からは、分析モデルの生成に用いられた所定期間の状態系列情報を、標準寄与率の計算に用いることが好ましい。分析モデルの生成に用いられた所定期間の状態系列情報を標準寄与率の計算に用いることは、設定すべきパラメータが少ないため、汎用性という観点からも好ましい。この場合、標準寄与率取得部２２は、分析モデル取得部２１による分析モデルの生成時に、標準寄与率を算出しておくことが可能である。

また、異常要因データ項目抽出の精度を高めるという観点を考える。このような観点からは、モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に近い値を持つ期間の状態系列情報を、標準寄与率の計算に用いることが好ましい。ここで、「近い値」とは、そのような目的変数に対応するデータ項目の値に対して近いことを示す所定条件を満たす値をいう。なお、モデル破壊は、後述のモデル破壊検出部２４によって検出される。この場合、状態情報記憶部２０３に、そのような近い値を持つ状態情報が十分多く記憶されていることが前提となる。例えば、モデル破壊した多体相関モデルの目的変数に対応するデータ項目ｘの実測値が、モデル破壊した時刻でｘ１だったと仮定する。この場合、標準寄与率取得部２２は、状態情報記憶部２０３に記憶されている状態情報のうち、そのデータ項目ｘの値がｘ１に近い値である期間の状態系列情報を抽出すればよい。そのような期間は、複数の期間であってもよい。また、抽出期間の長さは、運用者等によってあらかじめ定められているものとする。そして、標準寄与率取得部２２は、抽出した期間の状態系列情報を用いて、モデル破壊した多体相関モデルにおける各説明変数データ項目の標準寄与率を算出する。この場合、標準寄与率取得部２２は、後述のモデル破壊検出部２４によるモデル破壊の検出時点より後に、標準寄与率を算出すればよい。

なお、標準寄与率の計算に用いられる状態系列情報は、連続している１つの期間から抽出される必要はない。この場合、標準寄与率の計算に用いられる状態情報の数は、システムごとに好適な数が、システム分析の結果に基づいて設定されていてもよい。例えば、標準寄与率の計算に用いられる状態情報の数は、あらかじめ設定された所定の数であってもよい。あるいは、標準寄与率の計算に用いられる状態情報の数は、モデル破壊の発生した多体相関モデルの回帰式ごとに、標準寄与率の計算に用いた期間の予測精度が、あらかじめ設定された範囲内におさまる状態情報の数であってもよい。

また、多体相関モデルに含まれるデータ項目間の関係性に軽微な変化が既に発生している状況で、発生したモデル破壊に対する異常要因データ項目抽出の精度低下を防ぐという観点を考える。このような観点からは、モデル破壊時刻を含まない直前の所定期間にわたる状態系列情報を、標準寄与率の計算に用いることが好ましい。この場合、直前の所定期間の長さは、あらかじめ設定されていてもよい。この場合も、標準寄与率取得部２２は、後述のモデル破壊検出部２４によるモデル破壊の検出時点より後に、標準寄与率を算出すればよい。

モデル破壊検出部２４は、新たな状態情報が収集されると、分析モデルに含まれる各多体相関モデルについて、モデル破壊の発生の有無を検出する。前述のように、モデル破壊とは、多体相関モデルの回帰式の予測誤差が許容範囲を超える現象である。

本実施の形態では、このようなモデル破壊の発生を、その回帰式の目的変数とされたデータ項目に対応するセンサ値の変化に、通常変化とは無関係なセンサ値の変化による影響が含まれていることを示す指標として用いる。なお、通常変化とは、通常起こりうるシステムの状態変化に伴うセンサ値の変化をいう。

モデル破壊検出部２４は、例えば、状態情報記憶部２０３に記憶されている最新の状態情報を含む状態系列情報と、分析モデルとを用いて、分析モデルに含まれる各多体相関モデルについてモデル破壊の発生の有無を検出する。具体的には、モデル破壊検出部２４は、当該多体相関モデルの回帰式の目的変数に対する少なくとも最新の時刻における予測値を算出する。そして、モデル破壊検出部２４は、算出した目的変数の予測値と、最新の状態情報に含まれる実際のセンサ値との差である予測誤差を算出する。そして、モデル破壊検出部２４は、算出された予測誤差が許容範囲を満たしているか否かを判定することによって、モデル破壊の発生の有無を検出すればよい。そして、モデル破壊検出部２４は、モデル破壊の検出結果を、モデル破壊情報として出力する。

モデル破壊情報は、分析モデルに含まれる各多体相関モデルのモデル破壊の状況を示す情報である。具体的には、モデル破壊情報は、モデル破壊が発生した多体相関モデルを特定可能な情報を含んでいてもよい。逆に、モデル破壊情報は、モデル破壊が発生しなかった多体相関モデルを特定可能な情報を含んでいてもよい。その他、モデル破壊情報は、モデル破壊が発生した（あるいは発生しなかった）多体相関モデルから得られる各種情報を含んでいてもよい。そのような情報は、例えば、該多体相関モデルの回帰式に含まれるデータ項目の情報や、算出された予測誤差等であってもよい。あるいは、モデル破壊情報は、これらの情報の組合せを含んでいてもよい。

なお、モデル破壊情報に含まれる必要がある情報は、警報条件やデータ項目の異常度の算出方法に依存する。例えば、警報条件またはデータ項目の異常度の算出方法が、モデル破壊の発生した多体相関モデルの数（モデル破壊数）にかかわるものであるとする。この場合、モデル破壊情報は、モデル破壊数を特定可能な情報を含んでいればよい。例えば、モデル破壊情報に、分析モデルに含まれる各多体相関モデルについてのモデル破壊の有無を表す情報が含まれていれば、モデル破壊数が特定可能となる。また、モデル破壊情報に、モデル破壊が発生した多体相関モデルの識別子の集合が含まれていれば、モデル破壊数が特定可能となる。

また、例えば、警報条件またはデータ項目の異常度の算出方法が、モデル破壊の発生した多体相関モデルの回帰式の優良度にかかわるものであるとする。この場合、モデル破壊情報は、モデル破壊が発生した多体相関モデルの回帰式の優良度を特定可能な情報を含んでいればよい。例えば、モデル破壊情報には、モデル破壊が発生した多体相関モデルの回帰式の優良度そのものが含まれていてもよい。あるいは、モデル破壊情報に、モデル破壊が発生した多体相関モデルの識別子の集合が含まれていれば、各識別子が示す多体相関モデルの回帰式の優良度が特定可能となる。

また、例えば、警報条件またはデータ項目の異常度の算出手法が、モデル破壊の発生した多体相関モデルの予測誤差にかかわるものであるとする。この場合、モデル破壊情報は、モデル破壊が発生した多体相関モデルの予測誤差を特定可能な情報を含んでいればよい。例えば、モデル破壊情報には、モデル破壊が発生した多体相関モデルの予測誤差そのものが含まれていてもよい。あるいは、モデル破壊情報に、モデル破壊が発生した多体相関モデルの識別子の集合が含まれていれば、各識別子が示す多体相関モデルの予測誤差が特定可能となる。

異常判定部２９は、モデル破壊検出部２４から出力されたモデル破壊情報を基に、分析モデルのモデル破壊の状況が警報条件を満たしているか否かを判定する。また、異常判定部２９は、判定の結果、警報条件を満たしていれば、被監視システム９の状態を異常と判定し、判定結果を通知する。通知先は、例えば、出力装置１００３または被監視システム９等であってもよい。また、例えば、異常判定部２９は、警報条件を満たす場合に、モデル破壊検出部２４から出力されたモデル破壊情報をモデル破壊情報記憶部２０４に保存してもよい。

警報条件には、例えば、以下の式（１）を用いることができる。
Ｎａ＞Ｔａ・・・（１）
ここで、Ｎａは、分析モデルに含まれる多体相関モデルのうちモデル破壊が発生した多体相関モデルの数を表す。また、Ｔａは、許容されるモデル破壊の数である。例えば、Ｔａ＝３であったとする。このとき、分析モデルに含まれる多体相関モデルのうち、モデル破壊が発生した数が４以上であった場合、異常判定部２９は、被監視システム９の状態が異常であると判定し、異常の発生を通知する。

モデル破壊情報記憶部２０４は、上述のモデル破壊情報を記憶する。さらに、モデル破壊情報記憶部２０４は、モデル破壊に関連する情報を記憶してもよい。モデル破壊に関連する情報とは、例えば、異常判定部２９により異常と判定された際にモデル破壊を発生させた状態情報の計測時刻等であってもよい。

異常要因抽出部２５は、異常判定部２９によって被監視システム９の状態が異常と判定されると次のように動作するよう構成される。なお、上述したように、異常判定部２９によってモデル破壊情報のモデル破壊情報記憶部２０４への登録が行われる場合、異常要因抽出部２５は、モデル破壊情報記憶部２０４にモデル破壊情報が新たに追加されると動作するよう構成される。具体的には、異常要因抽出部２５は、後述の再予測値算出部２５１と、後述の部分異常度算出部２５２と、後述の異常統計値算出部２５３とを用いて、データ項目別の異常統計値を算出する。異常要因抽出部２５に含まれる各機能ブロックの構成の詳細については後述する。そして、異常要因抽出部２５は、データ項目別の異常統計値がより高いものから順に、被監視システム９の異常要因の候補となるデータ項目を抽出する。例えば、異常要因抽出部２５は、異常統計値が閾値以上のデータ項目を、異常要因の候補となるデータ項目として抽出してもよい。また、例えば、異常要因抽出部２５は、異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出してもよい。

次に、分析モデル取得部２１に含まれる多体相関モデル生成部２１１およびモデル抽出部２１２の構成の詳細について説明する。

多体相関モデル生成部２１１は、状態情報に含まれるデータ項目群のうち、任意の１つのデータ項目を目的変数として選出し、任意の２つ以上のデータ項目を説明変数として選出する。そして、多体相関モデル生成部２１１は、選出した目的変数および２つ以上の説明変数の全ての組合せについて、３つ以上のデータ項目を用いて構成される回帰式を構築する。また、多体相関モデル生成部２１１は、該回帰式の予測誤差の許容範囲を算出する。そして、多体相関モデル生成部２１１は、構築した回帰式と、該回帰式の予測誤差の許容範囲とを含む多体相関モデルを生成する。多体相関モデルの回帰式に含まれる説明変数としてのデータ項目の数は、センサノイズによる検知感度低下の防止や異常要因データ項目の絞り込みの容易さの観点からは、少ない方が好ましく、２つが最も好ましい。一方、システムの状態が変化しても高い予測精度を維持できるという観点からは、多体相関モデルの回帰式に含まれる説明変数データ項目の数は、多い方が好ましい。

多体相関モデル生成部２１１は、このような多体相関モデルの回帰式として、例えば、以下の式（２）に示されるような４つのデータ項目を用いて構成される回帰式を用いてもよい。

ここで、ｔは、状態情報のインデックスを表している。状態情報のインデックスｔには、状態情報を古い順に並べたとき、古い方から新しい方に向かって、値が増える連番の整数が与えられる。また、ｘ（ｔ）は、状態情報のインデックスがｔのときの、データ項目ｘの値を表している。また、式（２）において、１つ目の等号の左側にあるハット付きのｕ（ｔ）は、目的変数に相当し、状態情報のインデックスがｔのときのデータ項目ｕの予測値となる。また、２つ目の等号の右側にあるｘ（ｔ）^ｉ、ｙ（ｔ）^ｉ、ｚ（ｔ）^ｉは、説明変数に相当し、状態情報のインデックスがｔのときのデータ項目ｘ、ｙ、ｚのセンサ値をｉ乗した値を表す。また、１番目の等号と２番目の等号との間にあるｆ（ｘ、ｙ、ｚ）は、当該回帰式がｘ、ｙ、ｚの３つのデータ項目を説明変数に用いた関数であることを表している。また、Ｎ、ＫおよびＭは、任意の整数である。

また、多体相関モデル生成部２１１は、式（２）のパラメータとしてのａ_ｉ、ｂ_ｉ、ｃ_ｉ、ｄ、Ｋ、Ｎ、Ｍを、当該回帰式の優良度Ｆが最大となるように決定する。回帰式の優良度Ｆには、例えば、以下の式（３）に示されるような、回帰式の予測精度を用いることができる。式（３）において、ｕ（ｔ）は、状態情報のインデックスがｔのときの、データ項目ｕの値を表している。また、バー付きのｕは、状態系列情報に含まれる所定期間中における目的変数の平均値を表す。なお、所定期間とは、これらのパラメータを決定するための学習期間であり、状態情報のインデックスがＮ０〜Ｎ１の間（Ｎ０≦Ｎ１）である。ここで、Ｎ０は、当該回帰式の構築に用いられた状態情報の最も古い時刻を示すインデックスを表す。また、Ｎ１は、当該回帰式の構築に用いられた状態情報の最も新しい時刻を示すインデックスを表す。

回帰式の優良さには、予測精度の高さと、汎化誤差の低さという２つの観点がある。上記式（３）の例は、予測精度の高さの観点から定めた優良度の例である。一方、汎化誤差の低さの観点から優良度を定めることも可能である。そのような場合には、例えば、回帰式の優良度Ｆは、情報量基準を用いて算出可能である。なお、回帰式の優良度は、これらの観点による算出手法を組合せたものであってもよい。

優良度Ｆが最大となるパラメータは、例えば、Ｋ，Ｎ，Ｍの組に対して優良度Ｆが最大となるようにａ_ｉ、ｂ_ｉ、ｃ_ｉ、ｄ、を決定し、その後、優良度Ｆが最大となるＫ，Ｎ，Ｍの組を選択することで決定できる。本実施の形態では、パラメータａ_ｉ、ｂ_ｉ、ｃ_ｉ、ｄ、を決定する方法として、部分最小二乗法（Partial Least Squares:ＰＬＳ）を用いる。具体的には、まず、多体相関モデル生成部２１１は、Ｋ、Ｎ、Ｍの最大値をそれぞれ設定し、Ｋ、Ｎ、Ｍの値の組合せごとに回帰式を定式化する。そして、多体相関モデル生成部２１１は、それぞれの回帰式に対して、ＰＬＳ回帰を用いて、パラメータａ_ｉ、ｂ_ｉ、ｃ_ｉ、ｄ、を決定する。ＰＬＳ回帰の成分数は、例えば、次のようにして決定できる。多体相関モデル生成部２１１は、ＰＬＳ回帰の成分数を１から順に増やしたときに、分析モデルの生成に用いた状態系列情報に対する予測誤差の最大値が、減少から増加に転じる前までの成分数を決定すればよい。最後に、多体相関モデル生成部２１１は、回帰式ごとに、優良度Ｆを算出し、最大の優良度Ｆをもつ、回帰式のパラメータａ_ｉ、ｂ_ｉ、ｃ_ｉ、ｄ、Ｎ、Ｍ、Ｋ、を選択すればよい。これにより、所望の回帰式が得られる。ここで、Ｎ，Ｍ，Ｋの最大値は、運用者によって任意に設定可能である。

なお、パラメータａ_ｉ、ｂ_ｉ、ｃ_ｉ、ｄ、を決定する方法は、ＰＬＳに限らない。ここで、データ項目間の関係性が変化しないことを前提とする。この前提である限り、これらパラメータの決定方法には、各パラメータの値がセンサノイズの影響をあまり受けずにほぼ同じ値を安定的に得られる方法で、かつ、多体相関モデルの回帰式に寄与率の絶対値の小さい説明変数データ項目が含まれない方法を採用可能である。

なお、本実施の形態でＰＬＳを利用する１つ目の理由は、多重共線現象（multicollinearity）が発生する場合でも、安定してパラメータを求めることができるためである。多重共線現象が発生する場合、最小二乗法では、真のセンサ値に重畳するノイズが僅か変化するだけでも、パラメータの値が大きく変化するため、安定してパラメータを求めることができない。システム内のセンサ値を使って回帰分析する場合、多重共線性現象が発生する可能性が高い。これはシステムを構成する機器などの要素が、他の要素と連動して動作することで、システムの構成要素から得られるセンサ値も同様に、他のセンサ値と連動して変化することが考えられるためである。

また、本実施の形態でＰＬＳを利用する２つ目の理由は、潜在変数（ＰＬＳ回帰の各成分）として、データ項目間の主成分を抽出するためである。この特長によって、寄与率の絶対値の小さい説明変数データ項目が含まれない回帰式を含む多体相関モデルを生成できる。

また、本実施の形態でＰＬＳを利用する３つ目の理由は、回帰式を定式化した際のデータ項目数が、パラメータを決定した後でも変わらないためである。これによって、定式化の時点で、回帰式に含まれるデータ項目の数が３つ以上となることを確定できる。このため、後述のモデル抽出部２１２が、回帰式に含まれるデータ項目の数を確認する必要がなく、システム構成を簡便にできる。

このようにして、多体相関モデル生成部２１１は、状態情報に含まれるデータ項目群のうち任意の１つのデータ項目を目的変数とし、任意の２つ以上のデータ項目を説明変数とする全ての組合せについて、回帰式を構築する。

また、多体相関モデル生成部２１１は、構築した多体相関モデルの回帰式の予測誤差の許容範囲として、例えば、以下の式（４）および式（５）の両方が満たされる範囲を生成する。
ｒ_ｉ≦Ｔ_１・・・（４）
ｒ_ｉ≧Ｔ_２・・・（５）
ここで、Ｔ_１は予測誤差に対する上限閾値である。また、Ｔ_２は予測誤差に対する下限閾値である。また、ｒ_ｉは当該多体相関モデルの回帰式を用いて算出される目的変数のｉ番目の時刻での予測誤差である。ここで、ｉは状態系列情報における時刻の識別子を表している。より具体的には、ｉは、ある基準時刻から該当する時刻までの状態情報を昇順または降順で並べたときの並び番号である。例えば、ｉは、監視開始からｉ番目の時刻を表すものとしてもよい。

また、多体相関モデル生成部２１１は、式（４）および式（５）における上限閾値Ｔ_１および下限閾値Ｔ_２を、例えば、次式（６）および次式（７）を用いて決定してもよい。
Ｔ_１＝ｍａｘ｛｜Ｒ_Ｎ０｜，・・・，｜Ｒ_Ｎ１｜｝・・・（６）
Ｔ_２＝−Ｔ_１・・・（７）
ここで、ｍａｘ｛｝は入力された数値の中から最大値を出力する関数である。また、｜ｘ｜はｘの絶対値を抽出する演算子である。また、Ｒ_ｉ（ｉ＝Ｎ０〜Ｎ１）は、当該多体相関モデルの回帰式の構築に用いた状態系列情報から算出される目的変数のｉ番目の時刻の予測誤差を表している。また、Ｎ０は、該回帰式の構築に用いられた状態情報の最も古い時刻を示すインデックスを表す。また、Ｎ１は、該回帰式の構築に用いられた状態情報の最も新しい時刻を示すインデックスを表す。

つまり、式（６）では、許容範囲の上限値Ｔ_１として、該回帰式の構築に用いられた状態系列情報の期間にわたって算出される予測誤差（以下、算出期間中の予測誤差という）の絶対値の最大値が適用されている。また、式（７）では、許容範囲の下限値Ｔ_２として、同算出期間中の予測誤差の絶対値の最大値に−１をかけた値が適用されている。

式（６）および式（７）に限らず、多体相関モデル生成部２１１は、上述の算出期間中の予測誤差Ｒ_Ｎ０〜Ｒ_Ｎ１の平均値と標準偏差とを用いて、上限閾値Ｔ_１および下限閾値Ｔ_２を決定してもよい。例えば、多体相関モデル生成部２１１は、予測誤差の平均値に標準偏差の３倍を足した値を上限閾値Ｔ_１としてもよい。また、この場合、多体相関モデル生成部２１１は、予測誤差の平均値から標準偏差の３倍を引いた値を下限閾値Ｔ_２としてもよい。

このようにして、多体相関モデル生成部２１１は、状態情報に含まれるデータ項目群のうち任意の１つのデータ項目を目的変数とし、任意の２つ以上のデータ項目を説明変数とする全ての組合せについて構築した各回帰式について、予測誤差の許容範囲を決定する。そして、多体相関モデル生成部２１１は、各回帰式およびその予測誤差の許容範囲を含む多体相関モデル群を生成する。生成された多体相関モデル群は、分析モデルとして用いられる多体相関モデルの候補となる。

モデル抽出部２１２は、多体相関モデル生成部２１１が生成した多体相関モデル群の中から、分析モデルに用いる多体相関モデルを抽出する。例えば、モデル抽出部２１２は、多体相関モデル群の中から、その回帰式の優良度に基づいて、１つ以上の多体相関モデルを抽出してもよい。

具体的には、モデル抽出部２１２は、多体相関モデル生成部２１１によって生成される多体相関モデル群から、所定の優良モデル条件を満たす多体相関モデルを優良多体相関モデルとして抽出してもよい。そして、モデル抽出部２１２は、抽出した優良多体相関モデルの集合である優良多体相関モデル群を、分析モデルとしてもよい。また、モデル抽出部２１２は、抽出した各優良多体相関モデルのモデル情報を含む分析モデル情報を分析モデル記憶部２０１に記憶する。

例えば、モデル抽出部２１２は、優良モデル条件として、以下の式（８）を用いてもよい。なお、Ｆ_ｔｈは回帰式の優良度Ｆに対する閾値を表している。
Ｆ＞Ｆ_ｔｈ・・・（８）
ここで、回帰式の優良度Ｆに対する閾値Ｆ_ｔｈは、運用者によって任意の値が設定可能である。異常検知の対象範囲を広げるという観点からは、閾値Ｆ_ｔｈは、低く設定されることが好ましい。一方、システムの状態変化等による誤検知を減らすという観点からは、閾値Ｆ_ｔｈは、高く設定されることが好ましい。例えば、優良度Ｆが０〜１の値を取るとする。この場合、誤検知を減らすという観点からは、閾値Ｆ_ｔｈは、例えば、０．７から１までの値が好ましい。

また、例えば、モデル抽出部２１２は、多体相関モデル群の中から、相互相関モデルの優良度に基づいて、１つ以上の多体相関モデルを抽出してもよい。ここで、相互相関モデルとは、２つのデータ項目を含む回帰式をいうものとする。

具体的には、まず、モデル抽出部２１２は、多体相関モデル生成部２１１による多体相関モデル群の生成処理と同様の手順で、データ項目のすべての組み合わせに対して相互相関モデルを生成する。そして、モデル抽出部２１２は、各相互相関モデルに対して回帰式の優良度Ｆを求める。次に、モデル抽出部２１２は、所定の優良モデル条件を満たす相互相関モデルである優良相互相関モデルを抽出する。例えば、モデル抽出部２１２は、優良モデル条件として、式（８）を用いてもよい。モデル抽出部２１２は、優良相互相関モデルに含まれるデータ項目を回帰式に含む多体相関モデル群を、優良多体相関モデル群として抽出してもよい。

また、例えば、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルが、多体相関モデル生成部２１１によって生成される多体相関モデル群に含まれる場合を想定する。この場合、モデル抽出部２１２は、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルの一部を、優良多体相関モデルとして抽出してもよい。例えば、モデル抽出部２１２は、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルのうちの１つを、優良多体相関モデルとして抽出してもよい。例えば、モデル抽出部２１２は、回帰式の優良度に基づいて、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデル群から、優良多体相関モデル群に含める多体相関モデルを抽出してもよい。この場合、回帰式の優良度としては、回帰式の優良度Ｆを用いてもよい。一例として、モデル抽出部２１２は、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルのうち、回帰式の優良度Ｆが最も高いものを、優良多体相関モデル群に含める多体相関モデルとして抽出してもよい。

次に、異常要因抽出部２５に含まれる再予測値算出部２５１、部分異常度算出部２５２、異常統計値算出部２５３の構成の詳細について説明する。

再予測値算出部２５１は、モデル破壊情報記憶部２０４に新たに追加されたモデル破壊情報を参照し、モデル破壊が発生した各多体相関モデルについて、次の処理を行う。すなわち、再予測値算出部２５１は、モデル破壊が発生した各多体相関モデルの回帰式について、説明変数データ項目ごとに、当該データ項目の状態情報および標準寄与率に基づいて、当該回帰式の目的変数の予測値を再予測値として算出する。

例えば、再予測値算出部２５１は、再予測値の算出に、次式（９）を用いてもよい。式（９）では、再予測値は、１つのデータ項目にかかわる成分の値を、当該回帰式における当該データ項目の寄与率で割った値として得られる。

ここで、データ項目ｘ_ｉは、当該多体相関モデルの回帰式ｒに含まれる説明変数データ項目を表す。また、ハット付きのｕ_ｋｒｉは、説明変数データ項目ｘ_ｉによる、目的変数データ項目ｕ_ｋの再予測値を表す。また、ｇ_ｒは、回帰式ｒのうち特定のデータ項目にかかわる成分の値を取り出す関数である。したがって、ｇ_ｒ（ｘ_ｉ）は、回帰式ｒのうち、データ項目ｘ_ｉに関する成分の値を示す。また、ｑ_ｒｉは、説明変数データ項目ｘ_ｉの標準寄与率である。また、データ項目ｕ_ｋを目的変数とする多体相関モデルの回帰式ｒは、ｇ_ｒを用いて書きなおすと、次式（１０）のように表すことができる。

ここで、ハット付きのｕ_ｋｒは、当該多体相関モデルの回帰式ｒによるデータ項目ｕ_ｋの予測値である。また、ｃはデータ項目に依存しない定数項である。

再予測値算出部２５１による再予測値の具体的な計算方法について説明する。ここでは、式（２）に示した多体相関モデルの回帰式を例とする。また、異常判定部２９により異常と判定された時刻に対応する状態情報のインデックスを、ｔとする。この場合、式（２）のデータ項目ごとの再予測値は、次式（１１）、次式（１２）、次式（１３）のように表される。

ここで、ｘ、ｙ、ｚは、当該回帰式に含まれる説明変数データ項目を表す。また、ハット付きのｕ_ｘ、ｕ_ｙ、ｕ_ｚは、それぞれ説明変数データ項目ｘ、ｙ、ｚごとの再予測値である。また、ｑ_ｘ、ｑ_ｙ、ｑ_ｚは、説明変数データ項目ｘ、ｙ、ｚの標準寄与率である。

部分異常度算出部２５２は、第１のモデル破壊発生状況となった多体相関モデルと、第２のモデル破壊発生状況となった多体相関モデルとで、該多体相関モデルに含まれる各データ項目に対する部分異常度の割り当て方を変更する。ここで、第１のモデル破壊発生状況とは、その多体相関モデルにおいて各説明変数データ項目についての再予測値が全てモデル破壊となった場合をいうものとする。また、第２のモデル破壊発生状況とは、その多体相関モデルにおいて各説明変数データ項目についての再予測値の少なくとも１つがモデル破壊とならず少なくとも１つがモデル破壊となった場合をいうものとする。

具体的には、部分異常度算出部２５２は、第１のモデル破壊発生状況となった多体相関モデルにおいて、次のように部分異常度を割り当てる。この場合、部分異常度算出部２５２は、目的変数データ項目の部分異常度が、説明変数データ項目の部分異常度より高くなるよう各部分異常度の数値を割り当てる。割り当てる部分異常度は、本実施の形態では、２値であるものとする。例えば、この場合、部分異常度算出部２５２は、目的変数データ項目の部分異常度に１を割り当てる。また、部分異常度算出部２５２は、説明変数データ項目の部分異常度に０を割り当てる。

また、部分異常度算出部２５２は、第２のモデル破壊発生状況となった多体相関モデルにおいて、次のように部分異常度を割り当てる。この場合、部分異常度算出部２５２は、再予測値がモデル破壊となった説明変数データ項目の部分異常度が、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数データ項目の部分異常度より高くなるよう、部分異常度の数値を割り当てる。例えば、部分異常度算出部２５２は、再予測値がモデル破壊となった説明変数のデータ項目の部分異常度に１を割り当てる。また、部分異常度算出部２５２は、目的変数のデータ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に０を割り当てる。

異常統計値算出部２５３は、部分異常度算出部２５２から得られる部分異常度を、モデル破壊を検出した全ての多体相関モデルにわたって集計する。これにより、データ項目別の異常度の統計値である異常統計値が算出される。本実施の形態では、当該統計値として、平均値を用いるものとする。ただし、異常統計値に用いる統計量は、平均値に限らず、その他の統計量であってもよい。本実施の形態では、異常統計値算出部２５３は、異常統計値がより高いほど、異常要因である可能性が高いとみなす。

異常統計値に用いる統計量の他の例としては、累積和や、中央値等がある。以降、特段の説明がない場合は、異常統計値は高ければ高いほど、そのデータ項目が異常であることを示すこととする。

以上のように構成されたシステム分析装置２の動作について、図面を参照して説明する。なお、以下の動作の説明では、標準寄与率は、分析モデルの生成に用いられた所定期間の状態系列情報を用いて算出されるものとする。

まず、システム分析装置２の動作の一例の概略を図６に示す。

図６では、まず、状態情報収集部２３は、被監視システム９から状態情報を収集し、状態情報記憶部２０３に記憶する（ステップＳ１０１）。

なお、状態情報収集部２３は、運用を終了するという判断（ステップＳ１１０でＹｅｓ）が与えられるまで、ステップＳ１０１の動作を繰り返す。また、状態情報収集部２３は、ステップＳ１０２〜ステップＳ１０９の動作が行われている間も、所定周期毎に状態情報を収集し、状態情報記憶部２０３に記憶する動作を行う。

ここで、現在のタイミングが分析モデルを生成するタイミングでない場合（ステップＳ１０２でＮｏ）、システム分析装置２の動作は、ステップＳ１０５に進む。

一方、現在のタイミングが分析モデルを生成するタイミングである場合について説明する（ステップＳ１０２でＹｅｓ）。

この場合、分析モデル取得部２１は、分析モデルの生成に用いる所定期間の状態系列情報を、状態情報記憶部２０３から取得する。そして、分析モデル取得部２１は、取得した状態系列情報を用いて、分析モデルを生成する（ステップＳ１０３）。このステップの詳細については後述する。

そして、標準寄与率取得部２２は、分析モデルの生成に用いられた所定期間の状態系列情報を用いて、分析モデルに含まれる各多体相関モデルの回帰式において、各説明変数データ項目の標準寄与率を算出する（ステップＳ１０４）。

次に、現在の分析モデルを用いて対象システムを監視するという判断が与えられなければ（ステップＳ１０５でＮｏ）、システム分析装置２は、ステップＳ１０１からの動作を繰り返す。

一方、現在の分析モデルを用いて対象システムを監視するという判断が与えられた場合（ステップＳ１０５でＹｅｓ）について説明する。この場合、モデル破壊検出部２４は、状態情報収集部２３により新たに収集された状態情報を用いて、分析モデル記憶部２０１に記憶されている分析モデル情報によって示される分析モデルについて、モデル破壊の発生を検出する（ステップＳ１０６）。

前述のように、モデル破壊検出部２４は、分析モデルに含まれる各多体相関モデルについて、新たに収集された状態情報を適用した場合の予測誤差がその許容範囲を超えているか否かを判断すればよい。そして、モデル破壊検出部２４は、各多体相関モデルのモデル破壊評価結果を示すモデル破壊情報を生成する。

次に、異常判定部２９は、モデル破壊検出部２４から得られるモデル破壊情報に基づいて、モデル破壊の状況が警報条件を満たしているか否かを判定する（ステップＳ１０７）。

ここで、モデル破壊の状況が警報条件を満たしていれば（ステップＳ１０７でＹｅｓ）、異常判定部２９は、判定結果を通知する（ステップＳ１０８）。このとき、異常判定部２９は、モデル破壊の状況を示すモデル破壊情報を併せて通知してもよい。また、このとき、異常判定部２９は、該当するモデル破壊情報を、モデル破壊情報記憶部２０４に記憶する。そして、システム分析装置２の動作は、ステップＳ１０９に進む。

一方、モデル破壊の状況が警報条件を満たしていなければ（ステップＳ１０７でＮｏ）、異常判定部２９は、システムに異常は検知されなかったとして特に何もせず、ステップＳ１０１からの動作を繰り返す。

次に、システム分析装置２は、モデル破壊情報記憶部２０４に新たに記憶されたモデル破壊情報に基づいて、１つ以上の異常要因候補データ項目を抽出し、抽出した異常要因候補データ項目群を示す情報を通知する（ステップＳ１０９）。このステップの詳細については後述する。

システム分析装置２は、運用を終了するという判断（ステップＳ１１０でＹｅｓ）が与えられるまで、上記の動作を繰り返す。

なお、ステップＳ１０２、Ｓ１０５およびＳ１１０において、システム分析装置２は、入力装置１００４からの入力に基づいて、該当する判断を行ってもよい。あるいは、システム分析装置２は、あらかじめ定められたタイミングであるか否かに基づいて、該当する判断を行ってもよい。あるいは、システム分析装置２は、被監視システム９から得られる各種情報があらかじめ定められた条件を満たすか否かに基づいて、該当する判断を行ってもよい。また、これに限らず、システム分析装置２は、これらのステップにおける判断処理を、その他の方法により行ってもよい。

次に、ステップＳ１０３における分析モデル生成動作の一例の詳細を、図７に示す。

図７では、まず、多体相関モデル生成部２１１は、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶部２０３から取得する（ステップＳ２０１）。

次に、多体相関モデル生成部２１１は、取得した状態系列情報を用いて、分析モデルの候補である多体相関モデル群を生成する（ステップＳ２０２）。

ここでは、前述のように、多体相関モデル生成部２１１は、データ項目群から任意の１つのデータ項目を目的変数として選出し、目的変数とは異なる任意の２つ以上のデータ項目を、説明変数として選出する。なお、説明変数として選出するデータ項目数は、２つ以上の数があらかじめ定められている。そして、多体相関モデル生成部２１１は、目的変数および説明変数の全ての組合せについて、目的変数データ項目と説明変数データ項目とを用いた回帰式を構築する。また、多体相関モデル生成部２１１は、構築した各回帰式について、その予測誤差の許容範囲を算出する。そして、多体相関モデル生成部２１１は、回帰式および予測誤差の許容範囲を含む多体相関モデルを生成すればよい。これにより、多体相関モデル群が生成される。

次に、モデル抽出部２１２は、生成された多体相関モデル群から、所定の優良モデル条件に基づいて、優良多体相関モデル群を抽出する（ステップＳ２０３）。

次に、モデル抽出部２１２は、得られた優良多体相関モデル群を表す分析モデル情報を、分析モデル記憶部２０１に記憶する（ステップＳ２０４）。

以上で、システム分析装置２は、分析モデル生成動作を終了する。

次に、図６のステップＳ１０９における異常要因抽出動作の詳細を、図８に示す。

ここでは、システム分析装置２は、モデル破壊が発生した多体相関モデルの回帰式ごとに、ステップＳ３０１〜Ｓ３０８の処理を繰り返す。

まず、再予測値算出部２５１は、モデル破壊情報記憶部２０４からモデル破壊情報と、状態情報記憶部２０３から、異常判定部２９により異常と判定された時点の状態情報とを取得する。そして、再予測値算出部２５１は、モデル破壊が発生したこの多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、再予測値を計算する（ステップＳ３０１）。

次に、部分異常度算出部２５２は、再予測値算出部２５１によって算出された再予測値ごとに、再予測値とセンサ値との差が、その多体相関モデルの予測誤差の許容範囲内かどうか評価する。つまり、部分異常度算出部２５２は、再予測値ごとに、再予測値でもモデル破壊が発生するか否かを評価する（ステップＳ３０２）。

ここで、この多体相関モデルの回帰式において、全ての再予測値でモデル破壊が発生している場合（第１のモデル破壊発生状況）について説明する（ステップＳ３０３でＹｅｓ）。この場合、部分異常度算出部２５２は、目的変数データ項目の部分異常度に１を割り当てる（ステップＳ３０４）。また、さらに、部分異常度算出部２５２は、全ての説明変数データ項目の部分異常度に０を割り当てる（ステップＳ３０５）。

一方、この多体相関モデルの回帰式において、モデル破壊が発生しない再予測値が少なくとも１つあり、モデル破壊が発生した再予測値が少なくとも１つある場合（第２のモデル破壊発生状況）について説明する（ステップＳ３０３でＮｏ）。この場合、部分異常度算出部２５２は、目的変数データ項目の部分異常度に０を割り当てる（ステップＳ３０６）。また、さらに、部分異常度算出部２５２は、モデル破壊が発生した再予測値の計算に用いた説明変数データ項目の部分異常度に１を割り当てる（ステップＳ３０７）。また、さらに、部分異常度算出部２５２は、モデル破壊が発生しなかった再予測値の計算に用いた説明変数データ項目の部分異常度に０を割り当てる（ステップＳ３０８）。

モデル破壊が発生した全ての多体相関モデルの回帰式ごとにデータ項目別の部分異常度の算出を完了すると、システム分析装置２の動作は、ステップＳ３０９に進む。

ステップＳ３０９では、異常統計値算出部２５３は、部分異常度算出部２５２から取得した部分異常度を全ての当該回帰式にわたってデータ項目ごとに集計し、異常統計値を算出する（ステップＳ３０９）。

次に、異常要因抽出部２５は、各データ項目の異常統計値に基づいて、異常要因の候補となるデータ項目を抽出し、通知する（ステップＳ３１０）。例えば、前述のように、異常要因抽出部２５は、異常統計値が閾値より高いものを抽出し、異常要因候補として通知してもよい。また、例えば、異常要因抽出部２５は、異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出し通知してもよい。

以上で、システム分析装置２は、異常要因抽出動作を終了する。

次に、具体例を用いて本実施の形態を説明する。

まず、本実施の形態における分析モデル生成動作について、具体例を示す。

ここでは、多体相関モデルの回帰式の優良度Ｆに予測精度を用いるものとする。また、多体相関モデルに対する優良モデル条件を「Ｆ＞０．６」とする。また、説明変数に含まれるデータ項目の数を２とする。

図９は、本実施の形態における分析モデル生成動作を説明するための図である。図９において、符号９ａは、多体相関モデル生成部２１１によって生成された多体相関モデル群を示している。また、符号９ｂは、多体相関モデルに対する優良モデル条件を示している。また、符号９ｃは、モデル抽出部２１２によって抽出され、分析モデルとなった優良多体相関モデル群を示している。なお、多体相関モデルには、回帰式の予測誤差の許容範囲も含まれるが、回帰式の予測誤差の許容範囲は優良多体相関モデルの抽出には利用されないため、図示を省略している。以下、他の説明においても、説明に利用されない値を図から省略することがある。

この具体例では、まず、多体相関モデル生成部２１１は、状態情報記憶部２０３から状態系列情報を取得し、多体相関モデル群９ａを生成する。多体相関モデル群９ａは、１２個の多体相関モデルで構成されている。また、多体相関モデル群９ａの生成に用いられた状態系列情報に含まれるデータ項目群は、データ項目ｕ_１、データ項目ｕ_２、データ項目ｕ_３およびデータ項目ｕ_４からなる。多体相関モデル群９ａを構成する１２個の多体相関モデルの回帰式は、それぞれｕ_１＝ｆ_１２３（ｕ_２，ｕ_３）、ｕ_１＝ｆ_１３４（ｕ_３，ｕ_４）、ｕ_１=ｆ_１２４（ｕ_２,ｕ_４）、ｕ_２=ｆ_２１３（ｕ_１,ｕ_３）、ｕ_２＝ｆ_２１４（ｕ_１，ｕ_４）、ｕ_２＝ｆ_２３４（ｕ_３，ｕ_４）、ｕ_３＝ｆ_３１２（ｕ_１，ｕ_２）、ｕ_３＝ｆ_３１４（ｕ_１，ｕ_４）、ｕ_３＝ｆ_３２４（ｕ_２，ｕ_４）、ｕ_４＝ｆ_４１２（ｕ_１，ｕ_２）、ｕ_４＝ｆ_４１３（ｕ_１，ｕ_３）、ｕ_４＝ｆ_４２３（ｕ_２，ｕ_３）である。ここで、ｆ_ｊ（）は、カッコ内に含まれる説明変数データ項目から、左辺に示す目的変数データ項目の予測値を算出するための関数である。なお、ｊは、回帰式を識別するための識別子である。そのような関数の説明変数には、カッコ内に含まれるデータ項目について、状態情報記憶部２０３に記憶されている状態系列情報に含まれる該データ項目の値（センサ値）が適用される。なお、説明変数としては、データ項目の値そのものに限らず、該データ項目を用いて算出される変換値が適用されてもよい。

次に、モデル抽出部２１２は、多体相関モデル群９ａから、優良モデル条件９ｂを満たす優良多体相関モデルを抽出し、分析モデルである優良多体相関モデル群９ｃを得る。本例の優良モデル条件９ｂは、図９に示されるように「回帰式の優良度Ｆ＞０．６」である。そこで、モデル抽出部２１２は、多体相関モデル群９ａを構成する１２個の多体相関モデルのうち、回帰式の優良度Ｆが０．６を超える多体相関モデルを、優良多体相関モデルとして抽出する。本例では、以下の９つの回帰式、ｕ_１＝ｆ_１３４（ｕ_３，ｕ_４）、ｕ_１=ｆ_１２４（ｕ_２,ｕ_４）、ｕ_２＝ｆ_２１４（ｕ_１，ｕ_４）、ｕ_２＝ｆ_２３４（ｕ_３，ｕ_４）、ｕ_３＝ｆ_３１４（ｕ_１，ｕ_４）、ｕ_３＝ｆ_３２４（ｕ_２，ｕ_４）、ｕ_４＝ｆ_４１２（ｕ_１，ｕ_２）、ｕ_４＝ｆ_４１３（ｕ_１，ｕ_３）、ｕ_４＝ｆ_４２３（ｕ_２，ｕ_３）にかかわる多体相関モデルが抽出されたものとする。このようにして、９つの多体相関モデルから構成される優良多体相関モデル群９ｃが、分析モデルとして生成された。

次に、本実施の形態における異常要因抽出動作について、具体例を示す。

なお、以下に示す具体例では、異常の影響はデータ項目ｕ_２およびデータ項目ｕ_３に現れているものとした。

図１０は、本実施の形態における異常要因抽出動作の具体例を説明するための図である。図１０において、データセット１０ａは、分析モデルに含まれる上述の９つの多体相関モデルについて、再予測値の予測誤差と、再予測値によるモデル破壊評価結果と、部分異常度とを示している。また、データセット１０ｂは、データ項目ごとの異常統計値を示している。図１０のデータセット１０ａにおいて、「モデル破壊」の列には、モデル破壊の評価結果が示されている。この列では、モデル破壊となった回帰式には「○」印がついている。また、「説明変数データ項目による再予測値に対する予測誤差」の「第１」、「第２」の列には、第１説明変数データ項目および第２説明変数データ項目について算出された再予測値に対する予測誤差の数値が示されている。ただし、該当する多体相関モデルがモデル破壊とならなかったために計算が不要であった項目には、「−」が記されている。ここでは、説明の便宜上、関数ｆ_ｊ（）の説明変数データ項目を、括弧内の左から順に、第１説明変数データ項目、第２説明変数データ項目と呼ぶ。また、「説明変数データ項目によるモデル破壊評価結果」の「第１」、「第２」の列には、各再予測値によるモデル破壊の有無が示されている。この列では、再予測値によりモデル破壊となった回帰式には「○」印がついている。また、「部分異常度」の列には、０または１の部分異常度が示されている。ただし、該当する多体相関モデルが相関破壊とならなかったために計算が不要であった項目には、「−」が記されている。

例えば、ｕ_１＝ｆ_１３４（ｕ_３，ｕ_４）を回帰式として含む多体相関モデルは、モデル破壊とならなかったために、「モデル破壊」の列に「○」印がついていない。したがって、ｕ_１＝ｆ_１３４（ｕ_３，ｕ_４）に対応する「説明変数データ項目による再予測値に対する予測誤差」、「部分異常度」の箇所には、「−」が記されている。

また、例えば、ｕ_１＝ｆ_１２４（ｕ_２，ｕ_４）を回帰式として含む多体相関モデルは、モデル破壊となったために、「モデル破壊」の列に「○」印がついている。そこで、再予測値算出部２５１は、このｕ_１＝ｆ_１２４（ｕ_２，ｕ_４）について、「説明変数データ項目による再予測値に対する予測誤差」の「第１」、「第２」の列に示す再予測値を算出している。ここで、この多体相関モデルについて、第１説明変数データ項目による再予測値に対する予測誤差が、その許容範囲から外れている。また、第２説明変数データ項目による再予測値に対する予測誤差は、その許容範囲から外れていない。つまり、少なくとも１つの再予測値に関してモデル破壊が発生しておらず、少なくとも１つの再予測値に関してモデル破壊が発生しており、第２のモデル破壊発生状況となっている。そこで、部分異常度算出部２５２は、部分異常度として、再予測値がモデル破壊となった第１説明変数データ項目ｕ_２に、１を割り当てている。また、部分異常度算出部２５２は、部分異常度として、その他の説明変数データ項目ｕ_１および目的変数データ項目ｕ_４には、０を割り当てている。

また、ｕ_２＝ｆ_２１４（ｕ_１，ｕ_４）を回帰式として含む多体相関モデルも、モデル破壊となったために、「モデル破壊」の列に「○」印がついている。そこで、再予測値算出部２５１は、このｕ_２＝ｆ_２１４（ｕ_１，ｕ_４）について、「説明変数データ項目による再予測値に対する予測誤差」の「第１」、「第２」の列に示す再予測値を算出している。また、この多体相関モデルでは、第１説明変数データ項目による再予測値に対する予測誤差と、第２説明変数データ項目による再予測値に対する予測誤差との両方が、その許容範囲から外れている。つまり、全ての再予測値によりモデル破壊が発生しており、第１のモデル破壊発生状況となっている。そこで、部分異常度算出部２５２は、部分異常度として、目的変数データ項目ｕ_２に、１を割り当てている。また、部分異常度算出部２５２は、部分異常度として、全ての説明変数データ項目ｕ_１およびｕ_４に、０を割り当てている。

このようにして、データセット１０ａに示すように、他の多体相関モデルに含まれるデータ項目についても、部分異常度が算出されたとする。

次に、異常統計値算出部２５３は、図１０のデータセット１０ｂに示すように、異常統計値を算出する。データセット１０ｂに示す異常統計値は、データセット１０ａに示した部分異常度がデータ項目別に集計された平均値である。異常統計値算出部２５３は、データ項目別に部分異常度が数値であるものを対象として、それらの平均値を計算している。例えば、データ項目ｕ_２については、４つの多体相関モデルにおいて部分異常度１が割り当てられ、１つの多体相関モデルにおいて部分異常度０が割り当てられている。したがって、異常統計値算出部２５３は、データ項目ｕ_２の異常統計値として、約０．６７を計算する。同様に、異常統計値算出部２５３は、他のデータ項目についても、データセット１０ｂに示すように、異常統計値を算出する。この例では、異常の影響が現れたデータ項目ｕ_２およびデータ項目ｕ_３については、高い異常統計値が得られていることが確認された。一方で、異常の影響が現れていないデータ項目ｕ_１やｕ_４については、低い異常統計値が得られていることが確認された。

このように、本具体例は、異常の影響が現れたデータ項目と、異常の影響が現れていないデータ項目とを、明確に区別可能な異常統計値を算出している。

次に、異常要因抽出部２５は、例えば、異常統計値に閾値を設定し、閾値より異常統計値が高いデータ項目を、異常要因の候補として抽出し出力すればよい。これにより、本具体例は、異常統計値のより高いものに注目させるような通知を行うことができる。

次に、本発明の第２の実施の形態の効果について述べる。

本発明の第２の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出することができる。

その理由を５つ述べる。

１つ目の理由は、分析モデル取得部が、分析モデルとして多体相関モデルを生成しているからである。この結果、本実施の形態は、多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、多体相関モデルのモデル破壊を再評価できる。これにより、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目とを、より適切に切り分けることができる。換言すると、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。

２つ目の理由は、多体相関モデル生成部が、多体相関モデルの回帰式に含まれるデータ項目が少数となるように回帰式を構成し得るからである。この結果、本実施の形態は、データ項目のセンサ値に含まれるノイズが予測値に重畳する量を、回帰式に含まれるデータ項目が多い場合に比べて減らすことができる。これにより、本実施の形態は、異常検知精度の高い多体相関モデルを構成でき、異常検知漏れを防ぐことができる。換言すると、本実施の形態は、異常によるセンサ値の変化が僅かであっても、異常要因特定に有用な情報を的確に抽出できる。

３つ目の理由は、多体相関モデル生成部が、分析モデルとして、１種類の目的変数に対して複数個の回帰式を構築し得るためである。この結果、本実施の形態は、異常検知精度を低下させるデータ項目があったとしても、ある１種類の目的変数データ項目を予測する回帰式に対して、その異常検知精度を低下させるデータ項目を含まない回帰式を構築できる可能性がある。なお、異常検知精度を低下させるデータ項目とは、センサ値に含まれるセンサノイズが大きなデータ項目などである。これにより、本実施の形態は、異常検知精度を低下させるデータ項目が回帰式に含まれることによる異常検知漏れを防ぐことができる。換言すると、本実施の形態は、１種類の目的変数に対して構築される回帰式が１つに限られないため、異常によるセンサ値の変化が僅かであったとしても、異常検知漏れを防ぐことができる。さらに、１種類の目的変数に対する回帰式が１つに限られないため、ある回帰式が、その回帰式における目的変数としてのデータ項目が異常の影響を受けているかどうかの判断結果に寄与する割合が小さくなる。したがって、異常検知精度を低下させるデータ項目と同様に、異常要因の特定精度を低下させるデータ項目があったとしても、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目とを適切に切り分けることができる。このようにして、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。
４つ目の理由は、再予測値算出部および部分異常度算出部が、個々の回帰式における個々の説明変数データ項目について、標準寄与率を用いた再予測値によるモデル破壊の発生状況に基づいて部分異常度を算出するからである。そして、異常統計値算出部が、この部分異常度をデータ項目別に集計して異常統計値を算出するからである。これにより、本実施の形態は、どのデータ項目が異常なのかを多体相関モデルの回帰式ごとに評価した上で、それを集計することができる。その結果、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目を適切に切り分けることができる。換言すると、本実施の形態は、異常によるセンサ値の変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出できる。

５つ目の理由は、多体相関モデル生成部が、多体相関モデルの回帰式に寄与率の絶対値の小さい説明変数データ項目が含まれないように、多体相関モデルの回帰式のパラメータを決定するからである。これにより、本実施の形態は、個々の回帰式における個々の説明変数データ項目の標準寄与率に基づいて、目的変数の再予測値を安定的に算出することができる。また、これにより、上述の４つ目の理由を確実にする。

なお、本実施の形態において、多体相関モデルの回帰式の例として、目的変数および説明変数にデータ項目の値を用いる例を中心に説明した。これに限らず、各回帰式において、目的変数および説明変数には、データ項目の値を数値変換したものを用いてもよい。なお、データ項目の値を数値変換したものの例としては、階差、べき乗、所定の時間幅における状態系列情報の平均値などが挙げられる。

また、本実施の形態において、分析モデルを生成する際に用いる状態系列情報の期間は、時間的に連続する１つの期間である例を中心に説明した。これに限らず、分析モデルの生成に用いる状態系列情報の期間は、必ずしも連続していなくてもよい。例えば、分析モデルの生成には、期間同士が連続していない複数の期間に含まれる状態系列情報を用いてもよい。

また、本実施の形態において、多体相関モデル生成部が、式（２）に示した回帰式の生成方法の例として、優良度である予測精度の値が最大となるように各パラメータを決定する例を示した。これに限らず、多体相関モデル生成部は、目的に応じて他の優良度を用いてもよい。例えば、回帰式の優良度として、ＡＩＣ（Akaike's Information Criterion）や、ＢＩＣ（Bayesian Information Criterion）などの情報量基準の逆数を適用してもよい。この場合も、多体相関モデル生成部は、そのような優良度が最大となるように各パラメータを決定してもよい。

また、本実施の形態において、式（２）に示した回帰式のパラメータであるａ_ｉ，ｂ_ｉ，ｃ_ｉ，ｄ，Ｎ，Ｍ，Ｋを決定する際に、ＰＬＳ回帰の成分数の決定方法として、次の方法を示した。すなわち、ＰＬＳ回帰の成分数を１から順に増やしたときに、モデル構築に用いた状態系列情報に対する予測誤差の最大値が、減少から増加に転じる前までの成分数とする例を示した。これに限らず、多体相関モデル生成部は、World's R criterion，Krzanowski's W criterion，Osten's F criterion等の技術を用いて、ＰＬＳ回帰の成分数を決定してもよい。

また、本実施の形態において、Ｎ、Ｍ、Ｋを固定した時の回帰式のパラメータａ_ｉ，ｂ_ｉ，ｃ_ｉ，ｄの決定方法の例として、ＰＬＳ回帰を用いる例を示した。これに限らず、多体相関モデル生成部は、主成分回帰（Principal Component Regression：ＰＣＲ）等、説明変数間の多重共線性による影響を回避可能な別の方法を用いて、これらパラメータを決定してもよい。または、多体相関モデル生成部は、Lasso（least absolute shrinkage and selection operator）やリッジ回帰等で用いられる正則化パラメータ付きの損失関数を用いて、正則化パラメータ付きの損失関数が最小となるようこれらパラメータを決定してもよい。または、多体相関モデル生成部は、説明変数間に多重共線性による影響が発生しない場合には、式（３）の第二項の分子が最小になるように、最小二乗法を用いてパラメータａ_ｉ，ｂ_ｉ、ｃ_ｉ，ｄ，を決定してもよい。

また、本実施の形態において、多体相関モデル群を生成する際に、全てのデータ項目は目的変数データ項目および説明変数データ項目のどちらとしても利用できるものとして説明した。これに限らず、目的変数データ項目としてのみ利用可能なデータ項目や、説明変数データ項目としてのみ利用可能なデータ項目が規定されていてもよい。

また、本実施の形態において、多体相関モデル生成部は、説明変数として含まれるデータ項目の数が全て同一の多体相関モデル群を生成する例について説明した。これに限らず、多体相関モデル生成部によって生成される多体相関モデル群は、その回帰式に説明変数として含まれるデータ項目の数が必ずしも同一でなくてもよい。すなわち、ある回帰式に説明変数として含まれるデータ項目の数は、他の少なくとも１つの回帰式に説明変数として含まれるデータ項目の数と異なっていてもよい。例えば、多体相関モデル生成部は、説明変数データ項目が２つの多体相関モデルと、説明変数データ項目が３つの多体相関モデルを組合せて生成してもよい。この場合、モデル抽出部は、説明変数データ項目が３つおよび２つの多体相関モデルの中から、優良多体相関モデルを抽出すればよい。なお、多体相関モデルの回帰式に説明変数として含まれるデータ項目の数は、運用者によって任意に設定されてもよい。

また、本実施の形態において、システム分析装置が、１つの分析モデルを用いて、被監視システムの状態を監視する例を示した。ここで、１つの分析モデルとは、同じ状態系列情報から生成された多体相関モデル群からなる分析モデルをいう。これに限らず、分析モデル取得部は、収集期間の異なる状態系列情報を用いて複数の分析モデルを作成してもよい。そのような場合に、システム分析装置は、複数の分析モデルを適宜切り替えながら、被監視システムの状態を監視してもよい。

また、本実施の形態において、システム分析装置が、分析モデルを一度だけ構築する例を中心に示した。これに限らず、システム分析装置は、分析モデルを逐次、再構築してもよい。

また、本実施の形態において、システム分析装置が、分析モデルに含まれる全ての回帰式をモデル破壊の検出に用いて、被監視システムの状態を監視する例を示した。これに限らず、システム分析装置は、分析モデルに含まれる一部の回帰式を用いて、被監視システムの状態の例えば一部を監視してもよい。

また、本実施の形態において、標準寄与率が、説明変数に含まれるデータ項目別の予測値に対する割合である例を示した。これに限らず、標準寄与率は、所定の期間について、多体相関モデルに含まれる任意の１つの説明変数データ項目による再予測値と、多体相関モデルの予測値とが、同等の精度を持つような他の手法により算出されてもよい。なお、所定の期間としては、例えば、標準寄与率の計算に用いられる期間として上述した各種期間が利用可能である。例えば、標準寄与率は、多体相関モデルの回帰式において、「任意の１つの説明変数データ項目に関する成分／定数項を除く全成分」として算出されてもよい。なお「／」は除算を表す。この標準寄与率の定義を用いる場合、再予測値算出部は、多体相関モデルの定数項の値と、説明変数データ項目の標準寄与率およびセンサ値とから、目的変数データ項目の再予測値を計算すればよい。

また、本実施の形態において、多体相関モデルの回帰式として、式（２）の回帰式を例として説明した。式（２）は、説明変数としてデータ項目の過去の値（過去値）を用いてもよい。この場合、多体相関モデルの回帰式は、目的変数の過去値も説明変数として含むケースがある。このようなケースでは、標準寄与率取得部は、例えば、目的変数の過去値に関わる成分の値を定数項と同様に処理して、標準寄与率を算出する。つまり、多体相関モデルに説明変数として含まれる目的変数の過去値は、説明変数データ項目とみなされないため、再予測の対象にならない。

また、本実施の形態において、標準寄与率が、「任意の１つの説明変数データ項目に関する成分／予測値」の統計値である例を示した。ただし、多体相関モデルの回帰式のうち、再予測の対象になるデータ項目に関する成分の占める割合が低くなると、再予測の精度が低下することがある。その場合、標準寄与率は、「任意の１つの説明変数データ項目に関する成分／再予測の対象になるデータ項目に関する成分の総和」の統計値とすることが好ましい。多体相関モデルの回帰式の説明変数に目的変数の過去値を含まない場合、再予測の対象になるデータ項目に関する成分の総和は、定数項を除く全成分に相当する。また、多体相関モデルの回帰式の説明変数に目的変数の過去値を含む場合、再予測の対象になるデータ項目に関する成分の総和は、目的変数の過去値の成分および定数項を除く全成分に相当する。この標準寄与率の定義を用いる場合、再予測値算出部は、多体相関モデルの定数項の値と、目的変数の過去値に関わる成分の値と、説明変数データ項目の標準寄与率およびセンサ値とから、目的変数データ項目の再予測値を計算すればよい。このときの再予測値は、次式（１４）で表される。

ここで、データ項目ｘ_ｉは、当該多体相関モデルの回帰式ｒに含まれる説明変数データ項目を表す。また、データ項目ｕ_ｋは、当該多体相関モデルの回帰式ｒに含まれる目的変数データ項目を表す。また、ハット付きのｕ_ｋｒｉは、説明変数データ項目ｘ_ｉによる、目的変数データ項目ｕ_ｋの再予測値を表す。また、ｇ_ｒは、回帰式ｒのうち特定のデータ項目にかかわる成分の値を取り出す関数である。したがって、ｇ_ｒ（ｘ_ｉ）は、回帰式ｒのうち、データ項目ｘ_ｉに関する成分の値を示す。また、したがって、ｇ_ｒ（ｕ_ｋ）は、回帰式ｒのうち、データ項目ｕ_ｋに関する成分の値、すなわち目的変数の過去値に関わる成分の値を示す。また、ｑ_ｒｉは、説明変数データ項目ｘ_ｉの標準寄与率である。また、ｃは、回帰式ｒの定数項である。

また、本実施の形態において、異常判定部によって用いられる警報条件の例として、「モデル破壊が発生した相関モデルの数が、所定の数を超えたとき」といった条件を用いる例を示した。これに限らず、異常判定部は、他の警報条件を用いてもよい。例えば、警報条件は、「モデル破壊が発生した相関モデルの回帰式の優良度の累積値が、所定の値（警報閾値）を超えたとき」といった条件であってもよい。また、例えば、警報条件は、「あらかじめ設定された所定の期間にわたって、上述の優良度の累積値が警報閾値を超えたとき」といった条件であってもよい。このように、異常判定部は、警報条件として、モデル破壊情報に基づく様々な条件を適用可能である。

また、本実施の形態において、部分異常度算出部が、再予測値でもモデル破壊が発生するか否かを評価する手法として、再予測値とセンサ値との差が、その多体相関モデルの予測誤差の許容範囲内かどうか評価する例を中心に説明した。これに限らず、部分異常度算出部は、データ項目ごとに算出された再予測値用の予測誤差の許容範囲（再予測値用の閾値）を用いて、再予測値でもモデル破壊が発生するか否かを評価してもよい。つまり、同一のデータ項目であっても、多体相関モデルが異なる場合は、それぞれに対して、再予測値用の閾値を設定してもよい。この場合、部分異常度算出部は、再予測値用の閾値を、標準寄与率の算出に用いた所定の期間に対して、多体相関モデルの予測誤差の許容範囲と同じ方法で算出してもよい。

また、本実施の形態において、部分異常度算出部は、部分異常度として、０または１の２値のうち、部分異常度が高いものに１を割り当て、低いものに０を割り当てる例を中心に説明した。これに限らず、部分異常度算出部は、２値ではない値（連続値や離散値など）を部分異常度として割り当ててもよい。例えば、部分異常度算出部は、部分異常度として、本実施の形態で説明した２値の部分異常度に重みをかけたものを、部分異常度としてもよい。重みとしては、例えば、モデル破壊発生時の予測値の乖離度や、回帰式の優良度等を適用してもよい。なお、ここでいう予測値の乖離度とは、例えば、「予測誤差／予測誤差の許容範囲の下限」と「予測誤差／予測誤差の許容範囲の上限」との大きい方の値であってもよい。例えば、重みとして、モデル破壊発生時の予測値の乖離度をかける場合の部分異常度は、０または乖離度となる。なお、汎用的に異常要因特定に有用な情報を的確に抽出するという観点からは、部分異常度の定義としては、本実施の形態のように２値の定義が好ましい。一方で、特定のシステムに特化させ、より的確な情報を抽出するという観点からは、部分異常度に重みをかける方が好ましい。部分異常度にかける重みは、対象システムに対する知見に基づき、運用者によって任意の定義を設定可能である。

また、本実施の形態において、異常統計値算出部は、異常統計値として、データ項目別に部分異常度の平均値を算出する例を説明した。これに限らず、異常統計値は、異常の要因である可能性の高さと関係のある指標であればよい。例えば、異常統計値算出部は、異常統計値として、データ項目別の部分異常度の合計値を算出してもよい。なお、分析モデルの多体相関モデルに含まれる数が多いデータ項目を異常要因として抽出しやすくするという観点からは、異常統計値として、合計値を用いるのが好ましい。一方で、分析モデルの多体相関モデルに含まれる数が少ないデータ項目であっても異常要因として抽出しやすくするという観点からは、異常統計値として、平均値を用いるのが好ましい。

また、本実施の形態において、異常統計値算出部は、異常統計値として、異常要因である可能性がより高いデータ項目についてより高い値を示す異常統計値を算出するとして説明した。これに限らず、異常統計値は、異常の要因である可能性の高さと関係のある指標であればよい。例えば、異常統計値算出部は、異常統計値として、異常要因である可能性がより高いデータ項目についてより低い値を示す異常統計値を算出してもよい。

（第３の実施の形態）
次に、本発明の第３の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第１〜２の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。

本発明の第３の実施の形態としてのシステム分析装置３の機能ブロック構成を図１１に示す。図１１において、システム分析装置３は、本発明の第２の実施の形態としてのシステム分析装置２に対して、分析モデル取得部２１に替えて分析モデル取得部３１と、異常要因抽出部２５に替えて異常要因抽出部３５とを備える点が異なる。分析モデル取得部３１は、本発明の第２の実施の形態における分析モデル２１と同一の構成に加えて、データ項目分類部３１３を有する。また、システム分析装置３は、被監視システム９に接続される。なお、被監視システム９の詳細については、本発明の第１の実施の形態における被監視システム９と同様の構成であるため、本実施の形態における説明を省略する。また、図１１において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置３およびその各機能ブロックは、図２を参照して説明した本発明の第１の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置３およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

データ項目分類部３１３は、状態情報に含まれるデータ項目群を分類する。分類は、分析モデルに含まれる優良多体相関モデルの少なくとも１つの回帰式に、目的変数または説明変数として含まれるデータ項目が、同一のグループとなるように行われる。なお、データ項目分類部３１３は、データ項目の分類手法として、特願２０１４−６５１２０に記載の技術を適用してもよい。以降、同一の分類とされたデータ項目のグループを、データ項目グループとも記載する。そして、データ項目分類部３１３は、データ項目グループの情報を、分析モデル情報に加えて分析モデル記憶部２０１に保存する。

異常要因抽出部３５は、分析モデル記憶部２０１からデータ項目グループの情報を取得する。そして、異常要因抽出部３５は、データ項目グループごとに、異常要因の候補となるデータ項目を抽出して出力する。具体的には、異常要因抽出部３５は、各データ項目グループに関する多体相関モデルのうちモデル破壊が発生した多体相関モデルについて、再予測値算出部２５１および部分異常度算出部２５２を用いて、説明変数データ項目別の部分異常度を算出する。ここで、各データ項目グループに関する多体相関モデルとは、そのデータ項目グループに含まれるデータ項目に関する回帰式の多体相関モデルである。そして、異常要因抽出部３５は、異常統計値算出部２５３を用いて、データ項目グループ毎に、データ項目別に部分異常度を集計して異常統計値を算出する。そして、異常要因抽出部３５は、データ項目グループ毎に、異常統計値に基づき異常要因の候補となるデータ項目を抽出する。そして、異常要因抽出部３５は、データ項目グループ別に抽出した異常要因の候補となるデータ項目を、データ項目グループ別に出力する。

また、例えば、異常要因抽出部３５は、データ項目グループに優先順位をつけてもよい。この場合、異常要因抽出部３５は、優先順位の高いデータ項目グループから順に、異常統計値に基づき異常要因の候補として抽出したデータ項目を出力してもよい。このとき、データ項目グループの優先順位としては、そのデータ項目グループに関する多体相関モデル数が多い（または少ない）順が設定されてもよい。あるいは、データ項目グループの優先順位は、運用者によってあらかじめ定められた重要度の順であってもよい。

ここで、異常要因抽出部３５が通知対象とするデータ項目グループの数は、例えば、運用者によって任意の数が設定されていてもよい。通知対象とするデータ項目グループの個数は、障害の原因を見つけられる可能性を高め、障害の全体の状況を把握するという観点からは、多いほど好ましい。一方で、誤報が発生したときの調査時間を短縮するという観点からは、通知対象とするデータ項目グループの個数は、少ないほど好ましい。

以上のように構成されたシステム分析装置３の動作について説明する。システム分析装置３の動作の概略は、図６を参照して説明した本発明の第２の実施の形態としてのシステム分析装置２の動作の概略と同様である。ただし、ステップＳ１０３における分析モデル生成動作と、ステップＳ１０９における異常要因抽出動作の詳細が異なる。

ステップＳ１０３での分析モデル生成動作の詳細を、図１２に示す。

図１２では、システム分析装置３は、ステップＳ２０１〜Ｓ２０３まで、本発明の第２の実施の形態におけるシステム分析装置２と同様に動作して、優良多体相関モデル群を生成する。

次に、データ項目分類部３１３は、状態情報に含まれるデータ項目群を分類する（ステップＳ４０４）。前述のように、分類は、分析モデルに含まれる優良多体相関モデルの少なくとも１つの回帰式に、目的変数または説明変数として含まれるデータ項目が、同一のグループとなるように行われる。

次に、データ項目分類部３１３は、ステップＳ２０３で生成された優良多体相関モデル群からなる分析モデル情報とあわせて、データ項目グループ情報を、分析モデル記憶部２０１に保存する（ステップＳ４０５）。

以上で、システム分析装置３は、分析モデル生成動作を終了する。

次に、ステップＳ１０９での異常要因抽出動作の詳細について説明する。システム分析装置３は、データ項目グループごとに、図８を参照して説明した本発明の第２の実施の形態における異常要因抽出動作を実行する。もし、データ項目グループに優先順位をつけている場合、システム分析装置３は、優先順位の高いデータ項目グループから順に、通知対象として定められた所定のグループ数まで、図８の動作を繰り返せばよい。

以上で、システム分析装置３は、異常要因抽出動作を終了する。

次に、本発明の第３の実施の形態の効果について述べる。

本発明の第３の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より把握しやすく通知することができる。

その理由について述べる。本実施の形態では、データ項目分類部が、被監視システムを表す状態情報を構成するデータ項目を分類してデータ項目グループを生成する。この分類は、分析モデルに含まれる優良多体相関モデルの少なくとも１つの回帰式に、目的変数または説明変数として含まれたデータ項目が、同一のグループとなるように行われる。つまり、同一のデータ項目グループには、回帰式の観点から依存関係にあるデータ項目が含まれる。また、回帰式の観点から依存関係にないデータ項目同士は、異なるデータ項目グループに含まれることになる。そして、異常要因抽出部が、データ項目グループ別に、異常要因の候補となるデータ項目を抽出して出力する。これにより、本実施の形態は、回帰式の観点から依存関係にないデータ項目を区別して、異常要因の候補となるデータ項目を通知できる。したがって、本実施の形態は、障害が複数のデータ項目グループに及ぶ場合であっても、障害全体の状況をより把握しやすく通知することができる。また、何らかの理由で、特定のデータ項目グループにおける異常統計値が、正確に計算されないケースも考えられる。このような場合でも、本実施の形態は、他のデータ項目グループで高い異常統計値をもつデータ項目を通知することができるため、異常の原因を特定するのに有用な情報を提供できる可能性を高める。

なお、本実施の形態において、データ項目分類部は、分析モデルに含まれる優良多体相関モデルの少なくとも１つの回帰式に、目的変数または説明変数として含まれるデータ項目が、同一のグループとなるようにデータ項目を分類する例を示した。これに限らず、データ項目分類部は、他のデータ項目分類手法を用いてもよい。例えば、データ項目分類部は、あらかじめ運用者によって対象システムの専門知識に基づきデータ項目が分類された結果を用いて、データ項目グループを生成してもよい。

他の例として、データ項目分類部は、Ｋ平均法やスペクトラルクラスタリングなど、データマイニングでデータ項目を分類するために用いられる手法を用いて、データ項目グループを生成してもよい。

（第４の実施の形態）
次に、本発明の第４の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第１〜２の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。

本発明の第４の実施の形態としてのシステム分析装置４の機能ブロック構成を図１３に示す。図１３において、システム分析装置４は、本発明の第２の実施の形態としてのシステム分析装置２に対して、異常要因抽出部２５に替えて異常要因抽出部４５を備える点が異なる。異常要因抽出部４５は、異常要因抽出部２５に対して、部分異常度算出部２５２に替えて、部分異常度算出部４５２を備える点が異なる。システム分析装置４は、被監視システム９に接続される。なお、被監視システム９の詳細については、本発明の第１の実施の形態における被監視システム９と同様の構成であるため、本実施の形態における説明を省略する。また、図１３において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置４およびその各機能ブロックは、図２を参照して説明した本発明の第１の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置４およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

部分異常度算出部４５２は、第１のモデル破壊発生状況となった多体相関モデルと、第２のモデル破壊発生状況となった多体相関モデルとの間で、割り当てる部分異常度の最大値の比を調整する。具体的には、部分異常度算出部４５２は、第１のモデル破壊発生状況での多体相関モデルにおける部分異常度の最大値が、第２のモデル破壊発生状況での多体相関モデルにおける部分異常度の最大値よりも大きくなるように、部分異常度を割り当てる。前述のように、第１のモデル破壊発生状況とは、多体相関モデルにおいて、各説明変数データ項目についての再予測値が全てモデル破壊となった場合をいう。また、第２のモデル破壊発生状況とは、多体相関モデルにおいて、各説明変数データ項目についての再予測値の少なくとも１つがモデル破壊とならず、少なくとも１つがモデル破壊となった場合をいう。

例えば、部分異常度算出部４５２は、第１のモデル破壊発生状況となった多体相関モデルでは、次のように部分異常度を割り当てる。この場合、部分異常度算出部４５２は、目的変数データ項目の部分異常度が、説明変数データ項目の部分異常度より高くなるよう各部分異常度の数値を割り当てる。

また、部分異常度算出部４５２は、第２のモデル破壊発生状況となった多体相関モデルでは、次のように部分異常度を割り当てる。この場合、部分異常度算出部４５２は、再予測値がモデル破壊となった説明変数データ項目の部分異常度が、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数データ項目の部分異常度以上となるようにする。さらに、部分異常度算出部４５２は、再予測値がモデル破壊となった説明変数データ項目の部分異常度が、第１のモデル破壊発生状況において目的変数データ項目に割り当てられる部分異常度未満となるよう、部分異常度の数値を割り当てる。

具体例として、第１のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部４５２は、目的変数データ項目の部分異常度に１を割り当て、説明変数データ項目の部分異常度に０を割り当てる。また、第２のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部４５２は、再予測値がモデル破壊となった説明変数データ項目の部分異常度に０を割り当てる。また、第２のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部４５２は、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に０を割り当てる。これにより、第１のモデル破壊発生状況での部分異常度の最大値（目的変数データ項目の部分異常度１）は、第２のモデル破壊発生状況での部分異常度の最大値（再予測値がモデル破壊となった説明変数データ項目の部分異常度０）より大きくなる。

また、他の具体例として、第１のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部４５２は、目的変数データ項目の部分異常度に１を割り当て、説明変数データ項目の部分異常度に０を割り当てる。また、第２のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部４５２は、再予測値がモデル破壊となった説明変数データ項目の部分異常度に０．５を割り当てる。また、第２のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部４５２は、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に０を割り当てる。これにより、第１のモデル破壊発生状況での部分異常度の最大値（目的変数データ項目の部分異常度１）は、第２のモデル破壊発生状況での部分異常度の最大値（再予測値がモデル破壊となった説明変数データ項目の部分異常度０．５）より大きくなる。

ここで、異常要因として絞り込んだ結果に正常なデータ項目が混入する可能性を低くするという観点について考える。このような観点からは、第１のモデル破壊発生状況での部分異常度の最大値を、第２のモデル破壊発生状況での部分異常度の最大値で割った値の絶対値が大きいほど好ましい。例えば、第２のモデル破壊発生状況での部分異常度の最大値を０とすることが最も好ましい。

また、異常要因として絞り込んだ結果に異常なデータ項目が網羅される可能性を高くするという観点について考える。このような観点からは、第１のモデル破壊発生状況での部分異常度の最大値を、第２のモデル破壊発生状況での部分異常度の最大値で割った値の絶対値が１に近いほど好ましい。

なお、部分異常度として割り当てる値は、運用者やシステムの目的に合わせて任意の定義を設定可能である。被監視システム９が異常なときのデータの蓄積がある場合には、そのデータを分析した結果から、部分異常度として割り当てる値を決定してもよい。例えば、前述の具体例のように、部分異常度算出部４５２は、第１のモデル破壊発生状況において、目的変数データ項目の部分異常度に１を割り当て、説明変数データ項目の部分異常度に０を割り当てるとする。また、部分異常度算出部４５２は、第２のモデル破壊発生状況において、目的変数のデータ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に０を割り当てるとする。このとき、第２のモデル破壊発生状況において、再予測値がモデル破壊となった説明変数のデータ項目の部分異常度にいくらを割り当てればよいか、被監視システム９が異常なときのデータを分析して決定することを考える。この場合、まず、異常要因として絞り込んだ結果に正常なデータ項目が混入する確率の上限値と、異常要因として絞り込んだ結果に異常なデータ項目が入らない確率の上限値とを設定する。その次に、第２のモデル破壊発生状況において、再予測値がモデル破壊となった説明変数のデータ項目に割り当てる部分異常度を０から１まで変化させる。そして、変化させた部分異常度を用いて異常要因を抽出し、異常要因として絞り込んだ結果に正常なデータ項目が混入する確率と、異常要因として絞り込んだ結果に異常なデータ項目が入らない確率とを算出する。ここで、変化させた部分異常度のうち、異常要因として絞り込んだ結果に正常なデータ項目が混入する確率が、設定した上限値を下回り、異常要因として絞り込んだ結果に異常なデータ項目が入らない確率が、設定した上限値を下回るものがあるとする。この場合、そのような部分異常度の中から、第２のモデル破壊発生状況において再予測値がモデル破壊となった説明変数のデータ項目の部分異常度に割り当てる値を選択することができる。もし、上述の上限値の少なくとも一方が満たされない場合は、その上限値を再設定するか、データ分析の条件を変更する。そして、設定した上限値の両方を満たすよう、第２のモデル破壊発生状況において再予測値がモデル破壊となった説明変数のデータ項目に割り当てる部分異常度を探索する。

また、部分異常度算出部４５２は、上述した部分異常度に重みをかけたものを、部分異常度としてもよい。重みとしては、例えば、モデル破壊発生時の予測値の乖離度や、回帰式の優良度等を適用してもよい。なお、ここでいう予測値の乖離度とは、例えば、「予測誤差／予測誤差の許容範囲の下限」と「予測誤差／予測誤差の許容範囲の上限」との大きい方の値であってもよい。例えば、重みとして、モデル破壊発生時の予測値の乖離度をかける場合の部分異常度は、０または乖離度となる。なお、汎用的に異常要因特定に有用な情報を的確に抽出するという観点からは、部分異常度の定義としては、２値の定義が好ましい。一方で、特定のシステムに特化させ、より的確な情報を抽出するという観点からは、部分異常度に重みをかける方が好ましい。部分異常度にかける重みは、対象システムに対する知見に基づき、運用者によって任意の定義を設定可能である。

以上のように構成されたシステム分析装置４の動作について説明する。なお、システム分析装置４の動作の概略は、図６を参照して説明した本発明の第２の実施の形態としてのシステム分析装置２の動作の概略と略同様である。ただし、ステップＳ１０９における異常要因抽出動作の詳細が異なる。

本実施の形態における異常要因抽出動作の詳細を、図１４に示す。ここでは、部分異常度算出部４５２は、第１のモデル破壊発生状況では、目的変数データ項目の部分異常度に１を割り当て、説明変数データ項目の部分異常度に０を割り当てることとする。また、部分異常度算出部４５２は、第２のモデル破壊発生状況では、再予測値がモデル破壊となった説明変数のデータ項目の部分異常度に０を割り当てることとする。また、部分異常度算出部４５２は、第２のモデル破壊発生状況では、目的変数のデータ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に０を割り当てることとする。

図１４において、システム分析装置４の異常要因抽出動作では、図８を参照して説明した本発明の第２の実施の形態における異常要因抽出動作に対して、ステップＳ３０７に替えて、ステップＳ４０７が実行される点が異なる。

Ｓ４０７では、部分異常度算出部４５２は、モデル破壊が発生した再予測値の計算に用いた説明変数データ項目の部分異常度に０を割り当てる。

以上で、システム分析装置４は、異常要因抽出動作を終了する。

次に、本発明の第４の実施の形態の効果について述べる。

本発明の第４の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、運用者の嗜好に合わせてより的確に抽出することができる。つまり、本実施の形態は、異常要因として絞り込んだ結果において、正常なデータ項目が混入する可能性と、異常なデータ項目が網羅される可能性との度合いを、運用者の嗜好に合わせて調整したうえで、異常要因特定に有用な情報を、的確に抽出することができる。

その理由について述べる。本実施の形態では、本発明の第２の実施の形態と略同一の構成に加え、部分異常度算出部が、第１のモデル破壊発生状況での部分異常度の最大値より、第２のモデル破壊発生状況での部分異常度の最大値が小さくなるように、部分異常度を割り当てる。このように、本実施の形態は、再予測値によるモデル破壊の発生状況が異なる多体相関モデル間で部分異常度の最大値の差を調整する。その結果、本実施の形態は、異常要因として絞り込んだ結果に正常なデータ項目が混入する可能性と、異常要因として絞り込んだ結果に異常なデータ項目が網羅される可能性の度合いとを調整することができ、上述の効果を奏する。

（第５の実施の形態）
次に、本発明の第５の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第１〜２の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。

本発明の第５の実施の形態としてのシステム分析装置５の機能ブロック構成を図１５に示す。図１５において、システム分析装置５は、本発明の第２の実施の形態としてのシステム分析装置２に対して、分析モデル取得部２１に替えて分析モデル取得部５１を備える点が異なる。また、分析モデル取得部５１は、分析モデル取得部２１に対して、多体相関モデル生成部２１１に替えて、多体相関モデル生成部５１１を備える点が異なる。システム分析装置５は、被監視システム９に接続される。なお、被監視システム９の詳細については、本発明の第１の実施の形態における被監視システム９と同様の構成であるため、本実施の形態における説明を省略する。また、図１５において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置５およびその各機能ブロックは、図２を参照して説明した本発明の第１の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置５およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

多体相関モデル生成部５１１は、後述する代表データ項目が含まれるように回帰式を構成することを除いて、多体相関モデル生成部２１１と同様に構成される。

多体相関モデル生成部５１１は、状態情報に含まれるデータ項目群から、データ項目群の代表となるデータ項目である代表データ項目を選出する。そして、多体相関モデル生成部５１１は、その代表データ項目と、状態情報に含まれるデータ項目群のうち、その代表データ項目を除く任意の２つ以上のデータ項目とを用いて、多体相関モデルを生成する。そして、多体相関モデル生成部５１１は、選出した代表データ項目およびその代表データ項目を除く２つ以上のデータ項目の全ての組合せについて、３つ以上のデータ項目を用いて構成される回帰式を構築する。ここで、多体相関モデル生成部５１１は、それぞれの多体相関モデルを構成するために選出したデータ項目の組合せについて、すべてのデータ項目が目的変数となるようにデータ項目を入れ替えて、多体相関モデルを生成する。

なお、代表データ項目としては、その代表データ項目を含むことで、すべての多体相関モデルの予測精度を全体的に高くするものが選ばれることが望ましい。例えば、多体相関モデル生成部５１１は、代表データ項目の選択手法として、特願２０１４−６５１２０に記載の技術を適用してもよい。

以上のように構成されたシステム分析装置５の動作について説明する。システム分析装置５の動作の概略は、図６を参照して説明した本発明の第２の実施の形態としてのシステム分析装置２の動作の概略と略同様である。ただし、ステップＳ１０３における分析モデル生成動作の詳細が異なる。

本実施の形態における分析モデル生成動作の詳細を、図１６に示す。

図１６では、まず、多体相関モデル生成部５１１は、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶部２０３から取得する（ステップＳ２０１）。

次に、多体相関モデル生成部５１１は、取得した状態系列情報を用いて、代表データ項目を選出する。そして、多体相関モデル生成部５１１は、代表データ項目および代表データ項目を除く２つ以上のデータ項目を含む回帰式で構成される多体相関モデル群を、分析モデルの候補として生成する（ステップＳ５０２）。

以上で、システム分析装置５は、分析モデル生成動作を終了する。

次に、本発明の第５の実施の形態の効果について述べる。

本発明の第５の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、的確に抽出することができる。

その理由について述べる。本実施の形態では、本発明の第２の実施の形態と略同一の構成に加え、多体相関モデル生成部５１１が、代表データ項目を含むように回帰式を生成するからである。これにより、本実施の形態は、データ項目の組み合わせ数を減らし、分析モデルの候補となる多体相関モデルの数を減らすことができる。その結果、本実施の形態は、より少ない計算資源で、分析モデルの生成および分析が可能となり、上述の効果を奏する。

（第６の実施の形態）
次に、本発明の第６の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第１〜２の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。

本発明の第６の実施の形態としてのシステム分析装置６の機能ブロック構成を図１７に示す。図１７において、システム分析装置６は、本発明の第２の実施の形態としてのシステム分析装置２に対して、分析モデル取得部２１に替えて分析モデル取得部６１を備える点が異なる。分析モデル取得部６１は、分析モデル取得部２１に対して、多体相関モデル生成部２１１に替えて、多体相関モデル生成部６１１を備える点が異なる。さらに、分析モデル取得部６１は、データ項目分類部６１３を有する。また、システム分析装置６は、被監視システム９に接続される。なお、被監視システム９の詳細については、本発明の第１の実施の形態における被監視システム９と同様の構成であるため、本実施の形態における説明を省略する。また、図１７において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置６およびその各機能ブロックは、図２を参照して説明した本発明の第１の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置６およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

データ項目分類部６１３は、状態情報に含まれるデータ項目群を分類する。分類は、データ項目の類似度に応じて行われる。以降、同一の分類とされたデータ項目のグループを、データ項目グループとも記載する。さらにデータ項目分類部６１３は、データ項目グループごとに、データ項目グループの代表となるデータ項目である代表データ項目を１つ選出する。代表データ項目としては、その代表データ項目を含むことで、代表データ項目と同一データ項目グループ内のすべての多体相関モデルの予測精度を全体的に高くするものが選ばれることが望ましい。

また、データ項目分類部６１３は、データ項目グループの情報を、分析モデル情報に加えて分析モデル記憶部２０１に保存する。データ項目グループの情報には、データ項目グループの識別子と、各データ項目グループに含まれるデータ項目および代表データ項目の識別子が含まれる。

なお、データ項目分類部６１３は、データ項目の分類手法として、例えば、Ｋ近傍法、スペクトラルクラスタリング、または、特願２０１４−６５１２０に記載の技術などのように、データの特徴からデータ項目を分類する方法を採用可能である。また、データ項目分類部６１３は、データ項目の分類手法として、データ項目を被監視システム９のサブシステムごとに分類する等のように、被監視システム９に対する専門知識に基づいてデータ項目を分類する方法を採用可能である。また、データ項目分類部６１３は、これらの分類手法を組み合わせる方法を用いてもよい。

また、データ項目分類部６１３は、それぞれのデータ項目グループに対する代表データ項目を選出する手法として、例えば、特願２０１４−６５１２０に記載の技術など、データの特徴から代表データ項目を選出する方法を採用可能である。また、データ項目分類部６１３は、それぞれのデータ項目グループに対する代表データ項目を選出する手法として、被監視システム９に対する専門知識に基づいて代表データ項目を選出する方法を採用可能である。また、データ項目分類部６１３は、これらの選出手法を組み合わせる方法を適用してもよい。

多体相関モデル生成部６１１は、データ項目グループごとに、代表データ項目が含まれるように回帰式を構成することを除いて、多体相関モデル生成部２１１と同様に構成される。

具体的には、多体相関モデル生成部６１１は、データ項目分類部６１３からデータ項目グループと、それぞれのデータ項目グループの代表データ項目を取得する。そして、多体相関モデル生成部６１１は、データ項目グループごとに、次のようにして、多体相関モデルを生成する。具体的には、多体相関モデル生成部６１１は、そのデータ項目グループに含まれるデータ項目を対象として、代表データ項目およびその代表データ項目を除く２つ以上のデータ項目の全ての組合せについて、３つ以上のデータ項目を用いて構成される回帰式を構築する。ここで、多体相関モデル生成部６１１は、それぞれの多体相関モデルを構成するために選出されたデータ項目に対して、すべてのデータ項目が目的変数となるようにデータ項目を入れ替えて、多体相関モデルを生成する。

以上のように構成されたシステム分析装置６の動作について説明する。システム分析装置６の動作の概略は、図６を参照して説明した本発明の第２の実施の形態としてのシステム分析装置２の動作の概略と略同様である。ただし、ステップＳ１０３における分析モデル生成動作が異なる。

本実施の形態における分析モデル生成動作の詳細を、図１８に示す。

図１８では、まず、分析モデル取得部６１は、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶部２０３から取得する（ステップＳ２０１）。

次に、データ項目分類部６１３は、取得した状態系列情報を用いて、データ項目をデータ項目グループに分類し、データ項目グループごとに代表データ項目を選出する。さらに、データ項目分類部６１３は、データ項目グループの情報を、分析モデル情報に加えて分析モデル記憶部２０１に保存する（ステップＳ６０１）。

次に、多体相関モデル生成部６１１は、データ項目分類部６１３から、データ項目グループの情報を取得する。データ項目グループの情報には、データ項目グループを表す情報と、それぞれのデータ項目グループの代表データ項目を表す情報とが含まれる。そして、多体相関モデル生成部６１１は、取得したデータ項目グループの情報と状態系列情報とを用いて、データ項目グループごとに、分析モデルの候補となる多体相関モデル群を生成する。具体的には、多体相関モデル生成部６１１は、各データ項目グループについて、代表データ項目および代表データ項目を除く２つ以上のデータ項目を含む多体相関モデル群を、分析モデルの候補として生成する（ステップＳ６０２）。

以上で、システム分析装置６は、分析モデル生成動作を終了する。

次に、本発明の第６の実施の形態の効果について述べる。

本発明の第６の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、的確に抽出することができる。

その理由について述べる。本実施の形態では、本発明の第２の実施の形態と略同一の構成に加え、データ項目分類部が、データ項目を分類するとともに、データ項目グループごとに代表データ項目を選出する。さらに、多体相関モデル生成部が、それぞれのデータ項目グループでその代表データ項目を含むように多体相関モデルを生成する。この構成により、本実施の形態は、データ項目グループ間に跨るデータ項目の組み合わせと、代表データ項目を含まないデータ項目の組み合わせとについては、多体相関モデルを生成しない。その結果、そのような組合せについての多体相関モデルは、分析モデルにも含まれない。さらに、異常検知および異常要因特定の算出過程において、利用される多体相関モデルの数が減ることになる。その結果、これらの処理をより少ない計算資源で実行できる可能性が高まる。したがって、本実施の形態は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、的確に抽出することができる、という第２の実施形態の効果を、より少ない計算資源で奏する。

（第７の実施の形態）
次に、本発明の第７の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第１〜５の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。

本発明の第７の実施の形態としてのシステム分析装置７の機能ブロック構成を図１９に示す。図１９において、システム分析装置７は、本発明の第５の実施の形態としてのシステム分析装置５に対して、標準寄与率取得部２２に替えて標準寄与率取得部７２と、異常要因抽出部２５に替えて異常要因抽出部７５とを備える点が異なる。異常要因抽出部７５は、異常要因抽出部２５に対して、再予測値算出部２５１に替えて再予測値算出部７５１を備える点が異なる。さらに、異常要因抽出部７５は、モデル破壊再検出部７５４を備える。また、システム分析装置７は、被監視システム９に接続される。なお、被監視システム９の詳細については、本発明の第１の実施の形態における被監視システム９と同様の構成であるため、本実施の形態における説明を省略する。また、図１９において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置７およびその各機能ブロックは、図２を参照して説明した本発明の第１の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置７およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

標準寄与率取得部７２は、分析モデルに含まれる各多体相関モデルに加えて、後述の再生成モデルに含まれる各再生成多体相関モデルにおいて、各説明変数データ項目の標準寄与率を取得する。

異常要因抽出部７５は、異常判定部２９によって被監視システム９の状態が異常と判定されると次のように動作するよう構成される。なお、上述したように、異常判定部２９によってモデル破壊情報のモデル破壊情報記憶部２０４への登録が行われる場合、異常要因抽出部７５は、モデル破壊情報記憶部２０４にモデル破壊情報が新たに追加されると動作するよう構成される。具体的には、異常要因抽出部７５は、後述のモデル破壊再検出部７５４と、後述の再予測値算出部７５１と、部分異常度算出部２５２と、異常統計値算出部２５３とを用いて、データ項目別の異常統計値を算出する。異常要因抽出部７５に含まれる各機能ブロックの構成の詳細については後述する。そして、異常要因抽出部７５は、データ項目別の異常統計値がより高いものから順に、被監視システム９の異常要因の候補となるデータ項目を抽出する。例えば、異常要因抽出部７５は、異常統計値が閾値以上のデータ項目を、異常要因の候補となるデータ項目として抽出してもよい。また、例えば、異常要因抽出部７５は、異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出してもよい。

次に、異常要因抽出部７５に含まれるモデル破壊再検出部７５４、再予測値算出部７５１の構成の詳細について説明する。

モデル破壊再検出部７５４は、多体相関モデル再生成部７５４１を含んで構成される。多体相関モデル再生成部７５４１は、モデル破壊情報記憶部２０４に新たに追加された分析モデルのモデル破壊情報に基づいて、再生成モデルを生成する。

また、モデル破壊再検出部７５４は、分析モデルのモデル破壊が検知された時刻における再生成モデルのモデル破壊情報を生成する。なお、再生成モデルについて生成されるモデル破壊情報は、モデル破壊情報記憶部２０４に記憶されるモデル破壊情報と同じ種類の情報で構成される。

多体相関モデル再生成部７５４１は、取得した分析モデル情報と、取得した分析モデルのモデル破壊情報とに基づいて、代表データ項目の次に代表データ項目として適したデータ項目である二次代表データ項目を選出する。そして、多体相関モデル再生成部７５４１は、二次代表データ項目を回帰式に含む再生成多体相関モデル群を生成する。そして、多体相関モデル再生成部７５４１は、再生成多体相関モデル群のうち所定の優良条件を満たす再生成優良多体相関モデル群を、再生成モデルとして生成する。再生成モデルの生成処理の詳細については、本発明の第５の実施の形態において、図１６を参照して説明した代表データ項目を用いた分析モデル生成処理の説明において、代表データ項目を二次代表データ項目と読み替えることにより、同様に説明される。なお、二次代表データ項目は、回帰式に含めることで、再生成モデルの全体的な予測精度を高められるものであり、モデル破壊が検知された時刻において正常なデータ項目であることが望ましい。

多体相関モデル再生成部７５４１は、上記の条件にあてはまるデータ項目を二次代表データ項目として選出するための指標として、例えば、各データ項目について代表スコアおよび破壊スコアを算出してもよい。

まず、代表スコアについて説明する。多体相関モデル再生成部７５４１は、分析モデル情報に基づいて、代表データ項目を除くデータ項目ごとに、代表スコアを算出する。代表スコアは、そのデータ項目を含むように再生成モデルを生成することで、再生成モデルの全体的な予測精度を高められる度合を定量化したものである。例えば、代表スコアとして、特願２０１４−６５１２０に記載の技術において代表データ項目を選定する際の指標を用いてもよい。

また、例えば、多体相関モデル再生成部７５４１は、優良相互相関モデルの回帰式の優良度Ｆを用いて、各データ項目の代表スコアを算出してもよい。具体的には、多体相関モデル再生成部７５４１は、分析モデル情報に含まれる分析モデルの学習期間の情報に基づき、分析モデルの学習期間と同じ期間の状態系列情報を状態情報記憶部２０３から取得する。そして、多体相関モデル再生成部７５４１は、その状態系列情報を用いて、２つのデータ項目を含む回帰式（相互相関モデル）を構成する。相互相関モデルの生成処理は、データ項目のすべての組み合わせに対して、本発明の第２の実施の形態において説明した相互相関モデル群生成処理と同様の手順で行われる。そして、多体相関モデル再生成部７５４１は、相互相関モデルの回帰式に対して、回帰式の優良度を求める。次に、多体相関モデル再生成部７５４１は、所定の優良モデル条件を満たす相互相関モデル群である優良相互相関モデル群を抽出する。例えば、多体相関モデル再生成部７５４１は、優良相互相関モデル群を抽出するための回帰式の優良度として、前述の回帰式の優良度Ｆを用い、優良モデル条件として、式（８）を用いてもよい。そして、多体相関モデル再生成部７５４１は、優良相互相関モデルの回帰式の優良度Ｆに基づいて、データ項目別の統計値を算出し、それを代表スコアとしてもよい。詳細には、多体相関モデル再生成部７５４１は、優良相互相関モデル群に含まれる相互相関モデルの回帰式の優良度Ｆをデータ項目ごとに累積する。つまり、多体相関モデル再生成部７５４１は、当該相互相関モデル群に含まれる各相互相関モデルの回帰式の優良度を、目的変数に用いられるデータ項目および説明変数に用いられるデータ項目に対応づける。そして、多体相関モデル再生成部７５４１は、各データ項目に対応付けた回帰式の優良度Ｆを累積して加算すればよい。そして、多体相関モデル再生成部７５４１は、このようにして各データ項目について、回帰式の優良度Ｆの累計値（統計値）を、代表スコアとすればよい。

次に、破壊スコアについて説明する。多体相関モデル再生成部７５４１は、取得した分析モデルのモデル破壊情報に基づいて、代表データ項目を除くデータ項目ごとに、破壊スコアを算出する。破壊スコアは、そのデータ項目に異常の影響が表れているとみなす確信度を定量化したものである。例えば、破壊スコアには、第４の実施の形態の異常統計値を用いてもよい。具体的には、多体相関モデル再生成部７５４１が、第４の実施の形態の異常統計値を算出する処理を実行し、そのデータ項目ごとの異常統計値を破壊スコアとする。また、この場合の異常統計値としては、例えば、第２の実施の形態の異常統計値を用いてもよい。

このようにして求めた代表スコアおよび破壊スコアを用いて、多体相関モデル再生成部７５４１は、二次代表データ項目の選出を行う。具体的には、多体相関モデル再生成部７５４１は、データ項目の破壊スコアが最小で、代表スコアが最大であるデータ項目を二次代表データ項目として選出する。そのようなデータ項目が複数ある場合には、例えば、多体相関モデル再生成部７５４１は、それらのデータ項目からランダムに二次代表データ項目を選出してもよい。

再予測値算出部７５１は、再予測値の算出に用いる標準寄与率とモデル情報とモデル破壊情報とが異なる点を除いて、再予測値算出部２５１と同様に構成される。

具体的には、再予測値算出部７５１は、多体相関モデル再生成部７５４１によって生成された再生成モデルの標準寄与率を、標準寄与率取得部７２から取得する。

また、再予測値算出部７５１は、多体相関モデル再生成部７５４１によって生成された再生成モデルのモデル情報を、モデル破壊再検出部７５４から取得する。

また、再予測値算出部７５１は、取得した標準寄与率と再生成モデルのモデル情報とに基づいて、再予測値の算出式を生成する。具体的には、再予測値算出部７５１は、再生成モデルに含まれる再生成多体相関モデルの回帰式ごとに、再予測値の閾値と、その回帰式に含まれる各データ項目に対する再予測値の算出式とを生成する。また、再予測値算出部７５１は、モデル破壊再検出部７５４から、再生成モデルのモデル破壊情報を取得する。そして、再予測値算出部７５１は、再生成モデルのうちモデル破壊が発生した各再生成多体相関モデルについて、再予測値算出部２５１と同様の処理を行う。すなわち、再予測値算出部７５１は、モデル破壊が発生した各再生成多体相関モデルの回帰式について、説明変数データ項目ごとに、当該データ項目の状態情報および標準寄与率に基づいて、当該回帰式の目的変数の予測値を再予測値として算出する。

以上のように構成されたシステム分析装置７の動作について図２０を用いて説明する。

図２０では、まず、システム分析装置７は、ステップＳ１０１〜Ｓ１０８まで、本発明の第５の実施の形態と同様に動作する。なお、本発明の第５の実施の形態で説明したように、ステップＳ１０３における分析モデルの生成動作の詳細は、本発明の第２の実施の形態におけるステップＳ１０３とは異なり、図１６に示した通りである。

次に、多体相関モデル再生成部７５４は、モデル破壊情報記憶部２０４に新たに記憶された分析モデルのモデル破壊情報に基づいて、再生成モデルのモデル情報を生成する。そして、モデル破壊再検出部７５４１は、モデル破壊情報記憶部２０４に新たに記憶された分析モデルのモデル破壊情報の発生時刻における、再生成モデルのモデル破壊情報を生成する（ステップＳ７１１）。このステップの詳細については後述する。

次に、標準寄与率取得部７２は、再生成モデルに含まれる各再生成多体相関モデルに対する各説明変数データ項目の標準寄与率を算出する（ステップＳ７１２）。

次に、異常要因抽出部７５は、１つ以上の異常要因候補データ項目を抽出する（ステップＳ７１３）。このステップの動作は、本発明の第５（第２）の実施の形態におけるステップＳ１０９の異常要因候補データ項目抽出動作に対して、異常要因抽出動作時に利用する標準寄与率とモデル情報とモデル破壊情報とが異なる。具体的には、本発明の第５（第２）の実施の形態では、異常要因抽出部２５は、分析モデルの標準寄与率と、分析モデルのモデル情報と、分析モデルにおけるモデル破壊情報とを利用してステップＳ１０９を実行していた。これに対して、本実施の形態では、異常要因抽出部７５は、再生成モデルの標準寄与率と、再生成モデルのモデル情報と、再生成モデルにおけるモデル破壊情報とを利用してこのステップを実行する。この点を除いて、本実施の形態におけるステップＳ７１３の動作は、本発明の第５の実施の形態におけるステップＳ１０９と処理内容が同様である。このため、ステップＳ７１３の詳細については、本実施の形態における説明を省略する。

そして、システム分析装置７は、運用を終了するという判断（ステップＳ１１０でＹｅｓ）が与えられるまで、上記の動作を繰り返す。

ここで、ステップＳ７１１での再生成モデルにおけるモデル破壊情報を生成する動作の詳細を、図２１に示す。

図２１では、まず、モデル破壊再検出部７５４は、分析モデル記憶部２０１から分析モデル情報を取得するとともに、モデル破壊情報記憶部２０４からモデル破壊情報を取得する（ステップＳ７０１）。このステップで取得されるモデル破壊情報は、分析モデルについて検出されたモデル破壊情報である。

次に、モデル破壊再検出部７５４は、取得した分析モデル情報から、分析モデルの生成に用いられた学習期間を取得する。そして、モデル破壊再検出部７５４は、その学習期間に対応する状態系列情報を、状態情報記憶部２０３から取得する（ステップＳ７０２）。

次に、多体相関モデル再生成部７５４１は、モデル破壊再検出部７５４が取得した状態系列情報を用いて、二次代表データ項目を選出する。そして多体相関モデル再生成部７５４１は、選出した二次代表データ項目を含む回帰式で構成される再生成多体相関モデル群を生成する（ステップＳ７０３）。

次に、多体相関モデル再生成部７５４１は、再生成多体相関モデル群に対して、本発明の第２の実施の形態と略同様にステップＳ２０３を実行する。これにより、多体相関モデル再生成部７５４１は、再生成多体相関モデル群から、所定の優良モデル条件に基づいて再生成優良多体相関モデル群を抽出し、再生成モデルとする（ステップＳ２０３）。

次に、多体相関モデル再生成部７５４１は、再生成モデルのモデル情報を生成する（ステップＳ７０４）。

次に、モデル破壊再検出部７５４は、多体相関モデル再生成部７５４１から再生成モデルのモデル情報を取得する。また、モデル破壊再検出部７５４は、ステップＳ７０１で取得した分析モデルのモデル破壊情報から、モデル破壊の発生した時刻を取得する。そして、モデル破壊再検出部７５４は、分析モデルのモデル破壊発生時刻における再生成モデルのモデル破壊の有無を評価するために必要な状態系列情報を、状態情報記憶部２０３からモデル破壊評価用状態系列情報として取得する（ステップＳ７０５）。

次に、モデル破壊再検出部７５４は、再生成モデルのモデル情報とモデル破壊評価用状態系列情報とを用いて、分析モデルのモデル破壊発生時刻と同時刻のモデル破壊を評価する。そして、モデル破壊再検出部７５４は、評価結果に基づいて、再生成モデルのモデル破壊情報を生成し、再生成モデルのモデル情報と共に再予測値算出部７５１に出力する（ステップＳ７０６）。

以上で、システム分析装置７は、再生成モデルについてモデル破壊情報を生成する動作を終了する。

次に、本発明の第７の実施の形態の効果について述べる。

本発明の第７の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、より的確に抽出することができる。

その理由について述べる。本実施の形態は、本発明の第５の実施の形態との略同一の構成に加え、次のように構成される。すなわち、異常要因抽出部７５は、二次代表データ項目を選出する。二次代表データ項目は、回帰式に含めることで、再生成モデルの全体的な予測精度を高められると同時に、モデル破壊が検知された時刻において正常と思われるデータ項目である。そして、異常要因抽出部７５は、その二次代表データ項目を、多体相関モデルの回帰式に共通して含まれるように再生成モデルを生成する。そして、異常要因抽出部７５は、その再生成モデルを用いて、異常要因にかかわるデータ項目を抽出するからである。このような構成により、本実施の形態は、個々の回帰式に含まれるデータ項目のうち、少なくとも１つは、正常なデータ項目である可能性を高めることができる。その結果、本実施の形態は、部分異常度をより正確に算出することができる可能性を高める。より正確な部分異常度の算出は、より正確な異常統計値の算出につながる。したがって、本実施の形態は、上述の効果を奏する。

なお、本実施の形態では、モデル破壊情報記憶部に、分析モデルについてのモデル破壊情報が新たに追加されたときに、異常要因抽出部が状態系列情報から再生成モデルを生成する例について説明した。これに限らず、異常要因抽出部は、あらかじめ、所定の状態系列情報から再生成モデルの候補を生成しておいてもよい。この場合、多体相関モデル再生成部は、図２１に示した動作において、ステップＳ７０３およびＳ２０３に替えて、再生成モデルの候補から、選定した二次代表データ項目を有する候補を、再生成モデルとして抽出する動作を実行すればよい。また、このように、あらかじめ、所定の状態系列情報から再生成モデルの候補を生成しておく場合、各候補についての標準寄与率も同様にあらかじめ算出しておくことが可能となる。この場合、標準寄与率取得部は、図２０に示した動作において、ステップＳ７１２に替えて、ステップＳ７１１で候補から抽出された再生成モデルについて、算出しておいた標準寄与率を取得する動作を実行すればよい。

また、本実施の形態では、再生成モデルを用いて異常要因の候補を抽出する例について説明した。もし、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、例えば、分析モデルを用いて異常要因の候補を抽出してもよい。

また、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、次のような情報を運用者等に通知してもよい。通知する情報は、例えば、分析モデルのうちモデル破壊が発生した優良多体相関モデルに含まれるデータ項目であってもよい。また、通知する情報は、再生成モデルのうちモデル破壊が発生した再生成優良多体相関モデルに含まれるデータ項目であってもよい。また、通知する情報は、これら双方のデータ項目であってもよい。この際に、本実施の形態は、適切に異常要因を絞り込めなかったことを合わせて通知することが望ましい。

また、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、例えば、異常要因の候補がない旨を、運用者等に通知してもよい。

また、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、新たな二次代表データ項目を選出してもよい。例えば、この場合、本実施の形態は、分析モデルの多体相関モデル群に含まれる回帰式に共通して含ませていないデータ項目のうち、二次代表データ項目によりふさわしいデータ項目を選出してもよい。そして、本実施の形態は、新たな二次代表データ項目を含む新たな再生成モデルを生成し、異常統計値を算出してもよい。さらに、本実施の形態は、このような処理を、異常要因の候補が出るまで繰り返すことにより、その結果得られた異常要因の候補を運用者等に通知してもよい。

また、本実施の形態では、データ項目に異常の影響が表れているとみなす確信度として前述の破壊スコアを算出する例について説明した。この他、本実施の形態は、データ項目に異常の影響が表れているとみなす確信度として、他の定義にしたがう指標を算出してもよい。例えば、そのような確信度は、データ項目を１つまたは２つ含むモデルによって構成される分析モデルのモデル破壊情報から算出されることも可能である。

また、上述した本発明の各実施の形態では、異常要因の候補のみ、または異常要因の候補をそのスコアと共に運用者等に通知する方法を説明した。さらに、本実施の形態では、これらの情報に加えて、二次代表データ項目の破壊スコアを、二次代表データ項目の破壊スコアと分かるように運用者等に通知してもよい。破壊スコアを確認することで、運用者は、二次代表データ項目に求められる条件を満たしているか確認できる。

また、本実施の形態では、本発明の第５の実施の形態に対して、再生成モデルに基づき異常要因の候補を抽出する構成を適用する例について説明した。この他、再生成モデルに基づき異常要因の候補を抽出する本実施の形態の構成は、本発明の第６の実施の形態に対して適用することもできる。この場合、多体相関モデル再生成部は、データ項目グループごとに、二次代表データ項目を選出し、データ項目グループ毎の再生成優良多体相関モデル群を合せて再生成モデルとすればよい。

（第８の実施の形態）
次に、本発明の第８の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第１〜７の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。

本発明の第８の実施の形態としてのシステム分析装置８の機能ブロック構成を図２２に示す。図２２において、システム分析装置８は、本発明の第７の実施の形態としてのシステム分析装置７に対して、異常要因抽出部７５に替えて異常要因抽出部８５を備える点が異なる。異常要因抽出部８５は、異常要因抽出部７５に対して、再予測値算出部７５１に替えて再予測値算出部８５１を備える点が異なる。また、システム分析装置８は、被監視システム９に接続される。なお、被監視システム９の詳細については、本発明の第１の実施の形態における被監視システム９と同様の構成であるため、本実施の形態における説明を省略する。また、図２２において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置８およびその各機能ブロックは、図２を参照して説明した本発明の第１の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置８およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。

異常要因抽出部８５は、異常判定部２９によって被監視システム９の状態が異常と判定されると動作するよう構成される。なお、上述したように、異常判定部２９によってモデル破壊情報のモデル破壊情報記憶部２０４への登録が行われる場合、異常要因抽出部８５は、モデル破壊情報記憶部２０４にモデル破壊情報が新たに追加されると動作するよう構成される。具体的には、異常要因抽出部８５は、同一時刻に対する複数のモデル破壊情報の各々に対して、モデル破壊再検出部７５４と、後述の再予測値算出部８５１と、部分異常度算出部２５２と、異常統計値算出部２５３とを用いて、データ項目別の異常統計値を算出する。

ここで、同一時刻に対する複数のモデル破壊情報とは、被監視システム９の状態情報に基づく異なる構成の複数の多体相関モデル群について、同一時刻において検出されるモデル破壊を表す情報である。例えば、同一時刻に対する複数のモデル破壊情報は、分析モデルについてのモデル破壊情報と、再生成モデルについてのモデル破壊情報とであってもよい。本発明の第７の実施の形態で説明したように、再生成モデルについてのモデル破壊情報は、分析モデルについてのモデル破壊情報のモデル破壊発生時刻に関して生成されたものである。したがって、これらのモデル破壊情報は、同一時刻に対する複数のモデル破壊情報に相当する。

また、異常要因抽出部８５は、各モデル破壊情報に基づき算出されたデータ項目別の異常統計値に基づいて、データ項目別の最終的な異常統計値を算出する。異常要因抽出部８５に含まれる各機能ブロックの構成の詳細については後述する。そして、異常要因抽出部８５は、データ項目別の最終的な異常統計値がより高いものから順に、被監視システム９の異常要因の候補となるデータ項目を抽出する。例えば、異常要因抽出部８５は、最終的な異常統計値が所定の閾値以上のデータ項目を、異常要因の候補となるデータ項目として抽出してもよい。また、例えば、異常要因抽出部８５は、最終的な異常統計値が高いものから順に所定数のデータ項目を、異常要因候補として抽出してもよい。異常要因の候補となるデータ項目を抽出する際の、最終的な異常統計値に関する閾値やデータ項目数は、運用者が任意の数値を設定することができる。

ここで、同一時刻に対する複数のモデル破壊情報から、データ項目別の最終的な異常統計値を算出する処理の具体例について説明する。例えば、異常要因抽出部８５は、全てのモデル破壊情報にわたってその異常統計値が閾値以上となっているデータ項目については、全てのモデル破壊情報におけるそのデータ項目についての異常統計値の統計量を、そのデータ項目の最終的な異常統計値とする。また、異常要因抽出部８５は、少なくとも一部のモデル破壊情報でその異常統計値が閾値以上となっていないデータ項目については、異常統計値がとりうる最小値を、そのデータ項目の最終的な異常統計値とする。このとき、一部のモデル破壊情報から当該データ項目の異常統計値が算出されない場合、異常要因抽出部８５は、そのデータ項目の異常統計値に異常統計値がとりうる最小値を割り当てた後、上述の処理を実行する。なお、最終的な異常統計値を求めるための異常統計値の統計量としては、複数のモデル破壊情報のそれぞれに対するデータ項目別の異常統計値に基づいて、より異常と思われるデータ項目の異常統計値が高くなる統計量であれば、どのような統計量を用いてもよい。例えば、異常統計値の統計量としては、総和、最大値、最小値、平均値、中央値のいずれか一つを用いてもよい。

また、同一時刻に対する複数のモデル破壊情報からデータ項目別の最終的な異常統計値を算出する処理の他の具体例について説明する。この具体例は、同一時刻に対する複数のモデル破壊情報を生成した各モデルが、本発明の第５〜７の実施の形態のように、代表データ項目を含むように生成される場合に用いることが可能である。統一的に説明するため、データ項目が分類され、そのデータ項目グループごとに、代表データ項目が選出されるものとして説明する。データ項目が分類されない場合は、データ項目グループの数が１つの場合に対応する。ここで、データ項目グループごとに、代表データ項目がＮ個選出されたとする（Ｎは整数）。つまり、例えば、多体相関モデル再生成部７５４１が、データ項目グループ毎に、分析モデルの生成に用いられた代表データ項目（一次代表データ項目）以外のデータ項目のうち、二次代表データ項目からＮ次代表データ項目までを選出したとする。そして、多体相関モデル再生成部７５４１が、データ項目グループ毎に、二次代表データ項目からＮ次代表データ項目までをそれぞれ代表データ項目として、Ｎ−１個の再生成優良多体相関モデル群を生成したとする。そして、モデル破壊再検出部７５４が、データ項目グループ毎のＮ−１個の再生成優良多体相関モデル群のそれぞれにおいて、分析モデルでのモデル破壊発生時刻と同一時刻におけるモデル破壊情報を生成したとする。なお、モデル破壊検出部２４は、データ項目グループ毎に一次代表データ項目を代表データ項目として生成された優良多体相関モデル群について、それぞれモデル破壊情報を生成しているとする。これにより、データ項目グループ毎に、同一時刻に対するＮ個のモデル破壊情報が生成される。ここでは、各データ項目グループの一次代表データ項目を代表データ項目として生成された優良多体相関モデル群のモデル破壊情報を、「一次代表データ項目に基づくモデル破壊情報」とも記載する。また、各データ項目グループのｎ次代表データ項目を代表データ項目として生成された再生成優良多体相関モデル群のモデル破壊情報を、「ｎ次代表データ項目に基づくモデル破壊情報」とも記載する。ただし、ｎは、２以上Ｎ以下の整数である。このとき、異常要因抽出部８５は、データ項目別の最終的な異常統計値を、以下のように算出してもよい。例えば、異常要因抽出部８５は、あるデータ項目グループのｎ次代表データ項目に基づくモデル破壊情報におけるｎ次データ項目の異常統計値と、そのデータ項目グループの一次代表データ項目に基づくモデル破壊情報におけるｎ次代表データ項目の異常統計値とを比較する。そして、異常要因抽出部８５は、それらの異常統計値のうち最小値を、そのデータ項目グループのｎ次代表データ項目の最終的な異常統計値とする。この処理の例を、データ項目グループが１つであり、二次代表データ項目までが選出され、一次代表データ項目に基づくモデル破壊情報および二次代表データ項目に基づくモデル破壊情報が生成された場合について、具体的に説明する。この場合、異常要因抽出部８５は、一次代表データ項目に基づくモデル破壊情報における二次代表データ項目の異常統計値と、二次代表データ項目に基づくモデル破壊情報における二次代表データ項目の異常統計値とを比較する。そして、異常要因抽出部８５は、これらの異常統計値のより小さい方を、二次代表データ項目の最終的な異常統計値とする。同様に、異常要因抽出部８５は、各データ項目について、このような処理を用いて最終的な異常統計値を算出してもよい。

次に、異常要因抽出部８５に含まれる再予測値算出部８５１の構成の詳細について説明する。

再予測値算出部８５１は、同一時刻に対する複数のモデル破壊情報のそれぞれに対して、データ項目別の再予測値を算出する。例えば、前述のように、同一時刻に対する複数のモデル破壊情報として、分析モデルについてのモデル破壊情報と、再生成モデルについてのモデル破壊情報とを適用する場合を想定する。この場合、再予測値算出部８５１は、本発明の第２の実施の形態における再予測値算出部２５１と同様に、モデル破壊情報記憶部２０４へ新たに登録された分析モデルのモデル破壊情報について、再予測値を算出する。また、さらに、再予測値算出部８５１は、本発明の第７の実施の形態における再予測値算出部７５１と同様に、分析モデルのモデル破壊情報と同一のモデル破壊発生時刻に対応する再生成モデルのモデル破壊情報について、再予測値を算出する。

以上のように構成されたシステム分析装置８の動作について図面を参照して説明する。なお、システム分析装置８の動作の概略については、図２０を参照して説明した本発明の第７の実施の形態としてのシステム分析装置７の動作の概略と略同様である。ただし、ステップＳ７１３における異常要因抽出動作の詳細が異なる。

本実施の形態における異常要因抽出動作を図２３に示す。

まず、異常要因抽出部８５は、モデル破壊情報記憶部２０４へ新たに登録された分析モデルのモデル破壊情報に基づいて、データ項目別の異常統計値を算出する（ステップＳ８０１）。このステップの詳細は、再予測値算出部８５１と、部分異常度算出部２５２と、異常統計値算出部２５３とによって、図８に示したステップＳ３０１〜Ｓ３０９と略同様に実行される。

次に、異常要因抽出部８５は、モデル破壊情報記憶部２０４へ新たに登録された分析モデルと同一のモデル破壊発生時刻に対応して生成された再生成モデルのモデル破壊情報に基づいて、データ項目別の異常統計値を算出する（ステップＳ８０２）。このステップの詳細は、再予測値算出部８５１と、部分異常度算出部２５２と、異常統計値算出部２５３とによって、再生成モデルに関して、図８に示したステップＳ３０１〜Ｓ３０９と略同様に実行される。

次に、異常要因抽出部８５は、ステップＳ８０１およびＳ８０２でそれぞれ算出されたデータ項目別の異常統計値に基づいて、データ項目別の最終的な異常統計値を算出する（ステップＳ８０３）。

次に、異常要因抽出部８５は、各データ項目の最終的な異常統計値に基づいて、異常要因の候補となるデータ項目を抽出し、通知する（ステップＳ８０４）。例えば、前述のように、異常要因抽出部８５は、最終的な異常統計値が閾値より高いものを抽出し、異常要因候補として通知してもよい。また、例えば、異常要因抽出部８５は、最終的な異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出し通知してもよい。

以上で、異常要因抽出部８５は、異常要因抽出動作を終了する。

なお、本実施の形態では、本発明の第７の実施の形態に対して、複数のモデル破壊情報に基づいて最終的な異常要因の候補を抽出する構成を適用する例について説明した。これに限らず、複数のモデル破壊情報に基づいて最終的な異常要因の候補を抽出する本実施の形態の構成を、本発明の第６の実施の形態に対して適用してもよい。この場合、多体相関モデル再生成部は、データ項目グループごとに、二次代表以降の代表データ項目を選出する。そして、多体相関モデル再生成部は、データ項目グループごとに二次代表以降の代表データ項目ごとに生成される複数の再生成優良多体相関モデル群を合わせて、本実施の形態における再生成モデルとすればよい。ただし、最終的な異常統計値を出す処理によっては、それぞれの再生成優良多体相関モデル群は、いずれのデータ項目を代表データ項目として生成されたものであるかを区別できるようになっている必要がある。

次に、本発明の第８の実施の形態の効果について述べる。

本発明の第８の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、より的確に抽出することができる。

その理由について述べる。本実施の形態では、本発明の第７の実施の形態と略同一の構成に加え、異常要因抽出部が、代表データ項目の異なる優良多体相関モデル群に対する複数のモデル破壊情報から、最終的な異常要因の候補を抽出する。このように、本実施の形態は、同一時刻に対する複数のモデル破壊情報を用いることにより、多面的異常をとらえることができる。また、それだけではなく、本実施の形態では、それら複数のモデル破壊情報が、モデル破壊情報による異常要因の抽出結果の精度が高くなるように構成された優良多体相関モデル群および再生成優良多体相関モデル群から算出されたものである。したがって、本実施の形態において、それら複数のモデル破壊情報を総合して得られた異常要因の抽出結果は、より的確な結果である可能性が高まる。よって本実施の形態は上述の効果を奏する。

なお、本実施の形態では、同一時刻に対する複数のモデル破壊情報として、分析モデルについてのモデル破壊情報と、再生成モデルについてのモデル破壊情報とを用いる例について説明したが、これらに限らない。例えば、同一時刻に対する複数のモデル破壊情報として、これらのモデル破壊情報に加えて、代表データ項目または二次代表データ項目が異なる優良多体相関モデル群についてのモデル破壊情報を加えてもよい。例えば、具体的には、多体相関モデル再生成部は、代表データ項目または二次代表データ項目として選出されていないデータ項目から、既に選出済みの二次代表データ項目よりふさわしいデータ項目を、新たな二次代表データ項目として選出してもよい。そして、多体相関モデル再生成部は、新たな二次代表データ項目を含む新たな再生成モデルを生成してもよい。これにより、モデル破壊再検出部は、新たな再生成モデルについてモデル破壊情報を生成してもよい。このような処理を所定の回数、繰り返すことにより、本実施の形態は、同一時刻に対して、３つ以上のモデル破壊情報を生成可能となる。なお、この処理の繰り返し回数は、運用者が任意に設定してもよい。ただし、新たに選出された二次代表データ項目の破壊スコアが、最初に選出された二次代表データ項目の破壊スコアと等しくなければ、その新たに選出された二次代表データ項目による異常要因の抽出結果の精度が低下する。その観点では、上記処理の繰り返し処理は、新たに選出された二次代表データ項目の破壊スコアと、最初に選出された二次代表データ項目の破壊スコアとが略同一である範囲に限定することが好ましい。また、二次代表データ項目の代表スコアは高いほど、異常要因の抽出結果の精度が高いことが期待できる。そこで、新たに選出された二次代表データ項目の代表スコアと、最初に選出された二次代表データ項目の代表スコアとの差が大きい場合は、新たに選出された二次代表データ項目を用いたモデル破壊情報の生成を中止した方が好ましい。

また、本発明の第２および第３の実施の形態において、標準寄与率が、分析モデルの生成に用いられた所定期間の状態系列情報を用いて算出される場合を中心に説明した。この場合、標準寄与率取得部は、図６において、ステップＳ１０３で分析モデルを生成後、ステップＳ１０４で標準寄与率を算出していた。これに限らず、標準寄与率取得部は、モデル破壊検出後に、モデル破壊が発生した各多体相関モデルについて標準寄与率を算出してもよい。例えば、前述のように、標準寄与率は、モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に対して所定条件を満たす値を持つ期間の状態系列情報を用いて算出可能である。あるいは、前述のように、標準寄与率は、モデル破壊の発生した時点より以前の（例えば直前の）所定期間の状態系列情報を用いて算出可能である。このような場合、各実施の形態における標準寄与率取得部は、図６のステップＳ１０４で標準寄与率を算出する代わり、図８における多体相関モデル毎の繰り返し処理において、ステップＳ３０１の再予測値算出処理の前に、標準寄与率算出処理を行えばよい。

また、本発明の第２から第８の実施の形態において、優良多体相関モデルの回帰式の優良度が、当該モデルの構築に用いられた状態情報から算出される場合を説明した。これに限らず、優良多体相関モデルの回帰式の優良度は、当該モデルの構築に用いられていない状態情報から算出されてもよい。例えば、各実施の形態において、分析モデル取得部またはモデル破壊再検出部は、当該モデルの構築に用いられていない状態情報から、個々の回帰式の優良度Ｆを算出してもよい。他の例として、分析モデル取得部またはモデル破壊再検出部は、当該モデルの構築に用いられていない状態情報から、多体相関モデルのモデル破壊情報を生成し、そのモデル破壊情報から、個々の回帰式の優良度を算出してもよい。モデル破壊情報から個々の回帰式の優良度を求める場合、例えば、１−（当該回帰式がモデル破壊となった頻度）／（モデル破壊情報の生成に用いられた状態情報のインデックス数）を回帰式の優良度とすることが可能である。状態情報のインデックス数の考え方は、優良度Ｆの算出方法を説明した箇所に具体的な説明がある。また、分析モデル取得部またはモデル破壊再検出部は、当該モデルの構築に用いられた状態情報から算出された個々の回帰式の優良度と、当該モデルの構築に用いられていない状態情報から算出された個々の回帰式の優良度とに基づいて、優良多体相関モデルを抽出してもよい。複数の優良度を用いて優良多体相関モデルを抽出する場合の例について説明する。ここでは、２つの優良度を用いることを想定する。１つめの優良度は優良度Ｆであり、２つめの優良度は、１−（当該回帰式がモデル破壊となった頻度）／（モデル破壊情報の生成に用いられた状態情報のインデックス数）であるとする。この場合、分析モデル取得部またはモデル破壊再検出部は、それら２つの優良度が、それぞれの優良度に対してあらかじめ設定された閾値を超えたものを優良多体相関モデルとしてよい。これらの閾値は、運用者によって任意に設定可能である。

また、本発明の第４から第８の実施の形態において、標準寄与率が、分析モデルの生成に用いられた所定期間の状態系列情報を用いて算出される場合を中心に説明した。この場合、標準寄与率取得部は、図６において、ステップＳ１０３で分析モデルを生成後、ステップＳ１０４で標準寄与率を算出していた。これに限らず、標準寄与率取得部は、モデル破壊検出後に、モデル破壊が発生した各多体相関モデルについて標準寄与率を算出してもよい。例えば、前述のように、標準寄与率は、モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に対して所定条件を満たす値を持つ期間の状態系列情報を用いて算出可能である。あるいは、前述のように、標準寄与率は、モデル破壊の発生した時点より以前の（例えば直前の）所定期間の状態系列情報を用いて算出可能である。このような場合、各実施の形態における標準寄与率取得部は、図６のステップＳ１０４で標準寄与率を算出する代わり、図８における多体相関モデル毎の繰り返し処理において、ステップＳ３０１の再予測値算出処理の前に、標準寄与率算出処理を行えばよい。

また、上述した本発明の各実施の形態において、異常要因抽出部は、異常要因の候補となるデータ項目群を示す情報として、データ項目の名称を通知する例を示した。さらに、異常要因抽出部は、異常要因の候補となるデータ項目について異常統計値も通知するようにしてもよい。この場合、本実施の形態は、通知対象の運用者等に対して、より優先的に確認すべきデータ項目を示すことができる。その他、各実施の形態の異常要因抽出部は、異常要因の候補となるデータ項目群を表す情報として、他の情報を出力してもよい。

また、上述した本発明の各実施の形態において、被監視システムが発電プラントである例を示した。これに限らず、被監視システムは、その状態を示す情報から１つ以上の多体相関モデルを生成可能であり、かつ、１つ以上の多体相関モデルのモデル破壊により異常の発生有無を判定可能なシステムであれば、その他のシステムであってもよい。例えば、被監視システムは、ＩＴ（Information Technology）システム、プラントシステム、構造物、輸送機器等であってもよい。この場合でも、各実施の形態のシステム分析装置は、そのような被監視システムの状態を示す情報に含まれるデータの種目をデータ項目として、分析モデルを生成し、モデル破壊の検出および異常要因データ項目の抽出を行うことが可能である。

また、上述した本発明の各実施の形態において、システム分析装置の各機能ブロックが、記憶装置またはＲＯＭに記憶されたコンピュータ・プログラムを実行するＣＰＵによって実現される例を中心に説明した。これに限らず、各機能ブロックの一部、全部、または、それらの組合せが専用のハードウェアにより実現されていてもよい。

また、上述した本発明の各実施の形態において、情報受信装置の機能ブロックは、複数の装置に分散されて実現されてもよい。

また、上述した本発明の各実施の形態において、各フローチャートを参照して説明したシステム分析装置の動作を、本発明のコンピュータ・プログラムとしてコンピュータ装置の記憶装置（記憶媒体）に格納しておいてもよい。そして、係るコンピュータ・プログラムを当該ＣＰＵが読み出して実行するようにしてもよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコードあるいは記憶媒体によって構成される。

また、上述した各実施の形態は、適宜組合せて実施されることが可能である。

以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。

この出願は、２０１４年１２月５日に出願された日本出願特願２０１４−２４６９３６号および２０１５年２月１７日に出願された日本出願特願２０１５−０２８４５０を基礎とする優先権を主張し、その開示の全てをここに取り込む。

１、２、３、４、５、６、７、８システム分析装置
９被監視システム
９０被監視装置
１１、２１、３１、５１、６１分析モデル取得部
１２、２２、７２標準寄与率取得部
１３、２３状態情報収集部
１４、２４モデル破壊検出部
１５、２５、３５、４５、７５、８５異常要因抽出部
２９異常判定部
１５１、２５１、７５１、８５１再予測値算出部
１５２、２５２、４５２部分異常度算出部
１５３、２５３異常統計値算出部
２１１、５１１、６１１多体相関モデル生成部
２１２モデル抽出部
３１３、６１３データ項目分類部
２０１分析モデル記憶部
２０３状態情報記憶部
２０４モデル破壊情報記憶部
９ａ多体相関モデル群
９ｂ優良モデル条件
９ｃ優良多体相関モデル群
１００１ＣＰＵ
１００２メモリ
１００３出力装置
１００４入力装置
１００５ネットワークインタフェース

Claims

被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを１つ以上含む分析モデルを取得する分析モデル取得手段と、
前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得する標準寄与率取得手段と、
前記状態情報を収集する状態情報収集手段と、
収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出するモデル破壊検出手段と、
前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出する再予測値算出手段と、
前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出する部分異常度算出手段と、
前記部分異常度を前記データ項目別に集計して異常統計値を算出する異常統計値算出手段と、
前記再予測値算出手段、前記部分異常度算出手段および前記異常統計値算出手段を用いて、前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する異常要因抽出手段と、
を備えたシステム分析装置。
前記分析モデル取得手段は、
前記状態情報収集手段によって収集される状態情報の時系列に基づいて、前記状態情報を構成するデータ項目から、目的変数として任意の１つのデータ項目と、説明変数として任意の２つ以上のデータ項目とを選出し、選出した目的変数および説明変数の組合せ毎に、３つ以上のデータ項目を含む回帰式を構築するとともに、当該回帰式の予測誤差の許容範囲を算出し、構築した前記回帰式と、該回帰式の予測誤差の許容範囲とを含む前記多体相関モデルを生成する多体相関モデル生成手段と、
前記多体相関モデル生成手段によって生成された多体相関モデル群の中から、所定の優良条件を満たす多体相関モデルである優良多体相関モデルの群を抽出して前記分析モデルを構成するモデル抽出手段と、
を含むことを特徴とする請求項１に記載のシステム分析装置。
前記モデル破壊の検出結果に基づき前記被監視システムが異常であるか否かを判定する異常判定手段をさらに備え、
前記異常要因抽出手段は、前記異常判定手段により前記被監視システムが異常であると判定された場合に、前記異常要因の候補となるデータ項目を抽出して出力することを特徴とする請求項１または請求項２に記載のシステム分析装置。
前記部分異常度算出手段は、前記多体相関モデルの前記再予測値が全てモデル破壊となった場合（第１のモデル破壊発生状況）と、前記多体相関モデルの前記再予測値の少なくとも１つがモデル破壊とならず少なくとも１つがモデル破壊となった場合（第２のモデル破壊発生状況）とで、該多体相関モデルに含まれる各データ項目に対する前記部分異常度の割り当て方を変更することを特徴とする請求項１から請求項３のいずれか１項に記載のシステム分析装置。
前記部分異常度算出手段は、前記第１のモデル破壊発生状況となった多体相関モデルでは、目的変数のデータ項目の部分異常度が、説明変数のデータ項目の部分異常度より高くなるよう各部分異常度の数値を割り当て、前記第２のモデル破壊発生状況となった多体相関モデルでは、前記再予測値がモデル破壊となった説明変数のデータ項目の部分異常度が、目的変数のデータ項目および前記再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度より高くなるよう、各部分異常度の数値を割り当てることを特徴とする請求項４に記載のシステム分析装置。
前記部分異常度算出手段は、前記第１のモデル破壊発生状況となった多体相関モデルでは、目的変数のデータ項目の部分異常度が、説明変数のデータ項目の部分異常度より高くなるよう各部分異常度の数値を割り当て、前記第２のモデル破壊発生状況となった多体相関モデルでは、前記再予測値がモデル破壊となった説明変数のデータ項目の部分異常度が、目的変数のデータ項目および前記再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度以上、前記第１のモデル破壊発生状況で目的変数のデータ項目に割り当てられる部分異常度未満になるよう、各部分異常度の数値を割り当てることを特徴とする請求項４に記載のシステム分析装置。
前記部分異常度算出手段は、前記各データ項目の部分異常度として、定められた２値のいずれかを割り当てることを特徴とする請求項１から請求項６のいずれか１項に記載のシステム分析装置。
前記分析モデル取得手段は、前記データ項目から代表データ項目を選出し、前記代表データ項目と、該代表データ項目を除く２つ以上のデータ項目とからなる１つ以上の多体相関モデルを、前記分析モデルとして生成することを特徴とする請求項１から請求項７のいずれか１項に記載のシステム分析装置。
前記データ項目を分類して、１つ以上のデータ項目グループを生成するデータ項目分類手段をさらに備え、
前記分析モデル取得手段は、前記データ項目グループごとに、前記代表データ項目を選出し、選出した代表データ項目と、該データ項目グループのうち該代表データ項目を除く２つ以上のデータ項目とからなる優良多体相関モデルを生成し、データ項目グループ毎に生成した優良多体相関モデルを合せて、前記分析モデルとすることを特徴とする請求項８に記載のシステム分析装置。
前記代表データ項目を除いたデータ項目から二次代表データ項目を選出し、前記二次代表データ項目と、前記二次代表データ項目を除く２つ以上のデータ項目とからなる再生成多体相関モデルを１つ以上含む再生成モデルを生成する多体相関モデル再生成手段と、
前記モデル破壊の発生時刻と同一時刻において、前記再生成モデルにモデル破壊が発生したか否かを検出するモデル破壊再検出手段と、
をさらに備え、
前記再予測値算出手段は、モデル破壊が発生した前記各再生成多体相関モデルについて、該再生成多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出し、
前記部分異常度算出手段は、算出した各再予測値によるモデル破壊の発生の有無に基づいて、前記再生成多体相関モデルごとの前記データ項目別の部分異常度を算出することを特徴とする請求項８に記載のシステム分析装置。
前記データ項目を分類して、１つ以上のデータ項目グループを生成するデータ項目分類手段をさらに備え、
前記多体相関モデル再生成手段は、前記データ項目グループごとに、該データ項目グループに対応する前記代表データ項目を除いたデータ項目から前記二次代表データ項目を選出し、選出した二次代表データ項目と、該データ項目グループのうち前記二次代表データ項目を除く２つ以上のデータ項目とからなる再生成多体相関モデルを１つ以上含む再生成多体相関モデル群を生成し、データ項目グループ毎に生成した再生成多体相関モデル群を合せて、前記再生成モデルとすることを特徴とする請求項１０に記載のシステム分析装置。
前記異常要因抽出手段は、前記状態情報に基づく異なる構成の複数の多体相関モデル群について、それぞれ同一時刻におけるモデル破壊の情報に基づいてデータ項目別の前記異常統計値を算出し、複数の前記多体相関モデル群についてのデータ項目別の前記異常統計値を用いて、データ項目別の最終的な異常統計値を算出し、最終的な異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力することを特徴とする請求項１から請求項１１のいずれか１項に記載のシステム分析装置。
前記分析モデル取得手段は、前記データ項目を分類して１つ以上のデータ項目グループを生成し、
前記異常要因抽出手段は、前記データ項目グループごとに、前記異常要因の候補となるデータ項目を抽出することを特徴とする請求項１から請求項１２のいずれか１項に記載のシステム分析装置。
前記データ項目分類手段は、前記分析モデルを構成する少なくとも１つの多体相関モデルの回帰式に目的変数または説明変数として含まれるデータ項目が同一のグループとなるように、前記データ項目グループを生成することを特徴とする請求項１３に記載のシステム分析装置。
前記分析モデル取得手段は、前記分析モデルとして、前記各多体相関モデルの回帰式に説明変数として２つのデータ項目が含まれる分析モデルを取得することを特徴とする請求項１から請求項１４のいずれか１項に記載のシステム分析装置。
前記標準寄与率取得手段は、前記各多体相関モデルの回帰式の説明変数に含まれる各データ項目について、該データ項目に関する成分を、定数項を除く全成分で除算することにより、前記標準寄与率を算出することを特徴とする請求項１から請求項１５のいずれか１項に記載のシステム分析装置。
前記標準寄与率取得手段は、前記状態情報の時系列を用いて、目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合の統計量を、前記標準寄与率として算出することを特徴とする請求項１から請求項１６のいずれか１項に記載のシステム分析装置。
前記標準寄与率取得手段は、前記分析モデルの生成に用いられた状態情報の時系列を用いて、前記標準寄与率を算出することを特徴とする請求項１７に記載のシステム分析装置。
前記標準寄与率取得手段は、前記モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に対して所定条件を満たす値を持つ期間の状態情報の時系列を用いて、前記標準寄与率を算出することを特徴とする請求項１７に記載のシステム分析装置。
前記標準寄与率取得手段は、前記モデル破壊を発生させた状態情報の計測時刻より以前の所定期間に含まれる状態情報の時系列を用いて、前記標準寄与率を算出することを特徴とする請求項１７に記載のシステム分析装置。
コンピュータ装置が、
被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを１つ以上含む分析モデルを取得し、
前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得し、
前記状態情報を収集し、
収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出し、
前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出し、
前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出し、
前記部分異常度を前記データ項目別に集計して異常統計値を算出し、
前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力するシステム分析方法。
被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを１つ以上含む分析モデルを取得する分析モデル取得ステップと、
前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得する標準寄与率取得ステップと、
前記状態情報を収集する状態情報収集ステップと、
収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出するモデル破壊検出ステップと、
前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出する再予測値算出ステップと、
前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出する部分異常度算出ステップと、
前記部分異常度を前記データ項目別に集計して異常統計値を算出する異常統計値算出ステップと、
前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する異常要因抽出ステップと、
をコンピュータ装置に実行させるシステム分析プログラムを記憶した記憶媒体。