WO2017126585A1

WO2017126585A1 - 情報処理装置、情報処理方法、及び、記録媒体

Info

Publication number: WO2017126585A1
Application number: PCT/JP2017/001671
Authority: WO
Inventors: 昌尚棗田
Original assignee: 日本電気株式会社
Priority date: 2016-01-21
Filing date: 2017-01-19
Publication date: 2017-07-27
Also published as: JP6164311B1; JP2017130100A; US20190026632A1

Abstract

モデルの数が多い場合であっても、誤報や検知漏れの少ないモデルを生成する。　システム分析装置１は、特徴取得部１２１１、及び、選択部１２２１を含む。特徴取得部１２１１は、第１のデータ項目の特徴を取得する。選択部１２２１は、特徴に基づいて、第１のデータ項目と第２のデータ項目との関係を学習するためのモデルを選択する。

Description

情報処理装置、情報処理方法、及び、記録媒体

　本発明は、情報処理装置、情報処理方法、及び、記録媒体に関し、特にシステムの分析を行う情報処理装置、情報処理方法、及び、記録媒体に関する。

　システムの構成要素から得られるセンサデータに基づいて、システムの状態を分析する処理を実行するシステム分析装置が利用されている。このような分析処理は、システムを安全かつ効率的に運用する目的で行われる。分析処理のひとつに、センサデータを多変量解析することにより、システムの異常を検知する処理がある。この分析処理では、システムの異常を検知した場合に、異常の発生が、運用者やシステムに通知される。このような分析処理により、異常を早期に検知し、対策の初動を早めることで、異常に伴う被害を最小化することが可能となる。

　センサデータの多変量解析では、センサデータの推定値が算出され、その推定値と対応する計測値との差である推定誤差に基づいて、システムの異常が検知される。センサデータの推定値を得るためには、センサ間の関係性を近似した数理モデル（以下、モデルとも記載）が用いられる場合がある。現実のシステムから得られるセンサデータには、ある時刻の値が過去値の影響を受けるようなセンサデータがある。そのようなセンサデータに係るセンサ間の関係性は、近似するモデルに自己回帰過程を含めることで、精度よく近似できる。

　このように、自己回帰過程を含むモデルを用いて異常検知する技術が、例えば、特許文献１に記載されている。特許文献１に記載の技術は、自己回帰過程を含むモデルのパラメータを最小二乗法で求め、そのモデルを用いて異常を検知する。

　また、自己回帰過程を含むモデルで近似するときに、先験的情報を利用することで、モデルのパラメータを高精度に推定する技術が、例えば、特許文献２に記載されている。

　特許文献２に記載の技術では、入出力関係が自明なセンサ間の関係性毎に先験的情報が準備され、当該先験的情報をモデルのパラメータに対する制約条件として用いて、モデルのパラメータが推定される。

　システムにおいて、異常が発生する箇所は事前に知ることができない。このため、異常の早期検知には、センサ間の関係性をできる限り多く監視することが有効である。入出力関係が自明なセンサ間の関係性だけではなく、非自明なセンサ間の関係性も含めて、関係性を網羅的に監視して異常を検知する技術が、例えば、特許文献３に記載されている。

　特許文献３に記載の技術では、複数のセンサの内の任意の２つのセンサの組合せの各々についてモデルが生成され、モデル毎に異常検知が行われる。

特許第４５２０８１９号公報特開２００８－２８７３４３号公報特許第４８７２９４４号公報

　上述の特許文献１に記載の技術のような自己回帰過程を含むモデルを、特許文献３に記載の技術のようにセンサの組合せ毎に生成することで、システムにおける様々な箇所で発生する異常を早期に検知できる。

　しかしながら、特許文献１に記載された技術は、モデルのパラメータを最小二乗法で求めている。自己回帰過程を含むモデルを最小二乗法により求める場合、モデルのパラメータが過度に学習データに適合することがある。その結果、自己回帰過程を含むモデルを異常検知に用いた場合、誤報や検知漏れを引き起こす可能性がある。

　また、特許文献２に記載された技術は、入出力に係る先験的情報を用いることで、モデルのパラメータが過度に学習データに適合するという不具合を解決している。しかしながら、特許文献２に記載された技術は、適用対象が、入出力関係が自明なセンサ間のモデルに限られるため、センサ間の関係性を汎用的にモデル化する場合に適用できない。また、先験的情報は、理論的、または、経験的な知見や、実験から求められる。このため、モデルの数が多い場合には、必ずしも全てのモデルに対して先験的情報を準備できない、または、先験的情報の準備に多大なコストがかかるという課題がある。

　本発明の目的は、上述の課題を解決し、モデルの数が多い場合であっても、誤報や検知漏れの少ないモデルを生成できる、情報処理装置、情報処理方法、及び、記録媒体を提供することである。

　本発明の一態様における情報処理装置は、第１のデータ項目の特徴を取得する特徴取得手段と、前記特徴に基づいて、前記第１のデータ項目と第２のデータ項目との関係を学習するためのモデルを選択する選択手段と、を備える。

　本発明の一態様における情報処理方法は、第１のデータ項目の特徴を取得し、前記特徴に基づいて、前記第１のデータ項目と第２のデータ項目との関係を学習するためのモデルを選択する。

　本発明の一態様におけるコンピュータが読み取り可能な記録媒体は、コンピュータに、第１のデータ項目の特徴を取得し、前記特徴に基づいて、前記第１のデータ項目と第２のデータ項目との関係を学習するためのモデルを選択する、処理を実行させるプログラムを格納する。

　本発明の効果は、モデルの数が多い場合であっても、誤報や検知漏れの少ないモデルを生成できることである。

本発明の第１の実施の形態の特徴的な構成を示すブロック図である。本発明の第１の実施の形態における、システム分析装置１の構成を示すブロック図である。本発明の第１の実施の形態における、システム分析装置１のハードウェア構成の例を示すブロック図である。本発明の第１の実施の形態における、システム分析装置１の全体的な動作を示すフローチャートである。本発明の第１の実施の形態における、システム分析装置１の分析モデル生成処理（ステップＳ３）の詳細を示すフローチャートである。本発明の第１の実施の形態における、分析モデルの生成例を示す図である。本発明の第２の実施の形態における、システム分析装置１の構成を示すブロック図である。本発明の第２の実施の形態における、システム分析装置１の分析モデル生成処理（ステップＳ３）の詳細を示すフローチャートである。本発明の第３の実施の形態における、システム分析装置１の構成を示すブロック図である。本発明の第３の実施の形態における、システム分析装置１の分析モデル生成処理（ステップＳ３）の詳細を示すフローチャートである。

　本発明の実施の形態について、図面を参照して詳細に説明する。なお、各図面、及び、明細書記載の各実施形態において、同様の構成要素には同様の符号を付与し、適宜、説明を省略する。

　（第１の実施の形態）
　本発明の第１の実施の形態について説明する。

　本発明の第１の実施の形態の構成について説明する。図２は、本発明の第１の実施の形態における、システム分析装置１の構成を示すブロック図である。図２を参照すると、システム分析装置１は、状態情報収集部１１、分析モデル生成部１２、破壊検出部１３、状態情報記憶部１４、及び、分析モデル記憶部１５を含む。システム分析装置１は、被監視システム８に接続される。システム分析装置１は、本発明の情報処理装置の一実施形態である。

　システム分析装置１は、被監視システム８の状態を分析することにより、被監視システム８の異常を検知し、検知結果を出力する。

　被監視システム８は、システム分析装置１によって監視されるシステムである。被監視システム８は、例えば、ＩＣＴ（Information and Communication Technology）システム、化学プラント、発電所、動力設備等、相互に影響を及ぼしあう要素から構成される、まとまりや仕組みである。被監視システム８は、要素として、１つ以上の被監視装置８１を含む。例えば、被監視システム８が発電プラントシステムの場合、被監視装置８１は、タービン、給水加熱器、復水器等である。また、被監視装置８１には、例えば、配管や信号線等、装置間を接続する要素が含まれていてもよい。被監視システム８は、発電プラントシステムのようにシステム全体であってもよいし、あるシステムにおける一部の機能を実現する部分であってもよい。

　被監視装置８１の各々は、自装置に設けられたセンサから得られる値であるセンサ値を所定タイミング毎に計測し、システム分析装置１に送信する。以下、通常の計測機器のようにハードウェアとしての実態があるセンサだけではなく、ソフトセンサや、制御信号等もセンサと呼ぶ。センサ値は、例えば、弁の開度、液面高さ、温度、流量、圧力、電流、電圧等、設備に設置された計測機器によって計測される計測値である。また、センサ値は、当該計測値から算出される推定値でもよい。また、センサ値は、システムを所望の稼働状態に変更するために情報処理装置より生成、送出される、制御信号の値でもよい。また、センサ値は、オペレーティングシステムから取得されるＣＰＵ（Central Processing Unit）使用率、メモリ使用率、ネットワーク送受信量などの値でもよい。以下、各センサ値は、整数や小数等の数値で表される。

　また、本発明の実施の形態では、各被監視装置８１に設けられたセンサ毎に、１つのデータ項目を割り当てる。また、各被監視装置８１から同一と見なされるタイミングで収集された、複数のデータ項目のセンサ値の集合を、状態情報と呼ぶ。ここで、「同一と見なされるタイミングで収集される」とは、各被監視装置８１で、同一時刻、または、所定範囲内の時刻に計測されることでもよい。また、「同一と見なされるタイミングで収集される」とは、システム分析装置１の一連の収集処理によって収集されることでもよい。なお、被監視装置８１とシステム分析装置１との間に、被監視装置８１が取得したセンサ値を記憶する記憶装置（図示せず）が設けられてもよい。そのような記憶装置とは、例えば、データサーバ、ＤＣＳ（Distributed Control System）、または、プロセスコンピュータ等でもよい。この場合、被監視装置８１は、任意のタイミングでセンサ値を取得し、記憶装置に記憶させる。そして、システム分析装置１が、記憶装置に記憶されているセンサ値を、所定のタイミングに読み出してもよい。また、センサ値に欠落がある場合や、センサ値の収集タイミングがずれている場合、センサ値が収集されたタイミングが同一とみなせるように、任意の方法で、センサ値を補完してもよい。

　図３は、本発明の第１の実施の形態における、システム分析装置１のハードウェア構成の例を示すブロック図である。システム分析装置１は、図３に示すようなハードウェア要素を含むコンピュータ装置によって構成されてもよい。図３において、システム分析装置１は、ＣＰＵ１０１、メモリ１０２、出力装置１０３、入力装置１０４、及び、ネットワークインタフェース１０５を含む。メモリ１０２は、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、補助記憶装置（ハードディスク等）等によって構成される。出力装置１０３は、ディスプレイ装置やプリンタ等のように、情報を出力する装置によって構成される。入力装置１０４は、キーボードやマウス等のように、ユーザ操作の入力を受け付ける装置によって構成される。ネットワークインタフェース１０５は、ネットワークに接続するインタフェースである。この場合、システム分析装置１の各機能ブロックは、メモリ１０２に格納されるコンピュータプログラムを読み込んで実行するとともに、出力装置１０３、入力装置１０４、ネットワークインタフェース１０５を制御する、ＣＰＵ１０１によって構成される。なお、システム分析装置１、及び、システム分析装置１の各機能ブロックのハードウェア構成は、上述の構成に限定されない。

　次に、システム分析装置１の各機能ブロックの詳細について説明する。

　状態情報収集部１１は、被監視システム８の状態情報を所定タイミングで収集し、状態情報記憶部１４に保存する。以下、状態情報の時系列データを、状態系列情報とも記載する。

　状態情報記憶部１４は、状態情報収集部１１が収集した状態情報を、状態系列情報として記憶する。状態情報記憶部１４は、例えば、収集時間を示す情報と状態情報とを対応づけて記憶してもよい。状態情報記憶部１４は、少なくとも所定期間分の状態系列情報を記憶するための記憶領域を有する。

　分析モデル生成部１２は、被監視システム８の分析モデルを生成する。分析モデルは、１つ以上の相関モデルの集合（相関モデル群）である。相関モデル（以下、単にモデルとも記載）は、被監視システム８の状態情報を構成する複数のデータ項目の内の任意の２つ以上のデータ項目について、当該データ項目間の関係を定義した回帰式と、当該回帰式によるセンサ値の推定誤差の許容範囲と、を含む。分析モデルに含まれる各相関モデルのデータ項目の数は、異なっていてもよい。分析モデル生成部１２は、生成した分析モデルを、分析モデル記憶部１５に保存する。

　ここで、分析モデル生成部１２によって分析モデルの生成に用いられる状態系列情報の所定期間として、例えば、被監視システム８において障害が発生していない任意の期間が、運用者等によって設定される。当該所定期間は、異常検知の感度を高めるという観点からは、被監視システム８の経年的な変化による影響を受けないような、できるだけ短い期間であることが好ましい。例えば、被監視システム８のメンテナンスサイクルが１年の場合、当該所定期間として、それより十分短い、１か月、１週間、１日等の期間が用いられる。また、状態系列情報に有意な変化を含ませるために、当該所定期間として、通常起こりうるシステムの状態変化の要因の中で、最も多くのセンサ値に大きな変化をもたらす要因が影響するような期間が用いられてもよい。一方、当該所定期間は、被監視システム８の状態変化による誤検知を減らすという観点からは、主要な内的、または、外的要因によるセンサ値の変化を網羅的に含むような、できるだけ長い期間であることが好ましい。例えば、被監視システム８が季節の影響を強く受ける場合は、当該所定期間として、９か月、１年等の期間が用いられる。また、分析モデルの生成に用いられる状態系列情報は、連続している１つの期間に限らず、複数の期間から抽出されてもよい。

　分析モデル生成部１２は、自己回帰情報取得部１２１、及び、モデル生成部１２２を含む。

　自己回帰情報取得部１２１は、各データ項目について、自己回帰情報を取得する。自己回帰情報は、各データ項目を相関モデルにおける目的変数として用いる場合に、相関モデルに自己回帰過程を含めてもよいかどうかを示す。

　自己回帰情報取得部１２１は、特徴取得部１２１１、及び、自己回帰情報生成部１２１２を含む。

　特徴取得部１２１１は、各データ項目の自己回帰情報を生成するために必要な情報として、各データ項目の特徴を表す特徴情報を取得する。ここで、特徴取得部１２１１は、各データ項目の特徴として、例えば、データ項目の自己回帰過程への適合度（以下、第１の適合度とも記載）を算出する。自己回帰過程への適合度は、各データ項目の時系列データが、自己回帰過程を含む程度を表していれば、どのような指標でもよい。例えば、自己回帰過程への適合度として、後述する数１式のような自己回帰モデル（自己回帰式）への適合度が用いられてもよい。また、自己回帰過程への適合度として、遅れ時間０から所定の遅れ時間までの自己相関関数の絶対値の平均値や、後述する数１式のような自己回帰モデルにおけるパラメータａ_ｉの総和が用いられてもよい。

　特徴取得部１２１１は、特徴情報（データ項目の自己回帰過程への適合度）の取得に用いる状態系列情報の期間として、障害を含まない任意の期間を用いてもよい。ここで、分析モデルによる分析結果との整合性を高くするという観点からは、特徴取得部１２１１は、分析モデルの生成に用いられる所定期間の状態系列情報を、自己回帰情報の生成にも用いることが好ましい。

　以下、データ項目の自己回帰過程への適合度として、自己回帰モデルへの適合度を用いる場合について説明する。

　特徴取得部１２１１は、所定期間の状態系列情報について、例えば、数１式のような、１つのデータ項目を用いて構成される自己回帰モデル（自己回帰式）を生成する。

　数１式において、ｔは、状態情報のインデックスを表す。状態情報のインデックスｔには、状態情報を古い順に並べたときに、古い方から新しい方に向かって値が増えるような、連番の整数が付与される。ｕ（ｔ）は、状態情報のインデックスがｔのときの、データ項目ｕのセンサ値を表す。また、ｕ’（ｔ）は、自己回帰モデルの目的変数に相当し、状態情報のインデックスがｔのときのデータ項目ｕのセンサ値の推定値である。また、ｕ（ｔ－ｉ）は、当該回帰式の説明変数に相当し、状態情報のインデックスがｔ－ｉのときのデータ項目ｕのセンサ値を表す。ｆ（ｕ）は、当該回帰式が１つのデータ項目（ｕ）を説明変数に用いた関数であることを表す。Ｎは、任意の整数である。なお、数１式は、自己回帰モデルの一例であって、自己回帰モデルは、この形式に限定されない。例えば、自己回帰モデルとして、数１式から定数項ｃを除外した式を用いてもよいし、ｔ－ｉをｔ－ｉ－ｋとした式を用いてもよい。ここでｋは任意の整数である。例えば、ｋはあらかじめ定めた定数であってもよい。また、ｋは、あらかじめ定めた複数の値を対象に、後述の自己回帰過程への適合度が最大となるように決定されてもよい。

　特徴取得部１２１１は、数１式のパラメータである、ａ_ｉ、ｃ、及び、Ｎを、目的変数として用いるデータ項目ｕの、当該自己回帰式への適合度が最大となるように決定する。ここで、特徴取得部１２１１は、例えば、以下の数２式に示されるような、回帰式の推定精度を用いて、適合度Ｆ_１を算出する。

　数２式において、バー付きのｕは、状態系列情報に含まれる所定期間中における、目的変数の平均値を表す。なお、所定期間とは、数１式のパラメータを決定するための学習期間であり、状態情報のインデックスｔがＮ０～Ｎ１（Ｎ０≦ｔ≦Ｎ１）の期間である。ここで、Ｎ０、Ｎ１は、それぞれ、当該回帰式の構築に用いられる状態情報の最も古い時刻、最も新しい時刻のインデックスを表す。

　適合度には、推定精度の高さと、汎化誤差の低さとの２つの観点がある。数２式は、推定精度の高さの観点から定めた適合度の例である。一方、汎化誤差の低さの観点から適合度を定めることも可能である。汎化誤差の低さの観点から適合度を定める場合、例えば、適合度Ｆ_１は、情報量基準を用いて算出できる。なお、適合度Ｆ_１は、これらの観点による手法を組合せることにより算出されてもよい。

　適合度Ｆ_１が最大となるパラメータは、例えば、Ｎの各値に対して適合度Ｆ_１が最大となるようにａ_ｉ、ｃを決定し、その後、適合度Ｆ_１が最大となるＮのパラメータａ_ｉ、ｃを選択することで決定できる。パラメータａ_ｉ、ｃを決定する方法として、最小二乗法、部分最小二乗法（Partial Least Square:ＰＬＳ）等、一般的なパラメータ決定方法を用いることができる。ここで、Ｎの最大値は、運用者等によって任意に設定可能である。

　自己回帰情報生成部１２１２は、例えば、特徴取得部１２１１により取得された特徴（適合度Ｆ_１）が所定の条件を満たすかどうかを判定することで、自己回帰情報を生成する。ここで、自己回帰情報生成部１２１２は、自己回帰情報を生成する所定の条件として、以下の数３式を用いる。

　ここで、Ｆ_ｔｈ１は、適合度Ｆ_１に対する閾値（以下、第１の閾値とも記載）である。Ｆ_ｔｈ１の値には、運用者等により、任意の値が設定される。

　自己回帰情報生成部１２１２は、適合度Ｆ_１が閾値Ｆ_ｔｈ１以上であれば、当該データ項目を目的変数として用いる相関モデルに、自己回帰過程を含めない（自己回帰過程不可）と判定する。この場合、自己回帰情報生成部１２１２は、例えば、自己回帰情報に１を設定する。一方、自己回帰情報生成部１２１２は、適合度Ｆ_１が閾値Ｆ_ｔｈ１未満であれば、当該データ項目を目的変数として用いる相関モデルに、自己回帰過程を含めてもよい（自己回帰過程可）と判定する。この場合、自己回帰情報生成部１２１２は、例えば、自己回帰情報に０を設定する。自己回帰情報生成部１２１２は、判定結果を、自己回帰情報に設定する。なお、「適合度Ｆ_１が閾値Ｆ_ｔｈ１以上」という条件が、「第１の適合度に対する所定の適合条件」である。

　このようにして、自己回帰情報取得部１２１は、データ項目毎に、自己回帰情報を生成する。

　なお、自己回帰情報取得部１２１は、自己回帰情報を生成する代わりに、記憶部（図示せず）に予め記憶された各データ項目の自己回帰情報を取得してもよい。また、自己回帰情報取得部１２１は、入力装置１０４、ネットワークインタフェース１０５、または、可搬型記録媒体等を介して、外部から入力される自己回帰情報を取得してもよい。

　モデル生成部１２２は、状態情報記憶部１４に記憶されている状態系列情報と自己回帰情報とに基づいて、各相関モデルを生成する。

　モデル生成部１２２は、選択部１２２１、及び、学習部１２２２を含む。

　選択部１２２１は、相関モデルの回帰式の目的変数として用いるデータ項目に対する自己回帰情報に基づいて、学習部１２２２により学習する相関モデルの形式を選択する。ここで、生成の元として用いる相関モデル（ベースの相関モデル）の形式が自己回帰過程を含む場合、選択部１２２１は、ベースの相関モデルと当該相関モデルから自己回帰過程を除いた相関モデルとから、相関モデルの形式を選択する。ここで、選択部１２２１は、自己回帰情報が、「自己回帰過程可」を示していれば、自己回帰過程が含まれる相関モデルを選択する。一方、選択部１２２１は、自己回帰情報が、「自己回帰過程不可」を示していれば、自己回帰過程を含まない相関モデルを選択する。また、ベースの相関モデルが自己回帰過程を含まない場合、選択部１２２１は、自己回帰情報によらず、ベースの相関モデルを選択する。

　なお、ベースの相関モデルの形式（説明変数や目的変数として用いるデータ項目、説明変数に係る過去値の項の数や次数、定数項の有無等）は、運用者等により、予め与えられてもよい。また、ベースの相関モデルの形式は、モデル生成部１２２等が、特許文献３のように、予め定義されたルールに従って、決定してもよい。

　例えば、ベースの相関モデルとして、数４式のような、２つのデータ項目で構成される回帰式が用いられる。

　数４式において、ｕ’’（ｔ）は、相関モデルの目的変数に相当し、状態情報のインデックスがｔのときのデータ項目ｕの予測値である。また、ｕ（ｔ－ｊ）は、状態情報のインデックスがｔ－ｊのときの、データ項目ｕの値を表す。ｕ（ｔ－ｊ）^ｉ、ｘ（ｔ）^ｌは、当該回帰式の説明変数に相当する。ｕ（ｔ－ｊ）^ｉは、状態情報のインデックスがｔ－ｊのときのデータ項目ｕのセンサ値をｉ乗した値を表す。ｘ（ｔ）^ｌは、状態情報のインデックスがｔのときのデータ項目ｘのセンサ値をｌ乗した値を表す。また、ｆ（ｕ、ｘ）は、当該回帰式が２つのデータ項目（ｕ、ｘ）を説明変数に用いた関数であることを表す。Ｎ、Ｋ、及び、Ｍは、任意の整数である。

　ここで、データ項目ｕの自己回帰情報が、「自己回帰過程不可」を示していれば、選択部１２２１は、数４式における右辺第１項の自己回帰過程を除外した式を相関モデルの回帰式として選択する。一方、データ項目ｕの自己回帰情報が、「自己回帰過程可」を示していれば、選択部１２２１は、数４式を相関モデルの回帰式として選択する。

　学習部１２２２は、選択部１２２１により選択された相関モデルの回帰式で、データ項目間の関係を学習する。ここで、学習部１２２２は、例えば、数１式に対するパラメータの決定方法と同様の方法により、数４式のパラメータａ_ｉｊ、ｂ_ｌ、及び、ｄを決定する。

　学習部１２２２は、さらに、学習した相関モデルの回帰式の推定誤差の許容範囲を決定する。ここで、学習部１２２２は、例えば、数５式、及び、数６式の両方が満たされる範囲を、許容範囲に決定する。

　ここで、Ｔ_１は、推定誤差に対する上限閾値である。また、Ｔ_２は、推定誤差に対する下限閾値である。また、ｒ_ｔは、状態情報のインデックスｔに対して、相関モデルの回帰式を用いて算出される目的変数の予測値の推定誤差である。

　学習部１２２２は、数５式、及び、数６式における上限閾値Ｔ１、及び、下限閾値Ｔ２を、例えば、数７式、及び、数８式を用いて決定する。

　ここで、ｍａｘ｛｝は、入力された数値の中から最大値を出力する関数である。また、｜ｘ｜は、ｘの絶対値を抽出する演算子である。また、Ｒ_ｔ（ｔ＝Ｎ０～Ｎ１）は、状態情報のインデックスｔに対して、相関モデルの学習に用いた状態系列情報から算出される、目的変数の予測値の推定誤差である。Ｎ０は、相関モデルの学習に用いた状態情報の内、最も古い時刻の状態情報のインデックスを表す。Ｎ１は、相関モデルの学習に用いた状態情報の内、最も新しい時刻の状態情報のインデックスを表す。

　つまり、数７式では、許容範囲の上限閾値Ｔ_１として、状態系列情報の相関モデルの学習に用いられた期間にわたって算出される推定誤差（以下、算出期間中の推定誤差と呼ぶ）の絶対値の最大値が用いられている。また、数８式では、許容範囲の下限閾値Ｔ_２として、当該算出期間中の推定誤差の絶対値の最大値に－１を乗じた値が用いられている。

　なお、学習部１２２２は、数７式、及び、数８式に限らず、上述の算出期間中の推定誤差Ｒ_Ｎ０～Ｒ_Ｎ１の平均値と標準偏差とを用いて、上限閾値Ｔ_１、及び、下限閾値Ｔ_２を決定してもよい。例えば、学習部１２２２は、推定誤差の平均値に標準偏差の３倍を加算した値を、上限閾値Ｔ_１として用いてもよい。また、学習部１２２２は、推定誤差の平均値から標準偏差の３倍を減じた値を下限閾値Ｔ_２として用いてもよい。

　このようにして、モデル生成部１２２は、各回帰式、及び、その推定誤差の許容範囲を含む相関モデル群を、分析モデルとして生成する。

　分析モデル記憶部１５は、分析モデル情報を記憶する。分析モデル情報は、分析モデル生成部１２によって生成された分析モデルを表す。分析モデル情報は、例えば、分析モデルに含まれる各相関モデルについてのモデル情報の集合である。モデル情報は、例えば、相関モデルの識別子、当該相関モデルの回帰式の情報、及び、当該回帰式の予測誤差の許容範囲を示す情報を含む。回帰式の情報は、例えば、目的変数に用いられるデータ項目、説明変数に用いられるデータ項目、及び、データ項目間の関係式を表す。なお、モデル情報は、さらに、相関モデルの回帰式の良さを表す指標（相関モデルの適合度）を含んでいてもよい。

　破壊検出部１３（以下、単に検出部とも記載）は、新たな状態情報が収集されると、分析モデルに含まれる各相関モデルについて、モデル破壊の発生の有無を検出する。モデル破壊とは、相関モデルの回帰式によるセンサ値の推定誤差が、許容範囲を超える現象である。

　本発明の実施の形態では、モデル破壊の発生は、目的変数であるデータ項目のセンサ値の変化に、通常の変化とは無関係な変化が含まれていることを示す指標として用いられる。通常の変化とは、システムにおいて、通常起こりうる状態変化に伴うセンサ値の変化である。

　破壊検出部１３は、例えば、状態情報記憶部１４に記憶されている新たな状態情報を含む状態系列情報と分析モデルとを用いて、分析モデルに含まれる各相関モデルについてモデル破壊の発生の有無を検出する。具体的には、破壊検出部１３は、相関モデルの回帰式の目的変数について、新たな時刻における推定値を算出する。破壊検出部１３は、算出した推定値と実際のセンサ値との差である、推定誤差を算出し、算出された推定誤差が許容範囲を満たしているか否かを判定することにより、モデル破壊の発生の有無を検出する。破壊検出部１３は、モデル破壊の検出結果を、モデル破壊情報として、例えば、出力装置１０３を介して、運用者等に通知する。また、破壊検出部１３は、モデル破壊情報を、被監視システム８等に通知してもよい。

　モデル破壊情報は、分析モデルに含まれる各相関モデルのモデル破壊の状況を示す情報である。モデル破壊情報は、例えば、モデル破壊が発生した相関モデルの識別子等、モデル破壊が発生した相関モデルを特定可能な情報を含む。また、モデル破壊情報は、モデル破壊が発生しなかった相関モデルを特定可能な情報を含んでいてもよい。モデル破壊情報は、モデル破壊が発生した（或いは発生しなかった）相関モデルの回帰式に含まれるデータ項目の情報や、算出された予測誤差等、相関モデルから得られる各種情報を含んでいてもよい。モデル破壊情報は、これらの情報の組合せを含んでいてもよい。さらに、モデル破壊情報は、モデル破壊が検出された状態情報の計測時刻や、モデル破壊が検出された相関モデルの数が所定の数を超えたときの状態情報の計測時刻等、モデル破壊に関連する時刻情報を含んでもよい。

　次に、本発明の第１の実施の形態の動作について説明する。

　図４は、本発明の第１の実施の形態における、システム分析装置１の全体的な動作を示すフローチャートである。

　はじめに、状態情報収集部１１は、被監視システム８から所定期間の状態系列情報を収集し、状態情報記憶部１４に保存する（ステップＳ１）。以下、状態情報収集部１１は、ステップＳ２～ステップＳ７の処理が行われている間も、所定周期毎に状態情報を収集し、状態情報記憶部１４に保存する。

　現在のタイミングが分析モデルを生成するタイミングでない場合（ステップＳ２／Ｎｏ）、ステップＳ４以降の処理が行われる。

　一方、現在のタイミングが分析モデルを生成するタイミングである場合（ステップＳ２／Ｙｅｓ）、分析モデル生成部１２は、分析モデルの生成に用いる所定期間の状態系列情報を、状態情報記憶部１４から取得する。そして、分析モデル生成部１２は、取得した状態系列情報を用いて、分析モデルを生成する（ステップＳ３）。ステップＳ３の詳細については後述する。

　現在の分析モデルを用いて対象システムを監視しない場合（ステップＳ４／Ｎｏ）、ステップＳ１からの処理が繰り返される。

　一方、現在の分析モデルを用いて対象システムを監視する場合（ステップＳ４／Ｙｅｓ）、破壊検出部１３は、状態情報収集部１１により新たに収集された状態情報に対して、分析モデルを用いて、モデル破壊の発生有無を検出する（ステップＳ５）。ここで、破壊検出部１３は、分析モデルに含まれる各相関モデルについて、新たに収集された状態情報を適用した場合の推定誤差が許容範囲を超えているか否かを判断する。

　破壊検出部１３は、各相関モデルのモデル破壊の評価結果を示す、モデル破壊情報を生成し、モデル破壊情報を通知する（ステップＳ６）。

　さらに、運用を終了するタイミング（ステップＳ７／Ｙｅｓ）まで、ステップＳ１からの処理が繰り返される。

　なお、ステップＳ２、Ｓ４、及び、Ｓ７における判断（分析モデルを生成するかどうか、対象システムを監視するかどうか、及び、運用を終了するかどうか）は、例えば、入力装置１０４を介した運用者等からの入力に基づいて行われる。また、これに限らず、これらの判断は、予め定められたタイミングであるか否か、或いは、被監視システム８から得られる各種情報が予め定められた条件を満たすか否かに基づいて行われる等、他の方法で行われてもよい。

　図５は、本発明の第１の実施の形態における、システム分析装置１の分析モデル生成処理（ステップＳ３）の詳細を示すフローチャートである。

　自己回帰情報取得部１２１は、状態情報記憶部１４から状態系列情報を取得し、取得した状態系列情報を用いて、自己回帰情報を生成する（ステップＳ１０１）。

　モデル生成部１２２は、生成した自己回帰情報と状態系列情報とを用いて、相関モデル群を生成する（ステップＳ１０２）。

　以上で、本発明の第１の実施の形態の動作が完了する。

　次に、本発明の第１の実施の形態の具体例を説明する。

　ここでは、データ項目の自己回帰モデルへの適合度に、予測精度を用いる。また、適合度に対する閾値に０．７を用いる。よって、適合度に対する条件は「Ｆ_１＞＝０．７」である。

　図６は、本発明の第１の実施の形態における、分析モデルの生成例を示す図である。図６では、３つの例について、ベースの相関モデルにおける目的変数のデータ項目、当該データ項目の自己回帰モデルへの適合度、説明変数のデータ項目、及び、自己回帰情報の考慮の有無に応じて生成される相関モデルが示されている。

　１つ目の例は、ベースの相関モデルにおける目的変数がデータ項目Ａ、説明変数がデータ項目Ａ、Ｂの場合である。データ項目Ａの自己回帰モデルへの適合度は０．７であるため、自己回帰情報には、「自己回帰過程不可」が設定される。ここで、自己回帰情報を考慮しない場合は、例えば、Ａ（ｔ）＝－０．９×Ａ（ｔ－１）＋０．１×Ｂ（ｔ）＋１のように、自己回帰過程を含む相関モデルが生成される。しかしながら、自己回帰情報を考慮することにより、例えば、Ａ（ｔ）＝Ｂ（ｔ）＋０．５のように、自己回帰過程を含まない相関モデルが生成される。

　２つ目の例は、ベースの相関モデルにおける目的変数がデータ項目Ａ、説明変数がデータ項目Ｂ、Ｃの場合である。データ項目Ａの自己回帰モデルへの適合度は０．７であるため、自己回帰情報には、「自己回帰過程不可」が設定される。この場合、ベースの相関モデルにおける説明変数にデータ項目Ａが含まれていないため、自己回帰情報の考慮の有無にかかわらず、例えば、Ａ（ｔ）＝１．２×Ｂ（ｔ）＋０．１×Ｃ（ｔ）＋０．３のように、自己回帰過程を含まない相関モデルが生成される。

　３つ目の例は、ベースの相関モデルにおける目的変数がデータ項目Ｂ、説明変数がデータ項目Ｂ、Ｄの場合である。データ項目Ｂの自己回帰モデルへの適合度は０．５であるため、自己回帰情報には、「自己回帰過程可」が設定される。この場合、ベースの相関モデルにおける説明変数にデータ項目Ｂが含まれているが、自己回帰情報の考慮の有無にかかわらず、例えば、Ｂ（ｔ）＝－０．３×Ｂ（ｔ－１）＋０．１×Ｄ（ｔ）＋２のように、自己回帰過程を含む相関モデルが生成される。

　なお、本発明の第１の実施の形態では、データ項目の特徴として、データ項目の自己回帰過程への適合度を算出し、当該適合度を基に、相関モデルにおける自己回帰過程の有無を選択した。しかしながら、これに限らず、異なる相関モデルの形式から、データ項目の特徴に応じて、予測精度の高くなるような形式が選択できれば、データ項目の特徴として、自己回帰過程への適合度以外の特徴が用いられてもよい。

　次に、本発明の第１の実施の形態の特徴的な構成について説明する。

　図１は、本発明の第１の実施の形態の特徴的な構成を示すブロック図である。

　図１を参照すると、システム分析装置１（情報処理装置）は、特徴取得部１２１１、及び、選択部１２２１を含む。特徴取得部１２１１は、第１のデータ項目の特徴を取得する。選択部１２２１は、取得した特徴に基づいて、第１のデータ項目と第２のデータ項目との関係を学習するためのモデルを選択する。

　次に、本発明の第１の実施の形態の効果について説明する。

　本発明の第１の実施の形態によれば、モデルの数が多い場合であっても、誤報や検知漏れの少ないモデルを生成できる。その理由は、選択部１２２１が、第１のデータ項目の特徴に基づいて、第１のデータ項目と第２のデータ項目との関係を学習するためのモデルを選択するためである。

　例えば、上述のように、自己回帰過程への適合度が高いデータ項目を目的変数として用いた、自己回帰過程を含む相関モデルは、過適合しやすい。これは、自己回帰過程への適合度が高いデータ項目では、データ項目の過去値のみでデータ項目の推定値を精度よく計算できるためである。この場合、相関モデルによるデータ項目の推定値の算出に、説明変数のみに含まれるデータ項目のセンサ値が用いられない。そのため、説明変数のみに含まれるデータ項目のセンサ値に異常値が現れたとしても、その影響が推定値に反映されずに、異常を検知しない可能性がある。また、目的変数の過去値がデータ項目の推定値に寄与する割合が多くなるため、目的変数の過去値からの増加量が僅かに小さい、または、大きいだけでも、異常を検知する可能性がある。このように、自己回帰過程への適合度が高いデータ項目を目的変数として用いた相関モデルは、誤報や検知漏れを起こしやすい。

　そこで、例えば、データ項目の特徴として当該データ項目の自己回帰過程への適合度を用い、当該適合度に基づいて、相関モデルにおける自己回帰過程の有無を選択する。これにより、自己回帰過程への適合度が高いデータ項目を目的変数として用いた、自己回帰過程を含む相関モデル、すなわち、過適合しやすい相関モデルが生成されることが防止され、誤報や検知漏れのより少ない相関モデルが生成される。

　さらに、自己回帰過程を含めるかどうかを決定するための特徴は、データ項目から得られるため、特許文献２のような、入出力に係る先験的情報は不要であり、モデルの数が多い場合にも容易に適用できる。

　（第２の実施の形態）
　本発明の第２の実施の形態について説明する。

　本発明の第２の実施の形態においては、分析モデルとして、所定の条件を満たす相関モデル群を抽出する点において、本発明の第１の実施の形態と異なる。

　はじめに、本発明の第２の実施の形態の構成について説明する。図７は、本発明の第２の実施の形態における、システム分析装置１の構成を示すブロック図である。図７を参照すると、本発明の第２の実施の形態のシステム分析装置１の分析モデル生成部１２は、自己回帰情報取得部１２１、及び、モデル生成部１２２に加えて、さらに、モデル抽出部１２３を含む。

　モデル抽出部１２３（以下、単に抽出部とも記載）は、モデル生成部１２２が生成した相関モデル群から、所定の条件を満たす相関モデル群（適合相関モデル群）を、分析モデルとして抽出する。

　モデル抽出部１２３が相関モデルを抽出する所定の条件は、例えば、相関モデルの適合度（以下、第２の適合度とも記載）が所定の閾値以上であることである。相関モデルの適合度は、相関モデルの回帰式の当該相関モデルに係るデータ項目間の関係への適合度であり、当該回帰式の良さを示す指標である。なお、「相関モデルの適合度が所定の閾値以上」という条件が、「第２の適合度に対する所定の適合条件」である。

　モデル抽出部１２３は、例えば、上述の数２式で示した自己回帰モデルへの適合度Ｆ_１の算出方法と同様に、数９式を用いて、相関モデルの適合度Ｆ_２を算出する。また、モデル抽出部１２３は、相関モデルを抽出する所定の条件として、以下の数１０式を用いる。

　ここで、Ｆ_ｔｈ２は、適合度Ｆ_２に対する閾値（以下、第２の閾値とも記載）であり、Ｆ_ｔｈ２の値には、運用者等により、任意の値が設定される。異常検知の対象範囲を広げるという観点からは、閾値Ｆ_ｔｈ２の値には、低い値が設定されることが好ましい。また、システムの状態変化等による誤検知を減らすという観点からは、閾値Ｆ_ｔｈ２の値には、高い値が設定されることが好ましい。例えば、適合度Ｆ_２が０～１の値を取る場合、誤検知を減らすという観点からは、閾値Ｆ_ｔｈ２の値は、０．７から１であることが好ましい。

　なお、データ項目の自己回帰モデルへの適合度と同様に、相関モデルの適合度についても、数９式のような推定精度の高さの観点から定めた適合度だけでなく、汎化誤差の低さの観点から定めた適合度を用いて算出されてもよい。また、相関モデルの適合度についても、これらの観点による手法を組合せることにより算出されてよい。

　次に、本発明の第２の実施の形態の動作について説明する。

　本発明の第２の実施の形態における、システム分析装置１の全体的な動作を示すフローチャートは、本発明の第１の実施の形態（図４）と同様である。

　図８は、本発明の第２の実施の形態における、システム分析装置１の分析モデル生成処理（ステップＳ３）の詳細を示すフローチャートである。

　自己回帰情報取得部１２１は、状態情報記憶部１４から状態系列情報を取得し、取得した状態系列情報を用いて、自己回帰情報を生成する（ステップＳ２０１）。

　モデル生成部１２２は、生成した自己回帰情報と状態系列情報とを用いて、相関モデル群を生成する（ステップＳ２０２）。

　モデル抽出部１２３は、生成した相関モデル群から、相関モデルの適合度に基づいて、適合相関モデル群を、分析モデルとして抽出する（ステップＳ２０３）。

　以上で、本発明の第２の実施の形態の動作が完了する。

　次に、本発明の第２の実施の形態の効果について説明する。

　本発明の第２の実施の形態によれば、本発明の第１の実施の形態の効果に加え、誤報と検知漏れの割合を、運用者等が適切に決定できる。その理由は、モデル抽出部１２３が、相関モデルの適合度に基づいて、適合相関モデル群を、分析モデルとして抽出するためである。

　上述の第１の実施の形態により、誤報と検知漏れの少ない相関モデル群が生成されるが、誤報と検知漏れはトレードオフの関係にある。ここで、第２の実施の形態により、相関モデルの適合度に対する閾値を調整し、適合度の低い相関モデルも分析モデルに含めれば、誤報の割合が多くなり、適合度の高い相関モデルのみを分析モデルに含めると、検知漏れの割合が多くなる。このように、運用者等が、相関モデルの適合度に対する閾値を調整することにより、所望の感度に応じて相関モデルを選択できる。

　（第３の実施の形態）
　本発明の第３の実施の形態について説明する。

　本発明の第３の実施の形態においては、自己回帰過程を含む相関モデルについて、自己回帰過程を含まない相関モデルで再学習する点において、本発明の第２の実施の形態と異なる。

　はじめに、本発明の第３の実施の形態の構成について説明する。図９は、本発明の第３の実施の形態における、システム分析装置１の構成を示すブロック図である。図９を参照すると、本発明の第３の実施の形態のシステム分析装置１の分析モデル生成部１２は、自己回帰情報取得部１２１、モデル生成部１２２、及び、モデル抽出部１２３に加えて、モデル再生成部１２４（以下、再生成部とも記載）を含む。

　本発明の第３の実施の形態では、第１の適合度（データ項目の自己回帰過程への適合度）と第２の適合度（相関モデルの適合度）に、互いの大小を評価可能な指標を用いる。このような互いの大小を評価可能な指標として、例えば、回帰式の推定精度等、同一の定義に基づく指標が用いられる。また、このような指標として、例えば、尤度とＡＩＣ（Akaike's Information Criterion：赤池情報量基準）のように、変換テーブル等によって互いに変換可能な、異なる定義に基づく指標が用いられてもよい。また、第１の適合度に係る閾値（第１の閾値）、及び、第２の適合度に係る閾値（第２の閾値）には、独立に、異なる値が設定されてもよい。

　例えば、第１の適合度、及び、第２の適合度には、それぞれ、同じ定義（回帰式の推定精度）に基づく、数２式のような適合度Ｆ_１、及び、数９式のような適合度Ｆ_２が用いられる。この場合、第１の適合度に対する所定の適合条件、及び、第２の適合度に対する所定の適合条件には、それぞれ、数３式、及び、数１０式の条件が用いられる。ここで、数３式の第１の閾値Ｆ_ｔｈ１、及び、数１０式の第２の閾値Ｆ_ｔｈ２は、異なっていてもよい。

　モデル再生成部１２４は、自己回帰過程への適合度（第１の適合度）が相関モデルの適合度に係る閾値（第２の閾値）以上の自己回帰過程を含む相関モデル（再生成対象モデル）について、自己回帰過程を含まない回帰式で、データ項目間の関係を再学習する。このような相関モデル（再生成対象モデル）は、自己回帰過程への適合度（第１の適合度）が相関モデルの適合度に係る閾値（第２の閾値）以上、かつ、自己回帰過程への適合度に係る閾値（第１の閾値）より小さい相関モデルである。モデル再生成部１２４は、モデル生成部１２２と同様の方法により、データ項目間の関係を再学習する。

　次に、本発明の第３の実施の形態の動作について説明する。

　本発明の第３の実施の形態における、システム分析装置１の全体的な動作を示すフローチャートは、本発明の第１の実施の形態（図４）と同様である。

　図１０は、本発明の第３の実施の形態における、システム分析装置１の分析モデル生成処理（ステップＳ３）の詳細を示すフローチャートである。

　自己回帰情報取得部１２１は、状態情報記憶部１４から状態系列情報を取得し、取得した状態系列情報を用いて、自己回帰情報を生成する（ステップＳ３０１）。

　モデル生成部１２２は、生成した自己回帰情報と状態系列情報とを用いて、相関モデル群を生成する（ステップＳ３０２）。

　モデル再生成部１２４は、生成された相関モデル毎に、上述の再生成対象モデルかどうかを判定する（ステップＳ３０３）。再生成対象モデルである場合（ステップＳ３０３／Ｙｅｓ）、モデル再生成部１２４は、相関モデルを、自己回帰過程を含まない回帰式で再生成する（ステップＳ３０４）。

　生成した相関モデルの全てに対して、ステップＳ３０３～Ｓ３０４が実行されると、モデル抽出部１２３は、生成した相関モデル群から適合相関モデル群を、分析モデルとして抽出する（ステップＳ３０５）。

　以上で、本発明の第３の実施の形態の動作が完了する。

　次に、本発明の第３の実施の形態の効果について説明する。

　本発明の第３の実施の形態によれば、本発明の第２の実施の形態の効果に加え、システムをより広い範囲で監視できる。その理由は、モデル再生成部１２４が、自己回帰過程への適合度（第１の適合度）が相関モデルの適合度に係る閾値（第２の閾値）以上の、自己回帰過程を含む相関モデル（再生成対象モデル）について、自己回帰過程を含まない回帰式で、再学習するためである。

　分析モデルによる監視範囲を広くするためには、例えば、相関モデルの適合度に係る閾値（第２の閾値）を小さくすることで、相関モデルの適合度（第２の適合度）が低い相関モデルも分析モデルに含めることが有効と考えられる。これにより、分析モデルに含まれるデータ項目間の関係性やデータ項目を増やすことができる。しかしながら、適合度が低い相関モデルは、適合度の高い相関モデルより推定精度が低いため、誤報や検知漏れの原因となる可能性が高い。

　ここで、自己回帰過程への適合度（第１の適合度）が相関モデルの適合度に係る閾値（第２の閾値）以上となるような相関モデルが、自己回帰過程を含む場合を考える。この場合、相関モデルの適合度（第２の適合度）は、説明変数のみに含まれるデータ項目によらず、相関モデルの適合度に係る閾値（第２の閾値）を満たすため、分析モデルとして抽出される。このような相関モデルは、説明変数のみに含まれるデータ項目の影響が推定値に反映されず、誤報や検知漏れが起こる可能性が特に高い。そこで、このような、自己回帰過程への適合度（第１の適合度）が相関モデルの適合度に係る閾値（第２の閾値）以上の、自己回帰過程を含む相関モデルについては、自己回帰過程を含まない回帰式で、データ項目間の関係を再学習する。これにより、このような、誤報や検知漏れが起こる可能性が特に高い相関モデルは、分析モデルから排除される。すなわち、相関モデルの適合度に係る閾値（第２の閾値）を小さくしても、誤報や検知漏れが起こる可能性を抑制しつつ、監視範囲を広くすることができる。

　なお、上述した本発明の第２、及び、第３の実施の形態では、相関モデルの適合度が、当該相関モデルの生成に用いた状態情報から算出される場合を説明した。これに限らず、相関モデルの適合度は、当該相関モデルの構築に用いていない状態情報から算出されてもよい。例えば、分析モデル生成部１２は、相関モデルの生成に用いていない状態情報から、相関モデルの適合度Ｆ_２を算出してもよい。また、他の例として、分析モデル生成部１２は、相関モデルの生成に用いていない状態情報から、相関モデルのモデル破壊情報を生成し、当該モデル破壊情報から、相関モデルの適合度Ｆ_２を算出してもよい。モデル破壊情報から相関モデルの適合度Ｆ_２を求める場合、例えば、１－（相関モデルでモデル破壊が検出された頻度）／（モデル破壊情報の生成に用いた状態情報のインデックス数）を相関モデルの適合度Ｆ_２として用いてもよい。また、分析モデル生成部１２は、相関モデルの生成に用いた状態情報から算出された相関モデルの適合度と、当該モデルの生成に用いていない状態情報から算出された相関モデルの適合度とに基づいて、適合相関モデル群を抽出してもよい。複数の適合度を用いて適合相関モデル群を抽出する場合、分析モデル生成部１２は、当該複数の適合度が、当該複数の適合度の各々に対して運用者等により予め設定された閾値を超えた相関モデルを、適合相関モデルとして抽出してもよい。

　また、上述した本発明の各実施の形態において、被監視システム８が発電プラントシステムである例を示した。これに限らず、被監視システム８は、当該被監視システム８の状態を示す情報から１つ以上の相関モデルを生成可能であり、かつ、１つ以上の相関モデルのモデル破壊により異常の発生有無を判定可能なシステムであれば、他のシステムであってもよい。例えば、被監視システム８は、ＩＣＴシステム、プラントシステム、構造物、輸送機器等でもよい。被監視システム８がこれらのシステムの場合でも、各実施の形態のシステム分析装置１は、被監視システム８の状態を示す情報に含まれるデータの種目をデータ項目として用いて、分析モデルを生成し、モデル破壊の検出を行うことが可能である。

　また、上述した本発明の各実施の形態において、システム分析装置１の各構成要素（機能ブロック）が、記憶装置、または、ＲＯＭに記憶されたコンピュータプログラムを実行するＣＰＵによって実現される例を中心に説明した。これに限らず、構成要素の一部、全部、または、それらの組合せが、専用のハードウェアにより実現されていてもよい。

　また、上述した本発明の各実施の形態において、システム分析装置１の各構成要素（機能ブロック）は、複数の装置に分散されて配置されていてもよい。

　また、上述した本発明の各実施の形態において、各フローチャートを参照して説明したシステム分析装置１の動作は、本発明のコンピュータプログラムとしてコンピュータ装置の記憶装置（記憶媒体）に格納されていてもよい。そして、ＣＰＵが、当該コンピュータプログラムを読み出して実行してもよい。この場合、本発明は、当該コンピュータプログラムのコード、或いは、記憶媒体によって構成される。

　また、上述した本発明の各実施の形態において、システム分析装置１は、自己回帰モデルへの適合度に対する閾値の調整や分析モデルの生成において自己回帰情報を利用するかどうかを選択するための画面を、出力装置１０３を介して運用者等に出力してもよい。

　また、上述した本発明の各実施の形態において、システム分析装置１は、特許文献３と同様に、異常箇所の絞り込み機能を含んでいてもよい。

　また、上述した各実施の形態は、適宜組合せて実施されることが可能である。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２０１６年１月２１日に出願された日本出願特願２０１６－００９８７９を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　１　　システム分析装置
　１１　　状態情報収集部
　１２　　分析モデル生成部
　１２１　　自己回帰情報取得部
　１２１１　　特徴取得部
　１２１２　　自己回帰情報生成部
　１２２　　モデル生成部
　１２２１　　選択部
　１２２２　　学習部
　１２３　　モデル抽出部
　１２４　　モデル再生成部
　１３　　破壊検出部
　１４　　状態情報記憶部
　１５　　分析モデル記憶部
　１０１　　ＣＰＵ
　１０２　　メモリ
　１０３　　出力装置
　１０４　　入力装置
　１０５　　ネットワークインタフェース
　８　　被監視システム
　８１　　被監視装置

Claims

　第１のデータ項目の特徴を取得する特徴取得手段と、
　前記特徴に基づいて、前記第１のデータ項目と第２のデータ項目との関係を学習するためのモデルを選択する選択手段と、
　を備えた、情報処理装置。
　前記特徴取得手段は、前記第１のデータ項目の自己回帰過程への適合度である第１の適合度を、前記第１のデータ項目の前記特徴として取得し、
　前記選択手段は、前記第１の適合度に基づいて、前記モデルにおける前記第１のデータ項目の自己回帰過程の有無を選択する、
　請求項１に記載の情報処理装置。
　さらに、
　前記選択されたモデルを用いて、前記第１のデータ項目と前記第２のデータ項目との関係を学習する学習手段と、
　前記関係を学習したモデルを用いて、前記第１のデータ項目、または、前記第２のデータ項目における異常を検出する検出手段と、
　を備えた、請求項２に記載の情報処理装置。
　さらに、
　前記関係を学習したモデルの、当該関係に対する適合度である、第２の適合度を算出し、当該第２の適合度に基づいて、前記関係を学習したモデルから、前記異常を検出するためのモデルを抽出する抽出手段、
　を備えた、請求項３に記載の情報処理装置。
　前記選択手段は、前記第１の適合度が第１の閾値以上である場合に、前記第１のデータ項目の自己回帰過程を含まない前記モデルを選択し、
　前記抽出手段は、前記第２の適合度が第２の閾値以上であるモデルを、前記異常を検出するためのモデルとして抽出し、
　さらに、
　前記第１の適合度が前記第２の閾値以上の場合に、前記第１のデータ項目の自己回帰過程を含まない前記モデルを選択し、当該選択したモデルを用いて、前記関係を再学習する再生成手段、
　を備えた、請求項４に記載の情報処理装置。
　第１のデータ項目の特徴を取得し、
　前記特徴に基づいて、前記第１のデータ項目と第２のデータ項目との関係を学習するためのモデルを選択する、
　情報処理方法。
　前記第１のデータ項目の特徴を取得する場合、前記第１のデータ項目の自己回帰過程への適合度である第１の適合度を、前記第１のデータ項目の前記特徴として取得し、
　前記モデルを選択する場合、前記第１の適合度に基づいて、前記モデルにおける前記第１のデータ項目の自己回帰過程の有無を選択する、
　請求項６に記載の情報処理方法。
　さらに、
　前記選択されたモデルを用いて、前記第１のデータ項目と前記第２のデータ項目との関係を学習し、
　前記関係を学習したモデルを用いて、前記第１のデータ項目、または、前記第２のデータ項目における異常を検出する、
　請求項７に記載の情報処理方法。
　さらに、
　前記関係を学習したモデルの、当該関係に対する適合度である、第２の適合度を算出し、当該第２の適合度に基づいて、前記関係を学習したモデルから、前記異常を検出するためのモデルを抽出する、
　請求項８に記載の情報処理方法。
　コンピュータに、
　第１のデータ項目の特徴を取得し、
　前記特徴に基づいて、前記第１のデータ項目と第２のデータ項目との関係を学習するためのモデルを選択する、
　処理を実行させるプログラムを格納する、コンピュータが読み取り可能な記録媒体。