実施形態1.
以下、本発明の実施形態を図面を参照して説明する。以下の各実施形態では、発電プラントシステムの異常検知に本発明のシステム分析装置を適用した場合を例に用いて説明する。
図1は、第1の実施形態のシステム分析装置100の構成例を示すブロック図である。図1に示すように、本実施形態のシステム分析装置100は、1つ以上の被監視装置200を含む被監視システムと接続される。被監視装置200は、発電プラントシステムを構成する構成要素としての装置やサブシステムであって、例えば、タービン、給水加熱器、復水器などである。また、被監視装置200には、例えば、配管や信号線など、装置間を接続する要素も含まれる。本実施形態では、被監視システムとして、発電プラントシステムのようにシステム全体を想定するが、被監視システムは、あるシステムの一部であってもよい。すなわち、被監視システムを、タービン、給水加熱器、復水器といった、あるシステムが実現する機能を実現するための構成要素に限定してもよい。
被監視装置200の各々は、当該被監視装置200で得られるセンサ値を所定周期毎に計測し、システム分析装置100に送信する。本明細書では、通常の計測機器のようにハードウェアとしての実態があるものだけではなく、ソフトセンサや、制御信号もセンサと呼ぶこととする。センサ値はセンサから得られる値である。センサ値の例としては、弁の開度、液面高さ、温度、流量、圧力、電流、電圧等設備に設置された計測機器によって計測される計測値や、該計測値から算出される予測値や、制御信号の値が挙げられる。本実施形態において、各センサ値は、整数や小数といった数値で表されるものとする。
また、本実施形態では、各被監視装置200から得られるセンサ値に対応するセンサごとに1つのデータ項目が割り当てられる。また、各被監視装置200から同一と見なされるタイミングで収集されたセンサ値の集合を状態情報と呼び、状態情報に含まれるセンサ値に対応するデータ項目の集合を、データ項目群と呼ぶ。ここで、同一と見なされるタイミングで収集されたものの中には、各被監視装置200で同一時刻に計測され、システム分析装置100に送信されたものに限らず、所定範囲内の時刻差の時刻に計測され、システム分析装置100に送信されたものや、システム分析装置100が一連の収集処理によって各被監視装置200から収集したものなども含まれる。また、図示省略しているが、被監視装置200とシステム分析装置100との間に、被監視装置200が取得したセンサ値を記憶する装置、例えば、データサーバや、DCS(Distributed Control System)や、プロセスコンピュータを備えていてもよい。そのような場合には、被監視装置200が任意のタイミングでセンサ値を取得して記憶装置に記憶させ、システム分析装置100が記憶装置に記憶されているセンサ値を所定周期毎に読み出してもよい。
システム分析装置100は、被監視システムの状態情報を一定間隔で取得しながら、被監視システムの状態を分析するための分析モデルを構築し、また、構築した分析モデルを用いて被監視システムの状態を分析する装置であって、状態情報収集手段11と、分析モデル生成手段12と、分析手段13と、状態情報記憶手段14と、分析モデル記憶手段15とを含む。
状態情報収集手段11は、被監視システムの状態情報を一定周期毎に収集する。以下、状態情報の時系列データを、状態系列情報という場合がある。
状態情報記憶手段14は、状態情報収集手段11が収集した状態情報を時系列に沿って記憶する。換言すると、状態情報記憶手段14は、状態情報収集手段11が収集した状態情報を、状態系列情報として記憶する。状態情報記憶手段14は、例えば、収集時間を示す情報と、状態情報(より具体的には、収集されたセンサ値の集合)とを対応づけて記憶してもよい。状態情報は、例えば、収集対象とされたセンサ値が所定の順序で並んだ情報であってもよい。本実施形態の状態情報記憶手段14は、少なくとも所定期間分の状態系列情報を記憶するための記憶領域を有する。
分析モデル生成手段12は、状態情報記憶手段14に記憶されている所定期間分の状態系列情報をもとに、被監視システムの状態を分析するための分析モデルを生成する。
本実施形態の分析モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを有する相関モデルである多体相関モデルを1つ以上含む。より具体的には、本実施形態の分析モデルは、1つ以上の多体相関モデルからなる相関モデルの集合である。
本発明では、少なくとも、データ項目間の関係を定義した回帰式と、該回帰式の予測誤差の許容範囲とを有するモデルを相関モデルと呼び、そのうちの2つのデータ項目を用いて構成される回帰式を含む相関モデルを「相互相関モデル」と呼び、3つ以上のデータ項目を用いて構成される回帰式を含む相関モデルを「多体相関モデル」と呼ぶ。以下、相互相関モデルと多体相関モデルとを区別する必要がない場合には、単に相関モデルと呼ぶ場合がある。
分析モデルの生成に用いる状態系列情報の所定期間には、運用者によって障害を含まない任意の期間が設定される。異常検知の感度を高めるという観点からは、被監視システムの経年的な変化による影響を受けないように、できるだけ短い期間とすることが好ましい。例えば、被監視システムのメンテナンスサイクルが1年だとすると、当該所定期間を、それより十分短い、1か月、1週間、1日などの期間としてもよい。なお、このとき、当該期間に、通常起こりうるシステムの状態変化の要因の中で最も多くのセンサ値に大きな変化をもたらす要因によるセンサ値への影響が含まれることが好ましい。一方、被監視システムの状態変化による誤検知を減らすという観点からは、主要な内的要因または外的要因によるセンサ値の変化を網羅的に含むように、できるだけ長い期間を用いることが好ましい。例えば、被監視システムが季節の影響を強く受ける場合は、当該所定期間を、9か月、1年などの期間としてもよい。
分析モデル記憶手段15は、分析モデル生成手段12が生成した分析モデルの情報である分析モデル情報を記憶する。分析モデル情報は、例えば、分析モデルに含まれる相関モデル(本実施形態では、1つ以上の多体相関モデル)の各々についてのモデル情報の集合であってもよい。モデル情報は、例えば、当該相関モデルの識別子と、当該相関モデルの回帰式の情報(目的変数に用いるデータ項目の情報、説明変数に用いるデータ項目の情報、およびデータ項目間の関係式の情報等)と、該回帰式の予測誤差の許容範囲を示す情報とを含む情報である。また、モデル情報は、さらに回帰式の優良さを表す指標である優良度を含んでいてもよい。
分析手段13は、状態情報が新たに取得されると、分析モデル生成手段12が生成した分析モデルを用いて、被監視システムの状態を分析する。図1に示すように、分析手段13は、モデル破壊検出手段131と、異常判定手段132とを含む。
モデル破壊検出手段131は、新たな状態情報が収集されると、分析モデル記憶手段15に記憶されている分析モデル情報によって示される分析モデルに含まれる各相関モデルについて、相関モデルの回帰式の予測誤差が許容範囲を超える現象であるモデル破壊が発生したかどうかを検出する。
本発明では、このようなモデル破壊の発生を、回帰式の目的変数とされたデータ項目に対応するセンサ値の変化に、通常起こりうるシステムの状態変化に伴うセンサ値の変化(以下、単に通常変化という。)とは無関係なセンサ値の変化が含まれていることを示す指標として用いる。
モデル破壊検出手段131は、例えば、状態情報記憶手段14に記憶されている最新の状態情報を含む状態系列情報と、分析モデルとを用いて、分析モデルに含まれる各相関モデルについて、当該相関モデルの回帰式の目的変数に対する少なくとも最新の時刻における予測値を算出し、さらに、算出した目的変数の予測値と実際のセンサ値との差である予測誤差を算出し、算出された予測誤差が許容範囲を満たしているか否かを判定することによって、モデル破壊の発生の有無を検出する。また、モデル破壊検出手段131は、モデル破壊の検出結果を、モデル破壊情報として出力する。
モデル破壊情報は、例えば、分析モデルに含まれる各相関モデルのモデル破壊の状況を示す情報であってもよい。具体的には、モデル破壊情報は、モデル破壊が発生した相関モデルを特定可能な情報であったり、逆に、モデル破壊が発生しなかった相関モデルを特定可能な情報であってもよい。なお、モデル破壊情報は、相関モデルを特定可能な情報に加えてもしくは代えて、該相関モデルから得られる情報(例えば、該モデルの回帰式に含まれるデータ項目の情報や、算出された予測誤差)を含んでいてもよい。
モデル破壊情報に必要な情報は、警報を発する条件とされる警報条件に依存する。例えば、警報条件が、モデル破壊の発生した相関モデルの数にかかわるものであれば、モデル破壊情報は、モデル破壊が発生した相関モデルの数を特定可能な情報(例えば、分析モデルに含まれる各相関モデルのモデル破壊の有無や、モデル破壊の発生した相関モデルの識別子の集合等)を含んでいればよい。また、例えば、警報条件が、モデル破壊の発生した相関モデルの回帰式の優良度にかかわるものであれば、モデル破壊情報は、モデル破壊が発生した相関モデルの回帰式の優良度を示す情報や、モデル破壊が発生した相関モデルの回帰式の優良度を特定可能な情報(モデル破壊の発生した相関モデルの識別子の集合等)を含んでいればよい。
異常判定手段132は、モデル破壊検出手段131から得られるモデル破壊情報を基に、分析モデルのモデル破壊の状況が警報条件を満たしているか否かを判定する。また、異常判定手段132は、判定の結果、警報条件を満たしていれば、被監視システムの状態を異常と判定し、判定結果を運用者や被監視システムに通知する。
警報条件には、例えば、以下の式(1)を用いることができる。
Na>Ta ・・・(1)
ここで、Naは分析モデルに含まれる相関モデルのうちモデル破壊が発生した相関モデルの数である。また、Taは許容するモデル破壊の数である。例えば、Ta=3であったとすると、分析モデルに含まれる各相関モデルに対して回帰式の予測誤差を算出した結果、モデル破壊が発生した相関モデルの数が4以上であった場合には、警報条件を満たすので、異常判定手段132は、被監視システムの状態が異常であると判定し、運用者や被監視システムに異常の発生等を通知する。
次に、本実施形態の分析モデルの生成方法について説明する。本実施形態の分析モデル生成手段12は、図1に示すように、分析モデル候補生成手段121と、モデル抽出手段122とを含む。また、分析モデル候補生成手段121は、データ項目分類手段1211と、多体相関モデル生成手段1212とを有する。
分析モデル候補生成手段121は、分析モデルに用いる(含ませる)相関モデルの候補を生成する。なお、本例では、データ項目分類手段1211が、データ項目群を1つ以上のグループに分類し、多体相関モデル生成手段1212が、分類されたグループに基づき、1つ以上の多体相関モデルを生成する。
データ項目分類手段1211は、状態情報に含まれるデータ項目群を、1つ以上のグループに分類する。より具体的には、データ項目分類手段1211は、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、その第1データ項目と同一のグループに含まれるデータ項目のうち第1データ項目を除いたデータ項目の1つである第2データ項目とを用いて構成される回帰式の優良度を、任意に選択された第1データ項目に対して全ての第2データ項目の組み合わせについて算出したとき、それら回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、データ項目を分類する。
例えば、データ項目分類手段1211は、まず、所定期間分の状態系列情報を用いて、データ項目群のうち任意の2つのデータ項目に対する全ての組み合わせに対して、それぞれ第1の仮の相互相関モデルと、第2の仮の相互相関モデルとを生成する。ここで、第1の仮の相互相関モデルおよび第2の仮の相互相関モデルはいずれも、選択された2つのデータ項目を用いて構成される回帰式と、該回帰式の優良度とを少なくとも含むモデルである。ただし、第2の仮の相互相関モデルは、第1の仮の相互相関モデルに対して、回帰式の目的変数データ項目(後述)と説明変数データ項目(後述)とが入れ替わっている。
仮の相互相関モデルの回帰式には、例えば、以下の式(2)に示されるようなARX(Auto−Regressive with eXogenous)モデルを用いることができる。
ここで、tは、状態情報のインデックスを表している。状態情報のインデックスtには、状態情報を古い順に並べたとき、古い方から新しい方に向かって、値が増える連番の整数が与えられる。また、N、KおよびMは、任意の整数である。また、y(t)は、状態情報のインデックスがtのときの、データ項目yの値を表している。したがって、y(t−N)はy(t)に比べ、センサ値の収集間隔N回分だけ過去の値を表す。また、式(2)中の「・・・」は、左から右に向かって、tから減じる値を1ずつ大きくした項が、省略されていることを表している。一例として、N=5であれば、a1y(t−1)とa5y(t−5)の間には、a2y(t−2)、a3y(t−3)、a4y(t−4)が省略されていることを表す。また、式(2)において、1つ目の等号の左側にあるハット付きのy(t)が目的変数に相当する。該目的変数は、状態情報のインデックスがtのときの、データ項目yの予測値とされる。また、2つ目の等号の右側にあるy(t−1)〜y(t−N)およびu(t−K)〜u(t−K−M)が説明変数に相当する。本例の場合、説明変数として、状態情報のインデックスがt−1〜t−Nのときのデータ項目yのセンサ値および状態情報のインデックスがt−K〜t−K−Nのときのデータ項目uのセンサ値が用いられている。なお、データ項目の観点からは、目的変数に用いられるデータ項目yを「目的変数データ項目」と定義し、説明変数のみに用いられるデータ項目uを「説明変数データ項目」と定義する。また、1番目の等号と2番目の等号の間にあるf(u,y)は、当該回帰式がuとyの2つのデータ項目を用いた関数であることを表している。
式(2)のパラメータであるa1〜aN,b0〜bM,c,K,N,Mは、当該回帰式の優良度Fが最大となるように決定される。回帰式の優良度Fには、例えば以下の式(3)に示されるような、回帰式の予測精度を用いることができる。式(3)において、バー付きのyは、状態系列情報に含まれる所定期間中(状態情報のインデックスが1〜N1の間)における目的変数の平均値を表す。
回帰式の優良さには、予測精度の高さと、汎化誤差の低さという2つの観点がある。上記の例は予測精度の高さの観点から定めた優良度の例であるが、汎化誤差の低さの観点から優良度を定めることも可能である。そのような場合には、例えば、情報量基準を用いればよい。なお、回帰式の優良度は、これらを組み合わせたものであってもよい。
優良度Fが最大となるパラメータは、例えば、K,N,Mの組に対して優良度Fが最大となるようにa1〜aN,b0〜bM,cを決定し、その後、優良度Fが最大となるK,N,Mの組を選択することで決定される。具体的には、データ項目分類手段1211は、まず、K,N,Mの最大値をそれぞれ設定し、K,N,Mの値の組み合わせごとに回帰式を定式化して、それぞれの回帰式に対して、上記式(3)の第二項の分子が最小になるように、最小二乗法を用いて、パラメータa1〜aN,b0〜bM,cを決定する。次に、データ項目分類手段1211は、回帰式ごとに、優良度Fを算出し、最大の優良度Fをもつ、回帰式のパラメータa1〜aN,b0〜bM,c,K,N,Mを選択する。このようにすれば、所望の回帰式が得られる。ここで、K,N,Mの最大値には、運用者が任意の値を設定すればよい。
また、データ項目分類手段1211は、そのようにして生成した第1の仮の相互相関モデルの集合である第1仮相互相関モデル群と、第2の仮の相互相関モデルの集合である第2仮相互相関モデル群とから、それぞれのデータ項目の組について、回帰式の優良度Fが高い方を選択することで、任意の2つのデータ項目に対して1つの回帰式を対応させた相互相関モデル群を生成する。ここでは、データ項目分類手段1211は、2つのデータ項目の組の各々について、第1の仮の相互相関モデルと第2の仮の相互相関モデルのうち回帰式の優良度Fが高い方を相互相関モデルとして選択し、そのように選択された任意の2つのデータ項目に対するすべての組の相互相関モデルの集合として相互相関モデル群を得る。
また、データ項目分類手段1211は、そのようにして得た相互相関モデル群から、各相互相関モデルの回帰式において、優良度Fが、所定の優良モデル条件を満たす相互相関モデルを優良相互相関モデルとして抽出し、抽出した優良相互相関モデルの集合である優良相互相関モデル群を得る。
優良モデル条件には、例えば、以下の式(4)が用いられる。なお、Fthは回帰式の優良度Fに対する閾値を表している。
F > Fth ・・・(4)
ここで、回帰式の優良度Fに対する閾値Fthには、運用者が任意の値を設定できる。異常検知の対象範囲を広げるという観点からは、閾値Fthは低く設定されることが好ましい。システムの状態変化等による誤検知を減らすという観点からは、閾値Fthは高く設定されることが好ましい。また、システムの状態変化に埋もれる障害の兆候を精度よく検知するためには、システムの状態変化のパタンごとに代表データ項目を選出した方が好ましいため、閾値Fthは高く設定されることが好ましい。例えば、優良度Fが0〜1の値を取るとすると、誤検知を減らすまたは障害の兆候を精度良く検知するためには、閾値Fthは、0.7から1までの値が好ましく、0.8から1までの値がさらに好ましい。
また、データ項目分類手段1211は、抽出された優良相互相関モデル群のグラフ構造を構築する。グラフ構造は、相互相関モデルの回帰式に含まれるデータ項目を結節点とし、回帰式を線として、ネットーワーク図のように表したものである。以下、グラフ構造において、線を介して3つ以上の結節点がつながったものをクラスタと呼ぶ。
また、データ項目分類手段1211は、優良相互相関モデル群のグラフ構造に基づいて、グラフ構造のクラスタの各々が、1つのデータ項目のグループであるデータ項目グループに対応するようにデータ項目を分類する。このように分類したとき、グラフ構造の結節点がデータ項目に対応するため、各クラスタ内の結節点に対応するデータ項目が、各データ項目グループに含まれるデータ項目となる。ここで、クラスタに含まれなかったデータ項目は分析モデル構築の対象外とする。
このようにデータ項目を分類すれば、分類後のデータ項目グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、その第1データ項目と同一のデータ項目グループに含まれるデータ項目のうち第1データ項目を除いたデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、任意に選択された1つの第1データ項目に対して全ての第2データ項目との組み合わせについて算出したとき、その回帰式の優良度の少なくとも1つが、上記の優良モデル条件を満たすように、データ項目が分類される。
多体相関モデル生成手段1212は、データ項目分類手段1211が分類したデータ項目のグループごとに、そのグループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、そのグループに含まれるデータ項目のうち代表データ項目を除いた任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを含む回帰式を構築する。また、多体相関モデル生成手段1212は、構築した回帰式の予測誤差の許容範囲と、回帰式の優良度とを算出し、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する。なお、多体相関モデル生成手段1212は、回帰式と、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを含む多体相関モデルを生成してもよい。
このとき、多体相関モデル生成手段1212は、データ項目分類手段1211によって分類されたデータ項目グループごとに、当該データ項目グループ内の任意の2つのデータ項目の組を用いて構成される回帰式の全てについて算出される回帰式の優良度に基づいて、代表データ項目を選出する。多体相関モデル生成手段1212は、例えば、データ項目グループごとに、当該データ項目グループ内の任意の2つのデータ項目の組を用いて構成される回帰式の全てについて算出された回帰式の優良度から、当該データ項目グループにおけるデータ項目別の統計値を算出し、算出されたデータ項目別の統計値に基づいて、当該データ項目グループにおける代表データ項目を選出してもよい。多体相関モデル生成手段1212は、例えば、統計値の最も高いものを代表データ項目に選出してもよい。なお、代表データ項目は1つとは限らない。多体相関モデル生成手段1212は、複数の代表データ項目を選出する場合には、統計値の高い方から代表データ項目を選出してもよい。
具体的には、多体相関モデル生成手段1212は、データ項目分類手段1211が生成した相互相関モデル群に含まれる各相互相関モデルの回帰式の優良度をデータ項目ごとに累積し、データ項目グループごとに、当該データ項目グループに属するデータ項目のうち、回帰式の優良度の累積値が最も高いものを代表データ項目としてもよい。当該相互相関モデル群に含まれる各相互相関モデルの回帰式の優良度は、目的変数に用いられるデータ項目および説明変数に用いられるデータ項目に対応づけられているので、多体相関モデル生成手段1212は、累積の際には、両方のデータ項目にその回帰式の優良度を加算する。ここで、回帰式の優良度の累計値が前記統計値に相当する。
また、多体相関モデルの回帰式には、例えば以下の式(5)に示す回帰式を用いることができる。
ここで、K,N,M,L,P,Q,Sは任意の整数である。また、式(5)においても、1つ目の等号の左側にあるハット付きのy(t)が目的変数に相当する。該目的変数は、状態情報のインデックスがtのときの、データ項目yの予測値とされる。また、2つ目の等号の右側にあるy(t−1)〜y(t−N),u(t−K)〜u(t−K−M),x(t−L)〜x(t−L−Q)およびw(t−P)〜w(t−P−S)が説明変数に相当する。本例の場合、説明変数として、状態情報のインデックスがt−1〜t−Nのときのデータ項目yのセンサ値、状態情報のインデックスがt−K〜t−K−Nのときのデータ項目uのセンサ値、状態情報のインデックスがt−P〜t−P−Qのときのデータ項目xのセンサ値および状態情報のインデックスがt−R〜t−R−Sのときのデータ項目wのセンサ値が用いられている。ただし、式(2)の場合と同様に、データ項目の観点からは、目的変数に用いられるデータ項目yを「目的変数データ項目」と定義し、説明変数のみに用いられるデータ項目u,x,wを「説明変数データ項目」と定義する。なお、上記例では、4つの説明変数データ項目のうち2つのデータ項目(より具体的には、データ項目xとデータ項目w)が「代表データ項目」に相当する。
多体相関モデル生成手段1212は、任意の2つのデータ項目と代表データ項目とを用いて回帰式を構築する際に、代表データ項目ではない2つのデータ項目の各々を目的変数とした回帰式を構築し、それらの回帰式のうち回帰式の優良度が最大となる回帰式を選択することで、代表データ項目を除く任意の2つのデータ項目に対して1つの回帰式を対応させた多体相関モデル群を生成する。
式(5)のパラメータであるa1〜aN,b0〜bM,c,d0〜dQ,e0〜eS,K,L,N,M,P,Q,Sは、例えば、PLS回帰を用いて、当該回帰式の優良度Fが最大となるように決定される。当該回帰式の優良度Fには、例えば上記の式(3)で示されるような、回帰式の予測精度の値を用いることができる。
また、優良度Fが最大となるパラメータは、例えば、K,L,N,M,P,Q,Sの組に対して優良度Fが最大となるようにa1〜aN,b0〜bM,c,d0〜dQ,e0〜eSを決定し、その後、優良度Fが最大となるK,L,N,M,P,Q,Sの組を選択することで決定される。具体的には、多体相関モデル生成手段1212は、例えば、K,L,N,M,P,Q,Sの最大値をそれぞれ設定し、K,L,N,M,P,Q,Sの値の組み合わせごとに回帰式を定式化し、それぞれの回帰式に対して、PLS回帰を用いて、パラメータa1〜aN,b0〜bM,c,d0〜dQ,e0〜eSを決定する。PLS回帰の成分数は、例えば、PLS回帰の成分数を1から順に増やしたときに、分析モデルの生成に用いた状態系列情報に対する予測誤差の最大値が、減少から、増加に転じる前までの成分数とすればよい。最後に、多体相関モデル生成手段1212は、回帰式ごとに、優良度Fを算出し、最大の優良度Fをもつ、回帰式のパラメータa1〜aN,b0〜bM,c,d0〜dQ,e0〜eS,K,L,N,M,P,Q,Sを選択する。このようにすれば、所望の回帰式が得られる。ここで、K,L,N,M,P,Q,Sの最大値には、運用者が任意の値を設定すればよい。
このようにして得られた多体相関モデル群が、分析モデルとして用いる相関モデルの候補となる。
また、多体相関モデルの回帰式の予測誤差の許容範囲には、例えば、以下の式(6)および式(7)の両方が満たされる範囲を用いることができる。
ri≦T1 ・・・(6)
ri≧T2 ・・・(7)
ここで、T1は予測誤差に対する上限閾値である。また、T2は予測誤差に対する下限閾値である。また、riは当該多体相関モデルの回帰式を用いて算出される目的変数のi番目の時刻での予測誤差である。ここで、iは状態系列情報における時刻の識別子を表している。より具体的には、iはある基準時刻から該当する時刻までの状態情報を昇順または降順で並べたときの並び番号である。例えば、監視開始からi番目の時刻を表すものとしてもよい。
また、例えば、多体相関モデルの回帰式の予測誤差の許容範囲には、該回帰式の構築に用いられた状態系列情報の期間にわたって算出される予測誤差(以下、算出期間中の予測誤差という。)の絶対値の最大値に−1をかけたものから、同算出期間中の予測誤差の絶対値の最大値までの範囲となるような、以下の式(8)および式(9)で示されるT1およびT2を用いることができる。
T1=max{|R1|,|R2|,・・・,|RN1|} ・・・(8)
T2=−T1 ・・・(9)
ここで、max{}は入力された数値の中から最大値を出力する関数である。また、|x|はxの絶対値を抽出する演算子である。また、R1(i=1〜N1)は当該多体相関モデルの回帰式の構築に用いた状態系列情報から算出される目的変数のi番目の時刻の予測誤差を表している。また、N1は当該多体相関モデルの回帰式を用いて該状態系列情報から算出される予測誤差の個数である。
この他にも、回帰式の構築に用いた状態系列情報の期間にわたって算出された予測誤差R1〜RN1の平均値と標準偏差とを用いて、例えば、予測誤差の平均値に標準偏差の3倍を足した値をT1とし、予測誤差の平均値から標準偏差の3倍を引いた値をT2としてもよい。
モデル抽出手段122は、分析モデル候補生成手段121が生成した相関モデルの候補の中から、分析モデルに用いる相関モデルを抽出する。モデル抽出手段122は、分析モデル候補生成手段121によって生成された相関モデル群(本実施形態では、多体相関モデル生成手段1212によって生成される多体相関モデル群)の中から、各相関モデルの回帰式の優良度に基づいて、1つ以上の多体相関モデルを抽出する。
モデル抽出手段122は、例えば、多体相関モデル生成手段1212によって生成される多体相関モデル群から、所定の優良モデル条件を満たす多体相関モデルを優良多体相関モデルとして抽出し、抽出された優良多体相関モデルの集合である優良多体相関モデル群を分析モデルとしてもよい。また、モデル抽出手段122は、抽出した各優良多体相関モデルのモデル情報を含む分析モデル情報を分析モデル記憶手段15に記憶する。
優良多体相関モデルの抽出に用いる優良モデル条件には、例えば、上記の式(4)を用いることができる。ここで、回帰式の優良度Fに対する閾値Fthには、運用者が任意の値を設定できる。異常検知の対象範囲を広げるという観点からは、閾値Fthを低く設定することが好ましい。システムの状態変化等による誤検知を減らすという観点からは、閾値Fthは高く設定されることが好ましい。仮の相互相関モデルの場合と同様、例えば、誤検知を減らすという観点からは、優良度Fが0〜1の値を取るとすると、閾値Fthは、0.7から1までの値が好ましく、0.8から1までの値がさらに好ましい。
次に、本実施形態における、優良相互相関モデルおよび優良多体相関モデルの抽出について、具体例を用いて説明する。
以下に示す例では、優良相互相関モデルや優良多体相関モデルの抽出において、抽出する元となるモデル群が相互相関モデル群か多体相関モデル群かにかかわらず、同一の回帰式の優良度の指標および優良モデル条件を用いるが、抽出する元となるモデル群に応じて異なる回帰式の優良度の指標および優良モデル条件を用いてもよい。一例として、相互相関モデルおよび多体相関モデルとも回帰式の優良度Fとして予測精度を用い、相互相関モデルに対する優良モデル条件を「F>0.6」とし、多体相関モデルに対する優良モデル条件を「F>0.7」とする等が挙げられる。
また、以下に示す例では、優良多体相関モデルの抽出において、抽出する元となる多体相関モデル群に含まれる代表データ項目の数にかかわらず、同一の回帰式の優良度の指標および優良モデル条件を用いるが、抽出する元となる多体相関モデル群に含まれる代表データ項目の数に応じて、異なる回帰式の優良度の指標および優良モデル条件を用いてもよい。一例として、多体相関モデルの回帰式の優良度Fとして代表データ項目の数に関わらず予測精度を用い、多体相関モデルに対する優良モデル条件を「F>0.6×(代表データ項目の数)−1/3」とする等が挙げられる。
図2は、データ項目分類手段1211による優良相互相関モデルの抽出方法の一例を示す説明図である。図2において、符号701Aは、優良相互相関モデルの抽出元となる相互相関モデル群を表している。また、符号701Bは、抽出された優良相互相関モデル群を表している。また、符号701Cは、本例の優良相互相関モデルの抽出に用いた優良モデル条件を表している。なお、図2の上段および下段の表における「Item 1」および「Item 2」欄は、相互相関モデルの回帰式に用いられた説明変数のデータ項目を表している。また、「Regression equation」欄は、相互相関モデルの回帰式を表している。また、「F」欄は、回帰式の優良度を表している。なお、相互相関モデル群に含まれる各相互相関モデルには、回帰式の予測誤差の許容範囲も含まれうるが、回帰式の予測誤差の許容範囲は優良相互相関モデルの抽出には利用されないため、図中では省略している。以下、他の説明においても、説明に利用されない値を図から省略することがある。
本例では、データ項目分類手段1211は、状態情報記憶手段14から状態系列情報を取得し、相互相関モデル群701Aを生成する。本例の相互相関モデル群701Aは、5つの相互相関モデルで構成されている。また、本例の相互相関モデル群701Aの生成に用いた状態系列情報に含まれるデータ項目群は、データ項目A、データ項目B、データ項目C、データ項目D、データ項目Gおよびデータ項目Hからなる。相互相関モデル群701Aを構成する5つの相互相関モデルの回帰式は、それぞれB=f1(A,B),C=f2(A,C),B=f3(B,D),C=f4(C,D),G=f5(G,H)である。ここで、fj()はカッコ内に含まれるデータ項目から目的変数データ項目の予測値を算出するための関数である(ここでjは回帰式を識別するための識別子である整数)。その関数の説明変数には、カッコ内に含まれるデータ項目について、状態情報記憶手段14に記憶されている状態系列情報に含まれる該データ項目の値(センサ値)だけではなく、該データ項目を用いて算出される変換値や、過去の値も用いることができる。また、図2には、相互相関モデル群701Aを構成する各相互相関モデルの回帰式B=f1(A,B),C=f2(A,C),B=f3(B,D),C=f4(C,D),G=f5(G,H)の優良度Fが、それぞれ0.8,0.8,0.9,0.7,0.5であることが示されている。
データ項目分類手段1211は、相互相関モデル群701Aから、優良モデル条件701Cを満たす優良相互相関モデルを抽出して、優良相互相関モデル群701Bを得る。本例の優良モデル条件701Cは、図2に示されるように「回帰式の優良度F>0.6」である。このため、データ項目分類手段1211は、相互相関モデル群701Aを構成する5つの相互相関モデルのうち、回帰式の優良度Fが0.6を超える相互相関モデルを優良相互相関モデルとして抽出する。本例では、次の4つの回帰式、B=f1(A,B),C=f2(A,C),B=f3(B,D),C=f4(C,D)をそれぞれ含む4つの相互相関モデルが抽出されて、優良相互相関モデル群701Bとなる。
また、図3は、モデル抽出手段122による優良多体相関モデルの抽出方法の一例を示す説明図である。図3において、符号702Aは、優良多体相関モデルの抽出元となる多体相関モデル群を表わしている。また、符号702Bは、抽出された優良多体相関モデル群を表している。また、符号702Cは、本例の優良多体相関モデルの抽出に用いた優良モデル条件を表している。なお、図3の上段および下段の表における「Item 1」および「Item 2」欄は、多体相関モデルの回帰式に用いられた説明変数のデータ項目のうち代表データ項目を除くデータ項目を表している。また、同表における「Representative Item」欄は、多体相関モデルの回帰式に用いられた代表データ項目を表している。
本例では、モデル抽出手段122は、多体相関モデル生成手段1212から多体相関モデル群702Aを取得する。本例の多体相関モデル群702Aは、2つの多体相関モデルで構成されている。また、本例の多体相関モデル群702Aの生成に用いた状態系列情報に含まれるデータ項目群は、データ項目A、データ項目B、データ項目Cおよびデータ項目Dからなる。多体相関モデル群702Aを構成する2つの多体相関モデルの回帰式は、それぞれC=f10(A,B,C),C=f11(B,C,D)である。また、図3には、多体相関モデル群702Aを構成する各多体相関モデルの回帰式C=f10(A,B,C),C=f11(B,C,D)の優良度Fが、それぞれ0.9,0.8であることが示されている。
モデル抽出手段122は、多体相関モデル群702Aから、優良モデル条件702Cを満たす優良多体相関モデルを抽出して、優良多体相関モデル群702Bを得る。本例の優良モデル条件702Cは、図3に示されるように「回帰式の優良度F>0.6」である。このため、モデル抽出手段122は、多体相関モデル群702Aを構成する2つの多体相関モデルのうち、回帰式の優良度Fが0.6を超える多体相関モデルを優良多体相関モデルとして抽出する。本例では、次の2つの回帰式、C=f10(A,B,C),C=f1 1(B,C,D)をそれぞれ含む2つの多体相関モデルが抽出されて、優良多体相関モデル群702Bとなる。
次に、本実施形態における、相互相関モデル群や多体相関モデル群のグラフ構造を、具体例を用いて説明する。以下に示す例では、対象モデル群に含まれる相関モデルの回帰式に用いられている説明変数データ項目から目的変数データ項目に向かって矢印がつけられる有向グラフとして、グラフ構造を構築する場合を例に用いて説明するが、結節点と結節点の間の線に矢印をつけない無向グラフとして、グラフ構造を構築してもよい。
図4は、図2に示した優良相互相関モデル群701Bのグラフ構造の構築例を示す説明図である。図4に示されるように、まず、データ項目分類手段1211は、対象モデル群である優良相互相関モデル群701Bに含まれる各優良相互相関モデルの回帰式に用いられているデータ項目を、それぞれ結節点で表す。次いで、その結節点間を、回帰式ごとに、説明変数データ項目(説明変数にのみ用いられているデータ項目)から目的変数データ項目(目的変数に用いられているデータ項目)に向かう矢印付きの線で接続して、グラフ構造701Dを構築する。本例では、データ項目分類手段1211は、データ項目A,データ項目B,データ項目Cおよびデータ項目Dをそれぞれ結節点として表し、それら結節点間を、データ項目Aからデータ項目Bに向かう矢印付きの線,データ項目Aからデータ項目Cに向かう矢印付きの線,データ項目Dからデータ項目Bに向かう矢印付きの線およびデータ項目Dからデータ項目Cに向かう矢印付きの線でそれぞれ接続し、グラフ構造701Dを得る。なお、図4には、1つのクラスタが残る例が示されているが、複数のクラスタが残る場合もある。また、本例では、線を介して2つの結節点しか接続されないような固まりは存在しないため、いずれの結節点も有効とされるが、例えば、線を介して2つの結節点しか接続されないような固まりがあった場合には、当該固まりはクラスタとは認められず、これに含まれる結節点に対応するデータ項目は分析モデル構築の対象外とされる。
次に、本実施形態における代表データ項目の選出方法を、具体例を用いて説明する。図5は、代表データ項目の選出方法の一例を示す説明図である。多体相関モデル生成手段1212は、例えば、図4に示した優良相互相関モデル群のグラフ構造701Dに基づいて、各クラスタにつき、当該クラスタ内の結節点に対応するデータ項目ごとに、回帰式の優良度Fの累積値を算出する。具体的には、グラフ構造701Dに含まれるクラスタごとに、当該クラスタに含まれる結節点に対応するデータ項目別に、当該結節点に接続された矢印に対応する回帰式の優良度Fを累計して、累積値を得る。そして、得られた累計値を、当該データ項目のスコア701Eとする。そして、各データ項目のうち最大のスコア701Eとなったデータ項目を代表データ項目とする。ここで、スコア701Eが最大となるデータ項目が複数ある場合は、例えば、その中からランダムに代表データ項目を選出すればよい。図5に示す例では、各データ項目のスコア701Eは、データ項目A,データ項目B,データ項目Cおよびデータ項目Dに対して、それぞれ1.6,1.7,1.5および1.6である。よって、代表データ項目には、データ項目Bが選ばれる。換言すると、本例では、データ項目A、データ項目B、データ項目Cおよびデータ項目Dからなるデータ項目グループの代表データ項目として、データ項目Bが選ばれる。なお、本例は、優良多体相関モデル群のグラフ構造701Dにクラスタが1つしかない場合の例であるが、複数のクラスタがある場合は、クラスタごとに、同様の方法により、代表データ項目を選出する。本例の方法によれば、例えば、回帰式の優良度Fとしての予測精度を各回帰式の重みとして用い、スコアを計算することができるので、他のデータ項目を最も精度高く予測できるデータ項目が代表データ項目として選出される。別の見方をすれば、他のデータ項目を最も精度高く予測できるデータ項目は、同一クラスタに属するデータ項目において平均的な振る舞いをしているため、同一クラスタの他のデータ項目を最も精度高く予測できると考えられる。よって、このデータ項目を代表データ項目として回帰式を構築することで、システムの状態変化に伴うセンサ値の変化と、システムの状態変化とは無関係なセンサ値の変化とを分離して予測値を算出することが可能な回帰式を構築できるので、システムの状態変化に埋もれるような障害の兆候を検知できる。
次に、優良相互相関モデル群のグラフ構造に2つ以上のクラスタがある場合の代表データ項目の選出方法を、具体例を用いて説明する。
図6は、2つ以上のクラスタを有する優良相互相関モデル群のグラフ構造の例を示す説明図である。図6において、符号703Bは、グラフ構造の構築対象とされる優良相互相関モデル群を表している。また、符号703Dは、優良相互相関モデル群703Bのグラフ構造を表している。また、符号703F1および703F2は、それぞれグラフ構造703Dが有するクラスタを表している。データ項目分類手段1211は、優良相互相関モデル群703Bに含まれる各優良相互相関モデルの回帰式に用いられているデータ項目を、それぞれ結節点で表し、その結節点間を、回帰式ごとに、説明変数データ項目から目的変数データ項目に向かう矢印付きの線で接続して、グラフ構造703Dを得る。図6に示されるように、本例のグラフ構造703Dは、データ項目A、データ項目B、データ項目Cおよびデータ項目Dで構成されるクラスタ703F1と、データ項目K、データ項目Lおよびデータ項目Mで構成されるクラスタ703F2とを有する。
また、図7は、優良相互相関モデル群のグラフ構造に2つ以上のクラスタがある場合の代表データ項目の選出方法の例を示す説明図である。多体相関モデル生成手段1212は、図7に示される優良相互相関モデル群のグラフ構造703Dに基づいて、例えば、クラスタごとに、当該クラスタに含まれるデータ項目別の回帰式の優良度Fの累積値を算出する。具体的には、グラフ構造703Dに含まれるクラスタごとに、当該クラスタに含まれる結節点に接続された各矢印に対応する回帰式の優良度Fを、当該回帰式に用いられているデータ項目に対して累計する処理を行い、データ項目別の累計値を得る。そして、得られた累積値を当該データ項目のスコアとする。
図7では、クラスタ703F1を構成する各データ項目のスコアを703E1として示し、クラスタ703F2を構成する各データ項目のスコアを703E2として示している。多体相関モデル生成手段1212は、クラスタごとに、当該クラスタを構成するデータ項目のうち最大のスコアとなるデータ項目を、代表データ項目とする。1つのクラスタ内に、スコアが最大となるデータ項目が複数ある場合には、例えば、その中からランダムに代表データ項目を選択すればよい。図7に示す例では、クラスタ703F1を構成する各データ項目のスコア703E1は、データ項目A,データ項目B,データ項目Cおよびデータ項目Dに対して、それぞれ1.6,1.7,1.5および1.6である。よって、クラスタ703F1の代表データ項目には、データ項目Bが選ばれる。換言すると、データ項目A,データ項目B,データ項目Cおよびデータ項目Dからなるデータ項目グループの代表データ項目として、データ項目Bが選ばれる。また、クラスタ703F2を構成する各データ項目のスコア703E2は、データ項目K,データ項目Lおよびデータ項目Mに対して、それぞれ1.4,0.7および0.7である。よって、クラスタ703F2の代表データ項目には、データ項目Kが選ばれる。換言すると、データ項目K,データ項目Lおよびデータ項目Mからなるデータ項目グループの代表データ項目として、データ項目Kが選ばれる。
なお、システム分析装置100は、CPUとプログラムを記憶した記憶媒体とを含み、プログラムに基づくCPUの制御によって動作するコンピュータであってもよい。そのような場合、状態情報収集手段11、分析モデル生成手段12および分析手段13は、プログラムに従って動作するCPUによって実現される。また、状態情報記憶手段14および分析モデル記憶手段15は、該コンピュータが備える記憶媒体によって実現される。なお、状態情報記憶手段14および分析モデル記憶手段15は、それぞれ個別の記憶媒体によって実現されてもよく、また1つの記憶媒体によって実現されてもよい。
次に、本実施形態におけるシステム分析装置100の動作を説明する。図8は、本実施形態のシステム分析装置100の動作の一例を示すフローチャートである。
図8に示す例では、はじめに、システム分析装置100の状態情報収集手段11が、被監視装置200から状態情報を収集し、状態情報記憶手段14に記憶する(ステップS101)。状態情報収集手段11は、運用を終了するという判断(ステップS108のYes)が与えられるまで、ステップS101の動作を繰り返す。なお、状態情報収集手段11は、ステップS102〜ステップS107の動作が行われている間も、所定周期毎に状態情報を収集し、状態情報記憶手段14に記憶する動作を行う。
次いで、分析モデル生成手段12が、現在のタイミングが分析モデルを生成するタイミングであれば(ステップS102のYes)、分析モデルの生成に用いる所定期間についての状態系列情報を状態情報記憶手段14から取得し、取得した状態系列情報を用いて、分析モデルを生成する(ステップS103)。一方、現在のタイミングが分析モデルを生成するタイミングでなければ(ステップS102のNo)、ステップS104に進む。分析モデルを生成するタイミングであるか否かは、例えば、分析モデルを生成するという判断が与えられたか否かによって判定してもよい。
ステップS104では、分析手段13は、現在の分析モデルを用いて、対象システムを監視するという判断(ステップS104のYes)が与えられなければ、ステップS101に戻る。一方、現在の分析モデルを用いて、対象システムを監視するという判断(ステップS104のYes)が与えられれば、ステップS105に進む。
ステップS105では、モデル破壊検出手段131が、状態情報収集手段11により新たに収集された状態情報を用いて、分析モデル記憶手段15に記憶されている分析モデル情報によって示される分析モデルのモデル破壊の状況を検出する。モデル破壊検出手段131は、より具体的には、分析モデルに含まれる各多体相関モデルにモデル破壊が発生しているか否かを判定し、その結果を示すモデル破壊情報を生成する。
次いで、異常判定手段132が、モデル破壊検出手段131から得られるモデル破壊情報に基づいて、モデル破壊の状況が警報条件を満たしているか否かを判定する。モデル破壊の状況が警報条件を満たしていれば(ステップS106のYes)、異常判定手段132は、判定結果またはモデル破壊の状況を示すモデル破壊情報を運用者または被監視システムに通知し(ステップS107)、ステップS108に進む。一方、モデル破壊の状況が警報条件を満たしていなければ(ステップS106のNo)、異常判定手段132はシステムに異常は検知されなかったとして特に何もせず、ステップS101に戻る。
システム分析装置100は、運用を終了するという判断(ステップS108のYes)が与えられるまで、上記の動作を継続する。
また、図9は、分析モデル生成手段12による分析モデルの生成処理(図8のステップS103)の処理フローの一例を示すフローチャートである。図9に示す例では、はじめに、データ項目分類手段1211が、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶手段14から取得し、取得した状態系列情報を用いて、データ項目の分類のための相互相関モデル群を生成する(ステップS201)。
次いで、データ項目分類手段1211は、所定の優良モデル条件に基づいて、生成された相互相関モデル群から優良相互相関モデルを抽出して、優良相互相関モデル群を得る(ステップS202)。
次いで、データ項目分類手段1211は、得られた優良相互相関モデル群のグラフ構造を構築する(ステップS203)。ステップS203で、データ項目分類手段1211は、構築されたグラフ構造にもとづいて、データ項目を分類する。データ項目分類手段1211は、グラフ構造に含まれる各クラスタを、各々データ項目グループとする。
次いで、多体相関モデル生成手段1212が、データ項目分類手段1211によって分類されたデータ項目グループごとに、代表データ項目を選出する(ステップS204)。
次いで、多体相関モデル生成手段1212は、該データ項目グループごとに、代表データ項目を除く当該データ項目グループに属する任意の2つのデータ項目の全ての組み合わせについて、該2つのデータ項目と代表データ項目とを用いた回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成し、多体相関モデル群を得る(ステップS205)。
次いで、モデル抽出手段122が、生成された多体相関モデル群から、所定の優良モデル条件に基づいて、優良多体相関モデルを抽出して、優良相互相関モデル群を得る(ステップS206)。
次いで、モデル抽出手段122は、得られた優良多体相関モデル群を分析モデルとして、分析モデル記憶手段15に分析モデル情報を記憶する(ステップS207)。
以上のように、本実施形態のシステム分析装置100によれば、対象システムが複雑であったり、データ項目間に多重共線性があったりしても、高感度に異常を検知できる分析モデルを生成できるので、精度よくシステムの異常判定を行うことができる。その理由として、本実施形態の6つの特長が挙げられる。
1つ目は、データ項目分類手段1211が、相互相関モデル群を生成して、その相互相関モデル群に含まれる相互相関モデルの回帰式の中から優良度が高い回帰式を選び、その回帰式に含まれるデータ項目ごとに、データ項目を分類していることである。この結果、気温、システムへの負荷、設定値など、通常起こりうるシステムの状態変化が、データ項目の値に同様に現れるデータ項目ごとにデータ項目を分類できる。これは、データ項目の値に現れるシステムの状態変化に伴う影響(例えばセンサ値のトレンドとして現れる)が類似するデータ項目を、1つのグループに分類できることを意味する。
システムの状態変化に伴う影響が類似するデータ項目間では、それを用いた回帰式の予測精度等の回帰式の優良さを表す指標が高くなるため、所望の優良度を得るために必要な回帰式に含まれるデータ項目の数を抑えることができる。回帰式に含まれるデータ項目の数が少ないため、少数のデータ項目に影響が現れる障害の兆候を感度良く検知できる。さらに、回帰式に含まれるデータ項目の数が少ないため、多数のデータ項目を説明変数に用いて回帰式を構築した場合と比べて、異常の発生箇所を特定しやすいという効果も得られる。例えば、特許文献1,2に記載された方法では、予測精度を高めるために、一つの回帰式に説明変数として含まれるデータ項目の数を増やしていくと、異常の影響を受けたデータ項目を特定することが難しくなる問題があったが、このような問題も本実施形態によれば解決できる。
2つ目は、上記の方法でグループ化されたデータ項目ごとに、代表データ項目を決定し、分析モデルに含ませる相関モデルの回帰式として、代表データ項目と、代表データ項目を除く2つのデータ項目とを含む回帰式を構築していることである。回帰式に、システムの状態変化に伴う影響を表すためのデータ項目を加えると、システムの状態変化に伴う影響を各データ項目から除去するのと同様の効果が得られる。このため、上記の方法で構築された回帰式によれば、システムの状態変化に伴うデータ項目の値の変化と、データ項目固有のデータ項目の値の変化を分離して予測値を算出できる。このように、データ項目固有の変動に注目して予測誤差を算出できるので、センサ値の監視だけではシステムの状態変化に伴うデータ項目の値の変化に埋もれてしまうような障害の兆候によるデータ項目の値の変化であっても、精度よく検出することができる。
3つ目は、代表データ項目として、優良度の累積値が最も高いデータ項目を少なくとも選出していることである。関係性の強いデータ項目で構成されるクラスタに対応するデータ項目グループにおいて、他のデータ項目への優良度の累積値が最も高いデータ項目は、当該データ項目グループに属するデータ項目のうち、システムの状態変化の平均的な影響が現れたものと考えられる。よって、上記の方法で選出された代表データ項目は、システムの状態変化に伴うセンサ値の変化を表現するためのデータ項目としてふさわしく、よりシステムの状態変化に伴うデータ項目の値の変化と、データ項目固有のデータ項目の値の変化とを分離するのに有効である。
4つ目は、多重共線性の影響を受けないパラメータ決定の方法を用いていることである。そのため、相関関係の強いデータ項目を除外せずに、分析モデルを生成できる。これにより、相関関係の強いデータ項目間に現れる異常を発見できないといった問題を解決できる。換言すると、相関関係の強いデータ項目間に現れるような異常であっても精度よく検知できる。
5つ目は、分析モデルにおいて、1種類の目的変数に対して複数個の回帰式が構築されることがあるためである。1種類の目的変数に対して複数の回帰式が構築される場合では、1つの回帰式が、システムに対する正常または異常の判断結果に寄与する割合が小さくなるので、どのデータ項目が目的変数に用いられるかで、システムに対する正常または異常の判断結果が異なる場合があるといった問題を解決できる。換言すると、1種類の目的変数に対して構築される回帰式が1つに限られないため、目的変数を限ったことによる異常検知漏れを防ぐことができる。
6つ目は、代表データ項目、目的変数、説明変数の選択を、あらかじめ指定せず、センサ値の振る舞い等に基づいて、それらを適切に自動決定している点である。よって、代表データ項目、目的変数、説明変数の選択にかかわる論理がシステムの複雑さの影響を受けない。そのため、適切な目的変数および説明変数の選択が難しくなるといった問題を解決できる。換言すると、対象システムの構成等が複雑であっても、適切な目的変数および説明変数が選択できるので、精度よく対象システムの状態を分析できる。
また、本実施形態のシステム分析装置100は、上記に加えて、異常要因とされるデータ項目の絞り込み精度が高いという特長がある。関連性の高いデータ項目の集まりであるデータ項目グループ内では回帰式に含まれる代表データ項目が共通しているため、分析モデルに含まれる相関モデルの中の1つのデータ項目グループから生成された優良多体相関モデル群に着目して、例えば、次のような判断ができる。例えば、該優良多体相関モデル群のうちの大半がモデル破壊となったとき、代表データ項目が異常要因とされるデータ項目である可能性が高いという判断ができる。また、逆に、当該優良多体相関モデル群のうちの少数がモデル破壊となったとき、代表データ項目を除くデータ項目が異常要因とされるデータ項目である可能性が高いという判断ができる。
なお、上記の特長を持つためには、代表データ項目が、データ項目の値に現れるシステムの状態変化に伴う影響が類似のデータ項目ごとにグループ化されたデータ項目グループから、選出される必要があり、さらには、そのグループにおいて、システムの状態変化の平均的な影響が現れたデータ項目であることが好ましい。本実施形態のシステム分析装置100は、そのように代表データ項目を選出できる。具体的には、関係性の強いデータ項目群をまとめたデータ項目グループにおいて、優良度(予測精度)の累積値が最も高いデータ項目が選出されればよい。
なお、上記説明では、相関モデルの回帰式の例として、説明変数に目的変数の過去の値を含む例(例えば、式(2)や式(5))を示したが、説明変数から目的変数の過去の値を除外してもよい。また、上記の相関モデルの回帰式の例では、目的変数や説明変数にデータ項目の値を用いたが、データ項目の値を数値変換したものを用いてもよい。データ項目の値を数値変換したものの例としては、階差、べき乗、所定の時間幅における状態系列情報の平均値などが挙げられる。
また、式(2)や式(5)に示した回帰式の生成方法の例として、優良度である予測精度の値が最大となるように各パラメータを決定する例を示したが、目的に応じて他の優良度を用いてもよい。たとえば、回帰式の優良度として、AIC(Akaike‘s Information Criterion)や、BIC(Bayesian Information Criterion)などの情報量基準の逆数を用いて、それらが最大となるように各パラメータを決定してもよい。
また、上記では、K、N、Mを固定した時の回帰式のパラメータa1〜aN,b0〜bM,c,の決定方法として、式(3)の第二項の分子が最小になるように、最小二乗法を用いてパラメータa1〜aN,b0〜bM,c,を決定する方法を示したが、Lasso(least absolute shrinkage and selection operator)やRidge回帰等で用いられる正則化パラメータ付きの損失関数を用いて、正則化パラメータ付きの損失関数が最小となるように、これらパラメータを決定してもよい。
また、多体相関モデルの回帰式の例として、代表データ項目を説明変数に用いる例(例えば、式(5))を示したが、代表データ項目は目的変数であってもよい。複数の代表データ項目を目的変数とする場合は、複数の代表データ項目の合成値を目的変数としてもよい。
また、上記では、式(5)のパラメータであるa1〜aN,b0〜bM,c,d0〜dQ,e0〜eS,K,L,N,M,P,Q,Sを決定する際に、PLS回帰の成分数を、PLS回帰の成分数を1から順に増やしたときに、モデル構築に用いた状態系列情報に対する予測誤差の最大値が、減少から増加に転じる前までの成分数とする例を示したが、Wold‘s R criterion、Krzanowski’s W criterion、Osten‘s F criterion等を用いて、これらパラメータを決定してもよい。
また、上記では、K、L、N、M、P、Q、Sを固定した時の回帰式のパラメータa1〜aN,b0〜bM,c,d0〜dQ,e0〜eSの決定方法の例として、PLS回帰を用いる例を示したが、主成分回帰(Principal Component Regression :PCR)等、説明変数間の多重共線性による影響を回避可能な別の方法を用いて、これらパラメータを決定してもよい。
また、上記では、データ項目グループの代表データ項目の選出方法の例として、回帰式の優良度の累積値が最も高いものを選出する例を示したが、複数個のデータ項目を、回帰式の優良度の累積値が高い方から順に選出し、代表データ項目としてもよい。1つのデータ項目グループに対して複数の代表データ項目を選出する場合は、例えば、運用者によってあらかじめ定められた所定の個数を満たすまで代表データ項目を増やしてもよいし、情報量基準が所定の閾値を超えるまで代表データ項目を増やしてもよい。データ項目グループごとの代表データ項目の数は、異常の検知感度や異常要因データ項目の絞り込みの観点からは、少ない方が望ましく、誤報頻度の観点からは、多い方が望ましい。
また、上記では、データ項目グループの代表データ項目の選出に、回帰式の優良度の累積値という1種類の指標を用いる例を示したが、複数種類の指標を用いてもよい。複数種類の指標を用いて代表データ項目を選出する方法の一例としては、回帰式の優良度の累積値という指標と、後述する変化点の出現の早さという指標とを用いて、それぞれの指標に対して1つデータ項目を選択し、それらを代表データ項目とする方法が挙げられる。
また、上記では、データ項目グループの代表データ項目を選出する際に、回帰式の優良度の統計値として累積値を用いる例を示したが、優良度の平均値、中央値、最小値、最大値、など他の統計値を用いてもよい。
また、上記では、データ項目グループの代表データ項目を選出する際に、回帰式の優良度から統計値を算出する例を示したが、回帰式の優良度の値を数値変換したものを用いてもよい。回帰式の優良度の値を数値変換したものの一例としては、回帰式の優良度の2乗値や、回帰式の優良度を優良モデル条件に基づき、優良モデル条件を満たす回帰式の優良度を1、優良モデル条件を満たさない回帰式の優良度を0に変換したもの等が挙げられる。
また、上記では、システム分析装置100が、1つの分析モデル(同じ状態系列情報から生成された多体相関モデル群からなる分析モデル)を用いて、被監視システムの状態を監視する例を示したが、収集期間の異なる状態系列情報を用いて複数の分析モデルを作成してもよい。そのような場合に、複数の分析モデルを切り替えながら、被監視システムの状態を監視してもよい。
また、上記では、システム分析装置100が、分析モデルを一度だけ構築する例を示したが、分析モデルを逐次、再構築してもよい。
また、上記では、システム分析装置100が、分析モデルに含まれる全ての回帰式をモデル破壊の検出に用いて、被監視システムの状態を監視する例を示したが、分析モデルの一部のみを用いて、被監視システムの状態(例えば、一部の被監視装置200のみ)を監視してもよい。
また、上記では、警報条件の例として、「モデル破壊が発生した相関モデルの数が、所定の数を超えたとき」といった条件を用いる例を示したが、例えば、「モデル破壊が発生した相関モデルの回帰式の優良度の累積値が、所定の値を超えたとき」といった条件を用いてもよい。また、例えば、あらかじめ設定された所定の値を一般化して警報閾値とした上で、「あらかじめ設定された所定の期間にわたって警報閾値を超えたとき」といった条件を警報条件とすることもできる。このように警報条件には、モデル破壊情報に基づいたあらゆる条件を設定できる。
また、上記では、被監視システムが発電プラントである場合を例に示したが、被監視システムの状態を示す情報から1つ以上の多体相関モデルを生成でき、生成した1つ以上の多体相関モデルのモデル破壊により異常の発生有無を判定できれば、被監視システムは他のシステムでもよい。例えば、被監視システムは、ITシステム、プラントシステム、構造物、輸送機器等であってもよい。この場合、システム分析装置100は、例えば、これらシステムの状態を示す情報に含まれるデータの種目を、データ項目として分析モデルを生成し、モデル破壊の検出を行う。
実施形態2.
次に、本発明の第2の実施形態について説明する。本実施形態は、代表データ項目の選出方法を除いて第1の実施形態と同じである。このため、第1の実施形態と同じ部分については同一の符号を付し、説明を省略する。
本実施形態では、各データ項目グループ内で、時系列上で一番早く値が変化しているデータ項目すなわち最も早く変化点が出現したデータ項目を、代表データ項目として選出する。なお、複数の代表データ項目を選出する場合には、情報の変化点の出現が早い方から代表データ項目を選出してもよい。
本実施形態の多体相関モデル生成手段1212は、まずデータ項目分類手段1211によって分類されたデータ項目グループに含まれるデータ項目のうち、1つをランダムに選択する。そして、選択されたデータ項目を基準データ項目とし、該基準データ項目と、当該データ項目グループ内の他のデータ項目それぞれとの相互相関係数が、最大となる基準データ項目と他のデータ項目の間の時間シフト量を求める。その時間シフト量が過去の方に向かって、最も大きくなるデータ項目を、当該データ項目グループの代表データ項目とする。
次に、本実施形態における代表データ項目の選出方法を、具体例を用いて説明する。図10は、本実施形態における代表データ項目の選出方法の一例を示す説明図である。なお、図10に示す例は、図4に示した優良相互相関モデル群701Bのグラフ構造701Dに基づいてグループ分けした結果生成された1つのデータ項目グループから、代表データ項目を選出する場合の例である。
多体相関モデル生成手段1212は、まず生成されたグラフ構造の各クラスタに対応するデータ項目グループに含まれるデータ項目のうち、一つのデータ項目をランダムに選択する。図10の上部には、分析モデルの生成に用いた状態系列情報におけるデータ項目A,データ項目B,データ項目Cおよびデータ項目Dの時系列変化の様子(時系列データの模式図)が示されている。なお、本例では、データ項目Aが基準データ項目として選出されたものとする。このときの、基準データ項目であるデータ項目Aに対するデータ項目A,データ項目B,データ項目Cおよびデータ項目Dの時間シフト量は、それぞれ0,3,2および−1であった。
なお、図10には、時間シフト量として、基準データ項目Aと他のデータ項目との相互相関関数が最大値となる条件において、他のデータ項目を時間方向にずらした量が示されている。時間シフト量の単位は、1計測時間間隔である。また、時間シフト量が正の値をとるのは、他のデータ項目を未来に、すなわち紙面右側に移動させたときに、基準データ項目であるデータ項目Aと当該他のデータ項目との相互相関関数が最大値となることを示している。一方、時間シフト量が負の値をとるのは、他のデータ項目を過去に、すなわち紙面左側に移動させたときに、基準データ項目であるデータ項目Aと当該他のデータ項目の相互相関関数が最大値となること示している。したがって、本例では、時間シフト量が最大値を持つデータ項目が代表データ項目に選ばれる。図10に示す例では、データ項目Bが代表データ項目に選ばれる。
本手法によれば、時間の前後関係も考慮するため、1つのデータ項目グループ内のデータ項目が、類似の波形を持つもののみで構成されている場合に、システム状態の変化の原因となったデータ項目を抽出できる。また、システム状態の変化の原因となったデータ項目を用いて回帰式を構築することで、予測値の算出において、システム状態の変化によるデータ項目値の変化と、データ項目固有のデータ項目値の変化とを分離できるため、センサ値の監視だけではシステムの状態変化に伴うデータ項目の値の変化に埋もれてしまうような障害の兆候によるデータ項目の値の変化を検出することができる。なお、データ項目グループ内のデータ項目を類似の波形を持つもののみで構成するためには、仮の相互相関モデルの回帰式において目的変数の過去値を含ませず、かつ回帰式の優良度の高い回帰式に用いられるデータ項目のみを用いて、グループ内のデータ項目を構成すればよい。
実施形態3.
次に、本発明の第3の実施形態について説明する。本実施形態は、分析モデルの相関モデルとして、多体相関モデルだけでなく、相互相関モデルを用いる点で上記の各実施形態と異なる。以下では、第1の実施形態の構成に、相互相関モデルを分析モデルとして利用する機能を追加する場合を例に示すが、当該機能は、第2の実施形態に追加されてもよい。以下では、第1の実施形態と同じ部分については同一の符号を付し、説明を省略する。
図11は、本実施形態のシステム分析装置300の構成例を示すブロック図である。図11に示すシステム分析装置300は、図1に示す第1の実施形態のシステム分析装置100の構成と比べて、分析モデル生成手段12が分析モデル生成手段32となっている点が異なる。
分析モデル生成手段32は、分析モデル候補生成手段321と、モデル抽出手段322とを含む。また、分析モデル候補生成手段321は、相互相関モデル生成手段3213と、データ項目分類手段1211と、多体相関モデル生成手段1212とを有する。このように、分析モデル生成手段32の分析モデル候補生成手段321が、さらに相互相関モデル生成手段3213を有する点が、第1の実施形態と異なる。なお、モデル抽出手段322の動作も第1の実施形態と異なる。
相互相関モデル生成手段3213は、分析モデルに含ませる相関モデルの候補となる相互相関モデルを生成する。
具体的には、相互相関モデル生成手段3213は、任意の2つのデータ項目に対するすべての組み合わせについて、任意の2つのデータ項目を含む回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、少なくとも、構築した回帰式と、該回帰式の予測誤差の許容範囲とを含む相互相関モデルを生成する。なお、相互相関モデル生成手段3213は、構築した回帰式と、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを含む相互相関モデルを生成してもよい。以下、相互相関モデル生成手段3213が生成する相互相関モデルを、分析用の相互相関モデルと呼ぶ場合がある。また、分析用の相互相関モデルの集合を分析用相互相関モデル群と呼ぶ場合がある。また、以下では、当該分析用相互相関モデル群と区別するために、第1の実施形態のデータ項目分類手段1211が生成する相互相関モデル群を、分類用相互相関モデル群と呼ぶ場合がある。
なお、データ項目分類手段1211では、任意の2つのデータ項目に対して、第1の仮の相互相関モデルと、第1の仮の相互相関モデルにおける目的変数データ項目と説明変数データ項目とを入れ替えた第2の仮の相互相関モデルのうち回帰式の優良度Fが高い方を選択することで、任意の2つのデータ項目に対して1つの回帰式を対応させた分類用相互相関モデル群を生成するが、相互相関モデル生成手段3213でも同様の選択処理を行う。すなわち、任意の2つのデータ項目に対して、目的変数データ項目と説明変数データ項目とが入れ替えられている2つの回帰式のうち優良度が高い方の1つの回帰式を対応させた分析用相互相関モデル群を生成する。
また、本実施形態のモデル抽出手段322は、第1の実施形態のモデル抽出手段122の機能に加えて、次の機能を有する。すなわち、モデル抽出手段322は、相互相関モデル生成手段3213によって生成された分析用相互相関モデル群の中から、所定の優良モデル条件を満たす相互相関モデルを分析用優良相互相関モデルとして抽出し、抽出された分析用優良相互相関モデル群を、分析モデルに含ませる相関モデルとする。したがって、本実施形態の分析モデルは、1つ以上の多体相関モデルに加えて、1つ以上の相互相関モデルを含みうる。
また、モデル抽出手段322は、抽出の結果、分析モデルに含ませる相関モデルとされた多体相関モデルおよび相互相関モデルの情報を、分析モデル情報として分析モデル記憶手段15に記憶する。
分析用相互相関モデルと分類用相互相関モデルとは、回帰式、回帰式の優良度の指標および優良モデル条件が同じであってもよいし、異なっていてもよい。また、分析用相互相関モデルと多体相関モデルとは、回帰式の予想誤差の許容範囲の算出方法、回帰式の優良度の指標および優良モデル条件が同じであってもよいし、異なっていてもよい。いずれの場合も、第1の実施形態で示したものを用いることができる。
なお、分析モデルに含まれる相互相関モデルに対するモデル破壊の検出方法は、多体相関モデルの場合と同様である。したがって、分析手段13のモデル破壊検出手段131は、新たな状態情報が収集されると、分析モデル記憶手段15に記憶されている分析モデル情報によって示される分析モデルに含まれる各相関モデルについて、第1の実施形態と同様の方法で、モデル破壊の発生有無を検出すればよい。
次に、本実施形態におけるシステム分析装置300の動作を説明する。図12は、本実施形態の分析モデル生成手段32の動作の一例を示すフローチャートである。なお、以下では、図9に示した動作と同一の動作については同一の符号を付し、説明を省略する。
図12に示すように、本実施形態のシステム分析装置300の分析モデル生成手段32では、はじめに、相互相関モデル生成手段3213が、分析モデルの生成に用いる所定期間についての状態系列情報を状態情報記憶手段14から取得し、その状態系列情報を用いて、分析用相互相関モデル群を生成する(ステップS301)。
次いで、モデル抽出手段322が、所定の優良モデル条件に基づいて、生成された分析用相互相関モデル群から、分析用優良相互相関モデルを抽出して、分析用優良相互相関モデル群を得る(ステップS302)。
次いで、第1の実施形態と同様の方法で、データ項目分類手段1211と多体相関モデル生成手段1212とが協働して多体相関モデル群を生成し(ステップS201〜S205)、モデル抽出手段322が、所定の優良モデル条件に基づいて、生成された多体相関モデル群から、優良多体相関モデルを抽出して、優良多体相関モデル群を得る(ステップS206)。
最後に、モデル抽出手段322は、ステップS302で得られた分析用優良相互相関モデル群と、ステップS206で得られた優良多体相関モデル群とを合わせたものを、分析モデルとして、分析モデル記憶手段15に分析モデル情報を記憶する(ステップS303)。
以上のように、本実施形態によれば、相互相関モデルをデータ項目をグループ分けするためだけに用いるのではなく、分析モデルの相関モデルとしても用いているため、分析対象とするデータ項目の範囲をより広くできる。
なお、分析用相互相関モデルと分類用相互相関モデルとで、同じ回帰式を用いる場合には、データ項目分類手段1211は、相互相関モデル生成手段3213が生成した分析用相互相関モデル群をそのまま、分類用相互相関モデル群として用いてもよい。また、優良相互相関モデル群の抽出に用いる優良モデル条件も同じものを用いる場合には、優良相互相関モデル群も共用できる。すなわち、分析用優良相互相関モデル群をそのまま、分類用優良相互相関モデル群として用いてもよい。そのような場合、図12中のステップS201〜S202の処理は省略される。
実施形態4.
次に、本発明の第4の実施形態について説明する。本実施形態は、異常要因を抽出する機能を含む点で上記の各実施形態と異なる。以下では、第3の実施形態の構成に、当該機能を追加した場合を例に示すが、当該機能は、第1の実施形態や第2の実施形態に追加されてもよい。以下では、第3の実施形態と同じ部分については同一の符号を付し、説明を省略する。
図13は、本実施形態のシステム分析装置400の構成例を示すブロック図である。図13に示すシステム分析装置400は、図11に示す第3の実施形態のシステム分析装置300の構成と比べて、分析手段13が分析手段43となっている点が異なる。
本実施形態の分析手段43は、モデル破壊検出手段131と、異常判定手段132と、異常要因抽出手段433と、モデル破壊記憶手段434とを含む。このように、分析手段43が、さらに異常要因抽出手段433と、モデル破壊記憶手段434とを含む点が第3の実施形態と異なる。
モデル破壊記憶手段434は、モデル破壊検出手段131により生成されるモデル破壊情報を記憶する。モデル破壊記憶手段434へのモデル破壊情報の登録処理は、例えば、異常判定手段132が、システム状態を異常と判定した場合に行ってもよい。このとき、システム状態が異常か正常かを判断するための警報条件には、第1の実施形態で示したものを用いることができる。
異常要因抽出手段433は、モデル破壊記憶手段434にモデル破壊情報が新たに追加されると、新たに追加されたモデル破壊情報から、データ項目ごとに異常の度合いを示す異常度を算出する。そして、異常度の高い方から少なくとも1つのデータ項目を抽出し、抽出されたデータ項目の各々を、異常要因の候補となるデータ項目である異常要因候補データ項目とし、その集合である異常要因候補データ項目群を、運用者や被監視システムに通知する。
異常要因候補データ項目群に含ませるデータ項目の個数、すなわち通知する異常要因候補データ項目の個数には、例えば、異常時に確認するデータ項目の数として、運用者が任意の数を設定できる。通知する異常要因候補データ項目の個数は、障害の原因を見つけられる可能性を高め、障害の全体の状況を把握するという観点からは、多いほど好ましく、誤報が発生したときの調査時間を短縮するという観点からは、少ないほど好ましい。
データ項目の異常度には、例えば、データ項目ごとに、分析モデルに含まれる相関モデルのうちモデル破壊が発生した相関モデルの回帰式に含まれるデータ項目の数を累積した値や、モデル破壊が発生した相関モデルの回帰式に含まれるデータ項目の数を累積した値とモデル破壊が発生しなかった相関モデルの回帰式に含まれるデータ項目の数を累積した値との比を用いることができる。
本実施形態におけるモデル破壊情報に必要な情報は、警報条件およびデータ項目の異常度の算出方法に依存する。例えば、警報条件が、モデル破壊の発生した相関モデルの数にかかわるものであれば、モデル破壊情報に、モデル破壊が発生した相関モデルの数を特定可能な情報を含ませればよい。また、データ項目の異常度の算出方法が、データ項目ごとにモデル破壊が発生した回帰式に含まれるデータ項目の数を累積した値を用いるものであれば、モデル破壊情報に、モデル破壊が発生した相関モデルの回帰式に用いたデータ項目を示す情報や、モデル破壊が発生した相関モデルを特定可能な情報を含ませればよい。また、データ項目の異常度の算出方法が、モデル破壊が発生した回帰式に含まれるデータ項目の数にかかわる値(累積値等)と、モデル破壊が発生しなかった回帰式に含まれるデータ項目の数にかかわる値(累積値等)とを用いるもの(例えば、これらの比等)であれば、モデル破壊情報に、モデル破壊が発生した回帰式とモデル破壊が発生しなかった回帰式とを特定可能な情報を含ませればよい。
次に、本実施形態のシステム分析装置400の動作を説明する。図14は、本実施形態のシステム分析装置400の動作の一例を示すフローチャートである。なお、以下では、図8に示した動作と同一の動作については同一の符号を付し、説明を省略する。
図14に示すように、本実施形態のシステム分析装置400では、ステップS107で、異常判定手段132がシステムの状態を異常と判定すると、その旨もしくはモデル破壊情報を運用者または被監視システムに通知するとともに、モデル破壊情報をモデル破壊記憶手段434に記憶する。
次いで、異常要因抽出手段433が、モデル破壊記憶手段434に新たに記憶されたモデル破壊情報に基づいて、1つ以上の異常要因候補データ項目を抽出し、抽出した異常要因候補データ項目群を示す情報を運用者または被監視システムに通知する(ステップS401)。
次に、本実施形態における異常要因候補データ項目群の抽出方法を、具体例を用いて説明する。以下では、データ項目の異常度を、分析モデルに含まれる相関モデルのうち、モデル破壊が発生した相関モデルの回帰式に含まれるデータ項目の数を累積した値と、モデル破壊が発生しなかった相関モデルの回帰式に含まれるデータ項目の数を累積した値との比とした場合を例に説明する。
図15は、異常要因候補データ項目群の抽出方法の一例を示す説明図である。本例において、システム分析装置400が用いる分析モデルには、7つの相関モデルが含まれる。分析モデルを構成する7つの相関モデルの回帰式は、それぞれ、B=f1(A,B),C=f2(A,C),B=f3(B,D),C=f4(C,D),G=f5(G,H),C=f10(A,B,C)およびC=f11(B,C,D)である。なお、図15の上段には、分析モデルに含まれる相関モデル群のグラフ構造(該相関モデル群に用いられるデータ項目の関係を模式的に示した構造図)が示されている。なお、当該グラフ構造では、共通データ項目に対応する結節点は図示省略されている。また、図中の「共通メトリック」は代表データ項目を表している。
今、データ項目Cに異常に伴う変化が発生し、分析モデルの相関モデルのうち、回帰式C=f4(C,D),C=f10(A,B,C),C=f11(B,C,D)を有する相関モデルに、モデル破壊が発生したとする。この場合、データ項目A,B,C,D,GおよびHの異常度は、それぞれ、1/3,2/4,3/4,2/3,0/1および0/1と算出される。各データ項目を、その異常度の降順で並べ替えると、C→D→B→A→{G、H}となる。本例では、この順で、異常要因の可能性が高いといえる。通知する異常要因候補データ項目の個数=2であったとすると、異常要因候補データ項目群を示す情報として、データ項目CおよびDを示す情報(例えば、それらのデータ項目名)が、運用者または被監視システムに通知される。
以上のように、本実施形態によれば、運用者または被監視システムが、システム分析装置400から通知された情報を基に、異常要因を絞り込むことができる。
なお、上記では、異常要因候補データ項目群を示す情報として、データ項目名を通知する例を示したが、データ項目名に加えて異常度も通知するようにした方が、確認すべきデータ項目に対して優先度を与えられるので、好ましい。
図16は、本発明によるシステム分析装置の主要部を示すブロック図である。図16に示すように、本発明によるシステム分析装置は、主要な構成として、分析モデル生成手段51を備える。
分析モデル生成手段51(例えば、分析モデル生成手段12、分析モデル生成手段32)は、対象システムの複数種のデータ項目に関する情報の集合である状態情報を用いて、対象システムの状態を分析するための分析モデルを生成する手段であって、データ項目分類手段511と、多体相関モデル生成手段512と、モデル抽出手段513とを含む。
図16に示す構成において、分析モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを少なくとも有する相関モデルである多体相関モデルを1つ以上含む。
データ項目分類手段511(例えば、データ項目分類手段1211)は、状態情報に含まれるデータ項目群を1つ以上のグループに分類する。より具体的には、データ項目分類手段511は、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、データ項目を分類する。
多体相関モデル生成手段512(例えば、多体相関モデル生成手段1212)は、データ項目分類手段511によって分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出し、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する。
モデル抽出手段513(例えば、モデル抽出手段122)は、多体相関モデル生成手段512によって生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出する。
このような構成を備えることによって、多重共線性の問題を回避しつつ、データ項目固有の変動に注目して予測誤差を算出できる多体相関モデルを含む分析モデルを生成できるので、そのような分析モデルを用いてシステムの状態を分析することにより、対象システムが複雑であったり、データ項目間に多重共線性があったりしても、精度よく対象システムの状態を分析できる。
また、図17は、本発明によるシステム分析装置の他の構成例を示すブロック図である。本発明によるシステム分析装置は、例えば、図17に示すような構成であってもよい。図17に示すシステム分析装置は、上述した分析モデル生成手段51に加えて、分析モデル記憶手段52と、分析手段53とを備えている。
分析モデル記憶手段52(例えば、分析モデル記憶手段15)は、分析モデル生成手段51によって生成された分析モデルの情報を記憶する。
分析手段53(例えば、分析手段13、分析手段43)は、状態情報が新たに取得されると、前記分析モデル記憶手段に記憶された前記分析モデルを用いて、システムの状態を分析する手段であって、モデル破壊検出手段531と、異常判定手段532とを含む。
モデル破壊検出手段531(例えば、モデル破壊検出手段131)は、新たに収集された前記状態情報を用いて、前記分析モデル記憶手段に記憶されている分析モデルの情報により示される分析モデルに含まれる各相関モデルについて、当該相関モデルの回帰式の目的変数の予測値が、当該相関モデルの回帰式の予測誤差の許容範囲を超える現象であるモデル破壊の発生の有無を検出する。
異常判定手段532(例えば、異常判定手段132)は、モデル破壊検出手段531による検出結果に基づいて、システムの状態が異常か正常かを判定する。
このような構成を有することによって、対象システムが複雑であったり、データ項目間に多重共線性があったりしても、精度よく対象システムの状態を分析できる。
また、上記の実施形態の一部または全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)対象システムの複数種のデータ項目に関する情報の集合である状態情報を用いて、対象システムの状態を分析するための分析モデルを生成する分析モデル生成手段を備え、分析モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを少なくとも有する相関モデルである多体相関モデルを1つ以上含み、分析モデル生成手段は、状態情報に含まれるデータ項目群を1つ以上のグループに分類するデータ項目分類手段と、データ項目分類手段によって分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出し、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する多体相関モデル生成手段と、多体相関モデル生成手段によって生成された多体相関モデル群の中から、回帰式の優良度が予め定められている多体相関モデルの優良モデル条件を満たす多体相関モデルを、分析モデルに含ませる多体相関モデルとして抽出するモデル抽出手段とを含み、データ項目分類手段は、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、データ項目を分類することを特徴とする分析モデル生成装置。
(付記2)コンピュータに、対象システムの複数種のデータ項目に関する情報の集合である状態情報に含まれるデータ項目群を、分類後の少なくとも1つのグループにおいて、当該グループに含まれるデータ項目から任意に選択された1つのデータ項目である第1データ項目と、該第1データ項目を除く該第1データ項目と同一のグループに含まれるデータ項目の1つである第2データ項目とを用いて構築される回帰式の優良度を、第1データ項目に対して取りうる第2データ項目の全ての組み合わせについて算出したとき、該回帰式の優良度の少なくとも1つが、所定の優良モデル条件を満たすように、1つ以上のグループに分類するデータ項目分類処理、および状態情報を用いて、分類されたグループごとに、該グループに含まれるデータ項目の中から、少なくとも1つの代表データ項目を選出し、選出した代表データ項目を除く該グループに含まれるデータ項目のうちの任意の2つのデータ項目に対する全ての組み合わせについて、当該2つのデータ項目と、代表データ項目とを用いて構成される回帰式を構築するとともに、該回帰式の予測誤差の許容範囲と、該回帰式の優良度とを算出して、構築した回帰式と、該回帰式の予測誤差の許容範囲とを少なくとも有する多体相関モデルを生成する多体相関モデル生成処理を実行させるための分析モデル生成プログラム。
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記の実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2014年3月27日に出願された日本特許出願2014−065120を基礎とする優先権を主張し、その開示の全てをここに取り込む。