JPWO2016088362A1 - システム分析装置、システム分析方法および記憶媒体 - Google Patents

システム分析装置、システム分析方法および記憶媒体 Download PDF

Info

Publication number
JPWO2016088362A1
JPWO2016088362A1 JP2016562301A JP2016562301A JPWO2016088362A1 JP WO2016088362 A1 JPWO2016088362 A1 JP WO2016088362A1 JP 2016562301 A JP2016562301 A JP 2016562301A JP 2016562301 A JP2016562301 A JP 2016562301A JP WO2016088362 A1 JPWO2016088362 A1 JP WO2016088362A1
Authority
JP
Japan
Prior art keywords
model
data item
body correlation
destruction
abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016562301A
Other languages
English (en)
Other versions
JP6658540B2 (ja
Inventor
昌尚 棗田
昌尚 棗田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2016088362A1 publication Critical patent/JPWO2016088362A1/ja
Application granted granted Critical
Publication of JP6658540B2 publication Critical patent/JP6658540B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D9/00Recording measured values
    • G01D9/005Solid-state data loggers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D9/00Recording measured values
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/024Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本発明は、異常によるセンサ値の変化が僅かでその変化が複数センサに現れたとしても、異常要因特定に有用な情報を的確に抽出する。分析モデル取得部11は、1以上の多体相関モデルを含む分析モデルを取得する。標準寄与率取得部12は、各多体相関モデルについて各説明変数データ項目の標準寄与率を取得する。状態情報収集部13は、状態情報を収集する。モデル破壊検出部14は、各多体相関モデルのモデル破壊を検出する。再予測値算出部151は、モデル破壊した各多体相関モデルについて説明変数データ項目毎に再予測値を算出する。部分異常度算出部152は、各再予測値によるモデル破壊の発生有無に基づいて多体相関モデル毎にデータ項目別の部分異常度を算出する。異常統計値算出部153は、部分異常度をデータ項目別に集計して異常統計値を算出する。異常要因抽出部15は、異常統計値に基づき異常要因候補のデータ項目を抽出する。

Description

本発明は、システムの状態を分析するシステム分析装置、システム分析方法およびシステム分析プログラムに関する。
システムの構成要素から得られるセンサ値に基づいて、システムの状態を分析する処理を実行するシステム分析装置が利用されている。
例えば、特許文献1には、被監視装置の複数種目の性能値の実測データに基づいて、異常の検出能力が高い相関モデルを生成する技術が記載されている。
また、特許文献2には、移動機から送信されたデータに基づいて、所定の事象の評価や予測を行う相関モデルを抽出する技術が記載されている。
また、特許文献3には、製造物の製造工程において測定される複数の特性値の測定データに基づいて、測定項目間の階層的な関係を自動的に可視化する技術が記載されている。
このような分析処理は、システムを安全かつ効率的に運用する目的で行われる。その分析処理のひとつに、センサ値を多変量解析することにより、システムの状態が正常か異常かを判定する処理がある。このような分析処理は、システムの状態が異常であると判定した場合に、異常要因特定に有用な情報を、運用者やシステムに通知する。異常要因特定に有用な情報として、例えば、異常の影響が表れているセンサを通知するだけでも、異常要因特定の初動を早めることに有効である。
ここで、システムは、例えば、ICT(Information and Communication Technology)システム、化学プラント、発電所、動力設備等、相互に影響を及ぼしあう要素から構成される、まとまりや仕組みである。
また、センサ値は、システムの構成要素から得られる各種の値である。例えば、センサ値は、システムの構成要素に設けられたセンサを通して取得される計測値である。そのような計測値としては、弁の開度、液面高さ、温度、流量、圧力、電流、電圧等がある。また、例えば、センサ値は、そのような計測値を用いて算出される予測値である。また、例えば、センサ値は、システムを所望の稼働状態に変更するために情報処理装置によって発せられる制御信号である。以下、システムの構成要素から得られる各種の値を、その種別を区別することなく、単にセンサ値と呼ぶ。
特に、障害の発生が経済や人命等へ及ぼす影響が大きいシステムでは、そのシステムで過去に発生していない異常について、その要因特定に有用な情報を通知する機能が重要となる。これは、システム障害の影響が大きければ大きいほど、障害の発生を未然に防ぐ対策が施されるため、発生する異常が、そのシステム分析装置にとって未知の異常となる可能性が高くなるためである。
過去に同様の異常が発生していることを前提とせずに、異常要因特定に有用な情報を通知するシステム分析技術の一例が、特許文献4〜特許文献7に記載されている。
特許文献4に記載の関連技術は、複数の回帰式を用いてシステムを分析する。そして、この関連技術は、各回帰式について、該回帰式について設定された閾値を予測誤差が超えたか否かを判断する。そして、この関連技術は、予測誤差が閾値を超えた回帰式を、予測誤差の大きい順に、異常発生原因の候補として出力する。
また、特許文献5に記載の関連技術は、マハラノビス・タグチメソッドを用いてシステムを分析する。そして、この関連技術は、マハラノビス距離への各データ項目の貢献度を、異常度として出力する。
また、特許文献6に記載の関連技術は、主成分分析を用いてシステムを分析する。そして、この関連技術は、Q統計量またはホテリングT2分散への各データ項目の寄与度を、異常度として出力する。
また、特許文献7に記載の関連技術は、複数の製造装置からなる製造システムにおけるプロセスの異常を検出する。この関連技術は、プロセス実行時に得られるプロセスデータの特徴量から、そのプロセスに適用する異常検出要因分析ルールを特定する。そして、この関連技術は、その異常検出要因分析ルールにより求まる予測値が異常を示す場合、その異常に対する各データ項目の寄与度と共に、異常発生を通知する。
なお、ここでは、「データ項目」とは、システムの構成要素から得られる複数種のセンサ値の各種目に対応する情報である。例えば、「データ項目」とは、その種目に対応するセンサ値の集合を表すものであってもよい。また、例えば、「データ項目」とは、対応するセンサ値を識別する識別情報を表すものであってもよい。
国際公開第2014/132612号 特開2012−226390号公報 特開2011−150496号公報 特許第5108116号公報 特開2007−213194号公報 特許第4468269号公報 特開2009−54843号公報
ここで、システム停止や事故を回避するためには、障害が発生する兆候となるシステムの状態異常をできる限り早く発見し、異常要因を特定する必要がある。このとき、異常の影響は、複数のセンサ値に現れる可能性が高い。これは、システムを構成する機器などの要素が、情報処理や、化学製品の生産、エネルギー変換等のシステムの目的を達成するために、他の要素と連動して動作するからである。そのため、システムの構成要素から得られるセンサ値も同様に、他のセンサ値と連動して変化するためである。
つまり、システム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出できる必要がある。
ここで、特許文献4に記載された関連技術は、異常要因特定に有用な情報として、予測誤差が閾値を超えた回帰式を予測誤差の大きい順に並べた結果を提供する。しかし、回帰式に含まれるデータ項目に、ひとつでも異常と関係ないものが含まれている場合、提供される結果には、異常と関係ないデータ項目が、異常と関係あるデータ項目として含まれることになる。これは、回帰式に含まれるデータ項目の数や、予測誤差が閾値を超えた回帰式の数が多くなるにしたがって、異常の影響を受けているデータ項目の特定を難しくする原因となる。なお、特許文献4には、グラフィカルモデリングや相互相関関数による絞り込み処理に関する記載がある。しかしながら、これらの処理は、正常と異常とを区別せずに、現象の伝搬方向を示すものである。したがって、これらの処理は、異常の影響を受けているデータ項目の絞り込みに直接寄与しない。
また、特許文献5〜6に記載された関連技術は、全てのデータ項目を含む1つのモデルでシステムを監視する。また、特許文献7に記載された関連技術は、1つのプロセスについて適用可能な1つのルールでそのプロセスの異常を検知する。このため、これら特許文献5〜7に記載された関連技術は、最もセンサノイズの大きなデータ項目によって、異常検知感度が制限される。その結果、この関連技術は、複数のセンサに異常の影響が現れたとしても、異常の影響が現れたセンサを全て抽出できないことがある。
また、特許文献1〜3には、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れた場合に、異常要因を特定する技術については記載がない。
本発明は、上述の課題を解決するためになされたものである。すなわち、本発明は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出できるシステム分析技術を提供することを目的とする。
上記目的を達成するために、本発明のシステム分析装置は、被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを1つ以上含む分析モデルを取得する分析モデル取得手段と、前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得する標準寄与率取得手段と、前記状態情報を収集する状態情報収集手段と、収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出するモデル破壊検出手段と、前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出する再予測値算出手段と、前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出する部分異常度算出手段と、前記部分異常度を前記データ項目別に集計して異常統計値を算出する異常統計値算出手段と、前記再予測値算出手段、前記部分異常度算出手段および前記異常統計値算出手段を用いて、前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する異常要因抽出手段と、を備える。
また、本発明のシステム分析方法は、コンピュータ装置が、被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを1つ以上含む分析モデルを取得し、前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得し、前記状態情報を収集し、収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出し、前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出し、前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出し、前記部分異常度を前記データ項目別に集計して異常統計値を算出し、前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する。
また、本発明の記憶媒体は、被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを1つ以上含む分析モデルを取得する分析モデル取得ステップと、前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得する標準寄与率取得ステップと、前記状態情報を収集する状態情報収集ステップと、収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出するモデル破壊検出ステップと、前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出する再予測値算出ステップと、前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出する部分異常度算出ステップと、前記部分異常度を前記データ項目別に集計して異常統計値を算出する異常統計値算出ステップと、前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する異常要因抽出ステップと、をコンピュータ装置に実行させるシステム分析プログラムを記憶している。
本発明は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出できるシステム分析技術を提供することができる。
本発明の第1の実施の形態としてのシステム分析装置の機能ブロック図である。 本発明の第1の実施の形態としてのシステム分析装置のハードウェア構成の一例を示す図である。 本発明の第1の実施の形態としてのシステム分析装置の動作の概略を説明するフローチャートである。 本発明の第1の実施の形態としてのシステム分析装置の異常要因抽出動作の詳細を説明するフローチャートである。 本発明の第2の実施の形態としてのシステム分析装置の機能ブロック図である。 本発明の第2の実施の形態としてのシステム分析装置の動作の概略を説明するフローチャートである。 本発明の第2の実施の形態としてのシステム分析装置の分析モデル生成動作の詳細を説明するフローチャートである。 本発明の第2の実施の形態としてのシステム分析装置の異常要因抽出動作の詳細を説明するフローチャートである。 本発明の第2の実施の形態における分析モデル生成動作の具体例を説明する図である。 本発明の第2の実施の形態における異常要因抽出動作の具体例を説明する図である。 本発明の第3の実施の形態としてのシステム分析装置の機能ブロック図である。 本発明の第3の実施の形態としてのシステム分析装置の分析モデル生成動作の詳細を説明するフローチャートである。 本発明の第4の実施の形態としてのシステム分析装置の機能ブロック図である。 本発明の第4の実施の形態としてのシステム分析装置の異常要因抽出動作の詳細を説明するフローチャートである。 本発明の第5の実施の形態としてのシステム分析装置の機能ブロック図である。 本発明の第5の実施の形態としてのシステム分析装置の分析モデル生成動作の詳細を説明するフローチャートである。 本発明の第6の実施の形態としてのシステム分析装置の機能ブロック図である。 本発明の第6の実施の形態としてのシステム分析装置の分析モデル生成動作の詳細を説明するフローチャートである。 本発明の第7の実施の形態としてのシステム分析装置の機能ブロック図である。 本発明の第7の実施の形態としてのシステム分析装置の動作の概略を説明するフローチャートである。 本発明の第7の実施の形態としてのシステム分析装置の再生成優良多体相関モデル群のモデル情報およびモデル破壊情報の生成動作の詳細を説明するフローチャートである。 本発明の第8の実施の形態としてのシステム分析装置の機能ブロック図である。 本発明の第8の実施の形態としてのシステム分析装置の異常要因抽出動作の詳細を説明するフローチャートである。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(第1の実施の形態)
本発明の第1の実施の形態としてのシステム分析装置1の機能ブロック構成を図1に示す。図1において、システム分析装置1は、分析モデル取得部11と、標準寄与率取得部12と、状態情報収集部13と、モデル破壊検出部14と、異常要因抽出部15とを備える。また、異常要因抽出部15は、再予測値算出部151と、部分異常度算出部152と、異常統計値算出部153とを有する。また、システム分析装置1は、被監視システム9に接続される。
システム分析装置1は、被監視システム9を分析することにより、被監視システム9の異常要因を出力する装置である。なお、図1において、破線の矩形は、当該破線で囲まれた各機能ブロックが、分析モデル取得部11、標準寄与率取得部12および状態情報収集部13によって取得された情報を用いて動作することを表している。なお、図1において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。
被監視システム9は、システム分析装置1によって監視されるシステムである。被監視システム9は、1つ以上の被監視装置90を含む。例えば、被監視システム9の一例としては、発電プラントシステムが挙げられる。この場合、被監視装置90は、例えば、タービン、給水加熱器、復水器などである。また、被監視装置90には、例えば、配管や信号線など、装置間を接続する要素が含まれていてもよい。また、被監視システム9は、上述の発電プラントシステムのようにシステム全体であってもよいし、あるシステムにおいてその一部の機能を実現する部分であってもよい。
被監視装置90の各々は、自装置で得られるセンサ値を所定タイミング毎に計測し、システム分析装置1に送信する。以下では、通常の計測機器のようにハードウェアとしての実態があるものだけではなく、ソフトセンサや、制御信号等もセンサと呼ぶこととする。センサ値は、センサから得られる値である。センサ値の例としては、弁の開度、液面高さ、温度、流量、圧力、電流、電圧等、設備に設置された計測機器によって計測される計測値が挙げられる。また、センサ値の他の例としては、該計測値から算出される予測値が挙げられる。また、センサ値の他の例としては、制御信号の値が挙げられる。以下では、各センサ値は、整数や小数といった数値で表されるものとする。
また、本実施の形態では、各被監視装置90から得られるセンサ値に対応するセンサごとに、1つのデータ項目を割り当てるものとする。また、各被監視装置90から同一と見なされるタイミングで収集されたセンサ値の集合を、状態情報と呼ぶ。また、状態情報に含まれるセンサ値に対応するデータ項目の集合を、データ項目群と呼ぶ。つまり、状態情報は、複数のデータ項目によって構成される。ここで、「同一と見なされるタイミングで収集される」とは、各被監視装置90で同一時刻または所定範囲内の時刻に計測されることであってもよい。また、「同一と見なされるタイミングで収集される」とは、システム分析装置1による一連の収集処理によって収集されることであってもよい。なお、被監視装置90とシステム分析装置1との間に、被監視装置90が取得したセンサ値を記憶する記憶装置(図示せず)が設けられていてもよい。そのような記憶装置とは、例えば、データサーバ、DCS(Distributed Control System)、または、プロセスコンピュータ等であってもよい。そのような場合には、被監視装置90は、任意のタイミングでセンサ値を取得して記憶装置に記憶させる。そして、システム分析装置1は、記憶装置に記憶されているセンサ値を所定タイミングで読み出せばよい。
ここで、システム分析装置1は、図2に示すようなハードウェア要素を含むコンピュータ装置によって構成可能である。図2において、システム分析装置1は、CPU(Central Processing Unit)1001、メモリ1002、出力装置1003、入力装置1004、および、ネットワークインタフェース1005を含む。メモリ1002は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置(ハードディスク等)等によって構成される。出力装置1003は、ディスプレイ装置やプリンタ等のように、情報を出力する装置によって構成される。入力装置1004は、キーボードやマウス等のように、ユーザ操作の入力を受け付ける装置によって構成される。ネットワークインタフェース1005は、ネットワークに接続するインタフェースである。この場合、システム分析装置1の各機能ブロックは、メモリ1002に格納されるコンピュータ・プログラムを読み込んで実行するとともに出力装置1003、入力装置1004、ネットワークインタフェース1005を制御するCPU1001によって構成される。なお、システム分析装置1およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
次に、システム分析装置1の各機能ブロックの詳細について説明する。
分析モデル取得部11は、被監視システム9の分析モデルを取得する。分析モデルは、被監視システム9の状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを、1つ以上含むモデルである。ここで、相関モデルとは、データ項目間の関係を定義した回帰式と、該回帰式の予測誤差の許容範囲とを含む情報をいうものとする。また、多体相関モデルとは、そのような相関モデルのうち、3つ以上のデータ項目を用いて構成される回帰式を含む相関モデルをいうものとする。また、そのような分析モデルは、被監視システム9について得られた状態情報の時系列に基づき生成されたものであってもよい。
例えば、分析モデル取得部11は、メモリ1002に記憶された分析モデルを取得してもよい。また、分析モデル取得部11は、入力装置1004、ネットワークインタフェース1005、または、可搬型記録媒体等を介して、外部から入力される分析モデルを取得してもよい。
標準寄与率取得部12は、各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数として含まれる各データ項目が寄与する割合(標準寄与率)を取得する。例えば、標準寄与率は、分析モデルの生成に用いられた状態情報の時系列を用いてあらかじめ算出されたものであってもよい。なお、以降では、回帰式に説明変数として含まれるデータ項目を、説明変数データ項目とも記載する。また、回帰式に目的変数として含まれるデータ項目を、目的変数データ項目とも記載する。
例えば、標準寄与率取得部12は、各多体相関モデルについて、各説明変数データ項目の標準寄与率として、メモリ1002に記憶された情報を取得してもよい。また、標準寄与率取得部12は、入力装置1004、ネットワークインタフェース1005、または、可搬型記録媒体等を介して、外部から入力される標準寄与率を取得してもよい。
状態情報収集部13は、被監視システム9から状態情報を収集する。
モデル破壊検出部14は、収集された状態情報に対して分析モデルを適用することにより、各多体相関モデルにモデル破壊が発生したか否かを検出する。具体的には、モデル破壊検出部14は、収集された状態情報を構成するデータ項目のセンサ値を、分析モデルに含まれる各多体相関モデルの回帰式に適用する。ここで、状態情報の適用により多体相関モデルにモデル破壊が発生する場合がある。モデル破壊とは、その回帰式の予測値および実測値の差(予測誤差)が、その許容範囲を超える現象をいう。モデル破壊検出部14は、各多体相関モデルについて、状態情報の適用によりこのようなモデル破壊が発生したか否かを検出する。
異常要因抽出部15は、後述の再予測値算出部151と、後述の部分異常度算出部152と、後述の異常統計値算出部153とを用いて、データ項目別の異常統計値を算出する。また、異常要因抽出部15は、データ項目別の異常統計値に基づいて、被監視システム9の異常要因の候補となるデータ項目を抽出する。そして、異常要因抽出部15は、抽出したデータ項目を表す情報を通知する。例えば、異常要因抽出部15は、異常要因の候補となるデータ項目の名称を、出力装置1003等に出力してもよい。
ここで、異常要因の候補として抽出・通知するデータ項目の個数は、異常時に確認することが好ましいデータ項目の数として、運用者によって任意の数が設定されていてもよい。なお、障害の原因を見つけられる可能性を高め、障害全体の状況を把握するという観点からは、異常要因候補として抽出・通知するデータ項目の個数は、多いほど好ましい。また、誤報が発生したときの調査時間を短縮するという観点からは、抽出・通知するデータ項目の個数は、少ないほど好ましい。
再予測値算出部151は、モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、再予測値を算出する。再予測値の算出は、当該データ項目の状態情報および標準寄与率に基づいて行われる。ここで、再予測値により該当する多体相関モデルにモデル破壊が発生する場合と、発生しない場合とがある。
部分異常度算出部152は、各再予測値により多体相関モデルにモデル破壊が発生したか否かに基づいて、多体相関モデルごとにデータ項目別の異常度(部分異常度)を算出する。
例えば、この回帰式において、全ての説明変数データ項目による再予測値についてモデル破壊が発生したとする。この場合、部分異常度算出部152は、目的変数データ項目の部分異常度を、この回帰式における他のデータ項目の部分異常度より高くなるように算出してもよい。また、例えば、この回帰式において、少なくとも1つの再予測値ではモデル破壊が発生せず、少なくとも1つの再予測値ではモデル破壊が発生したとする。この場合、部分異常度算出部152は、再予測値によるモデル破壊を発生させた説明変数データ項目の部分異常度を、この回帰式における他のデータ項目の部分異常度より高くなるように算出してもよい。
異常統計値算出部153は、部分異常度をデータ項目別に集計して異常統計値を算出する。
以上のように構成されたシステム分析装置1の動作について、図面を参照して説明する。まず、システム分析装置1の動作の概略を図3に示す。なお、以下では、被監視システム9の分析モデルは、分析モデル取得部11によってあらかじめ取得されているものとする。また、その分析モデルに含まれる各多体相関モデルについて、その回帰式に含まれる各説明変数データ項目の標準寄与率は、標準寄与率取得部12によってあらかじめ取得されているものとする。
図3では、まず、状態情報収集部13は、被監視システム9から状態情報を収集する(ステップS1)。
次に、モデル破壊検出部14は、収集された状態情報を用いて、分析モデルに含まれる各多体相関モデルにモデル破壊が発生したか否かを検出する(ステップS2)。
モデル破壊の発生が検出された場合、異常要因抽出部15は、モデル破壊の発生状況に基づいて、異常要因の候補となるデータ項目を抽出し、出力する(ステップS3)。このステップの詳細については後述する。
以上の動作を、システム分析装置1は、運用終了まで(ステップS4でYes)継続する。
なお、ステップS4において、システム分析装置1は、入力装置1004からの入力に基づいて、運用終了するか否かの判断を行ってもよい。あるいは、システム分析装置1は、あらかじめ定められたタイミングであるか否かに基づいて、判断を行ってもよい。あるいは、システム分析装置1は、被監視システム9から得られる各種情報があらかじめ定められた条件を満たすか否かに基づいて、判断を行ってもよい。また、これに限らず、システム分析装置1は、ステップS4における判断処理を、その他の方法により行ってもよい。
次に、ステップS3における異常要因抽出動作の詳細を、図4に示す。
図4では、まず、システム分析装置1は、モデル破壊が発生した多体相関モデルごとに、ステップS11〜S13の動作を繰り返す。
ここでは、まず、再予測値算出部151は、この多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、再予測値を算出する(ステップS11)。再予測値の算出には、モデル破壊が発生した際に用いられた当該データ項目の状態情報と、当該データ項目の標準寄与率とが用いられる。
次に、部分異常度算出部152は、各再予測値について、再予測値でもこの多体相関モデルにモデル破壊が発生するか否かを評価する(ステップS12)。
具体的には、部分異常度算出部152は、各説明変数データ項目による再予測値と、モデル破壊が発生した際に用いられた状態情報における目的変数データ項目に対応するセンサ値との差が、その多体相関モデルの予測誤差の許容範囲内かどうか評価すればよい。
次に、部分異常度算出部152は、この多体相関モデルの回帰式において、各再予測値によるモデル破壊の発生状況に基づいて、目的変数データ項目の部分異常度と、説明変数データ項目の部分異常度とを算出する(ステップS13)。
モデル破壊が発生した全ての多体相関モデルの回帰式ごとにデータ項目別の部分異常度の算出を完了すると、異常統計値算出部153は、次のステップを実行する。すなわち、異常統計値算出部153は、各多体相関モデルの回帰式において算出した各データ項目の部分異常度を、全ての回帰式にわたってデータ項目別に集計する。そして、異常統計値算出部153は、集計により算出した統計値を、異常統計値とする(ステップS14)。
次に、異常要因抽出部15は、異常統計値に基づいて、被監視システム9の異常要因の候補となるデータ項目を抽出し、出力する(ステップS15)。例えば、異常要因抽出部15は、異常統計値の高い順に所定数までのデータ項目を出力してもよい。
以上で、システム分析装置1は、異常要因抽出動作を終了する。
次に、本発明の第1の実施の形態の効果について述べる。
本発明の第1の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出することができる。
その理由について説明する。
1つ目の理由は、本実施の形態では、分析モデルとして、被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを1つ以上含む分析モデルを用いるからである。このような分析モデルを用いることにより、本実施の形態は、多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、多体相関モデルのモデル破壊を再評価できる。その結果、本実施の形態は、どのデータ項目が異常なのかを、多体相関モデルの回帰式ごとに評価でき、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目を適切に切り分けることができる。このようにして、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。
2つ目の理由は、上述のような分析モデルは、1種類の目的変数に対して複数個の回帰式(多体相関モデル)を含み得るためである。このような分析モデルを用いることにより、本実施の形態は、異常検知精度を低下させるデータ項目がある場合にも対応可能となる。例えば、センサ値に含まれるセンサノイズが大きいデータ項目は、異常検知精度を低下させる。ここで、分析モデルに、あるデータ項目を目的変数として、異常検知精度を低下させるデータ項目が説明変数として含まれる回帰式が含まれるとする。このような場合でも、本実施の形態の分析モデルは、同じデータ項目を目的変数として、異常検知精度を低下させるデータ項目が説明変数として含まれない回帰式を含み得る。その結果、本実施の形態は、異常検知精度を低下させるデータ項目が回帰式に含まれることによる異常検知漏れを防ぐことができる。換言すると、分析モデルにおいて、1種類の目的変数に対する回帰式が1つに限られないため、本実施の形態は、異常によるセンサ値の変化が僅かであったとしても、異常検知漏れを防ぐことができる。さらに、1種類の目的変数に対する回帰式が1つに限られないため、ある回帰式が、その回帰式における目的変数としてのデータ項目が異常の影響を受けているかどうかの判断結果に寄与する割合が小さくなる。したがって、異常検知精度を低下させるデータ項目と同様に、異常要因の特定精度を低下させるデータ項目があったとしても、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目とを適切に切り分けることができる。このようにして、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。
3つ目の理由は、本実施の形態では、個々の回帰式における個々の説明変数データ項目について、標準寄与率を用いた再予測値に基づき部分異常度を算出し、さらに、部分異常度をデータ項目別に集計して異常統計値を算出するからである。このように、本実施の形態は、どのデータ項目が異常である可能性が高いかを多体相関モデルの回帰式ごとに評価した部分異常度を、さらに複数の多体相関モデルにわたって集計した異常統計値を用いる。その結果、本実施の形態は、回帰式単位で異常を検出する関連技術や、データ項目全体を1つのモデルに含めて監視する関連技術に比べて、異常要因の候補となるデータ項目をより精度よく抽出できる。
(第2の実施の形態)
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第2の実施の形態としてのシステム分析装置2の機能ブロック構成を図5に示す。図5において、システム分析装置2は、分析モデル取得部21と、標準寄与率取得部22と、状態情報収集部23と、モデル破壊検出部24と、異常要因抽出部25と、異常判定部29とを備える。また、分析モデル取得部21は、多体相関モデル生成部211およびモデル抽出部212を有する。また、異常要因抽出部25は、再予測値算出部251と、部分異常度算出部252と、異常統計値算出部253とを有する。また、システム分析装置2は、分析モデル記憶部201と、状態情報記憶部203と、モデル破壊情報記憶部204とを含む。なお、分析モデル記憶部201は、本発明の分析モデル取得部の一部の一実施形態を構成する。また、状態情報記憶部203は、本発明の状態情報収集部の一部の一実施形態を構成する。また、モデル破壊情報記憶部204は、本発明のモデル破壊検出部の一部の一実施形態を構成する。また、システム分析装置2は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図5において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置2およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置2およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
システム分析装置2は、被監視システム9の状態情報を所定タイミングで取得しながら、被監視システム9の分析モデルを構築し、構築した分析モデルを用いて被監視システム9の状態を分析する装置である。
状態情報収集部23は、被監視システム9の状態情報を所定タイミングで収集し、状態情報記憶部203に保存する。以下、状態情報の時系列データを、状態系列情報とも記載する。
状態情報記憶部203は、状態情報収集部23が収集した状態情報を時系列に沿って記憶する。換言すると、状態情報記憶部203は、状態情報収集部23によって収集された状態情報を、状態系列情報として記憶する。状態情報記憶部203は、例えば、収集時間を示す情報と、状態情報とを対応づけて記憶してもよい。状態情報は、より具体的には、収集されたセンサ値の集合である。例えば、状態情報は、収集対象とされたセンサ値が所定の順序で並んだ情報であってもよい。状態情報記憶部203は、少なくとも所定期間分の状態系列情報を記憶するための記憶領域を有する。
分析モデル取得部21は、多体相関モデル生成部211およびモデル抽出部212を用いて、状態情報記憶部203に記憶されている所定期間分の状態系列情報に基づいて、被監視システム9の分析モデルを生成する。分析モデル取得部21に含まれるこれらの各機能ブロックの詳細については後述する。生成される分析モデルは、1つ以上の多体相関モデルを含む。各多体相関モデルは、3つ以上のデータ項目を用いて構成される回帰式と、当該回帰式の予測誤差の許容範囲とを含む。換言すると、分析モデルは、1つ以上の多体相関モデルの集合である。また、分析モデル取得部21は、生成した分析モデルを、分析モデル記憶部201に保存する。
ここで、分析モデル取得部21によって分析モデルの生成に用いられる状態系列情報の所定期間としては、被監視システム9において障害が発生していない任意の期間が、運用者によって設定される。当該所定期間は、異常検知の感度を高めるという観点からは、被監視システム9の経年的な変化による影響を受けないように、できるだけ短い期間とすることが好ましい。例えば、被監視システム9のメンテナンスサイクルが1年だとすると、当該所定期間を、それより十分短い、1か月、1週間、1日などの期間としてもよい。なお、このとき、当該所定期間に、通常起こりうるシステムの状態変化の要因の中で、最も多くのセンサ値に大きな変化をもたらす要因によるセンサ値への影響が含まれることが好ましい。一方、当該所定期間は、被監視システム9の状態変化による誤検知を減らすという観点からは、主要な内的または外的要因によるセンサ値の変化を網羅的に含むように、できるだけ長い期間を用いることが好ましい。例えば、被監視システム9が季節の影響を強く受ける場合は、当該所定期間を、9か月、1年などの期間としてもよい。
分析モデル記憶部201は、分析モデル取得部21によって生成された分析モデルを表す分析モデル情報を記憶する。分析モデル情報は、例えば、分析モデルに含まれる各多体相関モデルについてのモデル情報の集合であってもよい。モデル情報は、例えば、当該多体相関モデルの識別子と、当該多体相関モデルの回帰式の情報と、該回帰式の予測誤差の許容範囲を示す情報とを含んでいてもよい。回帰式の情報は、例えば、目的変数に用いられるデータ項目の情報、説明変数に用いられるデータ項目の情報、およびデータ項目間の関係式の情報等を含んでいてもよい。また、モデル情報は、さらに回帰式の優良さを表す指標(優良度)を含んでいてもよい。
なお、モデル情報に含まれる必要がある情報は、後述の警報条件や、データ項目の異常度の算出方法等に依存する。ここで、警報条件とは、後述の異常判定部29により異常が通知される際の条件(警報条件)である。また、データ項目の異常度とは、後述の部分異常度算出部252により算出される部分異常度や、後述の異常統計値算出部253により算出される異常統計値などをいう。例えば、警報条件または異常度の算出手法が、回帰式の優良度にかかわるものであれば、モデル情報に、回帰式の優良度を含ませればよい。
標準寄与率取得部22は、状態情報記憶部203に記憶されている状態系列情報に基づいて、分析モデルに含まれる多体相関モデルの回帰式ごとに、各説明変数データ項目が予測値に寄与する割合(寄与率)の統計量を計算する。以降、寄与率の統計量を、標準寄与率という。ここで、標準寄与率として用いる統計量は、寄与率の平均的な値が得られる統計量であればよい。例えば、当該統計量は、寄与率の平均値または中央値であってもよい。また、例えば、当該統計量は、寄与率の数値ごとに所定の重みを付けた加重平均値、または、寄与率の数値ごとに所定の重みを付けた加重中央値等であってもよい。
ここで、標準寄与率の計算に用いる状態系列情報の期間としては、障害を含まない任意の期間が設定される。ここで、分析モデルによる分析結果との整合性を高くし、異常要因データ項目抽出時の解釈性を損なわないという観点を考える。このような観点からは、分析モデルの生成に用いられた所定期間の状態系列情報を、標準寄与率の計算に用いることが好ましい。分析モデルの生成に用いられた所定期間の状態系列情報を標準寄与率の計算に用いることは、設定すべきパラメータが少ないため、汎用性という観点からも好ましい。この場合、標準寄与率取得部22は、分析モデル取得部21による分析モデルの生成時に、標準寄与率を算出しておくことが可能である。
また、異常要因データ項目抽出の精度を高めるという観点を考える。このような観点からは、モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に近い値を持つ期間の状態系列情報を、標準寄与率の計算に用いることが好ましい。ここで、「近い値」とは、そのような目的変数に対応するデータ項目の値に対して近いことを示す所定条件を満たす値をいう。なお、モデル破壊は、後述のモデル破壊検出部24によって検出される。この場合、状態情報記憶部203に、そのような近い値を持つ状態情報が十分多く記憶されていることが前提となる。例えば、モデル破壊した多体相関モデルの目的変数に対応するデータ項目xの実測値が、モデル破壊した時刻でx1だったと仮定する。この場合、標準寄与率取得部22は、状態情報記憶部203に記憶されている状態情報のうち、そのデータ項目xの値がx1に近い値である期間の状態系列情報を抽出すればよい。そのような期間は、複数の期間であってもよい。また、抽出期間の長さは、運用者等によってあらかじめ定められているものとする。そして、標準寄与率取得部22は、抽出した期間の状態系列情報を用いて、モデル破壊した多体相関モデルにおける各説明変数データ項目の標準寄与率を算出する。この場合、標準寄与率取得部22は、後述のモデル破壊検出部24によるモデル破壊の検出時点より後に、標準寄与率を算出すればよい。
なお、標準寄与率の計算に用いられる状態系列情報は、連続している1つの期間から抽出される必要はない。この場合、標準寄与率の計算に用いられる状態情報の数は、システムごとに好適な数が、システム分析の結果に基づいて設定されていてもよい。例えば、標準寄与率の計算に用いられる状態情報の数は、あらかじめ設定された所定の数であってもよい。あるいは、標準寄与率の計算に用いられる状態情報の数は、モデル破壊の発生した多体相関モデルの回帰式ごとに、標準寄与率の計算に用いた期間の予測精度が、あらかじめ設定された範囲内におさまる状態情報の数であってもよい。
また、多体相関モデルに含まれるデータ項目間の関係性に軽微な変化が既に発生している状況で、発生したモデル破壊に対する異常要因データ項目抽出の精度低下を防ぐという観点を考える。このような観点からは、モデル破壊時刻を含まない直前の所定期間にわたる状態系列情報を、標準寄与率の計算に用いることが好ましい。この場合、直前の所定期間の長さは、あらかじめ設定されていてもよい。この場合も、標準寄与率取得部22は、後述のモデル破壊検出部24によるモデル破壊の検出時点より後に、標準寄与率を算出すればよい。
モデル破壊検出部24は、新たな状態情報が収集されると、分析モデルに含まれる各多体相関モデルについて、モデル破壊の発生の有無を検出する。前述のように、モデル破壊とは、多体相関モデルの回帰式の予測誤差が許容範囲を超える現象である。
本実施の形態では、このようなモデル破壊の発生を、その回帰式の目的変数とされたデータ項目に対応するセンサ値の変化に、通常変化とは無関係なセンサ値の変化による影響が含まれていることを示す指標として用いる。なお、通常変化とは、通常起こりうるシステムの状態変化に伴うセンサ値の変化をいう。
モデル破壊検出部24は、例えば、状態情報記憶部203に記憶されている最新の状態情報を含む状態系列情報と、分析モデルとを用いて、分析モデルに含まれる各多体相関モデルについてモデル破壊の発生の有無を検出する。具体的には、モデル破壊検出部24は、当該多体相関モデルの回帰式の目的変数に対する少なくとも最新の時刻における予測値を算出する。そして、モデル破壊検出部24は、算出した目的変数の予測値と、最新の状態情報に含まれる実際のセンサ値との差である予測誤差を算出する。そして、モデル破壊検出部24は、算出された予測誤差が許容範囲を満たしているか否かを判定することによって、モデル破壊の発生の有無を検出すればよい。そして、モデル破壊検出部24は、モデル破壊の検出結果を、モデル破壊情報として出力する。
モデル破壊情報は、分析モデルに含まれる各多体相関モデルのモデル破壊の状況を示す情報である。具体的には、モデル破壊情報は、モデル破壊が発生した多体相関モデルを特定可能な情報を含んでいてもよい。逆に、モデル破壊情報は、モデル破壊が発生しなかった多体相関モデルを特定可能な情報を含んでいてもよい。その他、モデル破壊情報は、モデル破壊が発生した(あるいは発生しなかった)多体相関モデルから得られる各種情報を含んでいてもよい。そのような情報は、例えば、該多体相関モデルの回帰式に含まれるデータ項目の情報や、算出された予測誤差等であってもよい。あるいは、モデル破壊情報は、これらの情報の組合せを含んでいてもよい。
なお、モデル破壊情報に含まれる必要がある情報は、警報条件やデータ項目の異常度の算出方法に依存する。例えば、警報条件またはデータ項目の異常度の算出方法が、モデル破壊の発生した多体相関モデルの数(モデル破壊数)にかかわるものであるとする。この場合、モデル破壊情報は、モデル破壊数を特定可能な情報を含んでいればよい。例えば、モデル破壊情報に、分析モデルに含まれる各多体相関モデルについてのモデル破壊の有無を表す情報が含まれていれば、モデル破壊数が特定可能となる。また、モデル破壊情報に、モデル破壊が発生した多体相関モデルの識別子の集合が含まれていれば、モデル破壊数が特定可能となる。
また、例えば、警報条件またはデータ項目の異常度の算出方法が、モデル破壊の発生した多体相関モデルの回帰式の優良度にかかわるものであるとする。この場合、モデル破壊情報は、モデル破壊が発生した多体相関モデルの回帰式の優良度を特定可能な情報を含んでいればよい。例えば、モデル破壊情報には、モデル破壊が発生した多体相関モデルの回帰式の優良度そのものが含まれていてもよい。あるいは、モデル破壊情報に、モデル破壊が発生した多体相関モデルの識別子の集合が含まれていれば、各識別子が示す多体相関モデルの回帰式の優良度が特定可能となる。
また、例えば、警報条件またはデータ項目の異常度の算出手法が、モデル破壊の発生した多体相関モデルの予測誤差にかかわるものであるとする。この場合、モデル破壊情報は、モデル破壊が発生した多体相関モデルの予測誤差を特定可能な情報を含んでいればよい。例えば、モデル破壊情報には、モデル破壊が発生した多体相関モデルの予測誤差そのものが含まれていてもよい。あるいは、モデル破壊情報に、モデル破壊が発生した多体相関モデルの識別子の集合が含まれていれば、各識別子が示す多体相関モデルの予測誤差が特定可能となる。
異常判定部29は、モデル破壊検出部24から出力されたモデル破壊情報を基に、分析モデルのモデル破壊の状況が警報条件を満たしているか否かを判定する。また、異常判定部29は、判定の結果、警報条件を満たしていれば、被監視システム9の状態を異常と判定し、判定結果を通知する。通知先は、例えば、出力装置1003または被監視システム9等であってもよい。また、例えば、異常判定部29は、警報条件を満たす場合に、モデル破壊検出部24から出力されたモデル破壊情報をモデル破壊情報記憶部204に保存してもよい。
警報条件には、例えば、以下の式(1)を用いることができる。
Na>Ta ・・・(1)
ここで、Naは、分析モデルに含まれる多体相関モデルのうちモデル破壊が発生した多体相関モデルの数を表す。また、Taは、許容されるモデル破壊の数である。例えば、Ta=3であったとする。このとき、分析モデルに含まれる多体相関モデルのうち、モデル破壊が発生した数が4以上であった場合、異常判定部29は、被監視システム9の状態が異常であると判定し、異常の発生を通知する。
モデル破壊情報記憶部204は、上述のモデル破壊情報を記憶する。さらに、モデル破壊情報記憶部204は、モデル破壊に関連する情報を記憶してもよい。モデル破壊に関連する情報とは、例えば、異常判定部29により異常と判定された際にモデル破壊を発生させた状態情報の計測時刻等であってもよい。
異常要因抽出部25は、異常判定部29によって被監視システム9の状態が異常と判定されると次のように動作するよう構成される。なお、上述したように、異常判定部29によってモデル破壊情報のモデル破壊情報記憶部204への登録が行われる場合、異常要因抽出部25は、モデル破壊情報記憶部204にモデル破壊情報が新たに追加されると動作するよう構成される。具体的には、異常要因抽出部25は、後述の再予測値算出部251と、後述の部分異常度算出部252と、後述の異常統計値算出部253とを用いて、データ項目別の異常統計値を算出する。異常要因抽出部25に含まれる各機能ブロックの構成の詳細については後述する。そして、異常要因抽出部25は、データ項目別の異常統計値がより高いものから順に、被監視システム9の異常要因の候補となるデータ項目を抽出する。例えば、異常要因抽出部25は、異常統計値が閾値以上のデータ項目を、異常要因の候補となるデータ項目として抽出してもよい。また、例えば、異常要因抽出部25は、異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出してもよい。
次に、分析モデル取得部21に含まれる多体相関モデル生成部211およびモデル抽出部212の構成の詳細について説明する。
多体相関モデル生成部211は、状態情報に含まれるデータ項目群のうち、任意の1つのデータ項目を目的変数として選出し、任意の2つ以上のデータ項目を説明変数として選出する。そして、多体相関モデル生成部211は、選出した目的変数および2つ以上の説明変数の全ての組合せについて、3つ以上のデータ項目を用いて構成される回帰式を構築する。また、多体相関モデル生成部211は、該回帰式の予測誤差の許容範囲を算出する。そして、多体相関モデル生成部211は、構築した回帰式と、該回帰式の予測誤差の許容範囲とを含む多体相関モデルを生成する。多体相関モデルの回帰式に含まれる説明変数としてのデータ項目の数は、センサノイズによる検知感度低下の防止や異常要因データ項目の絞り込みの容易さの観点からは、少ない方が好ましく、2つが最も好ましい。一方、システムの状態が変化しても高い予測精度を維持できるという観点からは、多体相関モデルの回帰式に含まれる説明変数データ項目の数は、多い方が好ましい。
多体相関モデル生成部211は、このような多体相関モデルの回帰式として、例えば、以下の式(2)に示されるような4つのデータ項目を用いて構成される回帰式を用いてもよい。
Figure 2016088362
ここで、tは、状態情報のインデックスを表している。状態情報のインデックスtには、状態情報を古い順に並べたとき、古い方から新しい方に向かって、値が増える連番の整数が与えられる。また、x(t)は、状態情報のインデックスがtのときの、データ項目xの値を表している。また、式(2)において、1つ目の等号の左側にあるハット付きのu(t)は、目的変数に相当し、状態情報のインデックスがtのときのデータ項目uの予測値となる。また、2つ目の等号の右側にあるx(t)、y(t)、z(t)は、説明変数に相当し、状態情報のインデックスがtのときのデータ項目x、y、zのセンサ値をi乗した値を表す。また、1番目の等号と2番目の等号との間にあるf(x、y、z)は、当該回帰式がx、y、zの3つのデータ項目を説明変数に用いた関数であることを表している。また、N、KおよびMは、任意の整数である。
また、多体相関モデル生成部211は、式(2)のパラメータとしてのa、b、c、d、K、N、Mを、当該回帰式の優良度Fが最大となるように決定する。回帰式の優良度Fには、例えば、以下の式(3)に示されるような、回帰式の予測精度を用いることができる。式(3)において、u(t)は、状態情報のインデックスがtのときの、データ項目uの値を表している。また、バー付きのuは、状態系列情報に含まれる所定期間中における目的変数の平均値を表す。なお、所定期間とは、これらのパラメータを決定するための学習期間であり、状態情報のインデックスがN0〜N1の間(N0≦N1)である。ここで、N0は、当該回帰式の構築に用いられた状態情報の最も古い時刻を示すインデックスを表す。また、N1は、当該回帰式の構築に用いられた状態情報の最も新しい時刻を示すインデックスを表す。
Figure 2016088362
回帰式の優良さには、予測精度の高さと、汎化誤差の低さという2つの観点がある。上記式(3)の例は、予測精度の高さの観点から定めた優良度の例である。一方、汎化誤差の低さの観点から優良度を定めることも可能である。そのような場合には、例えば、回帰式の優良度Fは、情報量基準を用いて算出可能である。なお、回帰式の優良度は、これらの観点による算出手法を組合せたものであってもよい。
優良度Fが最大となるパラメータは、例えば、K,N,Mの組に対して優良度Fが最大となるようにa、b、c、d、を決定し、その後、優良度Fが最大となるK,N,Mの組を選択することで決定できる。本実施の形態では、パラメータa、b、c、d、を決定する方法として、部分最小二乗法(Partial Least Squares:PLS)を用いる。具体的には、まず、多体相関モデル生成部211は、K、N、Mの最大値をそれぞれ設定し、K、N、Mの値の組合せごとに回帰式を定式化する。そして、多体相関モデル生成部211は、それぞれの回帰式に対して、PLS回帰を用いて、パラメータa、b、c、d、を決定する。PLS回帰の成分数は、例えば、次のようにして決定できる。多体相関モデル生成部211は、PLS回帰の成分数を1から順に増やしたときに、分析モデルの生成に用いた状態系列情報に対する予測誤差の最大値が、減少から増加に転じる前までの成分数を決定すればよい。最後に、多体相関モデル生成部211は、回帰式ごとに、優良度Fを算出し、最大の優良度Fをもつ、回帰式のパラメータa、b、c、d、N、M、K、を選択すればよい。これにより、所望の回帰式が得られる。ここで、N,M,Kの最大値は、運用者によって任意に設定可能である。
なお、パラメータa、b、c、d、を決定する方法は、PLSに限らない。ここで、データ項目間の関係性が変化しないことを前提とする。この前提である限り、これらパラメータの決定方法には、各パラメータの値がセンサノイズの影響をあまり受けずにほぼ同じ値を安定的に得られる方法で、かつ、多体相関モデルの回帰式に寄与率の絶対値の小さい説明変数データ項目が含まれない方法を採用可能である。
なお、本実施の形態でPLSを利用する1つ目の理由は、多重共線現象(multicollinearity)が発生する場合でも、安定してパラメータを求めることができるためである。多重共線現象が発生する場合、最小二乗法では、真のセンサ値に重畳するノイズが僅か変化するだけでも、パラメータの値が大きく変化するため、安定してパラメータを求めることができない。システム内のセンサ値を使って回帰分析する場合、多重共線性現象が発生する可能性が高い。これはシステムを構成する機器などの要素が、他の要素と連動して動作することで、システムの構成要素から得られるセンサ値も同様に、他のセンサ値と連動して変化することが考えられるためである。
また、本実施の形態でPLSを利用する2つ目の理由は、潜在変数(PLS回帰の各成分)として、データ項目間の主成分を抽出するためである。この特長によって、寄与率の絶対値の小さい説明変数データ項目が含まれない回帰式を含む多体相関モデルを生成できる。
また、本実施の形態でPLSを利用する3つ目の理由は、回帰式を定式化した際のデータ項目数が、パラメータを決定した後でも変わらないためである。これによって、定式化の時点で、回帰式に含まれるデータ項目の数が3つ以上となることを確定できる。このため、後述のモデル抽出部212が、回帰式に含まれるデータ項目の数を確認する必要がなく、システム構成を簡便にできる。
このようにして、多体相関モデル生成部211は、状態情報に含まれるデータ項目群のうち任意の1つのデータ項目を目的変数とし、任意の2つ以上のデータ項目を説明変数とする全ての組合せについて、回帰式を構築する。
また、多体相関モデル生成部211は、構築した多体相関モデルの回帰式の予測誤差の許容範囲として、例えば、以下の式(4)および式(5)の両方が満たされる範囲を生成する。
≦T ・・・(4)
≧T ・・・(5)
ここで、Tは予測誤差に対する上限閾値である。また、Tは予測誤差に対する下限閾値である。また、rは当該多体相関モデルの回帰式を用いて算出される目的変数のi番目の時刻での予測誤差である。ここで、iは状態系列情報における時刻の識別子を表している。より具体的には、iは、ある基準時刻から該当する時刻までの状態情報を昇順または降順で並べたときの並び番号である。例えば、iは、監視開始からi番目の時刻を表すものとしてもよい。
また、多体相関モデル生成部211は、式(4)および式(5)における上限閾値Tおよび下限閾値Tを、例えば、次式(6)および次式(7)を用いて決定してもよい。
=max{|RN0|,・・・,|RN1|} ・・・(6)
=−T ・・・(7)
ここで、max{}は入力された数値の中から最大値を出力する関数である。また、|x|はxの絶対値を抽出する演算子である。また、R(i=N0〜N1)は、当該多体相関モデルの回帰式の構築に用いた状態系列情報から算出される目的変数のi番目の時刻の予測誤差を表している。また、N0は、該回帰式の構築に用いられた状態情報の最も古い時刻を示すインデックスを表す。また、N1は、該回帰式の構築に用いられた状態情報の最も新しい時刻を示すインデックスを表す。
つまり、式(6)では、許容範囲の上限値Tとして、該回帰式の構築に用いられた状態系列情報の期間にわたって算出される予測誤差(以下、算出期間中の予測誤差という)の絶対値の最大値が適用されている。また、式(7)では、許容範囲の下限値Tとして、同算出期間中の予測誤差の絶対値の最大値に−1をかけた値が適用されている。
式(6)および式(7)に限らず、多体相関モデル生成部211は、上述の算出期間中の予測誤差RN0〜RN1の平均値と標準偏差とを用いて、上限閾値Tおよび下限閾値Tを決定してもよい。例えば、多体相関モデル生成部211は、予測誤差の平均値に標準偏差の3倍を足した値を上限閾値Tとしてもよい。また、この場合、多体相関モデル生成部211は、予測誤差の平均値から標準偏差の3倍を引いた値を下限閾値Tとしてもよい。
このようにして、多体相関モデル生成部211は、状態情報に含まれるデータ項目群のうち任意の1つのデータ項目を目的変数とし、任意の2つ以上のデータ項目を説明変数とする全ての組合せについて構築した各回帰式について、予測誤差の許容範囲を決定する。そして、多体相関モデル生成部211は、各回帰式およびその予測誤差の許容範囲を含む多体相関モデル群を生成する。生成された多体相関モデル群は、分析モデルとして用いられる多体相関モデルの候補となる。
モデル抽出部212は、多体相関モデル生成部211が生成した多体相関モデル群の中から、分析モデルに用いる多体相関モデルを抽出する。例えば、モデル抽出部212は、多体相関モデル群の中から、その回帰式の優良度に基づいて、1つ以上の多体相関モデルを抽出してもよい。
具体的には、モデル抽出部212は、多体相関モデル生成部211によって生成される多体相関モデル群から、所定の優良モデル条件を満たす多体相関モデルを優良多体相関モデルとして抽出してもよい。そして、モデル抽出部212は、抽出した優良多体相関モデルの集合である優良多体相関モデル群を、分析モデルとしてもよい。また、モデル抽出部212は、抽出した各優良多体相関モデルのモデル情報を含む分析モデル情報を分析モデル記憶部201に記憶する。
例えば、モデル抽出部212は、優良モデル条件として、以下の式(8)を用いてもよい。なお、Fthは回帰式の優良度Fに対する閾値を表している。
F > Fth ・・・(8)
ここで、回帰式の優良度Fに対する閾値Fthは、運用者によって任意の値が設定可能である。異常検知の対象範囲を広げるという観点からは、閾値Fthは、低く設定されることが好ましい。一方、システムの状態変化等による誤検知を減らすという観点からは、閾値Fthは、高く設定されることが好ましい。例えば、優良度Fが0〜1の値を取るとする。この場合、誤検知を減らすという観点からは、閾値Fthは、例えば、0.7から1までの値が好ましい。
また、例えば、モデル抽出部212は、多体相関モデル群の中から、相互相関モデルの優良度に基づいて、1つ以上の多体相関モデルを抽出してもよい。ここで、相互相関モデルとは、2つのデータ項目を含む回帰式をいうものとする。
具体的には、まず、モデル抽出部212は、多体相関モデル生成部211による多体相関モデル群の生成処理と同様の手順で、データ項目のすべての組み合わせに対して相互相関モデルを生成する。そして、モデル抽出部212は、各相互相関モデルに対して回帰式の優良度Fを求める。次に、モデル抽出部212は、所定の優良モデル条件を満たす相互相関モデルである優良相互相関モデルを抽出する。例えば、モデル抽出部212は、優良モデル条件として、式(8)を用いてもよい。モデル抽出部212は、優良相互相関モデルに含まれるデータ項目を回帰式に含む多体相関モデル群を、優良多体相関モデル群として抽出してもよい。
また、例えば、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルが、多体相関モデル生成部211によって生成される多体相関モデル群に含まれる場合を想定する。この場合、モデル抽出部212は、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルの一部を、優良多体相関モデルとして抽出してもよい。例えば、モデル抽出部212は、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルのうちの1つを、優良多体相関モデルとして抽出してもよい。例えば、モデル抽出部212は、回帰式の優良度に基づいて、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデル群から、優良多体相関モデル群に含める多体相関モデルを抽出してもよい。この場合、回帰式の優良度としては、回帰式の優良度Fを用いてもよい。一例として、モデル抽出部212は、回帰式に含まれるデータ項目の組み合わせが同じ多体相関モデルのうち、回帰式の優良度Fが最も高いものを、優良多体相関モデル群に含める多体相関モデルとして抽出してもよい。
次に、異常要因抽出部25に含まれる再予測値算出部251、部分異常度算出部252、異常統計値算出部253の構成の詳細について説明する。
再予測値算出部251は、モデル破壊情報記憶部204に新たに追加されたモデル破壊情報を参照し、モデル破壊が発生した各多体相関モデルについて、次の処理を行う。すなわち、再予測値算出部251は、モデル破壊が発生した各多体相関モデルの回帰式について、説明変数データ項目ごとに、当該データ項目の状態情報および標準寄与率に基づいて、当該回帰式の目的変数の予測値を再予測値として算出する。
例えば、再予測値算出部251は、再予測値の算出に、次式(9)を用いてもよい。式(9)では、再予測値は、1つのデータ項目にかかわる成分の値を、当該回帰式における当該データ項目の寄与率で割った値として得られる。
Figure 2016088362
ここで、データ項目xは、当該多体相関モデルの回帰式rに含まれる説明変数データ項目を表す。また、ハット付きのukriは、説明変数データ項目xによる、目的変数データ項目uの再予測値を表す。また、gは、回帰式rのうち特定のデータ項目にかかわる成分の値を取り出す関数である。したがって、g(x)は、回帰式rのうち、データ項目xに関する成分の値を示す。また、qriは、説明変数データ項目xの標準寄与率である。また、データ項目uを目的変数とする多体相関モデルの回帰式rは、gを用いて書きなおすと、次式(10)のように表すことができる。
Figure 2016088362
ここで、ハット付きのukrは、当該多体相関モデルの回帰式rによるデータ項目uの予測値である。また、cはデータ項目に依存しない定数項である。
再予測値算出部251による再予測値の具体的な計算方法について説明する。ここでは、式(2)に示した多体相関モデルの回帰式を例とする。また、異常判定部29により異常と判定された時刻に対応する状態情報のインデックスを、tとする。この場合、式(2)のデータ項目ごとの再予測値は、次式(11)、次式(12)、次式(13)のように表される。
Figure 2016088362

Figure 2016088362

Figure 2016088362
ここで、x、y、zは、当該回帰式に含まれる説明変数データ項目を表す。また、ハット付きのu、u、uは、それぞれ説明変数データ項目x、y、zごとの再予測値である。また、q、q、qは、説明変数データ項目x、y、zの標準寄与率である。
部分異常度算出部252は、第1のモデル破壊発生状況となった多体相関モデルと、第2のモデル破壊発生状況となった多体相関モデルとで、該多体相関モデルに含まれる各データ項目に対する部分異常度の割り当て方を変更する。ここで、第1のモデル破壊発生状況とは、その多体相関モデルにおいて各説明変数データ項目についての再予測値が全てモデル破壊となった場合をいうものとする。また、第2のモデル破壊発生状況とは、その多体相関モデルにおいて各説明変数データ項目についての再予測値の少なくとも1つがモデル破壊とならず少なくとも1つがモデル破壊となった場合をいうものとする。
具体的には、部分異常度算出部252は、第1のモデル破壊発生状況となった多体相関モデルにおいて、次のように部分異常度を割り当てる。この場合、部分異常度算出部252は、目的変数データ項目の部分異常度が、説明変数データ項目の部分異常度より高くなるよう各部分異常度の数値を割り当てる。割り当てる部分異常度は、本実施の形態では、2値であるものとする。例えば、この場合、部分異常度算出部252は、目的変数データ項目の部分異常度に1を割り当てる。また、部分異常度算出部252は、説明変数データ項目の部分異常度に0を割り当てる。
また、部分異常度算出部252は、第2のモデル破壊発生状況となった多体相関モデルにおいて、次のように部分異常度を割り当てる。この場合、部分異常度算出部252は、再予測値がモデル破壊となった説明変数データ項目の部分異常度が、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数データ項目の部分異常度より高くなるよう、部分異常度の数値を割り当てる。例えば、部分異常度算出部252は、再予測値がモデル破壊となった説明変数のデータ項目の部分異常度に1を割り当てる。また、部分異常度算出部252は、目的変数のデータ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てる。
異常統計値算出部253は、部分異常度算出部252から得られる部分異常度を、モデル破壊を検出した全ての多体相関モデルにわたって集計する。これにより、データ項目別の異常度の統計値である異常統計値が算出される。本実施の形態では、当該統計値として、平均値を用いるものとする。ただし、異常統計値に用いる統計量は、平均値に限らず、その他の統計量であってもよい。本実施の形態では、異常統計値算出部253は、異常統計値がより高いほど、異常要因である可能性が高いとみなす。
異常統計値に用いる統計量の他の例としては、累積和や、中央値等がある。以降、特段の説明がない場合は、異常統計値は高ければ高いほど、そのデータ項目が異常であることを示すこととする。
以上のように構成されたシステム分析装置2の動作について、図面を参照して説明する。なお、以下の動作の説明では、標準寄与率は、分析モデルの生成に用いられた所定期間の状態系列情報を用いて算出されるものとする。
まず、システム分析装置2の動作の一例の概略を図6に示す。
図6では、まず、状態情報収集部23は、被監視システム9から状態情報を収集し、状態情報記憶部203に記憶する(ステップS101)。
なお、状態情報収集部23は、運用を終了するという判断(ステップS110でYes)が与えられるまで、ステップS101の動作を繰り返す。また、状態情報収集部23は、ステップS102〜ステップS109の動作が行われている間も、所定周期毎に状態情報を収集し、状態情報記憶部203に記憶する動作を行う。
ここで、現在のタイミングが分析モデルを生成するタイミングでない場合(ステップS102でNo)、システム分析装置2の動作は、ステップS105に進む。
一方、現在のタイミングが分析モデルを生成するタイミングである場合について説明する(ステップS102でYes)。
この場合、分析モデル取得部21は、分析モデルの生成に用いる所定期間の状態系列情報を、状態情報記憶部203から取得する。そして、分析モデル取得部21は、取得した状態系列情報を用いて、分析モデルを生成する(ステップS103)。このステップの詳細については後述する。
そして、標準寄与率取得部22は、分析モデルの生成に用いられた所定期間の状態系列情報を用いて、分析モデルに含まれる各多体相関モデルの回帰式において、各説明変数データ項目の標準寄与率を算出する(ステップS104)。
次に、現在の分析モデルを用いて対象システムを監視するという判断が与えられなければ(ステップS105でNo)、システム分析装置2は、ステップS101からの動作を繰り返す。
一方、現在の分析モデルを用いて対象システムを監視するという判断が与えられた場合(ステップS105でYes)について説明する。この場合、モデル破壊検出部24は、状態情報収集部23により新たに収集された状態情報を用いて、分析モデル記憶部201に記憶されている分析モデル情報によって示される分析モデルについて、モデル破壊の発生を検出する(ステップS106)。
前述のように、モデル破壊検出部24は、分析モデルに含まれる各多体相関モデルについて、新たに収集された状態情報を適用した場合の予測誤差がその許容範囲を超えているか否かを判断すればよい。そして、モデル破壊検出部24は、各多体相関モデルのモデル破壊評価結果を示すモデル破壊情報を生成する。
次に、異常判定部29は、モデル破壊検出部24から得られるモデル破壊情報に基づいて、モデル破壊の状況が警報条件を満たしているか否かを判定する(ステップS107)。
ここで、モデル破壊の状況が警報条件を満たしていれば(ステップS107でYes)、異常判定部29は、判定結果を通知する(ステップS108)。このとき、異常判定部29は、モデル破壊の状況を示すモデル破壊情報を併せて通知してもよい。また、このとき、異常判定部29は、該当するモデル破壊情報を、モデル破壊情報記憶部204に記憶する。そして、システム分析装置2の動作は、ステップS109に進む。
一方、モデル破壊の状況が警報条件を満たしていなければ(ステップS107でNo)、異常判定部29は、システムに異常は検知されなかったとして特に何もせず、ステップS101からの動作を繰り返す。
次に、システム分析装置2は、モデル破壊情報記憶部204に新たに記憶されたモデル破壊情報に基づいて、1つ以上の異常要因候補データ項目を抽出し、抽出した異常要因候補データ項目群を示す情報を通知する(ステップS109)。このステップの詳細については後述する。
システム分析装置2は、運用を終了するという判断(ステップS110でYes)が与えられるまで、上記の動作を繰り返す。
なお、ステップS102、S105およびS110において、システム分析装置2は、入力装置1004からの入力に基づいて、該当する判断を行ってもよい。あるいは、システム分析装置2は、あらかじめ定められたタイミングであるか否かに基づいて、該当する判断を行ってもよい。あるいは、システム分析装置2は、被監視システム9から得られる各種情報があらかじめ定められた条件を満たすか否かに基づいて、該当する判断を行ってもよい。また、これに限らず、システム分析装置2は、これらのステップにおける判断処理を、その他の方法により行ってもよい。
次に、ステップS103における分析モデル生成動作の一例の詳細を、図7に示す。
図7では、まず、多体相関モデル生成部211は、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶部203から取得する(ステップS201)。
次に、多体相関モデル生成部211は、取得した状態系列情報を用いて、分析モデルの候補である多体相関モデル群を生成する(ステップS202)。
ここでは、前述のように、多体相関モデル生成部211は、データ項目群から任意の1つのデータ項目を目的変数として選出し、目的変数とは異なる任意の2つ以上のデータ項目を、説明変数として選出する。なお、説明変数として選出するデータ項目数は、2つ以上の数があらかじめ定められている。そして、多体相関モデル生成部211は、目的変数および説明変数の全ての組合せについて、目的変数データ項目と説明変数データ項目とを用いた回帰式を構築する。また、多体相関モデル生成部211は、構築した各回帰式について、その予測誤差の許容範囲を算出する。そして、多体相関モデル生成部211は、回帰式および予測誤差の許容範囲を含む多体相関モデルを生成すればよい。これにより、多体相関モデル群が生成される。
次に、モデル抽出部212は、生成された多体相関モデル群から、所定の優良モデル条件に基づいて、優良多体相関モデル群を抽出する(ステップS203)。
次に、モデル抽出部212は、得られた優良多体相関モデル群を表す分析モデル情報を、分析モデル記憶部201に記憶する(ステップS204)。
以上で、システム分析装置2は、分析モデル生成動作を終了する。
次に、図6のステップS109における異常要因抽出動作の詳細を、図8に示す。
ここでは、システム分析装置2は、モデル破壊が発生した多体相関モデルの回帰式ごとに、ステップS301〜S308の処理を繰り返す。
まず、再予測値算出部251は、モデル破壊情報記憶部204からモデル破壊情報と、状態情報記憶部203から、異常判定部29により異常と判定された時点の状態情報とを取得する。そして、再予測値算出部251は、モデル破壊が発生したこの多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、再予測値を計算する(ステップS301)。
次に、部分異常度算出部252は、再予測値算出部251によって算出された再予測値ごとに、再予測値とセンサ値との差が、その多体相関モデルの予測誤差の許容範囲内かどうか評価する。つまり、部分異常度算出部252は、再予測値ごとに、再予測値でもモデル破壊が発生するか否かを評価する(ステップS302)。
ここで、この多体相関モデルの回帰式において、全ての再予測値でモデル破壊が発生している場合(第1のモデル破壊発生状況)について説明する(ステップS303でYes)。この場合、部分異常度算出部252は、目的変数データ項目の部分異常度に1を割り当てる(ステップS304)。また、さらに、部分異常度算出部252は、全ての説明変数データ項目の部分異常度に0を割り当てる(ステップS305)。
一方、この多体相関モデルの回帰式において、モデル破壊が発生しない再予測値が少なくとも1つあり、モデル破壊が発生した再予測値が少なくとも1つある場合(第2のモデル破壊発生状況)について説明する(ステップS303でNo)。この場合、部分異常度算出部252は、目的変数データ項目の部分異常度に0を割り当てる(ステップS306)。また、さらに、部分異常度算出部252は、モデル破壊が発生した再予測値の計算に用いた説明変数データ項目の部分異常度に1を割り当てる(ステップS307)。また、さらに、部分異常度算出部252は、モデル破壊が発生しなかった再予測値の計算に用いた説明変数データ項目の部分異常度に0を割り当てる(ステップS308)。
モデル破壊が発生した全ての多体相関モデルの回帰式ごとにデータ項目別の部分異常度の算出を完了すると、システム分析装置2の動作は、ステップS309に進む。
ステップS309では、異常統計値算出部253は、部分異常度算出部252から取得した部分異常度を全ての当該回帰式にわたってデータ項目ごとに集計し、異常統計値を算出する(ステップS309)。
次に、異常要因抽出部25は、各データ項目の異常統計値に基づいて、異常要因の候補となるデータ項目を抽出し、通知する(ステップS310)。例えば、前述のように、異常要因抽出部25は、異常統計値が閾値より高いものを抽出し、異常要因候補として通知してもよい。また、例えば、異常要因抽出部25は、異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出し通知してもよい。
以上で、システム分析装置2は、異常要因抽出動作を終了する。
次に、具体例を用いて本実施の形態を説明する。
まず、本実施の形態における分析モデル生成動作について、具体例を示す。
ここでは、多体相関モデルの回帰式の優良度Fに予測精度を用いるものとする。また、多体相関モデルに対する優良モデル条件を「F>0.6」とする。また、説明変数に含まれるデータ項目の数を2とする。
図9は、本実施の形態における分析モデル生成動作を説明するための図である。図9において、符号9aは、多体相関モデル生成部211によって生成された多体相関モデル群を示している。また、符号9bは、多体相関モデルに対する優良モデル条件を示している。また、符号9cは、モデル抽出部212によって抽出され、分析モデルとなった優良多体相関モデル群を示している。なお、多体相関モデルには、回帰式の予測誤差の許容範囲も含まれるが、回帰式の予測誤差の許容範囲は優良多体相関モデルの抽出には利用されないため、図示を省略している。以下、他の説明においても、説明に利用されない値を図から省略することがある。
この具体例では、まず、多体相関モデル生成部211は、状態情報記憶部203から状態系列情報を取得し、多体相関モデル群9aを生成する。多体相関モデル群9aは、12個の多体相関モデルで構成されている。また、多体相関モデル群9aの生成に用いられた状態系列情報に含まれるデータ項目群は、データ項目u、データ項目u、データ項目uおよびデータ項目uからなる。多体相関モデル群9aを構成する12個の多体相関モデルの回帰式は、それぞれu=f123(u,u)、u=f134(u,u)、u=f124(u,u)、u=f213(u,u)、u=f214(u,u)、u=f234(u,u)、u=f312(u,u)、u=f314(u,u)、u=f324(u,u)、u=f412(u,u)、u=f413(u,u)、u=f423(u,u)である。ここで、f()は、カッコ内に含まれる説明変数データ項目から、左辺に示す目的変数データ項目の予測値を算出するための関数である。なお、jは、回帰式を識別するための識別子である。そのような関数の説明変数には、カッコ内に含まれるデータ項目について、状態情報記憶部203に記憶されている状態系列情報に含まれる該データ項目の値(センサ値)が適用される。なお、説明変数としては、データ項目の値そのものに限らず、該データ項目を用いて算出される変換値が適用されてもよい。
次に、モデル抽出部212は、多体相関モデル群9aから、優良モデル条件9bを満たす優良多体相関モデルを抽出し、分析モデルである優良多体相関モデル群9cを得る。本例の優良モデル条件9bは、図9に示されるように「回帰式の優良度F>0.6」である。そこで、モデル抽出部212は、多体相関モデル群9aを構成する12個の多体相関モデルのうち、回帰式の優良度Fが0.6を超える多体相関モデルを、優良多体相関モデルとして抽出する。本例では、以下の9つの回帰式、u=f134(u,u)、u=f124(u,u)、u=f214(u,u)、u=f234(u,u)、u=f314(u,u)、u=f324(u,u)、u=f412(u,u)、u=f413(u,u)、u=f423(u,u)にかかわる多体相関モデルが抽出されたものとする。このようにして、9つの多体相関モデルから構成される優良多体相関モデル群9cが、分析モデルとして生成された。
次に、本実施の形態における異常要因抽出動作について、具体例を示す。
なお、以下に示す具体例では、異常の影響はデータ項目uおよびデータ項目uに現れているものとした。
図10は、本実施の形態における異常要因抽出動作の具体例を説明するための図である。図10において、データセット10aは、分析モデルに含まれる上述の9つの多体相関モデルについて、再予測値の予測誤差と、再予測値によるモデル破壊評価結果と、部分異常度とを示している。また、データセット10bは、データ項目ごとの異常統計値を示している。図10のデータセット10aにおいて、「モデル破壊」の列には、モデル破壊の評価結果が示されている。この列では、モデル破壊となった回帰式には「○」印がついている。また、「説明変数データ項目による再予測値に対する予測誤差」の「第1」、「第2」の列には、第1説明変数データ項目および第2説明変数データ項目について算出された再予測値に対する予測誤差の数値が示されている。ただし、該当する多体相関モデルがモデル破壊とならなかったために計算が不要であった項目には、「−」が記されている。ここでは、説明の便宜上、関数f()の説明変数データ項目を、括弧内の左から順に、第1説明変数データ項目、第2説明変数データ項目と呼ぶ。また、「説明変数データ項目によるモデル破壊評価結果」の「第1」、「第2」の列には、各再予測値によるモデル破壊の有無が示されている。この列では、再予測値によりモデル破壊となった回帰式には「○」印がついている。また、「部分異常度」の列には、0または1の部分異常度が示されている。ただし、該当する多体相関モデルが相関破壊とならなかったために計算が不要であった項目には、「−」が記されている。
例えば、u=f134(u,u)を回帰式として含む多体相関モデルは、モデル破壊とならなかったために、「モデル破壊」の列に「○」印がついていない。したがって、u=f134(u,u)に対応する「説明変数データ項目による再予測値に対する予測誤差」、「部分異常度」の箇所には、「−」が記されている。
また、例えば、u=f124(u,u)を回帰式として含む多体相関モデルは、モデル破壊となったために、「モデル破壊」の列に「○」印がついている。そこで、再予測値算出部251は、このu=f124(u,u)について、「説明変数データ項目による再予測値に対する予測誤差」の「第1」、「第2」の列に示す再予測値を算出している。ここで、この多体相関モデルについて、第1説明変数データ項目による再予測値に対する予測誤差が、その許容範囲から外れている。また、第2説明変数データ項目による再予測値に対する予測誤差は、その許容範囲から外れていない。つまり、少なくとも1つの再予測値に関してモデル破壊が発生しておらず、少なくとも1つの再予測値に関してモデル破壊が発生しており、第2のモデル破壊発生状況となっている。そこで、部分異常度算出部252は、部分異常度として、再予測値がモデル破壊となった第1説明変数データ項目uに、1を割り当てている。また、部分異常度算出部252は、部分異常度として、その他の説明変数データ項目uおよび目的変数データ項目uには、0を割り当てている。
また、u=f214(u,u)を回帰式として含む多体相関モデルも、モデル破壊となったために、「モデル破壊」の列に「○」印がついている。そこで、再予測値算出部251は、このu=f214(u,u)について、「説明変数データ項目による再予測値に対する予測誤差」の「第1」、「第2」の列に示す再予測値を算出している。また、この多体相関モデルでは、第1説明変数データ項目による再予測値に対する予測誤差と、第2説明変数データ項目による再予測値に対する予測誤差との両方が、その許容範囲から外れている。つまり、全ての再予測値によりモデル破壊が発生しており、第1のモデル破壊発生状況となっている。そこで、部分異常度算出部252は、部分異常度として、目的変数データ項目uに、1を割り当てている。また、部分異常度算出部252は、部分異常度として、全ての説明変数データ項目uおよびuに、0を割り当てている。
このようにして、データセット10aに示すように、他の多体相関モデルに含まれるデータ項目についても、部分異常度が算出されたとする。
次に、異常統計値算出部253は、図10のデータセット10bに示すように、異常統計値を算出する。データセット10bに示す異常統計値は、データセット10aに示した部分異常度がデータ項目別に集計された平均値である。異常統計値算出部253は、データ項目別に部分異常度が数値であるものを対象として、それらの平均値を計算している。例えば、データ項目uについては、4つの多体相関モデルにおいて部分異常度1が割り当てられ、1つの多体相関モデルにおいて部分異常度0が割り当てられている。したがって、異常統計値算出部253は、データ項目uの異常統計値として、約0.67を計算する。同様に、異常統計値算出部253は、他のデータ項目についても、データセット10bに示すように、異常統計値を算出する。この例では、異常の影響が現れたデータ項目uおよびデータ項目uについては、高い異常統計値が得られていることが確認された。一方で、異常の影響が現れていないデータ項目uやuについては、低い異常統計値が得られていることが確認された。
このように、本具体例は、異常の影響が現れたデータ項目と、異常の影響が現れていないデータ項目とを、明確に区別可能な異常統計値を算出している。
次に、異常要因抽出部25は、例えば、異常統計値に閾値を設定し、閾値より異常統計値が高いデータ項目を、異常要因の候補として抽出し出力すればよい。これにより、本具体例は、異常統計値のより高いものに注目させるような通知を行うことができる。
次に、本発明の第2の実施の形態の効果について述べる。
本発明の第2の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出することができる。
その理由を5つ述べる。
1つ目の理由は、分析モデル取得部が、分析モデルとして多体相関モデルを生成しているからである。この結果、本実施の形態は、多体相関モデルの回帰式に含まれる説明変数データ項目ごとに、多体相関モデルのモデル破壊を再評価できる。これにより、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目とを、より適切に切り分けることができる。換言すると、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。
2つ目の理由は、多体相関モデル生成部が、多体相関モデルの回帰式に含まれるデータ項目が少数となるように回帰式を構成し得るからである。この結果、本実施の形態は、データ項目のセンサ値に含まれるノイズが予測値に重畳する量を、回帰式に含まれるデータ項目が多い場合に比べて減らすことができる。これにより、本実施の形態は、異常検知精度の高い多体相関モデルを構成でき、異常検知漏れを防ぐことができる。換言すると、本実施の形態は、異常によるセンサ値の変化が僅かであっても、異常要因特定に有用な情報を的確に抽出できる。
3つ目の理由は、多体相関モデル生成部が、分析モデルとして、1種類の目的変数に対して複数個の回帰式を構築し得るためである。この結果、本実施の形態は、異常検知精度を低下させるデータ項目があったとしても、ある1種類の目的変数データ項目を予測する回帰式に対して、その異常検知精度を低下させるデータ項目を含まない回帰式を構築できる可能性がある。なお、異常検知精度を低下させるデータ項目とは、センサ値に含まれるセンサノイズが大きなデータ項目などである。これにより、本実施の形態は、異常検知精度を低下させるデータ項目が回帰式に含まれることによる異常検知漏れを防ぐことができる。換言すると、本実施の形態は、1種類の目的変数に対して構築される回帰式が1つに限られないため、異常によるセンサ値の変化が僅かであったとしても、異常検知漏れを防ぐことができる。さらに、1種類の目的変数に対する回帰式が1つに限られないため、ある回帰式が、その回帰式における目的変数としてのデータ項目が異常の影響を受けているかどうかの判断結果に寄与する割合が小さくなる。したがって、異常検知精度を低下させるデータ項目と同様に、異常要因の特定精度を低下させるデータ項目があったとしても、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目とを適切に切り分けることができる。このようにして、本実施の形態は、異常要因特定に有用な情報を的確に抽出できる。
4つ目の理由は、再予測値算出部および部分異常度算出部が、個々の回帰式における個々の説明変数データ項目について、標準寄与率を用いた再予測値によるモデル破壊の発生状況に基づいて部分異常度を算出するからである。そして、異常統計値算出部が、この部分異常度をデータ項目別に集計して異常統計値を算出するからである。これにより、本実施の形態は、どのデータ項目が異常なのかを多体相関モデルの回帰式ごとに評価した上で、それを集計することができる。その結果、本実施の形態は、異常の影響を受けたデータ項目と、異常の影響を受けていないデータ項目を適切に切り分けることができる。換言すると、本実施の形態は、異常によるセンサ値の変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を的確に抽出できる。
5つ目の理由は、多体相関モデル生成部が、多体相関モデルの回帰式に寄与率の絶対値の小さい説明変数データ項目が含まれないように、多体相関モデルの回帰式のパラメータを決定するからである。これにより、本実施の形態は、個々の回帰式における個々の説明変数データ項目の標準寄与率に基づいて、目的変数の再予測値を安定的に算出することができる。また、これにより、上述の4つ目の理由を確実にする。
なお、本実施の形態において、多体相関モデルの回帰式の例として、目的変数および説明変数にデータ項目の値を用いる例を中心に説明した。これに限らず、各回帰式において、目的変数および説明変数には、データ項目の値を数値変換したものを用いてもよい。なお、データ項目の値を数値変換したものの例としては、階差、べき乗、所定の時間幅における状態系列情報の平均値などが挙げられる。
また、本実施の形態において、分析モデルを生成する際に用いる状態系列情報の期間は、時間的に連続する1つの期間である例を中心に説明した。これに限らず、分析モデルの生成に用いる状態系列情報の期間は、必ずしも連続していなくてもよい。例えば、分析モデルの生成には、期間同士が連続していない複数の期間に含まれる状態系列情報を用いてもよい。
また、本実施の形態において、多体相関モデル生成部が、式(2)に示した回帰式の生成方法の例として、優良度である予測精度の値が最大となるように各パラメータを決定する例を示した。これに限らず、多体相関モデル生成部は、目的に応じて他の優良度を用いてもよい。例えば、回帰式の優良度として、AIC(Akaike's Information Criterion)や、BIC(Bayesian Information Criterion)などの情報量基準の逆数を適用してもよい。この場合も、多体相関モデル生成部は、そのような優良度が最大となるように各パラメータを決定してもよい。
また、本実施の形態において、式(2)に示した回帰式のパラメータであるa,b,c,d,N,M,Kを決定する際に、PLS回帰の成分数の決定方法として、次の方法を示した。すなわち、PLS回帰の成分数を1から順に増やしたときに、モデル構築に用いた状態系列情報に対する予測誤差の最大値が、減少から増加に転じる前までの成分数とする例を示した。これに限らず、多体相関モデル生成部は、World's R criterion,Krzanowski's W criterion,Osten's F criterion等の技術を用いて、PLS回帰の成分数を決定してもよい。
また、本実施の形態において、N、M、Kを固定した時の回帰式のパラメータa,b,c,dの決定方法の例として、PLS回帰を用いる例を示した。これに限らず、多体相関モデル生成部は、主成分回帰(Principal Component Regression:PCR)等、説明変数間の多重共線性による影響を回避可能な別の方法を用いて、これらパラメータを決定してもよい。または、多体相関モデル生成部は、Lasso(least absolute shrinkage and selection operator)やリッジ回帰等で用いられる正則化パラメータ付きの損失関数を用いて、正則化パラメータ付きの損失関数が最小となるようこれらパラメータを決定してもよい。または、多体相関モデル生成部は、説明変数間に多重共線性による影響が発生しない場合には、式(3)の第二項の分子が最小になるように、最小二乗法を用いてパラメータa,b、c,d,を決定してもよい。
また、本実施の形態において、多体相関モデル群を生成する際に、全てのデータ項目は目的変数データ項目および説明変数データ項目のどちらとしても利用できるものとして説明した。これに限らず、目的変数データ項目としてのみ利用可能なデータ項目や、説明変数データ項目としてのみ利用可能なデータ項目が規定されていてもよい。
また、本実施の形態において、多体相関モデル生成部は、説明変数として含まれるデータ項目の数が全て同一の多体相関モデル群を生成する例について説明した。これに限らず、多体相関モデル生成部によって生成される多体相関モデル群は、その回帰式に説明変数として含まれるデータ項目の数が必ずしも同一でなくてもよい。すなわち、ある回帰式に説明変数として含まれるデータ項目の数は、他の少なくとも1つの回帰式に説明変数として含まれるデータ項目の数と異なっていてもよい。例えば、多体相関モデル生成部は、説明変数データ項目が2つの多体相関モデルと、説明変数データ項目が3つの多体相関モデルを組合せて生成してもよい。この場合、モデル抽出部は、説明変数データ項目が3つおよび2つの多体相関モデルの中から、優良多体相関モデルを抽出すればよい。なお、多体相関モデルの回帰式に説明変数として含まれるデータ項目の数は、運用者によって任意に設定されてもよい。
また、本実施の形態において、システム分析装置が、1つの分析モデルを用いて、被監視システムの状態を監視する例を示した。ここで、1つの分析モデルとは、同じ状態系列情報から生成された多体相関モデル群からなる分析モデルをいう。これに限らず、分析モデル取得部は、収集期間の異なる状態系列情報を用いて複数の分析モデルを作成してもよい。そのような場合に、システム分析装置は、複数の分析モデルを適宜切り替えながら、被監視システムの状態を監視してもよい。
また、本実施の形態において、システム分析装置が、分析モデルを一度だけ構築する例を中心に示した。これに限らず、システム分析装置は、分析モデルを逐次、再構築してもよい。
また、本実施の形態において、システム分析装置が、分析モデルに含まれる全ての回帰式をモデル破壊の検出に用いて、被監視システムの状態を監視する例を示した。これに限らず、システム分析装置は、分析モデルに含まれる一部の回帰式を用いて、被監視システムの状態の例えば一部を監視してもよい。
また、本実施の形態において、標準寄与率が、説明変数に含まれるデータ項目別の予測値に対する割合である例を示した。これに限らず、標準寄与率は、所定の期間について、多体相関モデルに含まれる任意の1つの説明変数データ項目による再予測値と、多体相関モデルの予測値とが、同等の精度を持つような他の手法により算出されてもよい。なお、所定の期間としては、例えば、標準寄与率の計算に用いられる期間として上述した各種期間が利用可能である。例えば、標準寄与率は、多体相関モデルの回帰式において、「任意の1つの説明変数データ項目に関する成分/定数項を除く全成分」として算出されてもよい。なお「/」は除算を表す。この標準寄与率の定義を用いる場合、再予測値算出部は、多体相関モデルの定数項の値と、説明変数データ項目の標準寄与率およびセンサ値とから、目的変数データ項目の再予測値を計算すればよい。
また、本実施の形態において、多体相関モデルの回帰式として、式(2)の回帰式を例として説明した。式(2)は、説明変数としてデータ項目の過去の値(過去値)を用いてもよい。この場合、多体相関モデルの回帰式は、目的変数の過去値も説明変数として含むケースがある。このようなケースでは、標準寄与率取得部は、例えば、目的変数の過去値に関わる成分の値を定数項と同様に処理して、標準寄与率を算出する。つまり、多体相関モデルに説明変数として含まれる目的変数の過去値は、説明変数データ項目とみなされないため、再予測の対象にならない。
また、本実施の形態において、標準寄与率が、「任意の1つの説明変数データ項目に関する成分/予測値」の統計値である例を示した。ただし、多体相関モデルの回帰式のうち、再予測の対象になるデータ項目に関する成分の占める割合が低くなると、再予測の精度が低下することがある。その場合、標準寄与率は、「任意の1つの説明変数データ項目に関する成分/再予測の対象になるデータ項目に関する成分の総和」の統計値とすることが好ましい。多体相関モデルの回帰式の説明変数に目的変数の過去値を含まない場合、再予測の対象になるデータ項目に関する成分の総和は、定数項を除く全成分に相当する。また、多体相関モデルの回帰式の説明変数に目的変数の過去値を含む場合、再予測の対象になるデータ項目に関する成分の総和は、目的変数の過去値の成分および定数項を除く全成分に相当する。この標準寄与率の定義を用いる場合、再予測値算出部は、多体相関モデルの定数項の値と、目的変数の過去値に関わる成分の値と、説明変数データ項目の標準寄与率およびセンサ値とから、目的変数データ項目の再予測値を計算すればよい。このときの再予測値は、次式(14)で表される。
Figure 2016088362
ここで、データ項目xは、当該多体相関モデルの回帰式rに含まれる説明変数データ項目を表す。また、データ項目uは、当該多体相関モデルの回帰式rに含まれる目的変数データ項目を表す。また、ハット付きのukriは、説明変数データ項目xによる、目的変数データ項目uの再予測値を表す。また、gは、回帰式rのうち特定のデータ項目にかかわる成分の値を取り出す関数である。したがって、g(x)は、回帰式rのうち、データ項目xに関する成分の値を示す。また、したがって、g(u)は、回帰式rのうち、データ項目uに関する成分の値、すなわち目的変数の過去値に関わる成分の値を示す。また、qriは、説明変数データ項目xの標準寄与率である。また、cは、回帰式rの定数項である。
また、本実施の形態において、異常判定部によって用いられる警報条件の例として、「モデル破壊が発生した相関モデルの数が、所定の数を超えたとき」といった条件を用いる例を示した。これに限らず、異常判定部は、他の警報条件を用いてもよい。例えば、警報条件は、「モデル破壊が発生した相関モデルの回帰式の優良度の累積値が、所定の値(警報閾値)を超えたとき」といった条件であってもよい。また、例えば、警報条件は、「あらかじめ設定された所定の期間にわたって、上述の優良度の累積値が警報閾値を超えたとき」といった条件であってもよい。このように、異常判定部は、警報条件として、モデル破壊情報に基づく様々な条件を適用可能である。
また、本実施の形態において、部分異常度算出部が、再予測値でもモデル破壊が発生するか否かを評価する手法として、再予測値とセンサ値との差が、その多体相関モデルの予測誤差の許容範囲内かどうか評価する例を中心に説明した。これに限らず、部分異常度算出部は、データ項目ごとに算出された再予測値用の予測誤差の許容範囲(再予測値用の閾値)を用いて、再予測値でもモデル破壊が発生するか否かを評価してもよい。つまり、同一のデータ項目であっても、多体相関モデルが異なる場合は、それぞれに対して、再予測値用の閾値を設定してもよい。この場合、部分異常度算出部は、再予測値用の閾値を、標準寄与率の算出に用いた所定の期間に対して、多体相関モデルの予測誤差の許容範囲と同じ方法で算出してもよい。
また、本実施の形態において、部分異常度算出部は、部分異常度として、0または1の2値のうち、部分異常度が高いものに1を割り当て、低いものに0を割り当てる例を中心に説明した。これに限らず、部分異常度算出部は、2値ではない値(連続値や離散値など)を部分異常度として割り当ててもよい。例えば、部分異常度算出部は、部分異常度として、本実施の形態で説明した2値の部分異常度に重みをかけたものを、部分異常度としてもよい。重みとしては、例えば、モデル破壊発生時の予測値の乖離度や、回帰式の優良度等を適用してもよい。なお、ここでいう予測値の乖離度とは、例えば、「予測誤差/予測誤差の許容範囲の下限」と「予測誤差/予測誤差の許容範囲の上限」との大きい方の値であってもよい。例えば、重みとして、モデル破壊発生時の予測値の乖離度をかける場合の部分異常度は、0または乖離度となる。なお、汎用的に異常要因特定に有用な情報を的確に抽出するという観点からは、部分異常度の定義としては、本実施の形態のように2値の定義が好ましい。一方で、特定のシステムに特化させ、より的確な情報を抽出するという観点からは、部分異常度に重みをかける方が好ましい。部分異常度にかける重みは、対象システムに対する知見に基づき、運用者によって任意の定義を設定可能である。
また、本実施の形態において、異常統計値算出部は、異常統計値として、データ項目別に部分異常度の平均値を算出する例を説明した。これに限らず、異常統計値は、異常の要因である可能性の高さと関係のある指標であればよい。例えば、異常統計値算出部は、異常統計値として、データ項目別の部分異常度の合計値を算出してもよい。なお、分析モデルの多体相関モデルに含まれる数が多いデータ項目を異常要因として抽出しやすくするという観点からは、異常統計値として、合計値を用いるのが好ましい。一方で、分析モデルの多体相関モデルに含まれる数が少ないデータ項目であっても異常要因として抽出しやすくするという観点からは、異常統計値として、平均値を用いるのが好ましい。
また、本実施の形態において、異常統計値算出部は、異常統計値として、異常要因である可能性がより高いデータ項目についてより高い値を示す異常統計値を算出するとして説明した。これに限らず、異常統計値は、異常の要因である可能性の高さと関係のある指標であればよい。例えば、異常統計値算出部は、異常統計値として、異常要因である可能性がより高いデータ項目についてより低い値を示す異常統計値を算出してもよい。
(第3の実施の形態)
次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第3の実施の形態としてのシステム分析装置3の機能ブロック構成を図11に示す。図11において、システム分析装置3は、本発明の第2の実施の形態としてのシステム分析装置2に対して、分析モデル取得部21に替えて分析モデル取得部31と、異常要因抽出部25に替えて異常要因抽出部35とを備える点が異なる。分析モデル取得部31は、本発明の第2の実施の形態における分析モデル21と同一の構成に加えて、データ項目分類部313を有する。また、システム分析装置3は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図11において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置3およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置3およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
データ項目分類部313は、状態情報に含まれるデータ項目群を分類する。分類は、分析モデルに含まれる優良多体相関モデルの少なくとも1つの回帰式に、目的変数または説明変数として含まれるデータ項目が、同一のグループとなるように行われる。なお、データ項目分類部313は、データ項目の分類手法として、特願2014−65120に記載の技術を適用してもよい。以降、同一の分類とされたデータ項目のグループを、データ項目グループとも記載する。そして、データ項目分類部313は、データ項目グループの情報を、分析モデル情報に加えて分析モデル記憶部201に保存する。
異常要因抽出部35は、分析モデル記憶部201からデータ項目グループの情報を取得する。そして、異常要因抽出部35は、データ項目グループごとに、異常要因の候補となるデータ項目を抽出して出力する。具体的には、異常要因抽出部35は、各データ項目グループに関する多体相関モデルのうちモデル破壊が発生した多体相関モデルについて、再予測値算出部251および部分異常度算出部252を用いて、説明変数データ項目別の部分異常度を算出する。ここで、各データ項目グループに関する多体相関モデルとは、そのデータ項目グループに含まれるデータ項目に関する回帰式の多体相関モデルである。そして、異常要因抽出部35は、異常統計値算出部253を用いて、データ項目グループ毎に、データ項目別に部分異常度を集計して異常統計値を算出する。そして、異常要因抽出部35は、データ項目グループ毎に、異常統計値に基づき異常要因の候補となるデータ項目を抽出する。そして、異常要因抽出部35は、データ項目グループ別に抽出した異常要因の候補となるデータ項目を、データ項目グループ別に出力する。
また、例えば、異常要因抽出部35は、データ項目グループに優先順位をつけてもよい。この場合、異常要因抽出部35は、優先順位の高いデータ項目グループから順に、異常統計値に基づき異常要因の候補として抽出したデータ項目を出力してもよい。このとき、データ項目グループの優先順位としては、そのデータ項目グループに関する多体相関モデル数が多い(または少ない)順が設定されてもよい。あるいは、データ項目グループの優先順位は、運用者によってあらかじめ定められた重要度の順であってもよい。
ここで、異常要因抽出部35が通知対象とするデータ項目グループの数は、例えば、運用者によって任意の数が設定されていてもよい。通知対象とするデータ項目グループの個数は、障害の原因を見つけられる可能性を高め、障害の全体の状況を把握するという観点からは、多いほど好ましい。一方で、誤報が発生したときの調査時間を短縮するという観点からは、通知対象とするデータ項目グループの個数は、少ないほど好ましい。
以上のように構成されたシステム分析装置3の動作について説明する。システム分析装置3の動作の概略は、図6を参照して説明した本発明の第2の実施の形態としてのシステム分析装置2の動作の概略と同様である。ただし、ステップS103における分析モデル生成動作と、ステップS109における異常要因抽出動作の詳細が異なる。
ステップS103での分析モデル生成動作の詳細を、図12に示す。
図12では、システム分析装置3は、ステップS201〜S203まで、本発明の第2の実施の形態におけるシステム分析装置2と同様に動作して、優良多体相関モデル群を生成する。
次に、データ項目分類部313は、状態情報に含まれるデータ項目群を分類する(ステップS404)。前述のように、分類は、分析モデルに含まれる優良多体相関モデルの少なくとも1つの回帰式に、目的変数または説明変数として含まれるデータ項目が、同一のグループとなるように行われる。
次に、データ項目分類部313は、ステップS203で生成された優良多体相関モデル群からなる分析モデル情報とあわせて、データ項目グループ情報を、分析モデル記憶部201に保存する(ステップS405)。
以上で、システム分析装置3は、分析モデル生成動作を終了する。
次に、ステップS109での異常要因抽出動作の詳細について説明する。システム分析装置3は、データ項目グループごとに、図8を参照して説明した本発明の第2の実施の形態における異常要因抽出動作を実行する。もし、データ項目グループに優先順位をつけている場合、システム分析装置3は、優先順位の高いデータ項目グループから順に、通知対象として定められた所定のグループ数まで、図8の動作を繰り返せばよい。
以上で、システム分析装置3は、異常要因抽出動作を終了する。
次に、本発明の第3の実施の形態の効果について述べる。
本発明の第3の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より把握しやすく通知することができる。
その理由について述べる。本実施の形態では、データ項目分類部が、被監視システムを表す状態情報を構成するデータ項目を分類してデータ項目グループを生成する。この分類は、分析モデルに含まれる優良多体相関モデルの少なくとも1つの回帰式に、目的変数または説明変数として含まれたデータ項目が、同一のグループとなるように行われる。つまり、同一のデータ項目グループには、回帰式の観点から依存関係にあるデータ項目が含まれる。また、回帰式の観点から依存関係にないデータ項目同士は、異なるデータ項目グループに含まれることになる。そして、異常要因抽出部が、データ項目グループ別に、異常要因の候補となるデータ項目を抽出して出力する。これにより、本実施の形態は、回帰式の観点から依存関係にないデータ項目を区別して、異常要因の候補となるデータ項目を通知できる。したがって、本実施の形態は、障害が複数のデータ項目グループに及ぶ場合であっても、障害全体の状況をより把握しやすく通知することができる。また、何らかの理由で、特定のデータ項目グループにおける異常統計値が、正確に計算されないケースも考えられる。このような場合でも、本実施の形態は、他のデータ項目グループで高い異常統計値をもつデータ項目を通知することができるため、異常の原因を特定するのに有用な情報を提供できる可能性を高める。
なお、本実施の形態において、データ項目分類部は、分析モデルに含まれる優良多体相関モデルの少なくとも1つの回帰式に、目的変数または説明変数として含まれるデータ項目が、同一のグループとなるようにデータ項目を分類する例を示した。これに限らず、データ項目分類部は、他のデータ項目分類手法を用いてもよい。例えば、データ項目分類部は、あらかじめ運用者によって対象システムの専門知識に基づきデータ項目が分類された結果を用いて、データ項目グループを生成してもよい。
他の例として、データ項目分類部は、K平均法やスペクトラルクラスタリングなど、データマイニングでデータ項目を分類するために用いられる手法を用いて、データ項目グループを生成してもよい。
(第4の実施の形態)
次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第4の実施の形態としてのシステム分析装置4の機能ブロック構成を図13に示す。図13において、システム分析装置4は、本発明の第2の実施の形態としてのシステム分析装置2に対して、異常要因抽出部25に替えて異常要因抽出部45を備える点が異なる。異常要因抽出部45は、異常要因抽出部25に対して、部分異常度算出部252に替えて、部分異常度算出部452を備える点が異なる。システム分析装置4は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図13において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置4およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置4およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
部分異常度算出部452は、第1のモデル破壊発生状況となった多体相関モデルと、第2のモデル破壊発生状況となった多体相関モデルとの間で、割り当てる部分異常度の最大値の比を調整する。具体的には、部分異常度算出部452は、第1のモデル破壊発生状況での多体相関モデルにおける部分異常度の最大値が、第2のモデル破壊発生状況での多体相関モデルにおける部分異常度の最大値よりも大きくなるように、部分異常度を割り当てる。前述のように、第1のモデル破壊発生状況とは、多体相関モデルにおいて、各説明変数データ項目についての再予測値が全てモデル破壊となった場合をいう。また、第2のモデル破壊発生状況とは、多体相関モデルにおいて、各説明変数データ項目についての再予測値の少なくとも1つがモデル破壊とならず、少なくとも1つがモデル破壊となった場合をいう。
例えば、部分異常度算出部452は、第1のモデル破壊発生状況となった多体相関モデルでは、次のように部分異常度を割り当てる。この場合、部分異常度算出部452は、目的変数データ項目の部分異常度が、説明変数データ項目の部分異常度より高くなるよう各部分異常度の数値を割り当てる。
また、部分異常度算出部452は、第2のモデル破壊発生状況となった多体相関モデルでは、次のように部分異常度を割り当てる。この場合、部分異常度算出部452は、再予測値がモデル破壊となった説明変数データ項目の部分異常度が、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数データ項目の部分異常度以上となるようにする。さらに、部分異常度算出部452は、再予測値がモデル破壊となった説明変数データ項目の部分異常度が、第1のモデル破壊発生状況において目的変数データ項目に割り当てられる部分異常度未満となるよう、部分異常度の数値を割り当てる。
具体例として、第1のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、目的変数データ項目の部分異常度に1を割り当て、説明変数データ項目の部分異常度に0を割り当てる。また、第2のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、再予測値がモデル破壊となった説明変数データ項目の部分異常度に0を割り当てる。また、第2のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てる。これにより、第1のモデル破壊発生状況での部分異常度の最大値(目的変数データ項目の部分異常度1)は、第2のモデル破壊発生状況での部分異常度の最大値(再予測値がモデル破壊となった説明変数データ項目の部分異常度0)より大きくなる。
また、他の具体例として、第1のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、目的変数データ項目の部分異常度に1を割り当て、説明変数データ項目の部分異常度に0を割り当てる。また、第2のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、再予測値がモデル破壊となった説明変数データ項目の部分異常度に0.5を割り当てる。また、第2のモデル破壊発生状況となった多体相関モデルにおいて、部分異常度算出部452は、目的変数データ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てる。これにより、第1のモデル破壊発生状況での部分異常度の最大値(目的変数データ項目の部分異常度1)は、第2のモデル破壊発生状況での部分異常度の最大値(再予測値がモデル破壊となった説明変数データ項目の部分異常度0.5)より大きくなる。
ここで、異常要因として絞り込んだ結果に正常なデータ項目が混入する可能性を低くするという観点について考える。このような観点からは、第1のモデル破壊発生状況での部分異常度の最大値を、第2のモデル破壊発生状況での部分異常度の最大値で割った値の絶対値が大きいほど好ましい。例えば、第2のモデル破壊発生状況での部分異常度の最大値を0とすることが最も好ましい。
また、異常要因として絞り込んだ結果に異常なデータ項目が網羅される可能性を高くするという観点について考える。このような観点からは、第1のモデル破壊発生状況での部分異常度の最大値を、第2のモデル破壊発生状況での部分異常度の最大値で割った値の絶対値が1に近いほど好ましい。
なお、部分異常度として割り当てる値は、運用者やシステムの目的に合わせて任意の定義を設定可能である。被監視システム9が異常なときのデータの蓄積がある場合には、そのデータを分析した結果から、部分異常度として割り当てる値を決定してもよい。例えば、前述の具体例のように、部分異常度算出部452は、第1のモデル破壊発生状況において、目的変数データ項目の部分異常度に1を割り当て、説明変数データ項目の部分異常度に0を割り当てるとする。また、部分異常度算出部452は、第2のモデル破壊発生状況において、目的変数のデータ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てるとする。このとき、第2のモデル破壊発生状況において、再予測値がモデル破壊となった説明変数のデータ項目の部分異常度にいくらを割り当てればよいか、被監視システム9が異常なときのデータを分析して決定することを考える。この場合、まず、異常要因として絞り込んだ結果に正常なデータ項目が混入する確率の上限値と、異常要因として絞り込んだ結果に異常なデータ項目が入らない確率の上限値とを設定する。その次に、第2のモデル破壊発生状況において、再予測値がモデル破壊となった説明変数のデータ項目に割り当てる部分異常度を0から1まで変化させる。そして、変化させた部分異常度を用いて異常要因を抽出し、異常要因として絞り込んだ結果に正常なデータ項目が混入する確率と、異常要因として絞り込んだ結果に異常なデータ項目が入らない確率とを算出する。ここで、変化させた部分異常度のうち、異常要因として絞り込んだ結果に正常なデータ項目が混入する確率が、設定した上限値を下回り、異常要因として絞り込んだ結果に異常なデータ項目が入らない確率が、設定した上限値を下回るものがあるとする。この場合、そのような部分異常度の中から、第2のモデル破壊発生状況において再予測値がモデル破壊となった説明変数のデータ項目の部分異常度に割り当てる値を選択することができる。もし、上述の上限値の少なくとも一方が満たされない場合は、その上限値を再設定するか、データ分析の条件を変更する。そして、設定した上限値の両方を満たすよう、第2のモデル破壊発生状況において再予測値がモデル破壊となった説明変数のデータ項目に割り当てる部分異常度を探索する。
また、部分異常度算出部452は、上述した部分異常度に重みをかけたものを、部分異常度としてもよい。重みとしては、例えば、モデル破壊発生時の予測値の乖離度や、回帰式の優良度等を適用してもよい。なお、ここでいう予測値の乖離度とは、例えば、「予測誤差/予測誤差の許容範囲の下限」と「予測誤差/予測誤差の許容範囲の上限」との大きい方の値であってもよい。例えば、重みとして、モデル破壊発生時の予測値の乖離度をかける場合の部分異常度は、0または乖離度となる。なお、汎用的に異常要因特定に有用な情報を的確に抽出するという観点からは、部分異常度の定義としては、2値の定義が好ましい。一方で、特定のシステムに特化させ、より的確な情報を抽出するという観点からは、部分異常度に重みをかける方が好ましい。部分異常度にかける重みは、対象システムに対する知見に基づき、運用者によって任意の定義を設定可能である。
以上のように構成されたシステム分析装置4の動作について説明する。なお、システム分析装置4の動作の概略は、図6を参照して説明した本発明の第2の実施の形態としてのシステム分析装置2の動作の概略と略同様である。ただし、ステップS109における異常要因抽出動作の詳細が異なる。
本実施の形態における異常要因抽出動作の詳細を、図14に示す。ここでは、部分異常度算出部452は、第1のモデル破壊発生状況では、目的変数データ項目の部分異常度に1を割り当て、説明変数データ項目の部分異常度に0を割り当てることとする。また、部分異常度算出部452は、第2のモデル破壊発生状況では、再予測値がモデル破壊となった説明変数のデータ項目の部分異常度に0を割り当てることとする。また、部分異常度算出部452は、第2のモデル破壊発生状況では、目的変数のデータ項目および再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度に0を割り当てることとする。
図14において、システム分析装置4の異常要因抽出動作では、図8を参照して説明した本発明の第2の実施の形態における異常要因抽出動作に対して、ステップS307に替えて、ステップS407が実行される点が異なる。
S407では、部分異常度算出部452は、モデル破壊が発生した再予測値の計算に用いた説明変数データ項目の部分異常度に0を割り当てる。
以上で、システム分析装置4は、異常要因抽出動作を終了する。
次に、本発明の第4の実施の形態の効果について述べる。
本発明の第4の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、運用者の嗜好に合わせてより的確に抽出することができる。つまり、本実施の形態は、異常要因として絞り込んだ結果において、正常なデータ項目が混入する可能性と、異常なデータ項目が網羅される可能性との度合いを、運用者の嗜好に合わせて調整したうえで、異常要因特定に有用な情報を、的確に抽出することができる。
その理由について述べる。本実施の形態では、本発明の第2の実施の形態と略同一の構成に加え、部分異常度算出部が、第1のモデル破壊発生状況での部分異常度の最大値より、第2のモデル破壊発生状況での部分異常度の最大値が小さくなるように、部分異常度を割り当てる。このように、本実施の形態は、再予測値によるモデル破壊の発生状況が異なる多体相関モデル間で部分異常度の最大値の差を調整する。その結果、本実施の形態は、異常要因として絞り込んだ結果に正常なデータ項目が混入する可能性と、異常要因として絞り込んだ結果に異常なデータ項目が網羅される可能性の度合いとを調整することができ、上述の効果を奏する。
(第5の実施の形態)
次に、本発明の第5の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第5の実施の形態としてのシステム分析装置5の機能ブロック構成を図15に示す。図15において、システム分析装置5は、本発明の第2の実施の形態としてのシステム分析装置2に対して、分析モデル取得部21に替えて分析モデル取得部51を備える点が異なる。また、分析モデル取得部51は、分析モデル取得部21に対して、多体相関モデル生成部211に替えて、多体相関モデル生成部511を備える点が異なる。システム分析装置5は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図15において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置5およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置5およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
多体相関モデル生成部511は、後述する代表データ項目が含まれるように回帰式を構成することを除いて、多体相関モデル生成部211と同様に構成される。
多体相関モデル生成部511は、状態情報に含まれるデータ項目群から、データ項目群の代表となるデータ項目である代表データ項目を選出する。そして、多体相関モデル生成部511は、その代表データ項目と、状態情報に含まれるデータ項目群のうち、その代表データ項目を除く任意の2つ以上のデータ項目とを用いて、多体相関モデルを生成する。そして、多体相関モデル生成部511は、選出した代表データ項目およびその代表データ項目を除く2つ以上のデータ項目の全ての組合せについて、3つ以上のデータ項目を用いて構成される回帰式を構築する。ここで、多体相関モデル生成部511は、それぞれの多体相関モデルを構成するために選出したデータ項目の組合せについて、すべてのデータ項目が目的変数となるようにデータ項目を入れ替えて、多体相関モデルを生成する。
なお、代表データ項目としては、その代表データ項目を含むことで、すべての多体相関モデルの予測精度を全体的に高くするものが選ばれることが望ましい。例えば、多体相関モデル生成部511は、代表データ項目の選択手法として、特願2014−65120に記載の技術を適用してもよい。
以上のように構成されたシステム分析装置5の動作について説明する。システム分析装置5の動作の概略は、図6を参照して説明した本発明の第2の実施の形態としてのシステム分析装置2の動作の概略と略同様である。ただし、ステップS103における分析モデル生成動作の詳細が異なる。
本実施の形態における分析モデル生成動作の詳細を、図16に示す。
図16では、まず、多体相関モデル生成部511は、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶部203から取得する(ステップS201)。
次に、多体相関モデル生成部511は、取得した状態系列情報を用いて、代表データ項目を選出する。そして、多体相関モデル生成部511は、代表データ項目および代表データ項目を除く2つ以上のデータ項目を含む回帰式で構成される多体相関モデル群を、分析モデルの候補として生成する(ステップS502)。
次に、モデル抽出部212は、生成された多体相関モデル群から、所定の優良モデル条件に基づいて、優良多体相関モデル群を抽出する(ステップS203)。
次に、モデル抽出部212は、得られた優良多体相関モデル群を表す分析モデル情報を、分析モデル記憶部201に記憶する(ステップS204)。
以上で、システム分析装置5は、分析モデル生成動作を終了する。
次に、本発明の第5の実施の形態の効果について述べる。
本発明の第5の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、的確に抽出することができる。
その理由について述べる。本実施の形態では、本発明の第2の実施の形態と略同一の構成に加え、多体相関モデル生成部511が、代表データ項目を含むように回帰式を生成するからである。これにより、本実施の形態は、データ項目の組み合わせ数を減らし、分析モデルの候補となる多体相関モデルの数を減らすことができる。その結果、本実施の形態は、より少ない計算資源で、分析モデルの生成および分析が可能となり、上述の効果を奏する。
(第6の実施の形態)
次に、本発明の第6の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第6の実施の形態としてのシステム分析装置6の機能ブロック構成を図17に示す。図17において、システム分析装置6は、本発明の第2の実施の形態としてのシステム分析装置2に対して、分析モデル取得部21に替えて分析モデル取得部61を備える点が異なる。分析モデル取得部61は、分析モデル取得部21に対して、多体相関モデル生成部211に替えて、多体相関モデル生成部611を備える点が異なる。さらに、分析モデル取得部61は、データ項目分類部613を有する。また、システム分析装置6は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図17において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置6およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置6およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
データ項目分類部613は、状態情報に含まれるデータ項目群を分類する。分類は、データ項目の類似度に応じて行われる。以降、同一の分類とされたデータ項目のグループを、データ項目グループとも記載する。さらにデータ項目分類部613は、データ項目グループごとに、データ項目グループの代表となるデータ項目である代表データ項目を1つ選出する。代表データ項目としては、その代表データ項目を含むことで、代表データ項目と同一データ項目グループ内のすべての多体相関モデルの予測精度を全体的に高くするものが選ばれることが望ましい。
また、データ項目分類部613は、データ項目グループの情報を、分析モデル情報に加えて分析モデル記憶部201に保存する。データ項目グループの情報には、データ項目グループの識別子と、各データ項目グループに含まれるデータ項目および代表データ項目の識別子が含まれる。
なお、データ項目分類部613は、データ項目の分類手法として、例えば、K近傍法、スペクトラルクラスタリング、または、特願2014−65120に記載の技術などのように、データの特徴からデータ項目を分類する方法を採用可能である。また、データ項目分類部613は、データ項目の分類手法として、データ項目を被監視システム9のサブシステムごとに分類する等のように、被監視システム9に対する専門知識に基づいてデータ項目を分類する方法を採用可能である。また、データ項目分類部613は、これらの分類手法を組み合わせる方法を用いてもよい。
また、データ項目分類部613は、それぞれのデータ項目グループに対する代表データ項目を選出する手法として、例えば、特願2014−65120に記載の技術など、データの特徴から代表データ項目を選出する方法を採用可能である。また、データ項目分類部613は、それぞれのデータ項目グループに対する代表データ項目を選出する手法として、被監視システム9に対する専門知識に基づいて代表データ項目を選出する方法を採用可能である。また、データ項目分類部613は、これらの選出手法を組み合わせる方法を適用してもよい。
多体相関モデル生成部611は、データ項目グループごとに、代表データ項目が含まれるように回帰式を構成することを除いて、多体相関モデル生成部211と同様に構成される。
具体的には、多体相関モデル生成部611は、データ項目分類部613からデータ項目グループと、それぞれのデータ項目グループの代表データ項目を取得する。そして、多体相関モデル生成部611は、データ項目グループごとに、次のようにして、多体相関モデルを生成する。具体的には、多体相関モデル生成部611は、そのデータ項目グループに含まれるデータ項目を対象として、代表データ項目およびその代表データ項目を除く2つ以上のデータ項目の全ての組合せについて、3つ以上のデータ項目を用いて構成される回帰式を構築する。ここで、多体相関モデル生成部611は、それぞれの多体相関モデルを構成するために選出されたデータ項目に対して、すべてのデータ項目が目的変数となるようにデータ項目を入れ替えて、多体相関モデルを生成する。
以上のように構成されたシステム分析装置6の動作について説明する。システム分析装置6の動作の概略は、図6を参照して説明した本発明の第2の実施の形態としてのシステム分析装置2の動作の概略と略同様である。ただし、ステップS103における分析モデル生成動作が異なる。
本実施の形態における分析モデル生成動作の詳細を、図18に示す。
図18では、まず、分析モデル取得部61は、分析モデルの生成に用いる所定期間分の状態系列情報を状態情報記憶部203から取得する(ステップS201)。
次に、データ項目分類部613は、取得した状態系列情報を用いて、データ項目をデータ項目グループに分類し、データ項目グループごとに代表データ項目を選出する。さらに、データ項目分類部613は、データ項目グループの情報を、分析モデル情報に加えて分析モデル記憶部201に保存する(ステップS601)。
次に、多体相関モデル生成部611は、データ項目分類部613から、データ項目グループの情報を取得する。データ項目グループの情報には、データ項目グループを表す情報と、それぞれのデータ項目グループの代表データ項目を表す情報とが含まれる。そして、多体相関モデル生成部611は、取得したデータ項目グループの情報と状態系列情報とを用いて、データ項目グループごとに、分析モデルの候補となる多体相関モデル群を生成する。具体的には、多体相関モデル生成部611は、各データ項目グループについて、代表データ項目および代表データ項目を除く2つ以上のデータ項目を含む多体相関モデル群を、分析モデルの候補として生成する(ステップS602)。
次に、モデル抽出部212は、生成された多体相関モデル群から、所定の優良モデル条件に基づいて、優良多体相関モデル群を抽出する(ステップS203)。
次に、モデル抽出部212は、得られた優良多体相関モデル群を表す分析モデル情報を、分析モデル記憶部201に記憶する(ステップS204)。
以上で、システム分析装置6は、分析モデル生成動作を終了する。
次に、本発明の第6の実施の形態の効果について述べる。
本発明の第6の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、的確に抽出することができる。
その理由について述べる。本実施の形態では、本発明の第2の実施の形態と略同一の構成に加え、データ項目分類部が、データ項目を分類するとともに、データ項目グループごとに代表データ項目を選出する。さらに、多体相関モデル生成部が、それぞれのデータ項目グループでその代表データ項目を含むように多体相関モデルを生成する。この構成により、本実施の形態は、データ項目グループ間に跨るデータ項目の組み合わせと、代表データ項目を含まないデータ項目の組み合わせとについては、多体相関モデルを生成しない。その結果、そのような組合せについての多体相関モデルは、分析モデルにも含まれない。さらに、異常検知および異常要因特定の算出過程において、利用される多体相関モデルの数が減ることになる。その結果、これらの処理をより少ない計算資源で実行できる可能性が高まる。したがって、本実施の形態は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、的確に抽出することができる、という第2の実施形態の効果を、より少ない計算資源で奏する。
(第7の実施の形態)
次に、本発明の第7の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜5の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第7の実施の形態としてのシステム分析装置7の機能ブロック構成を図19に示す。図19において、システム分析装置7は、本発明の第5の実施の形態としてのシステム分析装置5に対して、標準寄与率取得部22に替えて標準寄与率取得部72と、異常要因抽出部25に替えて異常要因抽出部75とを備える点が異なる。異常要因抽出部75は、異常要因抽出部25に対して、再予測値算出部251に替えて再予測値算出部751を備える点が異なる。さらに、異常要因抽出部75は、モデル破壊再検出部754を備える。また、システム分析装置7は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図19において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置7およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置7およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
標準寄与率取得部72は、分析モデルに含まれる各多体相関モデルに加えて、後述の再生成モデルに含まれる各再生成多体相関モデルにおいて、各説明変数データ項目の標準寄与率を取得する。
異常要因抽出部75は、異常判定部29によって被監視システム9の状態が異常と判定されると次のように動作するよう構成される。なお、上述したように、異常判定部29によってモデル破壊情報のモデル破壊情報記憶部204への登録が行われる場合、異常要因抽出部75は、モデル破壊情報記憶部204にモデル破壊情報が新たに追加されると動作するよう構成される。具体的には、異常要因抽出部75は、後述のモデル破壊再検出部754と、後述の再予測値算出部751と、部分異常度算出部252と、異常統計値算出部253とを用いて、データ項目別の異常統計値を算出する。異常要因抽出部75に含まれる各機能ブロックの構成の詳細については後述する。そして、異常要因抽出部75は、データ項目別の異常統計値がより高いものから順に、被監視システム9の異常要因の候補となるデータ項目を抽出する。例えば、異常要因抽出部75は、異常統計値が閾値以上のデータ項目を、異常要因の候補となるデータ項目として抽出してもよい。また、例えば、異常要因抽出部75は、異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出してもよい。
次に、異常要因抽出部75に含まれるモデル破壊再検出部754、再予測値算出部751の構成の詳細について説明する。
モデル破壊再検出部754は、多体相関モデル再生成部7541を含んで構成される。多体相関モデル再生成部7541は、モデル破壊情報記憶部204に新たに追加された分析モデルのモデル破壊情報に基づいて、再生成モデルを生成する。
また、モデル破壊再検出部754は、分析モデルのモデル破壊が検知された時刻における再生成モデルのモデル破壊情報を生成する。なお、再生成モデルについて生成されるモデル破壊情報は、モデル破壊情報記憶部204に記憶されるモデル破壊情報と同じ種類の情報で構成される。
多体相関モデル再生成部7541は、取得した分析モデル情報と、取得した分析モデルのモデル破壊情報とに基づいて、代表データ項目の次に代表データ項目として適したデータ項目である二次代表データ項目を選出する。そして、多体相関モデル再生成部7541は、二次代表データ項目を回帰式に含む再生成多体相関モデル群を生成する。そして、多体相関モデル再生成部7541は、再生成多体相関モデル群のうち所定の優良条件を満たす再生成優良多体相関モデル群を、再生成モデルとして生成する。再生成モデルの生成処理の詳細については、本発明の第5の実施の形態において、図16を参照して説明した代表データ項目を用いた分析モデル生成処理の説明において、代表データ項目を二次代表データ項目と読み替えることにより、同様に説明される。なお、二次代表データ項目は、回帰式に含めることで、再生成モデルの全体的な予測精度を高められるものであり、モデル破壊が検知された時刻において正常なデータ項目であることが望ましい。
多体相関モデル再生成部7541は、上記の条件にあてはまるデータ項目を二次代表データ項目として選出するための指標として、例えば、各データ項目について代表スコアおよび破壊スコアを算出してもよい。
まず、代表スコアについて説明する。多体相関モデル再生成部7541は、分析モデル情報に基づいて、代表データ項目を除くデータ項目ごとに、代表スコアを算出する。代表スコアは、そのデータ項目を含むように再生成モデルを生成することで、再生成モデルの全体的な予測精度を高められる度合を定量化したものである。例えば、代表スコアとして、特願2014−65120に記載の技術において代表データ項目を選定する際の指標を用いてもよい。
また、例えば、多体相関モデル再生成部7541は、優良相互相関モデルの回帰式の優良度Fを用いて、各データ項目の代表スコアを算出してもよい。具体的には、多体相関モデル再生成部7541は、分析モデル情報に含まれる分析モデルの学習期間の情報に基づき、分析モデルの学習期間と同じ期間の状態系列情報を状態情報記憶部203から取得する。そして、多体相関モデル再生成部7541は、その状態系列情報を用いて、2つのデータ項目を含む回帰式(相互相関モデル)を構成する。相互相関モデルの生成処理は、データ項目のすべての組み合わせに対して、本発明の第2の実施の形態において説明した相互相関モデル群生成処理と同様の手順で行われる。そして、多体相関モデル再生成部7541は、相互相関モデルの回帰式に対して、回帰式の優良度を求める。次に、多体相関モデル再生成部7541は、所定の優良モデル条件を満たす相互相関モデル群である優良相互相関モデル群を抽出する。例えば、多体相関モデル再生成部7541は、優良相互相関モデル群を抽出するための回帰式の優良度として、前述の回帰式の優良度Fを用い、優良モデル条件として、式(8)を用いてもよい。そして、多体相関モデル再生成部7541は、優良相互相関モデルの回帰式の優良度Fに基づいて、データ項目別の統計値を算出し、それを代表スコアとしてもよい。詳細には、多体相関モデル再生成部7541は、優良相互相関モデル群に含まれる相互相関モデルの回帰式の優良度Fをデータ項目ごとに累積する。つまり、多体相関モデル再生成部7541は、当該相互相関モデル群に含まれる各相互相関モデルの回帰式の優良度を、目的変数に用いられるデータ項目および説明変数に用いられるデータ項目に対応づける。そして、多体相関モデル再生成部7541は、各データ項目に対応付けた回帰式の優良度Fを累積して加算すればよい。そして、多体相関モデル再生成部7541は、このようにして各データ項目について、回帰式の優良度Fの累計値(統計値)を、代表スコアとすればよい。
次に、破壊スコアについて説明する。多体相関モデル再生成部7541は、取得した分析モデルのモデル破壊情報に基づいて、代表データ項目を除くデータ項目ごとに、破壊スコアを算出する。破壊スコアは、そのデータ項目に異常の影響が表れているとみなす確信度を定量化したものである。例えば、破壊スコアには、第4の実施の形態の異常統計値を用いてもよい。具体的には、多体相関モデル再生成部7541が、第4の実施の形態の異常統計値を算出する処理を実行し、そのデータ項目ごとの異常統計値を破壊スコアとする。また、この場合の異常統計値としては、例えば、第2の実施の形態の異常統計値を用いてもよい。
このようにして求めた代表スコアおよび破壊スコアを用いて、多体相関モデル再生成部7541は、二次代表データ項目の選出を行う。具体的には、多体相関モデル再生成部7541は、データ項目の破壊スコアが最小で、代表スコアが最大であるデータ項目を二次代表データ項目として選出する。そのようなデータ項目が複数ある場合には、例えば、多体相関モデル再生成部7541は、それらのデータ項目からランダムに二次代表データ項目を選出してもよい。
再予測値算出部751は、再予測値の算出に用いる標準寄与率とモデル情報とモデル破壊情報とが異なる点を除いて、再予測値算出部251と同様に構成される。
具体的には、再予測値算出部751は、多体相関モデル再生成部7541によって生成された再生成モデルの標準寄与率を、標準寄与率取得部72から取得する。
また、再予測値算出部751は、多体相関モデル再生成部7541によって生成された再生成モデルのモデル情報を、モデル破壊再検出部754から取得する。
また、再予測値算出部751は、取得した標準寄与率と再生成モデルのモデル情報とに基づいて、再予測値の算出式を生成する。具体的には、再予測値算出部751は、再生成モデルに含まれる再生成多体相関モデルの回帰式ごとに、再予測値の閾値と、その回帰式に含まれる各データ項目に対する再予測値の算出式とを生成する。また、再予測値算出部751は、モデル破壊再検出部754から、再生成モデルのモデル破壊情報を取得する。そして、再予測値算出部751は、再生成モデルのうちモデル破壊が発生した各再生成多体相関モデルについて、再予測値算出部251と同様の処理を行う。すなわち、再予測値算出部751は、モデル破壊が発生した各再生成多体相関モデルの回帰式について、説明変数データ項目ごとに、当該データ項目の状態情報および標準寄与率に基づいて、当該回帰式の目的変数の予測値を再予測値として算出する。
以上のように構成されたシステム分析装置7の動作について図20を用いて説明する。
図20では、まず、システム分析装置7は、ステップS101〜S108まで、本発明の第5の実施の形態と同様に動作する。なお、本発明の第5の実施の形態で説明したように、ステップS103における分析モデルの生成動作の詳細は、本発明の第2の実施の形態におけるステップS103とは異なり、図16に示した通りである。
次に、多体相関モデル再生成部754は、モデル破壊情報記憶部204に新たに記憶された分析モデルのモデル破壊情報に基づいて、再生成モデルのモデル情報を生成する。そして、モデル破壊再検出部7541は、モデル破壊情報記憶部204に新たに記憶された分析モデルのモデル破壊情報の発生時刻における、再生成モデルのモデル破壊情報を生成する(ステップS711)。このステップの詳細については後述する。
次に、標準寄与率取得部72は、再生成モデルに含まれる各再生成多体相関モデルに対する各説明変数データ項目の標準寄与率を算出する(ステップS712)。
次に、異常要因抽出部75は、1つ以上の異常要因候補データ項目を抽出する(ステップS713)。このステップの動作は、本発明の第5(第2)の実施の形態におけるステップS109の異常要因候補データ項目抽出動作に対して、異常要因抽出動作時に利用する標準寄与率とモデル情報とモデル破壊情報とが異なる。具体的には、本発明の第5(第2)の実施の形態では、異常要因抽出部25は、分析モデルの標準寄与率と、分析モデルのモデル情報と、分析モデルにおけるモデル破壊情報とを利用してステップS109を実行していた。これに対して、本実施の形態では、異常要因抽出部75は、再生成モデルの標準寄与率と、再生成モデルのモデル情報と、再生成モデルにおけるモデル破壊情報とを利用してこのステップを実行する。この点を除いて、本実施の形態におけるステップS713の動作は、本発明の第5の実施の形態におけるステップS109と処理内容が同様である。このため、ステップS713の詳細については、本実施の形態における説明を省略する。
そして、システム分析装置7は、運用を終了するという判断(ステップS110でYes)が与えられるまで、上記の動作を繰り返す。
ここで、ステップS711での再生成モデルにおけるモデル破壊情報を生成する動作の詳細を、図21に示す。
図21では、まず、モデル破壊再検出部754は、分析モデル記憶部201から分析モデル情報を取得するとともに、モデル破壊情報記憶部204からモデル破壊情報を取得する(ステップS701)。このステップで取得されるモデル破壊情報は、分析モデルについて検出されたモデル破壊情報である。
次に、モデル破壊再検出部754は、取得した分析モデル情報から、分析モデルの生成に用いられた学習期間を取得する。そして、モデル破壊再検出部754は、その学習期間に対応する状態系列情報を、状態情報記憶部203から取得する(ステップS702)。
次に、多体相関モデル再生成部7541は、モデル破壊再検出部754が取得した状態系列情報を用いて、二次代表データ項目を選出する。そして多体相関モデル再生成部7541は、選出した二次代表データ項目を含む回帰式で構成される再生成多体相関モデル群を生成する(ステップS703)。
次に、多体相関モデル再生成部7541は、再生成多体相関モデル群に対して、本発明の第2の実施の形態と略同様にステップS203を実行する。これにより、多体相関モデル再生成部7541は、再生成多体相関モデル群から、所定の優良モデル条件に基づいて再生成優良多体相関モデル群を抽出し、再生成モデルとする(ステップS203)。
次に、多体相関モデル再生成部7541は、再生成モデルのモデル情報を生成する(ステップS704)。
次に、モデル破壊再検出部754は、多体相関モデル再生成部7541から再生成モデルのモデル情報を取得する。また、モデル破壊再検出部754は、ステップS701で取得した分析モデルのモデル破壊情報から、モデル破壊の発生した時刻を取得する。そして、モデル破壊再検出部754は、分析モデルのモデル破壊発生時刻における再生成モデルのモデル破壊の有無を評価するために必要な状態系列情報を、状態情報記憶部203からモデル破壊評価用状態系列情報として取得する(ステップS705)。
次に、モデル破壊再検出部754は、再生成モデルのモデル情報とモデル破壊評価用状態系列情報とを用いて、分析モデルのモデル破壊発生時刻と同時刻のモデル破壊を評価する。そして、モデル破壊再検出部754は、評価結果に基づいて、再生成モデルのモデル破壊情報を生成し、再生成モデルのモデル情報と共に再予測値算出部751に出力する(ステップS706)。
以上で、システム分析装置7は、再生成モデルについてモデル破壊情報を生成する動作を終了する。
次に、本発明の第7の実施の形態の効果について述べる。
本発明の第7の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、より的確に抽出することができる。
その理由について述べる。本実施の形態は、本発明の第5の実施の形態との略同一の構成に加え、次のように構成される。すなわち、異常要因抽出部75は、二次代表データ項目を選出する。二次代表データ項目は、回帰式に含めることで、再生成モデルの全体的な予測精度を高められると同時に、モデル破壊が検知された時刻において正常と思われるデータ項目である。そして、異常要因抽出部75は、その二次代表データ項目を、多体相関モデルの回帰式に共通して含まれるように再生成モデルを生成する。そして、異常要因抽出部75は、その再生成モデルを用いて、異常要因にかかわるデータ項目を抽出するからである。このような構成により、本実施の形態は、個々の回帰式に含まれるデータ項目のうち、少なくとも1つは、正常なデータ項目である可能性を高めることができる。その結果、本実施の形態は、部分異常度をより正確に算出することができる可能性を高める。より正確な部分異常度の算出は、より正確な異常統計値の算出につながる。したがって、本実施の形態は、上述の効果を奏する。
なお、本実施の形態では、モデル破壊情報記憶部に、分析モデルについてのモデル破壊情報が新たに追加されたときに、異常要因抽出部が状態系列情報から再生成モデルを生成する例について説明した。これに限らず、異常要因抽出部は、あらかじめ、所定の状態系列情報から再生成モデルの候補を生成しておいてもよい。この場合、多体相関モデル再生成部は、図21に示した動作において、ステップS703およびS203に替えて、再生成モデルの候補から、選定した二次代表データ項目を有する候補を、再生成モデルとして抽出する動作を実行すればよい。また、このように、あらかじめ、所定の状態系列情報から再生成モデルの候補を生成しておく場合、各候補についての標準寄与率も同様にあらかじめ算出しておくことが可能となる。この場合、標準寄与率取得部は、図20に示した動作において、ステップS712に替えて、ステップS711で候補から抽出された再生成モデルについて、算出しておいた標準寄与率を取得する動作を実行すればよい。
また、本実施の形態では、再生成モデルを用いて異常要因の候補を抽出する例について説明した。もし、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、例えば、分析モデルを用いて異常要因の候補を抽出してもよい。
また、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、次のような情報を運用者等に通知してもよい。通知する情報は、例えば、分析モデルのうちモデル破壊が発生した優良多体相関モデルに含まれるデータ項目であってもよい。また、通知する情報は、再生成モデルのうちモデル破壊が発生した再生成優良多体相関モデルに含まれるデータ項目であってもよい。また、通知する情報は、これら双方のデータ項目であってもよい。この際に、本実施の形態は、適切に異常要因を絞り込めなかったことを合わせて通知することが望ましい。
また、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、例えば、異常要因の候補がない旨を、運用者等に通知してもよい。
また、再生成モデルを用いて異常要因の候補が抽出されなかった場合、本実施の形態は、新たな二次代表データ項目を選出してもよい。例えば、この場合、本実施の形態は、分析モデルの多体相関モデル群に含まれる回帰式に共通して含ませていないデータ項目のうち、二次代表データ項目によりふさわしいデータ項目を選出してもよい。そして、本実施の形態は、新たな二次代表データ項目を含む新たな再生成モデルを生成し、異常統計値を算出してもよい。さらに、本実施の形態は、このような処理を、異常要因の候補が出るまで繰り返すことにより、その結果得られた異常要因の候補を運用者等に通知してもよい。
また、本実施の形態では、データ項目に異常の影響が表れているとみなす確信度として前述の破壊スコアを算出する例について説明した。この他、本実施の形態は、データ項目に異常の影響が表れているとみなす確信度として、他の定義にしたがう指標を算出してもよい。例えば、そのような確信度は、データ項目を1つまたは2つ含むモデルによって構成される分析モデルのモデル破壊情報から算出されることも可能である。
また、上述した本発明の各実施の形態では、異常要因の候補のみ、または異常要因の候補をそのスコアと共に運用者等に通知する方法を説明した。さらに、本実施の形態では、これらの情報に加えて、二次代表データ項目の破壊スコアを、二次代表データ項目の破壊スコアと分かるように運用者等に通知してもよい。破壊スコアを確認することで、運用者は、二次代表データ項目に求められる条件を満たしているか確認できる。
また、本実施の形態では、本発明の第5の実施の形態に対して、再生成モデルに基づき異常要因の候補を抽出する構成を適用する例について説明した。この他、再生成モデルに基づき異常要因の候補を抽出する本実施の形態の構成は、本発明の第6の実施の形態に対して適用することもできる。この場合、多体相関モデル再生成部は、データ項目グループごとに、二次代表データ項目を選出し、データ項目グループ毎の再生成優良多体相関モデル群を合せて再生成モデルとすればよい。
(第8の実施の形態)
次に、本発明の第8の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1〜7の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
本発明の第8の実施の形態としてのシステム分析装置8の機能ブロック構成を図22に示す。図22において、システム分析装置8は、本発明の第7の実施の形態としてのシステム分析装置7に対して、異常要因抽出部75に替えて異常要因抽出部85を備える点が異なる。異常要因抽出部85は、異常要因抽出部75に対して、再予測値算出部751に替えて再予測値算出部851を備える点が異なる。また、システム分析装置8は、被監視システム9に接続される。なお、被監視システム9の詳細については、本発明の第1の実施の形態における被監視システム9と同様の構成であるため、本実施の形態における説明を省略する。また、図22において、機能ブロックを示す矩形間を結ぶ矢印の向きは、一例を示すものであり、機能ブロック間の信号の向きを限定するものではない。また、システム分析装置8およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。なお、システム分析装置8およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
異常要因抽出部85は、異常判定部29によって被監視システム9の状態が異常と判定されると動作するよう構成される。なお、上述したように、異常判定部29によってモデル破壊情報のモデル破壊情報記憶部204への登録が行われる場合、異常要因抽出部85は、モデル破壊情報記憶部204にモデル破壊情報が新たに追加されると動作するよう構成される。具体的には、異常要因抽出部85は、同一時刻に対する複数のモデル破壊情報の各々に対して、モデル破壊再検出部754と、後述の再予測値算出部851と、部分異常度算出部252と、異常統計値算出部253とを用いて、データ項目別の異常統計値を算出する。
ここで、同一時刻に対する複数のモデル破壊情報とは、被監視システム9の状態情報に基づく異なる構成の複数の多体相関モデル群について、同一時刻において検出されるモデル破壊を表す情報である。例えば、同一時刻に対する複数のモデル破壊情報は、分析モデルについてのモデル破壊情報と、再生成モデルについてのモデル破壊情報とであってもよい。本発明の第7の実施の形態で説明したように、再生成モデルについてのモデル破壊情報は、分析モデルについてのモデル破壊情報のモデル破壊発生時刻に関して生成されたものである。したがって、これらのモデル破壊情報は、同一時刻に対する複数のモデル破壊情報に相当する。
また、異常要因抽出部85は、各モデル破壊情報に基づき算出されたデータ項目別の異常統計値に基づいて、データ項目別の最終的な異常統計値を算出する。異常要因抽出部85に含まれる各機能ブロックの構成の詳細については後述する。そして、異常要因抽出部85は、データ項目別の最終的な異常統計値がより高いものから順に、被監視システム9の異常要因の候補となるデータ項目を抽出する。例えば、異常要因抽出部85は、最終的な異常統計値が所定の閾値以上のデータ項目を、異常要因の候補となるデータ項目として抽出してもよい。また、例えば、異常要因抽出部85は、最終的な異常統計値が高いものから順に所定数のデータ項目を、異常要因候補として抽出してもよい。異常要因の候補となるデータ項目を抽出する際の、最終的な異常統計値に関する閾値やデータ項目数は、運用者が任意の数値を設定することができる。
ここで、同一時刻に対する複数のモデル破壊情報から、データ項目別の最終的な異常統計値を算出する処理の具体例について説明する。例えば、異常要因抽出部85は、全てのモデル破壊情報にわたってその異常統計値が閾値以上となっているデータ項目については、全てのモデル破壊情報におけるそのデータ項目についての異常統計値の統計量を、そのデータ項目の最終的な異常統計値とする。また、異常要因抽出部85は、少なくとも一部のモデル破壊情報でその異常統計値が閾値以上となっていないデータ項目については、異常統計値がとりうる最小値を、そのデータ項目の最終的な異常統計値とする。このとき、一部のモデル破壊情報から当該データ項目の異常統計値が算出されない場合、異常要因抽出部85は、そのデータ項目の異常統計値に異常統計値がとりうる最小値を割り当てた後、上述の処理を実行する。なお、最終的な異常統計値を求めるための異常統計値の統計量としては、複数のモデル破壊情報のそれぞれに対するデータ項目別の異常統計値に基づいて、より異常と思われるデータ項目の異常統計値が高くなる統計量であれば、どのような統計量を用いてもよい。例えば、異常統計値の統計量としては、総和、最大値、最小値、平均値、中央値のいずれか一つを用いてもよい。
また、同一時刻に対する複数のモデル破壊情報からデータ項目別の最終的な異常統計値を算出する処理の他の具体例について説明する。この具体例は、同一時刻に対する複数のモデル破壊情報を生成した各モデルが、本発明の第5〜7の実施の形態のように、代表データ項目を含むように生成される場合に用いることが可能である。統一的に説明するため、データ項目が分類され、そのデータ項目グループごとに、代表データ項目が選出されるものとして説明する。データ項目が分類されない場合は、データ項目グループの数が1つの場合に対応する。ここで、データ項目グループごとに、代表データ項目がN個選出されたとする(Nは整数)。つまり、例えば、多体相関モデル再生成部7541が、データ項目グループ毎に、分析モデルの生成に用いられた代表データ項目(一次代表データ項目)以外のデータ項目のうち、二次代表データ項目からN次代表データ項目までを選出したとする。そして、多体相関モデル再生成部7541が、データ項目グループ毎に、二次代表データ項目からN次代表データ項目までをそれぞれ代表データ項目として、N−1個の再生成優良多体相関モデル群を生成したとする。そして、モデル破壊再検出部754が、データ項目グループ毎のN−1個の再生成優良多体相関モデル群のそれぞれにおいて、分析モデルでのモデル破壊発生時刻と同一時刻におけるモデル破壊情報を生成したとする。なお、モデル破壊検出部24は、データ項目グループ毎に一次代表データ項目を代表データ項目として生成された優良多体相関モデル群について、それぞれモデル破壊情報を生成しているとする。これにより、データ項目グループ毎に、同一時刻に対するN個のモデル破壊情報が生成される。ここでは、各データ項目グループの一次代表データ項目を代表データ項目として生成された優良多体相関モデル群のモデル破壊情報を、「一次代表データ項目に基づくモデル破壊情報」とも記載する。また、各データ項目グループのn次代表データ項目を代表データ項目として生成された再生成優良多体相関モデル群のモデル破壊情報を、「n次代表データ項目に基づくモデル破壊情報」とも記載する。ただし、nは、2以上N以下の整数である。このとき、異常要因抽出部85は、データ項目別の最終的な異常統計値を、以下のように算出してもよい。例えば、異常要因抽出部85は、あるデータ項目グループのn次代表データ項目に基づくモデル破壊情報におけるn次データ項目の異常統計値と、そのデータ項目グループの一次代表データ項目に基づくモデル破壊情報におけるn次代表データ項目の異常統計値とを比較する。そして、異常要因抽出部85は、それらの異常統計値のうち最小値を、そのデータ項目グループのn次代表データ項目の最終的な異常統計値とする。この処理の例を、データ項目グループが1つであり、二次代表データ項目までが選出され、一次代表データ項目に基づくモデル破壊情報および二次代表データ項目に基づくモデル破壊情報が生成された場合について、具体的に説明する。この場合、異常要因抽出部85は、一次代表データ項目に基づくモデル破壊情報における二次代表データ項目の異常統計値と、二次代表データ項目に基づくモデル破壊情報における二次代表データ項目の異常統計値とを比較する。そして、異常要因抽出部85は、これらの異常統計値のより小さい方を、二次代表データ項目の最終的な異常統計値とする。同様に、異常要因抽出部85は、各データ項目について、このような処理を用いて最終的な異常統計値を算出してもよい。
次に、異常要因抽出部85に含まれる再予測値算出部851の構成の詳細について説明する。
再予測値算出部851は、同一時刻に対する複数のモデル破壊情報のそれぞれに対して、データ項目別の再予測値を算出する。例えば、前述のように、同一時刻に対する複数のモデル破壊情報として、分析モデルについてのモデル破壊情報と、再生成モデルについてのモデル破壊情報とを適用する場合を想定する。この場合、再予測値算出部851は、本発明の第2の実施の形態における再予測値算出部251と同様に、モデル破壊情報記憶部204へ新たに登録された分析モデルのモデル破壊情報について、再予測値を算出する。また、さらに、再予測値算出部851は、本発明の第7の実施の形態における再予測値算出部751と同様に、分析モデルのモデル破壊情報と同一のモデル破壊発生時刻に対応する再生成モデルのモデル破壊情報について、再予測値を算出する。
以上のように構成されたシステム分析装置8の動作について図面を参照して説明する。なお、システム分析装置8の動作の概略については、図20を参照して説明した本発明の第7の実施の形態としてのシステム分析装置7の動作の概略と略同様である。ただし、ステップS713における異常要因抽出動作の詳細が異なる。
本実施の形態における異常要因抽出動作を図23に示す。
まず、異常要因抽出部85は、モデル破壊情報記憶部204へ新たに登録された分析モデルのモデル破壊情報に基づいて、データ項目別の異常統計値を算出する(ステップS801)。このステップの詳細は、再予測値算出部851と、部分異常度算出部252と、異常統計値算出部253とによって、図8に示したステップS301〜S309と略同様に実行される。
次に、異常要因抽出部85は、モデル破壊情報記憶部204へ新たに登録された分析モデルと同一のモデル破壊発生時刻に対応して生成された再生成モデルのモデル破壊情報に基づいて、データ項目別の異常統計値を算出する(ステップS802)。このステップの詳細は、再予測値算出部851と、部分異常度算出部252と、異常統計値算出部253とによって、再生成モデルに関して、図8に示したステップS301〜S309と略同様に実行される。
次に、異常要因抽出部85は、ステップS801およびS802でそれぞれ算出されたデータ項目別の異常統計値に基づいて、データ項目別の最終的な異常統計値を算出する(ステップS803)。
次に、異常要因抽出部85は、各データ項目の最終的な異常統計値に基づいて、異常要因の候補となるデータ項目を抽出し、通知する(ステップS804)。例えば、前述のように、異常要因抽出部85は、最終的な異常統計値が閾値より高いものを抽出し、異常要因候補として通知してもよい。また、例えば、異常要因抽出部85は、最終的な異常統計値が高いものから順に所定数のデータ項目を異常要因候補として抽出し通知してもよい。
以上で、異常要因抽出部85は、異常要因抽出動作を終了する。
なお、本実施の形態では、本発明の第7の実施の形態に対して、複数のモデル破壊情報に基づいて最終的な異常要因の候補を抽出する構成を適用する例について説明した。これに限らず、複数のモデル破壊情報に基づいて最終的な異常要因の候補を抽出する本実施の形態の構成を、本発明の第6の実施の形態に対して適用してもよい。この場合、多体相関モデル再生成部は、データ項目グループごとに、二次代表以降の代表データ項目を選出する。そして、多体相関モデル再生成部は、データ項目グループごとに二次代表以降の代表データ項目ごとに生成される複数の再生成優良多体相関モデル群を合わせて、本実施の形態における再生成モデルとすればよい。ただし、最終的な異常統計値を出す処理によっては、それぞれの再生成優良多体相関モデル群は、いずれのデータ項目を代表データ項目として生成されたものであるかを区別できるようになっている必要がある。
次に、本発明の第8の実施の形態の効果について述べる。
本発明の第8の実施の形態としてのシステム分析装置は、異常によるセンサ値の変化が僅かで、その変化が複数のセンサに現れたとしても、異常要因特定に有用な情報を、より少ない計算資源で、より的確に抽出することができる。
その理由について述べる。本実施の形態では、本発明の第7の実施の形態と略同一の構成に加え、異常要因抽出部が、代表データ項目の異なる優良多体相関モデル群に対する複数のモデル破壊情報から、最終的な異常要因の候補を抽出する。このように、本実施の形態は、同一時刻に対する複数のモデル破壊情報を用いることにより、多面的異常をとらえることができる。また、それだけではなく、本実施の形態では、それら複数のモデル破壊情報が、モデル破壊情報による異常要因の抽出結果の精度が高くなるように構成された優良多体相関モデル群および再生成優良多体相関モデル群から算出されたものである。したがって、本実施の形態において、それら複数のモデル破壊情報を総合して得られた異常要因の抽出結果は、より的確な結果である可能性が高まる。よって本実施の形態は上述の効果を奏する。
なお、本実施の形態では、同一時刻に対する複数のモデル破壊情報として、分析モデルについてのモデル破壊情報と、再生成モデルについてのモデル破壊情報とを用いる例について説明したが、これらに限らない。例えば、同一時刻に対する複数のモデル破壊情報として、これらのモデル破壊情報に加えて、代表データ項目または二次代表データ項目が異なる優良多体相関モデル群についてのモデル破壊情報を加えてもよい。例えば、具体的には、多体相関モデル再生成部は、代表データ項目または二次代表データ項目として選出されていないデータ項目から、既に選出済みの二次代表データ項目よりふさわしいデータ項目を、新たな二次代表データ項目として選出してもよい。そして、多体相関モデル再生成部は、新たな二次代表データ項目を含む新たな再生成モデルを生成してもよい。これにより、モデル破壊再検出部は、新たな再生成モデルについてモデル破壊情報を生成してもよい。このような処理を所定の回数、繰り返すことにより、本実施の形態は、同一時刻に対して、3つ以上のモデル破壊情報を生成可能となる。なお、この処理の繰り返し回数は、運用者が任意に設定してもよい。ただし、新たに選出された二次代表データ項目の破壊スコアが、最初に選出された二次代表データ項目の破壊スコアと等しくなければ、その新たに選出された二次代表データ項目による異常要因の抽出結果の精度が低下する。その観点では、上記処理の繰り返し処理は、新たに選出された二次代表データ項目の破壊スコアと、最初に選出された二次代表データ項目の破壊スコアとが略同一である範囲に限定することが好ましい。また、二次代表データ項目の代表スコアは高いほど、異常要因の抽出結果の精度が高いことが期待できる。そこで、新たに選出された二次代表データ項目の代表スコアと、最初に選出された二次代表データ項目の代表スコアとの差が大きい場合は、新たに選出された二次代表データ項目を用いたモデル破壊情報の生成を中止した方が好ましい。
また、本発明の第2および第3の実施の形態において、標準寄与率が、分析モデルの生成に用いられた所定期間の状態系列情報を用いて算出される場合を中心に説明した。この場合、標準寄与率取得部は、図6において、ステップS103で分析モデルを生成後、ステップS104で標準寄与率を算出していた。これに限らず、標準寄与率取得部は、モデル破壊検出後に、モデル破壊が発生した各多体相関モデルについて標準寄与率を算出してもよい。例えば、前述のように、標準寄与率は、モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に対して所定条件を満たす値を持つ期間の状態系列情報を用いて算出可能である。あるいは、前述のように、標準寄与率は、モデル破壊の発生した時点より以前の(例えば直前の)所定期間の状態系列情報を用いて算出可能である。このような場合、各実施の形態における標準寄与率取得部は、図6のステップS104で標準寄与率を算出する代わり、図8における多体相関モデル毎の繰り返し処理において、ステップS301の再予測値算出処理の前に、標準寄与率算出処理を行えばよい。
また、本発明の第2から第8の実施の形態において、優良多体相関モデルの回帰式の優良度が、当該モデルの構築に用いられた状態情報から算出される場合を説明した。これに限らず、優良多体相関モデルの回帰式の優良度は、当該モデルの構築に用いられていない状態情報から算出されてもよい。例えば、各実施の形態において、分析モデル取得部またはモデル破壊再検出部は、当該モデルの構築に用いられていない状態情報から、個々の回帰式の優良度Fを算出してもよい。他の例として、分析モデル取得部またはモデル破壊再検出部は、当該モデルの構築に用いられていない状態情報から、多体相関モデルのモデル破壊情報を生成し、そのモデル破壊情報から、個々の回帰式の優良度を算出してもよい。モデル破壊情報から個々の回帰式の優良度を求める場合、例えば、1−(当該回帰式がモデル破壊となった頻度)/(モデル破壊情報の生成に用いられた状態情報のインデックス数)を回帰式の優良度とすることが可能である。状態情報のインデックス数の考え方は、優良度Fの算出方法を説明した箇所に具体的な説明がある。また、分析モデル取得部またはモデル破壊再検出部は、当該モデルの構築に用いられた状態情報から算出された個々の回帰式の優良度と、当該モデルの構築に用いられていない状態情報から算出された個々の回帰式の優良度とに基づいて、優良多体相関モデルを抽出してもよい。複数の優良度を用いて優良多体相関モデルを抽出する場合の例について説明する。ここでは、2つの優良度を用いることを想定する。1つめの優良度は優良度Fであり、2つめの優良度は、1−(当該回帰式がモデル破壊となった頻度)/(モデル破壊情報の生成に用いられた状態情報のインデックス数)であるとする。この場合、分析モデル取得部またはモデル破壊再検出部は、それら2つの優良度が、それぞれの優良度に対してあらかじめ設定された閾値を超えたものを優良多体相関モデルとしてよい。これらの閾値は、運用者によって任意に設定可能である。
また、本発明の第4から第8の実施の形態において、標準寄与率が、分析モデルの生成に用いられた所定期間の状態系列情報を用いて算出される場合を中心に説明した。この場合、標準寄与率取得部は、図6において、ステップS103で分析モデルを生成後、ステップS104で標準寄与率を算出していた。これに限らず、標準寄与率取得部は、モデル破壊検出後に、モデル破壊が発生した各多体相関モデルについて標準寄与率を算出してもよい。例えば、前述のように、標準寄与率は、モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に対して所定条件を満たす値を持つ期間の状態系列情報を用いて算出可能である。あるいは、前述のように、標準寄与率は、モデル破壊の発生した時点より以前の(例えば直前の)所定期間の状態系列情報を用いて算出可能である。このような場合、各実施の形態における標準寄与率取得部は、図6のステップS104で標準寄与率を算出する代わり、図8における多体相関モデル毎の繰り返し処理において、ステップS301の再予測値算出処理の前に、標準寄与率算出処理を行えばよい。
また、上述した本発明の各実施の形態において、異常要因抽出部は、異常要因の候補となるデータ項目群を示す情報として、データ項目の名称を通知する例を示した。さらに、異常要因抽出部は、異常要因の候補となるデータ項目について異常統計値も通知するようにしてもよい。この場合、本実施の形態は、通知対象の運用者等に対して、より優先的に確認すべきデータ項目を示すことができる。その他、各実施の形態の異常要因抽出部は、異常要因の候補となるデータ項目群を表す情報として、他の情報を出力してもよい。
また、上述した本発明の各実施の形態において、被監視システムが発電プラントである例を示した。これに限らず、被監視システムは、その状態を示す情報から1つ以上の多体相関モデルを生成可能であり、かつ、1つ以上の多体相関モデルのモデル破壊により異常の発生有無を判定可能なシステムであれば、その他のシステムであってもよい。例えば、被監視システムは、IT(Information Technology)システム、プラントシステム、構造物、輸送機器等であってもよい。この場合でも、各実施の形態のシステム分析装置は、そのような被監視システムの状態を示す情報に含まれるデータの種目をデータ項目として、分析モデルを生成し、モデル破壊の検出および異常要因データ項目の抽出を行うことが可能である。
また、上述した本発明の各実施の形態において、システム分析装置の各機能ブロックが、記憶装置またはROMに記憶されたコンピュータ・プログラムを実行するCPUによって実現される例を中心に説明した。これに限らず、各機能ブロックの一部、全部、または、それらの組合せが専用のハードウェアにより実現されていてもよい。
また、上述した本発明の各実施の形態において、情報受信装置の機能ブロックは、複数の装置に分散されて実現されてもよい。
また、上述した本発明の各実施の形態において、各フローチャートを参照して説明したシステム分析装置の動作を、本発明のコンピュータ・プログラムとしてコンピュータ装置の記憶装置(記憶媒体)に格納しておいてもよい。そして、係るコンピュータ・プログラムを当該CPUが読み出して実行するようにしてもよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコードあるいは記憶媒体によって構成される。
また、上述した各実施の形態は、適宜組合せて実施されることが可能である。
以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
この出願は、2014年12月5日に出願された日本出願特願2014−246936号および2015年2月17日に出願された日本出願特願2015−028450を基礎とする優先権を主張し、その開示の全てをここに取り込む。
1、2、3、4、5、6、7、8 システム分析装置
9 被監視システム
90 被監視装置
11、21、31、51、61 分析モデル取得部
12、22、72 標準寄与率取得部
13、23 状態情報収集部
14、24 モデル破壊検出部
15、25、35、45、75、85 異常要因抽出部
29 異常判定部
151、251、751、851 再予測値算出部
152、252、452 部分異常度算出部
153、253 異常統計値算出部
211、511、611 多体相関モデル生成部
212 モデル抽出部
313、613 データ項目分類部
201 分析モデル記憶部
203 状態情報記憶部
204 モデル破壊情報記憶部
9a 多体相関モデル群
9b 優良モデル条件
9c 優良多体相関モデル群
1001 CPU
1002 メモリ
1003 出力装置
1004 入力装置
1005 ネットワークインタフェース

Claims (22)

  1. 被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを1つ以上含む分析モデルを取得する分析モデル取得手段と、
    前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得する標準寄与率取得手段と、
    前記状態情報を収集する状態情報収集手段と、
    収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出するモデル破壊検出手段と、
    前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出する再予測値算出手段と、
    前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出する部分異常度算出手段と、
    前記部分異常度を前記データ項目別に集計して異常統計値を算出する異常統計値算出手段と、
    前記再予測値算出手段、前記部分異常度算出手段および前記異常統計値算出手段を用いて、前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する異常要因抽出手段と、
    を備えたシステム分析装置。
  2. 前記分析モデル取得手段は、
    前記状態情報収集手段によって収集される状態情報の時系列に基づいて、前記状態情報を構成するデータ項目から、目的変数として任意の1つのデータ項目と、説明変数として任意の2つ以上のデータ項目とを選出し、選出した目的変数および説明変数の組合せ毎に、3つ以上のデータ項目を含む回帰式を構築するとともに、当該回帰式の予測誤差の許容範囲を算出し、構築した前記回帰式と、該回帰式の予測誤差の許容範囲とを含む前記多体相関モデルを生成する多体相関モデル生成手段と、
    前記多体相関モデル生成手段によって生成された多体相関モデル群の中から、所定の優良条件を満たす多体相関モデルである優良多体相関モデルの群を抽出して前記分析モデルを構成するモデル抽出手段と、
    を含むことを特徴とする請求項1に記載のシステム分析装置。
  3. 前記モデル破壊の検出結果に基づき前記被監視システムが異常であるか否かを判定する異常判定手段をさらに備え、
    前記異常要因抽出手段は、前記異常判定手段により前記被監視システムが異常であると判定された場合に、前記異常要因の候補となるデータ項目を抽出して出力することを特徴とする請求項1または請求項2に記載のシステム分析装置。
  4. 前記部分異常度算出手段は、前記多体相関モデルの前記再予測値が全てモデル破壊となった場合(第1のモデル破壊発生状況)と、前記多体相関モデルの前記再予測値の少なくとも1つがモデル破壊とならず少なくとも1つがモデル破壊となった場合(第2のモデル破壊発生状況)とで、該多体相関モデルに含まれる各データ項目に対する前記部分異常度の割り当て方を変更することを特徴とする請求項1から請求項3のいずれか1項に記載のシステム分析装置。
  5. 前記部分異常度算出手段は、前記第1のモデル破壊発生状況となった多体相関モデルでは、目的変数のデータ項目の部分異常度が、説明変数のデータ項目の部分異常度より高くなるよう各部分異常度の数値を割り当て、前記第2のモデル破壊発生状況となった多体相関モデルでは、前記再予測値がモデル破壊となった説明変数のデータ項目の部分異常度が、目的変数のデータ項目および前記再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度より高くなるよう、各部分異常度の数値を割り当てることを特徴とする請求項4に記載のシステム分析装置。
  6. 前記部分異常度算出手段は、前記第1のモデル破壊発生状況となった多体相関モデルでは、目的変数のデータ項目の部分異常度が、説明変数のデータ項目の部分異常度より高くなるよう各部分異常度の数値を割り当て、前記第2のモデル破壊発生状況となった多体相関モデルでは、前記再予測値がモデル破壊となった説明変数のデータ項目の部分異常度が、目的変数のデータ項目および前記再予測値がモデル破壊とならなかった説明変数のデータ項目の部分異常度以上、前記第1のモデル破壊発生状況で目的変数のデータ項目に割り当てられる部分異常度未満になるよう、各部分異常度の数値を割り当てることを特徴とする請求項4に記載のシステム分析装置。
  7. 前記部分異常度算出手段は、前記各データ項目の部分異常度として、定められた2値のいずれかを割り当てることを特徴とする請求項1から請求項6のいずれか1項に記載のシステム分析装置。
  8. 前記分析モデル取得手段は、前記データ項目から代表データ項目を選出し、前記代表データ項目と、該代表データ項目を除く2つ以上のデータ項目とからなる1つ以上の多体相関モデルを、前記分析モデルとして生成することを特徴とする請求項1から請求項7のいずれか1項に記載のシステム分析装置。
  9. 前記データ項目を分類して、1つ以上のデータ項目グループを生成するデータ項目分類手段をさらに備え、
    前記分析モデル取得手段は、前記データ項目グループごとに、前記代表データ項目を選出し、選出した代表データ項目と、該データ項目グループのうち該代表データ項目を除く2つ以上のデータ項目とからなる優良多体相関モデルを生成し、データ項目グループ毎に生成した優良多体相関モデルを合せて、前記分析モデルとすることを特徴とする請求項8に記載のシステム分析装置。
  10. 前記代表データ項目を除いたデータ項目から二次代表データ項目を選出し、前記二次代表データ項目と、前記二次代表データ項目を除く2つ以上のデータ項目とからなる再生成多体相関モデルを1つ以上含む再生成モデルを生成する多体相関モデル再生成手段と、
    前記モデル破壊の発生時刻と同一時刻において、前記再生成モデルにモデル破壊が発生したか否かを検出するモデル破壊再検出手段と、
    をさらに備え、
    前記再予測値算出手段は、モデル破壊が発生した前記各再生成多体相関モデルについて、該再生成多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出し、
    前記部分異常度算出手段は、算出した各再予測値によるモデル破壊の発生の有無に基づいて、前記再生成多体相関モデルごとの前記データ項目別の部分異常度を算出することを特徴とする請求項8に記載のシステム分析装置。
  11. 前記データ項目を分類して、1つ以上のデータ項目グループを生成するデータ項目分類手段をさらに備え、
    前記多体相関モデル再生成手段は、前記データ項目グループごとに、該データ項目グループに対応する前記代表データ項目を除いたデータ項目から前記二次代表データ項目を選出し、選出した二次代表データ項目と、該データ項目グループのうち前記二次代表データ項目を除く2つ以上のデータ項目とからなる再生成多体相関モデルを1つ以上含む再生成多体相関モデル群を生成し、データ項目グループ毎に生成した再生成多体相関モデル群を合せて、前記再生成モデルとすることを特徴とする請求項10に記載のシステム分析装置。
  12. 前記異常要因抽出手段は、前記状態情報に基づく異なる構成の複数の多体相関モデル群について、それぞれ同一時刻におけるモデル破壊の情報に基づいてデータ項目別の前記異常統計値を算出し、複数の前記多体相関モデル群についてのデータ項目別の前記異常統計値を用いて、データ項目別の最終的な異常統計値を算出し、最終的な異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力することを特徴とする請求項1から請求項11のいずれか1項に記載のシステム分析装置。
  13. 前記分析モデル取得手段は、前記データ項目を分類して1つ以上のデータ項目グループを生成し、
    前記異常要因抽出手段は、前記データ項目グループごとに、前記異常要因の候補となるデータ項目を抽出することを特徴とする請求項1から請求項12のいずれか1項に記載のシステム分析装置。
  14. 前記データ項目分類手段は、前記分析モデルを構成する少なくとも1つの多体相関モデルの回帰式に目的変数または説明変数として含まれるデータ項目が同一のグループとなるように、前記データ項目グループを生成することを特徴とする請求項13に記載のシステム分析装置。
  15. 前記分析モデル取得手段は、前記分析モデルとして、前記各多体相関モデルの回帰式に説明変数として2つのデータ項目が含まれる分析モデルを取得することを特徴とする請求項1から請求項14のいずれか1項に記載のシステム分析装置。
  16. 前記標準寄与率取得手段は、前記各多体相関モデルの回帰式の説明変数に含まれる各データ項目について、該データ項目に関する成分を、定数項を除く全成分で除算することにより、前記標準寄与率を算出することを特徴とする請求項1から請求項15のいずれか1項に記載のシステム分析装置。
  17. 前記標準寄与率取得手段は、前記状態情報の時系列を用いて、目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合の統計量を、前記標準寄与率として算出することを特徴とする請求項1から請求項16のいずれか1項に記載のシステム分析装置。
  18. 前記標準寄与率取得手段は、前記分析モデルの生成に用いられた状態情報の時系列を用いて、前記標準寄与率を算出することを特徴とする請求項17に記載のシステム分析装置。
  19. 前記標準寄与率取得手段は、前記モデル破壊が発生した多体相関モデルの目的変数に対応するデータ項目について、当該モデル破壊を発生させた状態情報の値に対して所定条件を満たす値を持つ期間の状態情報の時系列を用いて、前記標準寄与率を算出することを特徴とする請求項17に記載のシステム分析装置。
  20. 前記標準寄与率取得手段は、前記モデル破壊を発生させた状態情報の計測時刻より以前の所定期間に含まれる状態情報の時系列を用いて、前記標準寄与率を算出することを特徴とする請求項17に記載のシステム分析装置。
  21. コンピュータ装置が、
    被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを1つ以上含む分析モデルを取得し、
    前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得し、
    前記状態情報を収集し、
    収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出し、
    前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出し、
    前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出し、
    前記部分異常度を前記データ項目別に集計して異常統計値を算出し、
    前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力するシステム分析方法。
  22. 被監視システムの状態を表す状態情報を構成する複数のデータ項目の少なくとも一部に基づく多体相関モデルを1つ以上含む分析モデルを取得する分析モデル取得ステップと、
    前記各多体相関モデルについて、その回帰式の目的変数の予測値に対して、説明変数に含まれる各データ項目が寄与する割合を表す標準寄与率を取得する標準寄与率取得ステップと、
    前記状態情報を収集する状態情報収集ステップと、
    収集された前記状態情報に対して前記分析モデルを適用することにより、前記各多体相関モデルにモデル破壊が発生したか否かを検出するモデル破壊検出ステップと、
    前記モデル破壊が発生した各多体相関モデルについて、当該多体相関モデルの回帰式に説明変数として含まれるデータ項目ごとに、当該データ項目の状態情報および前記標準寄与率に基づいて、当該回帰式の目的変数の再予測値を算出する再予測値算出ステップと、
    前記各再予測値による前記モデル破壊の発生の有無に基づいて、前記多体相関モデルごとの前記データ項目別の異常度を表す部分異常度を算出する部分異常度算出ステップと、
    前記部分異常度を前記データ項目別に集計して異常統計値を算出する異常統計値算出ステップと、
    前記異常統計値に基づき前記被監視システムの異常要因の候補となるデータ項目を抽出して出力する異常要因抽出ステップと、
    をコンピュータ装置に実行させるシステム分析プログラムを記憶した記憶媒体。
JP2016562301A 2014-12-05 2015-12-01 システム分析装置、システム分析方法およびプログラム Active JP6658540B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2014246936 2014-12-05
JP2014246936 2014-12-05
JP2015028450 2015-02-17
JP2015028450 2015-02-17
PCT/JP2015/005967 WO2016088362A1 (ja) 2014-12-05 2015-12-01 システム分析装置、システム分析方法および記憶媒体

Publications (2)

Publication Number Publication Date
JPWO2016088362A1 true JPWO2016088362A1 (ja) 2017-09-07
JP6658540B2 JP6658540B2 (ja) 2020-03-04

Family

ID=56091324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016562301A Active JP6658540B2 (ja) 2014-12-05 2015-12-01 システム分析装置、システム分析方法およびプログラム

Country Status (3)

Country Link
US (1) US10719577B2 (ja)
JP (1) JP6658540B2 (ja)
WO (1) WO2016088362A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117671554A (zh) * 2023-10-20 2024-03-08 上海盈蝶智能科技有限公司 一种安防监控方法及系统

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6772809B2 (ja) * 2016-12-14 2020-10-21 株式会社Ihi 情報処理装置及び情報処理方法
JP6740157B2 (ja) 2017-03-13 2020-08-12 株式会社東芝 解析装置、解析方法、及び、プログラム
JP7017861B2 (ja) * 2017-03-23 2022-02-09 株式会社日立製作所 異常検知システムおよび異常検知方法
JP6986358B2 (ja) * 2017-03-29 2021-12-22 三菱重工業株式会社 情報処理装置、情報処理方法およびプログラム
WO2019142597A1 (ja) * 2018-01-19 2019-07-25 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
JP7238378B2 (ja) * 2018-12-17 2023-03-14 富士通株式会社 異常検出装置、異常検出プログラム、及び、異常検出方法
JP6932467B2 (ja) * 2019-03-22 2021-09-08 東芝情報システム株式会社 状態変動検出装置、状態変動検出システム及び状態変動検出用プログラム
EP4052051A4 (en) * 2019-12-02 2023-11-22 Siemens Aktiengesellschaft METHOD AND DEVICE FOR PROCESSING SENSOR MEASUREMENTS
JP7413742B2 (ja) * 2019-12-05 2024-01-16 オムロン株式会社 予測システム、情報処理装置および情報処理プログラム
JP2021111207A (ja) * 2020-01-14 2021-08-02 中国電力株式会社 プラント性能評価システムおよびプラント性能評価方法
JP7384059B2 (ja) * 2020-02-06 2023-11-21 富士通株式会社 検知プログラム、検知方法及び検知装置
JP7073432B2 (ja) * 2020-03-26 2022-05-23 東芝デジタルエンジニアリング株式会社 影響説明変数特定装置、影響説明変数特定方法及び影響説明変数特定用プログラム
JP2021174349A (ja) * 2020-04-28 2021-11-01 キヤノン株式会社 情報処理装置、表示制御方法、プログラム、基板処理システム、及び物品の製造方法
JP2023108255A (ja) * 2022-01-25 2023-08-04 オムロン株式会社 制御装置および制御方法
CN114462897B (zh) * 2022-04-12 2022-07-08 广东利通科技投资有限公司 高速公路机电系统综合性能评估方法、装置及存储介质
CN117744010B (zh) * 2024-02-07 2024-04-30 煤炭科学研究总院有限公司 一种小数据驱动的煤矿支架压力异常实时定位方法
CN118502331B (zh) * 2024-07-18 2024-09-17 青岛龙发热电有限公司 一种火电厂数据安全监测系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07159289A (ja) * 1993-12-03 1995-06-23 Nippon Steel Corp 異常現象の原因診断方法
JPH08202444A (ja) * 1995-01-25 1996-08-09 Hitachi Ltd 機械設備の異常診断方法および装置
JP2007250748A (ja) * 2006-03-15 2007-09-27 Omron Corp プロセス異常分析装置および方法並びにプログラム
JP2008512791A (ja) * 2004-09-10 2008-04-24 エクソンモービル リサーチ アンド エンジニアリング カンパニー オレフィン回収トレインへの異常事象検知技術の適用
WO2011104760A1 (ja) * 2010-02-26 2011-09-01 株式会社 日立製作所 故障原因診断システムおよびその方法
JP2013008111A (ja) * 2011-06-22 2013-01-10 Hitachi Engineering & Services Co Ltd 異常予兆診断装置および異常予兆診断方法
JP2014096050A (ja) * 2012-11-09 2014-05-22 Toshiba Corp プロセス監視診断装置、プロセス監視診断プログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4468269B2 (ja) 2005-08-30 2010-05-26 株式会社東芝 プロセス監視装置及びその方法
JP2007213194A (ja) 2006-02-08 2007-08-23 Yokogawa Electric Corp 状況解析システムおよび状況解析方法
JP2009054843A (ja) 2007-08-28 2009-03-12 Omron Corp プロセス異常検出装置および方法並びにプログラム
FR2939170B1 (fr) * 2008-11-28 2010-12-31 Snecma Detection d'anomalie dans un moteur d'aeronef.
WO2010082322A1 (ja) 2009-01-14 2010-07-22 株式会社日立製作所 装置異常監視方法及びシステム
JP2012226390A (ja) 2009-09-04 2012-11-15 Ntt Docomo Inc 評価予測システムおよび評価予測方法
US8825456B2 (en) * 2009-09-15 2014-09-02 The University Of Sydney Method and system for multiple dataset gaussian process modeling
JP5352485B2 (ja) 2010-01-21 2013-11-27 株式会社日立製作所 要因分析装置
JP5771510B2 (ja) * 2011-11-21 2015-09-02 株式会社日立製作所 判別と回帰を同時に行う回帰分析システムおよび回帰分析方法
US8788291B2 (en) * 2012-02-23 2014-07-22 Robert Bosch Gmbh System and method for estimation of missing data in a multivariate longitudinal setup
JP6183450B2 (ja) 2013-02-26 2017-08-23 日本電気株式会社 システム分析装置、及び、システム分析方法
US9710428B2 (en) * 2013-03-13 2017-07-18 Sas Institute Inc. Techniques for automated bayesian posterior sampling using markov chain monte carlo and related schemes
US9959248B1 (en) * 2015-02-28 2018-05-01 Cloud & Stream Gears Llc Iterative simple linear regression coefficient calculation for big data using components
JP6636883B2 (ja) * 2016-09-06 2020-01-29 株式会社東芝 評価装置、評価方法、および評価プログラム
US20180137218A1 (en) * 2016-11-11 2018-05-17 General Electric Company Systems and methods for similarity-based information augmentation

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07159289A (ja) * 1993-12-03 1995-06-23 Nippon Steel Corp 異常現象の原因診断方法
JPH08202444A (ja) * 1995-01-25 1996-08-09 Hitachi Ltd 機械設備の異常診断方法および装置
JP2008512791A (ja) * 2004-09-10 2008-04-24 エクソンモービル リサーチ アンド エンジニアリング カンパニー オレフィン回収トレインへの異常事象検知技術の適用
JP2007250748A (ja) * 2006-03-15 2007-09-27 Omron Corp プロセス異常分析装置および方法並びにプログラム
WO2011104760A1 (ja) * 2010-02-26 2011-09-01 株式会社 日立製作所 故障原因診断システムおよびその方法
JP2013008111A (ja) * 2011-06-22 2013-01-10 Hitachi Engineering & Services Co Ltd 異常予兆診断装置および異常予兆診断方法
JP2014096050A (ja) * 2012-11-09 2014-05-22 Toshiba Corp プロセス監視診断装置、プロセス監視診断プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117671554A (zh) * 2023-10-20 2024-03-08 上海盈蝶智能科技有限公司 一种安防监控方法及系统

Also Published As

Publication number Publication date
JP6658540B2 (ja) 2020-03-04
US10719577B2 (en) 2020-07-21
WO2016088362A1 (ja) 2016-06-09
US20170315961A1 (en) 2017-11-02

Similar Documents

Publication Publication Date Title
JP6658540B2 (ja) システム分析装置、システム分析方法およびプログラム
JP6354755B2 (ja) システム分析装置、システム分析方法、及びシステム分析プログラム
US9753801B2 (en) Detection method and information processing device
JP6493389B2 (ja) システム分析装置、分析モデル生成方法、システム分析方法およびシステム分析プログラム
EP2963553B1 (en) System analysis device and system analysis method
JP6193287B2 (ja) 異常検出装置、異常検出方法及びネットワーク異常検出システム
JP6164311B1 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP2014211837A (ja) イベント解析装置およびコンピュータプログラム
Chaves et al. Banhfap: A bayesian network based failure prediction approach for hard disk drives
JP6183449B2 (ja) システム分析装置、及び、システム分析方法
US20190265088A1 (en) System analysis method, system analysis apparatus, and program
US20190163549A1 (en) Label rectification and classification/prediction for multivariate time series data
Liu et al. Residual useful life prognosis of equipment based on modified hidden semi-Markov model with a co-evolutional optimization method
Bagheri et al. A stochastic asset life prediction method for large fleet datasets in big data environment
JP6973445B2 (ja) 表示方法、表示装置、および、プログラム
US10157113B2 (en) Information processing device, analysis method, and recording medium
US20240185117A1 (en) Knowledge Graph Based Modeling System for a Production Environment
Patri et al. Predicting compressor valve failures from multi-sensor data
JP6733656B2 (ja) 情報処理装置、情報処理システム、プラントシステム、情報処理方法、及び、プログラム
Kenett et al. Experimental Learning: Generate high information quality by comparing alternative experimental designs.
US20220172002A1 (en) Dynamic and continuous composition of features extraction and learning operation tool for episodic industrial process
WO2016163008A1 (ja) 異常診断装置および異常診断方法
Kumar et al. Enhanced-KNN (M-KNN) based outlier detection and sensor data aggregation for large data streams in the IoT-cloud
Dias Leveraging asset management policies with analytics for multi-dependent and heterogeneous multi-asset systems
ChauPattnaik et al. Component-Based System Reliability using MCMC Simulation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170523

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200120

R150 Certificate of patent or registration of utility model

Ref document number: 6658540

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150