JP2024041512A - 異常検知装置、方法およびプログラム - Google Patents

異常検知装置、方法およびプログラム Download PDF

Info

Publication number
JP2024041512A
JP2024041512A JP2022146371A JP2022146371A JP2024041512A JP 2024041512 A JP2024041512 A JP 2024041512A JP 2022146371 A JP2022146371 A JP 2022146371A JP 2022146371 A JP2022146371 A JP 2022146371A JP 2024041512 A JP2024041512 A JP 2024041512A
Authority
JP
Japan
Prior art keywords
value
function
threshold
feature amount
abnormality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022146371A
Other languages
English (en)
Inventor
安則 田口
康太 中田
晋 内藤
佑一 加藤
真哉 富永
直之 高戸
亮太 三宅
優介 寺門
俊夫 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Energy Systems and Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Energy Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Energy Systems and Solutions Corp filed Critical Toshiba Corp
Priority to JP2022146371A priority Critical patent/JP2024041512A/ja
Priority to US18/174,008 priority patent/US20240085278A1/en
Priority to EP23185531.3A priority patent/EP4339726A1/en
Publication of JP2024041512A publication Critical patent/JP2024041512A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M99/00Subject matter not provided for in other groups of this subclass
    • G01M99/005Testing of complete machines, e.g. washing-machines or mobile phones
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/0227Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
    • G05B23/0235Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions based on a comparison with predetermined threshold or range, e.g. "classical methods", carried out during normal operation; threshold adaptation or choice; when or how to compare with the threshold
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0262Confirmation of fault detection, e.g. extra checks to confirm that a failure has indeed occurred

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】異常の早期検知と誤検知の抑制を両立する異常検知装置を提供する。【解決手段】異常検知装置は、予測部と、仮検知部と、特徴量算出部と、第2閾値設定部と、検知部と、を備える。予測部は、監視対象システムに設置された複数のセンサの測定値を入力すると前記測定値の予測値を出力する第1関数に基づいて、監視対象時刻の予測値を生成する。仮検知部は、前記測定値と前記予測値との偏差が前記第1閾値を超えたことを仮検知する。第2閾値設定部は、前記測定値の時間変化に関する特徴量と、前記特徴量を入力すると第2閾値を出力する第2関数に基づいて、第2閾値を設定する。検知部は、監視対象時刻における前記仮検知の連続回数が前記第2閾値以上であるか否かを判定することにより前記監視対象システムの異常または当該異常の予兆を検知し、当該検知結果に関する検知信号を生成する。【選択図】図1

Description

本発明の実施形態は、異常検知装置、方法およびプログラムに関する。
発電プラントや水処理プラントに用いられるインフラシステムや、製造装置に用いられるシステムは、複数の機器から構成される。インフラシステムが停止した場合、社会機能に悪影響を与えることがある。また、製造装置のシステムが停止した場合、経済的損失を生むことがある。このため、これらのシステムを健全な状態に保つことが重要である。
システムの故障を未然に防ぐため、あるいは、故障後にできるだけ早くシステムを復旧するためには、システムを監視する必要がある。システムを監視するため、1つ以上のセンサがシステム内の各所に設置される場合が多い。そして、設置した1つ以上のセンサの測定値を利用することにより、システムの状態を監視できる。しかし、システムの規模が大きかったり、システムが複雑だったりすると、監視に必要なセンサの数が多くなる。この場合、限られた人数で全てのセンサを同時に監視するのは困難である。
このような課題に対し、システムの監視を補助または自動化する異常検知装置が知られている。このような異常検知装置では、例えば、正常な状態で測定されたセンサの測定値から生成した近似式を用いて予測値を生成し、測定値が予測値から連続して乖離する回数が所定の閾値に達した場合に、異常を検知したとみなす方法が用いられる。このような方法により、システムの正常な挙動を誤って異常とみなして検知する誤検知が抑制される。
しかし、ここで注意すべきは、異常の早期の検知と誤検知の抑制が、二律背反の関係にあることである。センサや時刻によらず連続回数に関する閾値を一律で小さく設定すると、異常を早期に検知できるものの、誤検知が多くなる。逆に、センサや時刻によらず連続回数に関する閾値を一律で大きく設定すると、誤検知を減らせるものの、異常を早期に検知できなくなる。
特開2020-201683号公報
本発明が解決しようとする課題は、異常の早期検知と誤検知の抑制を両立する異常検知装置、方法、および、プログラムを提供することである。
このような課題を解決するため、実施形態の異常検知装置は、測定値取得部と、第1関数取得部と、第2関数取得部と、予測部と、仮検知部と、カウンター部と、特徴量算出部と、第2閾値設定部と、検知部と、を備える。測定値取得部は、監視対象システムに設置された複数のセンサの測定値を取得する。第1関数取得部は、前記測定値を入力すると前記測定値の予測値を出力する第1関数を取得する。第2関数取得部は、前記測定値の時間変化に関する特徴量を入力すると第2閾値を出力する第2関数を取得する。予測部は、監視対象時刻に取得した測定値と前記第1関数に基づいて、前記予測値を生成する。仮検知部は、前記測定値と前記予測値との偏差が前記第1閾値を超えたことを仮検知し、当該仮検知結果に関する仮検知信号を生成する。カウンター部は、前記仮検知信号に基づいて、監視対象時刻における前記仮検知の連続回数をカウントする。特徴量算出部は、前記測定値に基づいて、前記特徴量を算出する。第2閾値設定部は、前記特徴量と前記第2関数に基づいて、第2閾値を設定する。検知部は、前記連続回数が前記第2閾値以上であるか否かを判定することにより前記監視対象システムの異常または当該異常の予兆を検知し、当該検知結果に関する検知信号を生成する。
第1の実施形態に係る異常検知装置の構成の一例を示す図 第1の実施形態に係る異常検知装置による異常検知処理の処理手順を例示するフローチャート 第1の実施形態に係る異常検知装置による予測値の時間変化の一例を示す図 第1の実施形態に係る異常検知装置による偏差の時間変化の一例を示す図 第4の変形例に係る異常検知装置の構成の一例を示す図 第4の変形例に係る異常検知装置による特徴量の時間変化の一例を示す図 第5の変形例に係る異常検知装置の構成の一例を示す図 第6の変形例に係る異常検知装置の構成の一例を示す図 第6の変形例に係る異常検知装置に用いられる特徴量の頻度分布の一例を示す図 図9の頻度分布に閾値を重畳表示した一例を示す図 第7の変形例に係る異常検知装置の構成の一例を示す図 第7の変形例に係る異常検知装置による第2閾値の時間変化の一例を示す図 第2の実施形態に係る異常検知装置に用いられる特徴量の頻度分布の一例を示す図 図13の頻度分布に閾値を重畳表示した一例を示す図
以下、図面を参照しながら、異常検知装置、方法およびプログラムの実施形態について詳細に説明する。以下の説明において、略同一の機能及び構成を有する構成要素については、同一符号を付し、重複説明は必要な場合にのみ行う。
(第1の実施形態)
図1は、第1の実施形態に係る異常検知装置100の構成を示す図である。異常検知装置100は、ネットワーク等を介して、監視対象のシステムに接続されている。異常検知装置100は、監視対象システムの異常または異常の予兆を検知する装置である。以下では、異常と異常の予兆を区別せずに異常と表記する。異常検知装置100は、監視対象システムに設置された複数のセンサにおいて時々刻々と測定される測定値を取得して、システムの異常を検知する。そして、異常検知結果を示す信号をディスプレイ等の外部機器へ出力する。
ネットワークは、例えば、LAN(Local Area Network)である。なお、ネットワークへの接続は、有線接続、及び無線接続を問わない。また、ネットワークはLANに限定されず、インターネットや公衆の通信回線等であっても構わない。
異常検知装置100は、異常検知装置100全体を制御する処理回路と、記憶媒体(メモリ)と、を備える。処理回路は、記憶媒体内のプログラムを呼び出し実行することにより、第1関数取得部101、第1閾値取得部102、測定値取得部104、第2関数取得部103、予測部105、仮検知部106、カウンター部107、特徴量算出部108、第2閾値設定部109及び検知部110の機能を実行するプロセッサである。処理回路は、CPU(Central Processing Unit)、ASIC(Application Specific Integrated Circuit)又はFPGA(Field Programmable Gate Array)等を含む集積回路から形成される。プロセッサは、1つの集積回路から形成されてもよく、複数の集積回路から形成されてもよい。
記憶媒体には、プロセッサで用いられる処理プログラム、及び、プロセッサでの演算で用いられるパラメータ及びテーブル等が記憶される。記憶媒体は、種々の情報を記憶するHDD(Hard Disk Drive)やSSD(Solid State Drive)、集積回路等の記憶装置である。また、記憶装置は、HDDやSSD等以外にも、CD(Compact Disc)、DVD(Digital Versatile Disc)、フラッシュメモリ等の可搬性記憶媒体であってもよく、フラッシュメモリ、RAM(Random Access Memory)等の半導体メモリ素子等との間で種々の情報を読み書きする駆動装置であってもよい。
なお、第1関数取得部101、第1閾値取得部102、第2関数取得部103、測定値取得部104、予測部105、仮検知部106、カウンター部107、特徴量算出部108、第2閾値設定部109及び検知部110が有する各機能は、単一の処理回路にて実現されてもよく、複数の独立したプロセッサを組み合わせて処理回路を構成し、各プロセッサがプログラムを実行することにより各機能を実現するものとしても構わない。また、第1関数取得部101、第1閾値取得部102、第2関数取得部103、測定値取得部104、予測部105、仮検知部106、カウンター部107、特徴量算出部108、第2閾値設定部109及び検知部110が有する各機能は、個別のハードウェア回路として実装してもよい。
第1関数取得部101は、第1関数を取得し、取得した第1関数を予測部105に送る。第1関数は、異常検知装置100の外部から後述の測定値を入力すると、後述の予測値を出力する関数である。第1関数としては、例えば、機械学習で生成された学習済みモデルが表す関数が用いられる。具体的には、第1関数は、例えば、監視対象システムに設置された複数のセンサ(以下、監視対象センサと呼ぶ)の測定値の履歴データから生成された機械学習モデルである。機械学習方式としては、例えば、線型回帰、多項式回帰、リッジ回帰、カーネルリッジ回帰、サポートベクター回帰、決定木回帰、ランダムフォレスト回帰、ニューラルネットワーク等、様々なものが知られている。ニューラルネットワークには、オートエンコーダや深層学習が含まれる。
第1閾値取得部102は、異常検知装置100の外部から、監視対象センサに対する第1閾値を取得し、仮検知部106に送る。第1閾値は、測定値と予測値との偏差に対して後述の仮検知を行う際に用いる閾値である。
第2関数取得部103は、異常検知装置100の外部から第2関数を取得し、取得した第2関数を第2閾値設定部109に送る。第2関数は、測定値に基づいて算出される後述の特徴量を入力すると後述の第2閾値を出力する関数である。
測定値取得部104は、異常検知装置100の外部から、監視対象システムに設置された複数のセンサの測定値を取得する。具体的には、測定値取得部104は、監視するシステムに設置された各センサの測定値を含む情報(以下、測定値データと呼ぶ)を取得する。測定値データは、監視するシステムに設置された複数のセンサにおいて時々刻々と測定される時系列データである。測定値データの取得間隔は、センサのサンプリング間隔や異常検知装置100の処理速度に応じて定めることが好ましい。測定値データの取得間隔は、例えば、1分や10分等である。監視対象時刻付近の複数の時刻の測定値を扱うために、測定値取得部104の内部にメモリを設けても良い。
測定値取得部104は、各測定値を要素に持つベクトルを生成し、生成したベクトルを予測部105に送る。このベクトルは、予測部105における後述の予測処理に用いられる。また、測定値取得部104は、各測定値を要素に持つベクトルを生成し、生成したベクトルを仮検知部106に送る。このベクトルは、仮検知部106における後述の仮検知処理に用いられる。また、測定値取得部104は、各測定値を要素に持つベクトルを生成し、生成したベクトルを特徴量算出部108に送る。このベクトルは、特徴量算出部108における後述の特徴量の算出に用いられる。
予測部105は、測定値と第1関数に基づいて、予測値を生成する。具体的には、予測部105は、測定値取得部104から取得した各センサの監視対象時刻における測定値を第1関数取得部101から取得した第1関数に入力することにより、第1関数から出力された各センサの予測値を取得する。予測部105は、生成した予測値を仮検知部106に送る。
仮検知部106は、測定値と予測値との偏差が第1閾値を超えたことを仮検知し、当該仮検知結果に関する仮検知信号を生成する。仮検知とは、最終的な異常検知を行う前に、測定値が異常の候補であるか否かを仮に検知することである。仮検知部106は、測定値取得部104から取得した測定値のベクトルと、予測部105から取得した予測値とを用いて測定値と予測値との偏差を各センサについて算出し、算出した偏差と第1閾値取得部102から取得した第1閾値に基づいて、測定値が異常の候補であるか否かを監視対象センサのそれぞれについて判定する。測定値が異常の候補であると判定した場合、測定値が異常の候補であることを表す信号(以下、仮検知信号と呼ぶ)を生成し、生成した仮検知信号をカウンター部107に送る。
カウンター部107は、仮検知信号に基づいて、監視対象時刻における仮検知の連続回数をカウントする。具体的には、カウンター部107は、仮検知部106から取得した仮検知信号を経時的に記憶しておき、監視対象時刻までに連続して測定値が異常の候補であると判定された回数を算出する。その後、カウンター部107は、算出した回数を連続回数として検知部110に送る。
特徴量算出部108は、測定値に基づいて、測定値の時間変化に関する特徴量を算出する。具体的には、特徴量算出部108は、測定値取得部104から取得した各センサの測定値に基づいて、測定値の時間変化に関する特徴量を各センサについて算出する。特徴量としては、例えば、測定値の微分値、測定値の微分値の絶対値、測定値の微分値の累積値、または、測定値の微分値の絶対値の累積値等を用いることができる。特徴量算出部108は、算出した特徴量を第2閾値設定部109に送る。
第2閾値設定部109は、特徴量と第2関数に基づいて、第2閾値を設定する。具体的には、第2閾値設定部109は、第2関数取得部103から取得した第2関数と、特徴量算出部108から取得した特徴量に基づいて、各センサについて第2閾値を設定する。第2閾値設定部109は、センサ毎に設定した第2閾値を検知部110に送る。
第2関数は、第1関数として用いられる学習済みモデルの学習に用いられる訓練データとして正常パターンのデータを充分に準備できないパターンに対して、第2閾値が大きく設定される関数である。第2関数は、学習済みモデルの訓練に利用した測定値の集合である訓練データに基づいて計算された特徴量の頻度分布に基づいて、第1の頻度を有する特徴量が入力されると第2閾値として第1の値を出力し、第1の頻度よりも小さい第2の頻度を有する特徴量が入力されると第2閾値として第1の値以上の第2の値を出力する。また、第2関数から出力される第2閾値は、第2関数への入力である特徴量の頻度分布における頻度に応じて2種類以上の値をとるように設計される。
例えば、発電プラントや水処理プラントなどのプラントや、製造装置に対して用いられる監視対象システムでは、定常運転が支配的である場合が多い。この場合の運転は定常的であるため、測定値の時間変化が大きいタイミングが少ない。よって、この場合向けの第2関数は、測定値の時間変化が大きいときに第2閾値が大きく設定される関数として設計すると良い。測定値の時間変化が大きいことは特徴量またはその絶対値が大きいことと対応している。特徴量またはその絶対値が大きいほど、訓練データにおける頻度が小さい性質がわかっているため、この性質を利用し、第2関数としては、入力される特徴量またはその絶対値が小さい場合に、第2閾値として大きい値を出力するような関数が用いられる。この場合、第2関数は、第1の特徴量が入力されると第2閾値として第1の値を出力し、第1の特徴量よりも大きい第2の特徴量が入力される、あるいは、第1の特徴量の絶対値よりも絶対値が大きい第2の特徴量が入力されると、第2閾値として第1の値以上の第2の値を出力する。このため、第2閾値設定部109は、特徴量算出部108から取得した特徴量またはその絶対値が小さいほど、第2閾値として大きい値を設定する。
なお、第2関数は、入力された特徴量が所定の閾値よりも小さい場合に大きい値を出力し、入力された特徴量が所定の閾値以上である場合に小さい値を出力するような出力が2種類の関数であってもよく、入力された特徴量の大きさに応じて3種類以上の値を出力するような関数であってもよい。
検知部110は、カウンター部107から取得した連続回数と第2閾値設定部109から取得した第2閾値から、監視対象センサに対する検知信号を生成し、生成した検知信号を異常検知装置100の外部に出力する。例えば、検知部110は、連続回数が第2閾値以上であるか否かを判定することにより監視対象システムの異常を検知し、当該検知結果に関する検知信号を生成する。
次に、異常検知装置100により実行される処理の動作について説明する。図2は、異常検知処理の手順の一例を示すフローチャートである。異常検知処理は、監視対象のシステムに設置された監視対象センサから得られるセンサ値に基づいてシステムの異常を検知する処理である。なお、以下で説明する各処理における処理手順は一例に過ぎず、各処理は可能な限り適宜変更可能である。また、以下で説明する処理手順について、実施の形態に応じて、適宜、ステップの省略、置換、及び追加が可能である。
なお、ステップS201からステップS203までの処理は、監視対象時刻において異常の検知を実行する前に予め実行される処理である。一方、ステップS204からステップS211までの処理は、監視対象時刻において異常を検知する処理である。ステップS204からステップS211までの処理は、例えば、所定の時間間隔で実行される。この時間間隔は、測定値を取得する間隔でもあるため、以降、サンプリング間隔と呼ぶ。このサンプリング間隔は、N個の監視対象センサのうち多くの監視対象センサの測定値の傾向を把握しやすいように、各監視対象センサの測定値のトレンドグラフにおいて値が過剰に急激には変化しない程度の時間間隔に設定される場合が多い。監視対象時刻や各部の同期は、処理回路により制御される。
(異常検知処理)
(ステップS201)
第1関数取得部101は、異常検知装置100の外部から、後述の測定値を入力すると、後述の予測値を出力する第1関数を取得し、予測部105に送る。ここでは、第1関数をfで表す。第1関数fは、例えば、監視対象システムに設置された複数のセンサの測定値の履歴データから生成された機械学習モデルである。機械学習モデルfを訓練する際には、例えば、履歴データから後述のxとyの組からなる訓練データを生成し、その訓練データから、f(x)のyに対する二乗誤差の総和Eが最小になるように機械学習モデルfを学習させる。二乗誤差の総和Eは、以下の式(1)を用いて算出される。
式(1)において、||・||は、ベクトルのL2ノルムを表す。Dは、訓練データに含まれるxとyの組の数を表す。xとyの添え字iは、その組の番号を表し、i=1,2,…,Dである。
(ステップS202)
第1閾値取得部102は、異常検知装置100の外部から、N個の監視対象センサに対する第1閾値を取得し、仮検知部106に送る。監視対象の各センサに対する第1閾値をN次元ベクトルjで表す。また、ベクトルjのn(n=1,2,…,N)番目の要素をjで表す。jは、n番目の監視対象センサに対する第1閾値を表す。
(ステップS203)
第2関数取得部103は、異常検知装置100の外部から、特徴量を入力すると第2閾値を出力する第2関数を取得し、第2閾値設定部109に送る。ここでは、第2関数をgで表す。第2関数gは、後述の第2閾値kを生成するための関数である。第2関数gは、例えば、以下の式(2)を満たすベクトル値関数である。
式(2)において、・は、行列やベクトルの転置を表す。gは、特徴量vを入力すると第2閾値k(n=1,2,…,N)を出力する関数である。第2閾値k、特徴量v、関数gについては後述する。
(ステップS204)
測定値取得部104は、異常検知装置100の外部から、監視対象システムに設置された複数のセンサの測定値を取得する。その後、測定値取得部104は、予測部105における後述の予測処理に必要な各測定値を要素に持つベクトルxを予測部105に送る。また、測定値取得部104は、仮検知部106における後述の仮検知処理に必要な各測定値を要素に持つベクトルyを仮検知部106に送る。また、測定値取得部104は、特徴量算出部108における後述の特徴量の算出に必要な各測定値を要素に持つベクトルzを特徴量算出部108に送る。監視対象時刻付近の複数の時刻の測定値を扱うために、測定値取得部104の内部にメモリを設けても良い。
予測部105における予測処理において参照する測定値について、センサの数をMで表し、参照する時間前の長さをWで表す。この場合、ベクトルxの次元数は、MWである。ベクトルxの時間窓には、監視対象時刻が含まれていても、含まれていなくても良い。
ベクトルyは、監視対象時刻におけるN個の監視対象センサの測定値を要素に持つN次元ベクトルである。ベクトルyのn(n=1,2,…,N)番目の要素をyで表す。yは、監視対象時刻におけるn番目の監視対象センサの測定値を表す。
ベクトルzは、監視対象時刻付近におけるN個の監視対象センサの測定値を要素に持つNU次元ベクトルである。ここで、Uは、監視対象時刻付近における時間窓の長さを表す。zの時間窓には、監視対象時刻が含まれる。
(ステップS205)
予測部105は、第1関数fと測定値のベクトルxから、監視対象時刻におけるN個の監視対象センサの測定値の予測値を要素に持つN次元ベクトルf(x)を生成する。ここで、ベクトルf(x)のn(n=1,2,…,N)番目の要素をfで表す。fは、監視対象時刻におけるn番目の監視対象センサの予測値を表す。予測部105は、予測値のベクトルf(x)を仮検知部106に送る。
(ステップS206)
仮検知部106は、測定値のベクトルy、予測値のベクトルf(x)、および、第1閾値jに基づいて、N個の監視対象センサのそれぞれについて、測定値が異常の候補であるか否かを表す仮検知信号を生成し、生成した仮検知信号をカウンター部107に送る。ここで、仮検知信号をN次元ベクトルcで表す。ベクトルcのn(n=1,2,…,N)番目の要素をcで表す。cは、n番目の監視対象センサの仮検知信号を表す。cは、例えば、以下の式(3)を用いて算出される。
(ステップS207)
カウンター部107は、仮検知信号のベクトルcに基づいて、N個の監視対象センサのそれぞれについて、仮検知の連続回数を数え、検知部110に送る。仮検知の連続回数は、監視対象時刻までに仮検知が連続して検知された回数である。ここで、N個の監視対象センサの仮検知の連続回数をN次元ベクトルrで表す。ベクトルrのn(n=1,2,…,N)番目の要素をrで表す。rは、n番目の監視対象センサの仮検知の連続回数を表す。監視対象時刻において、cが0であれば、rも0とする。また、監視対象時刻において、cが1であれば、監視対象時刻から過去にさかのぼってcが何回連続で1だったかを数えた結果をrとする。仮検知の連続回数を数えるには、仮検知信号のベクトルcの履歴データが必要である。その履歴データの保持のために、カウンター部107の内部にメモリを設けても良い。
(ステップS208)
特徴量算出部108は、測定値のベクトルzから、N個の監視対象センサの測定値の時間方向の変化を表す特徴量を算出し、第2閾値設定部109に送る。N個の監視対象センサの特徴量をベクトルvで表す。
(ステップS209)
第2閾値設定部109は、第2関数gと特徴量のベクトルvから、N個の監視対象センサに対する第2閾値を設定し、検知部110に送る。ここで、N個の監視対象センサに対する第2閾値を、N次元ベクトルkで表す。ベクトルkのn(n=1,2,…,N)番目の要素をkで表す。kは、n番目の監視対象センサに対する第2閾値を表す。ベクトルkは、k=g(v)によって計算される。
(ステップS210)
検知部110は、連続回数のベクトルrと第2閾値のベクトルkから、N個の監視対象センサに対する検知信号を生成し、異常検知装置100の外部に出力する。N個の監視対象センサに対する検知信号を、N次元ベクトルdで表す。ベクトルdのn(n=1,2,…,N)番目の要素をdで表す。dは、n番目の監視対象センサに対する検知信号を表す。dは、例えば、以下の式(4)を用いて算出される。
式(4)において、dが1であることは、n番目の監視対象センサが異常として検知されたことを表す。また、dが0であることは、n番目の監視対象センサが異常として検知されなかったことを表す。
(ステップS211)
異常検知装置100は、異常検知処理を継続するか否かを判定する。例えば、監視対象システムに対する検査や補修を行う場合、または、異常検知装置100をメンテナンスする場合に、異常検知処理を継続しないと判定する。異常検知処理を継続する場合(ステップS211-Yes)、処理はステップS204に戻り、ステップS204からステップS211までの処理を繰り返し実行する。異常検知処理を継続しない場合(ステップS211-No)、異常検知処理を終了する。
異常検知処理では、以上の処理により、各監視対象時刻において、検知信号のベクトルdが生成される。すなわち、各監視対象時刻において、各監視対象センサの異常が検知される。
(特徴量の具体例)
ここで、特徴量vの具体例について詳しく説明する。
特徴量vは、測定値の時間変化に関し、測定値の時間変化が相対的に激しい時期を特定するために計算される。特徴量vは、例えば、N個のベクトルa(n=1,2,…,N)を連結したベクトルである。
ベクトルaは、例えば、測定値のベクトルzのうちのn番目の監視対象センサの測定値の要素を抽出したU次元ベクトルを用いて算出される。ベクトルaは、例えば、前述のU次元ベクトルを微分することにより算出される。微分ステップが1の場合、aは(U-1)次元ベクトルであり、N個のaを連結したvは、N(U-1)次元ベクトルである。微分ステップが(U-1)の場合、aは1次元ベクトル、すなわち、スカラーであり、N個のaを連結したvはN次元ベクトルである。微分ステップは、1やU-1以外の値でも構わない。この場合も、N個のaを連結したベクトルvが、測定値の時間変化を表す特徴量になる。
は、前述のU次元ベクトルの微分値の絶対値を用いて算出しても構わない。この場合も、N個のaを連結したベクトルvが測定値の時間変化を表す特徴量になる。
また、aは、前述の微分値や微分値の絶対値を時間方向に累積したスカラーとしても構わない。この場合も、N個のaを連結したベクトルvが測定値の時間変化を表す特徴量になる。また、aを計算する際、第1関数fに入力する測定値のベクトルxを参照すると実装しやすい。そこで、微分値や微分値の絶対値を時間方向に累積する際の累積期間は、第1関数fに入力する測定値のベクトルxの時間窓長以下にすることが好ましい。
vは、N個のaを連結したベクトルのL1ノルムであっても構わない。この場合、特徴量vは、スカラーである。この場合も、vが測定値の時間変化を表す特徴量になる。
(第2関数の具体例)
次に、第2関数gの具体例について詳しく説明する。
第2関数gは、特徴量から、第2閾値を決定する関数である。vがベクトルの場合、gを定める関数gは、例えば、以下の式(5)を用いて算出される。
式(5)において、||・||は、ベクトルのL1ノルムを表す。bは、正の定数である。εは、正の定数である。定数εの役割は、関数gの出力値が発散するのを防止することである。この関数gでは、ベクトルvのL1ノルム||v||が小さいほど、大きな値が出力される。また、k=g(v)であるため、ベクトルvのL1ノルム||v||が小さいほど、n番目の監視対象センサの第2閾値kの値が大きくなる。
を計算するための微分のステップが1の場合、aは(U-1)次元ベクトルであり、vはN(U-1)次元ベクトルである。この場合、||a||は、n番目の監視対象センサに対して微分ステップ1で微分した微分値の絶対値の累積値を表し、以下の式(6)が成り立つ。
=g(v)と式(5)、(6)より、微分ステップが1の場合、kは、微分値の絶対値の累積値の総和||v||が小さいほど大きな値をとる。
を計算するための微分のステップが(U-1)の場合、aは1次元ベクトル、すなわち、スカラーである。この場合、||a||=|a|が成り立ち、||a||は、微分ステップU-1でn番目の監視対象センサを微分した際の微分値の絶対値を表し、以下の式(7)が成り立つ。
式(7)において、|・|は、スカラーの絶対値を表す。k=g(v)と式(5)、(7)より、微分ステップが(U-1)の場合、kは、微分値の絶対値の総和||v||が小さいほど大きな値をとる。
微分ステップによってvや||v||が変化するものの、vや||v||が監視対象センサの時間変化の大きさを表す特徴量である点は同じである。したがって、この関数gの場合、微分ステップによらず、kは監視対象センサの時間変化が小さいほど大きな値をとる。このように、監視対象センサの測定値が急激に変化する時刻での第2閾値が、他の時刻での第2閾値よりも大きくなるように自動で制御される。
前述したように、第2関数としては、他の様々な関数が採用されて構わない。ただし、第2関数には制約がある。具体的には、第2関数は、第1関数として用いられる学習済みモデルの学習に用いられる訓練データとして正常パターンのデータを充分に準備できないパターンに対して、第2閾値が大きく設定される関数である必要がある。例えば、発電プラントや水処理プラントなどのプラントや、製造装置に対して用いられる監視対象システムでは、定常運転が支配的であるため、第2関数は、測定値の時間変化が多いときに第2閾値が大きく設定される関数である必要がある。すなわち、第2関数は、学習済みモデルの訓練に利用した測定値の集合である訓練データに基づいて計算された特徴量の頻度分布に基づいて、第1の頻度を有する特徴量が入力されると第2閾値として第1の値を出力し、第1の頻度よりも小さい第2の頻度を有する特徴量が入力されると第2閾値として第1の値以上の第2の値を出力する。また、第2閾値は、第2関数への入力である特徴量の頻度分布における頻度に応じて2種類の値をとるように設計されている。
(第1の実施形態の効果)
以下、本実施形態に係る異常検知装置100の効果について説明する。
(誤検知の発生原理)
まず、本実施形態において抑制できる誤検知の発生原理について説明する。
我々発明者らは、誤検知には、特定の発生パターンと、その発生パターンの発生原理が存在することを発見した。すなわち、我々発明者らは、ある誤検知についての発生原理を発見した。
図3及び図4は、誤検知の特定の発生パターンを説明するための図である。図3は、n番目の監視対象センサの測定値yと予測値fのトレンドグラフである。図3の横軸は時刻を表し、図3の縦軸は測定値及び予測値を表す。図3の実線は、測定値yの時間推移を表す。図3の破線は、予測値fの時間推移を表す。図3は、正常な挙動として上下に変動している場合の測定値yの時間推移を示している。図4は、監視対象センサの測定値yと予測値fとの偏差(y-f)のトレンドグラフである。図4の横軸は図3と同期した時刻を表し、図4の縦軸は偏差を表す。図4の実線は、偏差(y-f)の時間推移を表す。図4の上側の破線は、第1閾値jを表し、図4の下側の破線は、第1閾値jを-1倍したものを表す。
上述したように、図3は、測定値yの正常な挙動を示している。このため、図4の偏差が第1閾値を超えた際に異常として検知した場合、その検知は誤検知となる。図3及び図4に示すように、図4における偏差が第1閾値を超えている時期は、図3における測定値の時間変化が相対的に激しい時期と同期していることがわかる。したがって、測定値の時間変化が相対的に激しい時期に誤検知が発生しやすいという発生パターンが存在することが分かる。
また、図3及び図4に示すように、図4における偏差が第1閾値を超えている時期は、図3における予測値の変化が測定値の変化に追従していないことがわかる。したがって、予測値が測定値に追従していない時期に誤検知が発生しやすいという発生パターンが存在することが分かる。
前述の通り、第1関数fは、例えば、二乗誤差の総和Eを最小化することで学習される。よって、第1関数fの学習に用いられる訓練データにおいて出現頻度が低い入力xに対する予測値f(x)の二乗誤差(=||f(x)-y||)は、訓練データにおいて出現頻度が高い入力xに対する予測値f(x)の二乗誤差(=||f(x)-y||)よりも大きくなる。ここで、入力xの「l」と、入力xの「h」は、インデックスを表す。
前述の通り、監視対象センサのサンプリング間隔は、N個のセンサのうち多くの監視対象センサの測定値のトレンドグラフにおいて、値が急激に変化しない程度の時間間隔に設定される場合が多い。したがって、履歴データには、測定値が急激に変化する時刻が多くないセンサが多い。訓練データは履歴データから作成される。このため、訓練データにおいて、測定値が急激に変化する時刻が多くない監視対象センサが多くなる。したがって、監視対象システムが正常な状態における予測値f(x)の二乗誤差(=||f(x)-y||)は、監視対象センサの測定値が急激に変化する時刻において大きくなりがちである。図4において、測定値の時間変化が相対的に激しい時期に予測値fが測定値yに追従せず、偏差の絶対値|y-f|が大きくなったのは、このためである。監視対象システムが正常であるにも関わらず、予測値fが測定値yに追従しない場合、各監視対象センサについて、測定値の予測値からの偏差が大きくなる。そのため、偏差の絶対値が第1閾値を超えやすくなり、仮検知が生じやすくなる。その結果、誤検知が生じやすくなる。これが、我々発明者が発見した誤検知の発生原理である。
発電プラントや水処理プラントなどのプラントや、製造装置に対して用いられる監視対象システムでは、定常運転が支配的であるため、監視対象センサの多くは、測定値が急激に変化する時刻が少なくなる。このため、第1関数として用いられる学習済みモデルの学習に用いられる訓練データにおいて、急激に変化する測定値の出現頻度が低くなる。言い換えると、急激に変化する測定値のデータが正常パターンのデータとして充分に準備できない。このため、測定値の時間変化が相対的に激しい時期において、学習済みモデルから出力される予測値が測定値に追随しにくくなり、誤検知が生じやすくなる性質があることがわかる。本実施形態の異常検知装置100は、この性質を利用して誤検知を抑制する。
(本実施形態の構成及び効果)
本実施形態の異常検知装置100は、監視対象システムに設置された複数のセンサの測定値と、第1関数と、第2関数を取得する。第1関数は、測定値を入力すると測定値の予測値を出力する関数であり、例えば、機械学習で生成された学習済みモデルが表す関数である。第2関数は、測定値の時間変化に関する特徴量を入力すると第2閾値を出力する関数である。特徴量は、例えば、測定値の微分値、微分値の絶対値、微分値の累積値、または微分値の絶対値の累積値である。異常検知装置100は、測定値と第1関数に基づいて予測値を生成し、測定値と予測値との偏差が第1閾値を超えたことを仮検知し、当該仮検知結果に関する仮検知信号を生成する。異常検知装置100は、その後、仮検知信号に基づいて、監視対象時刻における仮検知の連続回数をカウントする。また、異常検知装置100は、測定値に基づいて特徴量を算出し、特徴量と第2関数に基づいて、第2閾値を設定する。第2関数は、学習済みモデルの訓練に利用した測定値の集合である訓練データに基づいて計算された特徴量の頻度分布に基づいて、第1の頻度を有する特徴量が入力されると第2閾値として第1の値を出力し、第1の頻度よりも小さい第2の頻度を有する特徴量が入力されると第2閾値として第1の値以上の第2の値を出力することにより、第2閾値として、特徴量に応じて2種類以上の値を出力するように設計されている。そして、異常検知装置100は、連続回数が第2閾値以上であるか否かを判定することにより監視対象システムの異常または当該異常の予兆を検知し、当該検知結果に関する検知信号を生成する。
従来技術においては、仮検知の連続回数に関する第2閾値が時刻にもセンサにもよらず一律で設定されていた。この場合、第2閾値を一律で大きく設定することにより、誤検知が抑制される。しかし、仮検知の連続回数が第2閾値を超えるまで異常として検知されないため、異常の検知タイミングが遅れる。逆に、第2閾値を一律で小さく設定すると、異常の検知タイミングの遅れを抑制できるものの、誤検知が抑制されない。
本実施形態では、第2閾値は、N個の監視対象センサの測定値の時間方向の変化を表す特徴量と、第2関数に応じて設定される。そして、監視対象センサの測定値が急激に変化する時刻での第2閾値が、他の時刻での第2閾値よりも大きくなるように自動で制御される。そのため、監視対象センサの測定値が急激に変化する時刻での誤検知が抑制される。監視対象センサの測定値が急激に変化しない時刻では、第2閾値の値が大きくならないため、異常検知タイミングが遅れない。監視対象センサの測定値が急激に変化する時刻は、相対的に少ないため、異常検知タイミングが遅れる可能性を最小限に抑制できる。したがって、本実施形態の異常検知装置100によれば、異常の早期の検知と誤検知の抑制を両立できる。このように、訓練データにおいて稀な時間変化パターンを特定することで、誤検知を抑制することができる。
また、前述のように、測定値の時間変化が相対的に激しい時期は、訓練データにおいて稀な時間変化パターンであるため、誤検知が生じやすいことが分かった。上記構成により、本実施形態の異常検知装置100によれば、監視対象センサの測定値が急激に変化する時刻を特徴量で特定し、当該時刻での第2閾値が他の時刻よりも大きくなるように、特徴量と第2関数を用いて第2閾値を自動で制御する。これにより、測定値の時間変化が相対的に激しい時期での第2閾値が大きくなり、測定値の時間変化が相対的に激しい時期において異常が検知されづらくなり、誤検知を抑制することができる。すなわち、誤検知が生じやすい期間において他の期間よりも第2閾値を大きくすることで、誤検知が生じやすい期間で異常が検知されづらくなり、誤検知を抑制することができる。
また、特徴量として微分値の累積値または微分値の絶対値の累積値を用いる場合、累積値の累積期間は、第1関数fに入力する測定値の時間窓長以下である。この場合、特徴量を計算する際に第1関数に入力する測定値のベクトルを参照することができるため、実装しやすくなる。
(第1の変形例)
第1の実施形態では、式(2)のように、第2関数gがn番目の監視対象センサの第2閾値kが特徴量のベクトルvに依存する場合について説明した。前述のように、特徴量vは、N個のベクトルa(n=1,2,…,N)を連結したベクトルである。第2閾値kは、特徴量のベクトルvのうちのベクトルaにのみ依存しても構わない。この場合、第2関数gは、例えば、以下の式(8)を満たすベクトル値関数となる。
式(8)において、aは、n番目の監視対象センサの時間変化を表す特徴量である。したがって、本変形例では、第2閾値kは、n番目の監視対象センサの時間変化を表す特徴量で決まるため、他の監視対象センサの時間変化を表す特徴量には依存しない。n番目の監視対象センサの予測値fは、他の監視対象センサではなく、自身の測定値の影響を最も強く受ける。そのため、本変形例でも、第1の実施形態と同様の効果が得られる。
(第2の変形例)
第1の実施形態では、監視対象システムが正常な状態における予測値f(x)の二乗誤差||f(x)-y||^2が、監視対象センサの測定値が急激に変化する時刻において大きくなりがちな性質に基づいて、第2関数として、測定値の時間変化が多いときに第2閾値が大きく設定される関数を用いた。監視対象システムが正常な状態における監視対象センサの測定値が急激に変化する時刻において予測値f(x)の二乗誤差||f(x)-y||^2が大きくなりがちな本質的な理由は、測定値が急激に変化する時刻のデータが訓練データにおいて少ないことである。本変形例では、第2関数として、学習済みモデルfの訓練に利用した測定値の集合である訓練データから計算される特徴量の分布において頻度が低い特徴量が入力されると値が大きい第2閾値を出力する関数を用いる。
本変形例の第2関数gを定めるgは、例えば、以下の式(9)を用いて算出される。
式(9)において、Pは、入力される特徴量の頻度であり、特徴量のベクトルvを入力すると訓練データから計算される特徴量の分布における頻度を出力する関数である。Pは、単純な経験分布により頻度を計算する関数であってもよく、カーネル密度推定を用いてノンパラメトリックに頻度を計算する関数であってもよく、混合ガウス分布を用いてパラメトリックに頻度を計算する関数であってもよい。α及びβは、正の定数であり、α>βの関係を満たす。τは、頻度に関する閾値を表す。頻度は、0から1の値に正規化した確率で表現しても構わない。この場合、訓練データから計算される特徴量の分布において、頻度が低い特徴量が入力されると値がβよりも大きいαがg(v)の出力となる。k=g(v)であるため、訓練データから計算される特徴量の分布において頻度が低い特徴量が入力されると、大きい値であるαが第2閾値kとなる。
また、第2関数gは、例えば、以下の式(10)で表されるガウス関数であってもよい。
式(10)において、θとσは、ガウス関数の値が正のパラメータである。式(10)に示す第2関数を用いた場合も、訓練データから計算される特徴量の分布において頻度が低い特徴量が入力されると値が大きな値がg(v)の出力となる。k=g(v)であるため、訓練データから計算される特徴量の分布において頻度が低い特徴量が入力されると、大きな値が第2閾値kとなる。
本変形例は、第1の実施形態よりも広い範囲に適用することができる。第1の実施形態の方式では、訓練データから計算される特徴量の分布において、測定値の時間変化が大きいときの特徴量の頻度が低い場合に生じる誤検知を抑制する。一方、本変形例の方式では、測定値の時間変化量が大きいときに生じる誤検知に限られず、訓練データから計算される特徴量の分布において特徴量の頻度が低い場合に生じる誤検知を抑制することができる。また、第1の実施形態と同様に、第2閾値を大きくすることによって異常検知タイミングが遅れるリスクを最小限に抑制することができる。
(第3の変形例)
第2の変形例では、式(9)を用いてgを求めるため、ベクトルvの次元が高い場合、P(v)の計算時に次元の呪いの影響を受ける。その影響を排除するために、以下の式(11)から式(14)までのいずれかを用いてgを求めてもよい。この場合、時間変化に関する特徴量の次元を小さくすることができ、次元の呪いから解放される。aがスカラーの場合、次元の呪いの影響をさらに受けづらい。本変形例は、第1の変形例と第2の変形例の組み合わせになっている。このため、第1の変形例及び第2の変形例と同様の効果を得ることができる。
(第4の変形例)
図5は、第4の変形例に係る異常検知装置100の構成を示す図である。本変形例の異常検知装置100は、表示部111をさらに有する。実施形態と同様の構成、動作、及び効果については、説明を省略する。
本変形例では、特徴量算出部108は、算出した特徴量を第2閾値設定部109と表示部111に送る。
表示部111は、特徴量に基づいて特徴量のトレンドグラフを表示するための表示画面データを生成し、生成した表示画面データを外部のディスプレイ等に出力する。例えば、特徴量の時間変化を示すトレンドグラフを表示するための表示画面データが生成され、特徴量のトレンドグラフが外部のディスプレイ等に表示される。図6は、特徴量のトレンドグラフの一例を示す図である。図6は、図3及び図4と同じ監視対象センサの特徴量を示す図である。図6の横軸は、時刻であり、図3及び図4と同じ時刻に対応している。図6の縦軸は、特徴量である。また、図6は、特徴量として測定値の微分値を用いた場合の例である。
前述したように図3及び図4は、測定値及び偏差の正常な挙動を示している。このため、図4の偏差が第1閾値を超えた際に異常が検知された場合、その検知は誤検知となる。図4及び図6から分かる通り、偏差が第1閾値を超えたタイミングでは、特徴量である微分値の絶対値が大きい場合が多い。すなわち、誤検知が起きるタイミングでは、特徴量である微分値の絶対値が大きい場合が多い。
本変形例では、特徴量のトレンドグラフを表示させることができる。このため、偏差が第1閾値を超えることで検知された異常が誤検知であった場合でも、ユーザは、特徴量のトレンドグラフを確認することで、その異常の検知が誤検知である可能性が高いことに気づくことができる。また、特徴量のトレンドグラフに加えて、測定値の時間変化を示すトレンドグラフや偏差の時間変化を示すトレンドグラフを同一画面に表示してもよい。この場合、これらのトレンドグラフの横軸である時刻の軸を揃えると、ユーザがグラフを見比べやすい。
(第5の変形例)
図7は、第5の変形例に係る異常検知装置100の構成を示す図である。本変形例の異常検知装置100は、表示部112をさらに有する。実施形態と同様の構成、動作、及び効果については、説明を省略する。
本変形例では、仮検知部106は、算出した偏差をカウンター部107と表示部112に送る。また、特徴量算出部108は、算出した特徴量を第2閾値設定部109と表示部111に送る。
表示部112は、偏差と特徴量に基づいて偏差またはその絶対値と特徴量またはその絶対値の相関係数を算出し、算出した相関関係を表示するための表示画面データを生成し、生成した表示画面データを外部のディスプレイ等に出力する。例えば、各監視対象センサについて、偏差(y-f)またはその絶対値と特徴量またはその絶対値の相関係数を画面に表示すると良い。特徴量がベクトルの場合、相関係数を計算できない。この場合、例えば、特徴量の時間累積値や特徴量のL1ノルムを算出し、スカラーでない特徴量をスカラーに変換した後に、変換後の特徴量(スカラー)と偏差(y-f)またはその絶対値との相関係数を画面に表示すると良い。
画面に表示された相関係数が大きい場合、ユーザは、偏差またはその絶対値が特徴量またはその絶対値に連動していたことを定量的に確認できる。両者が連動していることを数値で確認できれば、ユーザは、特徴量に応じて第2閾値を制御する第1の実施形態のシステムを安心して利用できる。
(第6の変形例)
図8は、第6の変形例に係る異常検知装置100の構成を示す図である。本変形例の異常検知装置100は、表示部113をさらに有する。実施形態と同様の構成、動作、及び効果については、説明を省略する。
本変形例では、表示部113は、学習済みモデルの訓練に利用した訓練データに基づいて計算された特徴量の頻度分布を外部から取得し、取得した頻度分布を表示するための表示画面データを生成し、生成した表示画面データを外部のディスプレイ等に出力する。例えば、頻度分布として、訓練データから計算される特徴量の頻度P(v)、あるいは、P(a)の分布を画面に表示すると良い。図9は、訓練データから計算されるn番目の監視対象センサの特徴量aの頻度P(a)を頻度分布として表示した例を示す。図9は、特徴量として測定値の微分値を用い、aがスカラーの場合の例である。図9の横軸は、頻度を表す。図9の縦軸は、特徴量を表す。頻度は、0から1に正規化した確率で表現しても構わない。
図9では、特徴量が0の付近で特徴量の頻度が高い。特徴量として微分値を用いているため、特徴量が0付近であることは、測定値があまり変化しない定常状態であることに対応する。逆に、特徴量が0付近でないことは、測定値が変化する過渡状態であることに対応する。したがって、図9は、訓練データ中のn番目の監視対象センサの測定値について、主に定常状態のデータで構成されていることを意味する。図9では、時間変化に関する特徴量の頻度が0付近で高くなっている。このため、図9に示す頻度分布を表示することで、ユーザは、n番目の監視対象センサの測定値が急激に変化する時刻での第2閾値が、他の時刻での第2閾値よりも大きくなるように自動で制御されることで、誤検知を抑制できることを確認することができる。
また、頻度分布に加えて頻度に関する閾値を表示してもよい。図10は、第3の変形例において式(11)を採用した場合の頻度に関する閾値τを、図9に示す頻度分布に重畳した例を示す図である。この図から、特徴量がε以上、または、λ以下の場合、その特徴量の頻度は閾値τ以下であることがわかる。頻度に関する閾値τを頻度分布上に表示することで、ユーザは、n番目の監視対象センサの第2閾値kがαまたはβになる特徴量を一目で確認することができる。
(第7の変形例)
図11は、第7の変形例に係る異常検知装置100の構成を示す図である。本変形例の異常検知装置100は、表示部114をさらに有する。実施形態と同様の構成、動作、及び効果については、説明を省略する。
本変形例では、第2閾値設定部109は、設定した第2閾値を検知部110と表示部114に送る。
表示部114は、第2閾値に基づいて第2閾値のトレンドグラフを表示するための表示画面データを生成し、生成した表示画面データを外部のディスプレイ等に出力する。例えば、第2閾値の時間変化を示すトレンドグラフを表示するための表示画面データが生成され、第2閾値のトレンドグラフが外部のディスプレイ等に表示される。図12は、第2閾値のトレンドグラフの一例を説明するための図である。図12(a)は、特徴量のトレンドグラフの一例を示す。図12(b)は、図12(a)のように特徴量が変化した場合の第2閾値のトレンドグラフを示す。図12(b)は、n番目の監視対象センサの第2閾値kのトレンドグラフである。また、図12(a)及び図12(b)は、図3、図4及び図6と同じ監視対象センサのトレンドグラフである。図12(a)及び図12(b)の横軸は、時刻であり、図3、図4及び図6と同じ時刻に対応している。図12(a)の縦軸は、特徴量を表す。図12(b)の縦軸は、第2閾値を表す。また、図12(b)は、訓練データの特徴量が図10に示す頻度分布を有し、第3の変形例の式(11)を採用して第2閾値を算出した場合の例を示している。
図10に示すように、特徴量がε以上またはλ以下の場合に、その特徴量の頻度が閾値τn以下になるため、図12(b)では、図12(a)において特徴量がε以上の時刻と、λ以下の時刻において第2閾値がαとなり、それ以外の時刻で第2閾値として採用されるβよりも大きくなっている。
本変形例では、第2閾値のトレンドグラフを表示させることができる。ユーザは、第2閾値のトレンドグラフを確認することにより、n番目の監視対象センサの各時刻における第2閾値kを一目で把握できる。また、第2閾値のトレンドグラフに加えて、測定値の時間変化を示すトレンドグラフや偏差の時間変化を示すトレンドグラフを同一画面に表示してもよい。この場合、測定値が急激に変化したタイミングや、偏差の絶対値が第1閾値を超えたタイミングで第2閾値kが大きくなる様子をユーザが一目で確認できる。
(第2の実施形態)
第1の実施形態及びその変形例では、発電プラントや水処理プラントなどのプラントや、製造装置に対して用いられる監視対象システムでは、定常運転が支配的であるため、第2関数として、測定値の時間変化が多いときに第2閾値が大きく設定される関数が用いられた。本実施形態では、監視対象システムが、測定値の時間変化が多い過渡状態が支配的であるシステムである場合について説明する。第1の実施形態と同様の構成、動作、及び効果については、説明を省略する。
本実施形態においても、第2関数は、第1関数として用いられる学習済みモデルの学習に用いられる訓練データとして正常パターンのデータを充分に準備できないパターンに対して、第2閾値が大きく設定される関数である必要がある。このため、本実施形態では、第2関数は、測定値の時間変化が多いときに第2閾値が小さく設定され、測定値があまり変化しないときに第2閾値が大きく設定される関数である必要がある。
図13は、訓練データから計算されるn番目の監視対象センサの特徴量aの頻度P(a)を頻度分布として表示した例を示す。図13は、特徴量として測定値の微分値を用い、aがスカラーの場合の例である。図13の横軸は、頻度を表す。図13の縦軸は、特徴量を表す。頻度は、0から1に正規化した確率で表現しても構わない。
図13では、0付近以外の2か所で特徴量の頻度が高い。特徴量が微分値であるため、図13において頻度が高い正の特徴量は、訓練データ中のn番目の監視対象センサの測定値について、測定値が上昇傾向にあるタイミングが多いことを表す。図13において頻度が高い負の特徴量は、訓練データ中のn番目の監視対象センサの測定値について、測定値が下降傾向にあるタイミングが多いことを表す。図13において頻度が高い特徴量が正と負でそれぞれ1つずつあることは、訓練データ中のn番目の監視対象センサについて、測定値が上下動するタイミングが多く、あまり変化しないタイミングが少なかったことを表す。
本実施形態では、n番目の監視対象センサの測定値があまり変化しない時刻での第2閾値が、他の時刻での第2閾値よりも大きくなるように自動で制御されるため、特徴量が図13のように分布する場合に、訓練データにおける頻度が低いことに起因して生じる誤検知を抑制することができる。また、本実施形態では、特徴量が0付近でないタイミングで第2閾値が大きくならないため、もし、特徴量の頻度が高いタイミングで異常が生じたとしても、第2閾値が小さく設定されるため、検知タイミングが遅れることなく異常を検知することができる。
また、本実施形態においても、第1の実施形態の第2の変形例や第3の変形例のように、訓練データにおける頻度に応じて第2閾値を制御することで、訓練データにおける頻度が低いことに起因する誤検知を抑制でき、かつ、特徴量の図13における頻度が高いタイミングで生じた異常の検知タイミングが遅れないようにすることができる。
このように、訓練データから計算される特徴量の分布における頻度を算出して第2閾値を制御する場合、第1の実施形態と第2の実施形態のどちらの場合でも、より多くの誤検知を抑制できる。
また、第1の実施形態と同様に、頻度分布を外部のディスプレイ等に表示させてもよい。この場合、例えば、図13に示す頻度分布が表示される。また、頻度分布に加えて頻度に関する閾値を表示してもよい。図14は、本実施形態に第3の変形例を適用し、上述の式(11)を採用した場合の頻度に関する閾値τを、図14に示す頻度分布に重畳した例を示す図である。頻度に関する閾値τを頻度分布上に表示することで、ユーザは、n番目の監視対象センサの第2閾値kがαまたはβになる特徴量を一目で確認することができる。
かくして、前述のいずれかの実施形態によれば、異常の早期検知と誤検知の抑制を両立する異常検知装置、方法、および、プログラムを提供することができる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
100…異常検知装置、101…関数取得部、102…閾値取得部、103…関数取得部、104…測定値取得部、105…予測部、106…仮検知部、107…カウンター部、108…特徴量算出部、109…閾値設定部、110…検知部、111、112、113、114…表示部。

Claims (11)

  1. 監視対象システムに設置された複数のセンサの測定値を取得する測定値取得部と、
    前記測定値を入力すると前記測定値の予測値を出力する第1関数を取得する第1関数取得部と、
    第1閾値を取得する第1閾値取得部と、
    前記測定値の時間変化に関する特徴量を入力すると第2閾値を出力する第2関数を取得する第2関数取得部と、
    監視対象時刻に取得した測定値と前記第1関数に基づいて、前記予測値を生成する予測部と、
    前記測定値と前記予測値との偏差が前記第1閾値を超えたことを仮検知し、当該仮検知結果に関する仮検知信号を生成する仮検知部と、
    前記仮検知信号に基づいて、監視対象時刻における前記仮検知の連続回数をカウントするカウンター部と、
    前記測定値に基づいて、前記特徴量を算出する特徴量算出部と、
    前記特徴量と前記第2関数に基づいて、第2閾値を設定する第2閾値設定部と、
    前記連続回数が前記第2閾値以上であるか否かを判定することにより前記監視対象システムの異常または当該異常の予兆を検知し、当該検知結果に関する検知信号を生成する検知部と、
    を備える異常検知装置。
  2. 前記特徴量は、前記測定値の微分値、前記微分値の絶対値、前記微分値の累積値または前記絶対値の累積値である、
    請求項1に記載の異常検知装置。
  3. 前記第1関数は、機械学習で生成された学習済みモデルが表す関数である、
    請求項1または2に記載の異常検知装置。
  4. 前記第2関数は、前記学習済みモデルの訓練に利用した測定値の集合である訓練データに基づいて計算された前記特徴量の頻度分布に基づいて、第1の頻度を有する特徴量が入力されると前記第2閾値として第1の値を出力し、前記第1の頻度よりも小さい第2の頻度を有する特徴量が入力されると前記第2閾値として前記第1の値以上の第2の値を出力し、
    前記第2関数から出力される前記第2閾値は、前記第2関数への入力である前記特徴量の前記頻度分布における頻度に応じて2種類以上の値をとる、
    請求項3に記載の異常検知装置。
  5. 前記累積値に関する累積期間は、前記第1関数へ入力される前記測定値の時間窓長以下である、
    請求項2に記載の異常検知装置。
  6. 前記特徴量のトレンドグラフを表示する表示部をさらに備える、
    請求項1に記載の異常検知装置。
  7. 前記偏差と前記特徴量の相関係数を表示する表示部をさらに備える、
    請求項1に記載の異常検知装置。
  8. 前記頻度分布を表示する表示部をさらに備える、
    請求項4に記載の異常検知装置。
  9. 前記第2閾値のトレンドグラフを表示する表示部をさらに備える、
    請求項1に記載の異常検知装置。
  10. 監視対象システムに設置された複数のセンサの測定値を取得することと、
    前記測定値を入力すると前記測定値の予測値を出力する第1関数を取得することと、
    第1閾値を取得する第1閾値取得部と、
    前記測定値の時間変化に関する特徴量を入力すると第2閾値を出力する第2関数を取得することと、
    前記測定値と前記第1関数に基づいて、前記予測値を生成することと、
    前記測定値と前記予測値との偏差が前記第1閾値を超えたことを仮検知し、当該仮検知結果に関する仮検知信号を生成することと、
    前記仮検知信号に基づいて、監視対象時刻における前記仮検知の連続回数をカウントすることと、
    前記測定値に基づいて、前記特徴量を算出することと、
    前記特徴量と前記第2関数に基づいて、第2閾値を設定することと、
    前記連続回数が前記第2閾値以上であるか否かを判定することにより前記監視対象システムの異常または当該異常の予兆を検知し、当該検知結果に関する検知信号を生成することと、
    を備える方法。
  11. コンピュータに、
    監視対象システムに設置された複数のセンサの測定値を取得する機能と、
    前記測定値を入力すると前記測定値の予測値を出力する第1関数を取得する機能と、
    第1閾値を取得する第1閾値取得部と、
    前記測定値の時間変化に関する特徴量を入力すると第2閾値を出力する第2関数を取得する機能と、
    前記測定値と前記第1関数に基づいて、前記予測値を生成する機能と、
    前記測定値と前記予測値との偏差が前記第1閾値を超えたことを仮検知し、当該仮検知結果に関する仮検知信号を生成する機能と、
    前記仮検知信号に基づいて、監視対象時刻における前記仮検知の連続回数をカウントする機能と、
    前記測定値に基づいて、前記特徴量を算出する機能と、
    前記特徴量と前記第2関数に基づいて、第2閾値を設定する機能と、
    前記連続回数が前記第2閾値以上であるか否かを判定することにより前記監視対象システムの異常または当該異常の予兆を検知し、当該検知結果に関する検知信号を生成する機能と、
    を実現させるためのプログラム。
JP2022146371A 2022-09-14 2022-09-14 異常検知装置、方法およびプログラム Pending JP2024041512A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022146371A JP2024041512A (ja) 2022-09-14 2022-09-14 異常検知装置、方法およびプログラム
US18/174,008 US20240085278A1 (en) 2022-09-14 2023-02-24 Anomaly detection apparatus, method, and storage medium
EP23185531.3A EP4339726A1 (en) 2022-09-14 2023-07-14 Anomaly detection apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022146371A JP2024041512A (ja) 2022-09-14 2022-09-14 異常検知装置、方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2024041512A true JP2024041512A (ja) 2024-03-27

Family

ID=87340698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022146371A Pending JP2024041512A (ja) 2022-09-14 2022-09-14 異常検知装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US20240085278A1 (ja)
EP (1) EP4339726A1 (ja)
JP (1) JP2024041512A (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023549166A (ja) * 2020-11-11 2023-11-22 ラム リサーチ コーポレーション センサマッピングおよびトリガされるデータロギングを含む、健全性に基づいてモニタリング、評価、および応答するための基板処理システムツール

Also Published As

Publication number Publication date
EP4339726A1 (en) 2024-03-20
US20240085278A1 (en) 2024-03-14

Similar Documents

Publication Publication Date Title
Wang et al. A two-stage data-driven-based prognostic approach for bearing degradation problem
CN106104496B (zh) 用于任意时序的不受监督的异常检测
US10977568B2 (en) Information processing apparatus, diagnosis method, and program
Ross et al. Nonparametric monitoring of data streams for changes in location and scale
US10228994B2 (en) Information processing system, information processing method, and program
WO2018131219A1 (ja) 異常検知装置、異常検知方法、および記憶媒体
JP6854151B2 (ja) 異常予測方法、異常予測装置、異常予測システムおよび異常予測プログラム
CN110286656B (zh) 一种错误数据容忍的虚警过滤方法和装置
EP3795975B1 (en) Abnormality sensing apparatus, abnormality sensing method, and abnormality sensing program
US11620539B2 (en) Method and device for monitoring a process of generating metric data for predicting anomalies
CN110083593B (zh) 电站运行参数清洗及修复方法、修复系统
JP2019159604A (ja) 異常検知装置、異常検知方法及び異常検知プログラム
US20190026632A1 (en) Information processing device, information processing method, and recording medium
US7949497B2 (en) Machine condition monitoring using discontinuity detection
Zhou et al. EWMA smoothing and Bayesian spatial modeling for health surveillance
CN117434407A (zh) 时频域特征融合的换流变阀侧套管绝缘分析方法及系统
CN114065627A (zh) 温度异常检测方法、装置、电子设备和介质
CN106652393A (zh) 假警报确定方法及装置
JP2009110262A (ja) フィルタ装置、フィルタ装置のフィルタリング方法およびフィルタリングプログラム
Dogu Change point estimation based statistical monitoring with variable time between events (TBE) control charts
JP2024041512A (ja) 異常検知装置、方法およびプログラム
JP7095443B2 (ja) 異常検知プログラム、異常検知方法及び異常検知装置
EP4152115A1 (en) Monitoring apparatus, method, and program
JP7278499B1 (ja) 学習装置、異常兆候検知装置、異常兆候検知システム、学習方法およびプログラム
Maleki et al. A one-class clustering technique for novelty detection and isolation in sensor networks

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230131