JP7086803B2 - 異常検知装置、異常検知方法及びプログラム - Google Patents

異常検知装置、異常検知方法及びプログラム Download PDF

Info

Publication number
JP7086803B2
JP7086803B2 JP2018181533A JP2018181533A JP7086803B2 JP 7086803 B2 JP7086803 B2 JP 7086803B2 JP 2018181533 A JP2018181533 A JP 2018181533A JP 2018181533 A JP2018181533 A JP 2018181533A JP 7086803 B2 JP7086803 B2 JP 7086803B2
Authority
JP
Japan
Prior art keywords
abnormality
unit
distribution
value
acquired
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018181533A
Other languages
English (en)
Other versions
JP2020052740A (ja
Inventor
利幸 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Digital Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Digital Solutions Corp filed Critical Toshiba Corp
Priority to JP2018181533A priority Critical patent/JP7086803B2/ja
Priority to US16/582,338 priority patent/US11520672B2/en
Publication of JP2020052740A publication Critical patent/JP2020052740A/ja
Application granted granted Critical
Publication of JP7086803B2 publication Critical patent/JP7086803B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2101/00Indexing scheme relating to the type of digital function generated
    • G06F2101/14Probability distribution functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Description

本発明の実施形態は、異常検知装置、異常検知方法及びプログラムに関する。
時系列データをモデル化した自己回帰モデルを用い、監視対象の装置及び機器等に取り付けられたセンサにより実際に得られたデータから当該監視対象の装置及び機器等における異常の有無を判別するような手法が従来から知られている。
また、非線形の時系列データをモデル化するための手法として、例えば、LSTM(Long Short Term Memory)等のようなニューラルネットワークに含まれる各ノードの処理に用いられるパラメータを機械学習で学習させる手法が従来から知られている。
しかし、従来から知られている手法によれば、例えば、実際に得られたデータに含まれるノイズの特性が時間的に変化するような場合に、当該データから異常の有無を判別する際の判別精度が低下してしまう、という問題点がある。
日本国特開平7-219623号公報
Pankaj Malhotra, Lovekesh Vig, Gautam Shroff, Puneet Agarwal:「Long Short Term Memory Networks for Anomaly Detection in Time Series」, ESANN 2015 proceedings, Bruges (Belgium), 22-24 April 2015
実施形態は、実際に得られたデータに含まれるノイズの特性が時間的に変化するような場合であっても、当該データから異常の有無を高精度に判別することが可能な異常検知装置、異常検知方法及びプログラムを提供することを目的とする。
実施形態の異常検知装置は、測定対象の物理量を実際に測定して得られたT(T≧2)個の実測値を含むm(m≧1)次元の時系列データから異常の有無を検知するように構成された装置であって、予測部と、異常度算出部と、を有して構成されている。前記予測部は、前記m次元の時系列データの時間ステップ毎に、前記m次元の時系列データの時間ステップt(1≦t≦T)において取得され得る予測値の分布状態を表す連続確率分布の表現に必要な分布パラメータを取得するための処理を行うように構成されている。前記異常度算出部は、前記予測部により取得された前記分布パラメータを用い、前記m次元の時系列データの前記時間ステップtの実測値における異常の大きさを評価した評価値に相当する異常度を算出するための処理を行うように構成されている。前記予測部は、多層のニューラルネットワークを用いて構成されているとともに、前記時間ステップtに隣接する複数の時間ステップに対応する過去の複数の実測値を入力データとして用いて処理を行うことにより出力データを取得するように構成された基本ネットワーク部と、前記mの値が2以上である場合に、前記基本ネットワーク部により取得された前記出力データに含まれるベクトルを分割する処理を行うことにより、m次元の平均ベクトルと、m次の正方行列に相当するm次の中間行列と、を基本パラメータとして取得するように構成されたパラメータ取得部と、前記mの値が2以上である場合に、前記パラメータ取得部により取得された前記基本パラメータを前記連続確率分布の定義域に収めるための処理を行うことにより、前記m次元の平均ベクトルと、前記m次の中間行列を多変量ガウス分布の定義域に収めるための処理により得られたm次の分散共分散行列と、を前記分布パラメータとして取得するように構成された制約処理部と、を有する。
実施形態に係る異常検知装置を含む監視システムの構成の一例を示す図。 実施形態に係る異常検知装置の構成の一例を示す図。 実施形態に係る異常検知装置に含まれる異常度評価部の構成の一例を示す図。 実施形態に係る異常検知装置に含まれるモデルパラメータ学習部の構成の一例を示す図。 実施形態に係る異常検知装置に含まれる異常判定処理部の構成の一例を示す図。 実施形態に係る異常検知装置に含まれる異常度評価部において行われる処理の具体例を示すフローチャート。 実施形態に係る異常検知装置に含まれるモデルパラメータ学習部において行われる処理の具体例の一部を示すフローチャート。 図7の処理の続きを示すフローチャート。 実施形態の作用効果を説明するための模式図。
以下、実施形態について、図面を参照しつつ説明を行う。
監視システム101は、図1に示すように、製造装置1と、センサデータ収集装置2と、異常検知装置3と、表示装置4と、警報装置5と、を有して構成されている。図1は、実施形態に係る異常検知装置を含む監視システムの構成の一例を示す図である。
製造装置1は、例えば、半導体等の所定の製品を製造するための装置として構成されている。また、製造装置1には、所定の製品の製造工程における測定対象の物理量を測定するための1つ以上のセンサ1Aが取り付けられている。
センサ1Aは、例えば、振動センサ、電圧センサ、温度センサ及び静電容量センサ等の様々なセンサのうちのいずれかにより構成されている。また、センサ1Aは、所定の種類の物理量を測定して得られたセンサ値を示す信号を生成するとともに、当該生成した信号をセンサデータ収集装置2へ出力するように構成されている。なお、本実施形態によれば、製造装置1に取り付けられた複数のセンサ1Aにおいて、1つの種類の物理量のみが測定対象の物理量として測定されるものであってもよく、または、相互に異なる複数の種類の物理量が測定対象の物理量として測定されるものであってもよい。また、本実施形態によれば、製造装置1に取り付けられた複数のセンサ1Aのうちの一部のセンサにおいて、相互に同じ種類の物理量が測定対象の物理量として測定されるものであってもよい。
センサデータ収集装置2は、例えば、1つ以上のプロセッサ2Aと、記憶媒体2Bと、を有するコンピュータとして構成されている。また、センサデータ収集装置2は、センサ1Aから出力される信号により示される時系列の複数のセンサ値(実測値)をセンサデータとして蓄積するように構成されている。すなわち、センサデータ収集装置2に蓄積されるセンサデータには、1種類以上の測定対象の物理量を実際に測定して得られたセンサ値(実測値)が含まれている。また、センサデータ収集装置2に蓄積されるセンサデータは、非線形の時間依存性を有している。
なお、本実施形態によれば、1つの製造装置1に設けられたセンサ1Aから出力される信号に応じたセンサデータがセンサデータ収集装置2に蓄積されるものに限らず、複数の製造装置1に設けられたセンサ1A各々から出力される信号に応じたセンサデータがセンサデータ収集装置2に蓄積されるようにしてもよい。
異常検知装置3は、例えば、1つ以上のプロセッサ3Aと、記憶媒体3Bと、を有するコンピュータとして構成されている。また、異常検知装置3は、センサデータ収集装置2に蓄積されたセンサデータを読み込むとともに、当該読み込んだセンサデータから製造装置1における異常の有無を判定するための処理を行うように構成されている。また、異常検知装置3は、製造装置1に異常ありとの判定結果を得た際に、当該判定結果に応じた異常の内容を示す信号を生成するとともに、当該生成した信号を表示装置4及び警報装置5のうちの少なくとも一方へ出力するように構成されている。
すなわち、製造装置1は、監視システム101における監視対象の装置に相当するとともに、異常検知装置3による異常検知対象の装置に相当する。
表示装置4は、例えば、液晶モニタ等を有して構成されている。また、表示装置4は、異常検知装置3から出力される信号に応じ、製造装置1において発生している異常を報知するための文字列等を画面に表示することができるように構成されている。
警報装置5は、例えば、ランプまたはブザーを有して構成されている。また、警報装置5は、異常検知装置3から出力される信号に応じて動作することにより、製造装置1において異常が発生している旨を報知することができるように構成されている。
異常検知装置3は、例えば、図2に示すように、異常度評価部31と、モデルパラメータ学習部32と、異常判定処理部33と、を有して構成されている。図2は、実施形態に係る異常検知装置の構成の一例を示す図である。
異常度評価部31は、センサデータ収集装置2に蓄積されたセンサデータを読み込むとともに、当該読み込んだセンサデータに含まれる評価対象のセンサ値(実測値)における異常の大きさを評価した評価値に相当する異常度を算出するための処理を行うように構成されている。また、異常度評価部31は、前述の処理により算出した異常度を異常判定処理部33へ出力するように構成されている。
モデルパラメータ学習部32は、センサデータ収集装置2に蓄積されたセンサデータを読み込むとともに、当該読み込んだセンサデータに含まれる時系列の複数のセンサ値(実測値)に基づき、異常度評価部31において用いられるモデルパラメータを取得するための学習処理を行うように構成されている。
異常判定処理部33は、異常度評価部31から出力される異常度に基づき、製造装置1における異常の有無を判定するための判定処理を行うように構成されている。また、異常判定処理部33は、製造装置1に異常ありとの判定結果を得た際に、当該判定結果に応じた異常の内容を示す信号を生成するとともに、当該生成した信号を表示装置4及び警報装置5のうちの少なくとも一方へ出力するように構成されている。
異常度評価部31は、例えば、図3に示すように、予測部311と、異常度算出部31Dと、を有して構成されている。図3は、実施形態に係る異常検知装置に含まれる異常度評価部の構成の一例を示す図である。
予測部311は、センサデータ収集装置2に蓄積されたセンサデータと、モデルパラメータ学習部32により得られたモデルパラメータと、をそれぞれ読み込むとともに、当該読み込んだモデルパラメータと、当該読み込んだセンサデータに含まれる時系列の複数のセンサ値(実測値)と、に基づき、予測対象のセンサ値(予測値)の分布状態を表す連続確率分布の表現に必要な分布パラメータを取得するための処理を行うように構成されている。また、予測部311は、前述の処理により取得した分布パラメータを異常度算出部31Dへ出力するように構成されている。また、予測部311は、基本ネットワーク部31Aと、パラメータ取得部31Bと、制約処理部31Cと、を有して構成されている。
基本ネットワーク部31Aは、例えば、入力層、隠れ層及び出力層を有する多層のニューラルネットワークを用いて構成されている。また、基本ネットワーク部31Aは、モデルパラメータ学習部32において保持されているモデルパラメータを読み込むとともに、当該読み込んだモデルパラメータに応じてニューラルネットワークのパラメータに相当する当該ニューラルネットワークの各重み(結合強度)を設定するように構成されている。また、基本ネットワーク部31Aは、モデルパラメータ学習部32から読み込んだモデルパラメータに応じた重みを設定した状態において、センサデータ収集装置2に蓄積されたセンサデータを読み込むとともに、当該読み込んだセンサデータに含まれる時系列の複数のセンサ値(実測値)を入力データとして用いて処理を行うことにより出力データを取得するように構成されている。また、基本ネットワーク部31Aは、前述の処理により取得した出力データをパラメータ取得部31Bへ出力するように構成されている。
なお、本実施形態の基本ネットワーク部31Aは、後述の基本ネットワーク部32Aと同一のネットワーク構成を有している限りにおいては、任意のニューラルネットワークを用いて構成することができる。具体的には、本実施形態の基本ネットワーク部31Aは、例えば、全結合型ニューラルネットワーク、畳み込みニューラルネットワーク、及び、再帰型ニューラルネットワーク等の様々なニューラルネットワークのうちのいずれかを用いて構成することができる。
パラメータ取得部31Bは、基本ネットワーク部31Aから出力される出力データを分割する処理を行うことにより、分布パラメータの元となる基本パラメータを取得するように構成されている。また、パラメータ取得部31Bは、前述の処理により取得した基本パラメータを制約処理部31Cへ出力するように構成されている。
制約処理部31Cは、パラメータ取得部31Bから出力される基本パラメータを予測対象のセンサ値(予測値)の分布状態を表す連続確率分布の定義域に収めるための処理を行うことにより、当該連続確率分布の表現に必要な分布パラメータを取得するように構成されている。また、制約処理部31Cは、前述の処理により取得した分布パラメータを異常度算出部31Dへ出力するように構成されている。
異常度算出部31Dは、センサデータ収集装置2に蓄積されたセンサデータを読み込むとともに、予測部311から出力される分布パラメータを用い、当該読み込んだセンサデータに含まれる評価対象のセンサ値(実測値)における異常の大きさを評価した評価値に相当する異常度を算出するための処理を行うように構成されている。また、異常度算出部31Dは、前述の処理により算出した異常度を異常判定処理部33へ出力するように構成されている。
モデルパラメータ学習部32は、例えば、図4に示すように、基本ネットワーク部32Aと、パラメータ取得部32Bと、制約処理部32Cと、異常度算出部32Dと、を有して構成されている。図4は、実施形態に係る異常検知装置に含まれるモデルパラメータ学習部の構成の一例を示す図である。
基本ネットワーク部32Aは、例えば、入力層、隠れ層及び出力層を有する多層のニューラルネットワークを用いて構成されている。また、基本ネットワーク部32Aは、基本ネットワーク部31Aと同一のネットワーク構成を有するニューラルネットワークを用いて構成されている。また、基本ネットワーク部32Aは、センサデータ収集装置2に蓄積されたセンサデータを読み込むとともに、当該読み込んだセンサデータに含まれる時系列の複数のセンサ値(実測値)を入力データとして用いて処理を行うことにより出力データを取得するように構成されている。また、基本ネットワーク部32Aは、前述の処理により取得した出力データをパラメータ取得部32Bへ出力するように構成されている。また、基本ネットワーク部32Aは、パラメータ取得部32Bから出力される勾配(後述)を用いたバックプロパゲーションをニューラルネットワークに対して施すことにより、当該ニューラルネットワークに含まれる少なくとも一部の重み(結合強度)を更新する処理を学習処理において行うように構成されている。また、基本ネットワーク部32Aは、学習処理における所定の終了条件を満たした際の当該ニューラルネットワークの各重み(結合強度)をモデルパラメータとして保持するように構成されている。
なお、本実施形態の基本ネットワーク部32Aは、基本ネットワーク部31Aと同一のネットワーク構成を有している限りにおいては、任意のニューラルネットワークを用いて構成することができる。具体的には、本実施形態の基本ネットワーク部32Aは、例えば、全結合型ニューラルネットワーク、畳み込みニューラルネットワーク、及び、再帰型ニューラルネットワーク等の様々なニューラルネットワークのうちのいずれかを用いて構成することができる。
パラメータ取得部32Bは、基本ネットワーク部32Aから出力される出力データを分割する処理を行うことにより、分布パラメータの元となる基本パラメータを取得するように構成されている。また、パラメータ取得部32Bは、前述の処理により取得した基本パラメータを制約処理部32Cへ出力するように構成されている。また、パラメータ取得部32Bは、制約処理部32Cから出力される勾配(後述)に基づき、基本ネットワーク部32Aにより得られた出力データに対する異常度算出部32Dにより得られた異常度の勾配を算出するための処理を行うように構成されている。また、パラメータ取得部32Bは、前述の処理により算出した勾配を基本ネットワーク部32Aへ出力するように構成されている。
制約処理部32Cは、パラメータ取得部32Bから出力される基本パラメータを予測対象のセンサ値(予測値)の分布状態を表す連続確率分布の定義域に収めるための処理を行うことにより、当該連続確率分布の表現に必要な分布パラメータを取得するように構成されている。また、制約処理部32Cは、前述の処理により取得した分布パラメータを異常度算出部32Dへ出力するように構成されている。また、制約処理部32Cは、異常度算出部32Dから出力される勾配(後述)に基づき、パラメータ取得部32Bにより得られた基本パラメータに対する異常度算出部32Dにより得られた異常度の勾配を算出するための処理を行うように構成されている。また、制約処理部32Cは、前述の処理により算出した勾配をパラメータ取得部32Bへ出力するように構成されている。
異常度算出部32Dは、センサデータ収集装置2に蓄積されたセンサデータを読み込むとともに、制約処理部32Cから出力される分布パラメータを用い、当該読み込んだセンサデータに含まれる評価対象のセンサ値(実測値)における異常の大きさを評価した評価値に相当する異常度を算出するための処理を行うように構成されている。また、異常度算出部32Dは、制約処理部32Cにより得られた分布パラメータに対する異常度の勾配を算出するための処理を行うように構成されている。また、異常度算出部32Dは、前述の処理により算出した勾配を制約処理部32Cへ出力するように構成されている。
異常判定処理部33は、例えば、図5に示すように、異常度記録部33Aと、平滑化処理部33Bと、異常判定部33Cと、を有して構成されている。図5は、実施形態に係る異常検知装置に含まれる異常判定処理部の構成の一例を示す図である。
異常度記録部33Aは、異常度評価部31から出力される異常度を時系列に記録するように構成されている。
平滑化処理部33Bは、異常度記録部33Aに時系列に記録された複数の異常度を読み込むとともに、当該読み込んだ複数の異常度に対して平滑化処理を施すように構成されている。また、平滑化処理部33Bは、前述の平滑化処理の処理結果として得られた異常度を異常判定部33Cへ出力するように構成されている。
異常判定部33Cは、平滑化処理部33Bから出力される異常度に基づき、製造装置1における異常の有無を判定するための判定処理を行うように構成されている。また、異常判定部33Cは、製造装置1に異常ありとの判定結果を得た際に、当該判定結果に応じた異常の内容を示す信号を生成するとともに、当該生成した信号を表示装置4及び警報装置5のうちの少なくとも一方へ出力するように構成されている。
なお、本実施形態においては、異常度評価部31、モデルパラメータ学習部32、及び、異常判定処理部33の各部の機能が、プロセッサ3A及び記憶媒体3Bを含むハードウェアにより実現されるようにしてもよい。または、本実施形態においては、例えば、異常度評価部31、モデルパラメータ学習部32、及び、異常判定処理部33の各部の機能を実現するためのプログラムが記憶媒体3Bに格納されているとともに、プロセッサ3Aが当該プログラムを読み込んで実行するようにしてもよい。コンピュータ読取可能な記憶媒体3Bとしては、CD-ROM等の光ディスク、DVD-ROM等の相変化型光ディスク、MO(Magnet Optical)やMD(Mini Disk)などの光磁気ディスク、フロッピー(登録商標)ディスクやリムーバブルハードディスクなどの磁気ディスク、コンパクトフラッシュ(登録商標)、スマートメディア、SDメモリカード、メモリスティック等のメモリカードが挙げられる。また、本発明の目的のために特別に設計されて構成された集積回路(ICチップ等)等のハードウェア装置も記憶媒体として含まれる。
続いて、本実施形態の作用について説明する。
なお、以降においては、m個のセンサ1Aから得られた時系列の複数のセンサ値を含むセンサデータ、すなわち、m次元の時系列データに対して処理が行われる場合を例に挙げて説明する。また、以降においては、時系列データが、X={x1,x2,…,xT}として表されるT(T≧2)個のセンサ値を有するデータ、すなわち、系列長Tのデータであるものとして説明する。また、以降の説明においては、時系列データXに含まれる各センサ値(実測値)の時間間隔を時間ステップと称するものとする。また、以降の説明においては、時系列データXに含まれる各センサ値に対して時間ステップ毎に付与された番号をステップ値と称するものとする。また、以降においては、mの値が2以上であるとともに、予測対象のm次元のセンサ値の分布状態を表す連続確率分布として、下記数式(1)により示される多変量ガウス分布N(x;μ,Σ)を用いた場合を例に挙げて説明する。なお、下記数式(1)において、xはm次元のセンサ値を含むベクトルを表し、μはm次元の時系列データX各々のセンサ値の平均値を含む平均ベクトルを表し、Σはm次元の時系列データXにおける分散及び共分散を含む正定値対称行列に相当するm次の分散共分散行列を表すものとする。
Figure 0007086803000001
まず、異常度評価部31の各部において行われる処理について、図6を参照しつつ説明する。図6は、実施形態に係る異常検知装置に含まれる異常度評価部において行われる処理の具体例を示すフローチャートである。
基本ネットワーク部31Aは、モデルパラメータ学習部32において保持されているモデルパラメータを読み込むとともに、当該読み込んだモデルパラメータに応じてニューラルネットワークに含まれる各重み(結合強度)を設定する(図6のステップS1)。
予測部311の各部(基本ネットワーク部31A、パラメータ取得部31B及び制約処理部31C)は、予測対象のセンサ値のステップ値tを1に設定する(図6のステップS2)。また、異常度算出部31Dは、評価対象のセンサ値のステップ値tを1に設定する(図6のステップS2)。
基本ネットワーク部31Aは、センサデータ収集装置2に蓄積されたセンサデータの中から、時間ステップtに隣接する過去のセンサデータを読み込む(図6のステップS3)。
具体的には、基本ネットワーク部31Aは、例えば、時間ステップtに対応するm次元のセンサ値xtを予測する場合には、センサデータ収集装置2に蓄積されたセンサデータの中から、当該時間ステップtに隣接するW(W≧2)個の時間ステップに対応するm次元×W個のセンサ値{xt-W、xt-W+1、…、xt-1}を含む過去のセンサデータを読み込む。
基本ネットワーク部31Aは、図6のステップS3において読み込んだセンサデータに含まれる各センサ値を入力データとして用いて処理を行うことにより出力データを取得するとともに、当該取得した出力データをパラメータ取得部31Bへ出力する(図6のステップS4)。すなわち、基本ネットワーク部31Aは、時間ステップtに隣接する複数の時間ステップに対応する過去の複数の実測値を入力データとして用いて処理を行うことにより出力データを取得する。
パラメータ取得部31Bは、基本ネットワーク部31Aから出力される出力データを分割する処理を行うことにより基本パラメータを取得するとともに、当該取得した基本パラメータを制約処理部31Cへ出力する(図6のステップS5)。
具体的には、基本ネットワーク部31Aは、例えば、図6のステップS4において、m次元×W個のセンサ値を含むベクトルを入力データとして用いて処理を行うことにより、m+m2個のデータを含むベクトルを当該処理に応じた出力データvとして取得する。そして、パラメータ取得部31Bは、図6のステップS5において、基本ネットワーク部31Aから出力される出力データvに含まれるベクトルを分割する処理を行うことにより、時間ステップtに対応するm次元の平均ベクトルμtと、m次の正方行列に相当するm次の中間行列Uと、を基本パラメータとして取得する。すなわち、基本ネットワーク部31Aから出力される出力データvと、パラメータ取得部31Bにより取得される基本パラメータに含まれる平均ベクトルμt及び中間行列Uと、の間には、下記数式(2)に示すような関係が成立する。なお、下記数式(2)の演算子vec(・)は、行列を1列ずつ抽出して連結することによりベクトルを作成する処理を表すものとする。
Figure 0007086803000002
制約処理部31Cは、パラメータ取得部31Bから出力される基本パラメータを予測対象のセンサ値の分布状態を表す連続確率分布の定義域に収めるための処理を行うことにより、当該連続確率分布の表現に必要な分布パラメータを取得するとともに、当該取得した分布パラメータを異常度算出部31Dへ出力する(図6のステップS6)。
具体的には、制約処理部31Cは、パラメータ取得部31Bから出力されるm次の中間行列Uを上記数式(1)に示した多変量ガウス分布Nの定義域に収めるための処理として、例えば、パラメータ取得部31Bから出力されるm次の中間行列Uに対して下記数式(3)を適用する処理を行うことにより、時間ステップtに対応するm次の分散共分散行列Σtを取得する。なお、下記数式(3)において、Iはm次の単位行列を表し、λは正の実数を表すものとする。
Figure 0007086803000003
なお、制約処理部31Cは、パラメータ取得部31Bから出力される平均ベクトルμtに対しては処理を行わない。そのため、制約処理部31Cは、図6のステップS6において、上記数式(3)を用いた処理の処理結果に相当する分散共分散行列Σtと、パラメータ取得部31Bから出力される平均ベクトルμtと、を時間ステップtに対応するm次元のセンサ値xtの分布状態を表す多変量ガウス分布N(xt;μt,Σt)の表現に必要な分布パラメータとして取得するとともに、当該取得した分布パラメータを異常度算出部31Dへ出力する。
ここで、中間行列Uは、基本ネットワーク部31Aにおけるニューラルネットワークの出力データvと同じデータを含む関係上、上記数式(1)に示した多変量ガウス分布Nの分散共分散行列Σの定義域に収まらない行列として取得される場合がある。これに対し、本実施形態においては、制約処理部31Cが、上記数式(3)に示したような、m次の中間行列Uのグラム行列UTUと、m次の単位行列Iをλ倍した行列と、を加算する処理を行うことにより、上記数式(1)に示した多変量ガウス分布Nの定義域に収まる正定値対称行列に相当するm次の分散共分散行列Σtを取得するようにしている。
異常度算出部31Dは、センサデータ収集装置2に蓄積されたセンサデータの中から、時間ステップtに対応するm次元のセンサ値xtを含むセンサデータを読み込む(図6のステップS7)。
異常度算出部31Dは、予測部311の制約処理部31Cから出力される分布パラメータを用いた処理を行うことにより、図6のステップS7において読み込んだセンサデータに含まれるセンサ値各々に対応する異常度を算出するとともに、当該算出した異常度を異常判定処理部33へ出力する(図6のステップS8)。
具体的には、異常度算出部31Dは、例えば、制約処理部31Cから出力される分布パラメータに含まれる分散共分散行列Σt及び平均ベクトルμtと、図6のステップS7において読み込んだセンサデータに含まれるm次元のセンサ値xtと、を下記数式(4)に適用することにより、当該m次元のセンサ値xt各々に対応する異常度fを算出する。
Figure 0007086803000004
ここで、上記数式(4)によれば、異常度算出部31Dは、異常度fを算出するための処理として、多変量ガウス分布N(xt;μt,Σt)の負の対数尤度を算出する処理を行っている。そのため、例えば、時間ステップtに対応するm次元のセンサ値xtの多変量ガウス分布N(xt;μt,Σt)に対する当てはまりが良い場合には、異常度fが相対的に小さな値として算出される。また、例えば、時間ステップtに対応するm次元のセンサ値xtの多変量ガウス分布N(xt;μt,Σt)に対する当てはまりが悪い場合には、異常度fが相対的に大きな値として算出される。
なお、本実施形態の異常度算出部31Dは、制約処理部31Cから出力される分布パラメータを用いた処理を行う限りにおいては、上記数式(4)に示した負の対数尤度とは異なる評価指標に基づいて異常度fを算出するようにしてもよい。
予測部311の各部は、図6のステップS6の処理を終了した後、予測対象のセンサ値のステップ値tに1を加算する(図6のステップS9)。また、異常度算出部31Dは、図6のステップS8の処理を終了した後、評価対象のセンサ値のステップ値tに1を加算する(図6のステップS9)。
予測部311の各部及び異常度算出部31Dは、ステップ値tが時系列データXの系列長Tよりも大きいか否かに係る判定を行う(図6のステップS10)。
予測部311の各部及び異常度算出部31Dは、ステップ値tが系列長T以下であるとの判定結果を得た場合(S10:NO)には、図6のステップS3からの処理を再度行う。また、予測部311の各部及び異常度算出部31Dは、ステップ値tが系列長Tより大きいとの判定結果を得た場合(S10:YES)には、図6の一連の処理を終了する。
なお、図6の一連の処理は、mが2以上の場合に適用されるものに限らず、mが1である場合においても略同様に適用される。すなわち、図6の一連の処理は、m≧1において適用される。
以上に述べたように、予測部311は、m次元の時系列データXの時間ステップ毎に、当該m次元の時系列データの時間ステップt(1≦t≦T)において取得され得る予測値の分布状態を表す連続確率分布の表現に必要な分布パラメータを取得するための処理を行う。また、以上に述べたように、異常度算出部31Dは、予測部311により取得された分布パラメータを用い、m次元の時系列データの時間ステップtの実測値における異常の大きさを評価した評価値に相当する異常度を算出するための処理を行う。
本実施形態によれば、センサデータに関する事前知識が予め得られている場合に、当該事前知識に応じた追加の処理が制約処理部31Cにおいて行われるようにしてもよい。具体的には、本実施形態によれば、例えば、複数のセンサ1Aが相互に離れた場所に設けられているような場合に、分散共分散行列Σtに含まれる当該複数のセンサ1Aの共分散を0にするための処理が制約処理部31Cにおいてさらに行われるようにしてもよい。また、本実施形態によれば、例えば、センサ1Aにより得られるセンサ値が0以上であることが明らかな場合に、平均ベクトルμtに対する非負制約に係る処理が制約処理部31Cにおいてさらに行われるようにしてもよい。
本実施形態によれば、図6の一連の処理を適宜変形することにより、例えば、mの値が2以上である場合に、m次元の時系列データのうちの少なくとも1次元の時系列データについて、時間ステップtに対応するセンサ値xt(予測値)の分布状態を表す連続確率分布の表現に必要な分布パラメータを取得するための処理が予測部311により行われるともに、当該分布パラメータを用いて異常度fを算出するための処理が異常度算出部31Dにより行われるようにしてもよい。
次に、モデルパラメータ学習部32の各部において行われる処理について、図7及び図8を参照しつつ説明する。図7は、実施形態に係る異常検知装置に含まれるモデルパラメータ学習部において行われる処理の具体例の一部を示すフローチャートである。図8は、図7の処理の続きを示すフローチャートである。
なお、以降においては、センサ1Aが正常な状態で取得された、すなわち、製造装置1が正常に動作している状態で取得されたT個のセンサ値を含む時系列データX={x1,x2,…,xT}を用いた処理が行われる場合を例に挙げて説明する。
基本ネットワーク部32Aは、現在保持しているモデルパラメータに対応するニューラルネットワークの各重み(結合強度)を乱数で初期化する(図7のステップS21)。
具体的には、基本ネットワーク部32Aは、例えば、正規分布または一様分布に応じて生成した乱数を用い、現在保持しているモデルパラメータに対応するニューラルネットワークの各重み(結合強度)を初期化する。
基本ネットワーク部32Aは、予測対象のセンサ値のステップ値tをT個のステップ値の中からランダムに選択したステップ値に設定する(図7のステップS22)。また、パラメータ取得部32B及び制約処理部32Cは、予測対象のセンサ値のステップ値tを基本ネットワーク部32Aにより選択されたステップ値と同じステップ値に設定する(図7のステップS22)。また、異常度算出部32Dは、評価対象のセンサ値のステップ値tを基本ネットワーク部32Aにより選択されたステップ値と同じステップ値に設定する(図7のステップS22)。
基本ネットワーク部32Aは、センサデータ収集装置2に蓄積されたセンサデータの中から、図7のステップS22により設定したステップ値tを有する時間ステップtに隣接する過去のセンサデータを読み込む(図7のステップS23)。
具体的には、基本ネットワーク部32Aは、例えば、基本ネットワーク部31Aにおける図6のステップS3の処理と略同様の処理を行うことにより、時間ステップtに隣接するW個の時間ステップに対応するm次元×W個のセンサ値{xt-W、xt-W+1、…、xt-1}を含む過去のセンサデータを読み込む。
基本ネットワーク部32Aは、図7のステップS23において読み込んだセンサデータに含まれる各センサ値を入力データとして用いて処理を行うことにより出力データを取得するとともに、当該取得した出力データをパラメータ取得部32Bへ出力する(図7のステップS24)。
具体的には、基本ネットワーク部32Aは、例えば、基本ネットワーク部31Aにおける図6のステップS4の処理と略同様の処理を行うことにより、m+m2個のデータを含むベクトルを出力データvとして取得するとともに、当該取得した出力データvをパラメータ取得部32Bへ出力する。
パラメータ取得部32Bは、基本ネットワーク部32Aから出力される出力データを分割する処理を行うことにより基本パラメータを取得するとともに、当該取得した基本パラメータを制約処理部32Cへ出力する(図7のステップS25)。
具体的には、パラメータ取得部32Bは、例えば、パラメータ取得部31Bにおける図6のステップS5の処理と略同様の処理を行うことにより、時間ステップtに対応するm次元の平均ベクトルμtと、m次の正方行列に相当する中間行列Uと、を基本パラメータとして取得するとともに、当該取得した基本パラメータを制約処理部32Cへ出力する。
制約処理部32Cは、パラメータ取得部32Bから出力される基本パラメータを予測対象のセンサ値の分布状態を表す連続確率分布の定義域に収めるための処理を行うことにより、当該連続確率分布の表現に必要な分布パラメータを取得するとともに、当該取得した分布パラメータを異常度算出部32Dへ出力する(図7のステップS26)。
具体的には、制約処理部32Cは、例えば、制約処理部31Cにおける図6のステップS6の処理(上記数式(4)を用いた処理)と略同様の処理を行うことにより、分散共分散行列Σt及び平均ベクトルμtを時間ステップtに対応するm次元のセンサ値xtの分布状態を表す多変量ガウス分布N(xt;μt,Σt)の表現に必要な分布パラメータとして取得するとともに、当該取得した分布パラメータを異常度算出部32Dへ出力する。
異常度算出部32Dは、センサデータ収集装置2に蓄積されたセンサデータの中から、図7のステップS22により設定したステップ値tを有する時間ステップtに対応するm次元のセンサ値xtを含むセンサデータを読み込む(図7のステップS27)。
異常度算出部32Dは、制約処理部32Cから出力される分布パラメータを用いた処理を行うことにより、図7のステップS27において読み込んだセンサデータに含まれるセンサ値各々に対応する異常度を算出する(図7のステップS28)。
具体的には、異常度算出部32Dは、例えば、異常度算出部31Dにおける図6のステップS8の処理と略同様の処理(上記数式(2)を用いた処理)を行うことにより、m次元のセンサ値xt各々に対応する異常度fを算出する。
異常度算出部32Dは、図7のステップS28による異常度の算出に用いた分布パラメータに対する当該異常度の勾配を算出するとともに、当該算出した勾配を制約処理部32Cへ出力する(図8のステップS29)。
具体的には、異常度算出部32Dは、例えば、図7のステップS28による異常度の算出に用いた分散共分散行列Σt及び平均ベクトルμtと、図7のステップS27により読み込んだm次元のセンサ値xtと、を下記数式(5)に適用することにより、当該平均ベクトルμtに対する異常度fの勾配∂f/∂μtを算出する。また、異常度算出部32Dは、例えば、図7のステップS28による異常度の算出に用いた分散共分散行列Σt及び平均ベクトルμtと、図7のステップS27により読み込んだm次元のセンサ値xtと、を下記数式(6)に適用することにより、当該分散共分散行列Σtに対する異常度fの勾配∂f/∂Σtを算出する。そして、異常度算出部32Dは、前述のように算出した勾配∂f/∂μt及び∂f/∂Σtを制約処理部32Cへ出力する。
Figure 0007086803000005
Figure 0007086803000006
制約処理部32Cは、異常度算出部32Dから出力される勾配に基づき、図7のステップS26による分布パラメータの取得に用いた基本パラメータに対する、図7のステップS28により算出された異常度の勾配を算出するとともに、当該算出した勾配をパラメータ取得部32Bへ出力する(図8のステップS30)。
具体的には、制約処理部32Cは、例えば、図7のステップS26による分布パラメータの取得に用いた中間行列Uと、図8のステップS29により異常度算出部32Dから出力される勾配∂f/∂Σtと、を下記数式(7)に適用することにより、当該中間行列Uにおけるi行j列目の成分Uijに対する異常度fの勾配∂f/∂Uijを算出する。なお、下記数式(7)において、演算子Tr[・]は行列のトレースを表し、行列Jijはi行j列目の成分が1であるとともにその他の成分が0であるような行列を表すものとする。
Figure 0007086803000007
なお、制約処理部32Cは、異常度算出部32Dから出力される勾配∂f/∂μtに対しては処理を行わない。そのため、制約処理部32Cは、中間行列Uに含まれる各成分に対応する勾配∂f/∂Uijの算出結果を勾配∂f/∂Uとして取得するとともに、当該取得した勾配∂f/∂Uと、勾配∂f/∂μtと、を併せてパラメータ取得部32Bへ出力する。
パラメータ取得部32Bは、制約処理部32Cから出力される勾配に基づき、図7のステップS25による基本パラメータの取得に用いた出力データに対する、図7のステップS28により算出された異常度の勾配を算出するとともに、当該算出した勾配を基本ネットワーク部32Aへ出力する(図8のステップS31)。
具体的には、パラメータ取得部32Bは、例えば、図8のステップS30により制約処理部32Cから出力される勾配∂f/∂U及び∂f/∂μを下記数式(8)に適用することにより、出力データvに対する異常度fの勾配∂f/∂vを算出する。そして、パラメータ取得部32Bは、前述のように算出した勾配∂f/∂vを基本ネットワーク部32Aへ出力する。
Figure 0007086803000008
基本ネットワーク部32Aは、パラメータ取得部32Bから出力される勾配∂f/∂vに基づくバックプロパゲーションをニューラルネットワークに対して施すことにより、当該ニューラルネットワークに含まれる少なくとも一部の重み(結合強度)の勾配を算出する(図8のステップS32)。
本実施形態によれば、基本ネットワーク部32Aが図8のステップS32により算出した勾配を用いてニューラルネットワークに含まれる重み(結合強度)を更新するための処理において、例えば、Adagrad、RMSprop、AdaDelta、及び、Adam等のようなアルゴリズムを用いることができる。また、本実施形態によれば、基本ネットワーク部32Aが、図8のステップS32により算出した勾配を用いた処理を行うことにより、ニューラルネットワークに含まれる少なくとも一部の重み(結合強度)を更新するものであればよい。
基本ネットワーク部32Aは、図8のステップS32の処理回数(ニューラルネットワークのパラメータの更新回数)が所定の処理回数に到達したか否かに係る判定を行う(図8のステップS33)。
基本ネットワーク部32Aは、図8のステップS32の処理回数が所定の処理回数に到達していないとの判定結果を得た場合(S33:NO)には、図7のステップS22に戻って処理を行う。また、基本ネットワーク部32Aは、図8のステップS32の処理回数が所定の処理回数に到達したとの判定結果を得た場合(S33:YES)には、当該判定結果を得た際のニューラルネットワークの各重み(結合強度)をモデルパラメータとして保持した状態で一連の処理を終了する。
本実施形態によれば、図8のステップS33において、図8のステップS32の処理回数が所定の処理回数に到達したか否かに係る判定処理が行われるものに限らず、例えば、図7のステップS28により算出された異常度が一定値に収束した否かに係る判定処理が行われるようにしてもよい。そして、このような判定処理によれば、図7のステップS28により算出された異常度が一定値に収束したとの判定結果が得られるまで、図7のステップS22以降の一連の処理が繰り返し行われる。
本実施形態によれば、図7及び図8の一連の処理を適宜変形することにより、ミニバッチ学習に相当する処理が行われるようにしてもよい。具体的には、本実施形態によれば、例えば、時系列データXにおけるT個のステップ値の中から複数のステップ値tがランダムに選択され、当該複数のステップ値tに対応する複数のセンサ値xtにおける複数の異常度fが算出され、当該複数の異常度fに対応する複数の勾配∂f/∂vが算出され、当該複数の勾配∂f/∂vを用いて基本ネットワーク部32Aのニューラルネットワークに含まれる各重み(結合強度)が更新されるようにしてもよい。
本実施形態によれば、図7及び図8の一連の処理を適宜変形することにより、例えば、複数の時系列データX各々から1つずつランダムにステップ値tが選択され、当該選択されたステップ値t各々に対応する複数のセンサ値xtにおける複数の異常度fが算出され、当該複数の異常度fに対応する複数の勾配∂f/∂vが算出され、当該複数の勾配∂f/∂vを用いて基本ネットワーク部32Aのニューラルネットワークに含まれる各重み(結合強度)が更新されるようにしてもよい。
以上に述べたように、モデルパラメータ学習部32は、製造装置1(異常検知装置3による異常検知対象の装置)が正常に動作している状態における測定対象の物理量の測定結果として得られた複数の実測値を含む時系列データに相当する正常データを用い、基本ネットワーク部31Aと同一のネットワーク構成を有する基本ネットワーク部32Aのニューラルネットワークのパラメータを繰り返し更新する処理に相当する学習処理を行うことにより、基本ネットワーク部31Aのニューラルネットワークのパラメータを設定する際に用いられるモデルパラメータを取得する。また、以上に述べたように、モデルパラメータ学習部32は、前述の正常データを用いて基本ネットワーク部32Aのニューラルネットワークに含まれる少なくとも一部の重み(結合強度)の更新に用いられる勾配を算出する処理を学習処理において行うとともに、当該学習処理における所定の終了条件を満たした際の当該ニューラルネットワークの各重み(結合強度)をモデルパラメータとして保持する。
最後に、異常判定処理部33の各部において行われる処理について説明する。
異常度記録部33Aは、異常度評価部31から出力される異常度を時系列に記録する。
具体的には、異常度記録部33Aは、例えば、m次元の時系列データXにおける時間ステップ毎に算出された異常度fを時系列に記録する。
平滑化処理部33Bは、異常度記録部33Aに時系列に記録された複数の異常度を読み込み、当該読み込んだ複数の異常度に対して平滑化処理を施すとともに、当該平滑化処理の処理結果として得られた異常度を異常判定部33Cへ出力する。
具体的には、平滑化処理部33Bは、異常度記録部33Aに記録された各異常度の中から、例えば、時系列データXにおける所定の時間ステップ幅または所定の時間幅に対応する複数の異常度fを読み込み、当該読み込んだ複数の異常度fの平均値に相当する平均異常度を算出し、当該算出した平均異常度を異常判定部33Cへ出力する。すなわち、平滑化処理部33Bは、時系列データXにおける所定の時間ステップ幅または所定の時間幅に対応する複数の異常度fの平均値を算出する処理を平滑化処理として行う。
あるいは、平滑化処理部33Bは、異常度記録部33Aに記録された各異常度の中から、例えば、所定の製品数または所定のロット数の時系列データXに対応する複数の異常度fを読み込み、当該読み込んだ複数の異常度fの平均値に相当する平均異常度を算出し、当該算出した平均異常度を異常判定部33Cへ出力する。すなわち、平滑化処理部33Bは、所定の製品数または所定のロット数の時系列データXに対応する複数の異常度fの平均値を算出する処理を平滑化処理として行う。
本実施形態においては、平滑化処理部33Bが異常度fの移動平均を平均異常度として算出するための処理を行うものであってもよい。具体的には、平滑化処理部33Bは、例えば、時系列データXにおける所定の時間ステップ幅に対応する複数の異常度fを時間ステップ毎にスライドさせながら読み込んで平均値を算出するような処理を平滑化処理として行うものであってもよい。
異常判定部33Cは、平滑化処理部33Bから出力される異常度に基づき、製造装置1における異常の有無を判定するための判定処理を行う。また、異常判定部33Cは、製造装置1に異常ありとの判定結果を得た際に、当該判定結果に応じた異常の内容を示す信号を生成するとともに、当該生成した信号を表示装置4及び警報装置5のうちの少なくとも一方へ出力する。
具体的には、異常判定部33Cは、例えば、平滑化処理部33Bから出力される時系列データXに対応する複数の平均異常度に基づき、製造装置1における異常の有無を判定する。そして、異常判定部33Cは、例えば、平滑化処理部33Bから出力される時系列データXに対応する複数の平均異常度の中に閾値を超える平均異常度が所定の個数以上含まれていることを検知した場合に、製造装置1に異常ありとの判定結果を取得し、当該判定結果に応じた異常の内容を示す信号を生成するとともに、当該生成した信号を表示装置4及び警報装置5のうちの少なくとも一方へ出力する。また、異常判定部33Cは、例えば、平滑化処理部33Bから出力される時系列データXに対応する複数の平均異常度の中に閾値を超える平均異常度が所定の個数未満しか含まれていないことを検知した場合に、製造装置1に異常なしとの判定結果を取得する。
本実施形態においては、異常判定部33Cの処理に用いられる閾値が、予め設定された固定値であってもよく、または、作業者等により変更可能な可変値であってもよい。また、本実施形態においては、異常判定部33Cの処理に用いられる閾値が、製造装置1に異常なしとの判定結果が得られた際の平均異常度に基づいて算出される統計量に応じた値として設定されるようにしてもよい。
以上に述べたように、異常検知装置3は、測定対象の物理量を実際に測定して得られたT(T≧2)個の実測値を含むm(m≧1)次元の時系列データから異常の有無を検知する。
以上に述べたように、本実施形態によれば、時間ステップtに対応するm次元のセンサ値xtの分布状態を表す連続確率分布(多変量ガウス分布N(xt;μt,Σt))の表現に必要な分布パラメータ(分散共分散行列Σt及び平均ベクトルμt)を取得するとともに、当該取得した分布パラメータを時間ステップ毎に変化させるような処理が行われる。そのため、本実施形態によれば、製造装置1の異常検知に用いる自己回帰モデルとして、例えば、図9に模式的に示すような、センサ値の予測値の分布状態を表す連続確率分布がセンサ値の実測値に含まれるノイズの大きさに応じて変化するモデルを作成することができる。従って、本実施形態によれば、時系列データXに含まれるノイズの特性が時間的に変化するような場合であっても、当該時系列データXから異常の有無を高精度に判別することができる。図9は、実施形態の作用効果を説明するための模式図である。
本実施形態によれば、例えば、モデルパラメータ学習部32と同様の機能を有する外部装置において図7及び図8の処理を行うことにより得られたモデルパラメータが記憶媒体3Bに格納されている場合に、基本ネットワーク部31Aが記憶媒体3Bから読み込んだ当該モデルパラメータに応じてニューラルネットワークに含まれる各重み(結合強度)を設定するようにしてもよい。すなわち、本実施形態によれば、図7及び図8の処理を経て得られたモデルパラメータが基本ネットワーク部31Aにより読み込まれる限りにおいては、モデルパラメータ学習部32が異常検知装置3に設けられていなくともよい。
また、本実施形態に係る処理等を適宜変形することにより、上記数式(1)に示した多変量ガウス分布N(x;μ,Σ)とは異なる他の連続確率分布を用いた処理が行われるようにしてもよい。
また、本実施形態に係る異常検知装置3の構成を適宜変形することにより、製造装置1とは異なる他の装置等に適合させるようにしてもよい。
本発明の実施形態を説明したが、これらの実施形態は、例として示したものであり、本発明の範囲を限定することは意図していない。これら新規の実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1 製造装置
1A センサ
2 センサデータ収集装置
3 異常検知装置
31 異常度評価部
32 モデルパラメータ学習部
31A,32A 基本ネットワーク部
31B,32B パラメータ取得部
31C,32C 制約処理部
31D,32D 異常度算出部
33 異常判定処理部
33A 異常度記録部
33B 平滑化処理部
33C 異常判定部
101 監視システム
311 予測部

Claims (8)

  1. 測定対象の物理量を実際に測定して得られたT(T≧2)個の実測値を含むm(m≧1)次元の時系列データから異常の有無を検知するように構成された異常検知装置であって、
    前記m次元の時系列データの時間ステップ毎に、前記m次元の時系列データの時間ステップt(1≦t≦T)において取得され得る予測値の分布状態を表す連続確率分布の表現に必要な分布パラメータを取得するための処理を行うように構成された予測部と、
    前記予測部により取得された前記分布パラメータを用い、前記m次元の時系列データの前記時間ステップtの実測値における異常の大きさを評価した評価値に相当する異常度を算出するための処理を行うように構成された異常度算出部と、
    を有し、
    前記予測部は、
    多層のニューラルネットワークを用いて構成されているとともに、前記時間ステップtに隣接する複数の時間ステップに対応する過去の複数の実測値を入力データとして用いて処理を行うことにより出力データを取得するように構成された基本ネットワーク部と、
    前記mの値が2以上である場合に、前記基本ネットワーク部により取得された前記出力データに含まれるベクトルを分割する処理を行うことにより、m次元の平均ベクトルと、m次の正方行列に相当するm次の中間行列と、を基本パラメータとして取得するように構成されたパラメータ取得部と、
    前記mの値が2以上である場合に、前記パラメータ取得部により取得された前記基本パラメータを前記連続確率分布の定義域に収めるための処理を行うことにより、前記m次元の平均ベクトルと、前記m次の中間行列を多変量ガウス分布の定義域に収めるための処理により得られたm次の分散共分散行列と、を前記分布パラメータとして取得するように構成された制約処理部と、
    を有することを特徴とする異常検知装置。
  2. 前記予測部は、前記mの値が2以上である場合に、前記m次元の時系列データのうちの少なくとも1次元の時系列データについて、前記分布パラメータを取得するための処理を行う
    ことを特徴とする請求項1に記載の異常検知装置。
  3. 前記異常度算出部は、前記異常度を算出するための処理として、前記連続確率分布の負の対数尤度を算出する処理を行う
    ことを特徴とする請求項1に記載の異常検知装置。
  4. 前記制約処理部は、前記m次の中間行列を前記多変量ガウス分布の定義域に収めるための処理として、前記m次の中間行列のグラム行列と、m次の単位行列をλ(λは正の実数)倍した行列と、を加算する処理を行う
    ことを特徴とする請求項1に記載の異常検知装置。
  5. 前記異常検知装置による異常検知対象の装置が正常に動作している状態における前記測定対象の物理量の測定結果として得られた複数の実測値を含む時系列データに相当する正常データを用い、前記基本ネットワーク部と同一のネットワーク構成を有する所定のニューラルネットワークのパラメータを繰り返し更新する処理に相当する学習処理を行うことにより、前記基本ネットワーク部のニューラルネットワークのパラメータを設定する際に用いられるモデルパラメータを取得するように構成されたモデルパラメータ学習部をさらに有する
    ことを特徴とする請求項に記載の異常検知装置。
  6. 前記モデルパラメータ学習部は、前記正常データを用いて前記所定のニューラルネットワークに含まれる少なくとも一部の結合強度の更新に用いられる勾配を算出する処理を前記学習処理において行うとともに、前記学習処理における所定の終了条件を満たした際の前記所定のニューラルネットワークの各結合強度を前記モデルパラメータとして保持する
    ことを特徴とする請求項5に記載の異常検知装置。
  7. 測定対象の物理量を実際に測定して得られたT(T≧2)個の実測値を含むm(m≧1)次元の時系列データから異常の有無を検知するための異常検知方法であって、
    予測部が、前記m次元の時系列データの時間ステップ毎に、前記m次元の時系列データの時間ステップt(1≦t≦T)において取得され得る予測値の分布状態を表す連続確率分布の表現に必要な分布パラメータを取得し、
    異常度算出部が、前記予測部により取得された前記分布パラメータを用い、前記m次元の時系列データの前記時間ステップtの実測値における異常の大きさを評価した評価値に相当する異常度を算出し、
    前記予測部が、
    多層のニューラルネットワークを用いて構成されているとともに、前記時間ステップtに隣接する複数の時間ステップに対応する過去の複数の実測値を入力データとして用いて処理を行うことにより出力データを取得し、
    前記mの値が2以上である場合に、取得された前記出力データを分割する処理を行うことにより、m次元の平均ベクトルと、m次の正方行列に相当するm次の中間行列と、を基本パラメータとして取得し、
    前記mの値が2以上である場合に、取得された前記基本パラメータを前記連続確率分布の定義域に収めるための処理を行うことにより、前記m次元の平均ベクトルと、前記m次の中間行列を多変量ガウス分布の定義域に収めるための処理により得られたm次の分散共分散行列と、を前記分布パラメータとして取得する
    ことを特徴とする異常検知方法。
  8. 測定対象の物理量を実際に測定して得られたT(T≧2)個の実測値を含むm(m≧1)次元の時系列データから異常の有無を検知するコンピュータにより実行されるプログラムであって、
    前記m次元の時系列データの時間ステップ毎に、前記m次元の時系列データの時間ステップt(1≦t≦T)において取得され得る予測値の分布状態を表す連続確率分布の表現に必要な分布パラメータを取得する処理と、
    前記分布パラメータを用い、前記m次元の時系列データの前記時間ステップtの実測値における異常の大きさを評価した評価値に相当する異常度を算出する処理と、
    を実行させ、
    前記分布パラメータを取得する処理は、
    多層のニューラルネットワークを用いて構成されているとともに、前記時間ステップtに隣接する複数の時間ステップに対応する過去の複数の実測値を入力データとして用いて処理を行うことにより出力データを取得する処理と、
    前記mの値が2以上である場合に、取得された前記出力データを分割する処理を行うことにより、m次元の平均ベクトルと、m次の正方行列に相当するm次の中間行列と、を基本パラメータとして取得する処理と、
    前記mの値が2以上である場合に、取得された前記基本パラメータを前記連続確率分布の定義域に収めるための処理を行うことにより、前記m次元の平均ベクトルと、前記m次の中間行列を多変量ガウス分布の定義域に収めるための処理により得られたm次の分散共分散行列と、を前記分布パラメータとして取得する処理と、
    を実行させるためのプログラム。
JP2018181533A 2018-09-27 2018-09-27 異常検知装置、異常検知方法及びプログラム Active JP7086803B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018181533A JP7086803B2 (ja) 2018-09-27 2018-09-27 異常検知装置、異常検知方法及びプログラム
US16/582,338 US11520672B2 (en) 2018-09-27 2019-09-25 Anomaly detection device, anomaly detection method and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018181533A JP7086803B2 (ja) 2018-09-27 2018-09-27 異常検知装置、異常検知方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2020052740A JP2020052740A (ja) 2020-04-02
JP7086803B2 true JP7086803B2 (ja) 2022-06-20

Family

ID=69945926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018181533A Active JP7086803B2 (ja) 2018-09-27 2018-09-27 異常検知装置、異常検知方法及びプログラム

Country Status (2)

Country Link
US (1) US11520672B2 (ja)
JP (1) JP7086803B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7086803B2 (ja) * 2018-09-27 2022-06-20 株式会社東芝 異常検知装置、異常検知方法及びプログラム
EP3893066A1 (de) * 2020-04-09 2021-10-13 Siemens Aktiengesellschaft Verfahren und vorrichtung zum betrieb einer maschine mit einem werkzeug
CN113537519A (zh) * 2020-04-10 2021-10-22 北京京东乾石科技有限公司 一种识别异常设备的方法和装置
CN111880998B (zh) * 2020-07-30 2022-09-02 平安科技(深圳)有限公司 服务系统异常检测方法、装置、计算机设备和存储介质
JP7318612B2 (ja) * 2020-08-27 2023-08-01 横河電機株式会社 監視装置、監視方法、および監視プログラム
CN112418529B (zh) * 2020-11-24 2024-02-27 江苏巨数智能科技有限公司 基于lstm神经网络的户外广告在线倒塌预测方法
CN113255775B (zh) * 2021-05-28 2021-09-24 神威超算(北京)科技有限公司 一种电力系统异常数据的识别方法、装置和智能芯片
US20230244946A1 (en) * 2022-01-28 2023-08-03 International Business Machines Corporation Unsupervised anomaly detection of industrial dynamic systems with contrastive latent density learning

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016201088A (ja) 2015-04-10 2016-12-01 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 異常検出システムおよび方法
JP2017194341A (ja) 2016-04-20 2017-10-26 株式会社Ihi 異常診断方法、異常診断装置、及び異常診断プログラム
JP2018049355A (ja) 2016-09-20 2018-03-29 株式会社東芝 異常検知装置、学習装置、異常検知方法、学習方法、異常検知プログラム、および学習プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219623A (ja) 1994-02-02 1995-08-18 Yaskawa Electric Corp 計測器の異常検知装置
US10277693B2 (en) * 2015-06-04 2019-04-30 Twitter, Inc. Trend detection in a messaging platform
US10706554B2 (en) * 2017-04-14 2020-07-07 Adobe Inc. Three-dimensional segmentation of digital models utilizing soft classification geometric tuning
JP7086803B2 (ja) * 2018-09-27 2022-06-20 株式会社東芝 異常検知装置、異常検知方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016201088A (ja) 2015-04-10 2016-12-01 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited 異常検出システムおよび方法
JP2017194341A (ja) 2016-04-20 2017-10-26 株式会社Ihi 異常診断方法、異常診断装置、及び異常診断プログラム
JP2018049355A (ja) 2016-09-20 2018-03-29 株式会社東芝 異常検知装置、学習装置、異常検知方法、学習方法、異常検知プログラム、および学習プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
井手 剛,入門 機械学習による異常検知 -Rによる実践ガイド-,第3版,株式会社コロナ社 CORONA PUBLISHING CO.,LTD. 牛来 真也,2016年01月10日,19頁

Also Published As

Publication number Publication date
JP2020052740A (ja) 2020-04-02
US11520672B2 (en) 2022-12-06
US20200104224A1 (en) 2020-04-02

Similar Documents

Publication Publication Date Title
JP7086803B2 (ja) 異常検知装置、異常検知方法及びプログラム
CN102985211B (zh) 用于检查焊接点的质量的方法
US20210342244A1 (en) Distributed architecture for fault monitoring
Mao et al. A model for quantifying uncertainty in the estimation of noise-contaminated measurements of transmissibility
US10565080B2 (en) Discriminative hidden kalman filters for classification of streaming sensor data in condition monitoring
US9910966B2 (en) System and method of increasing sample throughput
Monteil et al. Calibration, estimation, and sampling issues of car-following parameters
CN111611294B (zh) 星敏感器数据异常检测方法
CN103646114B (zh) 硬盘smart数据中特征数据提取方法和装置
JP2022002111A (ja) 製造条件出力装置、品質管理システム及びプログラム
WO2017022234A1 (ja) 製造プロセス分析装置、製造プロセス分析方法、及び、製造プロセス分析プログラムが格納された記録媒体
KR102221067B1 (ko) 네트워크 엔트로피에 기초하는 생체의 상태 천이의 예조의 검출을 지원하는 검출 장치, 검출 방법 및 검출 프로그램
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
Neves et al. The influence of frequency content on the performance of artificial neural network–based damage detection systems tested on numerical and experimental bridge data
Luleci et al. Generative adversarial networks for labelled vibration data generation
JP2020140252A (ja) 運営評価装置、運営評価方法、およびプログラム
CN116881783B (zh) 道路损伤检测方法、装置、计算机设备、存储介质
Dederichs et al. Comparison of automated operational modal analysis algorithms for long-span bridge applications
JP6904331B2 (ja) 要因分析装置、要因分析方法、およびプログラム
US11775512B2 (en) Data analysis apparatus, method and system
Luca et al. Anomaly detection using the Poisson process limit for extremes
Jia et al. Development of multivariate failure threshold with quantifiable operation risks in machine prognostics
JP6951202B2 (ja) データ分類装置
Christensen et al. Parameter study of statistics of modal parameter estimates using automated operational modal analysis
Li et al. Methodology on establishing multivariate failure thresholds for improved remaining useful life prediction in PHM

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20191004

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200925

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220608

R150 Certificate of patent or registration of utility model

Ref document number: 7086803

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150