JP2022066957A - 異常検知方法、異常検知装置、及びプログラム - Google Patents
異常検知方法、異常検知装置、及びプログラム Download PDFInfo
- Publication number
- JP2022066957A JP2022066957A JP2020175584A JP2020175584A JP2022066957A JP 2022066957 A JP2022066957 A JP 2022066957A JP 2020175584 A JP2020175584 A JP 2020175584A JP 2020175584 A JP2020175584 A JP 2020175584A JP 2022066957 A JP2022066957 A JP 2022066957A
- Authority
- JP
- Japan
- Prior art keywords
- data
- feature amount
- input data
- group
- encoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【課題】未学習のデータでも適応可能な異常検知を行う。【解決手段】異常検知方法は、コンピュータが、符号化器を用いて、符号化器への入力データが属するグループの特徴量と、入力データの固有の特徴量とを抽出することと、グループの特徴量、及び固有の特徴量から、復号化器を用いて入力データの再構成データを生成することと、入力データと再構成データとの誤差が閾値以上である場合に異常を検知することとを含む。【選択図】図2
Description
特許法第30条第2項適用申請有り 掲載年月日 令和2年10月19日 掲載アドレス https://www.ieice.org/ken/program/index.php?tgs_regid=fcaa63fc93919d63c192941825025f97dfeb046f102fa4fa2c046abe6dc556ce&tgid=IEICE-IBISML
本発明は、異常検知方法、異常検知装置、及びプログラムに関する。
従来、オートエンコーダ(Autoencoder:AE、自己符号化器)を用いた異常検知方法
が知られている(例えば、特許文献1~6)。
が知られている(例えば、特許文献1~6)。
AEを用いた異常検知方法では、正常データが大量に利用可能である場合には、未知の異常を発見する上で比較的良い性能を示す。しかし、例えば画像による工場での不良品発見への応用では、環境条件や周辺機器の変更などで取得されるデータが影響を受ける場合や、製品自体に変化があった場合など、性能が低下し、再学習の必要が生じる場合がある。また、再学習においても十分な量の訓練データが得られず、性能が出ないことも考えられる。
本発明は、未学習のデータについても適応可能な異常検知方法、異常検知装置、及びプログラムを提供することを目的とする。
本発明の発明者らが鋭意検討した結果、到達した本発明は以下の通りである。
[1]コンピュータが、符号化器を用いて、前記符号化器への入力データが属するグループの特徴量と、前記入力データの固有の特徴量とを抽出することと、前記グループの特徴量、及び前記固有の特徴量から、復号化器を用いて前記入力データの再構成データを生成することと、前記入力データと前記再構成データとの誤差が閾値以上である場合に異常を検知することとを実行する異常検知方法。
[1]コンピュータが、符号化器を用いて、前記符号化器への入力データが属するグループの特徴量と、前記入力データの固有の特徴量とを抽出することと、前記グループの特徴量、及び前記固有の特徴量から、復号化器を用いて前記入力データの再構成データを生成することと、前記入力データと前記再構成データとの誤差が閾値以上である場合に異常を検知することとを実行する異常検知方法。
[2]前記符号化器及び前記復号化器を用いて複数のデータから共通の特徴を抽出して、前記再構成データを生成する[1]に記載の異常検知方法。
[3]複数のデータを含むグループに関して、前記複数のデータの夫々の固有の特徴量である第1の特徴量と、前記グループの特徴量である第2の特徴量とを取得することと、前記第1の特徴量が従う確率分布と、前記第2の特徴量が従う確率分布との夫々から前記複数のデータについての前記第1の特徴量及び前記第2の特徴量のサンプリングを行うことと、前記サンプリングによって得られた前記第1の特徴量及び前記第2の特徴量から前記復号化器を用いて前記複数のデータの再構成データを生成することと、前記第1の特徴量、前記第2の特徴量、及び前記複数のデータと前記複数のデータの再構成データとの誤差で定まる損失関数を算出することと、誤差逆伝播法により前記損失関数を小さくする前記
符号化器及び前記復号化器のパラメータ修正を行うこととを含む学習をさらに行う[1]又は[2]に記載の異常検知方法。
符号化器及び前記復号化器のパラメータ修正を行うこととを含む学習をさらに行う[1]又は[2]に記載の異常検知方法。
[4]符号化器を用いて、前記符号化器への入力データが属するグループの特徴量と、前記入力データの固有の特徴量とを抽出することと、前記グループの特徴量、及び前記固有の特徴量から、復号化器を用いて前記入力データの再構成データを生成することと、前記入力データと前記再構成データとの誤差が閾値以上である場合に異常を検知することと、を実行する制御装置を備える異常検知装置。
[5]符号化器を用いて、前記符号化器への入力データが属するグループの特徴量と、前記入力データの固有の特徴量とを抽出することと、前記グループの特徴量、及び前記固有の特徴量から、復号化器を用いて前記入力データの再構成データを生成することと、前記入力データと前記再構成データとの誤差が閾値以上である場合に異常を検知することとをコンピュータに実行させるプログラム。
本発明によれば、未学習のデータについても適応可能となる。
以下、図面を参照して、本発明の実施形態に係る異常検知方法、異常検知装置及びプログラムを詳細に説明する。以下に記載する説明は、本発明の実施例であり、本発明はその要旨を超えない限り、これらの内容に限定されない。
図1は、異常検知装置として動作可能な情報処理装置(コンピュータ)10の構成例を示す。情報処理装置10には、例えば、パーソナルコンピュータ(PC)、ワークステーション(WS)、メインフレームなどの汎用又は専用のコンピュータを適用することができる。但し、情報処理装置10は、PC及びWSに制限されず、異常検知装置としての動作が可能である限り、スマートフォンなどのスマートデバイスも含まれる。
図1において、情報処理装置10は、バス6を介して相互に接続された、処理装置又は制御装置(コントローラ)としてのプロセッサ1と、記憶装置2と、通信回路3と、入力装置4と、ディスプレイ5(表示装置)とを含む。
記憶装置2は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク、SSD(Solid State Drive)、フラッシュメモリ、EEPROM
(Electrically Erasable Programmable Read-Only Memory)などである。記憶装置2は
、プログラム及びデータの記憶領域、プログラムの展開領域、プロセッサ1の作業領域、及び通信データのバッファ領域などとして使用される。通信回路3は、例えばLANカードであり、通信処理を司る。通信回路3は、無線通信処理を司る無線通信回路を含んでいてもよい。
(Electrically Erasable Programmable Read-Only Memory)などである。記憶装置2は
、プログラム及びデータの記憶領域、プログラムの展開領域、プロセッサ1の作業領域、及び通信データのバッファ領域などとして使用される。通信回路3は、例えばLANカードであり、通信処理を司る。通信回路3は、無線通信処理を司る無線通信回路を含んでいてもよい。
入力装置4は、例えば、キー、ボタン、ポインティングデバイス、及びタッチパネル等であり、情報の入力に使用される。ディスプレイ5は例えば液晶ディスプレイなどであり、情報及びデータを表示する。プロセッサ1は、例えばCPU(Central Processing Unit)などである。プロセッサ1は、記憶装置2に記憶された各種のプログラムを実行する
ことによって、情報処理装置10が異常検知装置として動作するための様々な処理を行う。プロセッサ1による処理は、集積回路(IC、LSI、ASIC、FPGAなど)やプロセッサと回路の組み合わせ(SoC、MCU、システムLSIなど)によって行われてもよい。
ことによって、情報処理装置10が異常検知装置として動作するための様々な処理を行う。プロセッサ1による処理は、集積回路(IC、LSI、ASIC、FPGAなど)やプロセッサと回路の組み合わせ(SoC、MCU、システムLSIなど)によって行われてもよい。
プロセッサ1は、プログラムの実行によって、情報処理装置10を、図2に示すような、マルチレベル変分オートエンコーダ(Multi-Level Variational Autoencoder:MLV
AE)11として動作させる処理を行う。図2及び図3は、MLVAE11の説明図であり、図4AはAEの説明図であり、図4Bは変分オートエンコーダ(Variational Autoencoder:VAE)の説明図である。実施形態では、入力データとして画像データを用いる
。但し、データは画像以外(例えば数値)であってもよい。本実施形態では、本発明に係る異常検知装置の実施例の一つとしてMLVAEを説明するが、本発明に係る異常検知装置は、MLVAE以外にneural statistician等を含む。
AE)11として動作させる処理を行う。図2及び図3は、MLVAE11の説明図であり、図4AはAEの説明図であり、図4Bは変分オートエンコーダ(Variational Autoencoder:VAE)の説明図である。実施形態では、入力データとして画像データを用いる
。但し、データは画像以外(例えば数値)であってもよい。本実施形態では、本発明に係る異常検知装置の実施例の一つとしてMLVAEを説明するが、本発明に係る異常検知装置は、MLVAE以外にneural statistician等を含む。
図4Aに示すように、AEは、符号化器と復号化器とを含み、符号化器と復号化器との間の中間層において、入力データは、符号化器によって低次元の潜在変数に写像され、復号化器によって潜在変数から元の入力データを再生するように再構成データが写像される。入力データと再構成データとの誤差(再構成誤差)が閾値以上の場合に、異常が検知される。学習は、入力データと再構成データとの再構成誤差、例えば二乗誤差が最小となるように符号化器及び復号化器のパラメータが修正される。
図4Bに示すように、VAEも、符号化器及び復号化器を備え、入力データと再構成データとの誤差(再構成誤差)が閾値以上の場合に、異常が検知される。一方、VAEでは、潜在変数に確率分布(例えば、正規分布)を想定し、符号化器は、圧縮表現が想定される、確率分布のパラメータ(平均μ、分散σ2)を出力する。VAEでは、学習モードにおいて、圧縮表現が従うべき確率分布との距離と再構成誤差との和(図4B参照)が小さくなるように、符号化器及び復号化器のパラメータが修正される。
図2において、MLVAE11は、符号化器12(第1のニューラルネットワーク)と復号化器13(第2のニューラルネットワーク)とを含む。MLVAE11は、符号化器12の出力として得られる潜在変数、符号化器12への入力データが属するグループの共通の特徴量CGと、入力データ固有の特徴量Siとを得て、特徴量CG及び特徴量Siから復号化器13を用いて入力データの再構成を行い、再構成データを得る。入力データと再構成データとの差が閾値以上の場合に異常が検知(異常と判定)される。
符号化器12及び復号化器13の夫々をなすニューラルネットワークの各層は全結合層や畳み込み層などにより構成される。MLVAE11の学習モードでは、図3に示すように、入力を再現できている程度を示す再構成誤差と、潜在変数のグループの特徴量CGと、グループの特徴が想定される確率分布との差異と、固有の特徴Siが想定される確率分布との差異(例えば、KLダイバージェンス)を小さくするように学習する。すなわち、“1/|g|ΣG∈g-L(G)”の最大化を図る(gをグループとする)。
グループは、例えば、製品ごと、或いは工場の外観検査であれば、工場にある建物ごとに存在する複数のデータ(例えば複数の画像)を一つのグループとする、等となる。但し、グループの定義、グループの数、グループを構成する要素の数は適宜設定可能である。
MLVAE11を用いれば、同じグループに属する数個のデータ(例えば画像)から、グループの共通の特徴量を得ることができる。このため、未学習のグループのデータに対しても、数個のデータがあれば、数個のデータを符号化器12に入力することで、グループの特徴量CGが得られる。その後、数個のデータの夫々を符号化器12に入力して、データ固有の特徴量Siを得ることができる。そして、グループの特徴量CGと、データの夫々のデータ固有の特徴量Siとから、復号化器13を用いて入力データを復元(再構成)することが可能となる。グループの例示として挙げた製品や建物の差は、グループの共通の特徴として表される。よって、MLVAE11によれば、AE及びVAEに比べて未学習のグループのデータに対しても誤検出を減らすことができる。
図5は、MLVAE11の学習モードにおける、プロセッサ1の処理例を示すフローチャートである。学習モードにおいて、ニューラルネットワーク(符号化器12及び復号化器13)のパラメータ修正は繰り返し実施する必要がある。このため、あらかじめ繰り返し回数の規定値Neを設定しておき、ステップS1で、プロセッサ1はneの値を0に設定し、ステップS2で、プロセッサ1は現在のneの値をインクリメントする。
ステップS11において、プロセッサ1は、複数のグループから、夫々複数のデータ(いずれも正常値)から構成されるミニバッチ(データの集合)を取得する。すなわち、プロセッサ1は、記憶装置2或いは通信回路3を介してネットワークから、或るグループに属する複数のデータを取得する。
ステップS12では、プロセッサ1は、符号化器12を用いて、ステップS11で取得した複数のデータの夫々の固有の特徴量Si(第1の特徴量)を得る。ステップS13では、プロセッサ1は、符号化器12を用いて複数のデータの夫々から得られた特徴量Ciを統合し、複数のデータが属するグループに共通の特徴量CG(第2の特徴量)を得る。
ステップS14では、プロセッサ1は、グループの特徴量CGの従う確率分布とデータ固有の特徴量Siが従う確率分布との夫々からデータをサンプリングする。ステップS15では、プロセッサ1は、サンプリングされたデータ(対象データ)を入力データとし、対象データから復号化器13を用いて入力データを再構成する。
ステップS16では、プロセッサ1は、データ固有の特徴量Si、グループ特徴量CG、入力データと再構成データとの再構成誤差で定まる損失関数(図3のL(G))を算出する。ステップS17では、プロセッサ1は、誤差逆伝播法(バックプロパゲーション)により損失関数を小さくするよう符号化器12及び復号化器13のパラメータ修正(各パラメータの重みの更新)を行う。
ステップS3では、プロセッサ1は、繰り返し回数カウンタneの値が繰り返し回数規定値Ne以上かどうかの判定を行う。neが繰り返し回数以下の場合は、neの値に1を加算し(ステップS2)、再度ステップS11~S17の処理を繰り返す。その後、neの値が規定値Neを超えたところで処理を終了する。
図6は、MLVAE11の異常検知モード(識別モード)におけるプロセッサ1の処理例を示すフローチャートである。ステップS21では、プロセッサ1は、識別対象と同一のグループに属する複数個のデータを記憶装置2又はネットワークなどから取得する。ステップS22では、プロセッサ1は、ステップS21で取得したデータから符号化器12を用いてそのグループの特徴量CGを算出する。
ステップS23では、プロセッサ1は、識別対象データとなるデータ(入力データ)を、記憶装置2又はネットワークなどから取得する。ステップS24では、プロセッサ1は
、ステップS23で取得した識別対象データから符号化器12によりグループの特徴量CGとデータ固有の特徴量Siとを抽出する。
、ステップS23で取得した識別対象データから符号化器12によりグループの特徴量CGとデータ固有の特徴量Siとを抽出する。
ステップS25では、プロセッサ1は、ステップS24で抽出したデータ固有の特徴量Siと、ステップS22で用意したグループの特徴量CGから、復号化器13でデータを再構成する(再構成データを生成する)。
ステップS26では、プロセッサ1は、ステップS25の再構成データと識別対象データの差異(再構成誤差)を評価(算出)する。ステップS27では、プロセッサ1は、ステップS26で算出された誤差と閾値(予め用意)とを比較し、異常の有無の判定を実施する。このとき、誤差が閾値以上であれば、異常と判定する。ステップS28では、プロセッサ1は、ステップS27で得られた判定結果を出力する(例えば、ディスプレイ5に表示する、或いはネットワークに送信する)。
異常検知装置として動作する情報処理装置10によれば、学習済みの符号化器12を用いて、同一のグループに属する数個のデータから、そのグループの確率分布(潜在変数)を得る。例えば、数個のデータから得られる確率分布の積をそのグループの特徴とした場合は、以下の式で示すことができる。
入力データから符号化器12によって得られたデータ固有の潜在変数と上記によって得たグループの特徴を示す潜在変数から復号化器13を用いてデータを再構成する。そして、再構成によって得られた再構成データと入力データとの差(再構成誤差)を異常度とすることができる。再構成誤差は、確率分布として正規分布を想定する場合は、以下の式で表すことができる。
異常度が閾値以上、又は超過する場合に、異常と判定する(異常を検知する)ことができる。このように、異常検知装置11によれば、未知のデータ(学習に用いていない未知のグループのデータ)に対して、ロバスト性を高めることができる。すなわち、再学習が不要となる。
図7には、実施例として、工場の屋根の画像からの劣化(錆を異常とする)の検出(画素単位での異常判定)を行った例を示す。異常検知装置のモデルとして、AEと、VAE
と、MLVAEとを用意した。また、真陽性率(True Positive Ratio)がx(x=95
,90,50)のときの評価指標IoU(Intersection(領域の共通部分) over Union(領域の和集合))を求めた(IoU@TPRxとして表記)。図7には学習時とは異なる屋
根に対する結果を示す表が示されている。建屋ごとに屋根のパターンは異なるので、MLVAEに関して、TPRが95,90及び50のいずれにおいても、AE及びVAEよりよい評価値(IoU@TPRx)が得られた。以上説明した構成は発明の趣旨を逸脱しない範囲で適宜変更可能である。
と、MLVAEとを用意した。また、真陽性率(True Positive Ratio)がx(x=95
,90,50)のときの評価指標IoU(Intersection(領域の共通部分) over Union(領域の和集合))を求めた(IoU@TPRxとして表記)。図7には学習時とは異なる屋
根に対する結果を示す表が示されている。建屋ごとに屋根のパターンは異なるので、MLVAEに関して、TPRが95,90及び50のいずれにおいても、AE及びVAEよりよい評価値(IoU@TPRx)が得られた。以上説明した構成は発明の趣旨を逸脱しない範囲で適宜変更可能である。
1・・・プロセッサ
2・・・記憶装置
10・・・情報処理装置
11・・・MLVAE
12・・・符号化器
13・・・復号化器
2・・・記憶装置
10・・・情報処理装置
11・・・MLVAE
12・・・符号化器
13・・・復号化器
Claims (5)
- コンピュータが、
符号化器を用いて、前記符号化器への入力データが属するグループの特徴量と、前記入力データの固有の特徴量とを抽出することと、
前記グループの特徴量、及び前記固有の特徴量から、復号化器を用いて前記入力データの再構成データを生成することと、
前記入力データと前記再構成データとの誤差が閾値以上である場合に異常を検知することと、
を実行する異常検知方法。 - 前記符号化器及び前記復号化器を用いて複数のデータから共通の特徴を抽出して、前記再構成データを生成する
請求項1に記載の異常検知方法。 - 複数のデータを含むグループに関して、前記複数のデータの夫々の固有の特徴量である第1の特徴量と、前記グループの特徴量である第2の特徴量とを取得することと、前記第1の特徴量が従う確率分布と、前記第2の特徴量が従う確率分布との夫々から前記複数のデータについての前記第1の特徴量及び前記第2の特徴量のサンプリングを行うことと、前記サンプリングによって得られた前記第1の特徴量及び前記第2の特徴量から前記復号化器を用いて前記複数のデータの再構成データを生成することと、前記第1の特徴量、前記第2の特徴量、及び前記複数のデータと前記複数のデータの再構成データとの誤差で定まる損失関数を算出することと、誤差逆伝播法により前記損失関数を小さくする前記符号化器及び前記復号化器のパラメータ修正を行うこととを含む学習をさらに行う
請求項1又は2に記載の異常検知方法。 - 符号化器を用いて、前記符号化器への入力データが属するグループの特徴量と、前記入力データの固有の特徴量とを抽出することと、前記グループの特徴量、及び前記固有の特徴量から、復号化器を用いて前記入力データの再構成データを生成することと、前記入力データと前記再構成データとの誤差が閾値以上である場合に異常を検知することと、を実行する制御装置
を備える異常検知装置。 - 符号化器を用いて、前記符号化器への入力データが属するグループの特徴量と、前記入力データの固有の特徴量とを抽出することと、
前記グループの特徴量、及び前記固有の特徴量から、復号化器を用いて前記入力データの再構成データを生成することと、
前記入力データと前記再構成データとの誤差が閾値以上である場合に異常を検知することと、
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020175584A JP2022066957A (ja) | 2020-10-19 | 2020-10-19 | 異常検知方法、異常検知装置、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020175584A JP2022066957A (ja) | 2020-10-19 | 2020-10-19 | 異常検知方法、異常検知装置、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022066957A true JP2022066957A (ja) | 2022-05-02 |
Family
ID=81389818
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020175584A Pending JP2022066957A (ja) | 2020-10-19 | 2020-10-19 | 異常検知方法、異常検知装置、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022066957A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116662811A (zh) * | 2023-06-13 | 2023-08-29 | 无锡物联网创新中心有限公司 | 一种工业设备的时序状态数据重构方法及相关装置 |
-
2020
- 2020-10-19 JP JP2020175584A patent/JP2022066957A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116662811A (zh) * | 2023-06-13 | 2023-08-29 | 无锡物联网创新中心有限公司 | 一种工业设备的时序状态数据重构方法及相关装置 |
CN116662811B (zh) * | 2023-06-13 | 2024-02-06 | 无锡物联网创新中心有限公司 | 一种工业设备的时序状态数据重构方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10579938B2 (en) | Real time autonomous archetype outlier analytics | |
CN112036426B (zh) | 利用高维传感器数据的多数表决进行无监督异常检测和责任的方法和系统 | |
WO2019005186A1 (en) | NEURONAL NETWORKS OF TOPOLOGY-SENSITIVE GRAPHICS | |
US20180268533A1 (en) | Digital Image Defect Identification and Correction | |
CN108229673B (zh) | 卷积神经网络的处理方法、装置和电子设备 | |
CN111178548B (zh) | 集成学习预测方法与系统 | |
CN106920245B (zh) | 一种边界检测的方法及装置 | |
CN111401472B (zh) | 基于深度卷积神经网络的红外目标分类方法和装置 | |
US20140156569A1 (en) | Method and apparatus for improving resilience in customized program learning network computational environments | |
KR102434703B1 (ko) | 생체 이미지 처리 방법 및 이를 포함한 장치 | |
Peng et al. | Partial least squares and random sample consensus in outlier detection | |
CN116994044A (zh) | 一种基于掩码多模态生成对抗网络的图像异常检测模型的构建方法 | |
JP2022066957A (ja) | 異常検知方法、異常検知装置、及びプログラム | |
CN114781532A (zh) | 机器学习模型的评估方法、装置、计算机设备及介质 | |
Adhikari et al. | Imputation using information fusion technique for sensor generated incomplete data with high missing gap | |
JP2019003274A (ja) | 検知システム、検知方法及び検知プログラム | |
WO2022024211A1 (ja) | 学習活用システム、活用装置、学習装置、プログラム及び学習活用方法 | |
US11688175B2 (en) | Methods and systems for the automated quality assurance of annotated images | |
KR20190109194A (ko) | 불확정성을 모델링할 수 있는 뉴럴네트워크 학습 장치 및 방법 | |
CN115329938A (zh) | 一种基于鉴别器森林提高生成对抗网络泛化能力的方法 | |
CN115100068A (zh) | 一种红外图像校正方法 | |
JP7331938B2 (ja) | 学習装置、推定装置、学習方法及び学習プログラム | |
CN109583512B (zh) | 图像处理方法、装置及系统 | |
CN113283388A (zh) | 活体人脸检测模型的训练方法、装置、设备及存储介质 | |
US20210073685A1 (en) | Systems and methods involving detection of compromised devices through comparison of machine learning models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20201117 |