JP2020013449A - 異常検知装置、異常検知方法、およびプログラム - Google Patents

異常検知装置、異常検知方法、およびプログラム Download PDF

Info

Publication number
JP2020013449A
JP2020013449A JP2018136642A JP2018136642A JP2020013449A JP 2020013449 A JP2020013449 A JP 2020013449A JP 2018136642 A JP2018136642 A JP 2018136642A JP 2018136642 A JP2018136642 A JP 2018136642A JP 2020013449 A JP2020013449 A JP 2020013449A
Authority
JP
Japan
Prior art keywords
distribution
encoder
abnormal
data
normal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018136642A
Other languages
English (en)
Other versions
JP6930503B2 (ja
Inventor
祐太 河内
Yuta Kawachi
祐太 河内
悠馬 小泉
Yuma Koizumi
悠馬 小泉
登 原田
Noboru Harada
登 原田
村田 伸
Shin Murata
伸 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018136642A priority Critical patent/JP6930503B2/ja
Priority to PCT/JP2019/026027 priority patent/WO2020017285A1/ja
Priority to US17/260,956 priority patent/US20210326728A1/en
Publication of JP2020013449A publication Critical patent/JP2020013449A/ja
Application granted granted Critical
Publication of JP6930503B2 publication Critical patent/JP6930503B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

【課題】異常サンプルのエンコード結果の取り得る領域を限定し、オーバーフロー等の計算機的不都合が発生しにくくなる異常検知装置、異常検知方法およびプログラムを提供する。【解決手段】異常検知装置において、エンコーダ記憶部14は、潜在空間を閉じた多様体とし、正常データを学習した正常分布と異常データを学習した異常分布とを多様体上にもち、入力された特徴量を潜在空間に射影するエンコーダと、エンコーダの出力を再構成するデコーダとを記憶する。エンコード部15は、対象データの特徴量をエンコーダへ入力したときにデコーダが出力する再構成結果を得る。異常度算出部16は、再構成結果と正常分布および異常分布との距離に基づいて対象データの異常度を算出する。【選択図】図4

Description

この発明は、機械等の動作音から、故障等の異常な状態を判別する異常検知技術に関する。
機械等の故障を故障前に予見、または故障後に素早く発見することは、業務の継続性の観点で重要である。これを省力化するための方法として、センサ等を用いて電気回路やプログラム等により、正常状態からの乖離である「異常」を発見する異常検知という分野が存在する。特に、マイクロフォン等の音を電気に変換するセンサを用いるものを異常音検知と呼ぶ。
従来の代表的な異常音検知は、故障等の発生していない通常の状態であると考えられる音波形等のデータ(以下、「正常データ」と呼ぶ)を収集し、回帰モデル等を用いて正常データが従う分布を導出し、正常か異常かが未知であるサンプルに対する生成確率の小ささや回帰誤差の大きさを異常の度合いとして、異常を判定する技術である。例として、変分オートエンコーダ(非特許文献1参照)の再構成確率や再構成誤差を用いたもの(非特許文献2参照)がある。
異常音検知システムを実運用すると、正常データ以外に、故障時等の異常な状態に対応するごく少量の音波形等のデータ(以下、「異常データ」と呼ぶ)が収集できることがある。しかしながら、データ量が正常と異常との間で著しく偏っているため、単純に判別問題として異常データを学習に用いることは難しい。これを解決する技術として、両方のデータを用いて多様体学習を行う技術(非特許文献3参照)等がある。
KingmaP Diederik and Max Welling, "Auto-encoding variational bayes," arXiv preprint arXiv:1312.6114, 2013. An Jinwon and Sungzoon Cho, "Variational Autoencoder based Anomaly Detection using Reconstruction Probability," Technical Report, 2015. Bo Du and Liangpei Zhang, "A discriminative metric learning based anomaly detection method," IEEE Transactions on Geoscience and Remote Sensing, vol. 52, no. 11, pp. 6844-6857, 2014.
一般に音響信号処理では、1次元の波形をそのまま入力特徴として扱うのではなく、離散フーリエ変換をベースとした、メル周波数ケプストラム係数(MFCC: Mel-Frequency Cepstrum Coefficients)等の高次元音響特徴を用いることが多い。元々の音響特徴量等の特徴量空間自体ではなく、それを何らかの射影関数でうつした先で異常検知を行うことにより、「次元の呪い」と呼ばれる高次元に起因する様々な不都合を回避することができる。低次元化する場合には計算量削減効果も期待できる。したがって、特徴量を低次元潜在空間に射影するエンコーダを持つ変分オートエンコーダを用いて、正常な特徴を中心付近に集め、異常な特徴を遠ざけるように学習することによって、未知サンプルに対する特徴量をエンコードした結果の中心への近さ等の尺度で、不都合を回避しつつ異常を検出することができると考えられる。しかしながら、変分オートエンコーダにおける潜在空間は正負無限大を取り得るユークリッド空間であり、正常の代表点を原点等とした場合、正常から最も遠い点は無限遠点になるため、異常を無限遠点に近づけるほど検出性能が向上することになり、計算機上での処理にオーバーフロー等の不都合が生じる。
この発明の目的は、上記のような技術的課題に鑑みて、変分オートエンコーダを用いた異常検知において、異常サンプルのエンコード結果の取り得る領域を限定し、オーバーフロー等の計算機的不都合を回避することである。
上記の課題を解決するために、この発明の一態様の異常検知装置は、潜在空間を閉じた多様体とし、正常データを学習した正常分布と異常データを学習した異常分布とを多様体上にもち、入力された特徴量を潜在空間に射影するエンコーダと、エンコーダの出力を再構成するデコーダとを記憶するエンコーダ記憶部と、対象データの特徴量をエンコーダへ入力したときにデコーダが出力する再構成結果を得るエンコード部と、再構成結果と正常分布および異常分布との距離に基づいて対象データの異常度を算出する異常度算出部と、を含む。
この発明によれば、異常サンプルのエンコード結果の取り得る領域が限定され、オーバーフロー等の計算機的不都合が発生しにくくなる。
図1は変分オートエンコーダの学習処理を説明するための図である。 図2は変分オートエンコーダのエンコード結果を可視化した概念図である。 図3は変分オートエンコーダの簡易実装を説明するための図である。 図4は異常検知装置の機能構成を例示する図である。 図5は異常検知方法の処理手続きを例示する図である。
以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
この発明では、変分オートエンコーダ学習において、従来のユークリッド空間ではなく、閉じた多様体、例えば、超球上に射影することを考える。その多様体上の2点を正常・異常の代表点とし、それぞれへの近さ等の尺度を持って異常を判定する。正常・異常の代表点は、例えば、地球の北極や南極に相当する、互いに最も離れた二点を設定すればよい。超球面の潜在空間を採用するのは、球面上の潜在空間は有限であるため、ある程度学習を進めると潜在空間すべてをクラスタ先で埋め尽くすことができ、対象データを確実にいずれかにクラスタリングすることができるためである。また、訓練に用いたデータから大きく外れる、つまり未知なデータが出現した場合、潜在空間が既知パターンで埋め尽くされていることから、再構成パターンとの差異を用いて未知であることを知ることも可能である。
変分オートエンコーダではユークリッド空間上の多次元正規分布を潜在変数事前分布として用いる。超球上ではフォンミーゼス・フィッシャー分布がこれに相当する。以下にフォンミーゼス・フィッシャー分布を用いる場合の異常検知理論について説明する。
<学習基準の定義>
潜在空間を超球面とした場合、超球面上での扱いが簡単な、平面上における正規分布に相当するものとして、フォンミーゼス・フィッシャー分布が有名である。変分オートエンコーダの事前分布をフォンミーゼス・フィッシャー分布とした場合、事後分布と事前分布との間のKLダイバージェンスを求める必要がある。これを解析的に求めることは困難だが、上限値は既に求められているため(参考文献1参照)、これを代わりに用いればよい。
〔参考文献1〕Diethe, Tom, "A Note on the Kullback-Leibler Divergence for the von Mises-Fisher distribution," arXiv preprint arXiv:1502.07104, 2015.
<モデル構造>
フォンミーゼス・フィッシャー分布は、正規分布のように、他の確率分布に変換できる関係がないことが予想される(参考文献2参照)。したがって、素直にいわゆるreparametrization trickを用いて、多次元正規分布を用いた変分オートエンコーダと同様のモデル構造を取ることができない。そこで、それを回避する2つの構造を用いる。例えば学習の進み具合に応じて構造を切り替えることで、この問題を回避する。
〔参考文献2〕四辻哲章,“計算機シミュレーションのため確率分布乱数生成法”,p. 396,2013年
≪集中度パラメータを固定する方式(方式1)≫
エンコーダは、潜在空間での角度パラメータと集中度パラメータとを出力するものとする。この方式ではエンコーダの出力する集中度パラメータは無視する。角度の表現には、例えば正準オイラー角等を用いる。出力される変数がその範囲内に収まるように、クリッピング等を用いて、-180度から+180度や-90度から+90度の範囲に収まるようにしてもよい。出力された角度パラメータを用いて回転行列を構成する。この回転行列に対して、潜在変数事前分布である、所望の方向ベクトル(パラメータ)と適当な集中度パラメータとをもったフォンミーゼス・フィッシャー分布から生成した乱数を用いて得た値を乗じる。事前分布の方向パラメータは、正常か異常かを代表する点の持つ方向とし、集中度パラメータは任意の定数としてよい。それにより、事前分布で設定した方向ではなく、エンコーダの出力した方向を中心とする乱数が得られるため、それをデコーダに入力することによって変分オートエンコーダを構成する。上記の処理を、計算グラフを用いて構成することで、通常の変分オートエンコーダと同様に勾配を用いた学習を行うことができる。
≪集中度パラメータの分布を正規分布で近似する方式(方式2)≫
エンコーダは、方式1同様、潜在空間での角度パラメータと集中度パラメータとを出力するものとする。フォンミーゼス・フィッシャー分布は、集中度パラメータが大きい場合に正規分布と見なせると予想されるから(参考文献3参照)、正規乱数を用いて学習を行う方法が考えられる。まず、次元数が角度パラメータと同じ、平均がゼロベクトルであり、分散共分散行列が単位行列である多変量標準正規分布から乱数を生成する。この乱数と、エンコーダ出力の集中度パラメータをある規則に応じて変換した(集中度パラメータが正規分布の分散の逆数に対応するなどの関係性を用いて正規分布の標準偏差相当に変換するなどを指す)値とを乗じた値を、エンコーダ出力の角度パラメータと加算する。逆にエンコーダが出力するスカラー値を正規分布の対数分散等として扱ってもよく、その場合KLダイバージェンス項に渡す集中度パラメータに変換するにはその値の指数を取った後逆数を取るなどの変換をすればよい。この処理は、方式1と同様のクリッピングと併用してもよく、前後どちらでもよい。そのようにして得られたベクトルから回転行列を構成し、その回転行列に対して、全体で共通した任意の値を持つ固定ベクトル(長さは任意でよいが、簡単のため1とする)を乗じると単位超球面上のベクトルが得られる。その単位超球面上のベクトルをデコーダに入力することで変分オートエンコーダを構成できる。残りの詳細は方式1と同様である。以上の処理を図1に示す。
一つの事前分布で訓練した際の潜在空間への射影の概念を図2に示す。図2Aは、事前分布の方向パラメータを[0, 0, 1]として訓練したときの閉多様体オートエンコーダのエンコード結果の潜在空間を可視化した概念図である(左は訓練前、右は訓練後)。図2Bは、事前分布の方向パラメータを[1, 0, 0]として訓練したときの閉多様体オートエンコーダのエンコード結果の潜在空間を可視化した概念図である(左は訓練前、右は訓練後)。
≪方式2の簡易実装≫
方式2において、KLダイバージェンス値の計算を簡略化するため、以下のヒューリスティクスを導入してもよい。まず、エンコーダからは、潜在次元数(例えば3)の角度パラメータと、正規分布の対数分散に相当するようなスカラーパラメータを出力する。角度パラメータから回転行列を構成し、全体で共通した任意の値を持つ固定ベクトルと乗算し単位超球面上のベクトルを得ておく。単位超球面上のベクトルと、事前に与えた事前分布のもつ正常または異常を代表する単位超球面上のベクトル(事前分布方向ベクトル)の内積をとり、事前分布方向ベクトルとの類似度とする。この類似度に、事前に与えた事前分布のもつ事前分布集中度値(例えば1)を乗算する。最後に、エンコーダからのスカラーパラメータ(任意の定数倍してよい)の指数を取ったものからこの値を引き、この値を本来のKLダイバージェンスコストの代わりとして用いてもよい。具体的には図3のようになる。
≪2方式の組み合わせ方法≫
ニューラルネットワークパラメータが乱数か、それに近い学習初期は、潜在空間への射影先が多様体上に薄く広がるような分布になることがあり得るから、集中度パラメータを固定した方式である方式1が適していると想定される。ある程度訓練が進んでいれば、潜在空間内で正常・異常に対応するクラスタが構成されると考えられる。そのような状況、つまり射影結果の分布がある程度狭まっていると考えられる状況では集中度パラメータを大きいと見做して考え、方式2が適していると考えられる。したがって、乱数パラメータを持ったネットワークから学習を開始し、はじめは方式1を用いて学習し、ある程度学習が進んだところで、例えばあらかじめエポック数(学習データを1周する回数)などを決めておき、方式2に切り替える方法が適していると考えられる。
2つの方式を用いて学習する理由を以下にまとめる。従来の変分オートエンコーダは潜在変数事前分布として正規分布を用いる。しかしながら潜在変数事前分布を超球面とすると正規分布を扱うことができない。そのため、方式1により軸を固定し2次元空間として扱えるようにする。これにより正規分布を扱うことができるようになるため、その後方式2により学習を行うものとした。
<ジンバルロック現象の回避>
90度に近い出力がある場合に、「ジンバルロック」と呼ばれる不都合が発生することが知られている。これを回避するために、角度パラメータに対して、90度を避けるように、90度やそれに近い値に対して高い値を持つようなコスト関数を設定し、そのコストを損失関数に加算等で追加してもよい。
[実施形態]
実施形態の異常検知装置および方法は、正常データおよび異常データからなる学習データを用いて変分オートエンコーダを学習し、その変分オートエンコーダを用いて異常検知の対象とする入力データが正常か異常かを示す異常判定結果を出力する。実施形態の異常検知装置は、図4に例示するように、3個のAD変換部10−1〜10−3、正常データ記憶部11−1、異常データ記憶部11−2、3個の特徴抽出部12−1〜12−3、エンコーダ学習部13、エンコーダ記憶部14、エンコード部15、異常度算出部16、および異常判定部17を備える。さらに、エンコーダ学習部13は、事前分布設定部131、第一学習部132、および第二学習部133を備える。この異常検知装置が、図5に例示する各ステップの処理を行うことにより実施形態の異常検知方法が実現される。
異常検知装置は、例えば、中央演算処理装置(CPU: Central Processing Unit)、主記憶装置(RAM: Random Access Memory)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。異常検知装置は、例えば、中央演算処理装置の制御のもとで各処理を実行する。異常検知装置に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。異常検知装置の各処理部は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。異常検知装置が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。
以下、図5を参照して、実施形態の異常検知装置が実行する異常検知方法について説明する。
ステップS10−1において、AD変換部10−1は、異常検知の対象とする機械等の正常動作音等の音波形(以下、「正常音波形」と呼ぶ)を所定のサンプリング周波数でアナログデジタル変換し、量子化した波形データ(以下、「正常データ」と呼ぶ)を生成する。AD変換部10−1は、生成した正常データを正常データ記憶部11−1へ記憶する。
ステップS10−2において、AD変換部10−2は、異常検知の対象とする機械等の故障音等の音波形(以下、「異常音波形」と呼ぶ)を所定のサンプリング周波数でアナログデジタル変換し、量子化した波形データ(以下、「異常データ」と呼ぶ)を生成する。AD変換部10−2は、生成した異常データを異常データ記憶部11−2へ記憶する。
ステップS12−1において、特徴抽出部12−1は、正常データ記憶部11−1に記憶されている正常データから特徴量を抽出する。特徴量の抽出は、波形データをそのまま1次元の値が時系列に並んだデータとして扱ってもよいし、複数サンプルの連結、離散フーリエ変換、フィルタバンク処理等を用いて多次元に拡張する特徴抽出処理や、データの平均、分散を計算して値の取り幅を正規化する等を行ってもよい。特徴抽出部12−1は、抽出した正常データの特徴量をエンコーダ学習部13へ出力する。
ステップS12−2において、特徴抽出部12−2は、異常データ記憶部11−2に記憶されている異常データから特徴量を抽出する。特徴量の抽出は、特徴抽出部12−1と同様に行う。特徴抽出部12−2は、抽出した異常データの特徴量をエンコーダ学習部13へ出力する。
ステップS13において、エンコーダ学習部13は、事前分布設定部131、第一学習部132、および第二学習部133を順に実行し、正常データと異常データとを再構成するように単一の変分オートエンコーダを学習する。エンコーダ学習部13は、学習済みの変分オートエンコーダをエンコーダ記憶部14へ記憶する。
ステップS131において、エンコーダ学習部13の事前分布設定部131は、閉じた多様体上の相異なる2つの分布を、正常データの潜在変数事前分布と異常データの潜在変数事前分布として設定する。例えば、潜在空間を球状とすれば、フォンミーゼス・フィッシャー分布の中心を表現するパラメータを球面上でそれぞれ最も遠い点とし、集中度パラメータを所定の定数(例えば1)に設定すればよい。
ステップS132において、エンコーダ学習部13の第一学習部132は、特徴抽出部12−1が出力する正常データの特徴量と特徴抽出部12−2が出力する異常データの特徴量とからなる学習データを用いて、上述の集中度パラメータを固定する方式(方式1)による学習を行う。
ステップS133において、エンコーダ学習部13の第二学習部133は、特徴抽出部12−1が出力する正常データの特徴量と特徴抽出部12−2が出力する異常データの特徴量とからなる学習データを用いて、上述の集中度パラメータの分布を正規分布で近似する方式(方式2)による学習を行う。
ステップS132およびS133において、正常データと異常データとを交互に学習してもよいし、正常データと異常データとを1つのバッチ処理に含めて、正常データに対する事前分布と異常データに対する事前分布とを設定した時のそれぞれの損失の和を最小化するように学習してもよい。
ステップS10−3において、AD変換部10−3は、異常検知の対象とする機械等の動作音等の音波形(以下、「対象音波形」と呼ぶ)を所定のサンプリング周波数でアナログデジタル変換し、量子化した波形データ(以下、「対象データ」と呼ぶ)を生成する。AD変換部10−3は、生成した対象データを特徴抽出部12−3へ出力する。
ステップS12−3において、特徴抽出部12−3は、AD変換部10−3が出力する対象データから特徴量を抽出する。特徴量の抽出は、特徴抽出部12−1と同様に行う。特徴抽出部12−3は、抽出した対象データの特徴量をエンコード部15へ出力する。
ステップS15において、エンコード部15は、特徴抽出部12−3が出力する対象データの特徴量を、エンコーダ記憶部14に記憶されている学習済みの変分オートエンコーダへ入力し、少なくとも潜在変数ベクトルおよび再構成誤差を含む再構成結果を得る。エンコード部15は、得た再構成結果を異常度算出部16へ出力する。
ステップS16において、異常度算出部16は、エンコード部15が出力する再構成結果から対象データの異常度を算出する。異常度は、潜在空間上での正常データに対する事前分布や、異常データに対する事前分布への近さを用いて定義する。簡単には、それぞれの事前分布の位置への近さの比などを用いればよい。近さはユークリッド的な長さで定義してもよいし、損失関数内で用いたKLダイバージェンスの上限値を用いてもよい。また、再構成誤差と加算等で組み合わせて異常度を構成する等、他の指標と任意の方法で組み合わせてもよい。異常度算出部16は、算出した対象データの異常度を異常判定部17へ出力する。
ステップS17において、異常判定部17は、異常度算出部16が出力する対象データの異常度から異常検知の対象とする機械等が正常な状態か異常な状態かを判定し、正常か異常かを示す異常判定結果を出力する。正常な状態か異常な状態かの判定は、例えば対象データの異常度を予め定めた閾値と比較して、異常度が閾値未満であれば正常、閾値以上であれば異常のように判定すればよい。
この発明では、変分オートエンコーダを用いた異常検知を以下のように構成した。潜在空間を閉じた多様体とし、潜在変数事前分布を閉じた多様体上の確率分布とする。正常・異常それぞれに対応する2つの潜在変数事前分布を設定し、正常・異常両方のデータを用いて単一のモデルを更新する。そのモデルに対し、未知サンプルのエンコーダ出力がどちらの分布に近いかの情報を用いて異常を検知する。このように構成することで、この発明によれば、異常サンプルのエンコード結果の取り得る領域が限定され、結果として、オーバーフロー等の計算機的不都合が発生しにくくなる。
本発明は音以外の、温度、圧力、変位、等の任意のセンサデータ、ネットワーク通信量等のトラフィックデータ等を対象とした任意の異常検知ドメインに対しても同様に適用可能である。
以上、この発明の実施の形態について説明したが、具体的な構成は、これらの実施の形態に限られるものではなく、この発明の趣旨を逸脱しない範囲で適宜設計の変更等があっても、この発明に含まれることはいうまでもない。実施の形態において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
[プログラム、記録媒体]
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記憶装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
10−1,10−2,10−3 AD変換部
11−1 正常データ記憶部
11−2 異常データ記憶部
12−1,12−2,12−3 特徴抽出部
13 エンコーダ学習部
131 事前分布設定部
132 第一学習部
133 第二学習部
14 エンコーダ記憶部
15 エンコード部
16 異常度算出部
17 異常判定部

Claims (8)

  1. 潜在空間を閉じた多様体とし、正常データを学習した正常分布と異常データを学習した異常分布とを上記多様体上にもち、入力された特徴量を上記潜在空間に射影するエンコーダと、上記エンコーダの出力を再構成するデコーダとを記憶するエンコーダ記憶部と、
    対象データの特徴量を上記エンコーダへ入力したときに上記デコーダが出力する再構成結果を得るエンコード部と、
    上記再構成結果と上記正常分布および上記異常分布との距離に基づいて上記対象データの異常度を算出する異常度算出部と、
    を含む異常検知装置。
  2. 請求項1に記載の異常検知装置であって、
    上記エンコーダは角度パラメータと集中度パラメータとを出力するものであり、
    上記多様体上の相異なる2つの分布を上記正常分布の事前分布および上記異常分布の事前分布として設定する事前分布設定部と、
    上記正常データおよび上記異常データからなる学習データの特徴量を入力したときの上記エンコーダの出力のうち上記集中度パラメータを所定の定数として上記正常分布および上記異常分布を学習する第一学習部と、
    上記学習データの特徴量を入力したときに上記エンコーダが出力する上記角度パラメータから構成した回転行列と全体で共通した任意の値を持つ固定ベクトルとを乗算したベクトルと、上記事前分布のもつ方向ベクトルと、上記事前分布のもつ集中度パラメータとから計算したKLダイバージェンス上限値を用いて、上記学習データの特徴量を入力したときに上記エンコーダが出力する上記集中度パラメータを正規分布の標準偏差相当に変換した値に正規分布から生成した乱数を乗じた値を上記エンコーダが出力する上記角度パラメータに加算したベクトルを用いて回転行列を構成し上記正常分布および上記異常分布を学習する第二学習部と、
    をさらに含む異常検知装置。
  3. 請求項1に記載の異常検知装置であって、
    上記エンコーダは角度パラメータと正規分布の対数分散に相当するスカラーパラメータとを出力するものであり、
    上記多様体上の相異なる2つの分布を上記正常分布の事前分布および上記異常分布の事前分布として設定する事前分布設定部と、
    上記正常データおよび上記異常データからなる学習データの特徴量を入力したときの上記エンコーダの出力のうち上記集中度パラメータを所定の定数として上記正常分布および上記異常分布を学習する第一学習部と、
    上記学習データの特徴量を入力したときに上記エンコーダが出力する上記角度パラメータから構成した回転行列と全体で共通した任意の値を持つ固定ベクトルとを乗算した単位超球面上のベクトルを得、その単位超球面上のベクトルと上記事前分布のもつ方向ベクトルとの内積に上記事前分布のもつ集中度パラメータを乗算した値を、上記学習データの特徴量を入力したときに上記エンコーダが出力する上記スカラーパラメータの指数から減算した値をKLダイバージェンス値として、上記学習データの特徴量を入力したときに上記エンコーダが出力する上記スカラーパラメータに正規分布から生成した乱数を乗じた値を上記エンコーダが出力する上記角度パラメータに加算したベクトルを用いて回転行列を構成し上記正常分布および上記異常分布を学習する第二学習部と、
    をさらに含む異常検知装置。
  4. 請求項2または3に記載の異常検知装置であって、
    上記学習データを用いた上記第一学習部による上記正常分布および上記異常分布の学習を所定の回数繰り返し実行した後、上記学習データを用いた上記第二学習部による上記正常分布および上記異常分布の学習を実行する、
    異常検知装置。
  5. 請求項2から4のいずれかに記載の異常検知装置であって、
    上記エンコーダは、上記角度パラメータに90度近傍の値に対して高い値をもつコスト関数が設定されている、
    異常検知装置。
  6. 請求項1から5のいずれかに記載の異常検知装置であって、
    上記潜在空間を超球面とし、
    上記正常分布および上記異常分布をフォンミーゼス・フィッシャー分布とする、
    異常検知装置。
  7. エンコーダ記憶部に、潜在空間を閉じた多様体とし、正常データを学習した正常分布と異常データを学習した異常分布とを上記多様体上にもち、入力された特徴量を上記潜在空間に射影するエンコーダと、上記エンコーダの出力を再構成するデコーダとが記憶されており、
    エンコード部が、対象データの特徴量を上記エンコーダへ入力したときに上記デコーダが出力する再構成結果を得、
    異常度算出部が、上記再構成結果と上記正常分布および上記異常分布との距離に基づいて上記対象データの異常度を算出する、
    異常検知方法。
  8. 請求項1から6のいずれかに記載の異常検知装置としてコンピュータを機能させるためのプログラム。
JP2018136642A 2018-07-20 2018-07-20 異常検知装置、異常検知方法、およびプログラム Active JP6930503B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018136642A JP6930503B2 (ja) 2018-07-20 2018-07-20 異常検知装置、異常検知方法、およびプログラム
PCT/JP2019/026027 WO2020017285A1 (ja) 2018-07-20 2019-07-01 異常検知装置、異常検知方法、およびプログラム
US17/260,956 US20210326728A1 (en) 2018-07-20 2019-07-01 Anomaly detection apparatus, anomaly detection method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018136642A JP6930503B2 (ja) 2018-07-20 2018-07-20 異常検知装置、異常検知方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2020013449A true JP2020013449A (ja) 2020-01-23
JP6930503B2 JP6930503B2 (ja) 2021-09-01

Family

ID=69164299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018136642A Active JP6930503B2 (ja) 2018-07-20 2018-07-20 異常検知装置、異常検知方法、およびプログラム

Country Status (3)

Country Link
US (1) US20210326728A1 (ja)
JP (1) JP6930503B2 (ja)
WO (1) WO2020017285A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024009442A1 (ja) * 2022-07-06 2024-01-11 日本電信電話株式会社 判定装置、判定方法、および、判定プログラム
KR102654240B1 (ko) * 2022-10-26 2024-04-04 주식회사 에이아이네이션 딥러닝, 머신러닝 및 통계 모델을 이용한 산업설비 이상 감지 장치 및 시스템
JP7540209B2 (ja) 2020-06-23 2024-08-27 富士通株式会社 最適解獲得プログラム、最適解獲得方法および情報処理装置
WO2024181037A1 (ja) * 2023-03-01 2024-09-06 日本電気株式会社 データ処理装置、データ処理方法及びプログラム

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118348951A (zh) * 2018-08-10 2024-07-16 日本电信电话株式会社 概率分布学习装置、自编码器学习装置、数据变换装置
US20200097879A1 (en) * 2018-09-25 2020-03-26 Oracle International Corporation Techniques for automatic opportunity evaluation and action recommendation engine
US11467803B2 (en) 2019-09-13 2022-10-11 Oracle International Corporation Identifying regulator and driver signals in data systems
US20220206888A1 (en) * 2019-08-28 2022-06-30 Mitsubishi Electric Corporation Abnormal portion detecting device, method of detecting abnormal portion, and recording medium
CN111174905B (zh) * 2020-02-13 2023-10-31 欧朗电子科技有限公司 低功耗物联网振动异常检测装置及其检测方法
JP6979477B2 (ja) * 2020-03-10 2021-12-15 エヌ・ティ・ティ・アドバンステクノロジ株式会社 状態判定装置、状態判定方法及びコンピュータプログラム
CN111709491B (zh) * 2020-06-30 2024-05-14 平安科技(深圳)有限公司 基于自编码器的异常检测方法、装置、设备及存储介质
CN112393860B (zh) * 2020-12-09 2022-12-20 杭州拓深科技有限公司 一种基于类内距离约束自编码器的消防管网漏水监测方法
CN112702329B (zh) * 2020-12-21 2023-04-07 四川虹微技术有限公司 一种流量数据异常检测方法、装置和存储介质
US11443758B2 (en) * 2021-02-09 2022-09-13 International Business Machines Corporation Anomalous sound detection with timbre separation
US11843623B2 (en) * 2021-03-16 2023-12-12 Mitsubishi Electric Research Laboratories, Inc. Apparatus and method for anomaly detection
US11763086B1 (en) * 2021-03-29 2023-09-19 Amazon Technologies, Inc. Anomaly detection in text
CN113190797B (zh) * 2021-04-18 2024-07-16 南京医工交叉创新研究院有限公司 一种基于在线滚动判别特征分析的pta装置粗差判别方法
CN113670434B (zh) * 2021-06-21 2023-05-02 深圳供电局有限公司 变电站设备声音异常识别方法、装置和计算机设备
CN114462617A (zh) * 2021-12-21 2022-05-10 北京理工大学 一种基于蒸馏机制的数据异常检测方法
CN114297036B (zh) * 2022-01-05 2023-06-09 腾讯科技(深圳)有限公司 数据处理方法、装置、电子设备及可读存储介质
CN114330597B (zh) * 2022-01-14 2022-08-19 阿里巴巴达摩院(杭州)科技有限公司 用户聚类方法、数据聚类方法、装置、电子设备
CN115034282A (zh) * 2022-04-13 2022-09-09 国家电网有限公司信息通信分公司 异常数据检测模型的构建方法、异常数据检测方法及系统
WO2024180681A1 (ja) * 2023-02-28 2024-09-06 日本電信電話株式会社 学習装置、推定装置、学習方法、及び学習プログラム
CN116662811B (zh) * 2023-06-13 2024-02-06 无锡物联网创新中心有限公司 一种工业设备的时序状态数据重构方法及相关装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105637432A (zh) * 2013-08-30 2016-06-01 慧与发展有限责任合伙企业 识别被监控实体的异常行为
US11397792B2 (en) * 2016-09-08 2022-07-26 Nec Corporation Anomaly detecting device, anomaly detecting method, and recording medium
US11403531B2 (en) * 2017-07-19 2022-08-02 Disney Enterprises, Inc. Factorized variational autoencoders
JP6881207B2 (ja) * 2017-10-10 2021-06-02 日本電信電話株式会社 学習装置、プログラム
US10373056B1 (en) * 2018-01-25 2019-08-06 SparkCognition, Inc. Unsupervised model building for clustering and anomaly detection

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
TIM R.DAVIDSON, LUCA FALORSI, NICOLA DE CAO, THOMAS KIPF, JAKUB M.TOMCZAK: "Hyperspherical Variational Auto-Encoders", ARXIV.ORG [ONLINE], JPN6019034687, 3 April 2018 (2018-04-03), pages 1 - 19, ISSN: 0004524341 *
小泉悠馬、齊藤翔一郎、植松 尚: "深層学習を用いた機器動作音の異常音検知", 日本音響学会2017年春季研究発表会講演論文集CD−ROM[CD−ROM], JPN6019034685, 1 March 2017 (2017-03-01), JP, pages 473 - 476, ISSN: 0004524339 *
立花亮介、松原 崇、上原邦昭: "深層生成モデルによる非正則化異常度を用いた工業製品の異常検知", 第32回全国大会論文集DVD[DVD−ROM], JPN6019034686, 5 June 2018 (2018-06-05), JP, pages 1 - 4, ISSN: 0004524340 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7540209B2 (ja) 2020-06-23 2024-08-27 富士通株式会社 最適解獲得プログラム、最適解獲得方法および情報処理装置
WO2024009442A1 (ja) * 2022-07-06 2024-01-11 日本電信電話株式会社 判定装置、判定方法、および、判定プログラム
KR102654240B1 (ko) * 2022-10-26 2024-04-04 주식회사 에이아이네이션 딥러닝, 머신러닝 및 통계 모델을 이용한 산업설비 이상 감지 장치 및 시스템
WO2024181037A1 (ja) * 2023-03-01 2024-09-06 日本電気株式会社 データ処理装置、データ処理方法及びプログラム

Also Published As

Publication number Publication date
JP6930503B2 (ja) 2021-09-01
WO2020017285A1 (ja) 2020-01-23
US20210326728A1 (en) 2021-10-21

Similar Documents

Publication Publication Date Title
WO2020017285A1 (ja) 異常検知装置、異常検知方法、およびプログラム
US10387768B2 (en) Enhanced restricted boltzmann machine with prognosibility regularization for prognostics and health assessment
JP6881207B2 (ja) 学習装置、プログラム
WO2019160003A1 (ja) モデル学習装置、モデル学習方法、プログラム
US20200265307A1 (en) Apparatus and method with multi-task neural network
CN114297036A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN114298997B (zh) 一种伪造图片检测方法、装置及存储介质
JP6943067B2 (ja) 異常音検知装置、異常検知装置、プログラム
Tousi et al. Comparative analysis of machine learning models for performance prediction of the spec benchmarks
Wang et al. Incremental causal graph learning for online root cause analysis
JP5017941B2 (ja) モデル作成装置および識別装置
US20210397973A1 (en) Storage medium, optimum solution acquisition method, and optimum solution acquisition apparatus
CN117874673A (zh) 一种异常数据检测、解释方法
US11354600B2 (en) System and method for heterogeneous relational kernel learning
Caillerie et al. Model selection for simplicial approximation
Wang et al. Functional sufficient dimension reduction for functional data classification
Oyedotun et al. A closer look at autoencoders for unsupervised anomaly detection
KR102289396B1 (ko) 군장비 수리부속 품목 수요예측의 고도화를 위한 강화학습 적용
Zheng et al. Using Neural Networks for Novelty-based Test Selection to Accelerate Functional Coverage Closure
CN111832596B (zh) 数据处理方法、电子设备及计算机可读介质
Niveditha et al. Kernelized Deep Networks for Speech Signal Segmentation Using Clustering and Artificial Intelligence in Neural Networks
CN116051633B (zh) 一种基于加权关系感知的3d点云目标检测方法及装置
Zhao et al. PointCore: Efficient Unsupervised Point Cloud Anomaly Detector Using Local-Global Features
Wang et al. Disentangled Causal Graph Learning for Online Unsupervised Root Cause Analysis
You Weak-supervision Time-series Analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210628

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210726

R150 Certificate of patent or registration of utility model

Ref document number: 6930503

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150