JP2013257251A - 異常検知方法、プログラム及びシステム - Google Patents
異常検知方法、プログラム及びシステム Download PDFInfo
- Publication number
- JP2013257251A JP2013257251A JP2012134319A JP2012134319A JP2013257251A JP 2013257251 A JP2013257251 A JP 2013257251A JP 2012134319 A JP2012134319 A JP 2012134319A JP 2012134319 A JP2012134319 A JP 2012134319A JP 2013257251 A JP2013257251 A JP 2013257251A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- samples
- normal
- abnormal
- unlabeled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 29
- 239000011159 matrix material Substances 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000005856 abnormality Effects 0.000 claims description 39
- 230000002159 abnormal effect Effects 0.000 claims description 38
- 238000005259 measurement Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 abstract description 6
- 238000012360 testing method Methods 0.000 abstract description 5
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 12
- 238000005457 optimization Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01B—MEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
- G01B21/00—Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant
- G01B21/30—Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant for measuring roughness or irregularity of surfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
【課題】 ラベル情報を、異常検知モデルに取り入れる解析技法を提供すること。
【解決手段】 ラベル情報を有効活用するために、標本間に類似度を導入するというアイデアに基づく。例えば、正常ラベルあり標本は互いによく似ていて、異常ラベルあり標本とは類似性がないと想定する。個々のセンサ値が、潜在変数と各センサ固有の係数ベクトルの線形和で生成されると仮定する。但し、観測ノイズの大きさは、センサ値のラベル情報により異なるように定式化される。観測ノイズは、正常ラベル ≦ ラベルなし ≦ 異常ラベルとなるように設定される。次に、各標本の間の類似度からグラフ・ラプラシアンが作成され、グラフ・ラプラシアンを用いて、勾配法などによって、最適線形変換行列が求められ、最適線形変換行列を用いてテスト標本のセンサ各々の異常スコアが計算される。
【選択図】 図3
【解決手段】 ラベル情報を有効活用するために、標本間に類似度を導入するというアイデアに基づく。例えば、正常ラベルあり標本は互いによく似ていて、異常ラベルあり標本とは類似性がないと想定する。個々のセンサ値が、潜在変数と各センサ固有の係数ベクトルの線形和で生成されると仮定する。但し、観測ノイズの大きさは、センサ値のラベル情報により異なるように定式化される。観測ノイズは、正常ラベル ≦ ラベルなし ≦ 異常ラベルとなるように設定される。次に、各標本の間の類似度からグラフ・ラプラシアンが作成され、グラフ・ラプラシアンを用いて、勾配法などによって、最適線形変換行列が求められ、最適線形変換行列を用いてテスト標本のセンサ各々の異常スコアが計算される。
【選択図】 図3
Description
この発明は、車両や産業機械などの異常を検知する技法に関するものである。
列車やプラントなどの産業機械は、事故が発生すると社会的な影響が大きいので、事前に異常を検出することの要望が大きい。
そこで、従来より、安全性を維持するために、車両や産業機械などの様々な箇所を測定するためのセンサを設置し、それらのセンサから得られた測定データをコンピュータにより解析することによって、異常を検出することが行なわれている。
例えば、車両の主要部位の温度が、異常検知に利用可能である。その温度は、車両の経路付近に設置されたレーザー計測装置を用いて測定される。そして計測されたデータに基づき、早期異常検知が行なわれる。
その際、解析用のコンピュータには、異常検知対象の装置に関する知識が組み込まれる。
しかし、知識ベースの異常検知は、十分な信頼性を保証するまでに至っていない。その際、過去に検知した異常パターンを利用できるなら、過去と似たようなケースを見落とす可能性が減って異常検知の信頼性が高まる。関連技術として、以下の文献に記述されているものが知られている。
特開平7−280603号公報は、機械の異常判定方法において、標本を用いることを開示する。
WO2008/114863は、診断装置において、診断対象の変化度パターンの類似度を計算することを開示する。
特開2008−58191号公報は、回転機械の診断方法において、標準パラメータ値との類似度を確信度として計算することを開示する。
特開2009−76056号公報は、異常値を同定する方法において、頻度異常測度を用いることを開示する。
特開2010−78467号公報は、テスト用時系列データと、参照用正常時系列データの各々について、先ず相関係数行列を作成し、graphic lassoのアルゴリズムにより、その各々の相関係数行列から、逆行列である、疎の精度行列を作成し、精度行列を用いて、テスト用時系列データと参照用正常時系列データの各々について、好適には多変量ガウスモデルによって近傍性の確率分布を記述することを開示する。
X. Zhu, Z. Ghahramani, "Semi-supervised learning using gaussian fields and harmonic functions" in ICML, 2003は、ガウス・ランダム場モデルに基づく、半教師あり学習について述べたものであり、ラベル付きデータとラベルなしデータを、重み付きグラフの頂点としてあらわすことを開示する。
A.B. Goldberg, X. Zhu, and S. Wright, "Dissimilarity in graph-based semi-supervised classification", in AISTATS, 2007は、ラベル付けされたデータとラベルなしデータの類似度と非類似度から学習する、半教師あり分類アルゴリズムを記述する。
X. Zhu, Z. Ghahramani, "Semi-supervised learning using gaussian fields and harmonic functions" in ICML, 2003
A.B. Goldberg, X. Zhu, and S. Wright, "Dissimilarity in graph-based semi-supervised classification", in AISTATS, 2007
上記従来技術は、半教師ありアルゴリズムも含めて、異常検知に適用可能な様々に技法を記述するが、過去に検知した異常パターンを利用することについては示唆するものではない。すなわち、上記従来技術にあっては、過去に検知した異常パターンを活用しようとすると、恣意的な前処理が必要であり、結局、異常検知の信頼性を十分に高められなかった。
従って、この発明の目的は、既存のラベル情報を、異常検知モデルに取り入れる解析技法を提供することにある。
この発明の他の目的は、ラベルあり標本とラベルなし標本が混在しているデータにおいて、ラベル情報を有効に活用できる異常検知技法を提供することにある。
この発明は、上記課題を解決するためになされたものであり、ラベル情報を有効活用するために、標本間に類似度を導入するというアイデアに基づく。例えば、正常ラベルあり標本は互いによく似ていて、異常ラベルあり標本とは類似性がないと想定する。
また、過去の経験から故障は滅多にないと判明している場合、ラベルなし標本は異常標本より正常標本との類似度が高いと想定し、一方、何も事前情報がない場合、双方の標本に同等に似ていると想定する。
さて、正規化した各標本は、各々の成分がセンサ値である多次元ベクトルで表現される。そこで、本発明によれば、個々のセンサ値が、潜在変数と各センサ固有の係数ベクトルの内積と観測ノイズの線形和で生成されると仮定する。但し、観測ノイズの大きさは、センサ値のラベル情報により異なるように定式化される。観測ノイズは、正常ラベル ≦ ラベルなし ≦ 異常ラベルとなるように設定される。
次に、各標本の間の類似度からグラフ・ラプラシアンが作成され、グラフ・ラプラシアンを用いて、勾配法などによって、モデル・パラメータとしての最適線形変換行列が求められる。
最適線形変換行列が得られると、例えば、本願出願人に係る特願2011−206087号明細書に記載されている技法に従い、テスト標本のセンサ各々の異常スコアが計算される。
この発明によれば、過去に検知した異常パターン及び正常パターンの標本を異常検知モデルに取り入れることによって、異常検知の基準の恣意性を減らし、より信頼性の高い異常検知を行うことが可能となる。
以下、図面に基づき、この発明の実施例を説明する。特に断わらない限り、同一の参照番号は、図面を通して、同一の対象を指すものとする。尚、以下で説明するのは、本発明の一実施形態であり、この発明を、この実施例で説明する内容に限定する意図はないことを理解されたい。
図1を参照すると、本発明の一実施例に係るシステム構成及び処理を実現するためのコンピュータ・ハードウェアのブロック図が示されている。図1において、システム・パス102には、CPU104と、主記憶(RAM)106と、ハードディスク・ドライブ(HDD)108と、キーボード110と、マウス112と、ディスプレイ114が接続されている。CPU104は、好適には、32ビットまたは64ビットのアーキテクチャに基づくものであり、例えば、インテル社のPentium(商標) 4、Core(商標)2 Duo、Xeon(商標)、AMD社のAthlon(商標)などを使用することができる。主記憶106は、好適には、4GB以上の容量をもつものである。ハードディスク・ドライブ108は、大量のデータを格納できるように、例えば、500GB以上の容量をもつものであることが望ましい。
ハードディスク・ドライブ108には、個々に図示しないが、オペレーティング・システムが、予め格納されている。オペレーティング・システムは、Linux(商標)、マイクロソフト社のWindows XP(商標)、Windows(商標)7、アップルコンピュータのMac OS(商標)などの、CPU104に適合する任意のものでよい。
ハードディスク・ドライブ108にはさらに、図2を参照して後で説明する、メイン・プログラム202、ラベルありデータ204、ラベルなしデータ206、パラメータ群208、グラフ・ラプラシアン計算ルーチン210、パラメータ最適化ルーチン212、及び異常検知ルーチン214が格納されている。メイン・プログラム202、グラフ・ラプラシアン計算ルーチン210、パラメータ最適化ルーチン212、及び異常検知ルーチン214は、Java(R)、C、C++、C#などの既存の任意のプログラミング言語で作成することができる。
キーボード110及びマウス112は、オペレーティング・システムまたは、ハードディスク・ドライブ108から主記憶106にロードされ、ディスプレイ114に表示された・メインプログラム202上で操作したり、文字を打ち込んだりするために使用される。
ディスプレイ114は、好適には液晶ディスプレイであり、例えば、XGA(1024×768の解像度)、またはUXGA(1600×1200の解像度)などの任意の解像度のものを使用することができる。ディスプレイ114は、図示しないが、パラメータの入力や処理を開始するための操作ウインドウや、パラメータの計算結果等を表示するために使用される。
次に、図2の機能ブロック図を参照して、本発明の処理の機能的な構成について説明する。
図2において、メイン・プログラム202は、全体の処理を統合する機能をもつプログラムであり、ユーザの操作に従い、パラメータ群208をセットしたり、グラフ・ラプラシアン計算ルーチン210、パラメータ最適化ルーチン212、及び異常検知ルーチン214を起動して計算を実行したり、結果をディスプレイ114に表示したりするために使用される。
ラベルありデータ204は、過去に検知された、異常/正常が判明しているデータを含み、異常が判明しているデータには異常のラベルが付され、正常が判明しているデータには正常のラベルが付されている。
ラベルなしデータ206は、異常とも正常とも判明していない、ラベルなしのデータを含む。以下では便宜上、ラベルありデータ204とラベルなしデータ206を一括して統一して扱うことにする。
1つのデータ(標本とも呼ぶ)は、D種のセンサ値からなるD次元の実数ベクトルであるとする。このような標本がN個あるとすると、
センサ・データの集合X = [X1,...,XN]T ∈ RN×Dとあらわすことができる。
センサ・データの集合X = [X1,...,XN]T ∈ RN×Dとあらわすことができる。
センサ・データの集合Xは好適には、オリジナル・センサ・データの集合X' = [X'1,...,X'N]T ∈ RN×Dに基づき正規化されたデータである。正規化は次のような式に基づき行われる。ここで、Xn,dは、ベクトルXnのd番目の成分である。X'n,dも同様である。
また、センサ・データの集合X = [X1,...,XN]T ∈ RN×Dの各々に対応して、ラベル情報Y = [Y1,...,YN]T ∈ RN×Dが与えられ、図示しないが、ラベルありデータ204及びラベルなしデータ206とともにハードディスク・ドライブ108に保存されている。
本発明によれば、正規化された各標本Xnの各センサ値Xn,dは、潜在変数Zn ∈ RD'(D' ≦ D)と、ラベル毎のノイズの大きさの係数snormal, sanomaly, sunlabelと平均0、分散1のガウスノイズεで次のようにあらわされると仮定される。snormalは正常に対応し、sanomalyは異常に対応し、sunlabelはラベルなしに対応する。また、D'は通常はDと等しくセットするが、Dが非常に大きく、データ数Nが小さいときは、D'は100程度にセットされる。
このとき、snormal ≦ sunlabel ≦ sanomalyと設定される。具体的な値であるが、例えば、何も知見がなけば、snormal = 1,sunlabel = 3,sanomaly = 5と設定し、ラベルなしデータがほぼ正常であるという知見があればsnormal = 1,sunlabel = 2,sanomaly = 5と設定し、ラベルなしデータがほぼ異常であるという知見があればsnormal = 1,sunlabel = 4,sanomaly = 5と設定する。
パラメータ群208は、ノイズの大きさsnormal, sanomaly, sunlabel、スケールパラメータλ、次元数D、D'などのパラメータをハードディスク・ドライブ108に保存し、これらのパラメータは、ユーザの操作により設定可能である。
パラメータ群208にはさらに、類似度行列Rを決定するための値も含まれる。すなわち、類似度行列は標本数Nx標本数Nの正方行列であり、各行と各列は各標本に対応し(例えば、 i行 j列は i番目と j番目の標本に関する類似度に対応)、正常(ラベル付き)標本と正常標本に対応する行列の要素は正数aであり、正常標本と異常標本に対応する要素は非正数bであり、正常標本とラベル無し標本に対応する要素はcであり、異常標本と異常標本に対応する要素はdであり、異常標本とラベル無し標本に対応する要素はeであり、ラベル無し標本とラベル無し標本に対応する要素はfとなる。a,b,c,d,e,fは、b≦c≦a, e≦d, d≦fという関係を満たす。
上記のa,b,dは好ましくはa=1, b=0, d=0.2と設定される。
c,e,fの設定は sunlabelなどと同様、アルゴリズム使用者が適用データのラベル無しデータに関して持っている知見に依存する。
すなわち:
何も知見がないのであれば、 例えば c=0.5,e=0.1,f=0.5,
ラベル無しデータがほぼ正常であるという知見があれば、例えば c=0.8, e=0, f= 0.8,
ラベル無しデータがほぼ異常であるという知見があれば、例えば c=0, e=0.1, f= 0.2。
c,e,fの設定は sunlabelなどと同様、アルゴリズム使用者が適用データのラベル無しデータに関して持っている知見に依存する。
すなわち:
何も知見がないのであれば、 例えば c=0.5,e=0.1,f=0.5,
ラベル無しデータがほぼ正常であるという知見があれば、例えば c=0.8, e=0, f= 0.8,
ラベル無しデータがほぼ異常であるという知見があれば、例えば c=0, e=0.1, f= 0.2。
図2に示すグラフ・ラプラシアン計算ルーチン210は、パラメータ群208に設定された値a,b,c,d,e,fに基づき、類似度行列Rを構成し、次にこうして構成された類似度行列Rから、次のようにしてグラフ・ラプラシアンLを計算する。
この潜在変数Z ≡ [Z1,...,ZN]T ∈ RN×D'について、グラフ・ラプラシアンLを以って
が成立する。X ≡ [X1,...,XN]T ∈ RN×Dの確率Pr(X|W,Z,s)は、パラメータW ≡ [W1,...,WD]T ∈ RD×D'とZとの尤度関数と見なせるので、パラメータ最適化ルーチン212は、その事後確率を最大化するように、例えば勾配法により、(W*,Z*)を求める。この処理の詳細は、図3のフローチャートを参照して、後で説明する。
が成立する。X ≡ [X1,...,XN]T ∈ RN×Dの確率Pr(X|W,Z,s)は、パラメータW ≡ [W1,...,WD]T ∈ RD×D'とZとの尤度関数と見なせるので、パラメータ最適化ルーチン212は、その事後確率を最大化するように、例えば勾配法により、(W*,Z*)を求める。この処理の詳細は、図3のフローチャートを参照して、後で説明する。
こうして求められた(W*,Z*)に基づき、異常検知ルーチン214は、各変数の異常スコアを計算する。異常検知ルーチン214は好適には、本願出願人に係る特願2011−206087号明細書に記載されている技法を用いる。異常検知ルーチン214の処理は、図4のフローチャートを参照して、後で説明する。
次に図3のフローチャートを参照して、モデルパラメータ(最適線形変換行列)W*などを求める処理について説明する。
図3のステップ302において、メイン・プログラム202は、トレーニング・データ{X'∈RN×D,y}を、ラベルありデータ204及びラベルなしデータ206をハードディスク・ドライブ108から読み込むことで入力し、前述のようにこれらのデータを正規化するとともに、各列について正規化の際に計算した各列dの平均μdと標準偏差σdを記憶する。
ステップ304において、メイン・プログラム202は、パラメータD', スケールパラメータλ, snormal,sunlabel,sanomaly,a,b,c,d,e,fをパラメータ群208から読み込み、あるいは、設定画面(図示しない)によってキーボード110やマウス112を使って入力する。スケールパラメータλは例えば、0.1に設定されるが、ノイズの大きさなどを指標として、交差検定法により決定することもできる。
ステップ306において、メイン・プログラム202は、グラフ・ラプラシアン計算ルーチン210を呼び出し、ラベル情報Yとa,b,c,d,e,fを用いて、グラフ・ラプラシアンLを計算する。グラフ・ラプラシアンLの計算の詳細は、図2に関連して既に説明したので、ここでは説明を省略する。
ステップ308において、メイン・プログラム202は、W∈RD×D', Z∈N×D'を初期化する。この初期化は任意の方法でよいが、好ましくは標準正規分布、すなわち、平均が0、標準偏差が1の正規分布となるようにWとZを初期化する。
ステップ310において、メイン・プログラム202は、時刻変数tを1とセットする。
ステップ312において、メイン・プログラム202は、下記の式に従い、Wを更新する。
ここで、Sは下記のとおりであり、
S・(X - ZWT)という演算は、(X - ZWT)という行列のn,d要素に、Sのn,d要素を掛けることを意味する。またαは学習率であり、例えば0.1と設定される。αの値は一定でなく、繰り返し回数に応じて減少させてもよい。
ここで、Sは下記のとおりであり、
S・(X - ZWT)という演算は、(X - ZWT)という行列のn,d要素に、Sのn,d要素を掛けることを意味する。またαは学習率であり、例えば0.1と設定される。αの値は一定でなく、繰り返し回数に応じて減少させてもよい。
ここでの式は、類似度に基づくペナルティを小さくする項を有する更新式に従ってパラメータを更新するように計算を行なうものである。これは、各観測の潜在変数の類似度に基づくペナルティを小さくする項を含み、より詳細には、類似度に基づくペナルティは、類似度行列(もしくはグラフ・ラプラシアン)に基づくマハラノビス距離となるように定式化されている。そして、勾配法に従い、収束するように計算される。
なお、ステップ312とステップ314はこの順でなく、順序を入れ替えて計算してもよい。
ステップ314の後は、メイン・プログラム202は、ステップ316で、終了条件を判定する。ここでの終了条件とは例えば、前回のループで計算した行列W'と今回のループで計算した行列Wのフロベニウス・ノルム
を計算し、これが所定の閾値、例えば0.001以内であることをもって終了条件が満たされたとする。
を計算し、これが所定の閾値、例えば0.001以内であることをもって終了条件が満たされたとする。
終了条件が満たされないなら、メイン・プログラム202は、ステップ318でtを1だけ増分して、ステップ312に戻る。
メイン・プログラム202は、終了条件が満たされると、ステップ320で、モデルパラメータW、snormal、μ= [μ1,...,μD], σ = [σ1,...,σD]を出力する。
次に図4のフローチャートを参照して、異常検出ルーチン214による異常スコア計算処理について説明する。
図4において、ステップ402では、メイン・プログラム202は、異常検出ルーチン214を呼び出して、モデルパラメータW、snormal、μ= [μ1,...,μD], σ = [σ1,...,σD]を渡す。
異常検出ルーチン214はステップ404で、テスト・データ{X'∈RN×D,y}を、ラベルありデータ204及びラベルなしデータ206をハードディスク・ドライブ108から読み込むことで入力し、μとσを用いて、X'を各列について、記述の式により正規化し、Xを得る。
異常検出ルーチン214はステップ406で、下記の式により相関異常スコア・ベクトルsn∈RDを算出する。
但し、
であり、ここでIは単位行列である。この、最適線形変換行列Wに基づき相関異常スコア・ベクトルを計算するアルゴリズムは、本願出願人に係る特願2011−206087号明細書に記載されているものであるので、ここでは詳述しない。
但し、
であり、ここでIは単位行列である。この、最適線形変換行列Wに基づき相関異常スコア・ベクトルを計算するアルゴリズムは、本願出願人に係る特願2011−206087号明細書に記載されているものであるので、ここでは詳述しない。
このような計算に基づき、異常検出ルーチン214は、ステップ408で、異常スコア・ベクトルs1,...,sNを出力する。s1,...,sNは各次元=各変数、すなわち各センサの異常スコアであり、高いほど異常である。
以上、列車やプラントなどの産業機械の異常検知を行なう実施例について本発明を説明したが、これには限定されず、複数の測定パラメータに基づき異常検知を行なう任意の例に適用可能であることを理解されたい。
104・・・CPU
106・・・主記憶
108・・・ハードディスク・ドライブ
204・・・ラベルありデータ
206・・・ラベルなしデータ
210・・・グラフ・ラプラシアン計算ルーチン
212・・・パラメータ最適化ルーチン
214・・・異常検知ルーチン
106・・・主記憶
108・・・ハードディスク・ドライブ
204・・・ラベルありデータ
206・・・ラベルなしデータ
210・・・グラフ・ラプラシアン計算ルーチン
212・・・パラメータ最適化ルーチン
214・・・異常検知ルーチン
Claims (23)
- コンピュータの処理により、測定データに基づき異常検知を行なう方法であって、
異常あるいは正常のラベルをもつ測定データと、ラベルをもたない測定データを標本として入力するステップと、
前記標本に基づき、前記標本の間の関係を示す類似度行列を求めるステップと、
前記類似度に基づくペナルティを定義し、前記ペナルティを小さくする項を有する更新式に従ってパラメータを計算するステップと、
前記計算されたパラメータに基づき、異常検知の度合いを計算するステップを有する、
方法。 - 前記パラメータを計算するステップの前に、前記類似度行列からグラフ・ラプラシアンを計算するステップをさらに有し、前記パラメータを計算するステップが、該計算されたグラフ・ラプラシアンを使用する、請求項1に記載の方法。
- 前記類似度に基づくペナルティは、類似度行列またはグラフラプラシアンに基づくマハラノビス距離である、請求項2に記載の方法。
- 前記類似度行列は標本数x標本数の正方行列であり、各行と各列は各標本に対応し、正常(ラベル付き)標本と正常標本に対応する行列の要素は正数aであり、正常標本と異常標本に対応する要素は非正数bであり、正常標本とラベル無し標本に対応する要素はcであり、異常標本と異常標本に対応する要素はdであり、異常標本とラベル無し標本に対応する要素はeであり、ラベル無し標本とラベル無し標本に対応する要素はfである、請求項1に記載の方法。
- 前記a,b,c,d,e,fは、b≦c≦a, e≦d, d≦fである、請求項4に記載の方法。
- ラベル無し標本が正常標本であると仮定できる場合に、cとfをaと同じもしくは近い値にし、eをbと同じもしくは近い値にする、請求項5に記載の方法。
- ラベル無し標本が異常標本であると仮定できる場合に、cをbと同じもしくは近い値にし、eとfをdと同じもしくは近い値にする、請求項5に記載の方法。
- 前記標本としての観測値が、潜在変数とパラメータの内積とノイズ項により定まるモデルを用いる、請求項1に記載の方法。
- 前記ノイズ項が、正常標本と異常標本とラベルなし標本でそれぞれ異なり、正常標本のノイズ項 ≦ ラベルなし標本のノイズ項 ≦ 異常標本のノイズ項である、請求項8に記載の方法。
- コンピュータの処理により、測定データに基づき異常検知を行なうプログラムであって、
前記コンピュータに、
異常あるいは正常のラベルをもつ測定データと、ラベルをもたない測定データを標本として入力するステップと、
前記標本に基づき、前記標本の間の関係を示す類似度行列を求めるステップと、
前記類似度に基づくペナルティを定義し、前記ペナルティを小さくする項を有する更新式に従ってパラメータを計算するステップと、
前記計算されたパラメータに基づき、異常検知の度合いを計算するステップを実行させる、
プログラム。 - 前記パラメータを計算するステップの前に、前記類似度行列からグラフ・ラプラシアンを計算するステップをさらに有し、前記パラメータを計算するステップが、該計算されたグラフ・ラプラシアンを使用する、請求項10に記載のプログラム。
- 前記類似度に基づくペナルティは、類似度行列またはグラフラプラシアンに基づくマハラノビス距離である、請求項11に記載のプログラム。
- 前記類似度行列は標本数x標本数の正方行列であり、各行と各列は各標本に対応し、正常(ラベル付き)標本と正常標本に対応する行列の要素は正数aであり、正常標本と異常標本に対応する要素は非正数bであり、正常標本とラベル無し標本に対応する要素はcであり、異常標本と異常標本に対応する要素はdであり、異常標本とラベル無し標本に対応する要素はeであり、ラベル無し標本とラベル無し標本に対応する要素はfである、請求項10に記載のプログラム。
- 前記a,b,c,d,e,fは、b≦c≦a, e≦d, d≦fである、請求項13に記載の方法。
- ラベル無し標本が正常標本であると仮定できる場合に、cとfをaと同じもしくは近い値にし、eをbと同じもしくは近い値にする、請求項14に記載のプログラム。
- ラベル無し標本が異常標本であると仮定できる場合に、cをbと同じもしくは近い値にし、eとfをdと同じもしくは近い値にする、請求項14に記載のプログラム。
- 前記標本としての観測値が、潜在変数とパラメータの内積とノイズ項により定まるモデルを用いる、請求項10に記載のプログラム。
- 前記ノイズ項が、正常標本と異常標本とラベルなし標本でそれぞれ異なり、正常標本のノイズ項 ≦ ラベルなし標本のノイズ項 ≦ 異常標本のノイズ項である、請求項17に記載のプログラム。
- コンピュータの処理により、測定データに基づき異常検知を行なうシステムであって、
記憶手段と、
前記記憶手段に保存された、異常あるいは正常のラベルをもつ測定データと、ラベルをもたない測定データと、
前記標本に基づき、前記標本の間の関係を示す類似度行列を求める手段と、
前記類似度に基づくペナルティを定義し、前記ペナルティを小さくする項を有する更新式に従ってパラメータを計算する手段と、
前記計算されたパラメータに基づき、異常検知の度合いを計算する手段を有する、
システム。 - 前記パラメータを計算するステップの前に、前記類似度行列からグラフ・ラプラシアンを計算するステップをさらに有し、前記パラメータを計算するステップが、該計算されたグラフ・ラプラシアンを使用する、請求項19に記載のシステム。
- 前記類似度に基づくペナルティは、類似度行列またはグラフラプラシアンに基づくマハラノビス距離である、請求項20に記載のシステム。
- 前記類似度行列は標本数x標本数の正方行列であり、各行と各列は各標本に対応し、正常(ラベル付き)標本と正常標本に対応する行列の要素は正数aであり、正常標本と異常標本に対応する要素は非正数bであり、正常標本とラベル無し標本に対応する要素はcであり、異常標本と異常標本に対応する要素はdであり、異常標本とラベル無し標本に対応する要素はeであり、ラベル無し標本とラベル無し標本に対応する要素はfである、請求項19に記載のシステム。
- 前記a,b,c,d,e,fは、b≦c≦a, e≦d, d≦fである、請求項22に記載のシステム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012134319A JP2013257251A (ja) | 2012-06-14 | 2012-06-14 | 異常検知方法、プログラム及びシステム |
US13/916,744 US9495330B2 (en) | 2012-06-14 | 2013-06-13 | Anomaly detection method, program, and system |
US15/153,090 US9824069B2 (en) | 2012-06-14 | 2016-05-12 | Anomaly detection method, program, and system |
US15/152,867 US9805002B2 (en) | 2012-06-14 | 2016-05-12 | Anomaly detection method, program, and system |
US15/273,301 US10133703B2 (en) | 2012-06-14 | 2016-09-22 | Anomaly detection method, program, and system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012134319A JP2013257251A (ja) | 2012-06-14 | 2012-06-14 | 異常検知方法、プログラム及びシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013257251A true JP2013257251A (ja) | 2013-12-26 |
Family
ID=49756669
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012134319A Pending JP2013257251A (ja) | 2012-06-14 | 2012-06-14 | 異常検知方法、プログラム及びシステム |
Country Status (2)
Country | Link |
---|---|
US (4) | US9495330B2 (ja) |
JP (1) | JP2013257251A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017006792A1 (ja) * | 2015-07-07 | 2017-01-12 | 三菱電機株式会社 | 検査方法および検査装置 |
US9702729B2 (en) | 2014-04-30 | 2017-07-11 | International Business Machines Corporation | Sensor output change detection |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103827653B (zh) * | 2011-09-21 | 2016-03-30 | 国际商业机器公司 | 检测异常的发生的方法、设备及计算机程序 |
US9509710B1 (en) | 2015-11-24 | 2016-11-29 | International Business Machines Corporation | Analyzing real-time streams of time-series data |
JP6243080B1 (ja) * | 2017-08-03 | 2017-12-06 | 株式会社日立パワーソリューションズ | プリプロセッサおよび異常予兆診断システム |
US11308407B1 (en) * | 2017-12-14 | 2022-04-19 | Amazon Technologies, Inc. | Anomaly detection with feedback |
US12001949B2 (en) | 2018-09-05 | 2024-06-04 | Sartorius Stedim Data Analytics Ab | Computer-implemented method, computer program product and system for data analysis |
EP4290412A3 (en) | 2018-09-05 | 2024-01-03 | Sartorius Stedim Data Analytics AB | Computer-implemented method, computer program product and system for data analysis |
TWI668464B (zh) * | 2018-09-10 | 2019-08-11 | 和碩聯合科技股份有限公司 | 移動式電子裝置的定位方法及定位系統 |
CN109726893A (zh) * | 2018-11-27 | 2019-05-07 | 广东石油化工学院 | 一种旋转机械故障数据集属性权重的确定及评价方法 |
CN112559602B (zh) * | 2021-02-21 | 2021-07-13 | 北京工业大数据创新中心有限公司 | 一种工业设备征兆的目标样本的确定方法及系统 |
CN113191616B (zh) * | 2021-04-18 | 2023-01-24 | 宁波大学科学技术学院 | 一种基于双层相关特征分析的聚丙烯产品质量异常检测方法 |
CN113362313B (zh) * | 2021-06-18 | 2024-03-15 | 四川启睿克科技有限公司 | 一种基于自监督学习的缺陷检测方法及系统 |
CN113850301B (zh) * | 2021-09-02 | 2024-06-18 | 支付宝(杭州)信息技术有限公司 | 训练数据的获取方法和装置、模型训练方法和装置 |
CN114492517B (zh) * | 2022-01-10 | 2022-11-25 | 南方科技大学 | 电梯检测方法、电梯检测装置、电子设备及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2721799B2 (ja) | 1994-04-14 | 1998-03-04 | 四国電力株式会社 | 機械の異常判定方法 |
US20050283511A1 (en) * | 2003-09-09 | 2005-12-22 | Wei Fan | Cross-feature analysis |
JP3922375B2 (ja) * | 2004-01-30 | 2007-05-30 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 異常検出システム及びその方法 |
US7369965B2 (en) * | 2004-06-28 | 2008-05-06 | Honeywell International, Inc. | System and method for turbine engine anomaly detection |
JP2008058191A (ja) | 2006-08-31 | 2008-03-13 | Jfe Steel Kk | 回転機械の診断方法、そのプログラム、及びその診断装置 |
CN102354204B (zh) | 2007-03-22 | 2016-06-29 | 日本电气株式会社 | 诊断装置 |
US20090030753A1 (en) | 2007-07-27 | 2009-01-29 | General Electric Company | Anomaly Aggregation method |
US7483934B1 (en) * | 2007-12-18 | 2009-01-27 | International Busniess Machines Corporation | Methods involving computing correlation anomaly scores |
JP5186322B2 (ja) | 2008-09-26 | 2013-04-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 時系列データ解析システム、方法及びプログラム |
-
2012
- 2012-06-14 JP JP2012134319A patent/JP2013257251A/ja active Pending
-
2013
- 2013-06-13 US US13/916,744 patent/US9495330B2/en active Active
-
2016
- 2016-05-12 US US15/153,090 patent/US9824069B2/en active Active
- 2016-05-12 US US15/152,867 patent/US9805002B2/en not_active Expired - Fee Related
- 2016-09-22 US US15/273,301 patent/US10133703B2/en active Active
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9702729B2 (en) | 2014-04-30 | 2017-07-11 | International Business Machines Corporation | Sensor output change detection |
US10444032B2 (en) | 2014-04-30 | 2019-10-15 | International Business Machines Corporation | Sensor output change detection |
US10551212B2 (en) | 2014-04-30 | 2020-02-04 | International Business Machines Corporation | Sensor output change detection |
US11035693B2 (en) | 2014-04-30 | 2021-06-15 | International Business Machines Corporation | Sensor output change detection |
WO2017006792A1 (ja) * | 2015-07-07 | 2017-01-12 | 三菱電機株式会社 | 検査方法および検査装置 |
JPWO2017006792A1 (ja) * | 2015-07-07 | 2017-10-05 | 三菱電機株式会社 | 検査方法および検査装置 |
Also Published As
Publication number | Publication date |
---|---|
US20160258747A1 (en) | 2016-09-08 |
US9495330B2 (en) | 2016-11-15 |
US20160258748A1 (en) | 2016-09-08 |
US20130338965A1 (en) | 2013-12-19 |
US10133703B2 (en) | 2018-11-20 |
US9824069B2 (en) | 2017-11-21 |
US20170011008A1 (en) | 2017-01-12 |
US9805002B2 (en) | 2017-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2013257251A (ja) | 異常検知方法、プログラム及びシステム | |
Wang et al. | Quality-related fault detection using linear and nonlinear principal component regression | |
JP6594044B2 (ja) | 実時系列内の異常を検出するための方法 | |
Au | Uncertainty law in ambient modal identification—Part I: Theory | |
US7565262B2 (en) | Bayesian sensor estimation for machine condition monitoring | |
Mahmoud | Phase I analysis of multiple linear regression profiles | |
Brzezinski et al. | Prequential AUC for classifier evaluation and drift detection in evolving data streams | |
Brabec et al. | On model evaluation under non-constant class imbalance | |
Cai et al. | A new fault detection method for non-Gaussian process based on robust independent component analysis | |
US20180349320A1 (en) | Time series data analysis device, time series data analysis method, and computer program | |
Joshi et al. | Bayesian-EUCLID: Discovering hyperelastic material laws with uncertainties | |
US10754310B2 (en) | Incorporating change diagnosis using probabilistic tensor regression model for improving processing of materials | |
Chelidze et al. | Phase space warping: nonlinear time-series analysis for slowly drifting systems | |
Long et al. | Automated structural damage detection using one-class machine learning | |
Rao et al. | Sensor fault detection in structural health monitoring using null subspace–based approach | |
Liang et al. | A robust multivariate EWMA control chart for detecting sparse mean shifts | |
Zhan et al. | Improved process monitoring based on global–local manifold analysis and statistical local approach for industrial process | |
Ramlakhan et al. | Building artificial intelligence and machine learning models: a primer for emergency physicians | |
US11775512B2 (en) | Data analysis apparatus, method and system | |
Xia et al. | Process monitoring based on improved recursive PCA methods by adaptive extracting principal components | |
Hawkins et al. | QSARs for chemical mutagens from structure: ridge regression fitting and diagnostics | |
Kadiyala et al. | Anomaly Detection Using Unsupervised Machine Learning Algorithms | |
Sheu et al. | Monitoring the mean of autocorrelated observations with one generally weighted moving average control chart | |
Maleki et al. | Robust hierarchical clustering for novelty identification in sensor networks: With applications to industrial systems | |
Tong et al. | Dissimilarity-based fault diagnosis through ensemble filtering of informative variables |