JP2013257251A - 異常検知方法、プログラム及びシステム - Google Patents

異常検知方法、プログラム及びシステム Download PDF

Info

Publication number
JP2013257251A
JP2013257251A JP2012134319A JP2012134319A JP2013257251A JP 2013257251 A JP2013257251 A JP 2013257251A JP 2012134319 A JP2012134319 A JP 2012134319A JP 2012134319 A JP2012134319 A JP 2012134319A JP 2013257251 A JP2013257251 A JP 2013257251A
Authority
JP
Japan
Prior art keywords
sample
samples
normal
abnormal
unlabeled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012134319A
Other languages
English (en)
Inventor
Bin Tong
彬 童
Tetsuo Morimura
哲郎 森村
Takeshi Ide
剛 井手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2012134319A priority Critical patent/JP2013257251A/ja
Priority to US13/916,744 priority patent/US9495330B2/en
Publication of JP2013257251A publication Critical patent/JP2013257251A/ja
Priority to US15/153,090 priority patent/US9824069B2/en
Priority to US15/152,867 priority patent/US9805002B2/en
Priority to US15/273,301 priority patent/US10133703B2/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B21/00Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant
    • G01B21/30Measuring arrangements or details thereof, where the measuring technique is not covered by the other groups of this subclass, unspecified or not relevant for measuring roughness or irregularity of surfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

【課題】 ラベル情報を、異常検知モデルに取り入れる解析技法を提供すること。
【解決手段】 ラベル情報を有効活用するために、標本間に類似度を導入するというアイデアに基づく。例えば、正常ラベルあり標本は互いによく似ていて、異常ラベルあり標本とは類似性がないと想定する。個々のセンサ値が、潜在変数と各センサ固有の係数ベクトルの線形和で生成されると仮定する。但し、観測ノイズの大きさは、センサ値のラベル情報により異なるように定式化される。観測ノイズは、正常ラベル ≦ ラベルなし ≦ 異常ラベルとなるように設定される。次に、各標本の間の類似度からグラフ・ラプラシアンが作成され、グラフ・ラプラシアンを用いて、勾配法などによって、最適線形変換行列が求められ、最適線形変換行列を用いてテスト標本のセンサ各々の異常スコアが計算される。
【選択図】 図3

Description

この発明は、車両や産業機械などの異常を検知する技法に関するものである。
列車やプラントなどの産業機械は、事故が発生すると社会的な影響が大きいので、事前に異常を検出することの要望が大きい。
そこで、従来より、安全性を維持するために、車両や産業機械などの様々な箇所を測定するためのセンサを設置し、それらのセンサから得られた測定データをコンピュータにより解析することによって、異常を検出することが行なわれている。
例えば、車両の主要部位の温度が、異常検知に利用可能である。その温度は、車両の経路付近に設置されたレーザー計測装置を用いて測定される。そして計測されたデータに基づき、早期異常検知が行なわれる。
その際、解析用のコンピュータには、異常検知対象の装置に関する知識が組み込まれる。
しかし、知識ベースの異常検知は、十分な信頼性を保証するまでに至っていない。その際、過去に検知した異常パターンを利用できるなら、過去と似たようなケースを見落とす可能性が減って異常検知の信頼性が高まる。関連技術として、以下の文献に記述されているものが知られている。
特開平7−280603号公報は、機械の異常判定方法において、標本を用いることを開示する。
WO2008/114863は、診断装置において、診断対象の変化度パターンの類似度を計算することを開示する。
特開2008−58191号公報は、回転機械の診断方法において、標準パラメータ値との類似度を確信度として計算することを開示する。
特開2009−76056号公報は、異常値を同定する方法において、頻度異常測度を用いることを開示する。
特開2010−78467号公報は、テスト用時系列データと、参照用正常時系列データの各々について、先ず相関係数行列を作成し、graphic lassoのアルゴリズムにより、その各々の相関係数行列から、逆行列である、疎の精度行列を作成し、精度行列を用いて、テスト用時系列データと参照用正常時系列データの各々について、好適には多変量ガウスモデルによって近傍性の確率分布を記述することを開示する。
X. Zhu, Z. Ghahramani, "Semi-supervised learning using gaussian fields and harmonic functions" in ICML, 2003は、ガウス・ランダム場モデルに基づく、半教師あり学習について述べたものであり、ラベル付きデータとラベルなしデータを、重み付きグラフの頂点としてあらわすことを開示する。
A.B. Goldberg, X. Zhu, and S. Wright, "Dissimilarity in graph-based semi-supervised classification", in AISTATS, 2007は、ラベル付けされたデータとラベルなしデータの類似度と非類似度から学習する、半教師あり分類アルゴリズムを記述する。
特開平7−280603号公報 WO2008/114863 特開2008−58191号公報 特開2009−76056号公報 特開2010−78467号公報
X. Zhu, Z. Ghahramani, "Semi-supervised learning using gaussian fields and harmonic functions" in ICML, 2003 A.B. Goldberg, X. Zhu, and S. Wright, "Dissimilarity in graph-based semi-supervised classification", in AISTATS, 2007
上記従来技術は、半教師ありアルゴリズムも含めて、異常検知に適用可能な様々に技法を記述するが、過去に検知した異常パターンを利用することについては示唆するものではない。すなわち、上記従来技術にあっては、過去に検知した異常パターンを活用しようとすると、恣意的な前処理が必要であり、結局、異常検知の信頼性を十分に高められなかった。
従って、この発明の目的は、既存のラベル情報を、異常検知モデルに取り入れる解析技法を提供することにある。
この発明の他の目的は、ラベルあり標本とラベルなし標本が混在しているデータにおいて、ラベル情報を有効に活用できる異常検知技法を提供することにある。
この発明は、上記課題を解決するためになされたものであり、ラベル情報を有効活用するために、標本間に類似度を導入するというアイデアに基づく。例えば、正常ラベルあり標本は互いによく似ていて、異常ラベルあり標本とは類似性がないと想定する。
また、過去の経験から故障は滅多にないと判明している場合、ラベルなし標本は異常標本より正常標本との類似度が高いと想定し、一方、何も事前情報がない場合、双方の標本に同等に似ていると想定する。
さて、正規化した各標本は、各々の成分がセンサ値である多次元ベクトルで表現される。そこで、本発明によれば、個々のセンサ値が、潜在変数と各センサ固有の係数ベクトルの内積と観測ノイズの線形和で生成されると仮定する。但し、観測ノイズの大きさは、センサ値のラベル情報により異なるように定式化される。観測ノイズは、正常ラベル ≦ ラベルなし ≦ 異常ラベルとなるように設定される。
次に、各標本の間の類似度からグラフ・ラプラシアンが作成され、グラフ・ラプラシアンを用いて、勾配法などによって、モデル・パラメータとしての最適線形変換行列が求められる。
最適線形変換行列が得られると、例えば、本願出願人に係る特願2011−206087号明細書に記載されている技法に従い、テスト標本のセンサ各々の異常スコアが計算される。
この発明によれば、過去に検知した異常パターン及び正常パターンの標本を異常検知モデルに取り入れることによって、異常検知の基準の恣意性を減らし、より信頼性の高い異常検知を行うことが可能となる。
本発明を実施するための一例のコンピュータ・ハードウェアの構成を示すブロック図である。 本発明を実施するための機能構成を示すブロック図である。 本発明に従い、異常検知のためのモデル・パラメータを計算する処理のフローチャートを示す図である。 モデル・パラメータなどを用いて異常スコアを計算する処理のフローチャートを示す図である。
以下、図面に基づき、この発明の実施例を説明する。特に断わらない限り、同一の参照番号は、図面を通して、同一の対象を指すものとする。尚、以下で説明するのは、本発明の一実施形態であり、この発明を、この実施例で説明する内容に限定する意図はないことを理解されたい。
図1を参照すると、本発明の一実施例に係るシステム構成及び処理を実現するためのコンピュータ・ハードウェアのブロック図が示されている。図1において、システム・パス102には、CPU104と、主記憶(RAM)106と、ハードディスク・ドライブ(HDD)108と、キーボード110と、マウス112と、ディスプレイ114が接続されている。CPU104は、好適には、32ビットまたは64ビットのアーキテクチャに基づくものであり、例えば、インテル社のPentium(商標) 4、Core(商標)2 Duo、Xeon(商標)、AMD社のAthlon(商標)などを使用することができる。主記憶106は、好適には、4GB以上の容量をもつものである。ハードディスク・ドライブ108は、大量のデータを格納できるように、例えば、500GB以上の容量をもつものであることが望ましい。
ハードディスク・ドライブ108には、個々に図示しないが、オペレーティング・システムが、予め格納されている。オペレーティング・システムは、Linux(商標)、マイクロソフト社のWindows XP(商標)、Windows(商標)7、アップルコンピュータのMac OS(商標)などの、CPU104に適合する任意のものでよい。
ハードディスク・ドライブ108にはさらに、図2を参照して後で説明する、メイン・プログラム202、ラベルありデータ204、ラベルなしデータ206、パラメータ群208、グラフ・ラプラシアン計算ルーチン210、パラメータ最適化ルーチン212、及び異常検知ルーチン214が格納されている。メイン・プログラム202、グラフ・ラプラシアン計算ルーチン210、パラメータ最適化ルーチン212、及び異常検知ルーチン214は、Java(R)、C、C++、C#などの既存の任意のプログラミング言語で作成することができる。
キーボード110及びマウス112は、オペレーティング・システムまたは、ハードディスク・ドライブ108から主記憶106にロードされ、ディスプレイ114に表示された・メインプログラム202上で操作したり、文字を打ち込んだりするために使用される。
ディスプレイ114は、好適には液晶ディスプレイであり、例えば、XGA(1024×768の解像度)、またはUXGA(1600×1200の解像度)などの任意の解像度のものを使用することができる。ディスプレイ114は、図示しないが、パラメータの入力や処理を開始するための操作ウインドウや、パラメータの計算結果等を表示するために使用される。
次に、図2の機能ブロック図を参照して、本発明の処理の機能的な構成について説明する。
図2において、メイン・プログラム202は、全体の処理を統合する機能をもつプログラムであり、ユーザの操作に従い、パラメータ群208をセットしたり、グラフ・ラプラシアン計算ルーチン210、パラメータ最適化ルーチン212、及び異常検知ルーチン214を起動して計算を実行したり、結果をディスプレイ114に表示したりするために使用される。
ラベルありデータ204は、過去に検知された、異常/正常が判明しているデータを含み、異常が判明しているデータには異常のラベルが付され、正常が判明しているデータには正常のラベルが付されている。
ラベルなしデータ206は、異常とも正常とも判明していない、ラベルなしのデータを含む。以下では便宜上、ラベルありデータ204とラベルなしデータ206を一括して統一して扱うことにする。
1つのデータ(標本とも呼ぶ)は、D種のセンサ値からなるD次元の実数ベクトルであるとする。このような標本がN個あるとすると、
センサ・データの集合X = [X1,...,XN]T ∈ RN×Dとあらわすことができる。
センサ・データの集合Xは好適には、オリジナル・センサ・データの集合X' = [X'1,...,X'N]T ∈ RN×Dに基づき正規化されたデータである。正規化は次のような式に基づき行われる。ここで、Xn,dは、ベクトルXnのd番目の成分である。X'n,dも同様である。
Figure 2013257251
また、センサ・データの集合X = [X1,...,XN]T ∈ RN×Dの各々に対応して、ラベル情報Y = [Y1,...,YN]T ∈ RN×Dが与えられ、図示しないが、ラベルありデータ204及びラベルなしデータ206とともにハードディスク・ドライブ108に保存されている。
ラベル情報Yは、下記のように定義される。
Figure 2013257251

ここで、NaNは、0と1以外の任意の実数でよい。
本発明によれば、正規化された各標本Xnの各センサ値Xn,dは、潜在変数Zn ∈ RD'(D' ≦ D)と、ラベル毎のノイズの大きさの係数snormal, sanomaly, sunlabelと平均0、分散1のガウスノイズεで次のようにあらわされると仮定される。snormalは正常に対応し、sanomalyは異常に対応し、sunlabelはラベルなしに対応する。また、D'は通常はDと等しくセットするが、Dが非常に大きく、データ数Nが小さいときは、D'は100程度にセットされる。
Figure 2013257251
このとき、snormal ≦ sunlabel ≦ sanomalyと設定される。具体的な値であるが、例えば、何も知見がなけば、snormal = 1,sunlabel = 3,sanomaly = 5と設定し、ラベルなしデータがほぼ正常であるという知見があればsnormal = 1,sunlabel = 2,sanomaly = 5と設定し、ラベルなしデータがほぼ異常であるという知見があればsnormal = 1,sunlabel = 4,sanomaly = 5と設定する。
パラメータ群208は、ノイズの大きさsnormal, sanomaly, sunlabel、スケールパラメータλ、次元数D、D'などのパラメータをハードディスク・ドライブ108に保存し、これらのパラメータは、ユーザの操作により設定可能である。
パラメータ群208にはさらに、類似度行列Rを決定するための値も含まれる。すなわち、類似度行列は標本数Nx標本数Nの正方行列であり、各行と各列は各標本に対応し(例えば、 i行 j列は i番目と j番目の標本に関する類似度に対応)、正常(ラベル付き)標本と正常標本に対応する行列の要素は正数aであり、正常標本と異常標本に対応する要素は非正数bであり、正常標本とラベル無し標本に対応する要素はcであり、異常標本と異常標本に対応する要素はdであり、異常標本とラベル無し標本に対応する要素はeであり、ラベル無し標本とラベル無し標本に対応する要素はfとなる。a,b,c,d,e,fは、b≦c≦a, e≦d, d≦fという関係を満たす。
上記のa,b,dは好ましくはa=1, b=0, d=0.2と設定される。
c,e,fの設定は sunlabelなどと同様、アルゴリズム使用者が適用データのラベル無しデータに関して持っている知見に依存する。
すなわち:
何も知見がないのであれば、 例えば c=0.5,e=0.1,f=0.5,
ラベル無しデータがほぼ正常であるという知見があれば、例えば c=0.8, e=0, f= 0.8,
ラベル無しデータがほぼ異常であるという知見があれば、例えば c=0, e=0.1, f= 0.2。
図2に示すグラフ・ラプラシアン計算ルーチン210は、パラメータ群208に設定された値a,b,c,d,e,fに基づき、類似度行列Rを構成し、次にこうして構成された類似度行列Rから、次のようにしてグラフ・ラプラシアンLを計算する。
Figure 2013257251
この潜在変数Z ≡ [Z1,...,ZN]T ∈ RN×D'について、グラフ・ラプラシアンLを以って
Figure 2013257251

が成立する。X ≡ [X1,...,XN]T ∈ RN×Dの確率Pr(X|W,Z,s)は、パラメータW ≡ [W1,...,WD]T ∈ RD×D'とZとの尤度関数と見なせるので、パラメータ最適化ルーチン212は、その事後確率を最大化するように、例えば勾配法により、(W*,Z*)を求める。この処理の詳細は、図3のフローチャートを参照して、後で説明する。
こうして求められた(W*,Z*)に基づき、異常検知ルーチン214は、各変数の異常スコアを計算する。異常検知ルーチン214は好適には、本願出願人に係る特願2011−206087号明細書に記載されている技法を用いる。異常検知ルーチン214の処理は、図4のフローチャートを参照して、後で説明する。
次に図3のフローチャートを参照して、モデルパラメータ(最適線形変換行列)W*などを求める処理について説明する。
図3のステップ302において、メイン・プログラム202は、トレーニング・データ{X'∈RN×D,y}を、ラベルありデータ204及びラベルなしデータ206をハードディスク・ドライブ108から読み込むことで入力し、前述のようにこれらのデータを正規化するとともに、各列について正規化の際に計算した各列dの平均μdと標準偏差σdを記憶する。
ステップ304において、メイン・プログラム202は、パラメータD', スケールパラメータλ, snormal,sunlabel,sanomaly,a,b,c,d,e,fをパラメータ群208から読み込み、あるいは、設定画面(図示しない)によってキーボード110やマウス112を使って入力する。スケールパラメータλは例えば、0.1に設定されるが、ノイズの大きさなどを指標として、交差検定法により決定することもできる。
ステップ306において、メイン・プログラム202は、グラフ・ラプラシアン計算ルーチン210を呼び出し、ラベル情報Yとa,b,c,d,e,fを用いて、グラフ・ラプラシアンLを計算する。グラフ・ラプラシアンLの計算の詳細は、図2に関連して既に説明したので、ここでは説明を省略する。
ステップ308において、メイン・プログラム202は、W∈RD×D', Z∈N×D'を初期化する。この初期化は任意の方法でよいが、好ましくは標準正規分布、すなわち、平均が0、標準偏差が1の正規分布となるようにWとZを初期化する。
ステップ310において、メイン・プログラム202は、時刻変数tを1とセットする。
ステップ312において、メイン・プログラム202は、下記の式に従い、Wを更新する。
Figure 2013257251

ここで、Sは下記のとおりであり、
Figure 2013257251

S・(X - ZWT)という演算は、(X - ZWT)という行列のn,d要素に、Sのn,d要素を掛けることを意味する。またαは学習率であり、例えば0.1と設定される。αの値は一定でなく、繰り返し回数に応じて減少させてもよい。
ステップ314において、メイン・プログラム202は、下記の式に従い、Zを更新する。
Figure 2013257251
ここでの式は、類似度に基づくペナルティを小さくする項を有する更新式に従ってパラメータを更新するように計算を行なうものである。これは、各観測の潜在変数の類似度に基づくペナルティを小さくする項を含み、より詳細には、類似度に基づくペナルティは、類似度行列(もしくはグラフ・ラプラシアン)に基づくマハラノビス距離となるように定式化されている。そして、勾配法に従い、収束するように計算される。
なお、ステップ312とステップ314はこの順でなく、順序を入れ替えて計算してもよい。
ステップ314の後は、メイン・プログラム202は、ステップ316で、終了条件を判定する。ここでの終了条件とは例えば、前回のループで計算した行列W'と今回のループで計算した行列Wのフロベニウス・ノルム
Figure 2013257251

を計算し、これが所定の閾値、例えば0.001以内であることをもって終了条件が満たされたとする。
終了条件が満たされないなら、メイン・プログラム202は、ステップ318でtを1だけ増分して、ステップ312に戻る。
メイン・プログラム202は、終了条件が満たされると、ステップ320で、モデルパラメータW、snormal、μ= [μ1,...,μD], σ = [σ1,...,σD]を出力する。
次に図4のフローチャートを参照して、異常検出ルーチン214による異常スコア計算処理について説明する。
図4において、ステップ402では、メイン・プログラム202は、異常検出ルーチン214を呼び出して、モデルパラメータW、snormal、μ= [μ1,...,μD], σ = [σ1,...,σD]を渡す。
異常検出ルーチン214はステップ404で、テスト・データ{X'∈RN×D,y}を、ラベルありデータ204及びラベルなしデータ206をハードディスク・ドライブ108から読み込むことで入力し、μとσを用いて、X'を各列について、記述の式により正規化し、Xを得る。
異常検出ルーチン214はステップ406で、下記の式により相関異常スコア・ベクトルsn∈RDを算出する。
Figure 2013257251

但し、
Figure 2013257251

であり、ここでIは単位行列である。この、最適線形変換行列Wに基づき相関異常スコア・ベクトルを計算するアルゴリズムは、本願出願人に係る特願2011−206087号明細書に記載されているものであるので、ここでは詳述しない。
このような計算に基づき、異常検出ルーチン214は、ステップ408で、異常スコア・ベクトルs1,...,sNを出力する。s1,...,sNは各次元=各変数、すなわち各センサの異常スコアであり、高いほど異常である。
以上、列車やプラントなどの産業機械の異常検知を行なう実施例について本発明を説明したが、これには限定されず、複数の測定パラメータに基づき異常検知を行なう任意の例に適用可能であることを理解されたい。
104・・・CPU
106・・・主記憶
108・・・ハードディスク・ドライブ
204・・・ラベルありデータ
206・・・ラベルなしデータ
210・・・グラフ・ラプラシアン計算ルーチン
212・・・パラメータ最適化ルーチン
214・・・異常検知ルーチン

Claims (23)

  1. コンピュータの処理により、測定データに基づき異常検知を行なう方法であって、
    異常あるいは正常のラベルをもつ測定データと、ラベルをもたない測定データを標本として入力するステップと、
    前記標本に基づき、前記標本の間の関係を示す類似度行列を求めるステップと、
    前記類似度に基づくペナルティを定義し、前記ペナルティを小さくする項を有する更新式に従ってパラメータを計算するステップと、
    前記計算されたパラメータに基づき、異常検知の度合いを計算するステップを有する、
    方法。
  2. 前記パラメータを計算するステップの前に、前記類似度行列からグラフ・ラプラシアンを計算するステップをさらに有し、前記パラメータを計算するステップが、該計算されたグラフ・ラプラシアンを使用する、請求項1に記載の方法。
  3. 前記類似度に基づくペナルティは、類似度行列またはグラフラプラシアンに基づくマハラノビス距離である、請求項2に記載の方法。
  4. 前記類似度行列は標本数x標本数の正方行列であり、各行と各列は各標本に対応し、正常(ラベル付き)標本と正常標本に対応する行列の要素は正数aであり、正常標本と異常標本に対応する要素は非正数bであり、正常標本とラベル無し標本に対応する要素はcであり、異常標本と異常標本に対応する要素はdであり、異常標本とラベル無し標本に対応する要素はeであり、ラベル無し標本とラベル無し標本に対応する要素はfである、請求項1に記載の方法。
  5. 前記a,b,c,d,e,fは、b≦c≦a, e≦d, d≦fである、請求項4に記載の方法。
  6. ラベル無し標本が正常標本であると仮定できる場合に、cとfをaと同じもしくは近い値にし、eをbと同じもしくは近い値にする、請求項5に記載の方法。
  7. ラベル無し標本が異常標本であると仮定できる場合に、cをbと同じもしくは近い値にし、eとfをdと同じもしくは近い値にする、請求項5に記載の方法。
  8. 前記標本としての観測値が、潜在変数とパラメータの内積とノイズ項により定まるモデルを用いる、請求項1に記載の方法。
  9. 前記ノイズ項が、正常標本と異常標本とラベルなし標本でそれぞれ異なり、正常標本のノイズ項 ≦ ラベルなし標本のノイズ項 ≦ 異常標本のノイズ項である、請求項8に記載の方法。
  10. コンピュータの処理により、測定データに基づき異常検知を行なうプログラムであって、
    前記コンピュータに、
    異常あるいは正常のラベルをもつ測定データと、ラベルをもたない測定データを標本として入力するステップと、
    前記標本に基づき、前記標本の間の関係を示す類似度行列を求めるステップと、
    前記類似度に基づくペナルティを定義し、前記ペナルティを小さくする項を有する更新式に従ってパラメータを計算するステップと、
    前記計算されたパラメータに基づき、異常検知の度合いを計算するステップを実行させる、
    プログラム。
  11. 前記パラメータを計算するステップの前に、前記類似度行列からグラフ・ラプラシアンを計算するステップをさらに有し、前記パラメータを計算するステップが、該計算されたグラフ・ラプラシアンを使用する、請求項10に記載のプログラム。
  12. 前記類似度に基づくペナルティは、類似度行列またはグラフラプラシアンに基づくマハラノビス距離である、請求項11に記載のプログラム。
  13. 前記類似度行列は標本数x標本数の正方行列であり、各行と各列は各標本に対応し、正常(ラベル付き)標本と正常標本に対応する行列の要素は正数aであり、正常標本と異常標本に対応する要素は非正数bであり、正常標本とラベル無し標本に対応する要素はcであり、異常標本と異常標本に対応する要素はdであり、異常標本とラベル無し標本に対応する要素はeであり、ラベル無し標本とラベル無し標本に対応する要素はfである、請求項10に記載のプログラム。
  14. 前記a,b,c,d,e,fは、b≦c≦a, e≦d, d≦fである、請求項13に記載の方法。
  15. ラベル無し標本が正常標本であると仮定できる場合に、cとfをaと同じもしくは近い値にし、eをbと同じもしくは近い値にする、請求項14に記載のプログラム。
  16. ラベル無し標本が異常標本であると仮定できる場合に、cをbと同じもしくは近い値にし、eとfをdと同じもしくは近い値にする、請求項14に記載のプログラム。
  17. 前記標本としての観測値が、潜在変数とパラメータの内積とノイズ項により定まるモデルを用いる、請求項10に記載のプログラム。
  18. 前記ノイズ項が、正常標本と異常標本とラベルなし標本でそれぞれ異なり、正常標本のノイズ項 ≦ ラベルなし標本のノイズ項 ≦ 異常標本のノイズ項である、請求項17に記載のプログラム。
  19. コンピュータの処理により、測定データに基づき異常検知を行なうシステムであって、
    記憶手段と、
    前記記憶手段に保存された、異常あるいは正常のラベルをもつ測定データと、ラベルをもたない測定データと、
    前記標本に基づき、前記標本の間の関係を示す類似度行列を求める手段と、
    前記類似度に基づくペナルティを定義し、前記ペナルティを小さくする項を有する更新式に従ってパラメータを計算する手段と、
    前記計算されたパラメータに基づき、異常検知の度合いを計算する手段を有する、
    システム。
  20. 前記パラメータを計算するステップの前に、前記類似度行列からグラフ・ラプラシアンを計算するステップをさらに有し、前記パラメータを計算するステップが、該計算されたグラフ・ラプラシアンを使用する、請求項19に記載のシステム。
  21. 前記類似度に基づくペナルティは、類似度行列またはグラフラプラシアンに基づくマハラノビス距離である、請求項20に記載のシステム。
  22. 前記類似度行列は標本数x標本数の正方行列であり、各行と各列は各標本に対応し、正常(ラベル付き)標本と正常標本に対応する行列の要素は正数aであり、正常標本と異常標本に対応する要素は非正数bであり、正常標本とラベル無し標本に対応する要素はcであり、異常標本と異常標本に対応する要素はdであり、異常標本とラベル無し標本に対応する要素はeであり、ラベル無し標本とラベル無し標本に対応する要素はfである、請求項19に記載のシステム。
  23. 前記a,b,c,d,e,fは、b≦c≦a, e≦d, d≦fである、請求項22に記載のシステム。
JP2012134319A 2012-06-14 2012-06-14 異常検知方法、プログラム及びシステム Pending JP2013257251A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2012134319A JP2013257251A (ja) 2012-06-14 2012-06-14 異常検知方法、プログラム及びシステム
US13/916,744 US9495330B2 (en) 2012-06-14 2013-06-13 Anomaly detection method, program, and system
US15/153,090 US9824069B2 (en) 2012-06-14 2016-05-12 Anomaly detection method, program, and system
US15/152,867 US9805002B2 (en) 2012-06-14 2016-05-12 Anomaly detection method, program, and system
US15/273,301 US10133703B2 (en) 2012-06-14 2016-09-22 Anomaly detection method, program, and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012134319A JP2013257251A (ja) 2012-06-14 2012-06-14 異常検知方法、プログラム及びシステム

Publications (1)

Publication Number Publication Date
JP2013257251A true JP2013257251A (ja) 2013-12-26

Family

ID=49756669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012134319A Pending JP2013257251A (ja) 2012-06-14 2012-06-14 異常検知方法、プログラム及びシステム

Country Status (2)

Country Link
US (4) US9495330B2 (ja)
JP (1) JP2013257251A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017006792A1 (ja) * 2015-07-07 2017-01-12 三菱電機株式会社 検査方法および検査装置
US9702729B2 (en) 2014-04-30 2017-07-11 International Business Machines Corporation Sensor output change detection

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103827653B (zh) * 2011-09-21 2016-03-30 国际商业机器公司 检测异常的发生的方法、设备及计算机程序
US9509710B1 (en) 2015-11-24 2016-11-29 International Business Machines Corporation Analyzing real-time streams of time-series data
JP6243080B1 (ja) * 2017-08-03 2017-12-06 株式会社日立パワーソリューションズ プリプロセッサおよび異常予兆診断システム
US11308407B1 (en) * 2017-12-14 2022-04-19 Amazon Technologies, Inc. Anomaly detection with feedback
US12001949B2 (en) 2018-09-05 2024-06-04 Sartorius Stedim Data Analytics Ab Computer-implemented method, computer program product and system for data analysis
EP4290412A3 (en) 2018-09-05 2024-01-03 Sartorius Stedim Data Analytics AB Computer-implemented method, computer program product and system for data analysis
TWI668464B (zh) * 2018-09-10 2019-08-11 和碩聯合科技股份有限公司 移動式電子裝置的定位方法及定位系統
CN109726893A (zh) * 2018-11-27 2019-05-07 广东石油化工学院 一种旋转机械故障数据集属性权重的确定及评价方法
CN112559602B (zh) * 2021-02-21 2021-07-13 北京工业大数据创新中心有限公司 一种工业设备征兆的目标样本的确定方法及系统
CN113191616B (zh) * 2021-04-18 2023-01-24 宁波大学科学技术学院 一种基于双层相关特征分析的聚丙烯产品质量异常检测方法
CN113362313B (zh) * 2021-06-18 2024-03-15 四川启睿克科技有限公司 一种基于自监督学习的缺陷检测方法及系统
CN113850301B (zh) * 2021-09-02 2024-06-18 支付宝(杭州)信息技术有限公司 训练数据的获取方法和装置、模型训练方法和装置
CN114492517B (zh) * 2022-01-10 2022-11-25 南方科技大学 电梯检测方法、电梯检测装置、电子设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2721799B2 (ja) 1994-04-14 1998-03-04 四国電力株式会社 機械の異常判定方法
US20050283511A1 (en) * 2003-09-09 2005-12-22 Wei Fan Cross-feature analysis
JP3922375B2 (ja) * 2004-01-30 2007-05-30 インターナショナル・ビジネス・マシーンズ・コーポレーション 異常検出システム及びその方法
US7369965B2 (en) * 2004-06-28 2008-05-06 Honeywell International, Inc. System and method for turbine engine anomaly detection
JP2008058191A (ja) 2006-08-31 2008-03-13 Jfe Steel Kk 回転機械の診断方法、そのプログラム、及びその診断装置
CN102354204B (zh) 2007-03-22 2016-06-29 日本电气株式会社 诊断装置
US20090030753A1 (en) 2007-07-27 2009-01-29 General Electric Company Anomaly Aggregation method
US7483934B1 (en) * 2007-12-18 2009-01-27 International Busniess Machines Corporation Methods involving computing correlation anomaly scores
JP5186322B2 (ja) 2008-09-26 2013-04-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 時系列データ解析システム、方法及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9702729B2 (en) 2014-04-30 2017-07-11 International Business Machines Corporation Sensor output change detection
US10444032B2 (en) 2014-04-30 2019-10-15 International Business Machines Corporation Sensor output change detection
US10551212B2 (en) 2014-04-30 2020-02-04 International Business Machines Corporation Sensor output change detection
US11035693B2 (en) 2014-04-30 2021-06-15 International Business Machines Corporation Sensor output change detection
WO2017006792A1 (ja) * 2015-07-07 2017-01-12 三菱電機株式会社 検査方法および検査装置
JPWO2017006792A1 (ja) * 2015-07-07 2017-10-05 三菱電機株式会社 検査方法および検査装置

Also Published As

Publication number Publication date
US20160258747A1 (en) 2016-09-08
US9495330B2 (en) 2016-11-15
US20160258748A1 (en) 2016-09-08
US20130338965A1 (en) 2013-12-19
US10133703B2 (en) 2018-11-20
US9824069B2 (en) 2017-11-21
US20170011008A1 (en) 2017-01-12
US9805002B2 (en) 2017-10-31

Similar Documents

Publication Publication Date Title
JP2013257251A (ja) 異常検知方法、プログラム及びシステム
Wang et al. Quality-related fault detection using linear and nonlinear principal component regression
JP6594044B2 (ja) 実時系列内の異常を検出するための方法
Au Uncertainty law in ambient modal identification—Part I: Theory
US7565262B2 (en) Bayesian sensor estimation for machine condition monitoring
Mahmoud Phase I analysis of multiple linear regression profiles
Brzezinski et al. Prequential AUC for classifier evaluation and drift detection in evolving data streams
Brabec et al. On model evaluation under non-constant class imbalance
Cai et al. A new fault detection method for non-Gaussian process based on robust independent component analysis
US20180349320A1 (en) Time series data analysis device, time series data analysis method, and computer program
Joshi et al. Bayesian-EUCLID: Discovering hyperelastic material laws with uncertainties
US10754310B2 (en) Incorporating change diagnosis using probabilistic tensor regression model for improving processing of materials
Chelidze et al. Phase space warping: nonlinear time-series analysis for slowly drifting systems
Long et al. Automated structural damage detection using one-class machine learning
Rao et al. Sensor fault detection in structural health monitoring using null subspace–based approach
Liang et al. A robust multivariate EWMA control chart for detecting sparse mean shifts
Zhan et al. Improved process monitoring based on global–local manifold analysis and statistical local approach for industrial process
Ramlakhan et al. Building artificial intelligence and machine learning models: a primer for emergency physicians
US11775512B2 (en) Data analysis apparatus, method and system
Xia et al. Process monitoring based on improved recursive PCA methods by adaptive extracting principal components
Hawkins et al. QSARs for chemical mutagens from structure: ridge regression fitting and diagnostics
Kadiyala et al. Anomaly Detection Using Unsupervised Machine Learning Algorithms
Sheu et al. Monitoring the mean of autocorrelated observations with one generally weighted moving average control chart
Maleki et al. Robust hierarchical clustering for novelty identification in sensor networks: With applications to industrial systems
Tong et al. Dissimilarity-based fault diagnosis through ensemble filtering of informative variables