JP2008268182A - センサにより取得されたサンプルのストリームにおける変化を検出する方法 - Google Patents

センサにより取得されたサンプルのストリームにおける変化を検出する方法 Download PDF

Info

Publication number
JP2008268182A
JP2008268182A JP2008016533A JP2008016533A JP2008268182A JP 2008268182 A JP2008268182 A JP 2008268182A JP 2008016533 A JP2008016533 A JP 2008016533A JP 2008016533 A JP2008016533 A JP 2008016533A JP 2008268182 A JP2008268182 A JP 2008268182A
Authority
JP
Japan
Prior art keywords
samples
sample
buffer
difference
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008016533A
Other languages
English (en)
Other versions
JP5344823B2 (ja
Inventor
Daniel N Nikovski
ダニエル・エヌ・ニコヴスキ
Ankur Jain
アンカー・ジェイン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2008268182A publication Critical patent/JP2008268182A/ja
Application granted granted Critical
Publication of JP5344823B2 publication Critical patent/JP5344823B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/16Classification; Matching by matching signal segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

【課題】この発明方法は、センサによって取得されたサンプルのストリームにおける変化を検出する。
【解決手段】時間経過とともにセンサにより取得されたサンプルストリームがバッファに順次保存され、バッファが時間的に前方にスライドするサンプルのウィンドウを形成するように、バッファが満杯のとき、最も古いサンプルが捨てられて新しいサンプルが保存される。各新しいサンプルに対し、バッファは、サンプルのすべての可能な対の隣接する第1および第2サブウィンドウを含むサブウィンドウへ分割され、最新サンプルが1対のサブウィンドウの第2サブウィンドウに保存される。サンプルの各対の隣接するサブウィンドウの第1および第2サブウィンドウ間の差が求められ、最大差がメリットスコアとして割り当てられる。メリットスコアが所定の閾値より大きければ、サンプルストリームにおける変化を送信する。変化は、突然でも緩やかでもよい。
【選択図】図1A

Description

この発明は一般に、センサで機器および環境を監視する技術、特にセンサのサンプルにおける変化を検出する技術に関する。
センサデータ
これまで、センサによる機器および/または環境のリアルタイムの詳細な監視は、大規模で高価な、安全性およびミッション・クリティカルな設置に対してのみ経済的に実現可能であった。ところで、コンピュータ技術の飛躍的進歩、更に詳しく言うと、安価なセンサネットワーク、安価な無線通信、および強力な埋め込みプロセッサの到来は、電気モーター、タービン、電力開閉装置、冷暖房空調機器などの非常に安価な装置に対してばかりでなく、製油、食品加工、製品製造、大規模環境などの産業プロセスの拡大し続けている領域に対しても、器機状態監視(ECM)技術を実施することを可能にした。
その結果生じる、センサネットワークから絶えず流れているセンサデータの量の増加は、データをモニタ(監視)する仕事を課されたどんな人間の監視者をも速やかに圧倒するであろう。速やかかつ正確にセンサデータを処理するという問題への唯一の実行可能な解決策は、自動化された変化検出(ACD)方法を開発することである。そのような自動化手法は、よく訓練された人間の監視者の能力と汎用性(融通性)に達しそうにないが、自動化手法は、センサデータストリームにおける特定のイベントを探すように設計されると、まだ非常に効果的であり、かつ正確である場合がある。
これらのイベントの中で最も重要なものの1つはセンサデータにおける突然の変化である。そのような突然の変化を検出するのは、取るに足りない問題でない。その理由は、すべての、しかし、最も簡単なデータストリーム以外のすべてのデータストリームは、そのデータを生成する処理における変化が全く起こらないときでさえも、変化するからである。これは、たとえば、データがダイナミカル(動的)システムから来るときのように、処理の自然変動によって、または、測定誤差や隠れ変数などによるノイズによって、引き起こされるかもしれない。そのような場合、突然の変化の検出は統計的に行われる。すなわち、その問題は、その変化の前後に、データがサンプリングされた確率分布間の相違(差)を検出することに帰着する。製造への応用では、このタスクはしばしば統計的プロセス制御(SPC)と呼ばれる。SPCでは、その目的は、データの制御内の分布から或る他の制御しきれない分布への逸脱を検出することにある。
累積集計(CUSUM)
制御内(可能)および制御外(不可)の分布が既知のパラメトリック形式を有し、それぞれのパラメータが既知であるときには、累積集計(CUSUM)処理手順が最適であることが知られている。パージュ(Page)、「連続測検査スキーム(Continuous Inspection Schemes)」、バイオメトリカ(Biometrika)41、pp.100−114、1954、およびバッセビル他(Basseville et al.)、「突然の変化の検出:理論と応用(Detection of Abrupt Changes:Theory and Application)」、 エングルウッド クリフ、ニュージャージー:プレンティスホール(Englewood Cliffs、NJ:Prentice Hall)、1993。
ところで、制御内(可能)およびすべての制御外(不能)分布の明確なモデリングは、典型的には、困難(面倒)で高価なプロセスであり、解決困難でさえあるかもしれない。
したがって、単に、センサデータストリームを検査してそれらの確率分布に関して推論することによって、如何なる変化をも検出できる方法を提供することが望ましい。
突然の変化の検出
現時刻tでは、センササンプルストリームからのd次元データベクトルはxである。
突然の変化を検出する問題は、そのような変化が現在時刻tで起こったか、またはその前に起こったかを判別することである。この問題に対する重要な前提は、変化が永続的である、すなわち、変化が起こった後、その後のリーディング(読み、解釈)が新しい分布からくると、仮定することである。これは、変化が破壊的であるとき、すなわち装置が故障するとき、産業機器に対して典型的な状況である。
その変化の前のすべてのセンサのサンプルは、独立しており、分布p(x)からサンプリングされた、同じように分布している(i.i.d.)確率変数であると仮定される。同様に、変化の後のすべてのサンプルは分布p(x)からサンプリングされたi.i.d.変数であると仮定される。
分布p(x)およびp(x)が既知であるとき、パージュ(Page)は、その2つの分布に対して電流サンプルの対数尤度を累算して、助変数(g=S−m)に基づいて、次式に対する決定を行うCUSUM処理手順について説明している。
Figure 2008268182
所定の閾値hに対して、g>hの場合には、変化が生じたことが宣言される。
この決定は、与えられた偽陽性率に対して検出確率を最大にすることに関して最適になることを示すことができる。
ところで、CUSUM方法には、分布p(x)およびp(x)の両方をあらかじめ知っていなければならないという重大な欠点がある。産業機器の通常運転または或る環境における正常な状態に対して正確な確率分布p(x)を特定することは、典型的には、その器機を設計した、まさしく当該技術者でさえも困難であり、かつ骨が折れることである。制御不能な場合に対してすべての可能な分布p(x)を特定することは、率直に言えば、不可能であるかもしれない。その上、これらの分布に対して、正しいパラメトリック形式は利用できないかもしれない。
CUSUMのこれらの限界は、よりデータ駆動型であり、あらかじめ特定された分布に頼らない自動化された変化検出(ACD)に対する代替方法の大規模な研究に拍車をかけた。この研究の重要な方向は、ノンパラメトリック統計学を使用することである。たとえば、ランク統計、ブロドスキー他(Brodsky et al.),「変化点におけるノンパラメトリック法の問題(Nonparametric Methods in Change−Point Problems)」、クルワー(Kluwer)、1991。
機械学習
この研究の別のラインは、機械学習に基づくACD方法に焦点を合わせている。機械学習で、基本的な考えは、仮定された変化点の前後のサンプルから2つの確率分布を「学習(適合)」し、そして、しばしば情報理論的な距離尺度を使用して、2つの分布の差に対するテストをすることである。たとえば、クルバック・ライブラー・ダイバージェンス(Kullback−Leibler divergence)や、レニー・ダイバージェンス(Renyi divergence)、グーハ他(Guha et al.)、「エントロピーと情報距離のストリーミングおよびサブリニア近似(Streaming and sublinear approximation of entropy and information distances)」、SODA’06の論文集、pp.733.742、エーシーエム プレス(ACM Press)、2006など。しかしながら、そのような方法には、多くの問題点がある。
第1の問題は、複数のサンプルから2つの分布を学習することである。2つの分布がガウス形として知られているとき、2つのサブウィンドウに対するサンプル平均とバリアンス(変化)を求めることができ、そして、スチューデントのt‐統計量を使用することで2つの分布を比較できる。ゴセット(Gosset)、「平均の確率誤差(The probable error of the mean)」、バイオメトリカ(Biometrika)、1908。
さらに重要なケース(場合)は、これらの分布の2つの確率密度関数(pdfs)がガウス形でないときである。たとえば、それらの分布が幾つかの異なるモードを切り換えるシステムによりマルチモーダルであるときに、ガウシャンミックスチャモデル(ガウス形混合モデル)は、通常、マルチモーダル分布をモデル化するためには素晴らしい選択であるが、この特定の問題に対してはあまり良くない解決策である。その理由は、ガウス形混合モデルがパラメトリックであり、その適合には各パラメータの複数回の繰り返し調整が必要なためである。ヘイスティー他(Hastie et al.)、「統計的学習の要素(The Elements of Statistical Learning)」、スプリンガー(Springer)、2001。多くの可能な変化点を考えるとき、これは法外に時間がかかる。このために、そのような方法は、スピード(時間)が重視される応用には向かない。
さらに良い代替策は、パーゼンの核密度推定値(Parzen’s kernel density estimate)などのメモリベースの方法を使用することである。パーゼン(Parzen)、「確率密度関数とモードの推定に関して(On estimation of a probability density function and mode)」、Ann.Math.Stat.33、pp.1065−1076、1962、また、確率密度関数のナダラヤ・ワトソン推定(the Nadaraya−Watson estimate of a probability density function)として知られている、ヘイスティー他を参照。この方法では、確率密度p(x)は核値(kernel values)の正規化された合計として表わされる。
Figure 2008268182
ここで、wは適宜選択された核関数であり、また、x,i=1,nは、モデル化されるべき分布から得られたサンプルである。その核に対してポピュラーな選択は、ガウス分布および第2サブウィンドウ3立方(tricubic)分布である。
第2の問題は、それらの2つの分布を、それらのサンプルからの適合後に、比較することである。幾つかのポピュラーな方法は、周知のクルバック・ライブラー・ダイバージェンス(KLダイバージェンス)などの情報理論的な距離尺度を使う。
Figure 2008268182
KLダイバージェンスを使用するときの主な困難は、複数のサンプルxのドメイン全体に亘って統合(積分)する必要性である。これは、1次元のドメインでさえ時間がかかる場合があり、多変量の場合には不可能であるかもしれない。レニー(Renyi)ダイバージェス、ジェンセン・シャノン(Jensen−Shannon)距離、ブレグマン(Bregman)ダイバージェンス、およびヘリンジャー・マツシタ・バッタチャリヤ(Hellinger−Matsushita−Bhattacharya)距離などの他のポピュラーな情報理論的な距離尺度を使用しても、同様の統合(積分)に関連した困難につながる。
その結果、多くの研究は、これらの距離の近似計算に集中した。たとえば、グーハ他(Guha et al.)は、多項式時間で上記距離の大部分に対して近似計算できる幾つかの多項式時間近似方式(PTAS)について記述している。しかし、理論上の観点からは貴重であるが、同様のPTASの方法は、実用的応用においてモニタ(監視)するために使用できる実用的方法をそれほどもたらしそうにない。
機械学習に基づく他の方法は、2つのpdfが推測されるサンプルを保存するバッファの2つのサブウィンドウを使用する。そのウィンドウのサイズ(寸法)を大きくすれば、データがサンプリングされた真実のpdfへの漸近適合性(asymptotic fit)は良くなる。ところが、ウィンドウの寸法が大きいならば、新しいサンプルは非常にゆっくり変更後の分布に影響し始め、その結果、分布に実際の変化が起きる検出時間を増大させて、突然の変化を検出するのを難しくする。
この発明の実施の形態は、センササンプルのストリームにおける如何なる変化をも検出するための、矛盾に対処する方法を提供する。この発明は、可能な変化点の前後で、変化する寸法のサブウィンドウを使用する。これは、変化後の小さな寸法のサブウィンドウ、たとえば唯1つのサンプルに対して、激烈なまたは突然の変化に対する迅速な反応を可能にすると共に、より大きなウィンドウから学習された分布を使用することによって、より微妙な変化への感度の向上を可能にする。このアイデアを直接実施すると、O(N)への計算の複雑性(計算量)の増大をもたらす。しかし、この発明の実施の形態は、このような複雑さの増大を減少させる方法を効率的に実現することを提供する。
この発明の実施の形態は、多変量センササンプルストリームにおける如何なる変化をも検出するための方法を提供する。すなわち、本方法は、リアルタイムで突然の変化を検出できると共に、より長い時間帯に亘って、ゆっくり生じる変化をも検出できる。本方法は、変化の前後でデータ分布の明確なモデルを利用できないときに、適用できる。
本方法は、メモリ(記憶)バッファに保存されたサンプルのスライディングウィンドウで作動する。バッファは、最新のN個のサンプルを保存する。各新しいサンプルにより、バッファから最も古いサンプルを置き換えて削除する。本方法は、可能な変化が起こったかもしれない時間の前後の、サンプルの2つの隣接するサブウィンドウへの、バッファのすべての可能な分割を考える。サンプルの各対の隣接するサブウィンドウ間の差が求められ、最大の差がメリット(長所)スコアとして割り当てられる。そして、メリットスコアが所定の閾値より大きければ、サンプルのストリームにおける変化を送信することができる。
本方法の1つの実施の形態は、サンプルのサブウィンドウの対の間の平均ユークリッド距離を決定変数として測定する。本方法の他の実施の形態は、従来のCUSUM方法に基づいている。しかし、対照的に、従来の方法では、確率密度関数は未知であるが、本方法は、既知の分布の対数尤度推定値を使用する代わりに、パーゼン(Parzen)の核密度推定値で分布を推測する。
実施の形態1.
図1Aは、センサ102により機器および/または環境103から時間経過とともに順次取得された多変量センサデータサンプルストリーム101における如何なる変化をも検出するための方法100を示す。サンプル101はバッファ170に保存(記憶)110され、そこでは、バッファ170が時間的に前方にスライド(移動)するサンプルのウィンドウを形成するように、バッファ170が満杯のとき、最も古いサンプルが捨てられ、新しいサンプルが保存される。
次に、各新しいサンプルに対して、バッファは、可能な変化が生じたかもしれない時間171の前後のサンプルのすべての可能な対の隣接するサブウィンドウ111へ分割され120、最も新しいサンプルがその1対のサブウィンドウの第2のサブウィンドウに保存される。サンプルの各対のすべての可能な隣接するサブウィンドウ111間の差131が決定される130。最大の差はメリット(長所)スコアとして割り当てられ、そして、それは閾値化され140、またメリットスコアが所定の閾値より大きければ、変化151は送信される150。
この発明のすべての実施の形態は可変サイズを有するサンプルの複数組の近接するウィンドウで作動する。すなわち、本方法は、サイズNのサンプルのバッファ170のすべての可能なパーティション(分割)を考える。両方の方法は、そのメモリバッファのすべての可能な分割を考える計算コストを可成り減少させるのに利用できる共通の計算構造を共有する。両方の方法は、最新のセンササンプルを含むバッファΓで働き、そのバッファΓは、便宜的に、x(最も古いサンプル)からx(最も新しいサンプル)まで常に再番号付けされる。すなわち、該バッファは、時間的に前方にスライド(移動)する複数のサンプルの1つのウィンドウである。
差の処理手順130αは、変化がそのバッファにおける複数のサンプルのスパン(期間)内に起こった可能性に比例する定量的なメリットスコアΥα を決定する。特に、メリットスコアΥα は、バッファ170の2つのサブウィンドウ間の距離尺度でありうるが、これに限定されるものではない。典型的には、従来の方法は、単にそのバッファを複数のサンプルの2つの等しいサブウィンドウに分割して、これら2つの等しい部分の差に対して検定(テスト)される。対照的に、我々は、そのバッファを、単一のサンプルを保存するサブウィンドウを含む、すべての可能な対のサブウィンドウに分割する。
図に1Bに示すように、ベクトルxの形式の、サンプル101の時間的に順序づけられたウィンドウが、バッファ170に連続して(順番に)保存される。以下に述べる方法は、複数のセンササンプルxの1つのウィンドウの複数のサブウィンドウのすべての可能な対のインデックス(i、j)を考える。そこで、1≦i≦j≦Nであり、複数のサンプルx152を格納するバッファΓ170は2つの隣接するサブウィンドウγ i,j−1およびγ j,Nに分割される。
ここで、時間tは左から右へ増大し、次式が成立する。
Figure 2008268182
図2Aは、サンプル1〜Nを有するバッファ170を示す。インデックスiを有するサンプルは、その対の第1のサブウィンドウの始まり(開始)を定義し、また、インデックスjを有するサンプルは第2のサブウィンドウの第1のサンプルを定義し、また、それぞれ分割171に関連する、仮定された変化点を定義する。第1のサブウィンドウのエンド(終端)のサンプルは、インデックスj−1を有し、その1対のサブウィンドウが接近(隣接)することを保証するが、第2のサブウィンドウのエンド(終端)は常に最も新しいサンプル(x)である。
2つのサブウィンドウで保存されたサンプルの2つのサブセット(部分集合)は、それぞれ不等数のサンプルを持つことができる。1つのサブウィンドウは、単一のサンプルから構成されさえするかもしれない。したがって、複数のサンプルのサブウィンドウは一つまたは複数のサンプルを含むことができ、すなわち、1つのサブウィンドウ内のサンプルの数は範囲[1、N−1]でありうる。
差すなわちメリットスコアΥα (i,j)が、リストに載っている制約条件にしたがって、各可能な対のサブウィンドウに対して求められるならば、全体のメリットスコアは、次式に示すように、すべての分割に亘って最大である。
Figure 2008268182
次に、モデリングの問題は、何れのメリットスコアを使用すべきかを判別することである。コンピュータの問題は、各新しいサンプルxに対して計算上効率的な方法でこれを行うことである。
メモリベースのグラフ理論的な処理手順(MB−GT)
図2Bに示されるように、2の間の差200(距離)に複数のサンプルの2つのサブウィンドウ221−222の2つの分布211−212間の差200(距離)を求めるという問題に対する1つの解決策は、それらの複数のサンプル自体の間の平均距離(差)を求めることである。各サンプルは多次元のユークリッド空間におけるデータ点であるから、複数のサンプルxおよびxのサブウィンドウ間の固有距離尺度(natural distance measure)はそれらのユークリッド距離であり、次式で表される。
k,l=||x−x||.
上記のように特定されたインデックス対(i、j)により定義された特別の分割に対して、次式に示すように、複数のサンプルの2つのサブウィンドウ間の平均距離を求めることができる。
Figure 2008268182
このメモリベースのグラフ理論的な方法は、次式のように、メリットスコアを有する。
Figure 2008268182
各Cijを求めることはO(N)の複雑さ(コンプレクシティ)であり、考慮すべきO(N)個のそのような項(ターム)があり、全体の複雑さはO(N)である。この複雑さは、実際的応用のためには、容認できない。
ところで個々のCij項の判定には、計算の複雑性をO(N)まで引き下げるために利用できる或る程度の冗長度と反復的な構造がある。
ここで、我々が次式のように定義する。
Figure 2008268182
このとき、次のような再帰的な関係が成立する。
Figure 2008268182
図3に示されるように、これらの再帰(リカランス)は次のような効率的な計算プロセスを示唆する。値βi,jおよびC’i,jは概念的にマトリクスと同様のデータ構造301−302で保存される。このマトリクスは制約条件i<jによる上三角行列である。計算は、定義上は零である単一の要素C’N,Nを有する、このマトリクスの最下段の行310から始めることができる。前の行より1つ上の各行1≦i≦Nに対して、最下段から最上段に進んで行き、次の2つの工程が行なわれる。
1)すべての値βi,jが、それらの直ぐ右隣のサンプルから、右から左に進んで、次の再帰式を使用して再帰的に計算される。
Figure 2008268182
2)すべての値C’i,jが、各値βi,jおよび現在の行の直ぐ下の行の値C’i+1,jから、再帰式C’i,j=C’i+1,j+βi,jを使用して計算される。
メリットスコアΥα を求めることは、正規化を行いかつ最大値を求めるだけなので、個々の項C’i,jの計算と同時に行うことができる。このため、すべての値C’i,jおよびβi,jをバッファに保存する必要はない。値βの現在行iに対してN個のサンプルのサイズのバッファを確保し、また、C’i,jおよびC’i+1,jに対して同じサイズの2つのバッファを確保すれば充分である。したがって、この処理手順に関するメモリ要求条件はO(N)に過ぎず、また、計算の複雑さはO(N)に過ぎない。
メモリベースのCUSUM処理手順(MB−CUSUM)
図4Aに示されるように、この発明の第2の実施の形態は、本方法が或るモデリング条件の下で最適な変化の検出を実現するのを可能にする確率的な基礎を有する。サンプルの分布が未知であるので、我々は最初にパーゼンの核密度推定値、たとえば、ガウスまたは3立方(tricubic)確率分布関数で分布について学習する。図4Aでは、垂直軸が分布の確率密度、また水平軸が時間を表す。
同時に、非常に異なる理論的基盤にもかかわらず、第2の方法は実施の形態1と同様の計算構造を持っている。我々は、同様に重要な計算の複雑さの改善を実現するために、この構造を如何に活用できるかについて説明する。
CUSUMの導出に続いて、私たちはバッファ170に保存されたN個のサンプル内の可能な変化に関して以下の仮説を考える。
Figure 2008268182
ここで、我々は、最新のN−i+1のサンプルが取得されたが、何ら変化が生じないという帰無(ヌル)仮説Hi,0と、そのような変化が生じたという複数の対立仮説Hi,jについて考える。始めのインデックスiを導入することによって、我々は、テストされる仮説のセット(組)を、ウィンドウ内のN個のすべてのサンプルを必ずしも使用するわけではないものに拡大している。
本願に引用して援用するネイマン・ピアソンの補助定理(ホーエル他(Hoel et al.)、「仮説検定(Testing Hypotheses)」、統計理論への入門の第3章(Ch.3 in Introduction to Statistical Theory)、ニューヨーク(New York):ホートン・ミフリン(Houghton Mifflin),pp.56−67,1971)によれば、それぞれの特定の仮説Hi,jとHi,0を検定(テスト)するときに行うことができる最も良い検定、すなわち偽の帰無(false null)仮説を棄却する最も高い確率を有する検定は、次式で表す尤度比である。
Figure 2008268182
便宜的に、対数尤度比率Si,j=log(Λij)が一般的に使用される。我々の方法では、我々は、真のpdf(pおよびp)を、式(1)に示すように、それらの核密度推定値で置換して、次式(5)を得る。
Figure 2008268182
ここで、wl、kはその対のサンプル(x、x)対するカーネルウエイト(kernel weight)であり、また、ウエイトwl,k=w(dl,k)が成立する。最大尤度原理を使用することによって、この処理手順に対するメリットスコアは次式により表される。
Figure 2008268182
上述のように、メリットスコアの計算は、O(N)の計算複雑さを有する。しかし、このメリットスコアは、計算複雑さを減少させるのに再び利用できるこの発明の実施の形態の方法に対するメリットスコアに類似する構造を有する。
再び、図4Bに示すように、我々は、概念的にウィンドウSi,jおよびV’i,j401−402の値を三角形のデータ構造において組織化して、次式のように助変数を定義できる。
Figure 2008268182
計算すべき項はO(N)v i,jであるように見えるが、式(5)を次式のように再帰的に再公式化する。
Figure 2008268182
これにより、我々は、必ずしもすべての項が必要になるわけではないことを確信できる。さらにμ’=μ 、およびv’i,j=v i,jを定義することによって、我々は、効率的な処理手順に対する基礎として以下の式を使用できる。
Figure 2008268182
v’i,jに対する項だけが再帰的であること、すなわちμ に対する項は直接的に計算されることに注意すべきである。これらの式は以下の処理手順を示唆する。
S1:式(8)ごとに、μ’をj=1,Nに対して直接的に計算する。
この計算は複雑さO(N)を有するが、その結果をO(N)スペースに保存することができる。
S2:マトリクスSi,jの各行i=N,1に対して、最下段行410(i=N)から始めて、第1行(i=1)まで上方に移動して、以下の2つの工程を行なう。
S2.1:式(8)ごとに、i+1とNとの間のjの各値に対して、下の行の対応するv’i+1,jおよびwj,iからv’i,jを計算する。
S2.2:Nとi+1との間のjの各値に対して、式(Si,j=Si,j+1+logμ’−logv’i,j+log(j−i)−log(N−j+1)を使用して、すべてのi=1,Nに対して、Si,N+1=0から始めて、Si,jをその直ぐ右の値Si,j+1から計算する。この工程における計算は、厳密に右から左(j=N、i+1)へ進む。
図5は、さらに詳細に判別する第1のメモリベースのグラフ理論的な(MB−GT)方法に対する擬似コードを示す。図3は判別する第2のメモリベースの累積集計(MB−CUSUM)方法に対する変数を示し、また、図4は擬似コードをさらに詳細に示す。
この発明は好適な実施の形態を例に挙げて説明したが、この発明の精神および範囲内で種々の他の改変および変更を行うことができることを理解すべきである。したがって、添付クレームの目的は、この発明の真実の精神および範囲に含まれるようなすべての変形例および変更例をカバーすることである。
この発明の実施の形態1による多変量センサデータサンプルストリームにおける変化を検出するための方法のフロー図である。 この発明の実施の形態1によるセンササンプルを保存(記憶)するバッファのブロック図である。 互いに等しくない(不等の)サブウィンドウに分割された、図2のバッファのブロック図である。 この発明の実施の形態1によるサンプル値の異なる分布のブロック図である。 この発明の実施の形態1によるサンプルの差を求めるための三角形のデータ構造のブロック図である。 この発明の実施の形態1による核関数である。 この発明の実施の形態1による三角形のデータ構造のブロック図である。 この発明の実施の形態1によるセンサデータにおける突然の変化を検出するためのメモリベースのグラフ理論的な(MB−GT)方法のための擬似コードのブロック図である。 この発明の実施の形態1によるセンサデータにおける突然の変化を検出するためのメモリベースの累積集計(MB−CUSUM)方法で使用される変数のブロック図である。 メモリベースの累積集計方法で使用される擬似コードのブロック図である。

Claims (11)

  1. センサにより取得されたサンプルのストリームにおける変化を検出する方法であって、
    時間経過とともにセンサにより取得されたサンプルのストリームをバッファに順次保存する工程であって、前記バッファでは、該バッファが時間的に前方にスライドするサンプルのウィンドウを形成するように、該バッファが満杯のとき、最も古いサンプルが捨てられて、新しいサンプルが保存される工程と、
    各新しいサンプルに対して、前記バッファを、サンプルのすべての可能な対の隣接する、第1サブウィンドウおよび第2サブウィンドウを含むサブウィンドウへ分割する工程であって、最も新しいサンプルが1対のサブウィンドウの第2サブウィンドウに保存される工程と、
    サンプルの各対の隣接するサブウィンドウの第1サブウィンドウおよび第2サブウィンドウ間の差を求める工程と、
    最大の差をメリットスコアとして割り当てる工程と、
    前記メリットスコアが所定の閾値より大きければ、前記サンプルのストリームにおける変化を送信する工程と、
    を含む方法。
  2. 前記変化は時間的に突然生じる、請求項1の方法。
  3. 前記変化は時間経過とともに比較的ゆっくり生じる、請求項1の方法。
  4. 前記サンプルの分布は未知である、請求項1の方法。
  5. 前記差は、前記第1サブウィンドウと前記第2サブウィンドウにおける前記サンプルの値の間のユークリッド距離である、請求項1の方法。
  6. 前記第1サブウィンドウおよび前記第2のサブウィンドウは、不等数のサンプルを有する、請求項1の方法。
  7. 前記バッファにおけるサンプルの数がNであり、前記サブウィンドウのサンプルの数が[1、N−1]の範囲でありうる、請求項1の方法。
  8. 差判定の複雑さはO(N)であり、ここで、Nは前記バッファに保存されたサンプルの数である、請求項1の方法。
  9. 前記第1サブウィンドウおよび第2サブウィンドウのサンプルの値はそれぞれの三角マトリクスで保存され、前記差はすぐ隣同士のサンプルから再帰的に求められる、請求項1の方法。
  10. パーゼンの核推定値を使用することにより前記分布を推測する工程をさらに備える、請求項1の方法。
  11. 前記差は、前記核推定値の対数尤度の累積集計処理手順を使用して求められる、請求項10の方法。
JP2008016533A 2007-04-23 2008-01-28 センサにより取得されたサンプルのストリームにおける変化を検出する方法 Active JP5344823B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/738,562 2007-04-23
US11/738,562 US7555399B1 (en) 2007-04-23 2007-04-23 Method and system for detecting changes in sensor sample streams

Publications (2)

Publication Number Publication Date
JP2008268182A true JP2008268182A (ja) 2008-11-06
JP5344823B2 JP5344823B2 (ja) 2013-11-20

Family

ID=39535571

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008016533A Active JP5344823B2 (ja) 2007-04-23 2008-01-28 センサにより取得されたサンプルのストリームにおける変化を検出する方法

Country Status (4)

Country Link
US (1) US7555399B1 (ja)
EP (1) EP1986125B1 (ja)
JP (1) JP5344823B2 (ja)
CN (1) CN101295177B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016130906A (ja) * 2015-01-13 2016-07-21 富士ゼロックス株式会社 障害予測装置、障害予測システム、及びプログラム

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010081659A1 (en) * 2009-01-13 2010-07-22 Arieso Limited Wireless communication network
CN102087343B (zh) * 2009-12-02 2013-04-17 河南省电力公司许昌供电公司 一种快速监测到采样装置故障的方法
US8620591B2 (en) * 2010-01-14 2013-12-31 Venture Gain LLC Multivariate residual-based health index for human health monitoring
JP5988419B2 (ja) * 2012-01-11 2016-09-07 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 予測方法、予測システムおよびプログラム
EP3258333A1 (en) * 2016-06-17 2017-12-20 Siemens Aktiengesellschaft Method and system for monitoring sensor data of rotating equipment
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11467570B2 (en) * 2017-09-06 2022-10-11 Nippon Telegraph And Telephone Corporation Anomalous sound detection apparatus, anomaly model learning apparatus, anomaly detection apparatus, anomalous sound detection method, anomalous sound generation apparatus, anomalous data generation apparatus, anomalous sound generation method and program
KR101987687B1 (ko) * 2017-10-24 2019-06-11 강원대학교산학협력단 데이터 스트림 환경에서 균일신뢰도를 지원하는 가변 크기 샘플링 방법
CN109521158B (zh) * 2018-11-30 2021-06-01 安徽云汉智能科技有限公司 一种可燃气体智能传感器
CN109556649B (zh) * 2018-11-30 2020-12-22 安徽云汉智能科技有限公司 一种智能传感器的信号采集监测方法
US11526790B2 (en) 2019-09-27 2022-12-13 Oracle International Corporation Univariate anomaly detection in a sensor network
US11060885B2 (en) * 2019-09-30 2021-07-13 Oracle International Corporation Univariate anomaly detection in a sensor network
US11762956B2 (en) 2021-02-05 2023-09-19 Oracle International Corporation Adaptive pattern recognition for a sensor network

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4953386A (en) * 1988-10-11 1990-09-04 Gas Research Institute Method and apparatus for proving electronic gas meters
JPH06109498A (ja) * 1992-09-29 1994-04-19 Toshiba Corp 非定常および異常状態の検出装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7486811B2 (en) * 1996-09-16 2009-02-03 The Research Foundation Of State University Of New York System and method for performing a three-dimensional virtual examination of objects, such as internal organs
DE69917336T2 (de) * 1999-03-24 2005-05-12 Nokia Corp. System und verfahren zur bestimmung von minimum- und maximumwerten unter verwendung von letzt-ereignis- und gleitfenstertechniken
US6647343B1 (en) * 1999-04-29 2003-11-11 Agilent Technologies, Inc. Temporal profile analysis of mass data in a mass sensor system
GB0013147D0 (en) * 2000-05-31 2000-07-19 Koninkl Philips Electronics Nv Method of and receiver for estimating the bit rate of data
US7701434B2 (en) * 2005-10-31 2010-04-20 Research In Motion Limited Automatic screen and keypad brightness adjustment on a mobile handheld electronic device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4953386A (en) * 1988-10-11 1990-09-04 Gas Research Institute Method and apparatus for proving electronic gas meters
JPH06109498A (ja) * 1992-09-29 1994-04-19 Toshiba Corp 非定常および異常状態の検出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016130906A (ja) * 2015-01-13 2016-07-21 富士ゼロックス株式会社 障害予測装置、障害予測システム、及びプログラム

Also Published As

Publication number Publication date
CN101295177B (zh) 2010-08-18
EP1986125A3 (en) 2011-11-30
CN101295177A (zh) 2008-10-29
EP1986125B1 (en) 2019-01-09
JP5344823B2 (ja) 2013-11-20
EP1986125A2 (en) 2008-10-29
US7555399B1 (en) 2009-06-30
US20090177443A1 (en) 2009-07-09

Similar Documents

Publication Publication Date Title
JP5344823B2 (ja) センサにより取得されたサンプルのストリームにおける変化を検出する方法
JP7183471B2 (ja) 将来の動作の予測分類
US10452510B2 (en) Hybrid clustering-partitioning techniques that optimizes accuracy and compute cost for prognostic surveillance of sensor data
Abo-Hammour et al. A genetic algorithm approach for prediction of linear dynamical systems
US20060074828A1 (en) Methods and apparatus for detecting temporal process variation and for managing and predicting performance of automatic classifiers
US8712929B1 (en) Dynamic data filtering system and method
US20060074823A1 (en) Methods and apparatus for detecting temporal process variation and for managing and predicting performance of automatic classifiers
US11379340B2 (en) Apparatus and method for estimating anomaly information, and program
US7483934B1 (en) Methods involving computing correlation anomaly scores
KR20170127430A (ko) 센서 오차를 검출, 분류 및/또는 완화하는 방법 및 시스템
Netzer et al. Intelligent anomaly detection of machine tools based on mean shift clustering
CN112418065A (zh) 设备运行状态识别方法、装置、设备及存储介质
CN106354125A (zh) 一种利用分块pca检测化工过程故障的方法
Yang et al. Improved correlation analysis and visualization of industrial alarm data
Susto et al. Induced start dynamic sampling for wafer metrology optimization
US20060074826A1 (en) Methods and apparatus for detecting temporal process variation and for managing and predicting performance of automatic classifiers
Geng et al. Online change detection of linear regression models
CN107958089A (zh) 构建模型的方法和装置以及异常数据的检测方法和装置
Agusta et al. Unsupervised learning of correlated multivariate Gaussian mixture models using MML
US20060074827A1 (en) Methods and apparatus for detecting temporal process variation and for managing and predicting performance of automatic classifiers
Tveten et al. Online detection of sparse changes in high-dimensional data streams using tailored projections
Grundy On aspects of changepoint analysis motivated by industrial applications
Yang et al. Empirical probability density cumulative sum for incipient fault detection
Nikovski et al. Memory-based algorithms for abrupt change detection in sensor data streams
Botha Detecting change in complex process systems with phase space methods

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130813

R150 Certificate of patent or registration of utility model

Ref document number: 5344823

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250