JP6969588B2 - 異常検出装置、異常検出方法、およびコンピュータプログラム - Google Patents

異常検出装置、異常検出方法、およびコンピュータプログラム Download PDF

Info

Publication number
JP6969588B2
JP6969588B2 JP2019085117A JP2019085117A JP6969588B2 JP 6969588 B2 JP6969588 B2 JP 6969588B2 JP 2019085117 A JP2019085117 A JP 2019085117A JP 2019085117 A JP2019085117 A JP 2019085117A JP 6969588 B2 JP6969588 B2 JP 6969588B2
Authority
JP
Japan
Prior art keywords
data
variable
variable data
unit
correlation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019085117A
Other languages
English (en)
Other versions
JP2020181443A (ja
Inventor
隆道 岩田
茂年 則竹
伊弦 宮嵜
賢介 和田
孝裕 柚木
康宏 与語
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2019085117A priority Critical patent/JP6969588B2/ja
Publication of JP2020181443A publication Critical patent/JP2020181443A/ja
Application granted granted Critical
Publication of JP6969588B2 publication Critical patent/JP6969588B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • General Factory Administration (AREA)
  • Complex Calculations (AREA)

Description

本発明は、異常検出装置、異常検出方法、およびコンピュータプログラムに関する。
原系列が非定常である一方、差分系列が定常である場合には、原系列を構成する変数データ群に単位根が存在する。そして、このような単位根が存在する変数は、単位根過程と呼ばれる。単位根過程の変数に回帰分析あるいは相関係数を用いた処理を行うと、現実には存在しない変数間の関連性を反映している見せかけの相関(3個以上の変数が関係して発生する疑似相関とは異なる相関)が発生するおそれがある。そのため、このような見せかけの相関を排除するための技術が知られている(例えば、特許文献1参照)。特許文献1に記載された技術では、時系列に記録された信号値と、項目毎の項目値を所定期間後の信号値と対応付けることによって、単位根が存在する変数データ群間における見せかけの相関が排除されている。
特許文献2に記載された技術では、経時的に取得されたデータから構成される変数データ群にマハラノビス距離を用いたホテリング理論によって、成膜装置の異常が検出されている。非特許文献1に記載された技術では、ベクトル自己回帰モデル(VARモデル:vector autoregression model)に基づく予測誤差の分散分解が行われ、単位根が存在する変数データ間における見せかけの相関が排除されている。非特許文献2に記載された技術では、変数データとしての金融データに対して時系列分析が行われ、金融データ間における見せかけの相関について記載されている。
特開2015−228183号公報 特開2018−83958号公報
沖本竜義、「経済・ファイナンスデータの計量時系列分析」、朝倉書店、2010年2月1日刊行 山先 純也、他7名、"因果関係に基づく異常検知に関する考察"、2016年精密工学会春季大会、セッションID:F79、2016年3月1日発行
特許文献1、特許文献2、および非特許文献2に記載された変数データ群に含まれるデータは、過去のデータと、過去のデータに依存する現在のデータとを含んでいる。例えば、特許文献1における目的の変数データ群は、為替レートである。為替レートは、暴落直後に急騰しやすい、および、季節毎の傾向があるため、現在のデータが過去のデータに依存していると仮定できる。また、特許文献2における変数データ群は、経年劣化により変化するセンサーデータの集合である。すなわち、センサーデータは、新品の状態から徐々に劣化し、劣化に伴ってデータが少しずつ変化して異常に至るため、現在のデータが過去のデータに依存していると仮定できる。特許文献2の記載された技術では、変数データ群間の関係性に基づく方法(例えば、ホテリング理論、マハラノビス・タグチ法(MT法))を用いて成膜装置の異常検出が行われているが、見せかけの相関は排除されていない。
現在のデータが過去のデータに依存している変数データ群と異なり、製造工程の品質の異常検出に用いられる変数データ群は、現在のデータが過去のデータに依存しているとは限らない。例えば、良品の後に不良品が製造されるといった生産順序に依存した要因は考えにくい。一方で、このような変数データ群には、例えば、温度、時間、およびフィードバック回路によって高度に制御された変数などの単位根過程の一種であるランダムウォーク過程の変数が存在する。これらの変数データ群にこれらの変数に基づくデータを含んだ状態で、変数間の関係性に着目した計算処理(例えば、相関係数などの計算)を行うと、見せかけの相関が発生し、計算処理が実際の変数間の関係性を反映しないおそれがある。そのため、変数データ群間における見せかけの相関を回避した上で、現在のデータと過去のデータとの依存性を仮定しないで異常を検出する技術が求められている。
本発明は、上述した課題の少なくとも一部を解決するためになされたものであり、単位根が存在する変数データ群が存在する場合に、変数データ群間の見せかけの相関を排除した変数データ群を用いて、新たに取得されるデータの異常検出の精度を向上させることを目的とする。
本発明は、上述の課題を少なくとも一部を解決するためになされたものであり、以下の形態として実現することが可能である。異常検出装置であって、所定の変数についての複数のデータの集合である変数データ群であって、複数の前記変数についての前記変数データ群を含むデータセットを取得するデータ取得部と、複数の前記変数データ群間における相関係数を算出するデータ処理部と、前記相関係数を用いて、新たに取得された前記変数に依存するデータの異常判定を行う判定部と、を備え、前記データ処理部は、複数の前記変数データ群の内の少なくとも1つに単位根が存在する場合に、前記相関係数の算出に先立ち、少なくとも単位根が存在する前記変数データ群に対して前処理を行い、複数の前記変数データ群間における前記相関係数を算出するために相関係数行列または分散共分散行列を用いる、異常検出装置。そのほか、本発明は、以下の形態としても実現可能である。
(1)本発明の一形態によれば、異常検出装置が提供される。この異常検出装置は、所定の変数についての複数のデータの集合である変数データ群であって、複数の前記変数についての前記変数データ群を含むデータセットを取得するデータ取得部と、複数の前記変数データ群間における相関係数を算出するデータ処理部と、前記相関係数を用いて、新たに取得された前記変数に依存するデータの異常判定を行う判定部と、を備え、前記データ処理部は、複数の前記変数データ群の内の少なくとも1つに単位根が存在する場合に、前記相関係数の算出に先立ち、少なくとも単位根が存在する前記変数データ群に対して前処理を行う。
この構成によれば、複数の変数データ群の内の少なくとも1つに単位根が存在すると、少なくとも単位根が存在する変数データ群に対して前処理が行われた後に、複数の変数データ群間における相関係数が算出される。そのため、少なくとも単位根が存在する変数データ群に前処理を行うことにより、変数データ群間の見せかけの相関が排除される。現在のデータと、過去のデータとの依存性を仮定しないシステム(例えば、製造工程の品質チェック)に、この前処理に基づく変数変換処理が組み込まれることにより、新たに取得された変数に依存するデータの異常検出精度が向上する。
(2)上記形態の異常検出装置において、前記変数データ群には、前記変数について経時的に取得された複数のデータが含まれていてもよい。
この構成によれば、現在のデータと、過去のデータとの依存性を仮定しない経時的に取得されたデータの異常を検出できる。
(3)上記形態の異常検出装置において、前記データ処理部は、前記前処理として、単位根が存在する前記変数データ群における経時的に取得された複数のデータの各階差を算出し、算出された階差のデータの集合である処理後変数データ群を用いて相関係数を算出してもよい。
この構成によれば、階差のデータの集合から相関係数が算出されるため、経時的に取得された変数のデータに発生する見せかけの相関を排除できる。
(4)上記形態の異常検出装置において、さらに、複数の前記変数データ群のそれぞれに対して単位根の存在を推定する推定部を備えていてもよい。
この構成によれば、単位根が存在する変数データ群が特定され、変数データ群間における見せかけの相関を排除できる。
(5)上記形態の異常検出装置において、前記データ処理部は、前記推定部により少なくとも1つの前記変数データ群に単位根が存在すると推定された場合に、全ての複数の変数データ群のそれぞれに対して前記前処理を行ってもよい。
この構成によれば、複数の変数データ群の内に1つでも単位根が存在する場合に全ての変数データ群に前処理を行うため、算出される相関係数の精度が向上する。これにより、異常検出の精度が向上する。
(6)上記形態の異常検出装置において、前記推定部は、複数の前記変数データ群のそれぞれに対して、単位根検定を用いて単位根の存在を推定してもよい。
この構成によれば、単位根が存在する変数データ群を特定でき、変数データ群間における見せかけの相関が排除される。
(7)上記形態の異常検出装置において、前記データ処理部は、複数の前記変数データ群間における前記相関係数を算出するために相関係数行列または分散共分散行列を用いてもよい。
(8)上記形態の異常検出装置において、前記判定部は、ホテリング理論、マハラノビス・タグチ法(MT法)、カルバックライブラーダイバージェンス、マハラノビス距離、へリンジャー距離、決定木、ランダムフォレスト、およびXgboostの少なくとも1つを用いてデータの異常判定を行ってもよい。
なお、本発明は、種々の態様で実現することが可能であり、例えば、異常検出装置、データ処理装置、データ分析装置、異常検出方法、データ処理方法、データ分析方法、これら装置や方法を実行するためのコンピュータプログラム、このコンピュータプログラムを配布するためのサーバ装置、およびコンピュータプログラムを記憶した一時的でない記憶媒体等の形態で実現することができる。
本発明の一実施形態としての異常検出装置のブロック図である。 データセットの一部を示す概略図である。 変数データ群を用いた学習のフローチャートである。 学習フローによって算出された各データ群間の相関係数行列および散布図の一例を表す概略図である。 異常度についてのグラフである。 変数に依存する新たに取得されたデータの異常検出を行うフローチャートである。 比較例における各データ群間の相対係数行列および散布図の一例を表す概略図である。 実施例および比較例の異常度の平均値を表すグラフである。 変形例における異常検出方法を示すフローチャートである。
<実施形態>
図1は、本発明の一実施形態としての異常検出装置1のブロック図である。異常検出装置1は、所定の変数についての複数のデータの集合である変数データ群を含むデータセットを取得し、取得した複数の変数データ群間における相関係数を用いて、新たに取得した判定対象のデータについての異常判定を行う装置である。図1に示されるように、異常検出装置1は、CPU(Central Processing Unit)10と、ROM(Read Only Memory)20と、RAM(Random Access Memory)30と、記憶部40とを備えている。CPU10は、ROM20に格納されているコンピュータプログラムをRAM30に展開して実行することにより、取得部(データ取得部)11、処理部(データ処理部)12、判定部13、および推定部14として機能する。
記憶部40は、ハードディスクドライブ(HDD:Hard Disk Drive)などで構成されている。図1に示されるように、記憶部40は、複数の変数データ群を含むデータセット41と、判定対象のデータの異常判定時に用いられる閾値を含む閾値データ42とを記憶している。
図2は、データセット41の一部を示す概略図である。図2には、データセット41として、変数X1,X2,X3,およびX4のそれぞれについての複数の各データx1 1,x1 2などが表で示されている。また、図2には、変数X1〜X4のそれぞれについての各変数データ群CX1〜CX4は、太線によって囲われて示されている。例えば、変数X1についての時系列に沿った変数データ群CX1は、データx1 1,x1 2,x1 3,およびx1 4などから構成されている。時系列t1のときに取得されたデータは、データx1 1,x2 1,x3 1,およびx4 1などである。
図1に示される取得部11は、記憶部40に記憶されたデータセット41を取得する。推定部14は、データセット41に含まれる複数の変数データ群CX1〜CX4のそれぞれに対して、KPSS検定を用いることによって単位根の存在を推定する。処理部12は、取得したデータセット41に含まれる複数の変数データ群CX1〜CX4間における相関係数を算出する。本実施形態の処理部12は、相関係数として、複数の変数データ群CX1〜CX4間における相関係数行列を用いて算出する。また、処理部12は、推定部14により単位根の存在が推定された変数データ群に対して、相関係数の算出に先立ち、当該変数データ群CX1〜CX4に前処理を行う。処理部12は、前処理として、指定部14により少なくとも1つの変数データ群に単位根が存在すると推定された場合に、データセット41に含まれる全ての変数データ群CX1〜CX4における経時的なデータの階差を算出する。処理部12は、算出された階差のデータの集合である処理後変数データ群CX1’〜CX4’を用いて相関係数を算出する。
判定部13は、処理部12によって算出された相関係数行列を用いて、変数(例えば、変数X1)に依存する新たに取得したデータの異常判定を行う。判定部13は、算出された相関係数行列を用いて所定の閾値を設定する。設定された閾値は、記憶部40に閾値データ42として記憶される。本実施形態では、判定部13が、算出された相関係数に対して、下記式(1)に示されるマハラノビス・タグチ法(MT法)を用いることにより、各変数データ群に含まれる各データの異常度を算出する。
a(x’)=(x’−μ)TΣ-1(X’−μ)/M・・・(1)
x’:異常度の判定対象であるデータ
μ:変数データ群の標本平均
Σ:変数データ群の分散共分散行列
判定部13は、MT法により算出された異常度を用いて、異常検出時に用いる閾値を決定する。判定部13は、判定対象のデータx’と、閾値とを比較することによって、データx’が異常であるか否かを判定する。具体的には、データx’が閾値以上の場合に異常であると判定され、データx’が閾値未満の場合に正常であると判定される。なお、データx’は、異常検出時において新たに取得されたデータとも換言できる。
ここで、本実施形態では、複数の変数データ群CX1〜CX4の一例として、4つの変数X1,X2,X3,X4についての複数のデータ(各1000個)を学習データとして下記のように定義し、異常判定に用いられる閾値が設定される。
1についてのデータx1 t+1=x1 t+ε1,ε1〜N(0,1)
2についてのデータx2 t+1=x2 t+ε2,ε2〜N(0,1)
3についてのデータx3 t=ε3,ε3〜N(0,1)
4についてのデータx4 t=scale(X3 t+ε4),ε4〜N(0,1)
ε1,ε2,ε3,ε4:平均0,分散1の正規分布からランダムに得られた値(各変数のデータを生成するために用いる正規分布は全て独立)
以上の定義から、変数X1,X2についての各データx1 t,x2 tは、平均0,分散1の正規分布からランダムに得られた累積和である。変数X3についての各データx3 tは、平均0,分散1の正規分布からランダムに得られた値である。変数X4についての各データx4 tは、変数X3と、平均0,分散1の正規分布からランダムに得られた値の和とを標準化した値である。
変数X1,X2についてのデータx1 t、x2 tのそれぞれは、定義からランダムウォークするデータの集まりである。すなわち、変数X1,X2についてのそれぞれの変数データ群CX1,CX2は、単位根を持つ。そのため、変数データ群CX1,CX2間には、見せかけの相関が発生する。一方で、変数X4は、変数X3を用いて生成されているため、変数X3と変数X4とには依存関係がある(すなわち相関がある)。
図3は、変数データ群CX1〜CX4を用いた学習のフローチャートである。図3に示される学習のフローチャート(以下、単に「学習フロー」とも呼ぶ)では、変数データ群CX1〜CX4のそれぞれを用いて、判定対象のデータの異常判定を行うための閾値が設定される。学習フローでは、初めに、処理部12が、記憶部40からデータセット41を取得する(ステップS1)。処理部12は、データセット41に含まれる変数データ群CX1〜CX4の内、データの外れ値および欠損値を処理する(ステップS2)。処理部12は、外れ値および欠損値の処理として、平均値の代入など周知の方法を用いればよい。
次に、推定部14は、変数データ群CX1〜CX4の内のいずれかに単位根が存在するか否かを、KPSS検定を用いて判定する(ステップS3)。上記で定義した変数X1のKPSS検定の統計量は8.37であり、変数X2のKPSS検定の統計量は2.41であった。この2つの統計量は、有意水準5パーセント(%)の棄却点である0.463よりも大きいため、推定部14は、変数データ群CX1,CX2のそれぞれに単位根が存在すると推定する。一方で、変数X3および変数X4のKPSS検定の統計量は、0.1583である。変数X3,X4の統計量は、有意水準5%の棄却点である0.463よりも小さいため、推定部14は、変数データ群CX3,CX4のそれぞれに単位根が存在しないと判定する。変数データ群CX1〜CX4の内の変数データ群CX1,CX2に単位根が存在するため、次のステップS5の処理が行われる。なお、変数データ群CX1〜CX4の内のいずれにも単位根が存在しないと判定されると、後述のステップS6の処理が実行される。
ステップS4の処理において、変数データ群CX1〜CX4の内の変数データ群CX1,CX2に単位根が存在すると判定されると(ステップS4:YES)、処理部12は、全ての変数データ群CX1〜CX4における経時的な各データの階差を取った処理後変数データ群CX1’〜CX4’を算出する(ステップS5)。処理後変数データ群CX1’〜CX4’のそれぞれは、下記式(2)〜(5)で定義される各データを含んでいる。
1 t’=x1 t+1−x1 t・・・(2)
2 t’=x2 t+1−x2 t・・・(3)
3 t’=x3 t+1−x3 t・・・(4)
4 t’=x4 t+1−x4 t・・・(5)
次に、処理部12は、処理後変数データ群CX1’〜CX4’のそれぞれの相関係数行列を算出する(ステップS6)。図4は、学習フローによって算出された各データ群CX1’〜CX4’間の相関係数行列および散布図の一例を表す概略図である。図4には、左下に散布図が示され、右上に相関係数が示されている。また、散布図の中には、相関係数を表す実線が示されている。図4に示されるように、単位根が存在する処理後変数データ群CX1’,CX2’間における相関係数は、0.01である。一方で、変数データ群CX3’,CX4’間における相関係数は、0.70である。すなわち、変数X1と変数X2との相関はなく、変数X3と変数X4との相関があり、上記の定義に沿った相関結果が得られた。なお、相関係数行列は、標本分散共分散行列を標準化した行列であるため、これらの行列は同じ指標と考えてよい。
図3のステップS6の処理が行われると、判定部13は、処理後変数データ群CX1’〜CX4’のそれぞれに対してマハラビノス・タグチ法を用いて異常度を算出する(ステップS7)。図5は、異常度についてのグラフである。図5には、処理後変数データ群CX1’〜CX4’に含まれる全データから算出された異常度が示されている。図5のグラフの横軸は、時系列に沿って各データに付したデータ番号である。図3のステップS7の処理が行われると、判定部13は、判定対象のデータの異常判定を行うための閾値を設定し(ステップS8)、学習フローが終了する。
図5に示される例では、例えば、異常度の閾値を4に設定すると、1000個のデータの内の4個が異常として判定される。一方で、異常度の閾値を6に設定すると、学習データとしての1000個のデータから異常と判定されるデータは存在しなくなる。本実施形態では、設定された閾値が4の場合について説明する。なお、閾値の設定については、用途に応じて自由に設定されてよい。また、閾値の設定方法は、ユーザ入力による設定であってもよいし、異常度の分布から周知の方法による設定であってもよい。
図6は、変数X1〜X4に依存する判定対象のデータの異常検出を行うフローチャートである。図6に示された異常検出のフローチャート(以下、単に「検出フロー」とも呼ぶ)では、異常検出装置1が学習フローで設定された閾値を用いて、判定対象のデータが異常であるか否かを判定する。なお、検出フローでは、判定対象のデータの一例として、変数X1〜X4のそれぞれに依存する新たなデータx1’〜x4’を用いて説明する。検出フローでは、初めに、取得部11が、変数X1〜X4のそれぞれに依存する判定対象の各データx1’〜x4’を取得する(ステップS11)。データx1’〜x4’の取得先は、記憶部40に記憶されたデータから取得してもよいし、異常検出装置1と異なる他の装置から入力されてもよい。ステップS11の処理が行われると、ステップS12,S13の処理が行われる。なお、ステップS12,S13の処理は、図3のステップS5,S6の処理と同じであるため、ステップS12,S13の説明を省略する。
ステップS12,S13の処理が行われると、判定部13は、判定対象のデータx1’〜x4’が依存している変数X1〜X4の変数データ群CX1’〜CX4’の異常度を用いて、データx1’〜x4’の異常度を算出する(ステップS14)。判定部13は、算出されたデータx1’〜x4’の異常度が、学習フローによって変数データ群CX1’〜CX4’の異常度によって設定された閾値以上であるか否かを判定する(ステップS15)。算出されたデータx1’〜x4’の異常度が閾値以上である場合には(ステップS15:YES)、判定部13は、データx1’〜x4’を異常なデータとして検出する(ステップS16)。判定部13は、異常を検出した場合には、図1に図示されていないモニタに異常検出の画像を表示させ、図1に図示されていないスピーカーに警告音を発生させる。
ここで、変数X1〜X4のそれぞれに依存する判定対象のデータとして、下記関係式(6)に示されるデータが入力された場合の異常度は、9.8×10-5となる。変数X1〜X4の各データの平均値は0に近いため、当該異常度は正常値と判定される。
(x1’,x2’,x3’,x4’)=(0,0,0,0)・・・(6)
別の判定対象のデータとして、下記関係式(7)に示されるデータが入力された場合の異常度は、1.3となる。この異常度は、関係式(6)から算出された異常度よりも大きくなるものの、設定された閾値の4未満であるため、正常値の範囲内である。
(x1’,x2’,x3’,x4’)=(1,−1,1,−1)・・・(7)
別の判定対象のデータとして、下記関係式(8)に示されるデータが入力された場合の異常度は、22.9となる。X4’=10は、変数データ群CX4の分布から外れているため、異常として検出される。
(x1’,x2’,x3’,x4’)=(1,−1,1,10)・・・(8)
なお、製造工程の異常検出で本検出フローを用いる場合には、1回の異常検出により工程異常と判断されてもよいし、数回の異常検出により工程異常と判断されてもよい。
ステップS15の処理において算出されたデータx1’〜x4’の異常度が閾値未満である場合(ステップS15:NO)、または、ステップS16の処理後の場合には、判定部13は、検出フローを終了するか否かを判定する(ステップS17)。例えば、取得部11により更なる判定対象のデータが取得されない場合には(ステップS17:YES)、判定部13は検出フローを終了させる。一方で、検出フローを続ける場合には(ステップS17:NO)、ステップS11以降の処理を実行する。
図7は、比較例における各データ群間CX1〜CX4の相対係数行列および散布図の一例を表す概略図である。図7に示される相関係数行列および散布図は、本実施形態で定義されたX1〜X4についての複数の変数データ群CX1〜CX4に対して、階差の処理後変数データCX1’〜CX4’を算出せずに、算出された結果である。そのため、比較例では、本実施形態に基づく実施例(図3)と比較すると、変数データ群CX1と変数データ群CX2とにおける相関係数および散布図が大きく異なっている。比較例では、変数X1と変数X2との相関係数が0.52と算出されている。そのため、変数データ群CX1,CX2間に、見せかけの相関としての相関関係が存在している。すなわち、実施例では、見せかけの相関が排除され、比較例では、見せかけの相関が排除されていない。
図8は、実施例および比較例の異常度の平均値を表すグラフである。図8に示されるグラフに用いられた判定対象としてのテストデータは、学習データで用いた変数X1,X2,X3,X4についての複数のデータ(各1000個)と同じ方法で生成されたデータである。本実施例の学習データと同じように算出されたテストデータの異常度は、図8に示されるように、0.98となり、学習データの異常度の平均値である1に近い値となった。一方で、見せかけの相関を排除していない比較例で算出されたテストデータの異常度は、図8に示されるように、2.39となり、異常な傾向があると誤判断されている。すなわち、比較例では、判定対象のデータを過度に異常として検出してしまう。
以上説明したように、本実施形態の異常検出装置1では、処理部12は、変数X1,X2,X3,X4の変数データ群CX1〜CX4の内の変数データ群CX1,CX2に単位根が存在する場合に、変数データ群CX1〜CX4間の相関係数の算出に先立ち、変数データ群CX1〜CX4に前処理を行う。判定部13は、前処理後の処理後変数データ群CX1’〜CX4’の相関係数を用いて、変数X1,X2,X3,X4に依存する判定対象のデータx1’〜x4’の異常判定を行う。そのため、本実施形態の異常検出装置1は、変数データ群CX1,CX2に単位根が存在する場合に、前処理を行うことにより、変数データ群CX1,CX2間の見せかけの相関を排除できる。現在のデータと、過去のデータとの依存性を仮定しないシステム(例えば、製造工程の品質チェック)に、この前処理に基づく変数変換処理が組み込まれることにより、新たにこれらのシステムから取得される変数X1,X2に依存するデータの異常検出精度が向上する。
また、本実施形態の変数データ群CX1〜CX4には、変数データ群CX1〜CX4について経時的に取得された複数のデータが含まれている。そのため、本実施形態の異常検出装置1を、現在のデータと、過去のデータとの依存性を仮定しないシステムの異常検出に用いることができる。
また、本実施形態の処理部12は、単位根が存在する変数データ群CX1,CX2に行う前処理として、経時的に取得された複数のデータを算出し、算出された階差のデータの集合である処理後変数データ群CX1’〜CX4’を用いて相関係数を算出する。そのため、経時的に取得されたデータに発生する見せかけの相関を排除できる。
また、本実施形態の異常検出装置1では、推定部14が、変数データ群CX1〜CX4のそれぞれに対して、単位根検定を用いて単位根の存在を推定する。そのため、本実施形態の異常検出装置1は、単位根が存在する変数データ群CX1,CX2を特定でき、変数データ群CX1,CX2間における見せかけの相関を排除できる。
また、本実施形態の処理部12は、変数データ群CX1〜CX4の内に1つでも単位根が存在する場合に、全ての変数データ群に対して処理後変数データ群CX1’〜CX4’を算出する。そのため、処理後変数データ群CX1’〜CX4’を用いて算出される相関係数の精度が向上する。その結果、判定部13による異常判定の精度が向上する。
<本実施形態の変形例>
本発明は上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。
[変形例1]
上記実施形態の異常検出装置1の構成および異常検出装置1が行う制御については、一例であり、種々変形可能である。異常検出装置1のCPU10は、取得部11、処理部12、および判定部13として機能していればよく、推定部14として機能していなくてもよい。取得部11が取得する変数データ群CX1〜Cx4は、記憶部40の代わりに他の装置から取得されてもよい。閾値データ42は、記憶部40に記憶されておらず、判定部13が異常検出を行う度に算出してもよいし、その他の記憶装置に記憶されていてもよい。判定対象のデータx1’〜x4’の異常が検出された場合に、モニタの画像表示およびスピーカーの警告音出力以外の態様によって、異常検出が報知されてもよい。
上記実施形態では、処理部12は、相関係数を算出するために相関係数行列を用いたが、その他の算出方法(例えば、分散共分散行列)が用いられてもよい。判定部13は、MT法により変数X1〜X4の異常度が算出されたが、その他の方法によって異常度を算出してもよい。判定部13は、例えば、ホテリング理論、カルバックライブラーダイバージェンス、マハラノビス距離、へリンジャー距離、決定木、ランダムフォレスト、およびXgboostを用いて、異常度を算出してもよい。処理部12は、検出フローによって異常判定が行われた判定対象のデータx1’〜x4’を学習データに追加して、学習データの積み上げを行ってもよい。
上記実施形態では、処理部12は、変数データ群CX1,CX2に単位根が存在する場合に、前処理としての全ての変数データ群CX1〜Cx4に対して階差の処理後変数データ群CX1’〜CX4’を算出したが、単位根が存在しない変数データ群CX3,CX4に対して階差の処理後変数データ群CX3’,CX4’を算出しなくてもよい。変形例の処理部12は、推定部14により少なくとも1つの変数データ群に単位根が存在すると推定された場合に、データセット41に含まれる変数データ群の内の少なくとも単位根が存在する変数データ群に対して、処理後変数データ群を算出する前処理を行う。すなわち、変形例の処理部12は、データセット41に含まれるいずれかの変数データ群に単位根が存在する場合には、前処理を行った複数の処理後変数データ群と、単位根が存在しない変数データ群とにおける相関係数行列を算出する。
[変形例2]
図9は、変形例における異常検出方法を示すフローチャートである。上記実施形態では、異常検出装置1は、判定対象のデータの異常判定を行うために、学習フロー(図3)と、検出フロー(図6)とを個別に実施していたが、図9に示されるフローによって判定対象のデータの異常を検出してもよい。変形例の異常検出方法では、初めに、取得部11がデータセット41を取得するデータ取得工程を実施する(ステップS21)。処理部12は、データセット41に含まれる変数X1〜X4に依存する変数データ群CX1〜CX4間における相関係数を算出するデータ処理工程を実施する(ステップS22)。データ処理工程では、処理部12は、変数データ群CX1〜CX4の内の少なくとも1つに単位根が存在する場合に、全ての変数データ群CX1〜CX4に、相関係数を算出する前に例えば階差の算出などの前処理を行う。なお、前処理は階差の算出でなくてもよいし、前処理を行われる変数データ群は、少なくとも単位根が存在する変数データ群CX1,CX2であってもよい。データ処理工程後に、判定部13は、算出された相関係数を用いて、新たに取得された変数X1〜X4に依存するデータの異常判定を行う判定工程を実施し(ステップS23)、異常検出方法が終了する。
以上、実施形態、変形例に基づき本態様について説明してきたが、上記した態様の実施の形態は、本態様の理解を容易にするためのものであり、本態様を限定するものではない。本態様は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本態様にはその等価物が含まれる。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することができる。
1…異常検出装置
10…CPU
11…取得部(データ取得部)
12…処理部(データ処理部)
13…判定部
14…推定部
20…ROM
30…RAM
40…記憶部
41…データセット
42…閾値データ
CX1〜CX4…変数データ群
CX1’〜CX4’…処理後変数データ群
1〜X4…変数
1 1,x2 1,x3 1,x4 1,x1 t,x2 t…データ
x’,x1’〜x4’…判定対象のデータ(新たに取得されたデータ)

Claims (9)

  1. 異常検出装置であって、
    所定の変数についての複数のデータの集合である変数データ群であって、複数の前記変数についての前記変数データ群を含むデータセットを取得するデータ取得部と、
    複数の前記変数データ群間における相関係数を算出するデータ処理部と、
    前記相関係数を用いて、新たに取得された前記変数に依存するデータの異常判定を行う判定部と、を備え、
    前記データ処理部は
    数の前記変数データ群の内の少なくとも1つに単位根が存在する場合に、前記相関係数の算出に先立ち、少なくとも単位根が存在する前記変数データ群に対して前処理を行
    複数の前記変数データ群間における前記相関係数を算出するために相関係数行列または分散共分散行列を用いる、異常検出装置。
    異常検出装置。
  2. 請求項1に記載の異常検出装置であって、
    前記変数データ群には、前記変数について経時的に取得された複数のデータが含まれる、異常検出装置。
  3. 請求項2に記載の異常検出装置であって、
    前記データ処理部は、前記前処理として、単位根が存在する前記変数データ群における経時的に取得された複数のデータの各階差を算出し、算出された階差のデータの集合である処理後変数データ群を用いて相関係数を算出する、異常検出装置。
  4. 請求項1から請求項3までのいずれか一項に記載の異常検出装置であって、さらに、
    複数の前記変数データ群のそれぞれに対して単位根の存在を推定する推定部を備える、異常検出装置。
  5. 請求項4に記載の異常検出装置であって、
    前記データ処理部は、前記推定部により少なくとも1つの前記変数データ群に単位根が存在すると推定された場合に、全ての複数の変数データ群のそれぞれに対して前記前処理を行う、異常検出装置。
  6. 請求項4または請求項5に記載の異常検出装置であって、
    前記推定部は、複数の前記変数データ群のそれぞれに対して、単位根検定を 用いて単位根の存在を推定する、異常検出装置。
  7. 請求項1から請求項6までのいずれか一項に記載の異常検出装置であって、
    前記判定部は、ホテリング理論、マハラノビス・タグチ法(MT法)、カルバックライブラーダイバージェンス、マハラノビス距離、へリンジャー距離、決定木、ランダムフォレスト、およびXgboostの少なくとも1つを用いてデータの異常判定を行う、異常検出装置。
  8. 異常検出方法であって、
    所定の変数についての複数のデータの集合である変数データ群であって、複数の前記変数についての前記変数データ群を含むデータセットを取得するデータ取得工程と、
    複数の前記変数データ群間における相関係数を算出するデータ処理工程と、
    前記相関係数を用いて、新たに取得された前記変数に依存するデータの異常判定を行う判定工程と、を備え、
    前記データ処理工程では
    数の前記変数データ群の内の少なくとも1つに単位根が存在する場合に、前記相関係数の算出に先立ち、少なくとも単位根が存在する前記変数データ群に対して前処理を行
    複数の前記変数データ群間における前記相関係数を算出するために相関係数行列または分散共分散行列を用いる、異常検出方法。
  9. コンピュータプログラムであって、
    所定の変数についての複数のデータの集合である変数データ群であって、複数の前記変数についての前記変数データ群を含むデータセットを取得するデータ取得機能と、
    複数の前記変数データ群間における相関係数を算出するデータ処理機能と、
    前記相関係数を用いて、新たに取得された前記変数に依存するデータの異常判定を行う判定機能と、をコンピュータに実現させ、
    前記データ処理機能は
    数の前記変数データ群の内の少なくとも1つに単位根が存在する場合に、前記相関係数の算出に先立ち、少なくとも単位根が存在する前記変数データ群に対して前処理を行
    複数の前記変数データ群間における前記相関係数を算出するために相関係数行列または分散共分散行列を用いる、コンピュータプログラム。
JP2019085117A 2019-04-26 2019-04-26 異常検出装置、異常検出方法、およびコンピュータプログラム Active JP6969588B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019085117A JP6969588B2 (ja) 2019-04-26 2019-04-26 異常検出装置、異常検出方法、およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019085117A JP6969588B2 (ja) 2019-04-26 2019-04-26 異常検出装置、異常検出方法、およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2020181443A JP2020181443A (ja) 2020-11-05
JP6969588B2 true JP6969588B2 (ja) 2021-11-24

Family

ID=73024589

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019085117A Active JP6969588B2 (ja) 2019-04-26 2019-04-26 異常検出装置、異常検出方法、およびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6969588B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127542B (zh) * 2021-05-06 2023-06-16 郑州航空工业管理学院 一种数据异常分析方法和装置
CN116107847B (zh) * 2023-04-13 2023-06-27 平安科技(深圳)有限公司 多元时间序列数据异常检测方法、装置、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6115607B2 (ja) * 2015-09-24 2017-04-19 株式会社Ihi 異常診断装置、異常診断方法及び異常診断プログラム
JP6627639B2 (ja) * 2016-04-28 2020-01-08 株式会社明電舎 異常診断装置および異常診断方法

Also Published As

Publication number Publication date
JP2020181443A (ja) 2020-11-05

Similar Documents

Publication Publication Date Title
US10496515B2 (en) Abnormality detection apparatus, abnormality detection method, and non-transitory computer readable medium
CN107086944B (zh) 一种异常检测方法和装置
US11264121B2 (en) Real-time industrial plant production prediction and operation optimization
JP3495705B2 (ja) センサおよびプロセスの超高感度監視
KR102052217B1 (ko) 동적 특이치 바이어스 감소 시스템 및 방법
CN110874674B (zh) 一种异常检测方法、装置及设备
Kaminskyi et al. Recovery Gaps in Experimental Data.
CN113518011B (zh) 异常检测方法和装置、电子设备及计算机可读存储介质
JP6969588B2 (ja) 異常検出装置、異常検出方法、およびコンピュータプログラム
US20180121275A1 (en) Method and apparatus for detecting and managing faults
US20160321128A1 (en) Operations management system, operations management method and program thereof
CN110909306B (zh) 业务异常检测方法、装置、电子设备和存储设备
US11620539B2 (en) Method and device for monitoring a process of generating metric data for predicting anomalies
KR102266182B1 (ko) 복수의 시계열 데이터의 모니터링 방법 및 장치
WO2018130284A1 (en) Anomaly detection of media event sequences
JP2008084039A (ja) 製造工程分析方法
CN117454096B (zh) 一种电机生产质量检测方法及系统
CN110795324B (zh) 一种数据处理方法及装置
Zhang et al. Fault detection and diagnosis strategy based on a weighted and combined index in the residual subspace associated with PCA
JP2017536919A5 (ja)
CN112380073B (zh) 一种故障位置的检测方法、装置及可读存储介质
JP2008146157A (ja) ネットワーク異常判定装置
Tian Better reliability assessment and prediction through data clustering
CN112463646A (zh) 一种传感器异常检测方法及装置
JP5949032B2 (ja) 前処理方法及び異常診断装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210720

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210803

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211011

R150 Certificate of patent or registration of utility model

Ref document number: 6969588

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150