JP5186322B2 - Time series data analysis system, method and program - Google Patents

Time series data analysis system, method and program Download PDF

Info

Publication number
JP5186322B2
JP5186322B2 JP2008247380A JP2008247380A JP5186322B2 JP 5186322 B2 JP5186322 B2 JP 5186322B2 JP 2008247380 A JP2008247380 A JP 2008247380A JP 2008247380 A JP2008247380 A JP 2008247380A JP 5186322 B2 JP5186322 B2 JP 5186322B2
Authority
JP
Japan
Prior art keywords
matrix
series data
calculating
time series
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008247380A
Other languages
Japanese (ja)
Other versions
JP2010078467A (en
Inventor
剛 井手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2008247380A priority Critical patent/JP5186322B2/en
Publication of JP2010078467A publication Critical patent/JP2010078467A/en
Application granted granted Critical
Publication of JP5186322B2 publication Critical patent/JP5186322B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

この発明は、センサなどから取得された時系列データを解析するためのシステム、方法及びプログラムに関する。   The present invention relates to a system, method, and program for analyzing time series data acquired from a sensor or the like.

従来より、製造装置や監視装置などに取り付けたセンサから取得した時系列データを監視することにより、異常の有無を監視するという処理が行われている。   Conventionally, a process of monitoring presence / absence of an abnormality by monitoring time-series data acquired from a sensor attached to a manufacturing apparatus or a monitoring apparatus has been performed.

一方、近年、センサを取り付けた自動車を走行させ、そのようなセンサから得られた時系列データを解析する試みも行われている。自動車は、エンジンの冷却水の温度センサ、エンジンの吸入空気の温度センサ、オイル温度センサ、燃料噴射装置用の吸気管内圧力センサ、ターボチャージャ用の過給圧センサ、スロットルポジョンセンサ、ステアリング舵角センサ、車高センサ、液面センサ、電磁による回転速度センサ、ノックセンサ、加速度センサ、流量センサ、酸素センサ、希薄空燃比センサなど多くのセンサを有し、最新の自動車では、センサの数は、数百にも達する。   On the other hand, in recent years, an attempt is made to run a vehicle equipped with a sensor and analyze time-series data obtained from such a sensor. For automobiles, engine cooling water temperature sensor, engine intake air temperature sensor, oil temperature sensor, intake pipe pressure sensor for fuel injection device, turbocharger supercharging pressure sensor, throttle position sensor, steering rudder angle sensor , Vehicle height sensor, liquid level sensor, electromagnetic rotational speed sensor, knock sensor, acceleration sensor, flow rate sensor, oxygen sensor, lean air-fuel ratio sensor, etc. It reaches 100.

このような複数のセンサの時系列出力データを用いて行いたいことの1つに、異常診断がある。すなわち、図1(b)に示すのが、そのような異常診断を行いたいテスト・データとする。このようなテストデータが、
D = {x(t)|x(t)∈Rp, t = 1,2,...,N}で表されるとする。ここで、Rpは、p次元実数空間をあらわし、よって、x(t)は、実数成分をもつp次元ベクトルである。その1つの成分が、1つのセンサに対応する。tは、時間のインデックスで、ある増分毎の時間に対応する。よって、x(1),x(2),...,x(N)は、時系列に沿った、N個のベクトルである。
One of the things that we would like to do using the time series output data of a plurality of sensors is abnormality diagnosis. That is, FIG. 1B shows test data for which such an abnormality diagnosis is desired. Such test data
It is assumed that D = {x (t) | x (t) ∈ R p , t = 1, 2,..., N}. Here, R p represents a p-dimensional real number space, and therefore x (t) is a p-dimensional vector having a real number component. The one component corresponds to one sensor. t is an index of time and corresponds to a time for each increment. Therefore, x (1) , x (2) ,..., X (N) are N vectors along the time series.

一方、参照用正常データが、テストデータと同一フォーマットで用意されているとする。これは、例えば、自動車の正常走行中に測定したセンサの値とする。参照用正常データは、
D〜 = {x~(t)|x~(t)∈Rp, t = 1,2,...,N}で表されるとする。
On the other hand, it is assumed that normal data for reference is prepared in the same format as test data. This is, for example, a sensor value measured during normal driving of the automobile. Normal data for reference is
It is assumed that D˜ = {x˜ (t) | x˜ (t) ∈R p , t = 1, 2,..., N}.

すると、異常診断を行うということは、D〜に対して、Dを比較して、どのセンサからの信号が異常を示しているかを判別する、ということである。   Then, performing abnormality diagnosis means comparing D to D to determine which sensor indicates an abnormality.

このような比較を行うためのアプローチとして、従来より知られている方法には、下記のようなものがある。
(1) 時間相関が強い極限からのアプローチとして、自己回帰モデルのような時系列モデリングを利用する技法、例えば、特開平6−109498号公報に開示されているような技法である。
(2) 独立同一分布の仮定に基づく統計解析の手法を利用する技法。
(3) システムの運動法則に基づくカオス時系列解析などを用いる技法であり、例えば、特開平8−278815号公報に開示されているような技法である。
As an approach for performing such a comparison, methods conventionally known include the following.
(1) A technique using time series modeling such as an autoregressive model as an approach from the limit having a strong time correlation, for example, a technique disclosed in Japanese Patent Laid-Open No. 6-109498.
(2) A technique that uses a statistical analysis method based on the assumption of independent identical distribution.
(3) A technique using chaos time series analysis based on the law of motion of the system, for example, a technique as disclosed in JP-A-8-278815.

しかし、特に自動車のセンサのデータの場合、(a) 非常に動的であり、(b) 時系列信号同士にしばしば強い相関がある、(c) センサ毎に事前知識は与えられない、という特徴がある。すなわち、信号が非常に動的で複雑であるため、データが異なれば、時系列の様相ががらりと変わる。従って、同一センサからの信号であっても、「重ねて比べてみる」ことが意味をなさない。つまり、時系列からの定常性が仮定できない。このような理由から、伝統的な時系列予測の手法を用いて時系列予測モデルを作り、予測からのずれの検出という技法で問題を解くことが難しい。   However, especially in the case of automobile sensor data, (a) it is very dynamic, (b) there is often a strong correlation between time series signals, and (c) no prior knowledge is given for each sensor. There is. That is, since the signal is very dynamic and complex, the time-series aspect changes greatly if the data is different. Therefore, even if the signals are from the same sensor, it does not make sense to “compare with each other”. In other words, stationarity from the time series cannot be assumed. For this reason, it is difficult to create a time series prediction model using a traditional time series prediction method and to solve the problem using a technique of detecting a deviation from the prediction.

とはいえ、センサのデータは、独立同一分布に従うとはみなせず、しかも、その確率分布は一般に、複雑なものになる。さらに、センサ間には一般に依存関係があり、各センサを多変量系として扱わざるを得ない。ここで依存関係というのは、例えば、「アクセルを踏むと加速する」という関係で、これは、スロットルポジョンセンサからの出力と、回転速度センサや加速度センサからの出力とが関連している、というようなことである。ところが、多変量系では一般に、統計的漸近論の成立に必要なデータ数が、センサの個数であるpに指数的に依存する。従って、N→∞の漸近論が、多くの現実的な状況では使えない。   However, the sensor data cannot be considered to follow an independent and identical distribution, and the probability distribution is generally complicated. Furthermore, there is generally a dependency relationship between sensors, and each sensor must be treated as a multivariate system. Here, the dependency relationship is, for example, the relationship of “acceleration when the accelerator is depressed”, which is related to the output from the throttle position sensor and the output from the rotation speed sensor or the acceleration sensor. It is like that. However, in multivariate systems, in general, the number of data required to establish statistical asymptotic theory depends exponentially on p, which is the number of sensors. Therefore, N → ∞ asymptotics cannot be used in many realistic situations.

一方、自動車、発電設備などの場合、センサを設置される対象は非常に複雑な物理系となっており、システム全体の運動方程式を立てることは、ほぼ絶望である。   On the other hand, in the case of automobiles, power generation facilities, etc., the target to which the sensor is installed is a very complex physical system, and it is almost hopeless to establish the equation of motion of the entire system.

このような事情から、上記従来技術を、自動車のセンサのデータのような多変量系と見なされるデータに適用することはできない。   For these reasons, the above prior art cannot be applied to data regarded as a multivariate system, such as automobile sensor data.

そこで本願発明者の一人を含む発明者らは、本出願に譲渡された、2007年1月30日出願の米国特許出願第11/668745号明細書において、センサ信号の相関異常の解明を行う発明として、相関行列を元に各センサを、多次元尺度構成法でユークリッド空間に埋め込み、埋め込まれた空間での斥力ポテンシャルを異常度と結びつける方法を提案した。しかし、この技法は、ノイズ除去機能が十分でなく、埋め込み過程が不安定になりがちで、また、算出される異常度が規格化されていない、という点で、上述の問題に当てはめるに十分でない。   Accordingly, the inventors, including one of the inventors of the present application, in the US patent application Ser. No. 11/668745, filed on Jan. 30, 2007, assigned to the present application, elucidates the correlation abnormality of sensor signals. Based on the correlation matrix, each sensor is embedded in the Euclidean space using the multidimensional scaling method, and a method is proposed in which the repulsive potential in the embedded space is linked to the degree of abnormality. However, this technique is not sufficient to apply the above problem in that the noise removal function is not sufficient, the embedding process tends to be unstable, and the calculated degree of abnormality is not standardized. .

さらに、本願発明者の一人を含む発明者らは、本出願に譲渡された、2007年12月18日出願の米国特許出願第11/959073号明細書において、近傍性保存原理というアイデアに基づいて、上記の困難を解決することを意図した異常度検出手法を提案した。この手法の特徴は、センサ信号同士の類似度の破れから異常を見出すこと、各センサについて、近傍にあるセンサ以外は考慮しないこと、及び、近傍グラフのタイトさの変化から、異常度を計算することである。   In addition, the inventors, including one of the inventors of the present application, based on the idea of proximity conservation principle in US patent application Ser. No. 11/959073 filed on Dec. 18, 2007, assigned to the present application. Therefore, we proposed an anomaly detection method intended to solve the above difficulties. The feature of this method is that it finds anomalies from broken similarity between sensor signals, does not consider each sensor other than nearby sensors, and calculates the degree of abnormality from changes in the tightness of the neighborhood graph That is.

この技法は、自動車データの解析や中規模の発電設備の異常検知に利用され、実用的な成功を収めている。しかし、この技法の限界は、センサの近傍をうまく見出す手段をもたないことである。例えば、他のどれとも独立であるような変数では、近傍と呼べる仲間はいない。一方、測定系が多重化されているようなセンサでは、その多重度に応じた仲間を見出せるはずである。しかし、事前にそのようなセンサ個別の相違を解析する手段は未知であり、変数毎の個性を無視して、一律に近傍数kを決めるしかなかった。そのため、とりわけ他と独立性が強いようなセンサで擬陽性(問題でないのに、問題とみなさる)が多発するという問題があった。   This technique has been used successfully for analyzing automobile data and detecting abnormalities in medium-scale power generation facilities. However, the limitation of this technique is that it does not have a means to find the vicinity of the sensor well. For example, in a variable that is independent of any other, there are no friends that can be called neighbors. On the other hand, in a sensor in which the measurement system is multiplexed, it should be possible to find friends according to the multiplicity. However, means for analyzing such differences between sensors in advance is unknown, and there is no choice but to determine the number k of neighbors ignoring the individuality of each variable. For this reason, there is a problem that false positives (not regarded as a problem but regarded as a problem) frequently occur particularly in sensors that are highly independent from others.

さらに、異常度の定義がヒューリスティックスに基づいていたため、単一のセンサの陽性反転に基づくエラーが検出できないとか、ノイズが多い状況では検知能力が十分でない、という問題があった。   Furthermore, since the definition of the degree of abnormality is based on heuristics, there is a problem that an error based on positive reversal of a single sensor cannot be detected or the detection capability is not sufficient in a noisy situation.

特開平6−109498号公報JP-A-6-109498 特開平8−278815号公報JP-A-8-278815 2007年1月30日出願の米国特許出願第11/668745号明細書US patent application Ser. No. 11 / 668,745 filed Jan. 30, 2007 2007年12月18日出願の米国特許出願第11/959073号明細書US patent application Ser. No. 11/959073 filed Dec. 18, 2007 J. Friedman, T. Hastie, and R. Tibahirani, Sparse inverse covariance estimation with the graphical lasso. Biostatics, 9(3): 432-441, 2008J. Friedman, T. Hastie, and R. Tibahirani, Sparse inverse covariance estimation with the graphical lasso. Biostatics, 9 (3): 432-441, 2008 O. Banarjee, L.E.Ghaoui, and G. Natsoulis, Convex optimization techniques for fitting sparse gaussian graphical models. In in Proceedings of ICML, pages 89-96. Press, 2006.O. Banarjee, L.E.Ghaoui, and G. Natsoulis, Convex optimization techniques for fitting sparse gaussian graphical models.In in Proceedings of ICML, pages 89-96.Press, 2006. J. Friedman, T. Hastie, H. Hofling and Tibshinari, Pathwise coordinate optimization. Annals of Applied Statistics. I(2):302-332J. Friedman, T. Hastie, H. Hofling and Tibshinari, Pathwise coordinate optimization. Annals of Applied Statistics. I (2): 302-332

この発明の目的は、各センサの周りの近接グラフ構造をデータから自動的に推測する機能を提供することによって、上記従来技術の問題点を解決することにある。   An object of the present invention is to solve the above-mentioned problems of the prior art by providing a function for automatically inferring a proximity graph structure around each sensor from data.

本発明において、入力として与えられるのは、下記のものである。
(1) テスト・データD = {x(t)|x(t)∈Rp, t = 1,2,...,N}
(2) 正規化定数ρ ここで、0 < ρ < 1であり、その値は、ユーザが適宜選択する。
(3) 参照用正常データD〜 = {x~(t)|x~(t)∈Rp, t = 1,2,...,N}の相関係数行列S〜
In the present invention, the following are given as inputs.
(1) Test data D = {x (t) | x (t) ∈ R p , t = 1,2, ..., N}
(2) Normalization constant ρ Here, 0 <ρ <1, and the value is appropriately selected by the user.
(3) Reference normal data D˜ = {x ~ (t) | x ~ (t) ∈ R p , t = 1,2,..., N} correlation coefficient matrix S˜

これによって出力されるのは、各センサの異常度e1, e2,...,epである。 As a result, the abnormalities e 1 , e 2 ,..., E p of each sensor are output.

本発明に従うアルゴリズムの概要は、次のとおりである。以下の処理はすべて、コンピュータのプログラムによって、自動的に実行されることに留意されたい。まず、corr()という関数表示で、相関係数行列を求める手続きをあらわす。すると、最初のステップは、下記のとおり、テスト・データDの相関係数行列Sを求めることである。
1.S ← corr(D)
2.次のステップは、D、及びD〜に対する精度行列の計算である。精度行列とは基本的に、相関係数行列の逆行列であるが、特に本発明においては、L1ノルムの正規化項を付加した式を最適化するように解くことによって、精度行列が疎行列になるような解を得る。このような最適化の式を解くために好適なアルゴリズムの1つに、graphical lassoがある。それを、glasso()という関数表示であらわすと、
Λ ← glasso(ρ,S)、Λ〜 ← glasso(ρ,S〜)で、テスト・データDの精度行列Λと、参照用正常データD〜の精度行列Λ〜を得る。
3,次のステップは、i = 1,2,...,pに対する特徴量行列の計算である。特徴量行列は、次のようにあらわされる。

Figure 0005186322
但し、li(A|B)というのは、negentropy(A,B)のことである。
4.次のステップは、下記の式によって、i = 1,2,...,pに対する異常度を計算することである。
ei = max{li(Λ|S) - li(Λ〜|S),li(Λ|S〜) - li(Λ〜|S〜)}
これは、相対エントロピー、またはカルバック・ライブラー距離として知られているものである。 The outline of the algorithm according to the present invention is as follows. Note that all of the following processing is automatically executed by a computer program. First, a procedure for obtaining a correlation coefficient matrix is represented by a function display called corr (). Then, the first step is to obtain the correlation coefficient matrix S of the test data D as follows.
1. S ← corr (D)
2. The next step is the calculation of the accuracy matrix for D and D˜. The accuracy matrix is basically an inverse matrix of the correlation coefficient matrix. In particular, in the present invention, the accuracy matrix is sparse by solving an expression to which an L 1 norm normalization term is added. Get a solution that becomes a matrix. One suitable algorithm for solving such an optimization equation is graphical lasso. If it is expressed by a function display called glasso (),
With Λ ← glasso (ρ, S), Λ˜ ← glasso (ρ, S˜), the accuracy matrix Λ of the test data D and the accuracy matrix Λ˜ of the reference normal data D˜ are obtained.
3. The next step is the calculation of the feature matrix for i = 1,2, ..., p. The feature quantity matrix is expressed as follows.
Figure 0005186322
However, l i (A | B) means negentropy (A, B).
4). The next step is to calculate the anomaly for i = 1,2, ..., p by the following formula:
e i = max {l i (Λ | S) −l i (Λ˜ | S), l i (Λ | S˜) −l i (Λ˜ | S˜)}
This is what is known as relative entropy, or Cullback Ribler distance.

以上のように、この発明によれば、精度行列が疎行列になるような処理の工夫を施して、好適にはgraphic lassoを用いてこの最適化の式を解き、各センサについて、カルバック・ライブラー距離が異常度をあらわすようにしたことによって、近傍性保存原理に基づく時系列データの異常検出手法に、各センサの周りの近接グラフ構造をデータから自動的に推測する機能が組み込まれ、さらには、局所的な統計モデルの直接比較に基づいて、理論的に首尾一貫した異常度が与えられる。   As described above, according to the present invention, the processing is performed so that the accuracy matrix becomes a sparse matrix, and the optimization equation is solved preferably using graphic lasso, and the Cullback Live is obtained for each sensor. Since the error distance represents the degree of anomaly, the function for automatically inferring the proximity graph structure around each sensor from the data is incorporated into the anomaly detection method of time series data based on the proximity preservation principle. Is given a theoretically consistent degree of anomaly based on a direct comparison of local statistical models.

これによって、擬陽性の少ない、より適切なセンサ時系列データ異常判別技法が提供される。   This provides a more appropriate sensor time-series data abnormality determination technique with fewer false positives.

以下、図面に従って、本発明の実施例を説明する。これらの実施例は、本発明の好適な態様を説明するためのものであり、発明の範囲をここで示すものに限定する意図はないことを理解されたい。また、以下の図を通して、特に断わらない限り、同一符号は、同一の対象を指すものとする。   Embodiments of the present invention will be described below with reference to the drawings. It should be understood that these examples are for the purpose of illustrating preferred embodiments of the invention and are not intended to limit the scope of the invention to what is shown here. Further, throughout the following drawings, the same reference numerals denote the same objects unless otherwise specified.

図2を参照すると、本発明の一実施例に係るシステム構成及び処理を実現するためのコンピュータ・ハードウェアのブロック図が示されている。図2において、システム・バス202には、CPU204と、主記憶(RAM)206と、ハードディスク・ドライブ(HDD)208と、キーボード210と、マウス212と、ディスプレイ214が接続されている。CPU104は、好適には、32ビットまたは64ビットのアーキテクチャに基づくものであり、例えば、インテル社のPentium(商標)4、インテル社のCore(商標) 2 DUO、AMD社のAthlon(商標)などを使用することができる。主記憶204は、好適には、512KB以上の容量、より好ましくは、1GB以上の容量をもつものである。     Referring to FIG. 2, a block diagram of computer hardware for realizing a system configuration and processing according to an embodiment of the present invention is shown. In FIG. 2, a CPU 204, a main memory (RAM) 206, a hard disk drive (HDD) 208, a keyboard 210, a mouse 212, and a display 214 are connected to the system bus 202. The CPU 104 is preferably based on a 32-bit or 64-bit architecture, such as Intel Pentium (trademark) 4, Intel Core (trademark) 2 DUO, AMD Athlon (trademark), etc. Can be used. The main memory 204 preferably has a capacity of 512 KB or more, more preferably a capacity of 1 GB or more.

ハードディスク・ドライブ208には、個々に図示しないが、オペレーティング・システム及び本発明に係る処理プログラムなどが、予め格納されている。オペレーティング・システムは、Linux(商標)、マイクロソフト社のWindows Vista、Windows XP(商標)、Windows(商標)2000、アップルコンピュータのMac OS(商標)などの、CPU204に適合する任意のものでよい。   The hard disk drive 208 stores in advance an operating system, a processing program according to the present invention, and the like, which are not shown individually. The operating system may be any compatible with the CPU 204, such as Linux (trademark), Microsoft Windows Vista, Windows XP (trademark), Windows (trademark) 2000, Apple Mac OS (trademark).

ハードディスク・ドライブ208にはさらに、センサの基準用の正常の時系列データと、センサのテスト用時系列データとが個別のファイルとして格納されている。異なる状況で記録された複数のデータが、個別のファイルとして保存されていてよい。すると、ユーザは、テスト時に、保存されているファイルのうちの1つを選択することによって、所望の時系列データの異常検知を行うことができる。   The hard disk drive 208 further stores normal time series data for sensor reference and time series data for sensor test as separate files. A plurality of data recorded in different situations may be stored as individual files. Then, the user can detect anomalies in desired time-series data by selecting one of the stored files during the test.

同様に、基準用の正常の時系列データのファイルも、複数用意してハードディスク・ドライブ208に保存していてもよい。   Similarly, a plurality of reference normal time-series data files may be prepared and stored in the hard disk drive 208.

キーボード210及びマウス212は、オペレーティング・システムが提供するグラフィック・ユーザ・インターフェースに従い、ディスプレイ214に表示されたアイコン、タスクバー、ウインドウなどのグラフィック・オブジェクトを操作するために使用される。キーボード210及びマウス212はまた、異常検知のためのテスト用センサ時系列データが格納されたファイルを指定するためにも使用される。   The keyboard 210 and the mouse 212 are used to operate graphic objects such as icons, taskbars, and windows displayed on the display 214 according to a graphic user interface provided by the operating system. The keyboard 210 and the mouse 212 are also used for designating a file in which test sensor time-series data for abnormality detection is stored.

ディスプレイ214は、これには限定されないが、好適には、1024×768以上の解像度をもち、32ビットtrue colorのLCDモニタである。ディスプレイ214は、時系列データの波形や、異常検知の結果を表示したりするために使用される。   The display 214 is preferably, but not limited to, a 32-bit true color LCD monitor with a resolution of 1024 × 768 or higher. The display 214 is used for displaying a waveform of time series data and a result of abnormality detection.

ハードディスク・ドライブ208にはさらに、本発明に係る異常検知を行うためのプログラムが格納されている。このプログラムは、C++、C#、Java(商標)、Perl、Rubyなどの既存の任意のプログラム言語で書くことができる。オペレーティング・システムとして、Windows Vista、Windows XP(商標)、Windows(商標)2000などを使用する場合には、Win32 APIの機能を利用して、GUIも含むアプリケーション・プログラムとして実装することができる。しかし、本発明に係る異常検知を行うためのプログラムは、CUIとしても実装することが可能である。   The hard disk drive 208 further stores a program for detecting an abnormality according to the present invention. This program can be written in any existing programming language such as C ++, C #, Java ™, Perl, or Ruby. When using Windows Vista, Windows XP (trademark), Windows (trademark) 2000, or the like as an operating system, it can be implemented as an application program including a GUI by using the function of the Win32 API. However, the program for performing abnormality detection according to the present invention can also be implemented as a CUI.

図3は、センサからのデータの間の関連性を示す図である。図示されているように、本発明の異常検知の仕組みでは、iを1からpまでの間の任意の整数としたとき、センサからのデータxiにつき、データxi以外のデータx1, ..., xj, ...,xi-1,xi+1,...,xpとの間の関係をより際立たせるようなアルゴリズムが適用される。すなわち、弱い関係同士のデータの関連性は無視してしまい、かなり関係の大きいデータ同士の関係性のみが残されるようになされる。このような関係性を行列表示すると、ほとんどの成分が0の疎行列になる。換言すると、このような関係性をあらわす行列である、精度行列が、疎行列であるような解を求めることが、本発明の1つの目標である。図3では、データxiに対して、xjとはある程度関係があり、xi+1とは強い関係があり、それ以外の点線であらわす関係は、無関係とみなすことを示している。 FIG. 3 is a diagram illustrating the relationship between data from sensors. As shown, the mechanism of anomaly detection of the present invention, when an arbitrary integer between the i from 1 to p, per data x i from the sensor, the data x 1 except data x i,. .., x j , ..., x i-1 , x i + 1 , ..., x p An algorithm is applied to make the relationship more prominent. That is, the relevance of data between weak relationships is ignored, and only the relevance between data having a considerably large relationship is left. When such a relationship is displayed in a matrix, a sparse matrix in which most components are 0 is obtained. In other words, it is an object of the present invention to obtain a solution in which the accuracy matrix, which is a matrix representing such a relationship, is a sparse matrix. FIG. 3 shows that the data x i has a certain relationship with x j and a strong relationship with x i + 1, and other relationships represented by dotted lines are regarded as irrelevant.

なお、精度行列については、C.M. Bishop, "Pattern Matching and Machine Learning". Springer Verlagの2.3.1節などを参照されたい。   Refer to section 2.3.1 of C.M. Bishop, “Pattern Matching and Machine Learning”. Springer Verlag for details on the accuracy matrix.

図4は、本発明に係る処理の概要を示すフローチャートである。このフローチャートを実行するプログラムは、ハードディスク・ドライブ208に保存され、ユーザの操作により、オペレーティング・システムの働きで、主記憶206にロードされて実行可能となる。   FIG. 4 is a flowchart showing an outline of processing according to the present invention. A program for executing this flowchart is stored in the hard disk drive 208, and can be loaded into the main memory 206 and executed by the operation of the operating system by a user operation.

ステップ402では、手続きcorr()によって、テスト・データDの相関係数行列が計算される。
テスト・データDの定義を再掲すると、 {x(t)|x(t)∈Rp, t = 1,2,...,N}である。ここで、時系列データの次元数pは、例えば50程度で、数百になることもある。Nは、時分割の数で、一般的には100から1000程度である。時分割の刻みの適切な間隔は、適用例によって異なるが、ここでは0.1秒である。但し、後の計算量に効いてくるのは、Nよりも寧ろ、次元数pである。というのは、pが直接、相関係数行列の行数及び列数になるからである。このデータは、ハードディスク・ドライブ208に保存されており、処理のため、本発明の処理プログラムにより、主記憶206に読み出される。
In step 402, the correlation coefficient matrix of the test data D is calculated by the procedure corr ().
When the definition of the test data D is reproduced again, {x (t) | x (t) ∈ R p , t = 1, 2,..., N}. Here, the dimension number p of the time series data is about 50, for example, and may be several hundreds. N is the number of time divisions, and is generally about 100 to 1000. The appropriate time division interval is 0.1 seconds here, although it depends on the application. However, it is the number of dimensions p rather than N that affects the subsequent calculation amount. This is because p is directly the number of rows and columns of the correlation coefficient matrix. This data is stored in the hard disk drive 208 and is read into the main memory 206 by the processing program of the present invention for processing.

テスト・データDの相関係数行列は、次のようにして計算される。先ず、x(t)のi番目の成分を、xi (t)とあらわすことにする。ここで、i∈{1,..,p}である。 The correlation coefficient matrix of the test data D is calculated as follows. First, the i-th component of x (t), to be expressed as x i (t). Here, i∈ {1, .., p}.

そこで、処理プログラムは、xi (t)の、t = 1,2,...,Nについての平均miと標準偏差σiとを計算する。そして、処理プログラムは、平均miと標準偏差σiを用いて、次の式により、xi (t)を標準化する。

Figure 0005186322
Therefore, the processing program calculates the average m i and standard deviation σ i of x i (t) for t = 1, 2,. Then, the processing program standardizes x i (t) by the following equation using the average m i and the standard deviation σ i .
Figure 0005186322

こうしておいて、処理プログラムは、次の式により、相関係数行列Sを求める。

Figure 0005186322
In this way, the processing program obtains the correlation coefficient matrix S by the following equation.
Figure 0005186322

なお、ここでは参照用正常データD〜 = {x~(t)|x~(t)∈Rp, t = 1,2,...,N}の相関係数行列S〜は、所与であると想定しているが、もしまだ計算されていないなら、ここで同様に計算する。 Here, the normal reference data D~ = {x ~ (t) | x ~ (t) ∈R p, t = 1,2, ..., N} correlation matrix S~ of a given If it is not calculated yet, calculate it here as well.

ステップ404で、処理プログラムは、下記のように、関数glasso()を用いて、テスト・データDの精度行列Λと、参照用正常データD〜の精度行列Λ〜とを計算する。glassoとは、graphical lassoアルゴリズムを意味する。
Λ = glasso(ρ,D)
Λ〜 = glasso(ρ,D〜)
In step 404, the processing program calculates the accuracy matrix Λ of the test data D and the accuracy matrix Λ˜ of the reference normal data D˜ using the function glasso () as follows. “glasso” means the graphical lasso algorithm.
Λ = glasso (ρ, D)
Λ ~ = glasso (ρ, D ~)

精度行列Λとは、定義によれば、相関係数行列のSの逆行列である。しかし、Sの逆行列を計算することは一般に不可能である。なぜならSは一般に正則ではないからである。これは例えば、ある程度強い相関がある変数の対が存在する場合にそうなる。センサー系の時系列データではそのような状況は常に起こっていると考えなければならない。仮に、幸運にもSが正則だったとしても、単純に逆行列を計算して精度行列Λを求めればよいかというと否である。それでは、精度行列Λが疎行列にならず、近傍を自動で選択するという本発明の狙いを満たさないためである。そのための工夫は後で説明するとして、疎行列である精度行列Λが求まったとしよう。すると、グラフィカルモデリングの理論によれば、精度行列Λの(i,j)成分(i≠j)が0であれば、xiとxjは、これら以外の全ての変数を与えたときに条件付独立である。すなわち、

Figure 0005186322
By definition, the accuracy matrix Λ is an inverse matrix of S of the correlation coefficient matrix. However, it is generally impossible to calculate the inverse matrix of S. This is because S is generally not regular. This is the case, for example, when there are variable pairs with some degree of strong correlation. It must be considered that such a situation always occurs in the time series data of the sensor system. Fortunately, even if S is regular, it is not necessary to simply calculate the inverse matrix to obtain the accuracy matrix Λ. This is because the accuracy matrix Λ is not a sparse matrix and does not satisfy the aim of the present invention of automatically selecting a neighborhood. Let's assume that the precision matrix Λ, which is a sparse matrix, has been found, as will be explained later. Then, according to the theory of graphical modeling, if the (i, j) component (i ≠ j) of the accuracy matrix Λ is 0, x i and x j are the conditions when all other variables are given. It is independent. That is,
Figure 0005186322

本発明は、この条件付き独立性を、近傍探索に利用する。すなわち、統計的に独立でないと判断されれば近傍とみなし、そうでなければ近傍でないとする。
例えば、x2について、精度行列Λ2,j ≠ 0となるjが4と9だけであれば、x2の近傍がx4とx9だけ、ということが分かる。従って、多くの行列要素がゼロであるような疎行列として精度行列Λを最適に決定することは、近傍の自動選択と等価である。
The present invention makes use of this conditional independence for neighborhood search. That is, if it is determined that it is not statistically independent, it is regarded as a neighborhood, otherwise it is not a neighborhood.
For example, for x 2 , if j is only 4 and 9 for which the accuracy matrix Λ 2, j ≠ 0, it can be seen that the neighborhood of x 2 is only x 4 and x 9 . Therefore, optimally determining the precision matrix Λ as a sparse matrix with many matrix elements being zero is equivalent to the automatic selection of neighborhoods.

さて、前にも述べたように、センサ・データ自体が多変量正規分布に従うという保証はない。そこで寧ろ、近傍か否かを決める基準として、多変量ガウスモデルを援用することにする。そこで今は、平均ゼロを前提としているので、データに当てはめようとしているモデルは、平均ゼロ、精度行列Λのp次元ガウス分布である。それは、下記の式のようにあらわされる。

Figure 0005186322
ここで、detは行列式をあらわす。 As already mentioned, there is no guarantee that the sensor data itself follows a multivariate normal distribution. Instead, the multivariate Gaussian model is used as a criterion for determining whether or not it is a neighborhood. Therefore, since it is assumed that the mean is zero, the model to be applied to the data is a p-dimensional Gaussian distribution with the mean zero and the precision matrix Λ. It is expressed as the following equation.
Figure 0005186322
Here, det represents a determinant.

ここで、特定の(i,j)、例えば、(i,j) = (1,2)に着目する。そして、x1とx2以外に適当な数字として、例えば、0をいれてみる。すると、指数関数の肩は、次のようになる。

Figure 0005186322
Here, attention is paid to a specific (i, j), for example, (i, j) = (1,2). And, as appropriate numbers other than x 1 and x 2, for example, try to put a 0. Then, the shoulder of the exponential function is as follows.
Figure 0005186322

従って、Λ1,2 = 0であれば、x1とx2を結ぶ交差項はなく、すると、それらは、他の全てのデータを止めた時に独立となることが分かる。 Therefore, if Λ 1,2 = 0, there is no cross term connecting x 1 and x 2 and it can be seen that they become independent when all other data is stopped.

そこで、精度行列Λの疎性(sparsity)の議論に移る。疎性を一旦離れて、精度行列をデータから素朴に最尤推定することを試みる。すると、テスト・データDの対数尤度は、次のようになる。

Figure 0005186322
Therefore, the discussion moves on the sparsity of the accuracy matrix Λ. We leave the sparseness and try to estimate the accuracy matrix from the data with maximum likelihood. Then, the log likelihood of the test data D is as follows.
Figure 0005186322

ここで、trは行列の対角和である。従って、尤度を最大にする精度行列を求めるためには、上記の式の{ }内を最大化すればよいことになる。   Where tr is the diagonal sum of the matrix. Therefore, in order to obtain an accuracy matrix that maximizes the likelihood, it is sufficient to maximize {} in the above equation.

しかし生憎、このようにして求めた精度行列は、一般に疎にならない。そこで、本発明は、L1ノルムに基づく正規化項を付与して最尤推定すると疎行列が得られるという性質を利用する。このようにL1正規化項を付して疎な解を得る手法が統計学の分野でlasso (Least absolute shrinkage and selection operator)と呼ばれることが、ここで使うgraphical lassoの名前の所以である。 However, the accuracy matrix obtained in this way is generally not sparse. Therefore, the present invention utilizes the property that a sparse matrix can be obtained when maximum likelihood estimation is performed by adding a normalization term based on the L 1 norm. The reason why the method of obtaining a sparse solution with L 1 normalization term is called lasso (Least absolute shrinkage and selection operator) in the field of statistics is the reason for the name of graphical lasso used here.

そこで、L1ノルムを付与した関数f(Λ;S,ρ)を次のように定義する。

Figure 0005186322
ここで、|Λi,j|は、行列Λの(i,j)要素の絶対値をあらわす。 Therefore, the function f (Λ; S, ρ) to which the L 1 norm is assigned is defined as follows.
Figure 0005186322
Here, | Λ i, j | represents the absolute value of the (i, j) element of the matrix Λ.

すると、この関数f(Λ;S,ρ)を用いて、Λを求めることは、下記ような最適化問題を解くことに帰着される。

Figure 0005186322
Then, obtaining Λ using this function f (Λ; S, ρ) results in solving the following optimization problem.
Figure 0005186322

この最適化問題を解くための好適な方法は、graphical lassoというアルゴリズムである。これの詳しい説明は、J. Friedman, T. Hastie, and R. Tibahirani, Sparse inverse covariance estimation with the graphical lasso. Biostatics, 9(3): 432-441, 2008 などにある。   A preferred method for solving this optimization problem is an algorithm called graphical lasso. A detailed explanation of this can be found in J. Friedman, T. Hastie, and R. Tibahirani, Sparse inverse covariance estimation with the graphical lasso. Biostatics, 9 (3): 432-441, 2008.

正規化項

Figure 0005186322
の存在によって、Λの多くの行列要素は、正定値性を失わない範囲で厳密にゼロになる。定数ρは、直感的に言うと、どの程度相関係数を無視するかの尺度であり、0 < ρ < 1の範囲でユーザが与える。graphical lassoの場合の好適な1つの値は、ρ = 0.3である。ρが1に近いと、得られる近接グラフは非常に小さくなり、ρ = 0だと、基本的に全てのセンサが結合した完全グラフが得られる。 Normalization term
Figure 0005186322
, Many matrix elements of Λ are exactly zero within a range that does not lose positive definiteness. Intuitively speaking, the constant ρ is a measure of how much the correlation coefficient is ignored, and is given by the user in the range of 0 <ρ <1. One preferred value for graphical lasso is ρ = 0.3. When ρ is close to 1, the obtained proximity graph is very small, and when ρ = 0, a complete graph is basically obtained in which all sensors are connected.

なお、graphical lassoのアルゴリズムについては、後で、もう少し詳しく説明する。   The graphical lasso algorithm will be described in more detail later.

このようにして、ステップ404で、テスト・データDの精度行列Λと、参照用正常データD〜の精度行列Λ〜とが求められると、ステップ406での負のエントロピー(ネゲントロピー)の行列の計算と、ステップ408での異常度スコアの計算に移行する。ステップ406及びステップ408は、i = 1,2,...,pについて順次実行される。   In this way, when the accuracy matrix Λ of the test data D and the accuracy matrix Λ˜ of the reference normal data D˜ are obtained in step 404, the matrix of the negative entropy (negentropy) in step 406 is calculated. Then, the process proceeds to calculation of the abnormality score in step 408. Steps 406 and 408 are sequentially performed for i = 1, 2,.

ところで、テスト・データDと、参照用正常データD〜との間に本質的な違いがなければ、それぞれから得られる精度行列ΛとΛ〜とが表す近接グラフの様子には大差はないはずである。すなわち、精度行列を求めるためのアルゴリズムに鑑みると、近接グラフ自体が、図1に示すような時系列データの見かけ上の相違とは関係なく求まるはずである。逆に言えば、ある変数xiに着目したとき、その周りの近接グラフに大きな変化がおきていれば、その変数に何か異常が生じている公算が高い。 By the way, if there is no essential difference between the test data D and the reference normal data D˜, there should be no big difference in the state of the proximity graph represented by the accuracy matrices Λ and Λ˜ obtained from each. is there. That is, in view of the algorithm for obtaining the accuracy matrix, the proximity graph itself should be obtained regardless of the apparent difference of the time series data as shown in FIG. Conversely, when focusing on a variable x i , if there is a large change in the adjacent graph around it, there is a high probability that something abnormal has occurred in that variable.

さて、いまやテスト・データDの精度行列Λと、参照用正常データD〜の精度行列Λ〜とが得られているので、
テスト・データDの確率モデルp(x) = N(x|0,Λ-1)と、
テスト・データD〜の確率モデルp~(x) = N(x|0,Λ〜-1)とが得られる。そこで、これらを勘案して、変数xiの異常度を計算するに当たっては、xi以外の全ての変数x1,x2,...,xi-1, xi+1,...,xpを与えたときのxiの条件付き分布p(xi|rest)と、p~(xi|rest)の違いを評価するのが自然である。ここで、restというのは、xi以外の全ての変数x1,x2,...,xi-1, xi+1,...,xpのことである。そこで、記法の便宜上、xi以外の全ての変数x1,x2,...,xi-1, xi+1,...,xpをzi∈Rp-1とすると、ネゲントロピーの関数は、下記のような式となる。

Figure 0005186322
ここで、< .. >Dという表示は、データDでの経験分布をあらわす。
これらの式が、前述のガウス分布の式から見導かれることは、この分野の当業者に明らかであろう。これらの式に基づき、ステップ406で、個々のi=1,...,pにつき、負のエントロピーが計算される。 Now, since the accuracy matrix Λ of the test data D and the accuracy matrix Λ˜ of the reference normal data D˜ are obtained,
Probability model p (x) = N (x | 0, Λ −1 ) of test data D,
The probability model p ~ (x) = N (x | 0, Λ ~ -1 ) of the test data D ~ is obtained. Therefore, in consideration of these, in calculating the degree of abnormality of the variable x i, all variables x 1, x 2 other than the x i, ..., x i- 1, x i + 1, ... , the conditional distribution p of x i of when given the x p | a (x i rest), p ~ | it is natural to evaluate the difference between (x i rest). Here, because rest, all variables x 1 except x i, x 2, ..., x i-1, x i + 1, ..., is that the x p. Therefore, for convenience of notation, if all variables x 1 , x 2 , ..., x i-1 , x i + 1 , ..., x p other than x i are set to z i ∈R p−1 , The function of negentropy is as follows.
Figure 0005186322
Here, the display <..> D represents the empirical distribution in the data D.
It will be apparent to those skilled in the art that these equations are derived from the aforementioned Gaussian equation. Based on these equations, at step 406, negative entropy is calculated for each i = 1,.

これらの結果に基づき、下記の式を用いて、処理プログラムは、i=1,2,...,pにつき、異常度eiの計算を行う。

Figure 0005186322
この結果は、見て取れるように、相対エントロピー、すなわちカルバック・ライブラーの距離である。
そして、ei ≡ max(d1,d2)により、i番目のデータの異常度が求められる。なお、前述の2007年12月18日出願の米国特許出願第11/959073号明細書に記載の技法では、相違度行列Dの要素di,jが、- ln|Si,j|で定義されていたので、相関係数の符合反転を検知することができなかったが、本発明の技法には、そのような制約はない。 Based on these results, the processing program calculates the degree of abnormality e i for i = 1, 2,.
Figure 0005186322
The result, as can be seen, is the relative entropy, i.e. the distance of the Cullback liber.
Then, the degree of abnormality of the i-th data is obtained by e i ≡ max (d 1 , d 2 ). In the technique described in the aforementioned US patent application Ser. No. 11/959073 filed on Dec. 18, 2007, the element d i, j of the dissimilarity matrix D is defined by −ln | S i, j |. However, the sign inversion of the correlation coefficient could not be detected, but the technique of the present invention has no such limitation.

いくつかの実験で、本発明の技法は、ノイズが大きく、いくつかのセンサに断線が生じているような状況でも、高い精度で異常度が検知できることが分かった。これは、疎な精度行列としてテスト・データDと、参照用正常データD〜を比較した場合、ノイズや断線の効果が、かなりの程度抑えられるからであろうと考察される。   In some experiments, it has been found that the technique of the present invention can detect the degree of abnormality with high accuracy even in a situation where the noise is large and some of the sensors are disconnected. It is considered that this is because the effects of noise and disconnection are suppressed to a considerable extent when the test data D and the reference normal data D˜ are compared as a sparse accuracy matrix.

<grahical lassoの計算に関する補足説明>
前述のように、grahical lassoにより解くべき問題は、下記の式を最大にする行列Λを求めることであった。

Figure 0005186322
そこで、この式をΛで偏微分する。このとき、下記の公式に留意する。
Figure 0005186322
<Supplementary explanation about calculation of grahical lasso>
As described above, the problem to be solved by grahical lasso is to obtain a matrix Λ that maximizes the following equation.
Figure 0005186322
Therefore, this equation is partially differentiated by Λ. At this time, pay attention to the following formula.
Figure 0005186322

すると、Λでの偏微分の結果の勾配の式は、下記のようになる。

Figure 0005186322
ここで、sign(Λ)とは、符号関数sign()を、行列の要素に適用した結果を要素とする行列である。すなわち、行列sign(Λ)の(i,j)要素は、Λi,j≠0のときsign(Λi,j)であり、Λi,j=0であるなら、[-1,1]の何らかの値を返すように定義される。 Then, the equation of the gradient resulting from the partial differentiation at Λ is as follows.
Figure 0005186322
Here, sign (Λ) is a matrix whose elements are the results of applying the sign function sign () to the elements of the matrix. That is, the (i, j) element of the matrix sign (Λ) is sign (Λ i, j ) when Λ i, j ≠ 0, and [-1,1] if Λ i, j = 0. Defined to return some value of.

上記勾配の式をゼロ行列と等値してΛを求めることになるが、Λはその性質から、対角要素は全て正であり、よって、sign(Λ)の対角要素は全て1となる。   Λ is obtained by making the above gradient equation equivalent to the zero matrix, but because of its nature, Λ is all diagonal elements, so all diagonal elements of sign (Λ) are 1. .

これから、Σi,j = Si,j + ρと、対角要素は厳密に求まる。ここで、Σ≡Λ-1と定義した。 From this, Σ i, j = S i, j + ρ and the diagonal elements can be determined exactly. Here, Σ≡Λ −1 was defined.

以上のように対角要素は厳密に求まるが、非対角要素は簡単には求まらない。そこで、ブロック勾配法という技法が使われる。ブロック勾配法については、"O. Banarjee, L.E.Ghaoui, and G. Natsoulis, Convex optimization techniques for fitting sparse gaussian graphical models. In in Proceedings of ICML, pages 89-96. Press, 2006."及び"J. Friedman, T. Hastie, H. Hofling and Tibshinari, Pathwise coordinate optimization. Annals of Applied Statistics. I(2):302-332"などにも記載がある。
ブロック勾配法では、次のように行列が分解される。

Figure 0005186322
As described above, diagonal elements can be obtained strictly, but non-diagonal elements are not easily obtained. Therefore, a technique called block gradient method is used. For the block gradient method, see "O. Banarjee, LEGhaoui, and G. Natsoulis, Convex optimization techniques for fitting sparse gaussian graphical models. In in Proceedings of ICML, pages 89-96. Press, 2006." and "J. Friedman, T. Hastie, H. Hofling and Tibshinari, Pathwise coordinate optimization. Annals of Applied Statistics. I (2): 302-332 ".
In the block gradient method, the matrix is decomposed as follows.
Figure 0005186322

ここで、L及びWは、(p-1)×(p-1)の行列であり、λとσはスカラーである。従って、wとlは、(p-1)次元のベクトル、ということになる。   Here, L and W are (p−1) × (p−1) matrices, and λ and σ are scalars. Therefore, w and l are (p-1) -dimensional vectors.

ブロック勾配法は、ここでは、一つの列ベクトルであるwとlを未知、他のλ、σ、L、Wを既知として最適化問題を解くものである。   Here, the block gradient method solves the optimization problem by assuming that one column vector w and l are unknown and the other λ, σ, L, and W are known.

このように決めたwに対して、数15がゼロになるという条件は、下記の式と等価である。βは、あるベクトル・パラメータ変数である。

Figure 0005186322
但し、
Figure 0005186322
である。また、sは、相関係数行列Sにおける、wに対応する位置のベクトルである。この式から見て取れるように、βは、L1正規化項付きの2次計画問題を解くことで求まる。よってβは、一般的な2次計画ソルバーを使っても解けるが、好適な解法があり、それについては、後述する。 The condition that Equation 15 becomes zero with respect to w determined in this way is equivalent to the following equation. β is a vector parameter variable.
Figure 0005186322
However,
Figure 0005186322
It is. Further, s is a vector at a position corresponding to w in the correlation coefficient matrix S. As can be seen from this equation, β can be obtained by solving a quadratic programming problem with an L 1 normalization term. Therefore, although β can be solved using a general quadratic programming solver, there is a suitable solution, which will be described later.

数15がゼロに等しいという条件の、Σ≡Λ-1におけるwに対応する位置のベクトルでの部分の式は、w - s - sign(l) = 0と書ける。 The expression of the part of the vector at the position corresponding to w in Σ≡Λ −1 under the condition that the number 15 is equal to zero can be written as w − s − sign (l) = 0.

そこで、ΣΛを計算してみると、次のようになる。

Figure 0005186322
この式の右上のブロックから得られる l = -λW-1wを使い、また、β≡W-1wとおけば、
Wβ - s +ρsign(β) = 0
数17の偏微分を実行することによって、この式に等しくなることが確認できる。 Therefore, when ΣΛ is calculated, it becomes as follows.
Figure 0005186322
Using l = -λW -1 w obtained from the upper right block of this equation, and if β≡W -1 w,
Wβ-s + ρsign (β) = 0
By performing the partial differentiation of Equation 17, it can be confirmed that it is equal to this equation.

上の説明では、第p変数についてブロック勾配法を適用するものであったが、より一般に次のようなステップであると言える。
(1) 最初に例えば、Σ = S + ρ1pと置く。
(2) i = 1から始めて、第i変数について、行と列を並べ替えて、i行目が第p行目、i列目が第p列目に来るようにする。
(3) lとλを最適に決めた後、行と列の配列を戻す。
(4) 元の行列と違いが小さければ終了。そうでなければ、iを1つ増やす。iがpを超えたなら、iを1にする。
(5) ステップ(2)に戻る。
In the above explanation, the block gradient method is applied to the p-th variable, but it can be said that the steps are more generally as follows.
(1) First, for example, Σ = S + ρ1 p is set.
(2) Starting from i = 1, the rows and columns are rearranged for the i-th variable so that the i-th row is in the p-th row and the i-th column is in the p-th column.
(3) After optimally determining l and λ, return the array of rows and columns.
(4) Finish if the difference is small from the original matrix. Otherwise, increase i by one. If i exceeds p, set i to 1.
(5) Return to step (2).

このとき、lとλを最適に決めるステップであるが、数19の右下部分から、wTl+σλ=1が得られ、これと、l = -λW-1wとから、下記の式が得られる。

Figure 0005186322
At this time, it is a step for optimally determining l and λ, and w T l + σλ = 1 is obtained from the lower right part of Equation 19, and from this and l = −λW −1 w, the following equation is obtained: Is obtained.
Figure 0005186322

ここで、結果的に使われる式には、W-1が陽に表れていないことに留意されたい。すなわち、相関係数行列がランク落ちしている場合、一般的にW-1を求めることができない。その意味で、逆行列を使わないこの計算方法は、ランク落ちしている相関係数行列にも対応できる点で、有利である。 Note that W −1 does not appear explicitly in the resulting formula. In other words, when the correlation coefficient matrix has dropped in rank, generally W −1 cannot be obtained. In this sense, this calculation method that does not use an inverse matrix is advantageous in that it can cope with a correlation coefficient matrix whose rank is lowered.

さて、数17に対応する最適化問題を書き下す。

Figure 0005186322
この目的関数をg(β;W,ρ)と書き、βiで偏微分すると、
Figure 0005186322
が成り立つ。これに基づく最適化条件を次の2つの場合に分けて考える。 Now, the optimization problem corresponding to Equation 17 is written down.
Figure 0005186322
When this objective function is written as g (β; W, ρ) and partial differentiation is performed with β i ,
Figure 0005186322
Holds. The optimization conditions based on this are considered in the following two cases.

(1) βi > 0のとき、数22が0という条件は、βm (m≠i)を与えた下で、

Figure 0005186322
と解ける。但し、
Figure 0005186322
と置いた。数23で、Ai - ρ < 0 であれば、もともとの条件βi > 0と矛盾する。このときは、
Figure 0005186322
のように単調であることから、定義域の左端、すなわち、βi → 0が解となる。 (1) When β i > 0, the condition that number 22 is 0 is that β m (m ≠ i)
Figure 0005186322
It can be solved. However,
Figure 0005186322
I put it. If A i −ρ <0 in Equation 23, it contradicts the original condition β i > 0. At this time,
Figure 0005186322
Therefore, the solution is the left end of the domain, that is, β i → 0.

(2) βi < 0のとき、数22が0という条件は、

Figure 0005186322
と、解ける。但し、Ai + ρ > 0であれば、もともとの条件βi < 0と矛盾する。このときは、
Figure 0005186322
のように単調であることから、定義域の左端、すなわち、βi → 0が解となる。 (2) When β i <0, the condition that number 22 is 0 is
Figure 0005186322
It can be solved. However, if A i + ρ> 0, it is inconsistent with the original condition β i <0. At this time,
Figure 0005186322
Therefore, the solution is the left end of the domain, that is, β i → 0.

以上、2つの場合を纏めると、数21の最適化問題は、p-1個のiそれぞれについて、

Figure 0005186322
という置換を繰り返せばよい。添え字iが最後の変数まで行ったら、また最初に戻って、収束するまで繰り返す。 As described above, when the two cases are summarized, the optimization problem of Equation 21 is as follows.
Figure 0005186322
You can repeat this substitution. When subscript i goes to the last variable, go back to the beginning and repeat until convergence.

なお、Σi,j = Si,j + ρという式から見てとれるように、Wi,iは必ず正であり、この解に特異性はない。また、上述したgraphical lassoの2つの記述法は、簡単な反復公式で記述でき、計算効率が高い。らに、前述のように、Σがランク落ちしていも、その逆行列を計算に使う必要がないので、安定して計算を実行することができる。 As can be seen from the equation Σ i, j = S i, j + ρ, W i, i is always positive, and this solution has no specificity. Further, the two graphical lasso description methods described above can be described by a simple iterative formula, and the calculation efficiency is high. In addition, as described above, even if Σ is dropped in rank, it is not necessary to use the inverse matrix for the calculation, so that the calculation can be executed stably.

以上の例は、自動車のセンサから取得したデータを異常検知する場合であったが、これには限定されず、発電所や、プラントなど、測定データが多次元時系列データとあらわされる、任意の場合に適用可能である。   The above example was a case of detecting anomalies in data acquired from an automobile sensor, but is not limited to this, and any measurement data such as a power plant or a plant can be expressed as multidimensional time series data. Applicable to the case.

参照用正常時系列データと、テスト用時系列データの波形の例を示す図である。It is a figure which shows the example of the waveform of reference normal time series data and the time series data for a test. 本発明を実施するためのハードウェアのブロック図である。It is a block diagram of the hardware for implementing this invention. 変数間の近傍関係を示す図である。It is a figure which shows the neighborhood relationship between variables. 本発明の処理のフローチャートを示す図である。It is a figure which shows the flowchart of the process of this invention.

Claims (18)

コンピュータにより、多次元時系列データの異常度を計算するためのシステムであって、
第1の多次元時系列データと、該第1の多次元時系列データと同次元の第2の多次元時系列データとを入力する手段と、
前記第1の多次元時系列データの共分散行列の逆行列である第1の精度行列と、前記第2の多次元時系列データの共分散行列の逆行列である第2の精度行列とを、各々の精度行列が疎行列になるように、計算する手段と、
前記第1の精度行列に基づく多変量確率分布モデルと、第2の精度行列に基づく多変量確率分布モデルによって、前記多次元時系列データの各次元毎の負のエントロピーを計算する手段と、
前記計算された負のエントロピーに基づく、相対エントロピー距離に基づき、各次元毎の異常度を計算する手段とを有する、
多次元時系列データの異常度計算システム。
A system for calculating the degree of abnormality of multidimensional time series data by a computer,
Means for inputting first multidimensional time-series data and second multi-dimensional time-series data having the same dimension as the first multi-dimensional time-series data;
A first accuracy matrix that is an inverse matrix of the covariance matrix of the first multidimensional time series data, and a second accuracy matrix that is an inverse matrix of the covariance matrix of the second multidimensional time series data. Means for calculating each precision matrix to be a sparse matrix;
Means for calculating a negative entropy for each dimension of the multidimensional time-series data by a multivariate probability distribution model based on the first accuracy matrix and a multivariate probability distribution model based on a second accuracy matrix;
Means for calculating the degree of anomaly for each dimension based on the relative entropy distance based on the calculated negative entropy;
Anomaly calculation system for multidimensional time series data.
前記第1の第多次元時系列データが参照用正常データであり、前記第2の第多次元時系列データが、異常を検知すべきテスト・データである、請求項1のシステム。   The system according to claim 1, wherein the first multi-dimensional time series data is reference normal data, and the second multi-dimensional time series data is test data for detecting an abnormality. 前記多変量確率分布モデルが、多変量ガウスモデルである、請求項1のシステム。   The system of claim 1, wherein the multivariate probability distribution model is a multivariate Gaussian model. 前記精度行列が疎行列になるように計算する手段は、L1ノルムの正規化項を付加した式を最適化することにより計算を行う、請求項1のシステム。 The system according to claim 1, wherein the means for calculating the accuracy matrix to be a sparse matrix performs calculation by optimizing an expression to which a normalization term of L 1 norm is added. 前記精度行列が疎行列になるように計算する手段は、graphical lassoのアルゴリズムを用いる、請求項4のシステム。   The system according to claim 4, wherein the means for calculating the precision matrix to be a sparse matrix uses a graphical lasso algorithm. 前記多次元時系列データが、自動車の複数のセンサから取得されたデータであり、前記多次元の個々の要素が、個々のセンサに対応する、請求項1のシステム。   The system of claim 1, wherein the multi-dimensional time series data is data obtained from a plurality of sensors of an automobile, and the multi-dimensional individual elements correspond to individual sensors. コンピュータにより、多次元時系列データの異常度を計算するための方法であって、
第1の多次元時系列データと、該第1の多次元時系列データと同次元の第2の多次元時系列データとを入力するステップと、
前記第1の多次元時系列データの共分散行列の逆行列である第1の精度行列と、前記第2の多次元時系列データの共分散行列の逆行列である第2の精度行列とを、各々の精度行列が疎行列になるように、計算するステップと、
前記第1の精度行列に基づく多変量確率分布モデルと、第2の精度行列に基づく多変量確率分布モデルによって、前記多次元時系列データの各次元毎の負のエントロピーを計算するステップと、
前記計算された負のエントロピーに基づく、相対エントロピー距離に基づき、各次元毎の異常度を計算するステップとを有する、
多次元時系列データの異常度計算方法。
A method for calculating the degree of abnormality of multidimensional time series data by a computer,
Inputting first multidimensional time-series data and second multi-dimensional time-series data having the same dimension as the first multi-dimensional time-series data;
A first accuracy matrix that is an inverse matrix of the covariance matrix of the first multidimensional time series data, and a second accuracy matrix that is an inverse matrix of the covariance matrix of the second multidimensional time series data. Calculating each precision matrix to be a sparse matrix;
Calculating a negative entropy for each dimension of the multidimensional time-series data by a multivariate probability distribution model based on the first accuracy matrix and a multivariate probability distribution model based on a second accuracy matrix;
Calculating the degree of abnormality for each dimension based on the relative entropy distance based on the calculated negative entropy.
Abnormality calculation method for multidimensional time series data.
前記第1の第多次元時系列データが参照用正常データであり、前記第2の第多次元時系列データが、異常を検知すべきテスト・データである、請求項7の方法。   8. The method according to claim 7, wherein the first multi-dimensional time series data is reference normal data, and the second multi-dimensional time series data is test data for detecting an abnormality. 前記多変量確率分布モデルが、多変量ガウスモデルである、請求項7の方法。   The method of claim 7, wherein the multivariate probability distribution model is a multivariate Gaussian model. 前記精度行列が疎行列になるように計算するステップは、L1ノルムの正規化項を付加した式を最適化することにより計算を行う、請求項7の方法。 8. The method according to claim 7, wherein the step of calculating the accuracy matrix so as to be a sparse matrix is performed by optimizing an expression to which an L 1 norm normalization term is added. 前記精度行列が疎行列になるように計算するステップは、graphical lassoのアルゴリズムを用いる、請求項10のシステム。   The system of claim 10, wherein the step of calculating the precision matrix to be a sparse matrix uses a graphical lasso algorithm. 前記多次元時系列データが、自動車の複数のセンサから取得されたデータであり、前記多次元の個々の要素が、個々のセンサに対応する、請求項7の方法。   The method of claim 7, wherein the multi-dimensional time series data is data obtained from a plurality of sensors of an automobile, and the multi-dimensional individual elements correspond to individual sensors. コンピュータにより、多次元時系列データの異常度を計算するためのプログラムであって、
前記コンピュータに、
第1の多次元時系列データと、該第1の多次元時系列データと同次元の第2の多次元時系列データとを入力するステップと、
前記第1の多次元時系列データの共分散行列の逆行列である第1の精度行列と、前記第2の多次元時系列データの共分散行列の逆行列である第2の精度行列とを、各々の精度行列が疎行列になるように、計算するステップと、
前記第1の精度行列に基づく多変量確率分布モデルと、第2の精度行列に基づく多変量確率分布モデルによって、前記多次元時系列データの各次元毎の負のエントロピーを計算するステップと、
前記計算された負のエントロピーに基づく、相対エントロピー距離に基づき、各次元毎の異常度を計算するステップとを実行させる、
プログラム。
A program for calculating the degree of abnormality of multidimensional time series data by a computer,
In the computer,
Inputting first multidimensional time-series data and second multi-dimensional time-series data having the same dimension as the first multi-dimensional time-series data;
A first accuracy matrix that is an inverse matrix of the covariance matrix of the first multidimensional time series data, and a second accuracy matrix that is an inverse matrix of the covariance matrix of the second multidimensional time series data. Calculating each precision matrix to be a sparse matrix;
Calculating a negative entropy for each dimension of the multidimensional time-series data by a multivariate probability distribution model based on the first accuracy matrix and a multivariate probability distribution model based on a second accuracy matrix;
Calculating the degree of abnormality for each dimension based on the relative entropy distance based on the calculated negative entropy;
program.
前記第1の第多次元時系列データが参照用正常データであり、前記第2の第多次元時系列データが、異常を検知すべきテスト・データである、請求項13のプログラム。   14. The program according to claim 13, wherein the first multi-dimensional time series data is reference normal data, and the second multi-dimensional time series data is test data whose abnormality is to be detected. 前記多変量確率分布モデルが、多変量ガウスモデルである、請求項13のプログラム。   The program according to claim 13, wherein the multivariate probability distribution model is a multivariate Gaussian model. 前記精度行列が疎行列になるように計算するステップは、L1ノルムの正規化項を付加した式を最適化することにより計算を行う、請求項13のプログラム。 14. The program according to claim 13, wherein the step of calculating the precision matrix to be a sparse matrix is performed by optimizing an expression to which an L 1 norm normalization term is added. 前記精度行列が疎行列になるように計算するステップは、graphical lassoのアルゴリズムを用いる、請求項16のプログラム。   The program according to claim 16, wherein the step of calculating the precision matrix to be a sparse matrix uses a graphical lasso algorithm. 前記多次元時系列データが、自動車の複数のセンサから取得されたデータであり、前記多次元の個々の要素が、個々のセンサに対応する、請求項13のプログラム。   14. The program according to claim 13, wherein the multidimensional time series data is data acquired from a plurality of sensors of an automobile, and the individual elements of the multidimensional correspond to individual sensors.
JP2008247380A 2008-09-26 2008-09-26 Time series data analysis system, method and program Expired - Fee Related JP5186322B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008247380A JP5186322B2 (en) 2008-09-26 2008-09-26 Time series data analysis system, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008247380A JP5186322B2 (en) 2008-09-26 2008-09-26 Time series data analysis system, method and program

Publications (2)

Publication Number Publication Date
JP2010078467A JP2010078467A (en) 2010-04-08
JP5186322B2 true JP5186322B2 (en) 2013-04-17

Family

ID=42209089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008247380A Expired - Fee Related JP5186322B2 (en) 2008-09-26 2008-09-26 Time series data analysis system, method and program

Country Status (1)

Country Link
JP (1) JP5186322B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224507A (en) * 2015-09-29 2016-01-06 杭州天宽科技有限公司 A kind of disappearance association rule mining method based on tensor resolution
CN105518432A (en) * 2013-09-06 2016-04-20 国际商业机器公司 Detection device, detection method, and program
CN106368813A (en) * 2016-08-30 2017-02-01 北京协同创新智能电网技术有限公司 Abnormal alarm data detection method based on multivariate time series
EP4040248A4 (en) * 2019-09-30 2023-10-25 NTT Communications Corporation Information porocessing device, calculation method, and calculation program

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013042455A1 (en) * 2011-09-21 2013-03-28 インターナショナル・ビジネス・マシーンズ・コーポレーション Method, device and computer program for detecting occurrence of abnormality
JP2013257251A (en) 2012-06-14 2013-12-26 Internatl Business Mach Corp <Ibm> Anomaly detection method, program, and system
JP6172678B2 (en) 2014-04-30 2017-08-02 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Detection apparatus, detection method, and program
JP6211561B2 (en) 2014-06-26 2017-10-11 タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited Event detection from multiple time series data sequences
US10082787B2 (en) 2015-08-28 2018-09-25 International Business Machines Corporation Estimation of abnormal sensors
JP6453785B2 (en) * 2016-01-21 2019-01-16 日本電信電話株式会社 Regression analysis apparatus, regression analysis method, and regression analysis program
WO2018199312A1 (en) * 2017-04-27 2018-11-01 日本電気株式会社 Waveform anomaly determination device, method, program, and recording medium
JP6721533B2 (en) * 2017-05-02 2020-07-15 日本電信電話株式会社 Graphical lasso computing device, graphical lasso computing method and graphical lasso computing program
WO2018220813A1 (en) 2017-06-02 2018-12-06 富士通株式会社 Assessment device, assessment method, and assessment program
CN109726364B (en) * 2018-07-06 2023-01-10 平安科技(深圳)有限公司 Power consumption abnormity detection method, device, terminal and computer readable storage medium
JP7230925B2 (en) * 2018-12-05 2023-03-01 日本電気株式会社 Sparse matrix normalization device, sparse matrix normalization method and sparse matrix normalization program
CN112966017B (en) * 2021-03-01 2023-11-14 北京青萌数海科技有限公司 Abnormal subsequence detection method for indefinite length in time sequence
CN113176011B (en) * 2021-04-30 2022-03-15 南京安控易创润滑科技有限公司 Intelligent temperature measuring method and system of surface mounted sensor based on Internet of things
CN117870943B (en) * 2024-01-22 2024-08-20 中国三峡建工(集团)有限公司 Multi-sensor-based data optimization acquisition system in grouting process

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105518432A (en) * 2013-09-06 2016-04-20 国际商业机器公司 Detection device, detection method, and program
US10584986B2 (en) 2013-09-06 2020-03-10 International Business Machines Corporation Detecting device, detecting method, and program
CN105224507A (en) * 2015-09-29 2016-01-06 杭州天宽科技有限公司 A kind of disappearance association rule mining method based on tensor resolution
CN106368813A (en) * 2016-08-30 2017-02-01 北京协同创新智能电网技术有限公司 Abnormal alarm data detection method based on multivariate time series
CN106368813B (en) * 2016-08-30 2018-09-25 北京协同创新智能电网技术有限公司 A kind of abnormal alarm data detection method based on multivariate time series
EP4040248A4 (en) * 2019-09-30 2023-10-25 NTT Communications Corporation Information porocessing device, calculation method, and calculation program

Also Published As

Publication number Publication date
JP2010078467A (en) 2010-04-08

Similar Documents

Publication Publication Date Title
JP5186322B2 (en) Time series data analysis system, method and program
CN112955839B (en) Abnormality detection device, abnormality detection method, and program
US10664754B2 (en) Information processing apparatus
US11692910B2 (en) Abnormality diagnostic device, abnormality diagnostic method, and program
Xu et al. Application of a modified fuzzy ARTMAP with feature-weight learning for the fault diagnosis of bearing
US20080086283A1 (en) Bayesian Sensor Estimation For Machine Condition Monitoring
JP2013175108A (en) Clustering device and clustering program
CN111680725B (en) Gas sensor array multi-fault isolation algorithm based on reconstruction contribution
CN115905991A (en) Time series data multivariate abnormal detection method based on deep learning
CN109584267B (en) Scale adaptive correlation filtering tracking method combined with background information
Li et al. Classification of time–frequency representations based on two-direction 2DLDA for gear fault diagnosis
Wang et al. Fault detection based on diffusion maps and k nearest neighbor diffusion distance of feature space
US20090012752A1 (en) Aerodynamic Design Optimization Using Information Extracted From Analysis of Unstructured Surface Meshes
CN114997296A (en) Unsupervised track anomaly detection method and unsupervised track anomaly detection system based on GRU-VAE model
CN110555235A (en) Structure local defect detection method based on vector autoregressive model
Zhang et al. Parsimony-enhanced sparse Bayesian learning for robust discovery of partial differential equations
JP2022082277A (en) Detection program, detection device, and detection method
US10839258B2 (en) Computer-readable recording medium, detection method, and detection device
Entezami et al. Statistical decision-making by distance measures
JP7433648B2 (en) Anomaly detection method
US20240028872A1 (en) Estimation apparatus, learning apparatus, methods and programs for the same
CN117688496B (en) Abnormality diagnosis method, system and equipment for satellite telemetry multidimensional time sequence data
Zhang et al. Improved locally linear embedding based method for nonlinear system fault detection
CN116577671B (en) Battery system abnormality detection method and device
Park et al. Nonparametric estimation of a log-variance function in scale-space

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130121

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees