JP6602256B2 - Program, apparatus and method capable of detecting time series change point based on cross-correlation - Google Patents
Program, apparatus and method capable of detecting time series change point based on cross-correlation Download PDFInfo
- Publication number
- JP6602256B2 JP6602256B2 JP2016098654A JP2016098654A JP6602256B2 JP 6602256 B2 JP6602256 B2 JP 6602256B2 JP 2016098654 A JP2016098654 A JP 2016098654A JP 2016098654 A JP2016098654 A JP 2016098654A JP 6602256 B2 JP6602256 B2 JP 6602256B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- series data
- change point
- correlation
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Complex Calculations (AREA)
Description
本発明は、時系列データにおけるデータ値の傾向変化や異常を検出する技術に関する。 The present invention relates to a technique for detecting a trend change or abnormality of data values in time series data.
近年、ICT(Information and Communication Technologies)システムの普及に伴い、様々な状況において膨大な量の時系列データが生成されている。現在、このような時系列データを解析し、事業に有用な情報を取得する試みが盛んに行われている。1つの例として、セルラ通信に代表される無線通信サービスの時系列データについて以下に説明する。 In recent years, with the spread of ICT (Information and Communication Technologies) systems, a huge amount of time-series data is generated in various situations. At present, attempts are being made to analyze such time-series data and obtain information useful for business. As an example, time series data of a wireless communication service represented by cellular communication will be described below.
無線通信サービスでは、通常、数十メートルから数キロメートルのエリアをカバーする無線基地局を複数設置し、多数のユーザがどこにいても通信できるように広い通信カバレッジが提供されている。また、1つの周波数帯域では収容しきれないほどの多数のユーザを抱えるエリアでは、例えば、複数の周波数帯域を利用した無線通信サービスが提供される。これにより、ユーザは、移動等に伴う接続先基地局の変更を意識することなく、シームレスに通信サービスを利用することができる。 In the wireless communication service, usually, a plurality of wireless base stations covering an area of several tens of meters to several kilometers are installed, and a wide communication coverage is provided so that a large number of users can communicate anywhere. Further, in an area having a large number of users that cannot be accommodated in one frequency band, for example, a wireless communication service using a plurality of frequency bands is provided. Thereby, the user can use the communication service seamlessly without being aware of the change of the connection destination base station due to movement or the like.
このような通信サービスの下では、ユーザの移動状況や利用される通信関連アプリケーションの相違等によって、基地局毎のトラヒック(例えば通信量)の時間変化情報、すなわち時系列トラヒックデータに違いが生じる。 Under such a communication service, there is a difference in time change information of traffic (for example, traffic) for each base station, that is, time-series traffic data, depending on a user's movement status and a difference in communication-related applications to be used.
無線通信サービス事業者は、このようなトラヒックの時間変化を監視することによって、基地局の容量を超えるトラヒックの流入や設備故障による処理トラヒック量の低下等を発見することができる。実際に、基地局内のトラヒックが大きく変化する要因としては、時間帯や曜日等に起因する周期的なトラヒックの時間変化を除くと、
(a)ユーザによる通信トラヒックの変化、(b)ユーザ数の変化、
(c)基地局でのパラメータの変更、(d)基地局の新設や廃局、
(e)設備における故障や障害の発生
が挙げられる。
A wireless communication service provider can detect such an inflow of traffic exceeding the capacity of the base station or a decrease in the amount of processing traffic due to equipment failure by monitoring such a time change of traffic. Actually, as a factor that the traffic in the base station greatly changes, excluding the periodic traffic change due to the time zone and day of the week,
(A) change in communication traffic by users, (b) change in number of users,
(C) Change of parameters at the base station, (d) New establishment or discontinuation of base stations,
(E) The occurrence of a failure or failure in equipment.
ここで、(a)におけるユーザによる通信トラヒックは、例えば、大容量のアプリケーションを利用する頻度の変化等によって変動するものであり、緩やかに変化する傾向がある。また、(b)のユーザ数の変化は、通信サービスエリア内における新たな人口密集スポットが出現した場合や、当該スポット周囲の動線変化によってユーザの空間的及び/又は時間的な分布が変動する場合に起こり得る。さらに、上記(c)及び(d)は、例えば、トラヒックマネジメントとして事業者が基地局の調整を行うことによって発生する。また、(e)における設備は、ネットワーク設備や、基地局、サーバ等の機器であり、このような設備に故障が発生し障害が起こった場合、トラヒックが通常とは異なる傾向を示すことになる。 Here, the communication traffic by the user in (a) fluctuates due to, for example, a change in the frequency of using a large-capacity application, and tends to change gradually. In addition, the change in the number of users in (b) changes the spatial and / or temporal distribution of users when a new densely populated spot appears in the communication service area or due to a flow line change around the spot. Can happen. Furthermore, the above (c) and (d) occur, for example, when the operator adjusts the base station as traffic management. In addition, the equipment in (e) is a network equipment, a base station, a server or the like, and when such equipment fails and a failure occurs, the traffic tends to be different from normal. .
以上に述べたトラヒック変化の要因、特に、(e)の設備における故障や障害の発生を突き止めるために、時系列トラヒックデータにおける変化点を検出する技術が非常に重要となるのである。 In order to determine the cause of the traffic change described above, in particular, the occurrence of a failure or failure in the facility (e), a technique for detecting a change point in the time-series traffic data is very important.
さらに、このような変化点検出技術は、通信ネットワークにおける攻撃検知や侵入検知といったセキュリティ手段に適用したり、例えば製造システムにおける異常監視や故障検出・障害検知等のために利用したりすることもできる。このような事情から、時系列データにおける変化点検出技術は、様々な分野で注目されている。 Furthermore, such a change point detection technique can be applied to security means such as attack detection and intrusion detection in a communication network, or can be used for abnormality monitoring, failure detection / failure detection, etc. in a manufacturing system, for example. . Under such circumstances, a change point detection technique in time-series data has attracted attention in various fields.
例えば、特許文献1には、過去の時系列データを用いて時系列予測モデルを構築し、予測値と実績値の差を逐次検定することにより構造変化の有無を判断し、変化点を検出する技術が開示されている。また、特許文献2には、2段階の自己回帰モデルのオンライン忘却学習アルゴリズムを利用して、変化点を検出する技術が開示されている。
For example, in
さらに、特許文献3は、時系列データを逐次読み込みながら時系列モデルを更新するとともに、入力データの1つ1つに対してパラメータを逐次的に読み込んで損失関数を計算し、損失関数の値を足し合わせたものを、入力した時系列データへのモデルの当てはめ誤差(コンプレキシティ)として算出する技術を開示している。この技術では、全ての変化点候補に対し、変化点前後の時系列データに対するコンプレキシティを読み出した上で、これらコンプレキシティの和と、変化点を仮定しない場合の全時系列データに対するコンプレキシティとを比較し、その差分値に基づいて計算した変化点度合いの大きさに基づいて、変化点が検出されている。 Further, Patent Document 3 updates the time series model while sequentially reading the time series data, sequentially reads the parameters for each of the input data, calculates the loss function, and calculates the value of the loss function. There is disclosed a technique for calculating a sum as a model fitting error (complexity) to input time-series data. In this technique, for all change point candidates, the complexity for the time series data before and after the change point is read, and the sum of these complexities and the complexity for all time series data when no change point is assumed. The change point is detected based on the magnitude of the change point degree calculated based on the difference value.
また、特許文献4には、入力された全ての時系列データを対象として、最新の時系列データから得られるベクトル又は空間と、過去の一定期間の時系列データから得られる部分空間のベクトル又は空間との間で類似度を算出し、算出された類似度に基づいて異常点や変化点を検出する技術が開示されている。 Further, in Patent Document 4, for all input time-series data, a vector or space obtained from the latest time-series data and a vector or space of a partial space obtained from time-series data of a past fixed period A technique is disclosed in which a similarity is calculated between and an abnormal point or a change point is detected based on the calculated similarity.
しかしながら、特許文献1〜4に記載されたような従来技術では、漏れなく変化点を検出するために計算コストが膨大になったり、検出のリアルタイム性に欠けたりする問題が生じてしまう。
However, in the prior arts described in
例えば、特許文献1〜3に記載の技術では、時系列データ毎に変化点の検出を実施しなければならない。その結果、時系列データの数が増えると計算コストが線形的に増大してしまう。実際、時系列データを取り扱う多くの現場、例えば多数の無線基地局を有する無線通信サービス提供の現場では、取得される膨大な時系列データから、変化点を漏れなく検出しなければならない。従って、計算コストの増大は重大な問題となる。
For example, in the techniques described in
また、特許文献4に記載の技術では、全時系列データを同時に扱ってはいるが、時系列データにおける過去の一定期間より取得される特徴ベクトル又は空間を利用するため、遅延が生じ、リアルタイム性に欠けるという問題が生じる。また、長い周期性を持つ時系列データが存在する場合、最新時刻に時間的に近い部分空間では特徴が異なるので、類似性は低くなってしまう。これに対処するため、周期分の過去の時系列データを参照する必要が生じ、結局、周期分だけ検出の遅延が発生してしまう。 Further, in the technique described in Patent Document 4, all time series data is handled at the same time, but since a feature vector or space acquired from a certain period in the past in the time series data is used, a delay occurs and real-time characteristics are obtained. The problem of lacking. In addition, when time-series data having a long periodicity exists, the similarity is low because the characteristics are different in the partial space temporally close to the latest time. In order to deal with this, it becomes necessary to refer to past time-series data for a period, and eventually, a detection delay occurs for the period.
さらに、時系列データ毎の変動の相関性が低い場合、部分空間は時刻によって異なってしまい、類似度が安定せず、その結果、安定して変化点検出を行うことができなくなってしまう。また、入力された複数の時系列データ群について、データ群毎に固有の周期性が存在する可能性もあるが、このような場合、データ群毎に類似度を算出するための期間を適切に決定することが容易ではなく、結果的に、安定して変化点検出を行うことができない場合も生じ得る。 Furthermore, when the correlation of fluctuations for each time series data is low, the partial space varies depending on the time, the similarity is not stable, and as a result, the change point cannot be stably detected. In addition, there is a possibility that there is a periodicity unique to each data group for a plurality of input time-series data groups. In such a case, a period for calculating the similarity for each data group is appropriately set. It is not easy to determine, and as a result, there may be a case where the change point cannot be detected stably.
そこで、本発明は、計算コストの増大を抑制しつつ、時系列データから変化点を適宜検出可能なプログラム、装置及び方法を提供することを目的とする。 Therefore, an object of the present invention is to provide a program, an apparatus, and a method capable of appropriately detecting a change point from time series data while suppressing an increase in calculation cost.
本発明によれば、時系列データから傾向変化や異常を示す変化点を検出する装置に搭載されたコンピュータを機能させる変化点検出プログラムであって、
基準となる時系列データとの間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを決定する相互相関データ決定手段と、
当該基準となる時系列データと、決定された時系列データとを含む時系列データ群から、1つの時点に係る相関行列を生成し、当該相関行列の固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素をベクトル成分としたベクトルである代表ベクトルとの向きの差に対応するスカラ値を特徴量として、各時点での当該特徴量を含む特徴量時系列データを生成する特徴量生成手段と、
当該特徴量時系列データでの特徴量の変動に基づいて、当該1つの時系列データの変化点を決定する変化点決定手段と
してコンピュータを機能させる変化点検出プログラムが提供される。
According to the present invention, there is a change point detection program for causing a computer mounted on an apparatus for detecting a change point indicating a trend change or an abnormality from time series data,
Cross-correlation data determining means for determining one or a plurality of time-series data showing high cross-correlation satisfying a predetermined condition at a certain negative time lag value with reference time-series data;
A correlation matrix relating to one time point is generated from a time-series data group including the time-series data serving as the reference and the determined time-series data, and an eigenvector of the correlation matrix and the time-series data group are included. Generates feature value time-series data including the feature value at each time point using a scalar value corresponding to the difference in direction from a representative vector, which is a vector component of matrix elements related to one time-series data, as a feature value. Feature quantity generating means for
There is provided a change point detection program for causing a computer to function as a change point determination means for determining a change point of the one time series data based on the fluctuation of the feature amount in the feature amount time series data.
この本発明による変化点検出プログラムの一実施形態として、本変化点検出プログラムは、当該基準となる時系列データについて、所定条件を満たす高い自己相関を示す時系列データを生成する自己相関データ生成手段としてコンピュータを更に機能させ、
特徴量生成手段は、当該所定条件を満たす高い自己相関を示す時系列データを、当該相関行列を生成するための時系列データ群に含めることも好ましい。
As an embodiment of the change point detection program according to the present invention, the change point detection program generates auto-correlation data generating means for generating time-series data indicating high auto-correlation satisfying a predetermined condition for the reference time-series data. As a computer,
The feature quantity generation means preferably includes time-series data indicating high autocorrelation satisfying the predetermined condition in the time-series data group for generating the correlation matrix.
また、本発明による変化点検出プログラムにおいて、特徴量生成手段は、当該時系列データ群に含まれる時系列データ毎に、当該時系列データに係る行列要素をベクトル成分としたベクトルである代表ベクトルについての特徴量を生成し、各時点において当該時系列データ毎に生成された複数の特徴量の組を含む特徴量時系列データを生成し、
変化点決定手段は、当該特徴量時系列データでの特徴量の変動に基づいて、変化点を発生させた時系列データを特定することも好ましい。
Further, in the change point detection program according to the present invention, the feature quantity generation means is configured to obtain, for each time series data included in the time series data group , a representative vector that is a vector having a matrix element related to the time series data as a vector component. Generating feature amount time-series data including a set of a plurality of feature amounts generated for each time-series data at each time point,
It is also preferable that the change point determination means specifies the time series data in which the change point is generated based on the feature amount variation in the feature amount time series data.
さらに、本発明による変化点検出プログラムにおいて、相互相関データ決定手段は、変化点を検出する対象となる複数の時系列データの各々を、基準となる時系列データとし、当該基準となる時系列データ毎に、当該高い相互相関を示す1つ又は複数の時系列データを決定し、
特徴量生成手段は、当該基準となる時系列データ毎に、当該特徴量時系列データを生成することも好ましい。
Further, in the change point detection program according to the present invention, the cross-correlation data determination means sets each of a plurality of time series data to be detected as change points as reference time series data, and sets the reference time series data. For each, determine one or more time-series data showing the high cross-correlation,
It is also preferable that the feature quantity generation unit generates the feature quantity time series data for each time series data as the reference.
また、本発明による変化点検出プログラムの他の実施形態として、相互相関データ決定手段は、当該基準となる時系列データとの間で、ある正のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを含む時系列データリストを生成し、
本変化点検出プログラムは、変化点決定手段によって変化点が1つの時点で決定された時系列データについての当該時系列データリストに含まれた時系列データにおいて、当該1つの時点から当該正のタイムラグに係る時間の経過後に、変化点が発生することを予測する変化点予測手段としてコンピュータを更に機能させることも好ましい。
As another embodiment of the change point detection program according to the present invention, the cross-correlation data determination means shows a high cross-correlation satisfying a predetermined condition at a certain positive time lag value with the reference time-series data. Generating a time series data list including one or more time series data;
The change point detection program performs the positive time lag from the one time point in the time series data included in the time series data list for the time series data for which the change point is determined at one time point by the change point determination unit. It is also preferable to further cause the computer to function as a change point predicting means for predicting that a change point will occur after a lapse of time.
さらに、本発明による変化点検出プログラムにおいて、特徴量生成手段は、第N(N≧1)の期間に係る当該時系列データ群から、第Nの時点での相関行列を生成し、当該相関行列の固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素をベクトル成分としたベクトルである代表ベクトルとの向きの差に対応するスカラ値を、第Nの時点での当該1つの時系列データに係る特徴量とし、次いで、第Nの期間から見て時間単位分だけ時間経過方向にずれた第(N+1)の期間に係る当該時系列データ群から、第Nの時点に次ぐ第(N+1)の時点での相関行列を生成し、当該相関行列の固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素をベクトル成分としたベクトルである代表ベクトルとの向きの差に対応するスカラ値を、第(N+1)の時点での当該1つの時系列データに係る特徴量とする処理を、N値を順次増分させる形で繰り返して、当該特徴量時系列データを生成することも好ましい。 Furthermore, in the change point detection program according to the present invention, the feature value generation means generates a correlation matrix at the Nth time point from the time series data group related to the Nth (N ≧ 1) period, and the correlation matrix And a scalar value corresponding to a difference in direction between the eigenvector and a representative vector that is a vector component of a matrix element related to one time-series data included in the time-series data group, at the Nth time point. From the time series data group related to the (N + 1) th period shifted from the Nth period in the time lapse direction as viewed from the Nth period, to the Nth time point behind the generated correlation matrix at the time of (N + 1), and eigenvectors of the correlation matrix, is the vector of one when the matrix elements according to sequence data and vector components contained in the time-series data group representative Repeating the process of making the scalar value corresponding to the difference in orientation with the Kuttle as the feature value related to the one time-series data at the (N + 1) th time point in the form of sequentially incrementing the N value, the feature value It is also preferable to generate time series data.
また、本発明による変化点検出プログラムの更なる他の実施形態として、特徴量生成手段は、部分空間追跡法を用いて、当該時系列データ群に係る新たな時点でのデータに基づいて、当該相関行列の固有ベクトルを更新し、当該時系列データ群に含まれる1つの時系列データにおける他の時系列データとの間の相関係数から生成されるベクトルと、更新された当該固有ベクトルとの向きの差に対応するスカラ値を、当該新たな時点での特徴量とすることも好ましい。 Further, as still another embodiment of the change point detection program according to the present invention, the feature value generation means uses the subspace tracking method, based on the data at the new time point related to the time series data group, update the eigenvectors of the correlation matrix, the orientation of the behenate vector generated from the correlation coefficient between the other time series data in one time-series data contained in the time-series data group, and updated the eigenvector It is also preferable that the scalar value corresponding to the difference is a feature value at the new time point.
本発明によれば、また、時系列データから傾向変化や異常を示す変化点を検出する装置に搭載されたコンピュータを機能させる変化点検出プログラムであって、
基準となる時系列データとの間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを決定する相互相関データ決定手段と、
部分空間追跡法を用い、当該基準となる時系列データと、決定された時系列データとを含む時系列データ群に係る新たな時点でのデータに基づいて、予め設定された初期の固有ベクトル又は前時点で更新された固有ベクトルを更新し、当該時系列データ群に含まれる1つの時系列データにおける他の時系列データとの間の相関係数から生成されるベクトルと、更新された当該固有ベクトルとの向きの差に対応するスカラ値を、当該新たな時点での特徴量として、各時点での当該特徴量を含む特徴量時系列データを生成する特徴量生成手段と、
当該特徴量時系列データでの特徴量の変動に基づいて、当該1つの時系列データの変化点を決定する変化点決定手段と
してコンピュータを機能させる変化点検出プログラムが提供される。
According to the present invention, there is also a change point detection program for causing a computer mounted on an apparatus for detecting a change point indicating a trend change or abnormality from time series data,
Cross-correlation data determining means for determining one or a plurality of time-series data showing high cross-correlation satisfying a predetermined condition at a certain negative time lag value with reference time-series data;
Using the subspace tracking method, based on the data at a new time point related to the time-series data group including the time-series data serving as the reference and the determined time-series data, a preset initial eigenvector or previous update the eigenvectors updated in time, and behenate vector generated from the correlation coefficient between the other time series data in one time-series data contained in the time-series data group, and updated the eigenvector A feature value generating means for generating a feature value time-series data including the feature value at each time point as a scalar value corresponding to the difference in direction of
There is provided a change point detection program for causing a computer to function as a change point determination means for determining a change point of the one time series data based on the fluctuation of the feature amount in the feature amount time series data.
本発明によれば、さらに、時系列データから傾向変化や異常を示す変化点を検出する変化点検出装置であって、
基準となる時系列データとの間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを決定する相互相関データ決定手段と、
当該基準となる時系列データと、決定された時系列データとを含む時系列データ群から、1つの時点に係る相関行列を生成し、当該相関行列の固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素をベクトル成分としたベクトルである代表ベクトルとの向きの差に対応するスカラ値を特徴量として、各時点での当該特徴量を含む特徴量時系列データを生成する特徴量生成手段と、
当該特徴量時系列データでの特徴量の変動に基づいて、当該1つの時系列データの変化点を決定する変化点決定手段と
を有する変化点検出装置が提供される。
According to the present invention, the change point detection device further detects a change point indicating a trend change or abnormality from the time series data,
Cross-correlation data determining means for determining one or a plurality of time-series data showing high cross-correlation satisfying a predetermined condition at a certain negative time lag value with reference time-series data;
A correlation matrix relating to one time point is generated from a time-series data group including the time-series data serving as the reference and the determined time-series data, and an eigenvector of the correlation matrix and the time-series data group are included. Generates feature value time-series data including the feature value at each time point using a scalar value corresponding to the difference in direction from a representative vector, which is a vector component of matrix elements related to one time-series data, as a feature value. Feature quantity generating means for
There is provided a change point detection device having change point determination means for determining a change point of the one time series data based on the fluctuation of the feature amount in the feature amount time series data.
この本発明による変化点検出装置の一実施形態として、相互相関データ決定手段は、当該基準となる時系列データとの間で、ある正のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを含む時系列データリストを生成し、
本変化点検出装置は、変化点決定手段によって変化点が1つの時点で決定された時系列データについての当該時系列データリストに含まれた時系列データにおいて、当該1つの時点から当該正のタイムラグに係る時間の経過後に、変化点が発生することを予測する変化点予測手段を更に有することも好ましい。
As one embodiment of the change point detecting apparatus according to the present invention, the cross correlation data determining means is one which shows a high cross correlation satisfying a predetermined condition at a certain positive time lag value with respect to the reference time series data. Or, generate a time series data list containing multiple time series data,
The change point detection apparatus includes a positive time lag from the one time point in the time series data included in the time series data list for the time series data for which the change point is determined at one time point by the change point determination unit. It is also preferable to further include a change point predicting means for predicting that a change point will occur after the lapse of time.
本発明によれば、また、時系列データから傾向変化や異常を示す変化点を検出する装置における変化点検出方法であって、
基準となる時系列データとの間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを決定するステップと、
当該基準となる時系列データと、決定された時系列データとを含む時系列データ群から、1つの時点に係る相関行列を生成し、当該相関行列の固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素をベクトル成分としたベクトルである代表ベクトルとの向きの差に対応するスカラ値を特徴量として、各時点での当該特徴量を含む特徴量時系列データを生成するステップと、
当該特徴量時系列データでの特徴量の変動に基づいて、当該1つの時系列データの変化点を決定するステップと
を有する変化点検出方法が提供される。
According to the present invention, there is also a change point detection method in an apparatus for detecting a change point indicating a trend change or abnormality from time series data,
Determining one or a plurality of time-series data exhibiting a high cross-correlation satisfying a predetermined condition at a certain negative time lag value with reference time-series data;
A correlation matrix relating to one time point is generated from a time-series data group including the time-series data serving as the reference and the determined time-series data, and an eigenvector of the correlation matrix and the time-series data group are included. Generates feature value time-series data including the feature value at each time point using a scalar value corresponding to the difference in direction from a representative vector, which is a vector component of matrix elements related to one time-series data, as a feature value. And steps to
There is provided a change point detection method including a step of determining a change point of the one time series data based on a variation of the feature quantity in the feature quantity time series data.
この本発明による変化点検出方法の一実施形態として、本変化点検出方法は、
当該基準となる時系列データとの間で、ある正のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを含む時系列データリストを生成するステップと、
上記の変化点を決定するステップで変化点が1つの時点で決定された時系列データについての当該時系列データリストに含まれた時系列データにおいて、当該1つの時点から当該正のタイムラグに係る時間の経過後に、変化点が発生することを予測するステップと
を更に有することも好ましい。
As one embodiment of the change point detection method according to the present invention, the change point detection method includes:
Generating a time series data list including one or a plurality of time series data indicating a high cross-correlation satisfying a predetermined condition at a certain positive time lag value with respect to the reference time series data;
In the time-series data included in the time-series data list for the time-series data in which the change point is determined at one time point in the step of determining the change point, the time related to the positive time lag from the one time point It is also preferable to further include a step of predicting that a change point will occur after the elapse of time.
本発明の変化点検出プログラム、装置及び方法によれば、計算コストの増大を抑制しつつ、時系列データから変化点を適宜検出することができる。 According to the change point detection program, apparatus, and method of the present invention, it is possible to appropriately detect a change point from time series data while suppressing an increase in calculation cost.
以下、本発明の実施形態について、図面を用いて詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[変化点検出装置]
図1は、本発明による変化点検出装置の一実施形態における機能構成を示す機能ブロック図である。
[Change point detector]
FIG. 1 is a functional block diagram showing a functional configuration in an embodiment of a change point detection apparatus according to the present invention.
図1に示した本実施形態の変化点検出装置1は、通信インタフェース101を介して複数の時系列データを受信し、これらの時系列データにおける傾向変化や異常を示す変化点を検出する装置である。変化点検出装置1は、例えば、本発明による変化点検出プログラムの搭載されたサーバ、又はパーソナルコンピュータ(PC)とすることができる。
The change
ここで、複数の時系列データとは、互いに出所の異なる又はデータ種の異なる時系列データである。例えば、無線通信サービスでは、時系列データとして、設置された1つの基地局における所定時刻毎の(又は所定単位時間経過毎の)トラヒック(通信量)データを採用することができる。例えば、1つの時刻でのトラヒックデータは、この時刻よりも所定時間単位だけ前の時点からこの時刻までの間の通信量としてもよい。ここで、通常、通信エリアには複数の基地局が設置されているので、基地局(又は基地局アンテナ)の数だけの複数の時系列データが取得される。 Here, the plurality of time-series data are time-series data having different sources or different data types. For example, in a wireless communication service, traffic (communication amount) data at a predetermined time (or every elapse of a predetermined unit time) in one installed base station can be adopted as time series data. For example, the traffic data at one time may be a communication amount from a time point before this time by a predetermined time unit to this time. Here, since a plurality of base stations are usually installed in the communication area, a plurality of pieces of time-series data corresponding to the number of base stations (or base station antennas) are acquired.
さらに、トラヒックデータとして、通信量ではなく、呼接続数や、接続試行数等を採用することも可能である。さらにまた、取り扱う複数の時系列データとして、トラヒックデータに通信量を採用したものと、呼接続数(又は接続試行数)を採用したものとを取り混ぜて採用することも可能である。この場合、例えば呼の数が増加しても通信量は減少する、といった通常とは異なる事態を変化点として検出することも可能となる。 Further, the number of call connections, the number of connection trials, etc. can be adopted as traffic data instead of the traffic. Furthermore, as a plurality of time-series data to be handled, it is possible to adopt a mixture of traffic data adopting traffic and traffic call count (or connection trial count). In this case, for example, it is possible to detect an unusual situation such as a decrease in traffic even if the number of calls increases, as a change point.
ここで、変化点検出装置1の検出する時系列データにおける変化点とは、時系列データにおけるデータ値の推移の傾向が変化する箇所(時点)、及びデータ値が正常な傾向からかけ離れた箇所(時点)のことである。
Here, the change point in the time series data detected by the change
変化点検出装置1を用いて時系列データにおける変化点を検出することによって、例えばセルラ通信に代表される無線通信サービスでは、ネットワーク設備や、基地局、サーバ等の機器における故障や障害の発生を突き止めることができる。すなわち、このような設備等に故障が発生し障害が起こった場合、トラヒックが通常と異なる傾向を示したり通常の傾向からかけ離れたりするので、時系列トラヒックデータの変化点を検出することにより、故障・障害を検知することが可能となるのである。
By detecting a change point in time-series data using the change
なお、変化点検出装置1による変化点検出は、当然に、ネットワーク設備等の故障や障害の発生を検知するためだけに利用されるものではない。例えば、通信ネットワークにおける攻撃検知や侵入検知といったセキュリティ手段として利用されてもよく、製造システムにおける異常監視や故障検出・障害検知等に適用されてもよい。実際、様々な要因によってデータ値が変動し得るような複数の時系列データを取得できる環境であれば、変化点検出装置1を用いて、その要因の発生を検知することが可能となるのである。
Of course, the change point detection by the change
この本発明による変化点検出装置1は、その特徴として、
(A)基準となる時系列データ(以後、「基準時系列データ」と略称)との間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データ(以後、「高相互相関データ」と略称)を決定し、
(B)「基準時系列データ」と、決定された「高相互相関データ」とを含む時系列データ群から、1つの時点に係る相関行列を生成し、当該相関行列の「固有ベクトル」と、当該時系列データ群に含まれる1つの時系列データに係る行列要素から生成される「代表ベクトル」との向きの差に対応するスカラ値を「スカラ特徴量」として、各時点での「スカラ特徴量」を含む特徴量時系列データを生成し、
(C)当該特徴量時系列データでの「スカラ特徴量」の変動に基づいて、当該1つの時系列データの変化点を決定する。
The change
(A) One or a plurality of time-series data indicating a high cross-correlation satisfying a predetermined condition at a certain negative time lag value with reference time-series data (hereinafter abbreviated as “reference time-series data”) (Hereinafter referred to as “high cross-correlation data”)
(B) generating a correlation matrix relating to one point in time from a time-series data group including “reference time-series data” and the determined “high cross-correlation data”, the “eigenvector” of the correlation matrix, The scalar value corresponding to the difference in direction from the “representative vector” generated from the matrix elements related to one time-series data included in the time-series data group is defined as the “scalar feature value”. ”Including feature amount time series data,
(C) Based on the variation of the “scalar feature value” in the feature value time-series data, a change point of the one time-series data is determined.
変化点検出装置1では、このように、スカラ値であるが故に比較的算出処理負担の小さい「スカラ特徴量」を利用するので、複数の時系列データを取り扱っていても、変化点検出のための計算コストの増大を抑制することができる。さらに、各時点での「スカラ特徴量」を含む特徴量時系列データから変化点を決定するので、リアルタイムに近い形で変化点を適宜検出することが可能となる。また、スカラ量の時系列の処理となるので、変化点決定のための計算量も少なくて済む。言い換えると、逐次的にスカラ特徴量を算出することによって、変化点を少ない計算量で随時検出することができるのである。
Since the change
また、変化点検出装置1では、複数の時系列データをまとめて処理して特徴量を算出するので、時系列データ毎の個別の変動に大きく影響されずに、より確実に安定して変化点検出を行うことも可能となる。
In addition, since the change
この点、変化点検出装置1は、特に、「基準時系列データ」との間で高い相互相関を示す「高相互相関データ」を、相関行列を生成するための時系列データ群にグルーピングしている。また、後に詳述するよう一実施形態として、「基準時系列データ」との間で高い自己相関を示す「高自己相関データ」を、この時系列データ群に含めることもできる。
In this regard, the change
このようなグルーピングによって、互いに所定以上の高い相関を有する複数の時系列データから「固有ベクトル」を算出するので、より確実に安定して変化点検出を行うことが可能となる。すなわち、まとめて処理する複数の時系列データ間での変動の相関性が低いために安定した変化点検出ができなくなるような事態を回避することができる。 By such grouping, “eigenvectors” are calculated from a plurality of time-series data having a high correlation of a predetermined level or more, so that change point detection can be performed more reliably and stably. That is, it is possible to avoid a situation in which stable change point detection cannot be performed because the correlation of fluctuations between a plurality of time-series data processed together is low.
ちなみに、「高相互相関データ」が「基準時系列データ」との間で高い相互相関を示すのは、負のタイムラグ値においてである。従って、「基準時系列データ」についての相関行列を生成するのに使用される「高相互相関データ」としては、「基準時系列データ」の発生に関して原因(因)となるものが選択されていることになる。このように、「基準時系列データ」についての相関行列において、「基準時系列データ」よりも時間的に前の状況に係るデータを取り入れることにより、より確実に変化点検出を捉えることが可能となる。 Incidentally, it is at a negative time lag value that “high cross-correlation data” shows high cross-correlation with “reference time series data”. Accordingly, the “high cross-correlation data” used to generate the correlation matrix for “reference time series data” is selected as the cause (factor) for the occurrence of “reference time series data”. It will be. In this way, in the correlation matrix for “reference time series data”, it is possible to capture change point detection more reliably by incorporating data related to the situation before the “reference time series data”. Become.
さらに、このようにタイムラグを考慮して、相関行列を生成するための時系列データをグルーピングすることによって、因果関係の認められる時系列データを逃さずに相関行列に取り入れることができるのである。例えば、ある装置の異常が、1時間前に発生した別の装置の異常に起因して発生した場合、タイムラグを考慮せずに両装置の時系列データの相関のみを考慮すると、両時系列データを同じグループとして取り入れた相関行列を生成しないことも十分に考えられる。これに対し、変化点検出装置1のように、両時系列データの因果関係を考慮することにより、両時系列データを取り入れた相関行列を生成し、データの異常検知をより確実に行うことが可能となるのである。
Further, by grouping the time series data for generating the correlation matrix in consideration of the time lag in this way, it is possible to incorporate the time series data with a causal relationship into the correlation matrix without missing. For example, if an abnormality of a certain device occurs due to an abnormality of another device that occurred one hour ago, considering only the correlation between the time series data of both devices without considering the time lag, both time-series data It is also conceivable not to generate a correlation matrix incorporating the same as the same group. On the other hand, like the change
ちなみに、1つの例として、無線通信ネットワークの各基地局で生成される通信トラヒックに係る時系列データにおいては、例えば基地局の設置位置の違いによって互いの間にタイムシフトが生じ、基地局毎の時系列データの間に因果関係が生じる場合も少なくない。本発明によれば、このような因果関係を有するトラヒック時系列データをも適切にグルーピングして相関行列を生成することができる。 Incidentally, as an example, in time-series data related to communication traffic generated at each base station of a wireless communication network, for example, a time shift occurs between each base station due to a difference in the installation position of the base station. There are many cases where causal relationships occur between time-series data. According to the present invention, it is possible to appropriately group traffic time series data having such a causal relationship to generate a correlation matrix.
また、変化点検出装置1は、後に詳細に説明するが、本発明の一実施形態として、変化点を検出した際、グルーピングされた時系列データのいずれにおいて変化点が検出されたのかを特定することもできる。さらに、時系列データにおける変化点発生を予測することも可能となる。このような変化点発生データの特定処理及び変化点発生の予測処理も、時系列データ間の因果関係を考慮することによって可能となるのである。
Further, as will be described in detail later, the change
[装置の機能構成]
同じく、図1に示した機能ブロック図によれば、変化点検出装置1は、通信インタフェース101と、時系列データ蓄積部102と、相関データ記憶部103と、特徴量時系列記憶部104と、変化点情報記憶部105と、時系列データリスト蓄積部106と、ディスプレイ(DP)107と、キーボード(KB)108と、プロセッサ・メモリとを有する。ここで、プロセッサ・メモリは、変化点検出装置1のコンピュータを機能させるプログラムを実行することによって、変化点検出機能を実現させる。
[Functional configuration of the device]
Similarly, according to the functional block diagram shown in FIG. 1, the change
さらに、このプロセッサ・メモリは、機能構成部として、時系列データアクセス部111と、自己相関データ生成部112と、相互相関データ決定部113と、特徴量生成部114と、変化点決定部115と、変化点予測部116と、入出力制御部117とを有する。ここで、図1における装置1の機能構成部間を矢印で接続して示した処理の流れは、本発明による変化点検出方法の一実施形態としても理解される。
Further, the processor memory includes a time series
同じく図1において、通信インタフェース101は、複数の基地局のそれぞれにおいて取得される複数の時系列トラヒックデータ、といったような複数の時系列データを、アクセスネットワーク(事業者通信網)やインターネットを介して受信する。ここで、各時系列データには、データの出所、すなわち系列を識別するための識別子、例えば基地局識別子が付与されていることも好ましい。
Similarly, in FIG. 1, the
時系列データ蓄積部102は、受信(取得)された時系列データを、系列毎に区別して逐次記憶する。ここで、各系列において(例えば基地局毎に)、一定期間のデータを蓄積することも好ましい。例えば、常時、所定時間前から現在までの期間に係るデータのみを蓄積し、新たに受信したデータを蓄積する一方、所定時間前の時点よりも過去となった時点に係るデータを破棄していってもよい。または、新たに受信したデータを蓄積する一方で、データ長が所定閾値以内となるように最古のデータの破棄/維持を行ってもよい。
The time-series
時系列データアクセス部111は、適宜、例えば時系列データのデータ時間間隔経過毎に、蓄積された複数の時系列データにおける所定期間分のデータを、又は複数の系列のそれぞれにおいて新たに取得されたデータを、自己相関データ生成部112及び相互相関データ決定部113に出力する。
The time-series
自己相関データ生成部112は、(入力された)基準となる基準時系列データについて、ピリオドグラム(periodogram)から決定される周期tpだけタイムシフトさせた時系列データである高自己相関データを生成する。ここで、ピリオドグラムは、自己相関関数(ACF,Auto-Correlation Function)のフーリエ変換に相当する関数であり、周波数(1/周期)についての関数となっている。このピリオドグラムを用いた高自己相関データの生成については、後に図2を用いて詳細に説明する。
The autocorrelation
相互相関データ決定部113は、入力された時系列データの中から、(同じく入力された)基準となる基準時系列データとの間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す時系列データである高相互相関データを決定する。ここで、タイムラグは、相互相関関数(CCF,Cross-Correlation Function)における2つの時系列データの時間パラメータのシフト分(時間差)である。この相互相関関数を考慮した高相互相関データの決定についても、次に、図2を用いて詳細に説明する。
The cross-correlation
図2は、自己相関データ生成部112及び相互相関データ決定部113での処理の一実施例を示すグラフである。
FIG. 2 is a graph illustrating an example of processing in the autocorrelation
図2(A)によれば、変化点検出対象の時系列データとして、3つの時系列データA、B及びCが取得(入力)されており、このうち、時系列データAを基準時系列データとした場合の処理が図2(B)及び(C)に示されている。最初に、基準時系列データAから高自己相関データA'を生成する処理を説明する。 According to FIG. 2 (A), three time series data A, B and C are acquired (input) as time series data to be detected as change points, and among these, time series data A is used as reference time series data. 2B and 2C show the processing in the case of First, a process for generating the high autocorrelation data A ′ from the reference time series data A will be described.
図2(B)に示すように、自己相関データ決定部112は、基準時系列データAの自己相関関数(ACF)からピリオドグラムを生成する。この基準時系列データAの自己相関関数R(τ)は、次式
(1) R(τ)=T-1Σt=1 T A(t)・A(t+τ)
によって算出される。上式(1)において、A(t)は基準時系列データAの時刻tでのデータ値であり、A(t+τ)は時刻(t+τ)でのデータ値である。また、Σt=1 Tは、時刻tについてのt=1, 2, ・・・, Tでの総和(summation)である。ここで、時刻tは、1時間単位だけ経過すると1だけ増分する値となっている。また、それ故に、上式(1)におけるTは、基準時系列データAのデータ数と一致している。
As shown in FIG. 2B, the autocorrelation
Is calculated by In the above equation (1), A (t) is a data value at time t of the reference time series data A, and A (t + τ) is a data value at time (t + τ). Σ t = 1 T is the summation at time t at t = 1, 2,..., T. Here, the time t is a value that is incremented by 1 when an hour unit has elapsed. Therefore, T in the above formula (1) matches the number of data of the reference time series data A.
次いで、基準時系列データAのピリオドグラムp(f)は、上式(1)のR(τ)を用いて、次式
(2) p(f)=Στ=-T T exp(-i2πfτ)・R(τ)
によって算出される。ここで、fは周波数(1/周期)であり、Στ=-T Tは、τについての−TからTまでの総和(summation)である。なお、上式(2)のexp内のiは虚数単位である。
Next, the periodogram p (f) of the reference time series data A is expressed by the following equation (2) p (f) = Στ = −T T exp (−i2πfτ) using R (τ) of the above equation (1). ) ・ R (τ)
Is calculated by Here, f is a frequency (1 / period), and Στ = −T T is a summation from −T to T with respect to τ. In the expression (2), i in exp is an imaginary unit.
図2(B)のグラフに示された時系列データAのピリオドグラムは、周波数f=0.14でピーク値(極大値)をとり、その周期tp(=1/f)は7となっている。自己相関データ決定部112は、
(a)基準時系列データAにおいて、ピリオドグラムから求めたこの周期tp(=7)だけタイムシフトさせた時系列データA'を生成し、
(b)基準時系列データAの自己相関関数において、周期tp=7での自己相関関数値ACF7が所定閾値以上であるならば、生成した時系列データA'を、高自己相関データA'として、相関行列を生成するための時系列データ群に加える。
ここで、所定閾値が例えば0.80であれば、ACF7は0.81であるから、時系列データA'は、高自己相関データA'として時系列データ群に加えられることになる。
The periodogram of the time-series data A shown in the graph of FIG. 2B has a peak value (local maximum value) at a frequency f = 0.14, and its period t p (= 1 / f) is 7. . The autocorrelation
(A) In the reference time series data A, generate time series data A ′ time-shifted by this period t p (= 7) obtained from the periodogram,
(B) In the autocorrelation function of the reference time series data A, if the autocorrelation function value ACF 7 at the period t p = 7 is equal to or greater than a predetermined threshold, the generated time series data A ′ is converted to the high autocorrelation data A 'Is added to the time series data group for generating the correlation matrix.
Here, if the predetermined threshold is 0.80, for example, ACF 7 is 0.81, and therefore the time series data A ′ is added to the time series data group as the high autocorrelation data A ′.
実際には、自己相関データ生成部112は、入力された時系列データの各々を基準時系列データとし、当該基準時系列毎に、上記(a)及び(b)の手順に従ってピリオドグラムを生成して周期tpを導出し、この周期tpを用いて生成した高自己相関データを、相関行列生成用の時系列データ群の要素とすることができる。なお、基準時系列データAをタイムシフトしていき、自己相関関数値が最大となるタイムシフト分だけタイムシフトした時系列データを時系列データA'とする等、ピリオドグラムを用いずに高自己相関データを生成することも可能である。次に、基準時系列データAから高相互相関データを決定する処理を説明する。
Actually, the autocorrelation
図2(C)に示すように、相互相関データ決定部113は、まず、時系列データAと時系列データBとの相互相関関数(CCF)を生成する。この相互相関関数CAB(tg)は、次式
(3) CAB(tg)=T-1Σt=1 T A(t)・B(t+tg)
によって算出される。ここで、A(t)は基準時系列データAの時刻tでのデータ値であり、B(t+tg)は時系列データBの時刻t+tgでのデータ値である。また、tgは、基準時系列データAに対する時系列データBのタイムラグである。次に、相互相関データ決定部113は、時系列データAと時系列データCとの相互相関関数CAC(tg)も、次式
(4) CAC(tg)=T-1Σt=1 T A(t)・C(t+tg)
によって算出する。
As shown in FIG. 2C, the cross correlation
Is calculated by Here, A (t) is a data value at time t of the reference time series data A, and B (t + t g ) is a data value at time t + t g of the time series data B. T g is the time lag of the time series data B with respect to the reference time series data A. Next, the cross-correlation
Calculated by
図2(C)に示された(上式(3)で算出された)相互相関関数CAB(tg)においては、相互相関関数値CCFの絶対値は、タイムラグtg=+6において0.8となり最大値をとる。このように時系列データA及びBのCCFの絶対値が最大となるタイムラグtgをtABとすると、本実施例ではtAB=+6である。ここで、本実施例のように、CCFの絶対値が最大となるタイムラグが正値をとる場合(tAB>0)、基準となる時系列データ(A)が原因(因)となって、結果(果)としての相関調査対象の時系列データ(B)が生じている、と捉えることが可能となる。 In the cross-correlation function C AB (t g ) shown in FIG. 2C (calculated by the above equation (3)), the absolute value of the cross-correlation function value CCF becomes 0.8 at the time lag t g = + 6. Take the maximum value. When in this way the absolute value of the CCF of the time series data A and B is the time lag t g as a maximum and t AB, in this example a t AB = + 6. Here, as in this embodiment, when the time lag at which the absolute value of CCF is maximum takes a positive value (t AB > 0), the time-series data (A) serving as a reference causes (causes) It is possible to grasp that the time series data (B) of the correlation survey target as a result (fruit) has occurred.
相互相関データ決定部113は、この基準時系列データAに対して「果」となる時系列データBを、後に詳細に説明する、変化点予測の際に利用する時系列データリストに加える。
The cross-correlation
一方、図2(C)に示された(上式(4)で算出された)相互相関関数CAC(tg)においては、相互相関関数値CCFの絶対値は、タイムラグtg=−6において0.8となり最大値をとる。このように時系列データA及びCのCCFの絶対値が最大となるタイムラグtgをtACとすると、本実施例ではtAC=−6である。ここで、本実施例のように、CCFの絶対値が最大となるタイムラグが負値をとる場合(tAC<0)、相関調査対象の時系列データ(C)が原因(因)となって、結果(果)としての基準時系列データ(A)が生じている、と捉えることが可能となる。 On the other hand, in the cross-correlation function C AC (t g ) shown in FIG. 2C (calculated by the above equation (4)), the absolute value of the cross-correlation function value CCF is a time lag t g = −6. The maximum value is 0.8. When in this way the absolute value of the CCF of the time series data A and C is a time lag t g as a maximum and t AC, in this example a t AC = -6. Here, as in this example, when the time lag at which the absolute value of CCF is the maximum takes a negative value (t AC <0), the time series data (C) subject to correlation investigation causes (cause) Therefore, it can be understood that the reference time series data (A) as a result (result) is generated.
相互相関データ決定部113は、この基準時系列データAに対して「因」となる時系列データCを高相互相関データとして、相関行列を生成するための時系列データ群に加える。
The cross-correlation
実際には、相互相関データ生成部113は、
(a)入力された全ての時系列データに対し、pairwiseの相互相関関数を生成し、すなわち、入力された時系列データから選択される全ての時系列データの(順序を考慮した)ペアについて相互相関関数を生成し、
(b)時系列データX及びYのペアにおいて、相互相関関数値CCFXYの絶対値が最大となるタイムラグ値tXYを算出して、このtXYを当該ペアに対応付けて記録し、
(c)上記(b)の処理を全てのペアについて実施し、
(d)入力された時系列データの各々を基準時系列データとして、当該基準時系列データ(X)毎に、ペアの相手である時系列データ(Y)についての記録されたタイムラグ(tXY)が正値であって、且つこのタイムラグ値(tXY)での相互相関関数値(CCFXY)の絶対値が所定閾値以上であれば、当該時系列データ(Y)を、時系列データリストに加え、
(e)一方、タイムラグ(tXY)が負値であって、且つこのタイムラグ値(tXY)での相互相関関数値(CCFXY)の絶対値が所定閾値以上であれば、当該時系列データ(Y)を、相関行列を生成するための時系列データ群の要素とする
ことができる。
Actually, the cross-correlation
(A) A pairwise cross-correlation function is generated for all input time-series data, that is, a pair of all time-series data selected from the input time-series data (considering the order) Generate a correlation function
(B) In the pair of time series data X and Y, calculate a time lag value t XY where the absolute value of the cross-correlation function value CCF XY is maximum, and record this t XY in association with the pair;
(C) The above process (b) is performed for all pairs,
(D) Using each of the input time series data as reference time series data, for each reference time series data (X), a recorded time lag (t XY ) for the time series data (Y) that is the counterpart of the pair there a positive, and if the absolute value is equal to or greater than a predetermined threshold value of the cross-correlation function value at the time lag value (t XY) (CCF XY) , the time-series data (Y), the time-series data list In addition,
(E) On the other hand, if the time lag (t XY ) is a negative value and the absolute value of the cross-correlation function value (CCF XY ) at the time lag value (t XY ) is greater than or equal to a predetermined threshold value, the time series data (Y) can be an element of a time-series data group for generating a correlation matrix.
なお、自己相関データ生成部112及び相互相関データ決定部113に入力される複数の時系列データについては、これらの機能構成部で処理される直前の前処理として、各時系列データにおいてトレンド成分を抽出し、当該時系列データから当該トレンド成分を除外した時系列データを準備してもよい。ここで、時系列データからのトレンド成分の抽出は、公知の方法、例えば回帰分析等を用いて実施することができる。
For a plurality of time-series data input to the autocorrelation
ちなみに、時系列データのトレンド成分は、例えば通信サービスにおける時系列トラヒックデータの場合、対象地域において通信を行うユーザ数が増加していったり、ユーザの用いる通信端末がより通信量の多くなるスマートフォン等に移行していったりすることで発生する。このような変化点発生の要因とはならないトレンド成分を予め除去しておくことによって、より確実に変化点を検出することが可能となるのである。 Incidentally, the trend component of time-series data is, for example, in the case of time-series traffic data in a communication service, the number of users performing communication in the target area is increased, or the communication terminal used by the user has a higher communication volume, etc. Occurs when moving to. By removing the trend component that does not cause such a change point in advance, the change point can be detected more reliably.
図1に戻って、相関データ記憶部103は、自己相関データ生成部112で生成された高自己相関データを、相関相手となる基準時系列データに対応付けて記憶する。また、相互相関データ決定部113で決定された高相互相関データを、相関相手となる基準時系列データに対応付けて記憶する。また、相関データ記憶部103は、要求に応じて又は適宜、記憶した基準時系列データ、高自己相関データ、及び高相互相関データを、特徴量生成部114へ出力する。
Returning to FIG. 1, the correlation
また、時系列データリスト蓄積部106は、相互相関データ決定部113で生成された時系列データリストを相関相手となる基準時系列データに対応付けて蓄積し、また、当該リストに加わった時系列データの情報を入力して、時系列データリストを更新する。さらに、時系列データリスト蓄積部106は、要求に応じて又は適宜、記憶した時系列データリストを、変化点予測部116へ出力する。
The time-series data
同じく図1において、特徴量生成部114は、
(a)相関行列生成部114cにおいて、相関データ記憶部103から入力した基準時系列データと、対応付けられた高自己相関データと、同じく対応付けられた高相互相関データとを含む時系列データ群から、1つの時点に係る相関行列を生成し、
(b)主成分分析PCA(Principle Component Analysis)によって、生成した相関行列の(第一主成分)固有ベクトルを算出し、
(c)算出した固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素から生成される代表ベクトルとのなす内積(角度)に相当するスカラ値を算出して、特徴量とし、
(d)各時点において上記(a)の相関行列を生成して、算出した特徴量を含む特徴量時系列データを生成する。
Similarly in FIG. 1, the feature
(A) In the correlation
(B) Principal component analysis PCA (Principle Component Analysis) calculates the (first principal component) eigenvector of the generated correlation matrix,
(C) calculating a scalar value corresponding to an inner product (angle) formed by the calculated eigenvector and a representative vector generated from a matrix element related to one time-series data included in the time-series data group; age,
(D) The correlation matrix of (a) is generated at each time point, and feature amount time-series data including the calculated feature amount is generated.
ここで、特徴量生成部114は、上記(a)において、高自己相関データを使用せずに(当該時系列データ群に含めずに)相関行列を生成することも可能である。例えば、基準時系列データに周期性が無く、高自己相関データを生成することができない場合でも相関行列を生成することができる。当然、意図的に高自己相関データを含めずに相関行列を生成してもよい。このような場合、基準時系列データ及び高相互相関データの各々において、単独で変化点が発生した際に、この変化点を検出することができる。
Here, the feature
一方、上記(a)のように、高自己相関データも使用して(当該時系列データ群に含めて)相関行列を生成することにより、相関行列を構成する時系列データ全体におけるデータの傾向変化や異常をも変化点発生として捉えることが可能となるのである。 On the other hand, as shown in (a) above, by generating a correlation matrix using high autocorrelation data (included in the time-series data group), the trend change of data in the entire time-series data constituting the correlation matrix It is also possible to grasp the abnormalities as abnormal points.
ここで、上述した相関行列を用いた特徴量生成処理の前処理として、相関行列を生成するための時系列データ群に含まれる時系列データに対し、ボリューム比をそろえる正規化処理を行うことも好ましい。ここで、ボリューム比とは、各時系列データを横軸が時間であるグラフに表した場合における縦軸スケールの互いの比である。 Here, as a pre-processing of the feature value generation process using the correlation matrix described above, a normalization process for aligning the volume ratio may be performed on the time-series data included in the time-series data group for generating the correlation matrix. preferable. Here, the volume ratio is a ratio between the vertical scales when each time series data is represented in a graph in which the horizontal axis is time.
例えば、当該時系列データ群内の時系列データにおいて、他の時系列データに比べてボリューム比の小さいものがある場合、この時系列データのデータ値に変化が生じたとしても特徴量(固有ベクトルと代表ベクトルとのなす角度)には相応する変化が生じにくい。すなわち、ボリューム比のより小さな時系列データにおけるデータ値の変動は、ボリューム比のより大きなデータにまぎれてしまい、特徴量に反映されにくい。 For example, if some time series data in the time series data group have a smaller volume ratio than other time series data, even if a change occurs in the data value of this time series data, the feature amount (eigenvector and Corresponding changes are unlikely to occur in the angle formed with the representative vector. That is, data value fluctuations in time-series data with a smaller volume ratio are covered by data with a larger volume ratio and are not easily reflected in the feature amount.
そこで、当該時系列データ群内の時系列データにおける縦軸スケールを揃える(ボリューム比を一定にする又は所定範囲内に収める)、すなわちデータ値を正規化することによって、各時系列データに表れているデータ値の変化を、確実に特徴量に反映させるようにする。その結果、より漏れの少ない確実な変化点検出を実施することが可能となるのである。特に、特徴量生成部114では、複数の時系列データをまとめて特徴量生成処理を行うので、正規化処理を行うことは非常に有効となる。
Therefore, by aligning the vertical scale in the time-series data in the time-series data group (with the volume ratio constant or within a predetermined range), that is, by normalizing the data value, it appears in each time-series data. The change of the data value is surely reflected in the feature value. As a result, it is possible to carry out reliable change point detection with less leakage. In particular, since the feature
なお、以上に説明した相関行列生成部114cで生成される相関行列は、相関係数に相当する値を行列要素とするものだけでなく、例えば、この相関係数に対応する分散・共分散に相当する値を行列要素とするものも含むものとする。言い換えると、時系列データの相関行列生成処理と数学的に同様の意味を有する処理は、相関行列生成部114cでの処理に含まれるとする。
Note that the correlation matrix generated by the correlation
図3は、生成された相関行列及び時系列データリストの一実施例を示すテーブルである。 FIG. 3 is a table showing an example of the generated correlation matrix and time-series data list.
図3には、図2に示した実施例において特徴量生成部114で生成された相関行列と、相互相関データ決定部113で生成された時系列データリストとが示されている。このうち、相関行列は、基準時系列データA、高自己相関データA'及び高相互相関データCを含む時系列データ群から構成されている。また、時系列データリストは、基準時系列データAに対して「果」となる時系列データBをそのリストに含んでいる。これらの相関行列及び時系列データリストは、図3のように、基準時系列データAの属性(補助データ)として記録されていることも好ましい。
FIG. 3 shows a correlation matrix generated by the feature
図4は、特徴量生成部114における特徴量時系列データを生成する処理の一実施形態を説明するための模式図である。
FIG. 4 is a schematic diagram for explaining an embodiment of a process for generating feature amount time-series data in the feature
図4によれば、最初に、1つの基準時系列データ、対応する1つの高自己相関データ、及び対応する1つ又は複数の高相互相関データを含む時系列データ群の各時系列について、時刻(t-M)から時刻tまでのデータを有する時系列データを取得する。図4では、時刻(t-M)から時刻tまでのウィンドウによって取り出された時刻(t-M)〜tにおける、基準時系列データ、高自己相関データ及び高相互相関データの3つが取り出されている。 According to FIG. 4, first, for each time series of a time series data group including one reference time series data, one corresponding high autocorrelation data, and one or more corresponding high cross-correlation data, Time-series data having data from (tM) to time t is acquired. In FIG. 4, three pieces of reference time-series data, high autocorrelation data, and high cross-correlation data are extracted from time (t-M) to t extracted by a window from time (t-M) to time t.
次に、これらの時系列データを、系列k(=1, 2,・・・, Nk)の時系列データXkとして、次式
(5) Xk=[xk1, xk2,・・・, xk(M+1)]
で表すと、グループ内の各時系列データを列データとした行列Xの転置行列XTは、
(6) XT=[X1, X2,・・・, XNk]
の形で表される。次いで、このような行列XT(X)を用いて、時刻tでの相関行列(疑似相関行列)Ctを、次式
(7)Ct=m-1 X・XT
によって生成する。また、さらに、この生成した相関行列Ctの第一主成分固有ベクトルwを算出する。
Next, these time series data are set as time series data X k of series k (= 1, 2,..., N k ), and the following equation (5) X k = [x k1 , x k2 ,.・, X k (M + 1) ]
Is represented by the transposed matrix X T of the matrix X using the time series data in the group as column data.
(6) X T = [X 1 , X 2 , ..., X Nk ]
It is expressed in the form of Next, using such a matrix X T (X), a correlation matrix (pseudo correlation matrix) C t at time t is expressed by the following equation (7) C t = m −1 X · X T
Generate by. Also, further, it calculates a first principal component eigenvectors w of the generated correlation matrix C t.
次に、生成した相関行列Ctの各列成分(各行成分)をベクトル成分とした、列毎(行毎)の代表ベクトルを生成する。この列毎(行毎)の代表ベクトルakは、基準時系列データ、高自己相関データ、及び1つ以上の高相互相関データのうち、当該列(行)に対応するいずれか1つの時系列データについての代表ベクトルとなっている。 Next, a representative vector for each column (for each row) is generated using each column component (each row component) of the generated correlation matrix C t as a vector component. The representative vector a k for each column (row) is one of the time series corresponding to the column (row) among the reference time series data, the high autocorrelation data, and one or more high cross correlation data. It is a representative vector for data.
次いで、算出した固有ベクトルwと、時系列データXkについての代表ベクトルakとのなす角度Fk(t)を、次式
(8) Fk(t)=cos-1(wT・ak)
によって算出する。この時刻tにおいて算出された角度Fk(t)を、時系列データXkのスカラ特徴量とし、さらに、次式
(9) F(t)=[F1(t), F2(t),・・・, FNk(t)]
で表された時刻tでの特徴量の組F(t)を算出する。
Then, the eigenvector w calculated, when the angle between the representative vector a k of the series data X k F k a (t), the following equation (8) F k (t) = cos -1 (w T · a k )
Calculated by The angle F k (t) calculated at the time t is set as the scalar feature amount of the time series data X k . Further, the following equation (9) F (t) = [F 1 (t), F 2 (t) , ..., F Nk (t)]
A set F (t) of feature quantities at time t expressed by
次いで、以上に述べた時刻tでの特徴量の組F(t)の算出処理を、tを1単位だけ増分させた時刻t+1において繰り返し、時刻t+1での特徴量の組F(t+1)を算出する。具体的には、時刻(t-M+1)から時刻(t+1)までのウィンドウによって取り出された時刻(t-M+1)〜(t+1)の時系列データから特徴量の組F(t+1)を算出する。このように、順次経過する時刻t+p(p=1, 2,・・・)毎に、特徴量の組F(t+p)を算出して記憶していくことで、F(t), F(t+1), F(t+2),・・・といったデータ列である特徴量時系列データを生成することができる。ここで、t+pは、時刻tから見て、時系列データに係る時刻の時間単位(増分)のp倍だけの時間が経過した時点の時刻を表している。 Next, the process of calculating the feature value set F (t) at time t described above is repeated at time t + 1 when t is incremented by one unit, and the feature value set F (at time t + 1) t + 1) is calculated. Specifically, a set of feature values is obtained from time series data of times (t-M + 1) to (t + 1) extracted by a window from time (t-M + 1) to time (t + 1). F (t + 1) is calculated. In this way, by calculating and storing the feature value set F (t + p) for each time t + p (p = 1, 2,...) That sequentially elapses, F (t) , F (t + 1), F (t + 2),..., Feature quantity time-series data can be generated. Here, t + p represents the time when a time corresponding to p times the time unit (increment) of the time related to the time series data has elapsed as viewed from time t.
以上説明した特徴量時系列データの生成処理をまとめると、以下の通りとなる。
(a)最初に第N(N≧1)の期間(ウィンドウ)に係る相関行列生成用の時系列データ群から、第Nの時点での(疑似)相関行列を生成し、
(b)生成した(疑似)相関行列の第一主成分固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素から生成される代表ベクトルとのなす角度(向きの差)に対応するスカラ値を、第Nの時点での当該1つの時系列データに係る特徴量とし、
(c)次いで、第Nの期間から見て時間単位分だけ時間経過方向にずれた第(N+1)の期間(ウィンドウ)に係る当該時系列データ群から、第Nの時点に次ぐ第(N+1)の時点での(疑似)相関行列を生成し、
(d)生成した(疑似)相関行列の固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素から生成される代表ベクトルとのなす角度(向きの差)に対応するスカラ値を、第(N+1)の時点での当該1つの時系列データに係る特徴量とし、
(e)このような処理を、N値を順次1だけ増分させる形で繰り返して、特徴量時系列データを生成する。
このように、時刻の経過とともにウィンドウをずらして新たな時系列データのバッチが取得される毎に固有値解析を行い、特徴量時系列データを導出するバッチ処理が行われるのである。
The generation process of the feature amount time series data described above is summarized as follows.
(A) First, a (pseudo) correlation matrix at the Nth time point is generated from a time series data group for generating a correlation matrix related to an Nth (N ≧ 1) period (window),
(B) Angle (direction difference) between the first principal component eigenvector of the generated (pseudo) correlation matrix and a representative vector generated from a matrix element related to one time-series data included in the time-series data group A scalar value corresponding to is a feature amount related to the one time series data at the Nth time point,
(C) Next, from the time-series data group related to the (N + 1) th period (window) shifted in the time lapse direction as viewed from the Nth period, the (N + 1) th time after the Nth time point Generate a (pseudo) correlation matrix at
(D) A scalar corresponding to an angle (direction difference) between the eigenvector of the generated (pseudo) correlation matrix and a representative vector generated from a matrix element related to one time-series data included in the time-series data group The value is a feature amount related to the one time-series data at the (N + 1) th time point,
(E) Such processing is repeated in such a manner that the N value is incremented by 1 in order to generate feature amount time-series data.
In this way, each time a new batch of time series data is acquired by shifting the window with the passage of time, eigenvalue analysis is performed, and batch processing for deriving feature amount time series data is performed.
なお、実際には、特徴量生成部114は、変化点検出対象として入力された時系列データの各々を基準時系列データとして、当該基準時系列データ(X)毎に、特徴量の組F(t)の時系列である特徴量時系列データを算出することができる。この場合、変化点検出対象として入力された時系列データの数だけ、相関行列及び特徴量時系列データが生成されることになる。
Actually, the feature
図1に戻って、特徴量生成部114は、生成した特徴量時系列データを、対応する基準時系列データに対応付けた形で特徴量時系列記憶部104に出力する。特徴量時系列記憶部104は、入力した特徴量時系列データを記憶するとともに、要求に応じて又は適宜、記憶した特徴量時系列データを変化点決定部115に出力する。
Returning to FIG. 1, the feature
変化点決定部115は、入力した特徴量時系列データでの特徴量の変動に基づいて、1つの時系列データにおいて発生した変化点を決定する。ここで、上式(9)によって算出される特徴量の組F(t)の時系列データを取得した場合、このF(t)の特徴量時系列データでの特徴量の変動に基づいて、変化点を発生させた時系列データを特定することもできる。
The change
図5は、変化点決定部115における変化点検定処理の一実施形態を説明するための模式図である。
FIG. 5 is a schematic diagram for explaining an embodiment of a change point test process in the change
図5(A)〜(D)には、図2に示した実施例における、各時刻Tでの相関行列と、特徴量生成部114で生成された特徴量時系列データとが示されている。このうち、相関行列は、基準時系列データA、高自己相関データA'及び高相互相関データCを含む時系列データ群から生成されている。また、特徴量時系列データは、
(a)この相関行列の第一主成分固有ベクトルと、基準時系列データAの代表ベクトルとのなす角度であるスカラ特徴量FWA[t]、
(b)この相関行列の第一主成分固有ベクトルと、高自己相関データA'の代表ベクトルとのなす角度であるスカラ特徴量FWA'[t]、及び
(c)この相関行列の第一主成分固有ベクトルと、高相互相関データCの代表ベクトルとのなす角度であるスカラ特徴量FWC[t]
を含むスカラ特徴量の組から構成されている。
5A to 5D show the correlation matrix at each time T and the feature amount time series data generated by the feature
(A) A scalar feature amount F WA [t] that is an angle formed by the first principal component eigenvector of this correlation matrix and the representative vector of the reference time series data A,
(B) a scalar feature F WA ′ [t], which is an angle formed by the first principal component eigenvector of this correlation matrix and the representative vector of the high autocorrelation data A ′, and (c) the first main component of this correlation matrix Scalar feature value F WC [t], which is the angle between the component eigenvector and the representative vector of high cross-correlation data C
Is composed of a set of scalar features including
変化点決定部115は、各時刻において、この特徴量時系列データのスカラ特徴量Fにおける1つ前の時刻での値からの変化分の絶対値が所定閾値FTH以上になった場合、このスカラ特徴量Fの代表ベクトルに係る時系列データにおいて変化点が発生したと判定する。具体的に、図5の実施例においては、この所定閾値FTHを0.1とすると、時刻T=1(図5(A))から時刻T=t(図5(C))までの間、いずれのスカラ特徴量Fにも、この所定閾値FTH以上となる変化は見られない。
When the absolute value of the change from the value at the previous time in the scalar feature value F of the feature value time-series data becomes equal to or greater than the predetermined threshold value F TH at each time point, the change
しかしながら、時刻T=t+1(図5(D))では、高相互相関データCに係るスカラ特徴量Fについて、
(10) FWC[t+1]−FWC[t]=0.45−0.24=0.21>0.1=FTH
となり、所定以上の変化があったと判定される。これにより、変化点決定部115は、時刻t+1において時系列データCに変化点が発生したことを決定し、また、変化点の発生した時系列データを、時系列データCであると特定する。
However, at the time T = t + 1 (FIG. 5D), the scalar feature amount F related to the high cross-correlation data C is
(10) F WC [t + 1] −F WC [t] = 0.45−0.24 = 0.21> 0.1 = F TH
Thus, it is determined that there has been a predetermined change or more. Thereby, the change
このように、変化点決定部115によれば、特徴量Fの組から構成される特徴量時系列データを生成し利用することによって、変化点の発生を検出するだけではなく、当該変化点が発生した時系列データがいずれであるかを特定することも可能となるのである。
As described above, the change
ここで、1つの例として、無線通信ネットワークにおいて通信トラヒックに変化点が発生した基地局単体を特定するためには、従来、膨大な計算処理コストがかかっていた。これに対し、変化点決定部115によれば、特定対象となるいずれの時系列データについても、スカラ量の計算に基づいて変化点を検出するので、変化点を発生させた基地局(時系列)の特定処理における計算コストを抑えることが可能となる。
Here, as one example, in order to identify a single base station where a change point occurs in communication traffic in a wireless communication network, conventionally, a huge calculation processing cost has been required. On the other hand, the change
以上説明したように、変化点決定部115は、
(a)ある時刻でのスカラ特徴量Fと1つ前の時刻でのスカラ特徴量Fとの差が、予め設定された所定閾値FTHを以上となる場合に、当該ある時刻において変化点が発生したと決定する
ことができる。
As described above, the change
(A) When the difference between the scalar feature value F at a certain time and the scalar feature value F at the previous time exceeds a predetermined threshold value F TH , the change point at the certain time is It can be determined that it has occurred.
この場合、具体的には、生成した特徴量時系列データから、時刻毎に、当該時刻でのスカラ特徴量Fと1つ前の時刻でのスカラ特徴量Fとの差(特徴量差)を対応付けて記録した特徴量差時系列データを生成しておき、この特徴量差時系列データを用いて変化点を決定することも好ましい。ここで、この特徴量差を変化点検出スコアとして、この変化点検出スコアが所定スコア以上となる場合に、当該時刻において変化点が発生したと決定してもよい。 In this case, specifically, from the generated feature quantity time-series data, for each time, the difference between the scalar feature quantity F at the time and the scalar feature quantity F at the previous time (feature quantity difference) is calculated. It is also preferable to generate feature amount difference time series data recorded in association with each other and determine a change point using this feature amount difference time series data. Here, using this feature amount difference as a change point detection score, when the change point detection score is equal to or greater than a predetermined score, it may be determined that a change point has occurred at that time.
また、変化点決定の他の方法として、変化点決定部115は、
(b)特徴量時系列データにおけるある時刻でのスカラ特徴量Fと、予め設定された時系列予測モデルにおける当該時刻でのデータ値との差分(誤差)を算出し、この誤差が予め設定された所定閾値以上となる場合に、当該時刻において変化点が発生したと決定する
ことも可能である。
As another method for determining the change point, the change
(B) The difference (error) between the scalar feature value F at a certain time in the feature value time-series data and the data value at the time in the preset time-series prediction model is calculated, and this error is preset. When the predetermined threshold value is exceeded, it is possible to determine that a change point has occurred at that time.
ここで、このような時系列予測モデルとの比較処理は、変化点決定部115のモデル比較部115mで実施される。また、予め設定される時系列予測モデルとして、例えば、時系列データを予測するのに一般的に用いられるAR(自己回帰)モデルを採用してもよい。線形のARモデルでは、目的変数は目的変数の過去値を説明変数とし、モデルを表す多項式の係数は、通常、最尤法で決定される。
Here, the comparison processing with such a time series prediction model is performed by the
図1に戻って、変化点決定部115で決定された変化点の情報は、いずれの時刻において、いずれの時系列データで変化点が発生したかを示す情報を含む変化点検出情報として、変化点情報記憶部105に記録される。また、この変化点検出情報は、入出力制御部117を介し、ディスプレイ107に表示されてもよく、または、通信インタフェース101から外部の情報処理装置に送信されてもよい。変化点検出情報は、さらに、キーボード108等の入力デバイスから入力された変化点検出情報の要求信号に従って、以上に説明したように出力されてもよい。
Returning to FIG. 1, the information on the change point determined by the change
変化点予測部116は、変化点決定部115によって変化点が1つの時点において1つの時系列データで検出された際、
(a)当該1つの時系列データについての時系列データリストを、時系列データリスト蓄積部106から取得し、
(b)取得した時系列データリストが時系列データを含んでいる(Nullではない)場合、すなわち、当該1つの時系列データを「因」とする(正のタイムラグ値が対応付けられた)時系列データが存在する場合、当該リストに含まれている時系列データ(の各々)において、当該1つの時点から当該正のタイムラグ値に係る時間の経過後に、変化点が発生することを予測する。
The change
(A) obtaining a time-series data list for the one time-series data from the time-series data
(B) When the acquired time-series data list includes time-series data (not null), that is, when the one time-series data is “cause” (a positive time lag value is associated) When the series data exists, it is predicted that a change point will occur in the time series data (each) included in the list after the time related to the positive time lag value has elapsed from the one time point.
例えば、図2に示した実施例の場合であって図3に示したような時系列データリストが生成されている場合において、時刻T=t'で時系列データAに変化点が発生したと判定(特定)された際、変化点予測部116は、時刻T=t'+6において、時系列データBに変化点が発生する、と予測することができる。
For example, in the case of the embodiment shown in FIG. 2 and when the time series data list as shown in FIG. 3 is generated, a change point occurs in the time series data A at time T = t ′. When the determination (specification) is made, the change
この時系列データリストに含まれている時系列データは、すでに説明したように、基準時系列データに対して「果」となるデータであり、基準時系列データでの変化を原因とした変化を起こし得る時系列データとなっている。変化点予測部116によれば、このような時系列データリストを利用することによって、変化点の発生を検出するだけではなく、将来の1つの時点で1つの時系列データにおいて変化点が発生する、との予測情報を決定することも可能となるのである。
As described above, the time series data included in this time series data list is data that is a “result” with respect to the reference time series data, and changes caused by changes in the reference time series data. It is time series data that can occur. According to the change
ここで、1つの例として、従来、無線通信ネットワークでは、通信トラヒックにおける変化点発生を予測することが困難であった。これに対し、変化点予測部116によれば、自己相関解析によって生成した自己相関時系列データと、スカラ量の計算によって検出した変化点とに基づいて変化点発生を予測するので、計算コストを抑えつつ、変化点を発生させる基地局(時系列)を事前に特定(予測)することが可能となるのである。
Here, as an example, conventionally, in a wireless communication network, it has been difficult to predict the occurrence of a change point in communication traffic. On the other hand, the change
ちなみに、変化点予測部116は、特徴量生成部114で生成された相関行列を用いて、変化点の発生を予測することもできる。例えば、図5に示した実施例において、時刻T=t+1で時系列データCに変化点が発生したと判定された際、変化点予測部116は、この判定結果を受け、この時系列データCに対して「果」の関係にある時系列データAについて、時刻Tが、
T=(t+1)+|tAC|=t+1+6=t+7 (ここで、タイムラグ値tAC=-6)
において変化点が発生する、と予測することができる。
Incidentally, the change
T = (t + 1) + | t AC | = t + 1 + 6 = t + 7 (where time lag value t AC = -6)
It can be predicted that a change point will occur at.
この変化点予測部116で決定された変化点予測情報は、入出力制御部117を介し、ディスプレイ107に表示されてもよく、または、通信インタフェース101から外部の情報処理装置に送信されてもよい。変化点予測情報は、さらに、キーボード108等の入力デバイスから入力された変化点予測情報の要求信号に従って、以上に説明したように出力されてもよい。次に、機能・処理としては遡るが、特徴量生成部114における特徴量生成処理において、部分空間追跡法を用いた他の実施形態について説明する。
The change point prediction information determined by the change
図6は、特徴量生成部114における特徴量生成処理の他の実施形態を説明するための模式図である。
FIG. 6 is a schematic diagram for explaining another embodiment of the feature quantity generation processing in the feature
特徴量生成処理の他の実施形態として、特徴量生成部114の部分空間追跡部114p(図1)によって実施される、部分空間追跡法を用いた特徴量生成処理について、以下に説明する。
As another embodiment of the feature quantity generation process, a feature quantity generation process using the subspace tracking method performed by the
最初に、比較のため、図4を用いてすでに説明した特徴量生成バッチ処理の概要を、図6(A)に示す。このバッチ処理における特徴量の算出では、時系列データにおける新たな時点でのデータが追加される毎に、所定期間のウィンドウ(図4)内の時系列データのバッチに対し、特徴量算出のための固有値解析を実施することが必要となる。 First, for comparison, FIG. 6A shows an outline of the feature quantity generation batch processing already described with reference to FIG. In the calculation of the feature amount in the batch processing, every time data at a new time point is added in the time series data, the feature amount is calculated for the batch of the time series data in the window (FIG. 4) for a predetermined period. It is necessary to perform eigenvalue analysis of.
一方、図6(B)によれば、部分空間追跡部114p(図1)は、部分空間追跡法を用い、複数の時系列データに係る新たな時点でのデータに基づいて、
(a)当初は、予め設定された初期の固有ベクトルを更新し、
(b)前時点で更新された固有ベクトルが存在する場合、当該前時点で更新された固有ベクトルをさらに更新し、
更新された固有ベクトルと、時系列データ群に含まれる1つの時系列データにおける他の時系列データとの間の相関係数(相互相関関数値)から生成される代表ベクトルとの向きの差(角度)に対応するスカラ値を、この新たな時点での特徴量として、各時点での特徴量を含む特徴量時系列データを生成する。
On the other hand, according to FIG. 6B, the
(A) Initially, the initial eigenvector set in advance is updated,
(B) If there is an eigenvector updated at the previous time point, further update the eigenvector updated at the previous time point,
Difference in direction (angle) between the updated eigenvector and the representative vector generated from the correlation coefficient (cross-correlation function value) between the other time-series data in one time-series data included in the time-series data group The feature value time-series data including the feature value at each time point is generated using the scalar value corresponding to) as the feature value at the new time point.
具体的には、PASTDアルゴリズムとして、時刻tにおいて取得される(時刻(t-M)〜tでの)時系列データを、時刻tでの観測ベクトルxtとして表し、時刻tでの固有ベクトルwtを、次式
(11) yt=wT t-1・xt
dt=β・dt-1+yt 2
et=xt−wt-1・yt
wt=wt-1+et・yt/dt
を用いて算出する。ここで、dtは、時刻tの観測ベクトルxtによって更新された固有値相当量であり、βは忘却係数である。上式(11)によって算出された時刻tでの固有ベクトルwtは、時刻tの観測ベクトルxtによって更新された固有ベクトルに相当する。
Specifically, as the PAST D algorithm, time series data (at time (tM) to t) acquired at time t is represented as an observation vector x t at time t, and an eigenvector w t at time t is expressed as (11) y t = w T t-1 · x t
d t = β ・ d t-1 + y t 2
e t = x t −w t-1・ y t
w t = w t-1 + e t · y t / d t
Calculate using. Here, d t is the eigenvalue equivalent updated by the observation vector x t at time t, and β is a forgetting factor. The eigenvector w t at time t calculated by the above equation (11) corresponds to the eigenvector updated by the observation vector x t at time t.
次いで、算出された固有ベクトルwtと代表ベクトルatとの時刻tでの特徴量Ftを、次式
(12) Ft=cos-1(wt T・at)
を用いて算出する。このような上式(11)及び(12)を用いた処理を、経過する時刻毎に、全ての時系列データの代表ベクトルについて行って特徴量Fの組を算出することにより、当該特徴量Fの組の時系列で構成される特徴量時系列データが生成される。ちなみに、このアルゴリズムの初期パラメータとしての初期固有ベクトルw(0)、及び初期固有値d(0)はそれぞれ、ゼロベクトル以外の任意のベクトル、及びゼロ以外の任意のスカラ値とすることができる。
Next, the feature quantity F t at the time t between the calculated eigenvector w t and the representative vector at is expressed by the following equation (12) F t = cos −1 (w t T · a t )
Calculate using. The processing using the above equations (11) and (12) is performed on the representative vectors of all the time-series data at every elapsed time to calculate a set of feature amounts F, whereby the feature amount F Feature quantity time-series data composed of a set of time series is generated. Incidentally, the initial eigenvector w (0) and the initial eigenvalue d (0) as initial parameters of this algorithm can be any vector other than the zero vector and any scalar value other than zero, respectively.
このように、各時系列で時刻tのデータが追加される毎に、この追加データに対し部分空間追跡法を適用することによって、部分空間追跡法の各種パラメータを更新し、結果として、特徴量Ftも更新されるのである。従って、本実施形態では、データが追加される毎に固有値解析を実施するといった処理の必要がなく、比較的簡易な計算によって特徴量が算出されるので、計算量が低減し処理負担がより軽減される。 In this way, each time time t data is added in each time series, the subspace tracking method is applied to the additional data to update various parameters of the subspace tracking method. F t is also updated. Therefore, in this embodiment, there is no need to perform eigenvalue analysis each time data is added, and feature amounts are calculated by relatively simple calculations, so the calculation amount is reduced and the processing burden is further reduced. Is done.
ちなみに、特徴量生成部114(部分空間追跡部114p)は、変更態様として、
(a)当初、図4に示したようなバッチ処理によって、時系列データ群の(疑似)相関行列を生成して、第一主成分固有ベクトル及び対応する固有値を算出し、
(b)初回の時刻だけ、又は初回の時刻から所定数の時間単位経過後の時刻まで、上記(a)の固有値解析によって、当該時刻での特徴量Fを算出し、
(c)その直後の時刻において、上記(b)で算出された固有ベクトルを初期固有ベクトルとし、部分空間追跡法を用いて、複数の時系列データに係る当該時刻でのデータに基づき、この初期固有ベクトルを更新して、時系列データ群に含まれる1つの時系列データにおける他の時系列データとの間の相関係数(相互相関関数値)から生成される代表ベクトルと、更新された初期固有ベクトルとの向きの差(角度)に対応するスカラ値を、当該新たな時点での特徴量Fとし、
(d)その後、各時刻において、図6(B)に示したような部分空間追跡法を用いた処理によって特徴量Fの組を算出し、特徴量時系列データを生成する
ことも好ましい。
Incidentally, the feature quantity generation unit 114 (
(A) Initially, by batch processing as shown in FIG. 4, a (pseudo) correlation matrix of the time series data group is generated, and the first principal component eigenvector and the corresponding eigenvalue are calculated.
(B) calculating the feature amount F at the time by the eigenvalue analysis of the above (a) only for the first time or from the first time to the time after a predetermined number of time units have elapsed,
(C) At the time immediately thereafter, the eigenvector calculated in the above (b) is set as the initial eigenvector, and this initial eigenvector is determined based on the data at the time related to a plurality of time series data using the subspace tracking method. A representative vector generated from a correlation coefficient (cross-correlation function value) between other time-series data in one time-series data included in the time-series data group, and the updated initial eigenvector The scalar value corresponding to the difference in direction (angle) is defined as the feature value F at the new time point.
(D) After that, at each time, it is also preferable to generate a feature amount time-series data by calculating a set of feature amounts F by processing using a subspace tracking method as shown in FIG. 6B.
なお、さらなる変更態様として、上記(d)での処理に引き続き、
(e)当初から所定期間経過後の時刻において、再度、当該時刻に係る時系列データの(疑似)相関行列を生成し、第一主成分固有ベクトル(及び対応する固有値)を算出して、特徴量Fの組を算出する
ことも好ましい。この後は、新たな時刻毎に、引き続き固有値解析を行って特徴量Fの組を算出してもよいし、または、これらの固有ベクトル及び固有値を部分空間追跡法のパラメータとして順次更新して、当該時刻での特徴量Fの組を算出してもよい。
As a further modification, following the process in (d) above,
(E) Generate a (pseudo) correlation matrix of time-series data relating to the time again at a time after a predetermined period from the beginning, calculate a first principal component eigenvector (and corresponding eigenvalue), and calculate a feature amount It is also preferable to calculate the set of F. After this, at each new time, the eigenvalue analysis may be continued to calculate the set of feature amounts F, or these eigenvectors and eigenvalues may be sequentially updated as parameters of the subspace tracking method, A set of feature values F at time may be calculated.
[変化点検出方法] [Change point detection method]
図7は、本発明による変化点検出方法の一実施形態を示すフローチャートである。以下、図7(A)及び図7(B)を用いて、本実施形態の変化点検出方法におけるフローの概要を説明する。 FIG. 7 is a flowchart showing an embodiment of a change point detection method according to the present invention. Hereinafter, an outline of a flow in the change point detection method of the present embodiment will be described with reference to FIGS. 7A and 7B.
最初に、図7(A)に、時系列データアクセス部111における処理フローを示す。
(S11)各系列の最新時系列データを取得する。
(S12)系列毎に、時系列データを、時系列データ蓄積部102に蓄積する。
First, FIG. 7A shows a processing flow in the time-series
(S11) The latest time series data of each series is acquired.
(S12) The time series data is stored in the time series
(S13)各時系列データにおいて、データ長が所定閾値を超えているか否かを判定する。ここで、偽の判定が行われた場合、判定された時系列データをそのまま、次の変化点検出対象とする。
(S14)一方、ステップS13において真の判定が行われた場合、判定された時系列データにおける最古データから順次、データ長が所定閾値以内となるまでデータを削除した上で、当該時系列データを次の変化点検出対象とする。
(S13) In each time-series data, it is determined whether or not the data length exceeds a predetermined threshold value. Here, if a false determination is made, the determined time-series data is used as the next change point detection target as it is.
(S14) On the other hand, when a true determination is made in step S13, the data is deleted in order from the oldest data in the determined time series data until the data length falls within a predetermined threshold, and then the time series data Is the next change point detection target.
次いで、図7(B)に、変化点検出データ特定・変化点予測処理フローを示す。
(S21)データ長を調整された変化点検出対象の全時系列データを読み込む。
(S22)基準時系列データ毎に、高自己相関データを生成し、相関行列を生成するための時系列データ群に加える。
(S23)基準時系列データ毎に、正のタイムラグ値で所定以上の高相互相関を示すデータを生成し、変化点発生予測のために用いる時系列データリストに加える。
(S24)基準時系列データ毎に、高相互相関データを決定し、相関行列を生成するための時系列データ群に加える。
Next, FIG. 7B shows a change point detection data specifying / change point prediction process flow.
(S21) Read all time-series data subject to change point detection with adjusted data length.
(S22) For each reference time series data, high autocorrelation data is generated and added to the time series data group for generating a correlation matrix.
(S23) For each reference time series data, data indicating a high cross-correlation greater than or equal to a predetermined value with a positive time lag value is generated and added to the time series data list used for predicting the occurrence of a change point.
(S24) High cross-correlation data is determined for each reference time series data and added to the time series data group for generating a correlation matrix.
(S25)基準時系列データ毎に、高自己相関データ及び高相互相関データを含む時系列データ群を用いて相関行列を生成し、当該相関行列の固有ベクトルを算出する。
(S26)基準時系列データ毎に、算出された固有ベクトルと代表ベクトルとのなす角度に相当するスカラ値を特徴量とし、各時刻での特徴量の組から特徴量時系列データを生成・更新する。
(S27)生成・更新した特徴量時系列データの変動に基づいて変化点を検出し、当該変化点を発生させた時系列データを特定する。
(S28)生成・更新した時系列データリストを用いて、変化点を発生させる時系列データを、その推定発生時刻とともに予測する。
以上、ステップS11からステップS28までの処理を各時刻において実施することによって、本変化点検出方法の実施が完了する。
(S25) For each reference time series data, a correlation matrix is generated using a time series data group including high autocorrelation data and high cross correlation data, and an eigenvector of the correlation matrix is calculated.
(S26) For each reference time-series data, a scalar value corresponding to the angle formed between the calculated eigenvector and representative vector is used as a feature quantity, and feature quantity time-series data is generated / updated from a set of feature quantities at each time. .
(S27) A change point is detected based on the variation of the generated / updated feature amount time-series data, and the time-series data causing the change point is specified.
(S28) Using the generated / updated time-series data list, the time-series data for generating the change point is predicted together with the estimated occurrence time.
As described above, by executing the processing from step S11 to step S28 at each time, the execution of the change point detection method is completed.
以上、詳細に説明したように、本発明によれば、変化点検出において、スカラ値であるが故に比較的算出処理負担の小さいスカラ特徴量を利用するので、複数の時系列データを取り扱っていても、変化点検出のための計算コストの増大を抑制することができる。さらに、各時点でのスカラ特徴量を含む特徴量時系列データから変化点を決定するので、リアルタイムに近い形で変化点を適宜検出することが可能となる。 As described above in detail, according to the present invention, since a scalar feature amount having a relatively small calculation processing load is used because of a scalar value, change point detection uses a plurality of time-series data. In addition, it is possible to suppress an increase in calculation cost for detecting the change point. Furthermore, since the change point is determined from the feature amount time-series data including the scalar feature amount at each time point, it is possible to appropriately detect the change point in a form close to real time.
また、複数の時系列データをまとめて処理して特徴量を算出するので、時系列データ毎の個別の変動に大きく影響されずに、より確実に安定して変化点検出を行うことも可能となる。 In addition, since feature values are calculated by processing multiple time series data together, it is possible to detect change points more reliably and stably without being greatly affected by individual fluctuations for each time series data. Become.
特に、基準時系列データとの間で高い相互相関を示す高相互相関データを、相関行列を生成するための時系列データ群にグルーピングしている。また、一実施形態として、基準時系列データとの間で高い自己相関を示す高自己相関データを、この時系列データ群に含めることもできる。このようなグルーピングを行い、互いに所定以上の高い相関を有する複数の時系列データから固有ベクトルを算出するので、より確実に安定して変化点検出を行うことが可能となるのである。 In particular, high cross-correlation data showing a high cross-correlation with reference time-series data is grouped into a time-series data group for generating a correlation matrix. Further, as one embodiment, high autocorrelation data showing high autocorrelation with reference time series data can be included in the time series data group. Since such grouping is performed and eigenvectors are calculated from a plurality of time-series data having a high correlation of a predetermined level or higher, change point detection can be performed more reliably and stably.
さらに、本発明の一実施形態として、変化点を検出した際、グルーピングされた時系列データのいずれにおいて変化点が検出されたのかを特定することも可能となる。また、時系列データにおける変化点発生を予測することもできる。このような特定処理及び予測処理も、時系列データ間の因果関係を考慮することによって可能となるのである。これにより、例えば無線通信ネットワークにおいて、通信トラヒックに変化点を発生させた基地局(時系列)を特定したり、変化点を発生させる基地局(時系列)を事前に特定(予測)したりすることが、計算コストを抑えつつ可能となるのである。 Furthermore, as one embodiment of the present invention, when a change point is detected, it is also possible to specify which of the grouped time-series data the change point is detected. It is also possible to predict the occurrence of change points in time series data. Such identification processing and prediction processing are also possible by considering the causal relationship between the time series data. Thereby, for example, in a wireless communication network, a base station (time series) that generates a change point in communication traffic is specified, or a base station (time series) that generates a change point is specified (predicted) in advance. This is possible while reducing the calculation cost.
ちなみに、時系列データの発生源は、当然に、基地局のような通信中継装置に限定されるものではない。例えば、通信ネットワークを構成する各種端末やサーバ等、製造システムを構成する製造装置、搬送装置及び管理装置等、さらには、マーケット・金融システムを構成する端末、認証サーバ及び顧客管理サーバ等、様々な装置・設備が時系列データの発生源となる。本発明は、当然、そのような発生源を含むシステムにも適用可能なものとなっている。さらに、これらの発生源からの時系列データにおける変化点の検出は、故障検出や障害検知を目的とするものに限定されず、例えば異常監視やアクセスの急変の検知、さらには攻撃・侵入検知等、様々の用途・目的のために有用となるのである。 Incidentally, the source of time-series data is naturally not limited to a communication relay device such as a base station. For example, various terminals and servers that make up a communication network, manufacturing devices that make up a manufacturing system, transportation devices, management devices, etc., and further, terminals that make up a market / financial system, authentication servers, customer management servers, etc. Equipment / equipment becomes the source of time-series data. The present invention is naturally applicable to a system including such a source. Furthermore, detection of change points in time-series data from these sources is not limited to those for fault detection and fault detection, for example, monitoring of abnormalities, detection of sudden changes in access, attack / intrusion detection, etc. This is useful for various purposes and purposes.
また、本発明によれば、今後大きく進展することが予想されるIoT(Internet of Things)の分野でも、多数のセンサや、機器・デバイスから出力される時系列データにおける変化点を検出することによって、監視・管理対象における異常を確実に検知したり、システム環境の変化を適切に把握したりすることが可能となるのである。 In addition, according to the present invention, even in the field of IoT (Internet of Things), which is expected to make great progress in the future, by detecting change points in time series data output from a large number of sensors and devices / devices. Therefore, it is possible to reliably detect an abnormality in the monitoring / management target and appropriately grasp a change in the system environment.
以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲内での種々の変更、修正及び省略は、当業者によれば容易に行うことができる。以上に述べた説明はあくまで例示であって、何ら制約を意図するものではない。本発明は、特許請求の範囲及びその均等物によってのみ制約される。 Various changes, modifications, and omissions of the various embodiments of the present invention described above within the scope of the technical idea and viewpoint of the present invention can be easily made by those skilled in the art. The above description is merely an example, and is not intended to be restrictive. The present invention is limited only by the claims and the equivalents thereof.
1 変化点検出装置
101 通信インタフェース
102 時系列データ蓄積部
103 相関データ記憶部
104 特徴量時系列記憶部
105 変化点情報記憶部
106 時系列データリスト蓄積部
107 ディスプレイ
108 キーボード
111 時系列データアクセス部
112 自己相関データ生成部
113 相互相関データ決定部
114 特徴量生成部
114c 相関行列生成部
114p 部分空間追跡部
115 変化点決定部
115m モデル比較部
116 変化点予測部
117 入出力制御部
DESCRIPTION OF
Claims (12)
基準となる時系列データとの間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを決定する相互相関データ決定手段と、
当該基準となる時系列データと、決定された時系列データとを含む時系列データ群から、1つの時点に係る相関行列を生成し、当該相関行列の固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素をベクトル成分としたベクトルである代表ベクトルとの向きの差に対応するスカラ値を特徴量として、各時点での当該特徴量を含む特徴量時系列データを生成する特徴量生成手段と、
当該特徴量時系列データでの特徴量の変動に基づいて、当該1つの時系列データの変化点を決定する変化点決定手段と
してコンピュータを機能させることを特徴とする変化点検出プログラム。 A change point detection program for functioning a computer mounted on a device that detects a change point indicating a trend change or abnormality from time series data,
Cross-correlation data determining means for determining one or a plurality of time-series data showing high cross-correlation satisfying a predetermined condition at a certain negative time lag value with reference time-series data;
A correlation matrix relating to one time point is generated from a time-series data group including the time-series data serving as the reference and the determined time-series data, and an eigenvector of the correlation matrix and the time-series data group are included. Generates feature value time-series data including the feature value at each time point using a scalar value corresponding to the difference in direction from a representative vector, which is a vector component of matrix elements related to one time-series data, as a feature value. Feature quantity generating means for
A change point detection program that causes a computer to function as a change point determination unit that determines a change point of one time series data based on a change in feature amount in the feature amount time series data.
前記特徴量生成手段は、当該所定条件を満たす高い自己相関を示す時系列データを、当該相関行列を生成するための時系列データ群に含める
ことを特徴とする請求項1に記載の変化点検出プログラム。 The change point detection program further causes the computer to function as autocorrelation data generating means for generating time series data indicating high autocorrelation satisfying a predetermined condition for the reference time series data,
The change point detection according to claim 1, wherein the feature amount generation unit includes time-series data indicating high autocorrelation satisfying the predetermined condition in a time-series data group for generating the correlation matrix. program.
前記変化点決定手段は、当該特徴量時系列データでの特徴量の変動に基づいて、変化点を発生させた時系列データを特定する
ことを特徴とする請求項1又は2に記載の変化点検出プログラム。 The feature amount generation means generates a feature amount for a representative vector that is a vector component of a matrix element related to the time series data for each time series data included in the time series data group, and at each time point Generate feature amount time series data including a plurality of feature amount sets generated for each time series data,
The change inspection according to claim 1 or 2, wherein the change point determination means identifies time-series data in which a change point is generated based on a variation in the feature amount in the feature amount time-series data. Out program.
前記特徴量生成手段は、当該基準となる時系列データ毎に、当該特徴量時系列データを生成する
ことを特徴とする請求項1から3のいずれか1項に記載の変化点検出プログラム。 The cross-correlation data determination means sets each of a plurality of time-series data to be detected as a change point as reference time-series data, and indicates the high cross-correlation for each reference time-series data. Determine one or more time series data,
The change point detection program according to any one of claims 1 to 3, wherein the feature amount generation unit generates the feature amount time-series data for each time-series data serving as the reference.
前記変化点検出プログラムは、前記変化点決定手段によって変化点が1つの時点で決定された時系列データについての当該時系列データリストに含まれた時系列データにおいて、当該1つの時点から当該正のタイムラグに係る時間の経過後に、変化点が発生することを予測する変化点予測手段としてコンピュータを更に機能させる
ことを特徴とする請求項1から4のいずれか1項に記載の変化点検出プログラム。 The cross-correlation data determination means includes a time-series data list including one or a plurality of time-series data indicating high cross-correlation satisfying a predetermined condition at a certain positive time lag value with the reference time-series data. Generate and
In the time-series data included in the time-series data list for the time-series data for which the change point is determined at one time point by the change point determination unit, the change point detection program performs the positive change from the one time point. 5. The change point detection program according to claim 1, further causing the computer to function as a change point prediction unit that predicts that a change point will occur after the lapse of time related to the time lag.
基準となる時系列データとの間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを決定する相互相関データ決定手段と、
部分空間追跡法を用い、当該基準となる時系列データと、決定された時系列データとを含む時系列データ群に係る新たな時点でのデータに基づいて、予め設定された初期の固有ベクトル又は前時点で更新された固有ベクトルを更新し、当該時系列データ群に含まれる1つの時系列データにおける他の時系列データとの間の相関係数から生成されるベクトルと、更新された当該固有ベクトルとの向きの差に対応するスカラ値を、当該新たな時点での特徴量として、各時点での当該特徴量を含む特徴量時系列データを生成する特徴量生成手段と、
当該特徴量時系列データでの特徴量の変動に基づいて、当該1つの時系列データの変化点を決定する変化点決定手段と
してコンピュータを機能させることを特徴とする変化点検出プログラム。 A change point detection program for functioning a computer mounted on a device that detects a change point indicating a trend change or abnormality from time series data,
Cross-correlation data determining means for determining one or a plurality of time-series data showing high cross-correlation satisfying a predetermined condition at a certain negative time lag value with reference time-series data;
Using the subspace tracking method, based on the data at a new time point related to the time-series data group including the time-series data serving as the reference and the determined time-series data, a preset initial eigenvector or previous update the eigenvectors updated in time, and behenate vector generated from the correlation coefficient between the other time series data in one time-series data contained in the time-series data group, and updated the eigenvector A feature value generating means for generating a feature value time-series data including the feature value at each time point as a scalar value corresponding to the difference in direction of
A change point detection program that causes a computer to function as a change point determination unit that determines a change point of one time series data based on a change in feature amount in the feature amount time series data.
基準となる時系列データとの間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを決定する相互相関データ決定手段と、
当該基準となる時系列データと、決定された時系列データとを含む時系列データ群から、1つの時点に係る相関行列を生成し、当該相関行列の固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素をベクトル成分としたベクトルである代表ベクトルとの向きの差に対応するスカラ値を特徴量として、各時点での当該特徴量を含む特徴量時系列データを生成する特徴量生成手段と、
当該特徴量時系列データでの特徴量の変動に基づいて、当該1つの時系列データの変化点を決定する変化点決定手段と
を有することを特徴とする変化点検出装置。 A change point detection device that detects a change point indicating a trend change or abnormality from time series data,
Cross-correlation data determining means for determining one or a plurality of time-series data showing high cross-correlation satisfying a predetermined condition at a certain negative time lag value with reference time-series data;
A correlation matrix relating to one time point is generated from a time-series data group including the time-series data serving as the reference and the determined time-series data, and an eigenvector of the correlation matrix and the time-series data group are included. Generates feature value time-series data including the feature value at each time point using a scalar value corresponding to the difference in direction from a representative vector, which is a vector component of matrix elements related to one time-series data, as a feature value. Feature quantity generating means for
A change point detection apparatus comprising: a change point determination unit that determines a change point of the one time series data based on a variation of the feature quantity in the feature quantity time series data.
前記変化点検出装置は、前記変化点決定手段によって変化点が1つの時点で決定された時系列データについての当該時系列データリストに含まれた時系列データにおいて、当該1つの時点から当該正のタイムラグに係る時間の経過後に、変化点が発生することを予測する変化点予測手段を更に有する
ことを特徴とする請求項9に記載の変化点検出装置。 The cross-correlation data determination means includes a time-series data list including one or a plurality of time-series data indicating high cross-correlation satisfying a predetermined condition at a certain positive time lag value with the reference time-series data. Generate and
In the time series data included in the time series data list of the time series data for which the change point is determined at one time point by the change point determination unit, the change point detection device is configured to perform the positive operation from the one time point. The change point detection apparatus according to claim 9, further comprising a change point prediction unit that predicts that a change point is generated after the time related to the time lag.
基準となる時系列データとの間で、ある負のタイムラグ値において所定条件を満たす高い相互相関を示す1つ又は複数の時系列データを決定するステップと、
当該基準となる時系列データと、決定された時系列データとを含む時系列データ群から、1つの時点に係る相関行列を生成し、当該相関行列の固有ベクトルと、当該時系列データ群に含まれる1つの時系列データに係る行列要素をベクトル成分としたベクトルである代表ベクトルとの向きの差に対応するスカラ値を特徴量として、各時点での当該特徴量を含む特徴量時系列データを生成するステップと、
当該特徴量時系列データでの特徴量の変動に基づいて、当該1つの時系列データの変化点を決定するステップと
を有することを特徴とする変化点検出方法。 A change point detection method in a device for detecting a change point indicating a trend change or abnormality from time series data,
Determining one or a plurality of time-series data exhibiting a high cross-correlation satisfying a predetermined condition at a certain negative time lag value with reference time-series data;
A correlation matrix relating to one time point is generated from a time-series data group including the time-series data serving as the reference and the determined time-series data, and an eigenvector of the correlation matrix and the time-series data group are included. Generates feature value time-series data including the feature value at each time point using a scalar value corresponding to the difference in direction from a representative vector, which is a vector component of matrix elements related to one time-series data, as a feature value. And steps to
A change point detection method comprising: determining a change point of the one time series data based on a variation of the feature quantity in the feature time series data.
前記変化点を決定するステップで変化点が1つの時点で決定された時系列データについての当該時系列データリストに含まれた時系列データにおいて、当該1つの時点から当該正のタイムラグに係る時間の経過後に、変化点が発生することを予測するステップと
を更に有することを特徴とする請求項11に記載の変化点検出方法。 Generating a time series data list including one or a plurality of time series data indicating a high cross-correlation satisfying a predetermined condition at a certain positive time lag value with respect to the reference time series data;
In the time-series data included in the time-series data list for the time-series data in which the change point is determined at one time point in the step of determining the change point, the time corresponding to the positive time lag from the one time point The change point detection method according to claim 11, further comprising a step of predicting that a change point will occur after the elapse of time.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016098654A JP6602256B2 (en) | 2016-05-17 | 2016-05-17 | Program, apparatus and method capable of detecting time series change point based on cross-correlation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016098654A JP6602256B2 (en) | 2016-05-17 | 2016-05-17 | Program, apparatus and method capable of detecting time series change point based on cross-correlation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017207852A JP2017207852A (en) | 2017-11-24 |
JP6602256B2 true JP6602256B2 (en) | 2019-11-06 |
Family
ID=60416868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016098654A Active JP6602256B2 (en) | 2016-05-17 | 2016-05-17 | Program, apparatus and method capable of detecting time series change point based on cross-correlation |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6602256B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020024509A (en) * | 2018-08-06 | 2020-02-13 | 富士通株式会社 | Information processing device, information processing program and distributed processing system |
CN113535990B (en) * | 2020-11-10 | 2023-12-15 | 腾讯科技(深圳)有限公司 | Method, device, storage medium and electronic equipment for determining multimedia content |
CN115408373A (en) * | 2021-05-26 | 2022-11-29 | 中兴通讯股份有限公司 | Data processing method and device, and computer readable storage medium |
CN113421020B (en) * | 2021-07-13 | 2024-06-21 | 神策网络科技(北京)有限公司 | Multi-index abnormal point overlap ratio analysis method |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4468131B2 (en) * | 2004-10-06 | 2010-05-26 | 株式会社エヌ・ティ・ティ・データ | Abnormal value detection device, change point detection device, abnormal value detection method, change point detection method |
JP2008165649A (en) * | 2006-12-29 | 2008-07-17 | Yokogawa Electric Corp | System and method for supporting plant abnormality diagnosis |
EP3051374A4 (en) * | 2013-09-26 | 2017-04-05 | Nec Corporation | Information processing device and analysis method |
JP6587950B2 (en) * | 2016-02-02 | 2019-10-09 | Kddi株式会社 | Program, apparatus, and method capable of detecting time series change point by scalar feature |
-
2016
- 2016-05-17 JP JP2016098654A patent/JP6602256B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017207852A (en) | 2017-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105677538B (en) | A kind of cloud computing system self-adaptive monitoring method based on failure predication | |
US9658916B2 (en) | System analysis device, system analysis method and system analysis program | |
US9274869B2 (en) | Apparatus, method and storage medium for fault cause extraction utilizing performance values | |
JP6602256B2 (en) | Program, apparatus and method capable of detecting time series change point based on cross-correlation | |
US10901832B2 (en) | System for maintenance recommendation based on failure prediction | |
Kim et al. | Bearing fault prognosis based on health state probability estimation | |
EP2963553B1 (en) | System analysis device and system analysis method | |
Niu et al. | Intelligent condition monitoring and prognostics system based on data-fusion strategy | |
US20170235626A1 (en) | Anomaly Fusion on Temporal Casualty Graphs | |
JP6355683B2 (en) | Risk early warning method, apparatus, storage medium, and computer program | |
US20140365179A1 (en) | Method and Apparatus for Detecting and Identifying Faults in a Process | |
Kim et al. | Machine prognostics based on health state estimation using SVM | |
US20200057956A1 (en) | Learning sparsity-constrained gaussian graphical models in anomaly detection | |
US20140365829A1 (en) | Operation management apparatus, operation management method, and program | |
US20070171085A1 (en) | Status monitor apparatus | |
EP2963552B1 (en) | System analysis device and system analysis method | |
CN117076258A (en) | Remote monitoring method and system based on Internet cloud | |
JP6587950B2 (en) | Program, apparatus, and method capable of detecting time series change point by scalar feature | |
CN112380073B (en) | Fault position detection method and device and readable storage medium | |
JP7218765B2 (en) | Time series data processing method | |
Lei et al. | Data-model fusion RUL prediction | |
Hu et al. | Remaining useful life estimation based on asynchronous multisource monitoring information fusion | |
CN118314458A (en) | Building equipment microscopic fault prediction method, device, equipment and storage medium | |
CN118655789A (en) | Automatic adjusting method for environmental adaptability of power distribution terminal | |
Celaya et al. | A discussion on uncertainty representation and interpretation in model-based prognostics algorithms based on kalman filter estimation applied to prognostics of electronics components |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180801 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190529 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191008 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6602256 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |