JP5826892B1 - Change point detection apparatus, change point detection method, and computer program - Google Patents

Change point detection apparatus, change point detection method, and computer program Download PDF

Info

Publication number
JP5826892B1
JP5826892B1 JP2014114303A JP2014114303A JP5826892B1 JP 5826892 B1 JP5826892 B1 JP 5826892B1 JP 2014114303 A JP2014114303 A JP 2014114303A JP 2014114303 A JP2014114303 A JP 2014114303A JP 5826892 B1 JP5826892 B1 JP 5826892B1
Authority
JP
Japan
Prior art keywords
trend
series
change point
calculated
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014114303A
Other languages
Japanese (ja)
Other versions
JP2015228182A (en
Inventor
克彦 永倉
克彦 永倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yanmar Co Ltd
Original Assignee
Yanmar Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yanmar Co Ltd filed Critical Yanmar Co Ltd
Priority to JP2014114303A priority Critical patent/JP5826892B1/en
Application granted granted Critical
Publication of JP5826892B1 publication Critical patent/JP5826892B1/en
Publication of JP2015228182A publication Critical patent/JP2015228182A/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】簡易な方法で外れ値の影響を低減させて変化点を検出することができる変化点検出装置、変化点検出方法、及びコンピュータプログラムを提供する。【解決手段】時系列的に連続する事象に対応する一連の値からなる系列を入力し、前記値を時系列に記録する記録手段と、前記系列における事象の変化点を検出する検出手段とを備える変化点検出装置において、前記検出手段は、前記記録手段に記録されている前記系列の記録期間中におけるトレンドをトレンドモデルに基づき算出するトレンド算出手段と、該トレンド算出手段が算出したトレンドの勾配を算出する勾配算出手段と、算出された勾配のマハラノビスの汎距離を算出する汎距離算出手段とを備え、前記検出手段は、算出されたマハラノビスの汎距離に基づき変化点を検出する。【選択図】図9A change point detection apparatus, a change point detection method, and a computer program capable of detecting a change point by reducing the influence of an outlier by a simple method. Recording means for inputting a series of values corresponding to events that are continuous in time series, recording the values in time series, and detecting means for detecting change points of events in the series. In the change point detecting apparatus, the detecting means includes a trend calculating means for calculating a trend during the recording period of the series recorded in the recording means based on a trend model, and a trend gradient calculated by the trend calculating means. And a distance calculation means for calculating the Mahalanobis general distance of the calculated gradient, and the detecting means detects a change point based on the calculated Mahalanobis general distance. [Selection] Figure 9

Description

本発明は、時系列的に変化する事象を分析して将来の事象を予測する方法に関し、特に、時系列的な事象に対応する値の系列から、外れ値の影響を低減させて事象の変化点を高精度に検出することができる変化点検出装置、変化点検出方法、及びコンピュータを変化点検出装置として機能させるコンピュータプログラムに関する。   The present invention relates to a method for predicting a future event by analyzing an event that changes in time series, and in particular, from a series of values corresponding to a time series event, the influence of outliers is reduced to change the event. The present invention relates to a change point detection apparatus, a change point detection method, and a computer program that causes a computer to function as a change point detection apparatus.

経時的に変化する事象について、該事象に係る任意の時点までの時系列データを用いて以後の変化を予測することは様々な分野で有用である。例えば為替、株価の過去の推移の観測に基づいて一日後、一週間後、半年後の為替又は株価の予測を行なったり、製品の販売実績に基づいて次期の需要予測を求めたりすることは、人間の経験及び判断力に基づいて行なわれている。上述の為替、株価、製品需要などの予測は非常に困難であるが、それらの予測が人間の主観を除去した上で高精度に実現することが可能であるとすれば、生産、販売及び在庫管理、並びに物流、製品開発等の計画に非常に有用となる。   For events that change over time, it is useful in various fields to predict subsequent changes using time-series data up to an arbitrary point in time related to the events. For example, forecasting the exchange rate or stock price one day, one week, half a year later based on observations of past changes in the exchange rate or stock price, or obtaining the next demand forecast based on the sales performance of the product, It is based on human experience and judgment. Predicting the above-mentioned exchange rate, stock price, product demand, etc. is very difficult, but if these predictions can be realized with high accuracy after removing human subjectivity, production, sales and inventory It is very useful for management, logistics and product development planning.

発明者はこれまでに、時系列的に変化する種々の事象に関する予測方法を提案してきた(特許文献1等)。既に提案した予測方法により、種々の事象の予測を実現できることを示されているが、更に予測精度を高めることが求められる。発明者が提案してきた予測方法の精度を高めるためには、過去の期間における時系列的な変化傾向(トレンド)を正確に捉えるべく、予測に用いる観測情報から適切に情報を選択することが有効である。情報を選択するための基準として、時系列的に変化する事象について変化点として定義される時点を特定することが有用である。変化点は言わば事象の潮目が変わる時点であり、観測される事象が実際に変化する時点、事象を発現させる状態が変化する時点のことである。変化点の検出は、データマイニング等の各種分野でも有用とされる。   The inventor has so far proposed methods for predicting various events that change in time series (Patent Document 1, etc.). Although it has been shown that prediction of various events can be realized by the previously proposed prediction method, further improvement in prediction accuracy is required. In order to improve the accuracy of the prediction method proposed by the inventor, it is effective to select information appropriately from the observation information used for prediction in order to accurately grasp the time-series change trend in the past period. It is. As a criterion for selecting information, it is useful to specify a time point that is defined as a change point for an event that changes in time series. In other words, the change point is the time when the tide of the event changes, the time when the observed event actually changes, and the time when the state causing the event changes. Detection of change points is useful in various fields such as data mining.

変化点は、観測系によるノイズ、又は突発的な原因による偶然の変動(所謂外れ値)の影響を受ける。ノイズ、外れ値の除去、及び、外れ値の影響を受けない変化点の検出に関しては、統計学、機械学習、データマイニング等の種々の分野にて多くの提案がなされている。特に時系列的な変化を考慮した変化点の検出に関しては、時系列データの性質に対応する統計モデルを用いて外れ値及び変化点を統一的に検出する方法が特許文献2に開示されている。   The change point is affected by noise caused by the observation system or accidental fluctuation (so-called outlier) due to an unexpected cause. Many proposals have been made in various fields such as statistics, machine learning, and data mining regarding noise, outlier removal, and detection of change points that are not affected by outliers. In particular, with regard to detection of change points in consideration of time-series changes, Patent Document 2 discloses a method for uniformly detecting outliers and change points using a statistical model corresponding to the properties of time-series data. .

特許第5068382号公報Japanese Patent No. 5068382 特許第3821225号公報Japanese Patent No. 3812225

特許文献2に開示された方法では、過去の事象の系列に依存する確率密度に基づき、忘却型の自己回帰モデル学習を行なう方法が利用されている。しかしながら、学習におけるパラメータの最適化等に課題が残される。   In the method disclosed in Patent Document 2, a method of performing forgetting type autoregressive model learning based on a probability density depending on a sequence of past events is used. However, problems remain in optimization of parameters in learning.

外れ値及び変化点の検出方法には、統計学的にマハラノビスの汎距離を利用した手法が用いられることがある。しかしながら、マハラノビスの汎距離を利用する場合、変化点を外れ値(ノイズ)と区別して検出することが困難な場合がある。   As a method for detecting outliers and change points, a method that statistically uses Mahalanobis's general distance may be used. However, when using the Mahalanobis generalized distance, it may be difficult to detect the change point separately from the outlier (noise).

発明者は、マハラノビスの汎距離を利用しつつも、時系列的に変化する事象のトレンドを加味することによって容易に変化点の検出が可能となるとの知見を得た。   The inventor has obtained the knowledge that the change point can be easily detected by taking into account the trend of events that change in time series, while utilizing the Mahalanobis generalized distance.

本発明は斯かる知見に基づいてなされたものであり、簡易な方法で外れ値の影響を低減させて変化点を検出することができる変化点検出装置、変化点検出方法、及びコンピュータを変化点検出装置として機能させるコンピュータプログラムを提供することを目的とする。   The present invention has been made on the basis of such knowledge, and a change point detection device, a change point detection method, and a computer that can detect a change point by reducing the influence of an outlier by a simple method. An object of the present invention is to provide a computer program that functions as a dispensing device.

本発明に係る変化点検出装置は、時系列的に連続する事象に対応する一連の値からなる系列を1又は複数入力し、1又は複数の前記系列を時系列的に記録する記録手段と、前記事象の記録期間中における変化点を検出する検出手段とを備える変化点検出装置において、前記検出手段は、前記記録手段に記録されている前記系列に基づく時系列データの記録期間中におけるトレンドをトレンドモデルに基づき算出するトレンド算出手段と、該トレンド算出手段が算出したトレンドの勾配を算出する勾配算出手段と、算出された勾配のマハラノビスの汎距離を算出する汎距離算出手段とを備え、前記検出手段は、算出されたマハラノビスの汎距離に基づき変化点を検出するようにしてあることを特徴とする。   The change point detection device according to the present invention, one or a plurality of series consisting of a series of values corresponding to events that are continuous in time series, recording means for recording one or more of the series in time series, A change point detecting device comprising a detecting means for detecting a change point during a recording period of the event, wherein the detecting means is a trend during a recording period of time-series data based on the series recorded in the recording means. A trend calculation means for calculating the slope based on the trend model, a slope calculation means for calculating the slope of the trend calculated by the trend calculation means, and a general distance calculation means for calculating the Mahalanobis general distance of the calculated slope, The detecting means is characterized in that a change point is detected based on the calculated Mahalanobis generalized distance.

本発明に係る変化点検出装置は、前記トレンド算出手段は、前記記録手段に記録されている複数系列に対してマハラノビスの汎距離を算出して前記時系列データとする時系列データ化手段を更に備え、算出された時系列データの記録期間中におけるトレンドをトレンドモデルに基づき算出するようにしてあることを特徴とする。   In the change point detection apparatus according to the present invention, the trend calculation means further includes time series data conversion means for calculating the Mahalanobis generalized distance for the plurality of series recorded in the recording means to obtain the time series data. The trend during the recording period of the calculated time series data is calculated based on the trend model.

本発明に係る変化点検出装置は、前記トレンド算出手段は、前記事象に対応する一連の値が、該値を発現させる状態が前記値に与える影響を表現する関数と白色雑音との和で記述される状態空間モデルに、各時点における前記一連の値がトレンドと白色雑音との和で記述されるトレンドモデル、及び前後する時点におけるトレンドは略等しいとするモデルを適用し、状態空間モデルの解法に基づきトレンドを算出することを特徴とする。   In the change point detection device according to the present invention, the trend calculation means is configured such that a series of values corresponding to the event is a sum of a white noise and a function that expresses an influence of a state in which the value is expressed on the value. To the state space model to be described, a trend model in which the series of values at each time point is described as the sum of the trend and white noise, and a model in which the trends at the time points before and after are approximately equal are applied. Trend is calculated based on the solution method.

本発明に係る変化点検出装置は、前記勾配算出手段は、前後する時点の内、前の時点におけるトレンドから後の時点におけるトレンドへの変化率を算出するようにしてあることを特徴とする。   The change point detection apparatus according to the present invention is characterized in that the gradient calculating means calculates a rate of change from a trend at a previous time point to a trend at a later time point among preceding and following time points.

本発明に係る変化点検出装置は、前記検出手段は、前記汎距離算出手段により算出されたマハラノビスの汎距離を、前記記録期間中におけるマハラノビスの汎距離の最大値で除算した値を求める手段を更に備えることを特徴とする。   In the change point detecting apparatus according to the present invention, the detecting means has means for obtaining a value obtained by dividing the Mahalanobis's general distance calculated by the general distance calculating means by the maximum value of the Mahalanobis's general distance during the recording period. It is further provided with the feature.

本発明に係る変化点検出方法は、時系列的に連続する事象に対応する1又は複数の一連の値からなる系列を入力し、1又は複数の系列を時系列的に記録する記録手段を備えるプロセッサが、前記事象の記録期間中における変化点を検出する変化点検出方法において、前記プロセッサは、前記記録手段に記録されている前記系列に基づく時系列データの記録期間中におけるトレンドをトレンドモデルに基づき算出し、算出されたトレンドの勾配を算出し、算出された勾配のマハラノビスの汎距離を算出し、算出されたマハラノビスの汎距離に基づき変化点を検出することを特徴とする。   The change point detection method according to the present invention includes recording means for inputting a series of one or more series of values corresponding to events that are continuous in time series and recording one or more series in time series. In the change point detection method in which the processor detects a change point during the recording period of the event, the processor uses a trend model as a trend model during the recording period of the time series data based on the series recorded in the recording means. And calculating the gradient of the calculated trend, calculating the Mahalanobis general distance of the calculated gradient, and detecting the change point based on the calculated Mahalanobis general distance.

本発明に係るコンピュータプログラムは、時系列的に連続する事象に対応する1又は複数の一連の値からなる系列を入力し、1又は複数の系列を時系列的に記録する記録手段を備えるコンピュータに、前記事象の記録期間中における変化点を検出させるコンピュータプログラムにおいて、前記コンピュータに、前記記録手段に記録されている前記系列に基づく時系列データの記録期間中におけるトレンドをトレンドモデルに基づき算出するステップと、算出されたトレンドの勾配を算出するステップと、算出された勾配のマハラノビスの汎距離を算出するステップと、算出されたマハラノビスの汎距離に基づき変化点を検出するステップとを実行させることを特徴とする。   A computer program according to the present invention is a computer comprising recording means for inputting a series of a series of one or a plurality of values corresponding to events that are continuous in a time series and recording the one or a plurality of series in a time series. In the computer program for detecting a change point during the recording period of the event, the computer calculates a trend during the recording period of the time series data based on the series recorded in the recording unit based on a trend model. Performing a step, a step of calculating a slope of the calculated trend, a step of calculating a Mahalanobis general distance of the calculated slope, and a step of detecting a change point based on the calculated Mahalanobis general distance. It is characterized by.

本発明では、単一系列又は複数系列の時系列データにおけるトレンドが算出され、トレンドの勾配の周辺との相関強度(類似性)がマハラノビスの汎距離により算出される。変化点は、それまでの時系列データの推移の傾向と比して類似性が低いためにマハラノビスの汎距離が大きく算出されることから、算出結果により変化点が検出可能となる。   In the present invention, a trend in time series data of a single series or a plurality of series is calculated, and the correlation strength (similarity) with the vicinity of the trend gradient is calculated by the Mahalanobis generalized distance. Since the change point has a lower similarity than the trend of the transition of the time series data so far, the Mahalanobis's general distance is calculated to be large, so that the change point can be detected from the calculation result.

本発明では、複数系列の値のマハラノビスの汎距離が算出されて単一系列の時系列データ化され、トレンドが算出される。マハラノビスの汎距離を算出することにより、複数系列の値が影響する事象の総合的なトレンドが算出される。算出された総合的なトレンドの勾配の類似性が算出され、算出結果により複数系列の値についての変化点が検出可能となる。   In the present invention, the Mahalanobis generalized distances of a plurality of series values are calculated, converted into time series data of a single series, and a trend is calculated. By calculating the Mahalanobis's generalized distance, a comprehensive trend of events affected by a plurality of series values is calculated. The similarity of the calculated overall trend gradient is calculated, and the change point for a plurality of series values can be detected based on the calculation result.

本発明では、トレンド算出において、入力される系列を観測系列とする状態空間モデルに、各観測系列は各時点のトレンドと白色雑音との和で記述されるというトレンドモデル、及び前後する時点のトレンドは略等しいというモデルを適用して、状態空間モデルの解法に基づきトレンドが推定算出される。これにより、トレンドの勾配はトレンド変化に敏感に反応する値として算出することが可能となり、トレンドが変化していない場合は、変化の度合いが低く抑えられるように算出される。   In the present invention, in trend calculation, in a state space model in which an input sequence is an observation sequence, a trend model in which each observation sequence is described as a sum of a trend at each time point and white noise, and a trend at a time point before and after The trend is estimated and calculated based on the solution of the state space model by applying a model that is substantially equal. As a result, the trend gradient can be calculated as a value sensitive to the trend change. When the trend is not changed, the trend gradient is calculated so that the degree of change can be kept low.

本発明では、トレンドの勾配として、前後する時点におけるトレンド間において後の時点のトレンドへの変化率が算出される。時間的に後の時点のトレンドへのトレンド増の変化が正値として算出される。   In the present invention, as a trend gradient, a rate of change to a trend at a later time is calculated between trends at preceding and succeeding times. A change in trend increase to a trend at a later point in time is calculated as a positive value.

本発明では、記録期間に亘り算出されたマハラノビスの汎距離が、最大値により正規化される。これにより、最大値との比較によって変化点が検出される。   In the present invention, the Mahalanobis' general distance calculated over the recording period is normalized by the maximum value. Thereby, a change point is detected by comparison with the maximum value.

本発明による場合、トレンドを考慮し、大きな変化を伴う外れ値についてはトレンドが変化したわけではないことを示す変化点スコアが算出され、これにより、外れ値の影響を低減させて簡易な方法で変化点を検出することができる。   In the case of the present invention, in consideration of the trend, a change point score indicating that the trend has not changed is calculated for an outlier with a large change, thereby reducing the influence of the outlier in a simple manner. Change points can be detected.

実施の形態1における検出装置の構成を示すブロック図である。2 is a block diagram illustrating a configuration of a detection device according to Embodiment 1. FIG. 実施の形態1の検出装置による検出処理手順の一例を示すフローチャートである。3 is a flowchart illustrating an example of a detection processing procedure performed by the detection device according to the first embodiment. トレンド勾配の算出概念を示すグラフである。It is a graph which shows the calculation concept of a trend gradient. 実施例1の時系列データDt を示すグラフである。Is a graph showing the series data D t time in Example 1. 実施例1の時系列データDt に対して算出された信号トレンドを示すグラフである。It is a graph showing a signal trend calculated for the time series data D t of Example 1. 図5の一部を拡大した図である。It is the figure which expanded a part of FIG. 実施例1の時系列データDt に対して算出された信号トレンドの勾配を示すグラフである。Is a graph showing the gradient of the calculated signal trends with respect to time-series data D t of Example 1. 実施例1の時系列データDt の信号トレンドの勾配についてのMDを示すグラフである。6 is a graph showing MD regarding the slope of a signal trend of time-series data Dt of Example 1. 実施例1の時系列データDt に対して導出された変化点スコアを示すグラフである。It is a graph showing the derived change point score against time series data D t of Example 1. 実施例1の時系列データDt に対して直接的にMDを算出した場合のグラフである。Is a graph when the calculated directly MD against time series data D t of Example 1. 実施例1の時系列データDt の変化差分を示すグラフである。It is a graph showing changes difference of the time series data D t of Example 1. 図11の変化差分に対して算出されたMDを示すグラフである。It is a graph which shows MD calculated with respect to the change difference of FIG. 図12のMDを最大値で正規化して算出した変化点スコアを示すグラフである。It is a graph which shows the change point score computed by normalizing MD of FIG. 12 with the maximum value. 実施の形態1の検出装置により導出された変化点スコアと、対応する信号値の変化量との関係を示す散布図である。FIG. 6 is a scatter diagram illustrating a relationship between a change point score derived by the detection device according to the first embodiment and a change amount of a corresponding signal value. 比較例にて算出された変化点スコアと、対応する信号値の変化量との関係を示す散布図である。It is a scatter diagram which shows the relationship between the change point score calculated in the comparative example, and the variation | change_quantity of a corresponding signal value. 実施の形態1の検出装置により導出されるCI一致指数の変化点スコアを示すグラフである。4 is a graph showing a change point score of a CI coincidence index derived by the detection device according to the first embodiment. 実施の形態1の検出装置により導出される大口電気使用量の変化点スコアを示すグラフである。6 is a graph showing a change point score of large-scale electricity usage derived by the detection device according to the first embodiment. 実施の形態1の検出装置により導出される日経平均株価の変化点スコアを示すグラフである。6 is a graph showing a change point score of the Nikkei average stock price derived by the detection device of the first embodiment. 実施の形態1の検出装置により導出される消費者物価指数の変化点スコアを示すグラフである。It is a graph which shows the change point score of a consumer price index derived | led-out by the detection apparatus of Embodiment 1. 実施の形態2の検出装置による検出処理手順の一例を示すフローチャートである。10 is a flowchart illustrating an example of a detection processing procedure performed by the detection device according to the second embodiment. 複数系列の信号値の例を示す説明図である。It is explanatory drawing which shows the example of the signal value of multiple series. 実施例3の複数系列の信号値に対して算出されたMD及びMDのトレンドを示すグラフである。It is a graph which shows MD and the trend of MD computed with respect to the signal value of the several series of Example 3. FIG. 実施例3の複数系列の信号値に対して算出されたMDトレンドの勾配を示すグラフである。12 is a graph showing MD trend gradients calculated for a plurality of series of signal values in Example 3. 実施例3の複数系列の信号値から得られたMDトレンドの勾配のMDを示すグラフである。It is a graph which shows MD of the gradient of MD trend obtained from the signal value of multiple series of Example 3. 実施例3の複数系列の信号値に対して導出された変化点スコアを示すグラフである。12 is a graph showing change point scores derived for a plurality of series of signal values in Example 3. 実施例3にて導出された変化点スコアをMDトレンドと比較して示すグラフである。It is a graph which shows the change point score derived | led-out in Example 3 compared with MD trend. 実施例3にて導出された変化点スコアと、複数系列の信号値に係る指標値とを比較するグラフである。It is a graph which compares the change point score derived | led-out in Example 3, and the index value which concerns on the signal value of several series.

以下、本発明の実施の形態を、図面に基づいて具体的に説明する。   Embodiments of the present invention will be specifically described below with reference to the drawings.

(実施の形態1)
図1は、実施の形態1における検出装置1の構成を示すブロック図である。検出装置1は例えばパーソナルコンピュータ、サーバコンピュータ等のコンピュータを用いる。検出装置1は、制御部10、記録部11、一時記憶部12、入力部13及び出力部14を備える。
(Embodiment 1)
FIG. 1 is a block diagram illustrating a configuration of a detection device 1 according to the first embodiment. For example, a computer such as a personal computer or a server computer is used as the detection device 1. The detection device 1 includes a control unit 10, a recording unit 11, a temporary storage unit 12, an input unit 13, and an output unit 14.

制御部10は、CPU(Central Processing Unit )を用いる。制御部10は、以下に説明する検出プログラム1Pに基づき、パーソナルコンピュータを制御し、本実施の形態における検出装置1としての機能を発揮させる。   The control unit 10 uses a CPU (Central Processing Unit). The control unit 10 controls the personal computer based on the detection program 1P described below, and exhibits the function as the detection device 1 in the present embodiment.

記録部11は、ROM(Read Only Memory)、ハードディスクドライブ等の不揮発性メモリを用いる。なお、記録部11は、外付けのハードディスクドライブ、光学ディスクドライブ、通信網を介して接続される他の記録装置であってもよい。すなわち、記録部11とは、制御部10からアクセス可能な1又は複数の情報記録媒体の総称である。   The recording unit 11 uses a nonvolatile memory such as a ROM (Read Only Memory) or a hard disk drive. The recording unit 11 may be an external hard disk drive, an optical disk drive, or another recording device connected via a communication network. That is, the recording unit 11 is a general term for one or a plurality of information recording media accessible from the control unit 10.

記録部11には、本実施の形態の変化点検出方法を実現するための各種手順を含む検出プログラム1Pが記録されている。また、記録部11の記録領域の一部は、信号値を記録する領域として用いられる。制御部10は、記録部11に対して情報の読み書きが可能である。   The recording unit 11 records a detection program 1P including various procedures for realizing the change point detection method of the present embodiment. A part of the recording area of the recording unit 11 is used as an area for recording a signal value. The control unit 10 can read and write information from and to the recording unit 11.

一時記憶部12は、例えば、DRAM(Dynamic Random Access Memory)、SRAM(Static Random Access Memory )等の不揮発性メモリである。一時記憶部12は、制御部10の処理によって発生した情報を一時的に記憶する。   The temporary storage unit 12 is, for example, a nonvolatile memory such as a DRAM (Dynamic Random Access Memory) or an SRAM (Static Random Access Memory). The temporary storage unit 12 temporarily stores information generated by the processing of the control unit 10.

入力部13は、キーボード、マウス等を用い、ユーザの操作に基づき情報を入力する。   The input unit 13 inputs information based on a user operation using a keyboard, a mouse, or the like.

出力部14は、液晶モニタなどの表示部、又はプリンタ等の印刷部を用い、制御部10による情報の処理結果を出力する。   The output unit 14 uses a display unit such as a liquid crystal monitor or a printing unit such as a printer, and outputs information processing results by the control unit 10.

このように構成される検出装置1にて、制御部10が検出プログラム1Pに基づく処理を実行することにより、変化点を検出する。   In the detection apparatus 1 configured as described above, the control unit 10 detects a change point by executing processing based on the detection program 1P.

図2は、実施の形態1の検出装置1による検出処理手順の一例を示すフローチャートである。   FIG. 2 is a flowchart illustrating an example of a detection processing procedure performed by the detection apparatus 1 according to the first embodiment.

制御部10は、入力部13から時系列データである複数の信号値を入力する。制御部10は、入力した複数の信号値を記録部11に記録する(ステップS1)。なお、信号値は入力部13から入力されるもののみならず、通信網を介して制御部10が信号値を入力するようにしてもよいし、他の情報記録媒体から信号値を入力するようにしてもよい。   The control unit 10 inputs a plurality of signal values that are time-series data from the input unit 13. The control unit 10 records the input signal values in the recording unit 11 (step S1). The signal value is not only input from the input unit 13, but the control unit 10 may input the signal value via a communication network, or input the signal value from another information recording medium. It may be.

制御部10は、記録した複数の信号値(観測値)に対し、隣り合う時点のトレンド成分は略等しいというトレンドモデルに基づいて記録期間全体における信号トレンドを算出する(ステップS2)。ステップS2における信号トレンドの算出には、状態空間モデルによる1次のトレンド成分を適用する。具体的には制御部10は、トレンドtn について、式(1)にて表現されるようにトレンドが時間軸において局所的に略一定の値をとり、前のタイミングにおけるトレンドtn-1 に対してtn ≒tn-1 であるというモデル(ランダムウォークモデル、参考:トレンド成分モデル−構造の確率的変化のモデル−、北川源四郎、1993、「FORTRAN77時系列解析プログラミング」、pp.252-263)を、ステップS1で入力した信号値を観測値とする状態空間モデルに当てはめ、カルマンフィルタ及び平滑化処理等の処理を実行することによってトレンドを算出する。 The control unit 10 calculates a signal trend for the entire recording period based on a trend model in which the trend components at adjacent time points are substantially equal to the plurality of recorded signal values (observed values) (step S2). In calculating the signal trend in step S2, a first-order trend component based on the state space model is applied. Specifically, for the trend t n , the trend 10 has a locally constant value on the time axis as expressed by the expression (1), and the trend t n−1 is the trend t n−1 at the previous timing. On the other hand, a model where t n ≈t n-1 (random walk model, reference: trend component model-model of stochastic change of structure-, Genshiro Kitagawa, 1993, "FORTRAN 77 time series analysis programming", pp.252- 263) is applied to the state space model using the signal value input in step S1 as an observation value, and a trend is calculated by executing processes such as a Kalman filter and a smoothing process.

制御部10は、ステップS2で算出したトレンドに対し、風上差分からのトレンド勾配を算出する(ステップS3)。ステップS3において詳細には、制御部10は、各時点について算出されたトレンドに対し、対象としている一の時点の次の時点におけるトレンドへの変化率を算出する。図3は、トレンド勾配の算出概念を示すグラフである。横軸は時間軸を示し、縦軸は算出されたトレンドを示す。ステップS3にて算出されるトレンド勾配は、図3中のGに対応する。   The control unit 10 calculates a trend gradient from the windward difference with respect to the trend calculated in step S2 (step S3). Specifically, in step S <b> 3, the control unit 10 calculates the rate of change to the trend at the next time after the target time for the trend calculated for each time. FIG. 3 is a graph showing a concept of calculating the trend gradient. The horizontal axis represents the time axis, and the vertical axis represents the calculated trend. The trend slope calculated in step S3 corresponds to G in FIG.

制御部10は、ステップS3で算出したトレンド勾配について、マハラノビスの汎距離(以下、MD:Maharanobis’s Distance と言う)を算出する(ステップS4)。これにより、トレンド勾配の類似性が求められる。なお、算出されたMDが近いほどトレンド(変化傾向)が類似し、遠いほどトレンドが非類似であることが示される。   The control unit 10 calculates the Mahalanobis general distance (hereinafter referred to as MD: Maharanobis's Distance) for the trend gradient calculated in step S3 (step S4). Thereby, the similarity of a trend gradient is calculated | required. Note that the closer the calculated MD, the more similar the trend (change tendency), and the farther the calculated MD, the dissimilar trend.

制御部10は、ステップS4で算出したMDに基づき変化点スコアを算出する(ステップS5)。詳細には、制御部10は、入力した信号値の全期間に亘って算出したMDの最大値で、算出されたMD全てを除算する。ステップS5の処理により、期間全体に亘って算出したMDの内の最大値に対応する時点の変化点スコアが1.0となるようにして各時点での変化点スコアが算出される。これにより、非類似性が高いトレンドの勾配に係る時点が変化点として検出される。   The control unit 10 calculates a change point score based on the MD calculated in step S4 (step S5). Specifically, the control unit 10 divides all the calculated MDs by the maximum MD value calculated over the entire period of the input signal value. By the process of step S5, the change point score at each time point is calculated so that the change point score at the time point corresponding to the maximum value of the MDs calculated over the entire period becomes 1.0. Thereby, a time point related to a trend gradient having high dissimilarity is detected as a changing point.

このようにして時系列データである信号値に対して導出される変化点スコアに基づき、信号値の変化点を検出することができる。検出装置1により導出される変化点スコアは、トレンドが考慮されているから、トレンドに従って真に状態が変化したことに応じて推定導出されるものである。このとき上述したように、実施の形態1における検出装置1では、算出した値が基準とする所定の値以上であるか否か等の判定条件は不要である。   In this way, the change point of the signal value can be detected based on the change point score derived for the signal value that is time-series data. The change point score derived by the detection device 1 is estimated and derived in accordance with the fact that the state has truly changed according to the trend because the trend is taken into consideration. At this time, as described above, the detection device 1 according to Embodiment 1 does not require a determination condition such as whether or not the calculated value is equal to or greater than a predetermined value as a reference.

次に、検出装置1による変化点検出方法を適用した具体的な実施例について説明する。   Next, a specific embodiment to which the change point detection method by the detection apparatus 1 is applied will be described.

(実施例1)
実施例としてまず、人工的に発生させた時系列データDt に本発明を適用し、外れ値の影響を低減させることができることを示す。
Example 1
First as an example, the present invention is applied to a series data D t when artificially generated, indicating that it is possible to reduce the influence of outliers.

図4は、実施例1の時系列データDt を示すグラフである。図4の横軸は時間軸に相当するデータの番号を示し、縦軸は信号値を示している。図4に示す時系列データDt は大きく10段階に変化し、各段階で細かく変動する信号値を人工的に発生させたものである。図4中のA〜Iの9つの時点が変化点に対応する。また、実施例1の時系列データDt には、外れ値として扱われるべき局所的に変動する値が含まれている。図4中の符号a,b,cにより外れ値を示している。 Figure 4 is a graph showing the series data D t time in Example 1. The horizontal axis in FIG. 4 indicates the data number corresponding to the time axis, and the vertical axis indicates the signal value. Series data D t time shown in FIG. 4 is changed to 10 stages increases, in which artificially generates a signal value which varies minutely in each stage. Nine time points A to I in FIG. 4 correspond to change points. Further, the time-series data D t of Example 1 includes a locally varying values should be treated as outliers. Outliers are indicated by symbols a, b, and c in FIG.

検出装置1の制御部10によって、図4に示した時系列データDt における変化点A〜Iを変化点として検出し、その際に外れ値a,b,cの影響を低減させることができることを以下に示す。 The control unit 10 of the detection device 1 detects a change point A~I in series data D t time shown in FIG. 4 as a change point, whereby the outlier a, b, that can reduce the effect of c Is shown below.

検出装置1の制御部10は、時系列データDt を入力し(S1)、入力した時系列データDt に対して信号トレンドを算出する(S2)。 Control unit 10 of the detection device 1, when inputs series data D t (S1), calculates the signal trend against time-series data D t inputted (S2).

図5は、実施例1の時系列データDt に対して算出された信号トレンドを示すグラフであり、図6は、図5の一部を拡大して示している。図5及び図6の横軸は時間軸に相当するデータの番号を示し、縦軸はトレンド値(信号値)を示している。図5及び図6中では、太線にて信号トレンドが示され、細線にて演算前の時系列データDt の信号値が示されている。信号トレンドの算出により、図5に示すように、変化点A〜Iにおけるトレンドの変化の幅は、元の信号値の変化の幅と同程度であるものの、外れ値a,b,cに対応するトレンドの変化は、元の信号値の変化の幅の1/3程度に低減されている。 Figure 5 is a graph showing a signal trend calculated for the time series data D t of Example 1, FIG. 6 shows an enlarged part of FIG. 5 and 6, the horizontal axis indicates the data number corresponding to the time axis, and the vertical axis indicates the trend value (signal value). 5 and in Figure 6, the signal trend is indicated by a thick line, the signal value of the time series data D t before operation is shown in a thin line. By calculating the signal trend, as shown in FIG. 5, the width of the trend change at the change points A to I is comparable to the width of the original signal value change, but corresponds to the outliers a, b, and c. The change in trend is reduced to about 1/3 of the change width of the original signal value.

次に検出装置1の制御部10は、算出した信号トレンドの勾配を算出する(S3)。   Next, the control unit 10 of the detection apparatus 1 calculates the slope of the calculated signal trend (S3).

図7は、実施例1の時系列データDt に対して算出された信号トレンドの勾配を示すグラフである。なお図7には比較のために図5のトレンド値(信号値)を併せて示している。図7の横軸は、時間軸に相当するデータの番号を示している。図7の縦軸は、左側にトレンド値(信号値)を示し、右側に算出されたトレンド勾配に対応する値を示している。図7では、変化点において値が増加する場合は勾配が正、値が減少する場合は勾配が負で示されていることがわかる。 Figure 7 is a graph showing the gradient of a signal trend calculated for the time series data D t of Example 1. FIG. 7 also shows the trend values (signal values) of FIG. 5 for comparison. The horizontal axis in FIG. 7 indicates data numbers corresponding to the time axis. The vertical axis in FIG. 7 shows the trend value (signal value) on the left side and the value corresponding to the calculated trend slope on the right side. In FIG. 7, it can be seen that the slope is positive when the value increases at the change point, and the slope is negative when the value decreases.

検出装置1の制御部10は、算出した勾配についてMDを算出する(S4)。   The control part 10 of the detection apparatus 1 calculates MD about the calculated gradient (S4).

図8は、実施例1の時系列データDt の信号トレンドの勾配についてのMDを示すグラフである。図8の横軸は時間軸に相当するデータの番号を示し、縦軸(左側)はMDを示す。なお図8には比較のために図7の信号トレンドの勾配を下部に示し、縦軸(右側)にトレンド勾配に対応する値を示している。図8に示すように、外れ値a,b,cに対応するMDは、変化点A〜Iに対応するMDと比較して値が低く算出され、特に外れ値aに関しては、他の変化点A〜Iと比較して無視できる程度までに値が小さくなっている。 Figure 8 is a graph showing the MD for the slope of the signal trend of the time series data D t of Example 1. The horizontal axis in FIG. 8 indicates the data number corresponding to the time axis, and the vertical axis (left side) indicates MD. For comparison, FIG. 8 shows the slope of the signal trend in FIG. 7 at the bottom, and the vertical axis (right side) shows the value corresponding to the trend slope. As shown in FIG. 8, the MD corresponding to the outliers a, b, c is calculated to be lower than the MD corresponding to the change points A to I. Compared with A to I, the value is small enough to be ignored.

検出装置1の制御部10は、算出したMDを最大値によって除算することによって変化点スコアを算出する(S5)。   The control unit 10 of the detection apparatus 1 calculates the change point score by dividing the calculated MD by the maximum value (S5).

図9は、実施例1の時系列データDt に対して導出された変化点スコアを示すグラフである。図9の横軸は時間軸に相当するデータの番号を示し、縦軸(右側)に変化点スコアを示す。最大値によって除算されているから、変化点スコアは最大値1.0である。なお図9には比較のために図4の時系列データDt の信号値を示し、縦軸(左側)に信号値に対応する値を示している。図9に示すように、変化点A〜I、及び外れ値a,b,c夫々に対応する変化点スコアが導出されていることが確認される。 Figure 9 is a graph showing a been changed point score derived for series data D t time in Example 1. The horizontal axis in FIG. 9 indicates the data number corresponding to the time axis, and the vertical axis (right side) indicates the change point score. Since it is divided by the maximum value, the change point score is a maximum value of 1.0. Note indicates when indicates the signal value of the series data D t, the value corresponding to the signal value on the vertical axis (left side) in FIG. 4 for comparison in Fig. As shown in FIG. 9, it is confirmed that the change point scores corresponding to the change points A to I and the outliers a, b, and c are derived.

このようにして、実施の形態1における検出装置1により、時系列データである信号値に対し、外れ値の影響を低減させて変化点を検出することが可能である。   As described above, the detection device 1 according to the first embodiment can detect the change point by reducing the influence of the outlier with respect to the signal value that is time-series data.

比較として、時系列データDt に対して信号トレンドを算出することなしに、MDを算出した場合の算出結果を挙げる。 For comparison, without calculating the signal trend against time-series data D t, given the calculation results in the case of calculating the MD.

図10は、実施例1の時系列データDt に対して直接的にMDを算出した場合のグラフである。図10の横軸は時間軸に相当するデータの番号を示し、縦軸(右側)はMDを示す。図10には比較のために、図4の時系列データDt の信号値を上部に示し、縦軸(左側)に信号値に対応する値を示している。図10に示すように、全体として値は小さくなるが変化点A〜Iと外れ値を同様にして検出することは困難である。 Figure 10 is a graph when the calculated directly MD against time series data D t of Example 1. The horizontal axis in FIG. 10 indicates the number of data corresponding to the time axis, and the vertical axis (right side) indicates MD. For comparison, FIG. 10 shows the signal value of the time series data Dt of FIG. 4 at the top, and the vertical axis (left side) shows the value corresponding to the signal value. As shown in FIG. 10, although the value becomes smaller as a whole, it is difficult to detect the change points A to I and the outlier in the same manner.

次に他の比較例として、MDを算出する前に信号値の変化差分(風上差分、次の信号値への変化分)を算出した場合の算出結果を挙げる。   Next, as another comparative example, a calculation result when a signal value change difference (windward difference, change to the next signal value) is calculated before MD is calculated will be given.

図11は、実施例1の時系列データDt の変化差分を示すグラフである。図11の横軸は時間軸に相当するデータの番号を示し、縦軸(右側)は変化差分を示す。図11には比較のために図4の時系列データDt の信号値を上部に示している。図12は、図11の変化差分に対して算出されたMDを示すグラフである。図12の横軸は時間軸に相当するデータの番号を示し、縦軸(右側)はMDを示す。図12においても比較のために図4の時系列データDt の信号値を上部に示し、縦軸(左側)に信号値に対応する値を示している。図13は、図12のMDを最大値で正規化して算出した変化点スコアを示すグラフである。図13の横軸は時間軸に相当するデータの番号を示し、縦軸(右側)は変化点スコアを示す。図13においても比較のために図4の時系列データDt の信号値を上部に示し、縦軸(左側)に信号値に対応する値を示している。図8のグラフと比較した場合に、特に外れ値cについて他の変化点H,I等と区別することが困難であることがわかる。 Figure 11 is a graph showing changes difference of the time series data D t of Example 1. The horizontal axis in FIG. 11 indicates the number of data corresponding to the time axis, and the vertical axis (right side) indicates the change difference. It is shown in the upper signal value of the time series data D t in FIG. 4 for comparison in Figure 11. FIG. 12 is a graph showing MD calculated for the change difference of FIG. The horizontal axis in FIG. 12 indicates data numbers corresponding to the time axis, and the vertical axis (right side) indicates MD. Also shows the signal value of the time series data D t in FIG. 4 for comparison in the upper 12 shows values corresponding to the signal value on the vertical axis (left side). FIG. 13 is a graph showing a change point score calculated by normalizing the MD of FIG. 12 with the maximum value. The horizontal axis in FIG. 13 indicates the data number corresponding to the time axis, and the vertical axis (right side) indicates the change point score. Also shows the signal value of the time series data D t in FIG. 4 for comparison in the upper 13 shows values corresponding to the signal value on the vertical axis (left side). When compared with the graph of FIG. 8, it can be seen that it is difficult to distinguish the outlier c from other change points H, I, and the like.

変化点と外れ値とを区別できるか否かについて、実施の形態1の検出装置1により導出された変化点スコアと、比較例にて算出された変化点スコアとを比較して説明する。図14は、実施の形態1の検出装置1により導出された変化点スコアと、対応する信号値の変化量との関係を示す散布図である。これに対し図15は、比較例にて算出された変化点スコアと、対応する信号値の変化量との関係を示す散布図である。図14及び図15では、横軸に信号値の変化量を示し、縦軸に変化点スコアを示している。図14及び図15では、変化点A〜Iを黒丸にて示し、外れ値a,b,cを白抜きの菱形にて示している。変化量は、各時点における前又は後の値からの振れ幅である。例えば図4を参照した場合、変化点Aの変化量は2.5、変化点Bの変化量は3より少し大きい程度、変化点Cの変化量は略ゼロ、変化点Dの変化量は7より少し小さい程度、変化点Eの変化量は10より大きく、変化点Fの変化量は10より少し小さい。変化点Gの変化量は7.5程度、変化点Hの変化量も7前後、変化量Iの変化量も7.5程度である。また、外れ値aの変化量は2.5程度、外れ値bの変化量は6程度、外れ値cの変化量は10より少し小さく見える。定量的には変化量は、各段階における信号値の平均値に対する差分の絶対値として求めた。   Whether or not the change point and the outlier can be distinguished will be described by comparing the change point score derived by the detection apparatus 1 of Embodiment 1 with the change point score calculated in the comparative example. FIG. 14 is a scatter diagram showing the relationship between the change point score derived by the detection apparatus 1 of Embodiment 1 and the corresponding signal value change amount. On the other hand, FIG. 15 is a scatter diagram showing the relationship between the change point score calculated in the comparative example and the change amount of the corresponding signal value. In FIG.14 and FIG.15, the horizontal axis | shaft shows the variation | change_quantity of the signal value, and the vertical axis | shaft has shown the change point score. 14 and 15, the change points A to I are indicated by black circles, and the outliers a, b, and c are indicated by white diamonds. The amount of change is the amount of fluctuation from the value before or after each time point. For example, referring to FIG. 4, the change amount at the change point A is 2.5, the change amount at the change point B is slightly larger than 3, the change amount at the change point C is substantially zero, and the change amount at the change point D is 7 The change amount at the change point E is larger than 10 and the change amount at the change point F is slightly smaller than 10 to a slightly smaller extent. The change amount of the change point G is about 7.5, the change amount of the change point H is about 7, and the change amount of the change amount I is about 7.5. The change amount of the outlier a is about 2.5, the change amount of the outlier b is about 6, and the change amount of the outlier c is slightly smaller than 10. Quantitatively, the amount of change was determined as the absolute value of the difference with respect to the average value of the signal value at each stage.

図14に示す散布図では、変化点A〜I及び外れ値a,b,cの変化点スコアを変化量に対してプロットした場合、図14に示すように、変化点A〜Iの変化点スコアに対する実線の近似曲線と、外れ値a〜cの変化点スコアに対する破線の近似曲線とは、有意に分離されている。これに対し、図15に示す散布図では、変化点A〜Iの変化点スコアに対する実線の近似曲線と、外れ値a〜cの変化点スコアに対する破線の近似曲線とが重なっており、変化点A〜Iと外れ値a〜cとを区別することが困難であることが示されている。つまり、図15に示すように、トレンドを考慮することなしにMDにより変化点の検出を行なう場合(図11〜図13に示した方法)では、変化量が大きい外れ値については特に変化点スコアも大きく算出されてしまう。一方で本実施の形態1の検出装置1による場合、図14に示すように、トレンドを考慮して変化点の検出を行なうときには、変化量の大きさに惑わされない変化点の検出が可能であると言える。これは、実施の形態1の検出装置1により、大きな変化量を持つ外れ値cに対してトレンドが変化したわけではないことを示す変化点スコアが導出されているということを示している。   In the scatter diagram shown in FIG. 14, when the change points A to I and the change point scores of the outliers a, b, and c are plotted against the change amount, as shown in FIG. 14, the change points of the change points A to I are plotted. The solid approximate curve for the score and the dashed approximate curve for the outliers a to c change point scores are significantly separated. On the other hand, in the scatter diagram shown in FIG. 15, the solid approximate curve with respect to the change point scores of the change points A to I overlaps with the dashed approximate curve with respect to the change point scores of the outliers a to c. It has been shown that it is difficult to distinguish between A to I and outliers a to c. That is, as shown in FIG. 15, when the change point is detected by MD without considering the trend (the method shown in FIGS. 11 to 13), the change point score is particularly large for an outlier having a large change amount. Will be greatly calculated. On the other hand, in the case of the detection apparatus 1 according to the first embodiment, as shown in FIG. 14, when changing points are detected in consideration of the trend, changing points that are not confused by the magnitude of the change amount can be detected. It can be said. This indicates that the detection device 1 of Embodiment 1 has derived a change point score indicating that the trend has not changed with respect to the outlier c having a large change amount.

ランダムウォークモデルというものは本来、ある時点の状態から他の状態への変化傾向は、任意の時点で不定であって次の時点での状態確率は現在の状態に対して正規分布するものであり、時系列データは状態確率の連鎖であるから、任意の時点で次の状態を予測することは不可能であることを記述していると言える。これに対し、本願発明者は、時系列的なデータに関しては、時間的に隣り合う信号値間の関係というのは、局所的にはほぼ等しいながらも時系列的には、ある程度の変化傾向を持ちながら変化していくものであることを表現することにも適しているとして、時系列データにおける外れ値(ノイズ)を除いた変化点を検出する方法に適用可能であるとの知見を得た。発明者はこのような知見に基づき上述したような方法を発明したものである。本発明による場合、本当にトレンドが変化したことに応じて観測された信号値に対応する変化点が推定検出される。   In the random walk model, the change tendency from one state to another is inherently indefinite at any point in time, and the state probability at the next point is normally distributed with respect to the current state. Since time-series data is a chain of state probabilities, it can be said that it is impossible to predict the next state at an arbitrary point in time. On the other hand, the inventor of the present application has a tendency of a certain degree of change in the time series for the time series data, although the relationship between the signal values adjacent in time is almost equal locally. Acquired knowledge that it can be applied to a method of detecting change points excluding outliers (noise) in time-series data, because it is suitable for expressing things that change while holding. . The inventor has invented the method as described above based on such knowledge. According to the present invention, a change point corresponding to the signal value observed in response to the fact that the trend has really changed is estimated and detected.

(実施例2)
次に実際の経済データに対して実施の形態1の検出装置1による変化点検出を実行した場合の例を示す。第1に、内閣府発表の景気動向指数の内のCI(Composite index )一致指数に対して変化点スコアを導出した。図16は、実施の形態1の検出装置1により導出されるCI一致指数の変化点スコアを示すグラフである。図16では、変化点スコアにCI一致指数を併せて示している。図16は、横軸に時間軸を示し、縦軸(左側)にCI一致指数を示し、縦軸(右側)に変化点スコアの大きさを示している。用いられたCI一致指数は、1985年1月から2013年5月までの期間における各月の値である。図16に示すように、2008年後半の景気後退に対応する変化点と2009年後半の景気回復に対応する変化点とが検出されていることがわかる。なお、導出された変化点スコアは、1985年1月から2013年12月までの期間中におけるトレンド勾配のMDの最大値で正規化された値であるから、記録期間中における変化点の変化点スコアは、2008年後半の最大の変化点との比較で算出される。
(Example 2)
Next, an example in which change point detection is performed on the actual economic data by the detection apparatus 1 according to the first embodiment will be described. First, the change score was derived for the CI (Composite index) coincidence index among the economic trend indices announced by the Cabinet Office. FIG. 16 is a graph showing the change point score of the CI coincidence index derived by the detection device 1 of the first embodiment. In FIG. 16, the CI coincidence index is shown together with the change point score. In FIG. 16, the horizontal axis indicates the time axis, the vertical axis (left side) indicates the CI coincidence index, and the vertical axis (right side) indicates the magnitude of the change point score. The CI coincidence index used is the value of each month in the period from January 1985 to May 2013. As shown in FIG. 16, it can be seen that a change point corresponding to a recession in the second half of 2008 and a change point corresponding to a recovery in the second half of 2009 are detected. Since the derived change point score is a value normalized by the maximum value of the MD of the trend gradient during the period from January 1985 to December 2013, the change point of the change point during the recording period. The score is calculated by comparison with the maximum change point in the second half of 2008.

第2に、検出装置1により、内閣府発表の景気動向指数の内の大口電気使用量に対して変化点スコアを導出した。図17は、実施の形態1の検出装置1により導出される大口電気使用量の変化点スコアを示すグラフである。図17においても図16同様に、変化点スコアに大口電気使用量を併せて示している。図17は、横軸に時間軸を示し、縦軸(左側)に大口電気使用量(kW単位)を示し、縦軸(右側)に変化点スコアの大きさを示している。用いられた大口電気使用量は、2003年1月から2013年5月までの期間における各月の値である。図17に示すように、大口電気使用量の変化点スコアの導出により、2008年後半の景気後退に対応する変化点と2009年後半の景気回復に対応する変化点とが検出されていることがわかる。   Secondly, the detection device 1 derived a change point score for the amount of electricity consumed in the large-scale electricity consumption index published by the Cabinet Office. FIG. 17 is a graph illustrating a change point score of the large-scale electricity usage amount derived by the detection device 1 according to the first embodiment. Also in FIG. 17, as with FIG. 16, the large amount of electricity used is shown together with the change point score. In FIG. 17, the horizontal axis indicates the time axis, the vertical axis (left side) indicates the large amount of electricity used (kW unit), and the vertical axis (right side) indicates the magnitude of the change point score. The large-scale electricity usage used is the value for each month in the period from January 2003 to May 2013. As shown in FIG. 17, the change point corresponding to the economic recession in the second half of 2008 and the change point corresponding to the economic recovery in the second half of 2009 are detected by deriving the change point score of the large-scale electricity usage. Recognize.

第3に、検出装置1により、日経平均株価に対して変化点スコアを導出した。図18は、実施の形態1の検出装置1により導出される日経平均株価の変化点スコアを示すグラフである。図18においても図16同様に、変化点スコアに日経平均株価を併せて示している。図18は、横軸に時間軸を示し、縦軸(左側)に日経平均株価を示し、縦軸(右側)に変化点スコアの大きさを示している。用いられた日経平均株価は、2003年1月から2013年5月までの期間における各月の平均値である。図18に示すように、日経平均株価の変化点スコアの導出により、2008年後半の景気後退に対応する変化点と2009年後半の景気回復に対応する変化点と、更には2013年初頭の株価上昇に対応する変化点とが検出されていることがわかる。   Third, a change point score is derived for the Nikkei average stock price by the detection device 1. FIG. 18 is a graph showing the Nikkei Stock Average change point score derived by the detection apparatus 1 according to the first embodiment. 18 also shows the Nikkei Stock Average together with the change point score, as in FIG. In FIG. 18, the horizontal axis indicates the time axis, the vertical axis (left side) indicates the Nikkei Stock Average, and the vertical axis (right side) indicates the magnitude of the change point score. The Nikkei average stock price used is the average value of each month in the period from January 2003 to May 2013. As shown in FIG. 18, by derivation of the Nikkei average stock price change point score, the change point corresponding to the recession in the second half of 2008, the change point corresponding to the economic recovery in the second half of 2009, and the stock price in the beginning of 2013 It can be seen that a change point corresponding to the rise is detected.

第4に、検出装置1により、消費者物価指数に対して変化点スコアを導出した。図19は、実施の形態1の検出装置1により導出される消費者物価指数の変化点スコアを示すグラフである。図19においても図16同様に、変化点スコアに消費者物価指数を併せて示している。図19は、横軸に時間軸を示し、縦軸(左側)に消費者物価指数を示し、縦軸(右側)に変化点スコアの大きさを示している。用いられた消費者物価指数は、2000年1月から2014年1月までの期間における各月の平均値である。図19に示すように、消費者物価指数の変化点スコアの導出により、2008年前半及び後半の景気後退に対応する変化点が検出されていることがわかる。   Fourth, a change point score is derived for the consumer price index by the detection device 1. FIG. 19 is a graph showing a change point score of the consumer price index derived by the detection device 1 of the first embodiment. Also in FIG. 19, the consumer price index is shown together with the change point score as in FIG. In FIG. 19, the horizontal axis indicates the time axis, the vertical axis (left side) indicates the consumer price index, and the vertical axis (right side) indicates the magnitude of the change point score. The consumer price index used is the average value of each month in the period from January 2000 to January 2014. As shown in FIG. 19, it is understood that the change points corresponding to the recession in the first half and the second half of 2008 are detected by deriving the change point score of the consumer price index.

このようにして、時系列的に隣り合う時点におけるトレンドは局所的には略等しいというモデルに基づいてトレンドを算出し、トレンドの勾配、勾配の類似性をMDにより算出することによって、トレンドが変化したと判断される変化点の検出が可能となる。   In this way, the trend is changed by calculating the trend based on the model that the trends at the time points adjacent in time series are substantially equal locally, and calculating the gradient of the trend and the similarity of the gradient by MD. It is possible to detect a change point determined to have been performed.

(実施の形態2)
実施の形態1では、検出装置1は一系列の時系列データDt に対して変化点スコアを導出する構成とした。これに対し実施の形態2では、検出装置1は複数系列の時系列データに対して総合的な変化点スコアを導出する。実施の形態2における検出装置1の構成は、以下に示す処理手順以外は実施の形態1における構成と同一であるから、共通する構成には同一の符号を付して詳細な説明を省略する。
(Embodiment 2)
In the first embodiment, the detection device 1 has been configured to derive the change point score against time series data D t of a single sequence. On the other hand, in the second embodiment, the detection device 1 derives an overall change point score for a plurality of time series data. Since the configuration of the detection apparatus 1 in the second embodiment is the same as the configuration in the first embodiment except for the processing procedure shown below, the same components are denoted by the same reference numerals and detailed description thereof is omitted.

図20は、実施の形態2の検出装置1による検出処理手順の一例を示すフローチャートである。なお図20のフローチャートに示す処理手順の内、実施の形態1の図2のフローチャートに示す処理手順と共通するステップについては同一のステップ番号を付して詳細な説明を省略する。   FIG. 20 is a flowchart illustrating an example of a detection processing procedure performed by the detection device 1 according to the second embodiment. In the processing procedure shown in the flowchart of FIG. 20, steps common to the processing procedure shown in the flowchart of FIG. 2 of the first embodiment are given the same step numbers, and detailed description thereof is omitted.

検出装置1の制御部10は、入力部13から同一期間における時系列データである複数系列の信号値を各入力し、入力した複数系列の信号値を系列ごとに記録部11に記録する(ステップS21)。なお、信号値は入力部13から入力されるもののみならず、通信網を介して制御部10が信号値を入力するようにしてもよいし、他の情報記録媒体から信号値を入力するようにしてもよい。   The control unit 10 of the detection apparatus 1 inputs a plurality of series of signal values that are time-series data in the same period from the input unit 13, and records the input plurality of series of signal values in the recording unit 11 for each series (step) S21). The signal value is not only input from the input unit 13, but the control unit 10 may input the signal value via a communication network, or input the signal value from another information recording medium. It may be.

制御部10は、記録した複数系列の信号値についてのMDを算出する(ステップS22)。具体的に制御部10は、複数系列を夫々次元とする多変量ベクトルとし、対応する時点における各系列の信号値をベクトルの各成分として演算を行なう。   The control unit 10 calculates the MD for the recorded multiple series of signal values (step S22). Specifically, the control unit 10 calculates multivariate vectors each having a plurality of series as dimensions, and calculates the signal value of each series at the corresponding time as each component of the vector.

次に制御部10は、算出される時系列のMDに対し、隣り合う時点のMDのトレンド成分は略等しいというトレンドモデルに基づいて記録期間全体におけるMDのトレンドを算出する(ステップS23)。   Next, the control unit 10 calculates the MD trend over the entire recording period based on a trend model in which the trend components of the MDs at adjacent time points are approximately equal to the calculated time-series MD (step S23).

ステップS23におけるMDトレンドの算出は、実施の形態1の信号トレンドのモデルにおける信号トレンドに代替して行なう。つまり、ステップS23におけるMDトレンドの算出には、状態空間モデルによる1次のトレンド成分を適用する。具体的には制御部10は、MDトレンドMDTn について、式(2)にて表現されるようにトレンドが時間軸において局所的に略一定の値をとり、前のタイミングにおけるトレンドMDTn-1 に対してMDTn ≒MDTn-1 であるというモデル(ランダムウォークモデルを、ステップS22で算出された時系列のMDを観測値とする状態空間モデルに当てはめ、カルマンフィルタ及び平滑化処理等の処理を実行することによってトレンドを算出する。 The calculation of the MD trend in step S23 is performed in place of the signal trend in the signal trend model of the first embodiment. That is, the primary trend component by the state space model is applied to the MD trend calculation in step S23. Specifically, for the MD trend MDT n , the control unit 10 has a locally locally constant value on the time axis as expressed by Expression (2), and the trend MDT n−1 at the previous timing. against the model (random walk model that is MDT n ≒ MDT n-1, fitted to a state space model to observed values of MD series when calculated in step S22, the Kalman filter and the process of smoothing treatment and the like The trend is calculated by executing.

制御部10は、ステップS23にて算出されたMDトレンドに対してMDトレンドの勾配を算出する(ステップS24)。ステップS24における勾配の算出は、実施の形態1の図2のフローチャートに示したステップS3の処理同様に、各時点について、次の時点におけるトレンドへの変化率を算出することである。   The control unit 10 calculates the gradient of the MD trend with respect to the MD trend calculated in step S23 (step S24). The calculation of the gradient in step S24 is to calculate the rate of change to the trend at the next time point for each time point, as in the process of step S3 shown in the flowchart of FIG. 2 of the first embodiment.

以後制御部10は、算出した勾配のMDを算出し(S4)、算出したMDに基づき変化点スコアを算出する(S5)。   Thereafter, the control unit 10 calculates the MD of the calculated gradient (S4), and calculates a change point score based on the calculated MD (S5).

このようにして実施の形態2の検出装置1は、複数系列の信号値について各系列で変化点を各検出するのではなく、複数の項目から総合的に判断される変化点を検出するために、複数系列の信号値から変化点スコアを導出する。   In this way, the detection apparatus 1 according to the second embodiment does not detect each change point in each series for a plurality of signal values, but detects a change point that is comprehensively determined from a plurality of items. Then, a change point score is derived from the signal values of a plurality of series.

以下、実施の形態2の検出装置1による変化点検出方法を適用した具体的な実施例について説明する。   Hereinafter, specific examples to which the change point detection method by the detection apparatus 1 according to the second embodiment is applied will be described.

(実施例3)
図21は、複数系列の信号値の例を示す説明図である。図21には、消費者物価指数を構成する68項目が示されている。実施例3では、68項目の月次データ(68系列の時系列データ)を複数系列の信号値とし、複数系列の信号値の総合的な変化点スコアを検出装置1により導出する。
(Example 3)
FIG. 21 is an explanatory diagram illustrating an example of a plurality of series of signal values. FIG. 21 shows 68 items constituting the consumer price index. In the third embodiment, 68 items of monthly data (68-series time-series data) are used as a plurality of series of signal values, and a total change point score of the plurality of series of signal values is derived by the detection apparatus 1.

検出装置1の制御部10は、複数系列の信号値を入力し(S21)、入力した複数系列の信号値のMDを算出し(S22)、MDのトレンドを算出する(S23)。   The control unit 10 of the detection apparatus 1 inputs a plurality of series of signal values (S21), calculates the MD of the input plurality of series of signal values (S22), and calculates the MD trend (S23).

図22は、実施例3の複数系列の信号値に対して算出されたMD及びMDのトレンドを示すグラフである。図22の横軸は時間軸を示し、縦軸(左側)にMDに対応する数値を示している。このように、68系列の信号値(時系列データ)から定義される各時点における“場”の観測値が単一系列の信号値として求められる。MDトレンドの算出により、複数系列の信号値のMDから、各系列の信号値を発現させる“場”のトレンドが得られる。   FIG. 22 is a graph showing MDs and MD trends calculated for a plurality of series of signal values in Example 3. The horizontal axis in FIG. 22 represents the time axis, and the vertical axis (left side) represents the numerical value corresponding to MD. In this way, the observed value of the “field” at each time point defined from 68 series of signal values (time series data) is obtained as a single series of signal values. By calculating the MD trend, a “field” trend for expressing the signal value of each series is obtained from the MD of the signal values of a plurality of series.

単一系列の信号値として求められた後は、実施の形態1における演算過程と同様である。検出装置1の制御部10は、算出されたMDトレンドに対して勾配を算出する(S24)。   After being obtained as a single series of signal values, the calculation process is the same as in the first embodiment. The control unit 10 of the detection device 1 calculates a gradient with respect to the calculated MD trend (S24).

図23は、実施例3の複数系列の信号値に対して算出されたMDトレンドの勾配を示すグラフである。図23の横軸は時間軸を示し、縦軸(右側)にMDトレンドの勾配に対応する数値を示している。なお図23には、比較のために図22のMD及びMDトレンドを上部に示し、縦軸(左側)にMDに対応する数値を示している。MDトレンドの勾配の算出により、複数系列の信号値を発現させる“場”のトレンドの局所的な変化が得られる。   FIG. 23 is a graph showing MD trend gradients calculated for a plurality of series of signal values according to the third embodiment. The horizontal axis in FIG. 23 represents the time axis, and the vertical axis (right side) represents the numerical value corresponding to the gradient of the MD trend. For comparison, FIG. 23 shows the MD and MD trends in FIG. 22 at the top, and the vertical axis (left side) shows the numerical values corresponding to MD. By calculating the gradient of the MD trend, a local change in the “field” trend that expresses a plurality of signal values can be obtained.

次に検出装置1の制御部10は、算出されたMDトレンドの勾配のMDを算出する(S4)。   Next, the control part 10 of the detection apparatus 1 calculates MD of the gradient of the calculated MD trend (S4).

図24は、実施例3の複数系列の信号値から得られたMDトレンドの勾配のMDを示すグラフである。図24の横軸は時間軸を示し、縦軸(左側)にMDトレンドの勾配のMDに対応する数値を示している。なお図24には、比較のために図23のMDトレンドの勾配を下部に示し、縦軸(右側)にMDトレンドの勾配に対応する値を示している。MDトレンドの勾配のMDを算出することにより、“場”のトレンドの局所的な変化の類似性を示す指標(値が大きいほど遠く、非類似を示す)が得られる。   FIG. 24 is a graph showing MD of the MD trend gradient obtained from the signal values of a plurality of series in Example 3. The horizontal axis in FIG. 24 represents the time axis, and the vertical axis (left side) represents the numerical value corresponding to the MD of the MD trend gradient. For comparison, FIG. 24 shows the MD trend slope of FIG. 23 at the bottom, and the vertical axis (right side) shows the value corresponding to the MD trend slope. By calculating the MD of the slope of the MD trend, an index indicating the similarity of the local change in the “field” trend (the larger the value, the dissimilar).

検出装置1の制御部10は、算出されたMDトレンドの勾配のMDを、最大値によって除算することによって変化点スコアを算出する(S5)。   The control unit 10 of the detection apparatus 1 calculates the change point score by dividing the MD of the calculated MD trend gradient by the maximum value (S5).

図25は、実施例3の複数系列の信号値に対して導出された変化点スコアを示すグラフである。図25の横軸は時間軸を示し、縦軸(右側)に変化点スコアを示している。変化点スコアは最大値で除算されて算出されているから、変化点スコアの最大値は1.0である。図25には比較のために図24のMDトレンドの勾配のMDを上部に示し、縦軸(左側)にMDトレンドの勾配のMDに対応する値を示している。なお図25に示す変化点スコアは、算出された変化点スコアの内、上位30点のみ表示している。このように変化点スコアの最大値と比較して変化点を検出することが可能となる。図25に示すように、2007年5月から2008年3月までの期間において、2000年1月以降最大の変化点の群が検出されている。   FIG. 25 is a graph illustrating change point scores derived for a plurality of series of signal values according to the third embodiment. The horizontal axis in FIG. 25 represents the time axis, and the vertical axis (right side) represents the change point score. Since the change point score is calculated by dividing by the maximum value, the maximum value of the change point score is 1.0. For comparison, FIG. 25 shows the MD of the MD trend gradient in FIG. 24 at the top, and the vertical axis (left side) shows the value corresponding to the MD of the MD trend gradient. Note that the change point score shown in FIG. 25 shows only the top 30 points among the calculated change point scores. In this way, it is possible to detect the change point by comparing with the maximum value of the change point score. As shown in FIG. 25, during the period from May 2007 to March 2008, the largest group of change points from January 2000 is detected.

図26は、実施例3にて導出された変化点スコアをMDトレンドと比較して示すグラフである。図26は、複数系列の信号値に対して算出されたMD及びMDのトレンド(図22)を上部に示し、変化点スコア(図25)を下部に示して比較したものである。図26の横軸は時間軸を示し、縦軸(右側)に変化点スコアを示し、縦軸(左側)にMDに対応する値を示している。図26に示すように、2000年1月以降最大の変化点の群が検出された後は、MDのトレンドが1.0以上を示しており、明らかに“場”が変化していることを読み取ることが可能である。   FIG. 26 is a graph showing the change point score derived in Example 3 in comparison with the MD trend. FIG. 26 shows a comparison between MD and MD trends calculated for a plurality of signal values (FIG. 22) at the top and a change point score (FIG. 25) at the bottom. The horizontal axis of FIG. 26 shows the time axis, the vertical axis (right side) shows the change point score, and the vertical axis (left side) shows the value corresponding to MD. As shown in FIG. 26, after the largest change point group has been detected since January 2000, the MD trend shows 1.0 or more, clearly indicating that the “field” has changed. It is possible to read.

図27は、実施例3にて導出された変化点スコアと、複数系列の信号値に係る指標値とを比較するグラフである。図27には、図21に示した複数項目の月次データを基に導出された変化点スコア(図22)を下部に示し、図21の複数項目に基づく総合指標値である消費者物価指数を上部に示している。また、図27には、実施の形態2の検出装置1によって導出された変化点スコア(ハッチングで示す棒グラフ)に加え、消費者物価指数を単一系列の時系列データDt として実施の形態1の検出装置1により導出した変化点スコア(白抜きの棒グラフ)を共に示している。図27の横軸は時間軸を示し、縦軸(左側)は消費者物価指数に対応する数値を示し、縦軸(右側)は変化点スコアに対応する値を示している。 FIG. 27 is a graph comparing the change point score derived in Example 3 with the index values related to the signal values of a plurality of series. In FIG. 27, the change point score (FIG. 22) derived based on the monthly data of the plurality of items shown in FIG. 21 is shown at the bottom, and the consumer price index, which is a comprehensive index value based on the plurality of items of FIG. Is shown at the top. Further, in FIG. 27, in addition to the derived change point score by the detection apparatus 1 of the second embodiment (bar indicated by hatching), consumer implement price index as time-series data D t of a single series embodiment 1 Both change point scores (open bar graphs) derived by the detection device 1 are shown. The horizontal axis in FIG. 27 represents the time axis, the vertical axis (left side) represents the numerical value corresponding to the consumer price index, and the vertical axis (right side) represents the value corresponding to the change point score.

図27に示すように、2008年前半及び後半の景気後退に対応する消費者物価指数の変化点の前に、2007年5月から、消費者物価指数の構成項目である68系列の信号値の変化点群が検出されている。これにより、2007年の68系列の項目の変化が、翌年の消費者物価指数の変化点に繋がっているという構造の変化が観測される。これにより、消費者物価指数の変化と、該指数に関連するデータの変化との関係性、時間特性等の把握が可能となり、例えば消費者物価指数の変化の予測に、複数項目の月次データにおける変化点を用いるなどの各種産業的な利用が可能となる。   As shown in FIG. 27, before the changing point of the consumer price index corresponding to the recession in the first half and the second half of 2008, the signal values of 68 series which are the constituent items of the consumer price index from May 2007 A change point group is detected. As a result, a change in the structure is observed in which changes in 68 series items in 2007 are linked to changes in the consumer price index in the following year. This makes it possible to grasp the relationship between changes in the consumer price index and changes in the data related to the index, temporal characteristics, etc., for example, predicting changes in the consumer price index, Various industrial uses, such as using a change point, are possible.

このようにして、着目する対象に係る単一系列の時系列データに対する変化点スコアのみならず、前記着目対象に影響する複数系列の時系列データから導出される変化点スコアを加味することにより、着目対象自体のトレンド及びトレンドに影響する“場”を考慮した変化点を、外れ値の影響を低減させて検出することができる。着目対象に関するシステム全体の特性変化の検知、時間特性の定量化などが可能となる。   In this way, by taking into account not only the change point score for the single series of time series data related to the target of interest, but also the change point score derived from the multiple series of time series data affecting the target of interest, The change point in consideration of the trend of the target object itself and the “field” that affects the trend can be detected while reducing the influence of the outlier. It is possible to detect changes in the characteristics of the entire system related to the target of interest, quantify the time characteristics, and the like.

なお、上述のように開示された本実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。   It should be understood that the embodiment disclosed above is illustrative in all respects and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the meanings described above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.

1 検出装置
10 制御部
11 記録部
13 入力部
1P 検出プログラム
DESCRIPTION OF SYMBOLS 1 Detection apparatus 10 Control part 11 Recording part 13 Input part 1P Detection program

Claims (7)

時系列的に連続する事象に対応する一連の値からなる系列を1又は複数入力し、1又は複数の前記系列を時系列的に記録する記録手段と、前記事象の記録期間中における変化点を検出する検出手段とを備える変化点検出装置において、
前記検出手段は、
前記記録手段に記録されている前記系列に基づく時系列データの記録期間中におけるトレンドをトレンドモデルに基づき算出するトレンド算出手段と、
該トレンド算出手段が算出したトレンドの勾配を算出する勾配算出手段と、
算出された勾配のマハラノビスの汎距離を算出する汎距離算出手段と
を備え、
前記検出手段は、算出されたマハラノビスの汎距離に基づき変化点を検出するようにしてある
ことを特徴とする変化点検出装置。
One or a plurality of series consisting of a series of values corresponding to events that are continuous in time series, a recording means for recording one or a plurality of the series in time series, and a change point during the recording period of the events In a change point detection device comprising detection means for detecting
The detection means includes
Trend calculating means for calculating a trend during a recording period of time series data based on the series recorded in the recording means based on a trend model;
A slope calculating means for calculating a slope of the trend calculated by the trend calculating means;
A general distance calculation means for calculating the general distance of Mahalanobis with the calculated gradient,
The detecting means detects a changing point based on the calculated Mahalanobis generalized distance. A changing point detecting apparatus, wherein:
前記トレンド算出手段は、
前記記録手段に記録されている複数系列に対してマハラノビスの汎距離を算出して前記時系列データとする時系列データ化手段を更に備え、
算出された時系列データの記録期間中におけるトレンドをトレンドモデルに基づき算出するようにしてある
ことを特徴とする請求項1に記載の変化点検出装置。
The trend calculation means includes
Further comprising time series data converting means for calculating the Mahalanobis generalized distance for the plurality of series recorded in the recording means and making the time series data,
The change point detection apparatus according to claim 1, wherein a trend during a recording period of the calculated time-series data is calculated based on a trend model.
前記トレンド算出手段は、
前記事象に対応する一連の値が、該値を発現させる状態が前記値に与える影響を表現する関数と白色雑音との和で記述される状態空間モデルに、各時点における前記一連の値がトレンドと白色雑音との和で記述されるトレンドモデル、及び前後する時点におけるトレンドは略等しいとするモデルを適用し、状態空間モデルの解法に基づきトレンドを算出する
ことを特徴とする請求項1又は2に記載の変化点検出装置。
The trend calculation means includes
A series of values corresponding to the event is represented in a state space model described by a sum of a white noise and a function that expresses an influence of a state that expresses the value on the value. 2. A trend model described by the sum of a trend and white noise and a model in which trends at approximately the same time are applied are applied, and the trend is calculated based on a solution of the state space model. The change point detection apparatus according to 2.
前記勾配算出手段は、
前後する時点の内、前の時点におけるトレンドから後の時点におけるトレンドへの変化率を算出するようにしてある
ことを特徴とする請求項1乃至3のいずれか1つに記載の変化点検出装置。
The gradient calculating means includes
The change point detection device according to any one of claims 1 to 3, wherein a rate of change from a trend at a previous time point to a trend at a later time point is calculated from the time points before and after. .
前記検出手段は、
前記汎距離算出手段により算出されたマハラノビスの汎距離を、前記記録期間中におけるマハラノビスの汎距離の最大値で除算した値を求める手段
を更に備えることを特徴とする請求項1乃至4のいずれかに記載の変化点検出装置。
The detection means includes
5. The method according to claim 1, further comprising: means for obtaining a value obtained by dividing the Mahalanobis's general distance calculated by the general distance calculating means by the maximum value of the Mahalanobis's general distance during the recording period. Change point detection apparatus described in 1.
時系列的に連続する事象に対応する1又は複数の一連の値からなる系列を入力し、1又は複数の系列を時系列的に記録する記録手段を備えるプロセッサが、前記事象の記録期間中における変化点を検出する変化点検出方法において、
前記プロセッサは、
前記記録手段に記録されている前記系列に基づく時系列データの記録期間中におけるトレンドをトレンドモデルに基づき算出し、
算出されたトレンドの勾配を算出し、
算出された勾配のマハラノビスの汎距離を算出し、
算出されたマハラノビスの汎距離に基づき変化点を検出する
ことを特徴とする変化点検出方法。
A processor comprising recording means for inputting a series of a series of one or a plurality of values corresponding to events that are continuous in time series and recording the series of one or more series in a time series, during the event recording period In the change point detection method for detecting the change point in
The processor is
A trend during a recording period of time series data based on the series recorded in the recording means is calculated based on a trend model,
Calculate the slope of the calculated trend,
Calculate the Mahalanobis generalized distance of the calculated gradient,
A change point detection method characterized by detecting a change point based on the calculated Mahalanobis generalized distance.
時系列的に連続する事象に対応する1又は複数の一連の値からなる系列を入力し、1又は複数の系列を時系列的に記録する記録手段を備えるコンピュータに、前記事象の記録期間中における変化点を検出させるコンピュータプログラムにおいて、
前記コンピュータに、
前記記録手段に記録されている前記系列に基づく時系列データの記録期間中におけるトレンドをトレンドモデルに基づき算出するステップと、
算出されたトレンドの勾配を算出するステップと、
算出された勾配のマハラノビスの汎距離を算出するステップと、
算出されたマハラノビスの汎距離に基づき変化点を検出するステップと
を実行させることを特徴とするコンピュータプログラム。
In a recording period of the event, a computer comprising recording means for inputting a series of a series of one or a plurality of values corresponding to events that are continuous in time series and recording the series of one or more series in time series In a computer program for detecting a change point in
In the computer,
Calculating a trend during a recording period of time-series data based on the series recorded in the recording means based on a trend model;
Calculating a slope of the calculated trend;
Calculating the Mahalanobis generalized distance of the calculated gradient;
And a step of detecting a change point based on the calculated Mahalanobis generalized distance.
JP2014114303A 2014-06-02 2014-06-02 Change point detection apparatus, change point detection method, and computer program Expired - Fee Related JP5826892B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014114303A JP5826892B1 (en) 2014-06-02 2014-06-02 Change point detection apparatus, change point detection method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014114303A JP5826892B1 (en) 2014-06-02 2014-06-02 Change point detection apparatus, change point detection method, and computer program

Publications (2)

Publication Number Publication Date
JP5826892B1 true JP5826892B1 (en) 2015-12-02
JP2015228182A JP2015228182A (en) 2015-12-17

Family

ID=54776771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014114303A Expired - Fee Related JP5826892B1 (en) 2014-06-02 2014-06-02 Change point detection apparatus, change point detection method, and computer program

Country Status (1)

Country Link
JP (1) JP5826892B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170195231A1 (en) * 2014-04-23 2017-07-06 Bequant S.L. Method and Apparatus for Network Congestion Control Based on Transmission Rate Gradients

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018132918A (en) * 2017-02-15 2018-08-23 日本電信電話株式会社 Data analysis apparatus and data analysis method
JP6848546B2 (en) * 2017-03-09 2021-03-24 沖電気工業株式会社 Change point detection device and change point detection method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004054370A (en) * 2002-07-17 2004-02-19 Nec Corp Autoregressive model learning device for time series data and device for detecting deviated value and changing point using the same
WO2008087968A1 (en) * 2007-01-17 2008-07-24 Nec Corporation Change-point detecting method and apparatus
JP2013156969A (en) * 2012-02-01 2013-08-15 Fuji Xerox Co Ltd Failure prediction system, failure prediction device and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004054370A (en) * 2002-07-17 2004-02-19 Nec Corp Autoregressive model learning device for time series data and device for detecting deviated value and changing point using the same
WO2008087968A1 (en) * 2007-01-17 2008-07-24 Nec Corporation Change-point detecting method and apparatus
JP2013156969A (en) * 2012-02-01 2013-08-15 Fuji Xerox Co Ltd Failure prediction system, failure prediction device and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170195231A1 (en) * 2014-04-23 2017-07-06 Bequant S.L. Method and Apparatus for Network Congestion Control Based on Transmission Rate Gradients
US10263894B2 (en) * 2014-04-23 2019-04-16 Bequant S.L. Method and apparatus for network congestion control based on transmission rate gradients
US10516616B2 (en) 2014-04-23 2019-12-24 Bequant S.L. Method and apparatus for network congestion control based on transmission rate gradients
US11329920B2 (en) 2014-04-23 2022-05-10 Bequant S.L. Method and apparatus for network congestion control based on transmission rate gradients
US11876714B2 (en) 2014-04-23 2024-01-16 Bequant S.L. Method and apparatus for network congestion control based on transmission rate gradients

Also Published As

Publication number Publication date
JP2015228182A (en) 2015-12-17

Similar Documents

Publication Publication Date Title
US10185893B2 (en) Method and apparatus for generating time series data sets for predictive analysis
Wauters et al. A nearest neighbour extension to project duration forecasting with artificial intelligence
Shao et al. A new electricity price prediction strategy using mutual information-based SVM-RFE classification
US20240177075A1 (en) Method and system for hierarchical forecasting
Zhao et al. Price trend prediction of stock market using outlier data mining algorithm
CA3088689C (en) Finite rank deep kernel learning for robust time series forecasting and regression
Yang et al. A pattern fusion model for multi-step-ahead CPU load prediction
JP5826892B1 (en) Change point detection apparatus, change point detection method, and computer program
JP7139932B2 (en) Demand forecasting method, demand forecasting program and demand forecasting device
CA3119351C (en) Extending finite rank deep kernel learning to forecasting over long time horizons
Ahmed et al. Enhancing stock portfolios for enterprise management and investment in energy industry
JP7288189B2 (en) Job power prediction program, job power prediction method, and job power prediction device
CN116703455A (en) Medicine data sales prediction method and system based on time series hybrid model
JP7458268B2 (en) Information processing device, information processing method, computer program and information processing system
JP5826893B1 (en) Change point prediction apparatus, change point prediction method, and computer program
JP6930195B2 (en) Model identification device, prediction device, monitoring system, model identification method and prediction method
JP2016532949A (en) System and method for deriving critical change attributes from data signals that have been selected and analyzed over a period of time to predict future changes in conventional predictors
Li et al. Financial time series prediction based on GGM-GAN
US11042837B2 (en) System and method for predicting average inventory with new items
JP5826348B1 (en) Prediction device, prediction method, and computer program
JP5826891B1 (en) Prediction device, prediction method, and computer program
JP7154468B2 (en) Information processing device, information processing method and information processing program
Alj et al. Dimensionality reduction for predicting students dropout in MOOC
Widodo et al. Enriching time series datasets using nonparametric kernel regression to improve forecasting accuracy
Malhathkar et al. Deep Learning for Time Series Forecasting–With a focus on Loss Functions and Error Measures

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151014

R150 Certificate of patent or registration of utility model

Ref document number: 5826892

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees