WO2010001966A1 - 時系列データ処理装置およびその方法とプログラム - Google Patents

時系列データ処理装置およびその方法とプログラム Download PDF

Info

Publication number
WO2010001966A1
WO2010001966A1 PCT/JP2009/062139 JP2009062139W WO2010001966A1 WO 2010001966 A1 WO2010001966 A1 WO 2010001966A1 JP 2009062139 W JP2009062139 W JP 2009062139W WO 2010001966 A1 WO2010001966 A1 WO 2010001966A1
Authority
WO
WIPO (PCT)
Prior art keywords
time
series data
singular value
prediction
width
Prior art date
Application number
PCT/JP2009/062139
Other languages
English (en)
French (fr)
Inventor
勇気 小阪
遼平 藤巻
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Publication of WO2010001966A1 publication Critical patent/WO2010001966A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Definitions

  • the present invention is based on the priority claim of Japanese patent application: Japanese Patent Application No. 2008-174193 (filed on July 3, 2008), the entire description of which is incorporated herein by reference. Shall.
  • the present invention relates to a technique for processing time series data, and more particularly to a time series prediction technique suitable for suppressing a reduction in prediction accuracy due to a specific time series.
  • Patent Document 1 Time series forecasting technology used for forecasting sales volume a few days ahead or forecasting future stock prices based on the sales performance of the previous day or the previous week is a very important technology for business efficiency and management judgment.
  • Patent Document 2 See Patent Document 2, Patent Document 3, etc.).
  • JP 2006-276970 A Japanese Patent Laid-Open No. 9-101947 JP 2004-54370 A JP-A-5-12240
  • time series prediction technology Although time series prediction technology is practical, time series data includes discontinuous and unique behavior due to changes in the resource environment represented by system expansion and rapid increase in access to web servers. In some cases, the prediction accuracy may decrease.
  • time series prediction of the prediction period is performed by a normal time series prediction unit, the unique behavior may significantly reduce the prediction accuracy.
  • Patent Document 2 discloses a method and a prediction system for quickly extracting a singular value and correcting work, which are a major cause of a decrease in prediction accuracy, while reducing the burden of the analyst's prediction work. According to the invention described in Patent Literature 2, it is possible for an analyst to monitor and analyze time-series data to prevent a decrease in prediction accuracy due to a singular value.
  • Patent Document 2 proposes an accurate and efficient method for calculating a correction value when the cause of occurrence of a singular value is clear.
  • Non-Patent Documents 1, 2, 3, etc. a non-Gaussian state space model is used to process data containing singular values, thereby appropriately eliminating the effects of singular values and smoothing trends including discontinuous jumps.
  • Future prediction accuracy can be expected by re-learning past time-series data and correcting the prediction model.
  • prediction models such as sudden singular values and slowly changing singular values, but prediction models such as long-term discontinuous singular values There are some singular values that cannot be handled. Therefore, in order to prevent a decrease in prediction accuracy due to a singular value, it is necessary to cope with a method other than the prediction model.
  • Patent Document 4 when a condition that can specify the type of a singular value in advance can be set, data corresponding to the type of the singular value is extracted from the database, and the correction amount of the singular value is calculated by a regression equation. Then, the singular value is corrected with the correction amount, and the corrected value is replaced with a singular value as a normal value, but when a future value is predicted from the input data, the singular value included in the input data is Some may reduce the accuracy of predicting future values, and conversely may represent changes in future values. When the singular value included in the input data represents a change in the future value, it may be appropriate to appropriately correct input data other than the singular value without correcting the singular value. For this reason, it is required to replace the entire input data (past time-series data) with corrected time-series data (the above knowledge of the present inventors).
  • An object of the present invention is to provide an apparatus, a method, and a program that can prevent a decrease in prediction accuracy due to a singular value of time series data in time series processing such as time series prediction.
  • the invention disclosed in the present application is generally configured as follows in order to solve the above-described problems.
  • a time-series prediction method for predicting time-series data in a prediction period, wherein the time-series data is used as original data corresponding to the kind of singular value with respect to a singular value in the original data.
  • an apparatus, a method, and a program for performing prediction and predicting time series data after replacing the original data with the corrected time series data are provided.
  • An apparatus including singular value correction means (step, process) for correcting time series data of one time width is provided.
  • the singular value correction means corresponds to the singular value model as the correction of the time-series data of the second time width.
  • the time series data of the time width may be set as a missing value, and the correction excluding the influence of the singular value may be performed.
  • the corrected time-series data of the first time width or the corrected time-series data of the first and second time widths is a prediction period. It is good also as a structure provided to the time series prediction means (process, process) which performs time series prediction.
  • the time series prediction means is the corrected time series data of the first time width, or the corrected first and second time series data.
  • the prediction data related to the second time width may be predicted from the time series data of the first time width.
  • the process of predicting the prediction data related to the second time width is a pre-process for determining the singular value model of the time series data of the second time width.
  • the prediction data related to the second time width including the singular value predicted by the time series prediction means (step, process), and the time of the second time width.
  • a singular value discriminating means (step, process) for discriminating a singular value model of the time series data of the second time width based on the series data may be further included.
  • the second time width prediction data including the singular value predicted by the time series prediction means (step, process), and the second time width time series A configuration may further include correction amount calculation means (steps, processes) for calculating a correction amount based on the data according to a preset singular value model.
  • the singular value correction means treats the time-series data of the second time width as a missing value according to the singular value model, and You may make it output the time series data which correct
  • time series prediction means for predicting the time series data of the second time width from the time series data of the first time width, The time series of the second time width based on the prediction data of the second time width predicted by the time series prediction means (process, process) and the time series data of the second time width.
  • Singular value discrimination means for discriminating a singular value model of data
  • the singular value correction means corrects the time-series data of the first and second time widths corresponding to the singular value model determined by the singular value determination means.
  • the time-series predicting means uses the time-series data obtained by performing correction corresponding to the singular value model for the time-series data of the first and second time widths. You may make it perform prediction of the value of the prediction period after the time width of this.
  • the singular value correction means processing, process
  • the singular value determination means processing, process
  • the time series data of the second time width is treated as a missing value
  • the time series data of the second time width is deleted
  • the corrected time series data of the first time width is replaced with the original first time series data.
  • the time series data of the second time width may be substituted and output.
  • time series prediction means for predicting the time series data of the second time width from the time series data of the first time width, Based on the prediction data of the second time width predicted by the time series prediction means and the time series data of the second time width, the first time value is determined according to a preset singular value model.
  • a correction amount calculating means for calculating a correction amount for the time-series data of the time width; Including The singular value correction means (step, process) corrects the time series data of the first and second time widths according to the correction amount calculated by the correction amount calculation means (step, process), The time series prediction means (step, process) uses the corrected time series data that has been corrected for the time series data of the first and second time widths, and is later than the second time width. It is good also as a structure which estimates the value of the prediction period at the time of this.
  • the singular value correction means treats the time series data of the second time width as a missing value based on the calculated correction amount
  • the time series data of the second time width is deleted, and the corrected time series data of the first time width is replaced with the original time series data of the first and second time widths and output. It may be.
  • the corrected time-series data of the first time width and the time-series data of the second time width are used as the new time-series data of the first time width.
  • age Next, the new time series data to be input is set as the new time series data of the second time width, Prediction on the time series data of the new second time width, time series data of the new first time width, or time series data of the new first time width according to a singular value model;
  • the new time series data of the second time width may be corrected.
  • the prediction result of the time series prediction means (process, process) and the corrected time series data may be stored in the correction information storage unit as an association history.
  • the correction information storage unit may store time information, a singular value determination result, a correction amount, and a prediction error in association with each other.
  • the apparatus may include a singular value detecting means (step, process) for detecting the singular value.
  • Means (process, process) may be configured.
  • the singular value discriminating means includes a time series including at least one of a trend component, a periodic component, and an autoregressive component of the time series data.
  • a state in which raising or lowering of the time-series components has occurred A state in which the variance of the time-series components has changed, Any one of the states in which the time-series component has changed or increased may be determined as a singular value model.
  • the correction amount calculation means is a correction amount corresponding to the singular value model.
  • the time-series components including at least one of the trend component, the periodic component, and the autoregressive component of the time-series data
  • the amount of correction in the state where raising or lowering occurs in the time-series components A correction amount in a state in which the variance of the time-series component has changed, A correction amount in a state in which a change in which the time-series component increases or decreases occurs, Any one of the above may be calculated.
  • time series processing such as time series prediction
  • it is difficult to identify the cause of singular values making it difficult to generate appropriate corrected time-series data. Contributes to solving the problem of generating series data.
  • Singular value correction prediction device 101, 101A, 101B, 101C, 101D, 101E, 101F, 101G, 101H Singular value correction prediction device 102 Input device 103 Output device 104 Storage device 201 Singular value discrimination means 202 Singular value correction means 203 Time series prediction means 701 Correction information storage Unit 1001 Singular Value Correction Device 1002 Time Series Prediction Device 1101 Correction Amount Calculation Unit 2001 Singular Value Detection Unit 2601 Measured Value 2602 Before Data 1 Prediction Period Data 2 Predicted Value during Data 1 Prediction Period 2603 Measurement Value 2701 during Data 1 Prediction Period Corrected time series data 2702 of data 1 Time series data 2703 before adding correction amount H of data 1 Correction amount H of data 1 2704 Predicted value 2801 predicted by corrected time-series data of data 1 Measured value 2802 before prediction period of data 2 Predicted value 2803 during prediction period of data 2 Actual value 2901 during prediction period of data 2 When data 2 is corrected Prediction value predicted by corrected time series data of series data 2902
  • An apparatus for processing time-series data according to the present invention in one aspect thereof, is located behind the time-series data having a first time width that does not include a singular value in time, and a singular value (singular period) Corresponding to the type of the singular value model of the time series data of the second time width including the singular value correction means (202) for correcting the time series data of the first time width.
  • the time series prediction means for performing the time series prediction includes the corrected time series data of the first time width or the corrected time series data of the first and second time widths. Is used to perform time-series prediction in a prediction period, and as a process for determining the type of the singular value model, the time-series prediction means uses prediction data relating to a second time width including the singular value. And predicting from the time-series data of the first time width.
  • a preset singular value model is used. Accordingly, a correction amount calculating means for calculating the correction amount is further provided.
  • a plurality of singular value models are prepared in advance, and based on the prediction data related to the second time width predicted by the time series prediction means and the time series data of the second time width, Singular value determination means for determining a singular value model that best fits the time-series data of the second time width, and correction amount calculation means for calculating a correction amount corresponding to the singular value model And.
  • the means for performing the correction corresponding to the type of the singular value is a time-series component including at least one of a trend component, a periodic component, and an autoregressive component. It is determined that the state of raising or lowering has occurred.
  • the means for performing correction corresponding to the type of the singular value is a time-series component including at least one of a trend component, a periodic component, and an autoregressive component. It is determined that the variance has occurred.
  • the means for performing correction corresponding to the type of the singular value after determining the type of the singular value includes a time series including at least one of a trend component, a periodic component, and an autoregressive component. It is determined that a change in which the component increases or decreases has occurred.
  • the present invention comprises: means for predicting the value of the singular value; and means for calculating a correction amount for the singular value based on the prediction value, and the means for calculating the correction amount includes a trend component, a period A correction amount is calculated in a state where raising or lowering occurs in a time-series component including at least one of components and autoregressive components.
  • the present invention comprises: means for predicting the value of the singular value; and means for calculating a correction amount for the singular value based on the prediction value, and the means for calculating the correction amount includes a trend component, a period A correction amount is calculated in a state where the variance of the time-series component including at least one of the component and the autoregressive component has changed.
  • the present invention comprises: means for predicting the value of the singular value; and means for calculating a correction amount for the singular value based on the prediction value, and the means for calculating the correction amount includes a trend component, a period A correction amount is calculated for a state in which a time series component including at least one of the component and the autoregressive component has changed.
  • a means for calculating the reliability of the corrected time-series data based on the prediction accuracy when predicted using the result of the past corrected time-series data and the corrected time-series data Means for reflecting the reliability in the time series prediction from.
  • a value for a specific period may be a missing value, and data for other periods may be corrected.
  • the original data (T_ ⁇ ) of the time-series data is time-series data including the singular value and the time-series data having the first time width (T_l) that does not include the singular value.
  • Time series data having a time width of 2 (T_p) the time series prediction means (203) predicts the time series data of the second time width from the time series data of the first time width.
  • the singular value discriminating means (201) based on the prediction data of the second time width predicted by the time series prediction means (203) and the time series data of the second time width, The type of the singular value model of the time series data of the time width is determined.
  • the singular value correction means (202) corrects the time series data of the first time width (T_l) corresponding to the type of the singular value model determined by the singular value determination means (201). Alternatively, the singular value correcting means (202) corresponds to the type of the singular value model, the time series data of the first time width (T_l) and the time series data of the second time width (T_p). Perform the correction.
  • the time series prediction means (203) uses the time series data of the first time width corrected by the singular value correction means (202) or the time series data of the first and second time widths corrected. Prediction of the value of the prediction period located later in time than the time-series data of the second time width is performed.
  • prediction data relating to a predetermined period including a singular value in the original data predicted by the time series prediction means (203), and the predetermined data in the original data
  • a correction amount calculation means (1101) for calculating a correction amount of the time series data in the original data according to a preset singular value model based on the time series data of the period.
  • the correction amount calculation means (1101) is preset based on the prediction data of the second time width predicted by the time series prediction means (203) and the time series data of the second time width. According to the singular value model, a correction amount for the time series data of the first time width is calculated.
  • the singular value correction means (202) treats the time-series data of the second time width as a missing value based on the calculated correction amount (for example, the correction amount is equal to or greater than a predetermined threshold), and the second value
  • the time-series time series data may be deleted, and the corrected first time-series time series data may be replaced with the original data and output.
  • the corrected time-series data of the first time width and the time-series data of the second time width are updated as new time-series data of the first time width, and the newly input next New time-series data is updated as time-series data with a new second time width, and predictions related to the new time-series data with the second time width and correction according to the singular value model are sequentially performed. Also good.
  • a correction information storage unit (701) that stores the prediction result of the time series prediction unit and the corrected time series data as an association history may be provided.
  • the correction information storage unit (701) may store the time information, the singular value determination result, the correction amount, and the prediction error in association with each other.
  • a singular value detecting means (2001) for detecting a singular value in the original data of the time series data may be provided.
  • the singular value detection means (2001) may be composed of a time series prediction means (203) and a singular value discrimination means (201).
  • the singular value discriminating means (201) relates to a time-series component including at least one of a trend component, a periodic component, and an autoregressive component of the time-series data.
  • One of the states in which a change in which the time-series component increases or decreases may be determined.
  • the correction amount calculation means (1101) relates to a time-series component including at least one of a trend component, a periodic component, and an autoregressive component of the time-series data.
  • Patent Document 2 invents a method of using a value obtained by removing time-series irregular components as a correction amount, and a method of allowing an analyst to input a correction amount.
  • the correction amount and analysis result may differ depending on the analyst. In some cases, it is impossible to prevent a decrease in prediction accuracy.
  • the work burden on the analyst can be reduced without the need for human intervention. Furthermore, large-scale data can be easily handled.
  • description will be given in accordance with specific examples.
  • FIG. 1 is a diagram showing a configuration of a time-series prediction apparatus according to the first embodiment of the present invention.
  • the time series prediction apparatus includes a singular value correction prediction apparatus 101, an input apparatus 102, an output apparatus 103, and a storage apparatus 104.
  • the input device 102 inputs time series data.
  • the singular value corrected prediction apparatus 101 generates corrected time series data, replaces the original data and the corrected time series data, and then predicts time series data in the prediction period.
  • the output device 103 outputs the time series prediction result of the singular value correction prediction device 101.
  • the storage device 104 stores time series data input from the input device 102, a time series prediction result of the singular value correction prediction device 101, and information used by the singular value correction prediction device 101.
  • FIG. 2 is a diagram showing a configuration of the singular value correction prediction apparatus 101 of FIG.
  • the singular value correction prediction apparatus 101 includes a singular value determination unit 201, a singular value correction unit 202, and a time series prediction unit 203.
  • the singular value discriminating means 201 discriminates the kind of singular value.
  • the kind of singular value is sometimes called a “singular value model”.
  • the singular value correction unit 202 corrects the time series based on the determination result by the singular value determination unit 201, and generates corrected time series data.
  • the time series prediction unit 203 predicts the time series data of the prediction period using the corrected time series data generated by the singular value correction unit 202.
  • the time series data [X_0,. . . , X_t ⁇ ] is input from the input device 102 (where X represents a time-series value).
  • time width T_ ⁇ the time series data of the first time width T_l [X_0,. . . , X_tl] and time-series data [X_tl + 1,. . . , X_ t ⁇ ].
  • time series data with the time width T_l does not include singular values
  • time series data with the time width T_p includes singular values
  • the singular value determination means 201 determines the singular value model of the time series data having the time width T_p with respect to the time series data having the time width T_p.
  • the singular value correction unit 202 corrects the time series data of the time width T_ ⁇ using a correction amount determined in advance for each singular value model, and generates corrected time series data of the time width T_ ⁇ .
  • the time series prediction unit 203 predicts time series data having a predetermined prediction width n from the time width T_ ⁇ using the corrected time series data.
  • the time series prediction unit 203 outputs the prediction result by the output device 103. Further, the prediction result is stored in the storage device 104.
  • FIG. 3 is a sequence diagram showing an example of the operation of the first embodiment. The operation of the present embodiment will be described with reference to FIG.
  • the time series prediction means 203 uses the time series data [X_0,. . . , X_tl] to time series data [X_tl + 1,. . . , X_ t ⁇ ].
  • the time series prediction means 203 converts the predicted data of the predicted time width T_p to [Y_tl + 1,. . . , Y_p] (step S301).
  • Y indicates a predicted value.
  • the singular value correction means 202 uses the correction amount H predetermined for each singular value model on the basis of the singular value state determination result, and uses the time series data [X_0,. . . , X_t ⁇ ] and corrected time series data [X ⁇ _0,. . . , X ⁇ _ t ⁇ ] is generated (S303).
  • X ⁇ indicates a corrected time series value.
  • the state where the time series trend component is raised or lowered is a singular value.
  • the rising state and the lowering state of the time series trend component are set as the singular value model.
  • FIG. 4 shows the raised state of time-series trend components.
  • FIG. 5 shows a state in which the time series trend components are lowered.
  • the singular value discriminating means 201 in order to discriminate the singular value model, the prediction data [Y_tl + 1,. . . , Y_p] with an appropriate addition amount S and time-series data [X_tl + 1,. . . , X_ t ⁇ ], an addition amount S that minimizes the error is calculated.
  • RMSE Root Mean-Square Error
  • the singular value discriminating means 201 discriminates the singular value model by examining the magnitude, sign, etc. of the value of the addition amount S.
  • S_RMSE is the prediction data [Y_tl + 1,. . . , Y_p] with an appropriate addition amount S and time-series data [X_tl + 1,. . . , X_ t ⁇ ] represents the mean square error of the predicted value.
  • Thre_shift represents the threshold value of the addition amount S.
  • the singular value model is applied to the raised or lowered state, it is considered that the value of the addition amount S is large. Therefore, the magnitude relationship between the addition amount S and Thre_shift is raised and used as a criterion for determining the lowered state.
  • Thre_shift_rmse represents the threshold value of S_RMSERM.
  • the time series data [X_tl + 1,. . . , X_ t ⁇ ] it is considered that there is no significant fluctuation in the periodic component, autoregressive component, etc., even if raising or lowering occurs.
  • the appropriate addition amount S is set to the prediction data [Y_tl + 1,. . . , Y_p], the prediction data [Y_tl + 1,. . . , Y_p] and time-series data [X_tl + 1,. . . , X_ t ⁇ ] is considered to be small.
  • the time series data [X_tl + 1,. . . , X_ t ⁇ ] is determined to be raised (S604), and if negative, it is determined to be raised (S605).
  • Other types include a state where the trend component rises, a state where the trend component falls, a state where the periodic component fluctuates, and a state where the variance fluctuates.
  • the trend component rises and falls, instead of the addition amount S used in the state where the trend component set in this embodiment is raised and lowered.
  • the singular value can be determined by obtaining the addition amount S_t from the equation (4).
  • the singular value can be determined by changing Expression (1) to Expression (5).
  • the time width T_k represents a cycle in which the cycle component varies.
  • the singular value is determined to be a trend component raising / lowering model by the singular value discriminating means 201, the time series data [X_tl + 1,. . . , X_t ⁇ ], the correction amount H is added to the time series data of the T_l interval.
  • the singular value model is raised by the singular value discriminating means 201 and does not apply to the lowering model, it is determined as a missing value in order to completely remove the influence of the singular value.
  • corrected time series data [X ⁇ _0,. . . , X ⁇ _t ⁇ ] [X ⁇ _0,. . . , X ⁇ _tl].
  • FIG. 7 is a diagram showing a modified sequence of the singular value correction prediction apparatus 101 of FIG.
  • a correction information storage unit 701 is further added to the configuration of the singular value correction prediction apparatus 101 in FIG. The rest is the same as FIG. Only the differences will be described below.
  • the correction information storage unit 701 stores the prediction result by the time series prediction unit 203 and the corrected time series data. By storing the past history in the correction information storage unit 701, the singular value determination unit 201 considering the past correction accuracy can be realized. By utilizing the correction information storage unit 701, it is possible to further prevent a decrease in prediction accuracy.
  • FIG. 8 is a sequence diagram showing the operation of the configuration of FIG. Referring to FIG. 8, processing (S801, S802) performed between the correction information storage unit 701 and the singular value determination unit 201 is added to the sequence diagram of FIG. The rest is the same as FIG. Only the differences will be described below.
  • the singular value determination unit 201 determines the singular value model
  • the result is stored in the correction information storage unit 701, and prediction accuracy information in the same singular value model in the past is read from the correction information storage unit 701. (S801).
  • the singular value discriminating means 201 once again discriminates the singular value model in consideration of the prediction history read from the correction information storage unit 701 (S802).
  • the determination result by the past singular value determination means 201 does not affect the prevention of the prediction accuracy from being lowered, it is necessary to review the determination result.
  • FIG. 9 shows an example of the contents of the correction information storage unit 701.
  • the date / time, input value, singular value determination result, correction amount, and prediction error are stored as one set.
  • the past singular value determination result, the amount of correction, and the prediction error when the correction is performed are stored. Based on this information, it is possible to generate corrected time-series data in consideration of the past correction accuracy. .
  • FIG. 10 is a diagram showing a modified sequence of the singular value correction prediction apparatus 101 of FIG.
  • the singular value correction prediction apparatus 101A in FIG. 2 may be divided into a singular value correction apparatus 1001 and a time series prediction apparatus 1002.
  • FIG. 11 is a diagram showing the configuration of the second exemplary embodiment of the present invention.
  • the singular value correction prediction apparatus 101B includes a correction amount calculation unit 1101 instead of the singular value determination unit 201 of FIG.
  • the correction amount calculation means 1101 calculates an optimal correction amount based on a preset singular value model. Since time series data often has a fixed singular value unique to that data, a singular value model can often be set in advance. However, even if the singular value model can be identified, if the value for correcting the singular value cannot be determined, the analyst must specify the correction value, but an inappropriate correction amount can be set manually. there's a possibility that. It is conceivable that this cannot prevent a decrease in prediction accuracy due to a singular value.
  • the singular value correction unit 202 corrects the time series based on the correction amount calculated by the correction amount calculation unit 1101, and generates corrected time series data.
  • the time series prediction unit 203 predicts the time series data of the prediction period from the time series data corrected by the singular value correction unit 202.
  • the time series data [X_0,. . . , X_t ⁇ ] is input from the input device 102.
  • the correction amount calculation means 1101 calculates an optimal correction amount based on a preset singular value model for the time series data of the time width T_p.
  • the singular value correction means 202 corrects the time series data of the time width T_ ⁇ to generate corrected time series data of the time width T_ ⁇ .
  • the time series prediction unit 203 predicts time series data having a predetermined prediction width n from the time width T_ ⁇ using the corrected time series data, and the output device 103 outputs a prediction result. Further, the time series prediction result is stored in the storage device 104.
  • FIG. 12 is a sequence diagram for explaining an example of the operation of the second embodiment of the present invention. This will be specifically described below.
  • the same steps as those in FIG. 3 are denoted by the same reference numerals, and description of the same steps will be omitted as appropriate.
  • the correction amount calculation unit 1101 calculates the correction amount (S1201).
  • a state in which the time series trend component is raised or lowered is set. That is, as the singular value model, the time series trend component raised state and lowered state are set.
  • the correction amount H is calculated so as to minimize the error.
  • RMSE Root Mean-Square Error
  • Equation (7) The optimum correction amount H of Equation (6) is obtained from Equation (7).
  • a state where the trend component is raised or lowered is used as the singular value model, but other types may be set as in the first embodiment.
  • the singular value correction unit 202 Based on the correction amount H calculated by the correction amount calculation unit 1101 of FIG. 11, the singular value correction unit 202 performs time-series data [X_0,. . . , X_t ⁇ ] Corrected time series data [X ⁇ _0,. . . , X ⁇ _ t ⁇ ] Is generated (S303). However, X ⁇ indicates a corrected time series value.
  • the singular value correction unit 202 in this embodiment will be described below.
  • the correction amount H is equal to or greater than the threshold
  • the time series data [X_tl + 1,. . . , X_t ⁇ ] is added to the time series data of the T_l interval.
  • time series data [X_tl + 1,. . . , X_t ⁇ ] may be in a state where the trend component is being raised and lowered, and the influence of the singular value is completely eliminated by setting this interval as a missing value.
  • the correction amount H is less than the threshold, if the singular value model is not appropriate or it can be determined that it is a sudden abnormal value, the time series data [X_tl + 1,. . . , X_ t ⁇ ] determines that the singular value model and the correction amount are not suitable. In this case, in order to completely remove the influence of the singular value, it is set as a missing value.
  • a correction amount suitable for the singular value model can be calculated based on the time series prediction result, it is possible to prevent generation of inappropriate corrected time series data by hand, and to obtain factor information. By a method that does not specify, it is possible to prevent a decrease in prediction accuracy due to a singular value.
  • the correction amount H When the correction amount H is small, there is no difference between the time series data before correction and the corrected time series data. Therefore, when the correction amount H is less than the threshold value, it is determined that the singular value model is not appropriate or is a sudden abnormal value, and the singular value is treated as a missing value, thereby preventing a reduction in prediction accuracy.
  • FIG. 13 is a diagram showing a modified sequence of the singular value correction prediction apparatus 101B of FIG.
  • a correction information storage unit 701 in FIG. 7 is added to the singular value correction prediction apparatus 101B in FIG.
  • the correction information storage unit 701 stores the prediction result by the time series prediction unit and the corrected time series data.
  • the correction amount calculation unit 1101 considering the past correction accuracy can be realized.
  • FIG. 14 is a diagram illustrating an example of an operation sequence of the singular value correction prediction apparatus 101C in FIG. 14 is different from FIG. 12 in that processing (S1401, S1402) performed between the correction information storage unit 701 and the singular value determination unit 1101 is added. The rest is the same as FIG. Description of the same steps is omitted as appropriate to avoid duplication.
  • the correction amount calculation unit 1101 calculates the correction amount at a certain singular value
  • the result is stored in the correction information storage unit 701.
  • prediction accuracy information in the same singular value model in the past is read from the correction information storage unit 701 (S1401).
  • the correction amount calculation means 1101 calculates the correction amount in consideration of the prediction history read from the correction information storage unit 701 (S1402).
  • the correction amount by the past correction amount calculation unit 1101 does not affect the prevention of the prediction accuracy from being lowered, it is necessary to review the correction amount.
  • the content shown in FIG. 9 is stored in the correction information storage unit 701.
  • Example 2 Modification 2> Note that the singular value correction prediction apparatus 101C of FIG. 13 may be divided into a singular value correction apparatus 1001 and a time series prediction apparatus 1002, as shown in FIG.
  • FIG. 15 is a diagram showing the configuration of the third exemplary embodiment of the present invention.
  • the singular value correction prediction apparatus 101 ⁇ / b> D includes a singular value determination unit 201, a correction amount calculation unit 1101, a singular value correction unit 202, and a time series prediction unit 203.
  • a plurality of singular value models are prepared, a correction amount for each singular value model is determined in advance, a singular value model most applicable to the singular value is found, and corrected time-series data is generated.
  • a singular value model is set in advance, an optimal correction amount is calculated, and corrected time-series data is generated.
  • the singular value discriminating means 201 finds the singular value model that best matches the singular value, and the correction amount calculating means 1101 optimizes the singular value model. A correction amount is calculated and corrected time-series data is generated. That is, the third embodiment is a combination of the first embodiment and the second embodiment. The operation of the third embodiment of the present invention will be described below.
  • the time series data [X_0,. . . , X_t ⁇ ] is input from the input device 102.
  • the singular value model is discriminated by the singular value discriminating means 201 with respect to the time series data of the time width T_p.
  • the correction amount calculation means 1101 calculates an optimal correction amount based on a preset singular value model.
  • the singular value correction means 202 corrects the time series data of the time width T_ ⁇ using the singular value model and the correction amount thereof, and generates corrected time series data of the time width T_ ⁇ .
  • the time series prediction unit 203 predicts time series data having a predetermined prediction width n from the time width T_ ⁇ using the corrected time series data, and the output device 103 outputs a prediction result. Further, the time series prediction result is stored in the storage device 104.
  • FIG. 16 is a sequence diagram showing an example of the operation of the third embodiment. This will be specifically described below.
  • the same steps as those in FIG. 3 are denoted by the same reference numerals, and description of the same steps will be omitted as appropriate.
  • the singular value discriminating means 201 discriminates the singular value model of the time series data of the time width T_p (S1601).
  • the correction amount calculation unit 1101 calculates a correction amount H according to the determination result of the singular value determination unit 201 (S1602).
  • the correction amount calculating means 1101 replaces the addition amount S obtained by the singular value discriminating means 201 with the correction amount H.
  • the singular value model by the singular value discriminating means 201, the correction amount is obtained by the correction amount calculating means 1101.
  • the singular value correcting means 202 corrects the time series data (X_0,..., X_t ⁇ ) of the time width T_ ⁇ , and the corrected time series data [X ⁇ _0,. . . , X ⁇ _ t ⁇ ] is generated (S1603).
  • X ⁇ represents a corrected time series value.
  • each time series component such as a trend component, a periodic component, and an autoregressive component
  • the state in which the time series trend component has been raised the state in which the bulk reduction has occurred
  • a state where irregular behavior independent of normal data behavior occurs is referred to as an “irregular state”.
  • the raised and lowered states of the time-series trend component are as shown in FIGS. 4 and 5, respectively.
  • FIG. 17 shows an example of an irregular state that is a time-series sudden abnormal value.
  • the least square criterion is adopted, and in this embodiment, the error scale of the following equation called RMSE (Root Mean-Square Error) is used.
  • the addition amount S is obtained using the above formulas (1) and (2). Further, the singular value model is discriminated by examining the magnitude, sign, etc. of the value of the addition amount S.
  • S_RMSE is the same as Thre_shift and Thre_shift_rmse in the first embodiment, the details are omitted.
  • I_RMSE is the prediction data [Y_tl + 1,. . . , Y_p] and time-series data [X_tl + 1,. . . , X_ t ⁇ ] represents the mean square error of the predicted value.
  • I_RMSE can be obtained by the following equation (8).
  • Thre_irregular_rmse represents the threshold value of I_RMSE.
  • the prediction data for the time width T_p [Y_tl +1,. . . , Y_p] and time-series data [X_tl + 1,. . . , X_ t ⁇ ] may have a large error. Therefore, the relationship between Thre_irregular_rmse and I_RMSE is used as a criterion for determining an irregular state.
  • the singular value model is discriminated using the five kinds of values.
  • FIG. 18 is a flowchart for explaining the singular value model discrimination processing in this embodiment.
  • the determination conditions for the raised / lowered state are the same as those in steps S601 to S605 of FIG. 6 referred to in the description of the first embodiment, and thus the details are omitted.
  • the conditions for determining whether the state is raised or lowered are not satisfied, it is next determined whether the state is irregular.
  • the conditions for determining an irregular state are as follows.
  • the trend component is in a raised state, a lowered state, or an irregular state, but other singular value models are set as in the first embodiment. Also good.
  • the correction amount calculation means 1101 calculates the correction amount H, the time series data [X_tl + 1,. . . , X_t ⁇ ], the correction amount H is added to the time series data of the T_l interval.
  • the model can be determined from the singular value model candidates based on the time series prediction result, and the correction amount suitable for the model can be calculated. It is possible to prevent the generation of series data and to prevent a decrease in prediction accuracy due to a singular value by a method that does not specify factor information. By setting a plurality of singular value model candidates, it is possible to prevent a decrease in prediction accuracy due to various singular values.
  • FIG. 19 is a diagram showing a modified sequence of the singular value correction prediction apparatus 101D of FIG. Referring to FIG. 19, in the singular value correction prediction apparatus 101E, a correction information storage unit 701 in FIG. 7 is added to the singular value correction prediction apparatus 101D in FIG. Others are the same as those in FIG. 15, and the description of the same elements is omitted as appropriate.
  • the correction information storage unit 701 stores the prediction result by the time series prediction unit 203 and the corrected time series data. By storing the past history in the correction information storage unit 701, the singular value discriminating means 201 and the correction amount calculating means 1101 considering the past correction accuracy can be realized. By using the correction information storage unit 701, it is possible to prevent a decrease in prediction accuracy.
  • FIG. 19 The operation of FIG. 19 is the same as that of the first and second embodiments, and thus the description thereof is omitted.
  • the singular value correction prediction apparatus 101E of FIG. 19 may be divided into a singular value correction apparatus 1001 and a time series prediction apparatus 1002 as shown in FIG.
  • FIG. 20 is a diagram showing the configuration of the fourth exemplary embodiment of the present invention.
  • a singular value detection unit 2001 a singular value determination unit 201, a correction amount calculation unit 1101, a singular value correction unit that detect whether or not a singular value is included in the input time-series data.
  • 202 time series prediction means 203 is provided.
  • the correction amount calculation unit 1101, the singular value correction unit 202, and the time series prediction unit 203 are the same as those described in the above-described embodiments, and in the following, in order to avoid duplication, the description of the same elements will be described. Omitted as appropriate.
  • the time series data of the time width T_p in the time series data of the time width T_ ⁇ includes a singular value.
  • time series prediction is performed in the prediction period while preventing a decrease in prediction accuracy due to singular values only by inputting time-series data from the input device 102. Making it possible.
  • the singular value detection means As in the present embodiment, it is possible to prevent generation of inappropriate corrected time-series data due to manual intervention.
  • the time series data [X_0,. . . , X_t ⁇ ] is input from the input device 102.
  • the singular value detection means 2001 detects the presence or absence of the singular value in the time series data of the time width T_ ⁇ .
  • the 20 time-series prediction means 203 predicts time-series data having a predetermined prediction width n from the time width T_ ⁇ , and the output device 103 outputs a prediction result. Further, the time series prediction result is stored in the storage device 104.
  • the singular value detection unit 2001 detects a singular value in the time-series data of the time width T_ ⁇ , the time-series data [X_0, time-series data of the time width T_l until the singular value is detected in the time width T_ ⁇ . . . . , X_tl] and time-series data [X_tl + 1,. . . , X_ t ⁇ ].
  • time-series data with time width T_l [X_0,. . . , X_tl] is small, the past input time-series data [X_-tq,. . . , X_-1] and [X_0,. . . , X_tl].
  • the time series data with the time width T_l does not include a singular value
  • the time series data with the time width T_p includes a singular value
  • the singular value model is discriminated by the singular value discriminating means 201 for the time series data of the time width T_p.
  • the singular value correction means 202 corrects the time series data of the time width T_ ⁇ to generate corrected time series data of the time width T_ ⁇ .
  • the time series prediction unit 203 predicts time series data having a predetermined prediction width n from the time width T_ ⁇ using the corrected time series data, and the output device 103 outputs a prediction result. Further, the time series prediction result is stored in the storage device 104.
  • FIG. 21 is a sequence diagram for explaining an example of the operation of the fourth embodiment. In the following description, it is assumed that the singular value is included in the time width T_ ⁇ by the singular value detection unit 2001.
  • the singular value detection means 2001 detects the singular value within the time series time width T_ ⁇ (S2101).
  • time series data [X_0,... Of the time width T_l until the singular value is detected in the time width T_ ⁇ . . . , X_tl] and time-series data [X_tl + 1,. . . , X_ t ⁇ ].
  • the singular value detection means by having the singular value detection means, it is possible to prevent generation of inappropriate corrected time-series data manually and to identify factor information only by inputting time-series data from the input device 102. By this method, it is possible to prevent a decrease in prediction accuracy due to singular values.
  • ⁇ Having singular value detection means can prevent inappropriate corrected time-series data from being generated manually.
  • FIG. 22 is a diagram showing a modified sequence of the singular value correction prediction apparatus 101F of FIG. Referring to FIG. 22, in the singular value correction prediction apparatus 101G, the correction information storage unit 701 in FIG. 7 is added to the configuration in FIG. Others are the same as those in the fourth embodiment, and the description of the same elements is omitted.
  • the correction information storage unit 701 stores the prediction result by the time series prediction means and the corrected time series data. By storing the past history in the correction information storage unit 701, the correction amount calculation unit 1101 considering the past correction accuracy can be realized.
  • correction information storage unit 701 By using the correction information storage unit 701, it is possible to prevent a decrease in prediction accuracy.
  • the operation of the singular value correction prediction apparatus 101G in FIG. 22 is omitted because it overlaps with the first to fourth embodiments.
  • the singular value correction prediction apparatus 101G in FIG. 22 may be divided into a singular value correction apparatus 1001 and a time series prediction apparatus 1002.
  • Example 4 Modification 3>
  • the singular value detection unit 2001 only needs to be able to detect a singular value from time-series data, and the singular value detection unit 2001 is not limited to the above.
  • the singular value detection unit 2001 may be referred to as “abnormal value detection unit”, “outlier detection unit”, or the like.
  • FIG. 23 is a diagram showing a configuration of a fourth modification of the fourth embodiment of the present invention.
  • the singular value detection unit 2001 may be replaced with a singular value determination unit 201 and a time series prediction unit 203.
  • the time-series data with the time width T_ ⁇ is changed from the time-series data with the first time width T_l [X_0,. . . , X_tl] and time-series data [X_tl + 1,. . . , X_ tp].
  • time-series data with a time width T_p is predicted using time-series data with a time width T_l (S301).
  • the singular value model is discriminated based on the time series data of the time width T_p and the prediction data of the time width T_p (S1601).
  • the singular value model discrimination process is performed according to the flowchart of FIG.
  • the time width T_ ⁇ is obtained by executing the above algorithm for all combinations of T_l and T_p that satisfy T_l + T_p ⁇ T_ ⁇ .
  • the singular value of the time series data can be detected.
  • the singular value detection means 2001 can be replaced by the singular value discrimination means 201 and the time series prediction means 203.
  • Time series prediction is performed for time series data provided by managed services (services that maintain and operate network devices and servers).
  • the rising and lowering state of the trend component is called “trend shift state”.
  • the trend shift state is generated by changing the trend of the observed values so far as a result of a change in the resource environment such as the addition of a system or equipment.
  • time series prediction of the prediction period by the time series prediction means is performed in such a situation, the tendency of the prediction value is dragged by the increase of the singular value, leading to a decrease in prediction accuracy.
  • the irregular state represents a singular state in which a unique behavior that is independent of normal data behavior occurs. It is a unique state other than a certain amount of change of trend component, periodic component, and autoregressive component.
  • the irregular state for example, when the monitoring target is a web server, when the company conducts a campaign to promote the sale of products, the access to the web server increases rapidly, and the access suddenly increases after the campaign ends. It occurs by decreasing.
  • prediction is performed by the time-series prediction means in such a situation, the prediction accuracy is lowered due to the irregular state.
  • the experimental data 1 is time-series data representing the write time rate between the file server dedicated machine and the cache.
  • the experimental data 1 has a trend shift state and an irregular state. This may be due to sudden concentration of access to the web server or expansion of the system.
  • FIG. 24 shows experimental data 1.
  • the experimental data 2 is time series data representing the hard disk usage rate. In the experimental data 2, a trend shift state has occurred. It is thought that the trend shift state occurred by moving a large amount of data temporarily.
  • FIG. 25 shows experimental data 2.
  • time widths T_ ⁇ , T_l, T_p, and predicted time width n Various parameters used in the fourth embodiment are time widths T_ ⁇ , T_l, T_p, and predicted time width n.
  • n 90 was set.
  • X represents a time-series value.
  • Thre_shift 7.0
  • Thre_shift_rmse 5.0
  • Thre_irregular_rmse 5.0.
  • FIG. 26 shows a prediction result when the singular value correction prediction apparatus 101 is not used.
  • the error between the predicted value 2602 and the actually measured value 2603 increases, and the prediction accuracy decreases due to the singular value.
  • the prediction result using the singular value correction prediction apparatus 101 is shown in FIG.
  • the error between the prediction value 2704 and the actual measurement value 2603 becomes smaller than that in FIG. It can be seen that the decrease could be prevented.
  • the corrected data 2702 is corrected time series data generated at a time before the prediction period shown in FIG.
  • the corrected data 2701 is corrected by the correction amount 2703 calculated by the singular value correction prediction apparatus 101 from the corrected data 2702.
  • the missing value is because the time series data is corrected.
  • FIG. 28 shows a prediction result when the singular value correction prediction apparatus 101 is not used.
  • the error between the predicted value 2802 and the actually measured value 2803 becomes large, and the prediction accuracy is lowered due to the singular value.
  • the prediction result using the singular value correction prediction apparatus 101 is shown in FIG.
  • the error between the prediction value 2902 and the actual measurement value 2803 becomes smaller than that in FIG. It turns out that the fall can be prevented.
  • the corrected time series data 2901 is time series data in which the time series data 2801 before the prediction period is corrected by the singular value correction prediction apparatus 101 and the influence of the singular value is removed.
  • the missing value in the corrected time series data 2901 is because the time series data is corrected. *
  • the singular value correction prediction device prevented the generation of inappropriate corrected time-series data by hand, and also prevented a decrease in prediction accuracy due to a singular value by a method that does not specify factor information.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

 時系列予測において、時系列データの特異値による予測精度の低下を防ぐことを可能とする方法、装置、プログラムを提供する。特異値補正予測装置101は、第1の時間幅の時系列データよりも時間的に後に位置する、第2の時間幅の時系列データの特異値モデルに対応して、第1の時系列データに対して補正を行い、また、第2の時間幅の時系列データを欠損値とする等して特異値の影響を除く補正を行い、補正済み時系列データを用いて予測期間の時系列予測を行う。

Description

時系列データ処理装置およびその方法とプログラム
[関連出願の記載]
 本発明は、日本国特許出願:特願2008-174193号(2008年7月3日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
 本発明は、時系列データの処理技術に関し、特に、特異な時系列による予測精度の低下の抑止に好適な時系列予測技術に関する。
 前日や前週の販売実績から数日先の販売量予測や将来の株価予測に利用される時系列予測技術は、業務の効率化や経営判断のために非常に重要な技術である(特許文献1、特許文献2、特許文献3等を参照)。
 さらに、近年、マネージドサービス(ネットワーク装置、サーバ類の保守・運用を行うサービス)などの市場において、時系列センサデータから、将来のリソース不足や障害の発生を予測することで、安定したシステム運用を行うニーズが増加しており、時系列データ予測が幅広く活用されている。
特開2006-276970号公報 特開平9-101947号公報 特開2004-54370号公報 特開平5-12240号公報
尾崎 統、北川源四郎編:時系列解析の方法、朝倉書店、p.93-106、1998 赤池 弘次、北川源四郎編:時系列解析の実際I、朝倉書店、p.181-214、1994 赤池 弘次、北川源四郎編:時系列解析の実際II、朝倉書店、p.181-195、1995
 上記特許文献、非特許文献の各開示は引用をもって本書に組み込まれる。以下に、本発明による関連技術の分析を与える。
 時系列予測技術は、実用的ではあるが、システムの増設に代表されるリソース環境の変更や、webサーバへのアクセスの急増などに伴い、時系列データに非連続的で特異な挙動が含まれる場合、予測精度の低下が起こる場合がある。
 時系列予測に用いる過去のデータに、このような特異な挙動が含まれていない場合は、時系列予測によって精度のよい予測を行なうことが可能であるが、過去のデータに通常とは異なる変動が含まれる場合、通常の時系列予測手段によって、予測期間の時系列予測を行うと、その特異な挙動が、予測精度を著しく低下させる場合がある。
 特許文献2では、分析者の予測業務の負担の軽減を図ると共に、予測の精度が低下する大きな原因となる特異値の摘出と補正作業の迅速な方法、予測システムが開示されている。特許文献2に記載の発明によれば、分析者が時系列データを監視、分析することで、特異値による予測の精度低下を防ぐことが可能となるものとされている。
 しかしながら、予測技術を利用する多くの企業等では、扱うデータ量が多量(膨大)であるため、分析者が時系列データの監視や分析を行うことが困難になっている。また、人手で補正値の入力を行う場合は、分析者によって補正値の調整が異なる可能性があり、的確な補正作業が難しい。
 よって、分析者を必要とせず、特異値による予測精度の低下を防ぐ方法の実現が望まれる。
 さらに、特許文献2には、特異値の発生要因がはっきりする場合に、的確かつ効率的な補正値の算出方法が提案されている。
 しかしながら、実世界では、要因が明確でない特異値が多いため、要因の特定が難しい。
 特異値の要因を特定できない場合、要因情報を予測値に反映できないため、予測精度の低下を防ぐことは困難である。
 よって、特異値の発生要因情報を用いないで、特異値による予測精度の低下を防ぐ方法の実現が望まれる。
 なお、他のアプローチとして、特異値を含むデータの処理に、非ガウス型の状態空間モデルを用いることで、特異値の影響を適当に排除し、不連続なジャンプを含むトレンドのスムージングを行う手法が提案されている(非特許文献1、2、3等を参照)。
 上記アプローチは、時系列データがガウス型や非ガウス型等の確率的なモデルに従うことを前提としている。また上記提案は、予測と補正が一体化されており、アルゴリズムも複雑化する傾向にある。以下の説明で明らかとされるように、本発明においては、特異値の補正と時系列予測を分離するとともに時系列の原データ(過去データ)を補正済み時系列データで置換更新することで、時系列予測の予測精度の低下を防ぐ。なお、過去に遡って時系列データの状態を推定し直す手法として平滑化(smoothing)と呼ばれる処理がある(非特許文献1)。
 過去の時系列データを学習し直し、予測モデルを修正することで、将来の予測精度の向上が期待できる。予測モデルを用いて特異値による予測精度の低下を防ぐには、突発的な特異値や緩やかに変化する特異値等の予測モデルで対応できるが、長期間の非連続な特異値などの予測モデルには対応できない特異値も存在する。よって、特異値による予測精度の低下を防ぐには、予測モデル以外の手法で対処することが必要となる。
 特許文献4には、予測対象を含むデータのなかに異常データが存在する場合、正常データに変換することで正常データの数を増やすことにより、予測対象の予測精度を向上させる予測装置として、異常データ検出部で過去のデータからデータ間の関係を計算し、その計算結果に基づいてデータが異常データかどうかを判定し、異常な場合は、異常データ変換部で、過去のデータからデータ間の関係を用いて正常なデータに変換し、正常に変換後のデータをデータベースに格納し、予測値計算部はデータベースの増えた正常なデータも読み込んで、データ間の関係を求め、読み込んだデータから予測する構成が開示されている。特許文献4においては、特異値の種類を予め特定できるような条件が設定できた場合に、その特異値の種類に当てはまるデータをデータベースから抽出して、回帰式により、特異値の補正量を計算し、該補正量で特異値を補正し、補正した値を正常な値として、特異値と置き換えているが、入力データから将来の値を予測する場合に、入力データに含まれる特異値は、将来の値を予測する精度を低下させるものもあれば、逆に、将来の値の変化を表している場合もある。入力データに含まれる特異値が、将来の値の変化を表している場合、特異値を補正せず、特異値以外の入力データを適切に補正することが妥当な場合もある。このため、入力データ全体(過去の時系列データ)を補正済み時系列データと置き換えることが求められる(以上は本発明者達の知見)。
 本発明の目的は、時系列予測等の時系列処理において、時系列データの特異値による予測精度の低下を防ぐことを可能とする装置、方法、プログラムを提供することにある。
 本願で開示される発明は前記課題を解決するため、概略以下の構成とされる。
 本発明によれば、予測期間における時系列データを予測する時系列予測方法であって、前記時系列データを原データとして前記原データ内の特異値に対して前記特異値の種類に対応させて補正を行い、前記補正済みの時系列データで前記原データを置き換えた上で、時系列データの予測を行う装置、方法、プログラムが提供される。
 本発明によれば、特異値を含まない第1の時間幅の時系列データに対して時間的に後方に位置する第2の時間幅の時系列データの特異値モデルに対応して、前記第1の時間幅の時系列データに補正を施す特異値補正手段(工程、処理)を含む装置(方法、プログラム)が提供される。
 本発明に係る装置(方法、プログラム)においては、前記特異値補正手段(工程、処理)は、前記第2の時間幅の時系列データの補正として、前記特異値モデルに対応して前記第2の時間幅の時系列データを欠損値とし、特異値の影響を除く補正を行うようにしてもよい。
 本発明に係る装置(方法、プログラム)においては、補正済みの前記第1の時間幅の時系列データ、又は、補正済みの前記第1及び第2の時間幅の時系列データが、予測期間の時系列予測を行う時系列予測手段(工程、処理)に供せされる構成としてもよい。
 本発明に係る装置(方法、プログラム)においては、前記時系列予測手段(工程、処理)が、補正済みの前記第1時間幅の時系列データ、又は、補正済みの前記第1及び第2の時間幅の時系列データを用いて、前記第2の時間幅の時系列データよりも時間的に後方の予測期間における時系列予測を行うほか、
 さらに、前記第2の時間幅に関する予測データを前記第1の時間幅の時系列データから予測する構成としてもよい。前記第2の時間幅に関する予測データを予測する処理は、前記第2の時間幅の時系列データの前記特異値モデルの判別のための前処理となる。
 本発明に係る装置(方法、プログラム)においては、前記時系列予測手段(工程、処理)で予測された特異値を含む前記第2の時間幅に関する予測データと、前記第2の時間幅の時系列データとに基づき、前記第2の時間幅の時系列データの特異値モデルを判別する特異値判別手段(工程、処理)をさらに含む構成としてもよい。
 本発明に係る装置(方法、プログラム)においては、前記時系列予測手段(工程、処理)で予測された特異値を含む第2の時間幅の予測データと、前記第2の時間幅の時系列データとに基づき、予め設定された特異値モデルにしたがって補正量を算出する補正量算出手段(工程、処理)をさらに含む構成としてもよい。
 本発明に係る装置(方法、プログラム)においては、前記特異値補正手段(工程、処理)は、前記特異値モデルに応じて前記第2の時間幅の時系列データを欠損値として扱い、前記第1の時間幅の時系列データを補正した時系列データを出力するようにしてもよい。
 本発明に係る装置(方法、プログラム)においては、前記第1の時間幅の時系列データから前記第2の時間幅の時系列データを予測する時系列予測手段(工程、処理)と、
 前記時系列予測手段(工程、処理)で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、前記第2の時間幅の時系列データの特異値モデルを判別する記特異値判別手段(工程、処理)と、
 を含み、前記特異値補正手段(工程、処理)は、前記特異値判別手段で判別された前記特異値モデルに対応して、前記第1及び第2の時間幅の時系列データの補正を行い、前記時系列予測手段(工程、処理)は、前記第1及び第2の時間幅の時系列データについて、前記特異値モデルに対応した補正が施された時系列データを用いて、前記第2の時間幅よりも後の時点の予測期間の値の予測を行うようにしてもよい。
 本発明に係る装置(方法、プログラム)において、前記特異値補正手段(工程、処理)は、前記特異値判別手段(工程、処理)で前記特異値モデル以外の異常値と判定された場合、前記第2の時間幅の時系列データを欠損値として扱い、前記第2の時間幅の時系列データを削除し、補正された前記第1の時間幅の時系列データを、もとの前記第1、第2の時間幅の時系列データに置き換えて出力するようにしてもよい。
 本発明に係る装置(方法、プログラム)においては、前記第1の時間幅の時系列データから前記第2の時間幅の時系列データを予測する時系列予測手段(工程、処理)と、
 前記時系列予測手段で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、予め設定された特異値モデルにしたがって、前記第1の時間幅の時系列データに対する補正量を算出する補正量算出手段(工程、処理)と、
 を含み、
 前記特異値補正手段(工程、処理)は、前記補正量算出手段(工程、処理)で算出された補正量に従って、前記第1及び第2の時間幅の時系列データの補正を行い、
 前記時系列予測手段(工程、処理)は、前記第1及び第2の時間幅の時系列データについて、補正が施された補正済み時系列データを用いて、前記第2の時間幅よりも後の時点の予測期間の値の予測を行う構成としてもよい。
 本発明に係る装置(方法、プログラム)において、前記特異値補正手段(工程、処理)は、算出された補正量に基づき、前記第2の時間幅の時系列データを欠損値として扱う場合、前記第2の時間幅の時系列データを削除し、補正された前記第1の時間幅の時系列データを、もとの前記第1、第2の時間幅の時系列データに置き換えて出力するようにしてもよい。
 本発明に係る装置(方法、プログラム)においては、補正された前記第1の時間幅の時系列データと前記第2の時間幅の時系列データを、新たな第1の時間幅の時系列データとし、
 次に入力される新たな時系列データを新たな第2の時間幅の時系列データとし、
 前記新たな第2の時間幅の時系列データに関する予測、特異値モデルに応じた、前記新たな第1の時間幅の時系列データ、又は、前記新たな第1の時間幅の時系列データと前記新たな第2の時間幅の時系列データの補正を行うようにしてもよい。
 本発明に係る装置(方法、プログラム)においては、前記時系列予測手段(工程、処理)の予測結果と前記補正済み時系列データとを関連付け履歴として補正情報記憶部に記憶するようにしてもよい。本発明において、前記補正情報記憶部に、時間情報、特異値判定結果、補正量、予測誤差を、組として、関連付けて記憶するようにしてもよい。
 本発明に係る装置(方法、プログラム)においては、前記特異値を検出する特異値検出手段(工程、処理)を含む構成としてもよい。
 本発明に係る装置(方法、プログラム)においては、時系列予測手段(工程、処理)と、前記特異値判別手段(工程、処理)とで、前記時系列データの特異値を検出する特異値検出手段(工程、処理)を構成してもよい。
 本発明に係る装置(方法、プログラム)においては、前記特異値判別手段(工程、処理)が、前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
 前記時系列の成分に嵩上げ又は嵩下げが起こった状態、
 前記時系列の成分の分散に変動が起こった状態、
 前記時系列の成分が上昇又は下降する変化が起こった状態
 のうちのいずれかを、特異値モデルとして判別するようにしてもよい。
 本発明に係る装置(方法、プログラム)においては、前記補正量算出手段(工程、処理)は、特異値モデルに対応する補正量として、
 前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
 前記時系列の成分に嵩上げ又は嵩下げが起こった状態の補正量、
 前記時系列の成分の分散に変動が起こった状態の補正量、
 前記時系列の成分が上昇又は下降する変化が起こった状態の補正量、
 のうちのいずれかを算出するようにしてもよい。
 本発明によれば、時系列予測等の時系列処理において、時系列データの特異値による予測精度の低下を防ぐことができる。例えば、時系列予測を行う場合に、特異値の発生要因の特定が困難なために、適切な補正済み時系列データの生成が難しいという問題や、人手を介すことによる不適切な補正済み時系列データを生成する問題の解消に貢献する。
本発明の実施例の構成を示すブロック図である。 本発明の第1の実施例の特異値補正予測装置の構成を示す図である。 本発明の第1の実施例の特異値補正予測装置の動作を説明するシーケンス図である。 時系列のトレンド成分の嵩上げ例を示す図である。 時系列のトレンド成分の嵩下げ例を示す図である。 本発明の第1の実施例の特異値判別手段の動作を説明するフローチャートである。 本発明の第1の実施例の特異値補正予測装置の変形例1の構成を示す図である。 本発明の第1の実施例の変形例1の特異値補正予測装置の動作を説明するシーケンス図である。 本発明の第1の実施例の変形例1における、補正情報記憶部の内容を例示した図である。 本発明の第1の実施例の特異値補正予測装置の変形例2の構成を示す図である。 本発明の第2の実施例の特異値補正予測装置の構成を示す図である。 本発明の第2の実施例の特異値補正予測装置の動作を説明するシーケンス図である。 本発明の第2の実施例の変形例1の特異値補正予測装置の構成を示す図である。 本発明の第2の実施例の変形例1の特異値補正予測装置の動作を説明するシーケンス図である。 本発明の第3の実施例の特異値補正予測装置の構成を示す図である。 本発明の第3の実施例の特異値補正予測装置の動作を説明するシーケンス図である。 時系列のイレギュラー状態の例を示す図である。 本発明の第3の実施例の特異値判別手段の動作を説明するフローチャートである。 本発明の第3の実施例の変形例1の特異値補正予測装置の構成を示す図である。 本発明の第4の実施例の特異値補正予測装置の構成を示す図である。 本発明の第4の実施例の特異値補正予測装置の動作を説明するシーケンス図である。 本発明の第4の実施例の変形例1の特異値補正予測装置の構成を示す図である。 本発明の第4の実施例の変形例4の特異値補正予測装置の構成を示す図である。 本発明の第4の実施例におけるデータ1を示す図である。 本発明の第4の実施例におけるデータ2を示す図である。 本発明の第4の実施例におけるデータ1における補正をしない時系列データとその予測値を示す図である。 本発明の第4の実施例におけるデータ1における補正済み時系列データと補正済みデータを用いた予測値を示す図である。 本発明の第4の実施例におけるデータ2における補正をしない時系列データとその予測値を示す図である。 本発明の第4の実施例におけるデータ2における補正済み時系列データと補正済みデータを用いた予測値を示す図である。
101、101A、101B、101C、101D、101E、101F、101G、101H 特異値補正予測装置
102 入力装置
103 出力装置
104 記憶装置
201 特異値判別手段
202 特異値補正手段
203 時系列予測手段
701 補正情報記憶部
1001 特異値補正装置
1002 時系列予測装置
1101 補正量算出手段
2001 特異値検出手段
2601 データ1の予測期間以前の実測値
2602 データ1の予測期間における予測値
2603 データ1の予測期間における実測値
2701 データ1の補正済み時系列データ
2702 データ1の補正量Hを加える前の時系列データ
2703 データ1の補正量H
2704 データ1の補正済み時系列データにより予測された予測値
2801 データ2の予測期間以前の実測値
2802 データ2の予測期間における予測値
2803 データ2の予測期間における実測値
2901 データ2の補正済み時系列データ
2902 データ2の補正済み時系列データにより予測された予測値
 上記した本発明についてさらに詳細に説述すべく添付図面を参照して以下に説明する。
 本発明に係る時系列データを処理する装置は、その1つの態様において、特異値を含まない第1の時間幅の時系列データに対して時間的に後方に位置し、特異値(特異な期間の値)を含む第2の時間幅の時系列データの特異値モデルの種別に対応して、第1の時間幅の時系列データに補正を施す特異値補正手段(202)を含む。
 本発明の一態様において、前記時系列予測を行う時系列予測手段は、補正済みの前記第1の時間幅の時系列データ、又は、補正済みの第1及び第2の時間幅の時系列データを用いて、予測期間における時系列予測を行い、さらに、前記特異値モデルの種別の判別のための処理として、前記時系列予測手段は、前記特異値を含む第2の時間幅に関する予測データを、前記第1の時間幅の時系列データから予測する。
 本発明の一態様において、前記時系列予測手段で予測された特異値を含む前記第2の時間幅に関する予測データと、前記第2の時間幅の時系列データとに基づき、前記第2の時間幅の時系列データの特異値モデルを判別する特異値判別手段をさらに備えている。
 本発明においては、前記時系列予測手段で予測された特異値を含む第2の時間幅の予測データと、前記第2の時間幅の時系列データとに基づき、予め設定された特異値モデルにしたがって補正量を算出する補正量算出手段をさらに備えている。あるいは、予め複数の特異値モデルを用意しておき、前記時系列予測手段で予測された前記第2の時間幅に関する予測データと、前記第2の時間幅の時系列データとに基づき、前記複数の特異値モデルの中から、前記第2の時間幅の時系列データに最も良く当てはまる特異値モデルを決定する特異値判別手段と、前記特異値モデルに対応する補正量を算出する補正量算出手段と、を備えている。
 本発明において、前記特異値の種類を判別した後に、前記特異値の種類に対応した補正を行う手段が、トレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に嵩上げ又は嵩下げが起こった状態と判別する。
 本発明において、前記特異値の種類を判別した後に、前記特異値の種類に対応した補正を行う手段が、トレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分の分散に変動が起こった状態と判別する。
 本発明において、前記特異値の種類を判別した後に前記特異値の種類に対応した補正を行う手段が、時系列をトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分が上昇又は下降する変化が起こった状態と判別する。
 本発明において、前記特異値の値を予測する手段と、前記予測値に基づいて、前記特異値に対する補正量を算出する手段と、を備え、前記補正量を算出する手段は、トレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に嵩上げ又は嵩下げが起こった状態の補正量を算出する。
 本発明において、前記特異値の値を予測する手段と、前記予測値に基づいて、前記特異値に対する補正量を算出する手段と、を備え、前記補正量を算出する手段は、トレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分の分散に変動が起こった状態の補正量を算出する。
 本発明において、前記特異値の値を予測する手段と、前記予測値に基づいて、前記特異値に対する補正量を算出する手段と、を備え、前記補正量を算出する手段は、トレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分が上昇又は下降する変化が起こった状態の補正量を算出する。
 本発明において、過去の補正済み時系列データの結果と、前記補正済み時系列データを用いて、予測したときの予測精度を基に、補正済み時系列データの信頼度を算出する手段と、次回からの時系列予測に、前記信頼度を反映させる手段と、を備えている。
 本発明において、前記特異値を検出する手段をさらに有する。
 本発明において、原データ内の特異値に対し、その特異値の種類に対応した補正を行い、前記特異値を検出する手段を備えている。
 本発明において、特異な期間の値を欠損値とし、その他の期間のデータに補正を行うようにしてもよい。
 本発明においては、特に制限されないが、時系列データの原データ(T_θ)が、時間的に前後し、特異値を含まない第1の時間幅(T_l)の時系列データと特異値を含む第2の時間幅(T_p)の時系列データと、を含む場合について、時系列予測手段(203)は、前記第1の時間幅の時系列データから前記第2の時間幅の時系列データを予測する。特異値判別手段(201)は、時系列予測手段(203)で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、前記第2の時間幅の時系列データの特異値モデルの種別を判別する。
 特異値補正手段(202)は、特異値判別手段(201)で判別された前記特異値モデルの種別に対応して、前記第1の時間幅(T_l)の時系列データの補正を行う。あるいは、特異値補正手段(202)は、前記特異値モデルの種別に対応して、前記第1の時間幅(T_l)の時系列データ、及び、第2の時間幅(T_p)の時系列データの補正を行う。
 時系列予測手段(203)は、特異値補正手段(202)で補正済みの第1の時間幅の時系列データ、又は、補正済みの第1及び2の時間幅の時系列データを用いて、前記第2の時間幅の時系列データよりも時間的に後に位置する予測期間の値の予測を行う。
 本発明の別の態様においては、図11を参照すると、時系列予測手段(203)で予測された前記原データ内の特異値を含む所定の期間に関する予測データと、前記原データ内の前記所定の期間の時系列データとに基づき、予め設定された特異値モデルにしたがって、前記原データ内の時系列データの補正量を算出する補正量算出手段(1101)をさらに備えている。
 補正量算出手段(1101)は、時系列予測手段(203)で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、予め設定された特異値モデルにしたがって、前記第1の時間幅の時系列データに対する補正量を算出する。特異値補正手段(202)は、算出された補正量に基づき(例えば補正量が所定の閾値以上である等)、前記第2の時間幅の時系列データを欠損値として扱い、前記第2の時間幅の時系列データを削除し、補正された前記第1の時間幅の時系列データを前記原データに置き換えて出力する構成としてもよい。
 本発明において、補正された前記第1の時間幅の時系列データと第2の時間幅の時系列データを、新たな第1の時間幅の時系列データとして更新し、次に入力される新たな時系列データを新たな第2の時間幅の時系列データとして更新し、前記新たな第2の時間幅の時系列データに関する予測、特異値モデルに応じた補正を逐次的に行うようにしてもよい。
 本発明において、前記時系列予測手段の予測結果と前記補正済み時系列データとを関連付け履歴として記憶する補正情報記憶部(701)を備えた構成としてもよい。この補正情報記憶部(701)には、時間情報、特異値判定結果、補正量、予測誤差を、組として、関連付けて記憶するようにしてもよい。
 本発明において、図20を参照すると、時系列データの原データ内の特異値を検出する特異値検出手段(2001)を備えた構成としてもよい。本発明において、特異値検出手段(2001)は、時系列予測手段(203)と、特異値判別手段(201)とで構成してもよい。
 本発明において、特異値判別手段(201)は、前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
 前記時系列の成分に嵩上げ又は嵩下げが起こった状態、
 前記時系列の成分の分散に変動が起こった状態、
 前記時系列の成分が上昇又は下降する変化が起こった状態
 のうちのいずれかを判別するようにしてもよい。
 本発明において、補正量算出手段(1101)は、前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
 前記時系列の成分に嵩上げ又は嵩下げが起こった状態の補正量、
 前記時系列の成分の分散に変動が起こった状態の補正量、
 前記時系列の成分が上昇又は下降する変化が起こった状態の補正量、
 のうちのいずれかを算出するようにしてもよい。
 本発明においては、人手を介することによる不適切な補正済み時系列データの生成を防ぐことができる。特許文献2では、時系列の不規則成分を除去した値を補正量とする方法や分析者に補正量を入力させる方法を発明しているが、分析者によって、補正量や分析結果が異なる可能性があり、予測精度の低下を防ぐことができない場合もある。
 本発明においては、特異値の発生要因情報の特定が不要であり、特異値の発生要因が明確でない場合でも、特異値による予測精度の低下を防ぐことができる。
 また、本発明においては、人手を介さないことで、分析者の作業負担を軽減できる。さらに、大規模なデータも容易に扱うことができる。以下、具体的な実施例に即して説明する。
<実施例1>
 図1は、本発明の第1の実施例の時系列予測装置の構成を示す図である。図1を参照すると、時系列予測装置は、特異値補正予測装置101と、入力装置102と、出力装置103と、記憶装置104を備える。
 入力装置102は、時系列データを入力する。
 特異値補正予測装置101は、補正済み時系列データを生成して、原データとその補正済み時系列データを置き換えてから、予測期間における時系列データを予測する。
 出力装置103は、特異値補正予測装置101の時系列予測結果を出力する。
 記憶装置104は、入力装置102から入力された時系列データや特異値補正予測装置101の時系列予測結果、及び特異値補正予測装置101で使用する情報を記憶する。
 図2は、図1の特異値補正予測装置101の構成を示す図である。図2を参照すると、特異値補正予測装置101は、特異値判別手段201と、特異値補正手段202と、時系列予測手段203とを備えている。
 特異値判別手段201は、特異値の種類を判別する。なお、特異値の種類は「特異値モデル」と呼ばれる場合もある。
 特異値補正手段202は、特異値判別手段201による判別結果に基づき、時系列を補正して、補正済み時系列データを生成する。
 時系列予測手段203は、特異値補正手段202によって生成された、補正済み時系列データを用いて予測期間の時系列データを予測する。
 次に、本実施例の動作について説明する。
 初めに、適当な時間幅T_θの時系列データ[X_0,...,X_tθ]を入力装置102から入力する(ただし、Xは、時系列の値を示す)。
 時間幅T_θのうち、最初の時間幅T_lの時系列データ[X_0,...,X_tl]と、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]に分割する。
 ここでは、説明の都合上、時間幅T_lの時系列データは、特異値が含まれていないものとし、時間幅T_pの時系列データは、特異値が含まれるものとする。
 時間幅は、T_θ―T_p=T_lという関係が成り立つ。
 特異値補正予測装置101において、時間幅T_pの時系列データに対して、特異値判別手段201により、時間幅T_pの時系列データの特異値モデルを判別する。
 次に、特異値補正手段202において、予め特異値モデルごとに定めた補正量を用いて、時間幅T_θの時系列データを補正し、時間幅T_θの補正済み時系列データを生成する。
 時系列予測手段203により、補正済み時系列データを用いて、時間幅T_θから先の所定の予測幅nの時系列データを予測する。
 次に、時系列予測手段203は、予測結果を出力装置103によって出力する。さらに、記憶装置104に、その予測結果を記憶する。
 図3は、第1の実施例の動作の例を示すシーケンス図である。図3を参照して、本実施例の動作を説明する。
(1)時系列予測手段203により、時間幅T_lの時系列データ[X_0,...,X_tl]から、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]を予測する。時系列予測手段203により、予測した時間幅T_p の予測データを[Y_tl+1,...,Y_p]とする(ステップS301)。ここで、Yは予測値を示す。
(2)時系列予測手段203により予測した時間幅T_p の予測データ[Y_tl+1,...,Y_p]と時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]を基に、特異値判別手段201によって、時間幅T_pの時系列データの特異値モデルを判別する(S302)。
(3)特異値補正手段202により、特異値の状態判別結果を基にして、特異値モデルごとに予め定めた補正量Hを用いて、時間幅T_θの時系列データ[X_0,...,X_tθ]を補正し、補正済み時系列データ[X^_0,...,X^_ tθ]を生成する(S303)。ここで、X^は、補正済み時系列の値を示す。
(4)時間幅T_θの補正済み時系列データ[X^_0,...,X^_ tθ]を用いて、時間幅T_θから先の所定の予測時間幅nを予測期間として、時系列予測手段203によりT_θから先の時点の値[Y_θ+1,...,Y_θ+n]を予測する(S304)。
 本実施例においては、特異値モデルの候補を予め複数設定する必要がある。特異値には、各データで定期的に起こるものが多いため、過去の分析から特異値モデルを事前に用意することも可能である。
 さらに、本実施例において、時系列を、トレンド成分、周期成分、自己回帰成分といった各成分に分けて考えた場合に、時系列のトレンド成分に嵩上げまたは嵩下げが起こった状態が特異値となる状況を考える。つまり、特異値モデルとして時系列のトレンド成分の嵩上げ状態、嵩下げ状態を設定する。
 図4に、時系列のトレンド成分の嵩上げ状態を示す。図5に、時系列のトレンド成分の嵩下げ状態を示す。
 特異値判別手段201では、特異値モデルを判別するために、時間幅T_p の予測データ[Y_tl+1,...,Y_p]に適切な加算量Sを加えた場合の時系列データと、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]との誤差が最小になるような加算量Sを算出する。
 誤差の尺度としては、最小2乗基準を採用し、本実施例においては、RMSE(Root Mean-Square Error)という次式(1)の誤差の尺度を用いる。
Figure JPOXMLDOC01-appb-M000001
 式(1)から、最適な加算量Sを計算する。加算量Sは、式(2)によって求める。
Figure JPOXMLDOC01-appb-M000002
 特異値判別手段201は、加算量Sの、値の大きさ、符号等を調べることで、特異値モデルを判別する。
 本実施例においては、特異値モデルを判別するために、S_RMSE、Thre_shift,Thre_shift_rmse、の3種類の値を用いる。
 S_RMSEは、時間幅T_p の予測データ[Y_tl+1,...,Y_p]に適切な加算量Sを加えた場合の時系列データと、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]との予測値の平均2乗誤差を表す。
 S_RMSEは、式(3)から求める。
Figure JPOXMLDOC01-appb-M000003
 Thre_shiftは、加算量Sの閾値を表す。特異値モデルが、嵩上げ、嵩下げ状態に当てはまる場合には、加算量Sの値が大きいことが考えられる。そこで、加算量SとThre_shift の大小関係を嵩上げ、嵩下げ状態の判別基準とする。
 Thre_shift_rmseは、S_RMSE の閾値を表す。特異値が、嵩上げ、嵩下げ状態である場合は、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]に嵩上げ、または嵩下げが起こっても、周期成分、自己回帰成分などには大きな変動がないことが考えられる。
 したがって、適切な加算量Sを時間幅T_p の予測データ[Y_tl+1,...,Y_p]に加える事により、時間幅T_p の予測データ[Y_tl+1,...,Y_p]と時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]の誤差は小さいと考えられる。
 本実施例における、嵩上げ、嵩下げの特異状態を判別する処理を、図6に示すフローチャートを用いて詳しく説明する。
 |S| > Thre_shiftという条件を満たす場合は(S601のY)、嵩上げ、嵩下げが起こっている可能性が高いとする。満たさない場合は(S601のN)、嵩上げ、嵩下げではないとする(S606)。
 次に、S_RMSE(Shift_RMSE) < Thre_shift_rmseという条件を満たす場合は(S602のY)、嵩上げ、嵩下げが起こっているとする。満たさない場合は(S602のN)、嵩上げ、嵩下げではないとする(S606)。
 嵩上げ、嵩下げ状態と判定された場合には、加算量Sの符号が正の場合、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]の特異値モデルを嵩上げと判別し(S604)、負の場合、嵩下げ(S605)と判別する。
 それ以外の場合は、特異値モデルに該当するものがないとして、特異値モデル以外の突発的な異常値とする(S606)。
 本実施例においては、特異値モデルとして、トレンド成分に嵩上げが起こった状態、嵩下げ状態を考えたが、その他のモデルを用いても良い。
 その他の種類として、トレンド成分が上昇する状態、トレンド成分が下降する状態、周期成分が変動する状態、分散が変動する状態などがある。
 トレンド成分の上昇や下降が起こった状態には、本実施例で設定したトレンド成分に嵩上げ、嵩下げが起こった状態に用いた加算量Sの変わりに、トレンド成分の上昇、下降変化量を表す、加算量S_tを式(4)より求めて、特異値の判別を行うことができる。
Figure JPOXMLDOC01-appb-M000004
 周期成分に変動が起こった状態には、式(1)を式(5)に変更することで、特異値の判別を行うことができる。時間幅T_kは、周期成分の変動する周期を表す。
Figure JPOXMLDOC01-appb-M000005
 本実施例の特異値補正手段202における補正の処理を以下に詳しく示す。
 特異値判別手段201により、特異値がトレンド成分の嵩上げ、嵩下げモデルと判断された場合、時間幅T_θの時系列データ[X_tl+1,...,X_tθ]中の、T_l区間の時系列データに補正量Hを足す。
 次に、時間幅T_pの時系列データ[X_tl+1,...,X_tθ]には、トレンド成分に嵩上げ、嵩下げが起こっている途中の状態である可能性があるとして、この区間を欠損値とする。欠損値にすることで、完全に特異値の影響を除去する。
 よって、特異値がトレンド成分の嵩上げ、嵩下げモデルと判断された場合の補正済み時系列データ[X^_0,...,X^_ tθ]は、
[X^_0,...,X^_ tθ]=[X_0+H,...,X_tl+H]となる。
 特異値判別手段201によって、特異値モデルが嵩上げ、嵩下げモデルに当てはまらなかった場合は、特異値の影響を完全に除去するため、欠損値とする。
 よって、特異値モデルに当てはまらない補正済み時系列データ[X^_0,...,X^_ tθ]は、
[X^_0,...,X^_ tθ]=[X_0,...,X_tl]となる。
 本実施例によれば、時系列予測結果に基づいて、特異値モデルを特定することで、各特異値に適した補正を行うことができるため、人手による不適切な補正済み時系列データの生成を防ぐとともに、特異値の要因情報を特定する必要がなく、特異値による予測精度の低下を防ぐことができる。
 特異値モデルに当てはまらない場合は、特異値を欠損値として扱うことで、予測精度の低下を防ぐことができる。
 特異値モデルの候補を複数設定することで、様々な特異値による予測精度の低下を防ぐことができる。
 どの特異値モデルに当てはまるか分析者が特定することは、不適切な判断を招く可能性があり、このように人手を介することが原因で特異値による予測精度の低下を防ぐことができなくなることも考えられる。よって、本実施例のように、特異値モデルの候補と各特異値モデルの補正量を予め設定することにより、補正済み時系列データを生成することは、非常に有用である。
<実施例1:変形例1>
 第1の実施例の変形例を説明する。図7は、図2の特異値補正予測装置101の変形列を示す図である。図7を参照すると、図2の特異値補正予測装置101の構成に、さらに、補正情報記憶部701が追加されている。これ以外は図2と同一である。以下では、相違点のみを説明する。
 補正情報記憶部701は、時系列予測手段203による予測結果と補正済み時系列データを保存する。補正情報記憶部701に、過去の履歴を保存することにより、過去の補正精度を考慮した、特異値判別手段201が実現できる。補正情報記憶部701を活用することで、さらに予測精度の低下を防ぐことができる。
 図8は、図7の構成の動作を表すシーケンス図である。図8を参照すると、図3のシーケンス図に対して、補正情報記憶部701と特異値判別手段201の間で行われる処理(S801、S802)が追加されている。これ以外は図3と同一である。以下では、相違点のみを説明する。
 特異値判別手段201により特異値モデルが判別されると、補正情報記憶部701に、その結果が保存され、さらに、過去の同じ特異値モデルにおける予測精度情報が、補正情報記憶部701から読み出される(S801)。
 次に、もう一度、特異値判別手段201において、補正情報記憶部701から読み出された予測履歴を考慮して、特異値モデルを再判別する(S802)。過去の特異値判別手段201による判別結果が、予測の精度の低下防止に影響を与えていない場合には、判別結果の見直しが必要となる。
 図9に、補正情報記憶部701の内容の一例を示す。日時、入力値、特異値判定結果、補正量、予測誤差を1組として記憶する。過去の特異値判定結果、その補正量、その補正を行ったときの予測誤差が保存されており、この情報を基に、過去の補正精度を考慮した補正済み時系列データの生成が可能となる。
<実施例1:変形例2>
 図10は、図2の特異値補正予測装置101の変形列を示す図である。図2の特異値補正予測装置101Aを、特異値補正装置1001と、時系列予測装置1002に分けた構成としても良い。
<実施例1:変形例3>
 本実施例において、一定時間が進む都度、その時点から決められた期間の過去のデータを用いて、時系列予測手段により予測を繰り返す場合は、時間幅T_θのうち、最初の時間幅T_lの時系列データ[X_0,...,X_tl]を、前の時刻で生成した補正済み時系列データ[X^_0,...,X^_ tθ]に置きかえ、さらに、一定時間が進むことで得られる新規データを時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]として、時系列予測を逐次的に繰り返すことができる。
<実施例2>
 次に、本発明の第2の実施例を説明する。図11は、本発明の第2の実施例の構成を示す図である。図11を参照すると、本実施例において、特異値補正予測装置101Bは、図2の特異値判別手段201の代わりに、補正量算出手段1101を有する。
 補正量算出手段1101は、予め設定した特異値モデルに基づく、最適な補正量を算出する。時系列データには、そのデータ特有の決まった特異値が発生するケースが多いため、予め特異値モデルを設定できる場合も多い。しかし、特異値モデルは特定できる状態でも、その特異値を補正する値が定まらない場合には、分析者が補正値を指定する必要があるが、人手を介することで不適切な補正量を設定する可能性がある。これが原因で特異値による予測精度の低下を防げないことも考えられる。
 そこで、第2の実施例のように、予め特異値モデルを設定することで、最適な補正値を算出し、補正済み時系列データを生成することは、特段に有用である。
 特異値補正手段202は、補正量算出手段1101により算出された補正量に基づいて、時系列を補正し、補正済み時系列データを生成する。時系列予測手段203は、特異値補正手段202による補正済み時系列データから、予測期間の時系列データを予測する。
 本実施例の動作について説明する。
 初めに、適当な時間幅T_θの時系列データ[X_0,...,X_tθ]を入力装置102から入力する。時間幅T_θのうち、最初の時間幅T_lの時系列データ[X_0,...,X_tl]と時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]に分割する。時間幅T_lの時系列データは、特異値が含まれていないとし、時間幅T_pの時系列データは、特異値が含まれるものとする。
 特異値補正予測装置101Bにおいて、時間幅T_pの時系列データに対して、補正量算出手段1101により、予め設定した特異値モデルに基づく、最適な補正量を算出する。
 次に、特異値補正手段202において、時間幅T_θの時系列データを補正し、時間幅T_θの補正済み時系列データを生成する。
 時系列予測手段203により、補正済み時系列データを用いて、時間幅T_θから先の所定の予測幅nの時系列データを予測し、出力装置103によって予測結果が出力される。さらに、記憶装置104に、時系列予測結果を記憶する。
 図12は、本発明の第2の実施例の動作の一例を説明するためのシーケンス図である。以下、具体的に説明する。なお、図12において、図3と同一のステップには同一の符号が付されており、同一ステップの説明は適宜省略する。
 時系列予測手段203により予測した時間幅T_p の予測データ[Y_tl+1,...,Y_p]と時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]を基に、補正量算出手段1101において、補正量を算出する(S1201)。
 本実施例においては、第1の実施例と同様に、時系列のトレンド成分に嵩上げ、または嵩下げが起こった状態を設定する。つまり、特異値モデルとして、時系列のトレンド成分の嵩上げ状態、嵩下げ状態を設定する。
 最適な補正量を算出するために、時間幅T_p の予測データ[Y_tl+1,...,Y_p]に適切な補正量Hを加えた場合の時系列データと、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]との誤差が最小になるような補正量Hを算出する。
 誤差の尺度としては、第1の実施例と同様に、最小2乗基準を採用し、RMSE(Root Mean-Square Error)という次式(6)の誤差の尺度を用いる。
Figure JPOXMLDOC01-appb-M000006
 式(7)によって、式(6)の最適な補正量Hを求める。
Figure JPOXMLDOC01-appb-M000007
 補正量Hが、小さい場合は、補正する前の時系列データと補正済みの時系列データに差がない。そこで、補正量Hが閾値未満の場合には、特異値モデルが適切でないか、突発的な異常値と判断する。
 本実施例においては、特異値モデルとしてトレンド成分に嵩上げが起こった状態、嵩下げ状態を用いたが、第1の実施例と同様にその他の種類を設定してもよい。
 図11の補正量算出手段1101により算出された補正量Hを基に、特異値補正手段202によって時間幅T_θの時系列データ[X_0,...,X_tθ]を補正し、
 補正済み時系列データ
[X^_0,...,X^_ tθ]
 を生成する(S303)。だたし、X^は、補正済み時系列の値を示す。
 本実施例における特異値補正手段202の処理を以下に説明する。補正量Hが、閾値以上の場合は、時間幅T_θの時系列データ[X_tl+1,...,X_tθ]中の、T_l区間の時系列データに補正量Hを足す。次に、時間幅T_pの時系列データ[X_tl+1,...,X_tθ]には、トレンド成分に嵩上げ、嵩下げが起こっている途中の状態である可能性があるため、この区間を欠損値とすることで完全に特異値の影響を除去する。
 よって、補正済み時系列データ[X^_0,...,X^_ tθ]は、
[X^_0,...,X^_ tθ]=[X_0+H,...,X_tl+H]となる。
 補正量Hが、閾値未満の場合は、特異値モデルが適切でないか、突発的な異常値と判断できる場合は、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]は、特異値モデルと補正量が適していないと判断する。この場合は、特異値の影響を完全に除去するため、欠損値とする。
 よって、特異値モデルが適切でないか、突発的な異常値と判断できる場合の補正済み時系列データ[X^_0,...,X^_ tθ]は、
[X^_0,...,X^_ tθ]=[X_0,...,X_tl]となる。
 本実施例によれば、時系列予測結果に基づいて、特異値モデルに適した補正量を算出することができるため、人手による不適切な補正済み時系列データの生成を防ぐとともに、要因情報を特定しない方法によって、特異値による予測精度の低下を防ぐことができる。
 補正量Hが小さい場合、補正する前の時系列データと補正済みの時系列データに差がない。そこで、補正量Hが閾値未満の場合には、特異値モデルが適切でないか、突発的な異常値と判断し、特異値を欠損値として扱うことで、予測精度の低下を防ぐことができる。
 特異値モデルの候補を複数設定することで、様々な特異値による予測精度の低下を防ぐことができる。
 特異値モデルが特定できた場合であっても、その補正量を分析者が与える場合、不適切な補正量を与える可能性があり、人手を介することが原因で特異値による予測精度の低下を防ぐことができなくなることが考えられるため、本実施例のように、特異値モデルの候補を予め設定することにより、補正量を算出して、補正済み時系列データを生成することは、特段に有用である。
<実施例2:変形例1>
 図13は、図11の特異値補正予測装置101Bの変形列を示す図である。図13を参照すると、特異値補正予測装置101Cにおいて、図11の特異値補正予測装置101Bに対して、図7の補正情報記憶部701が追加されている。補正情報記憶部701は、時系列予測手段による予測結果と補正済み時系列データを保存する。補正情報記憶部701に、過去の履歴を保存することにより、過去の補正精度を考慮した、補正量算出手段1101が実現できる。補正情報記憶部701を活用することで、予測精度の低下を防ぐことができる。
 図14は、図13の特異値補正予測装置101Cの動作シーケンスの一例を示す図である。図14において、図12との相違点は、補正情報記憶部701と特異値判別手段1101の間で行われる処理(S1401、S1402)が追加されていることである。これ以外は、図12と同一である。同一ステップの説明は重複を回避するため適宜省略する。
 補正量算出手段1101により、ある特異値における補正量が算出されると、補正情報記憶部701にその結果が保存される。そして、過去の同じ特異値モデルにおける予測精度情報が、補正情報記憶部701から読み出される(S1401)。
 次に、もう一度、補正量算出手段1101において、補正情報記憶部701から読み出された予測履歴を考慮して、補正量の算出を行う(S1402)。過去の補正量算出手段1101による補正量が、予測の精度の低下防止に影響を与えていない場合には、補正量の見直しが必要となる。補正情報記憶部701には、例えば図9に示す内容が保存される。
<実施例2:変形例2>
 なお、図13の特異値補正予測装置101Cを、図10に示したように、特異値補正装置1001と時系列予測装置1002に分けた構成にしてもよい。
<実施例2:変形例3>
 本実施例において、一定時間が進む都度、その時点から決められた期間の過去のデータを用いて、時系列予測手段により予測を繰り返すことは、前記第1の実施例の変形例3と同様に行うことができる。
<実施例3>
 次に本発明の第3の実施例を説明する。図15は、本発明の第3の実施例の構成を示す図である。図15を参照すると、特異値補正予測装置101Dは、特異値判別手段201と、補正量算出手段1101と、特異値補正手段202と、時系列予測手段203とを有する。
 前記第1の実施例では、特異値モデルを複数用意し、各特異値モデルに対する補正量を予め定めてから、最も特異値に当てはまる特異値モデルを見つけて、補正済み時系列データを生成する。
 前記第2の実施例では、予め特異値モデルを設定し、最適な補正量を算出して、補正済み時系列データを生成する。
 第3の実施例では、特異値モデルを複数用意することにより、特異値判別手段201によって、最も特異値に当てはまる特異値モデルを見つけて、補正量算出手段1101により、その特異値モデルに最適な補正量を算出して、補正済み時系列データを生成する。つまり、第3の実施例は、第1の実施例と第2の実施例の組み合わせである。以下、本発明の第3の実施の動作を説明する。
 初めに、適当な時間幅T_θの時系列データ[X_0,...,X_tθ]を入力装置102から入力する。時間幅T_θのうち、最初の時間幅T_lの時系列データ[X_0,...,X_tl]と時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]に分割する。時間幅T_lの時系列データは、特異値が含まれていないとし、時間幅T_pの時系列データは、特異値が含まれるものとする。
 特異値補正予測装置101Dにおいて、時間幅T_pの時系列データに対して、特異値判別手段201により、特異値モデルを判別する。
 時間幅T_pの時系列データに対して、補正量算出手段1101により、予め設定した特異値モデルに基づく、最適な補正量を算出する。
 次に、特異値補正手段202において、特異値モデルとその補正量を用いて、時間幅T_θの時系列データを補正し、時間幅T_θの補正済み時系列データを生成する。
 時系列予測手段203により、補正済み時系列データを用いて、時間幅T_θから先の所定の予測幅nの時系列データを予測し、出力装置103によって予測結果が出力される。さらに、記憶装置104に、時系列予測結果を記憶する。
 図16は、第3の実施例の動作の例を示すシーケンス図である。以下、具体的に説明する。なお、図16において、図3と同一のステップには同一の符号が付されており、同一ステップの説明は適宜省略する。
 時系列予測手段203により予測した時間幅T_p の予測データ[Y_tl+1,...,Y_p]と時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]を基に、特異値判別手段201により、時間幅T_pの時系列データの特異値モデルを判別する(S1601)。
 次に、補正量算出手段1101において、特異値判別手段201の判別結果に応じた、補正量Hを算出する(S1602)。
 特異値判別手段201により、トレンド成分に嵩上げ、嵩下げ状態と判別された場合、補正量算出手段1101では、特異値判別手段201で求めた加算量Sを補正量Hに置き換える。
 特異値判別手段201により、イレギュラー状態と判別された場合や特異な状態ではないと判断された場合には、補正量はH=0と設定する。
 特異値判別手段201による特異値モデル、補正量算出手段1101により補正量が求まる。
 次に、特異値補正手段202によって、時間幅T_θの時系列データ(X_0,...,X_tθ)を補正して、補正済み時系列データ[X^_0,...,X^_ tθ]を生成する(S1603)。ここで、X^は、補正済み時系列の値を示す。
 本実施例においては、特異値モデルの候補を、予め複数設定する必要がある。特異値には、各データで定期的に起こるものが多いため、過去の分析から特異値モデルを事前に用意することは可能である。
 本実施例においては、時系列をトレンド成分、周期成分、自己回帰成分といった各時系列成分に分けて考えた場合に、時系列のトレンド成分に嵩上げが起こった状態、嵩下げが起こった状態、通常のデータの挙動と独立なイレギュラーな挙動が起こった状態の種類の特異値モデルを設定する。
 本実施例においては、通常のデータの挙動と独立なイレギュラーな挙動が発生した状態を「イレギュラー状態」と呼ぶ。
 時系列のトレンド成分の嵩上げ状態、嵩下げ状態はそれぞれ図4、図5に示したようなものである。
 図17に、時系列の突発的な異常値であるイレギュラー状態の例を示す。
 特異値モデルを判別するために、時間幅T_p の予測データ[Y_tl+1,...,Y_p]に適切な加算量Sを加えた場合の時系列データと、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]との誤差が最小になるような加算量Sを算出する。
 誤差の尺度としては、最小2乗基準を採用し、本実施例においては、RMSE(Root Mean-Square Error)という次式の誤差の尺度を用いる。
 上記した式(1)、式(2)を用いて、加算量Sを求める。さらに、加算量Sの値の大きさ、符号等を調べることで、特異値モデルを判別する。
 本実施例においては、特異値の種類を判定に、S_RMSE、I_RMSE、Thre_shift、Thre_shift_rmse 、Thre_irregular_rmse、の5種類の値を用いる。なお、S_RMSEは、Thre_shift、Thre_shift_rmseは、第1の実施例と同様であるため、詳細は省略する。
 I_RMSEは、時間幅T_p の予測データ[Y_tl+1,...,Y_p]と、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]との予測値の平均2乗誤差を表す。I_RMSEは、次式(8)で求めることができる。
Figure JPOXMLDOC01-appb-M000008
 Thre_irregular_rmseは、I_RMSEの閾値を表す。通常のデータの挙動と独立なイレギュラーな挙動が発生した状態では、トレンド成分などには大きな変動がないものの、周期成分などに変動が起こると考えられることから、時間幅T_p の予測データ[Y_tl+1,...,Y_p]と時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]の誤差は大きいことが考えられる。よって、Thre_irregular_rmseとI_RMSEの大小関係をイレギュラー状態の判定基準とする。
 以上、5種類の値を用いて、特異値モデルを判別する。
 図18は、本実施例における特異値モデルの判別処理を説明するフローチャートである。図18において、嵩上げ、嵩下げ状態の判別条件は、第1の実施例の説明で参照した図6のステップS601~ステップS605と同様であるため、詳細は省略する。
 嵩上げ、嵩下げ状態と判別する条件を満たさない場合には、次にイレギュラー状態であるか判別する。イレギュラー状態と判別する条件を以下に示す。
 I_RMSE(Irregular_RMSE) > Thre_irregular_rmse というイレギュラー状態の条件を満たすか否か判定し(S1801)、満たす場合には(S1801のY)、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]の特異値モデルをイレギュラー状態とする(S1802)。
 嵩上げ、嵩下げ状態と判別する条件とイレギュラー状態と判別する条件を両方とも満たさない場合には、時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]は、特異な状態ではないとする(S1803)。
 本実施例においては、特異値モデルとして、トレンド成分に嵩上げが起こった状態、嵩下げ状態、イレギュラー状態を用いたが、前記第1の実施例と同様にその他の特異値モデルを設定してもよい。
 本実施例の特異値補正手段202における補正処理を以下に説明する。
 特異値モデルが、トレンド成分の嵩上げ、嵩下げモデルと判別され、補正量算出手段1101によって補正量Hが算出された場合には、時間幅T_θの時系列データ[X_tl+1,...,X_tθ]中の、T_l区間の時系列データに補正量Hを足す。
 さらに、時間幅T_pの時系列データ[X_tl+1,...,X_tθ]には、トレンド成分に嵩上げ、嵩下げが起こっている途中の状態である可能性があるため、この区間を欠損値とする。欠損値とすることで、完全に特異値の影響を除去する。
 よって、特異値モデルがトレンド成分の嵩上げ、嵩下げモデルであるとされた場合の補正済み時系列データ[X^_0,...,X^_ tθ]は、
[X^_0,...,X^_ tθ]=[X_0+H,...,X_tl+H]となる。
 特異値モデルが、イレギュラー状態のモデルであるとされた場合には、通常のデータの挙動と独立なイレギュラーな挙動が発生した状態であるため、特異値を欠損値として扱うことで、完全に特異値の影響を除去する。よって、イレギュラー状態の補正済み時系列データ[X^_0,...,X^_ tθ]は、
[X^_0,...,X^_ tθ]=[X_0,...,X_tl]となる。
 特異値判別手段201により、特異な状態ではないと判断された場合の補正済み時系列データ[X^_0,...,X^_ tθ]は、
[X^_0,...,X^_ tθ]=[X_0,...,X_tl ,X_tl+1,...,X_tθ]となる。
 本実施例によれば、時系列予測結果に基づいて、特異値モデルの候補から、モデルを判別し、そのモデルに適した補正量を算出することができるため、人手による不適切な補正済み時系列データの生成を防ぐとともに、要因情報を特定しない方法によって、特異値による予測精度の低下を防ぐことができる。特異値モデルの候補を複数設定することで、様々な特異値による予測精度の低下を防ぐことができる。
<実施例3:変形例1>
 図19は、図15の特異値補正予測装置101Dの変形列を示す図である。図19を参照すると、特異値補正予測装置101Eにおいては、図15の特異値補正予測装置101Dに、図7の補正情報記憶部701が追加されている。その他については、図15と同一であり、同一要素の説明は適宜省略する。
 補正情報記憶部701は、時系列予測手段203による予測結果と補正済み時系列データを保存する。補正情報記憶部701に、過去の履歴を保存することにより、過去の補正精度を考慮した特異値判別手段201と補正量算出手段1101が実現できる。補正情報記憶部701を活用することで、予測精度の低下を防ぐことができる。
 図19の動作は、前記第1、2の実施例と同様であるため、説明は省略する。
<実施例3:変形例2>
 図19の特異値補正予測装置101Eを、図10に示したように、特異値補正装置1001と時系列予測装置1002に分けた構成にしてもよい。
<実施例3:変形例3>
 本実施例において、一定時間が進む都度、その時点から決められた期間の過去のデータを用いて、時系列予測手段により予測を繰り返すことは、第1の実施例の変形例3と同様に行うことができる。
<実施例4>
 次に、本発明の第4の実施例を説明する。図20は、本発明の第4の実施例の構成を示す図である。図20を参照すると、本実施例においては、入力された時系列データに特異値が含まれているか検出する特異値検出手段2001、特異値判別手段201、補正量算出手段1101、特異値補正手段202、時系列予測手段203を備えている。このうち、補正量算出手段1101、特異値補正手段202、時系列予測手段203は、前記した各実施例で説明したものと同一であり、以下では、重複を回避するため、同一要素の説明は適宜省略する。
 前記第1乃至3の実施例では、時間幅T_θの時系列データ内の時間幅T_pの時系列データに、特異値が含まれているということが、前提になっていた。
 本実施例においては、特異値を検出する手段を備えたことで、入力装置102から時系列データを入力しただけで、特異値による予測精度の低下を防ぎながら、予測期間における時系列予測を行うことを可能としている。
 さらに、特異値の検出を、人手を介して行う場合は、特異値の見落としなども発生しやすいため、特異値による予測精度の低下を防ぐことが困難な場合である。本実施例のように、特異値の検出手段を有することで、人手を介すことによる不適切な補正済み時系列データの生成を防ぐことができる。
 本発明の第4の実施例の動作について説明する。
 初めに、適当な時間幅T_θの時系列データ[X_0,...,X_tθ]が入力装置102から入力される。
 特異値補正予測装置101Fに、入力された時系列に対して、特異値検出手段2001により、時間幅T_θの時系列データ内の特異値の有無を検出し、特異値が検出されなければ、図20の時系列予測手段203により、時間幅T_θから先の所定の予測幅nの時系列データを予測し、出力装置103によって予測結果が出力される。さらに、記憶装置104に、時系列予測結果を記憶する。
 特異値検出手段2001により、時間幅T_θの時系列データ内で特異値が検出された場合には、時間幅T_θのうち、特異値が検出されるまでの時間幅T_lの時系列データ[X_0,...,X_tl]と特異値が検出された時刻からの時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]に分割する。
 ここで、時間幅T_lの時系列データ[X_0,...,X_tl]の長さが小さい場合には、記憶装置104から、過去の入力時系列データ[X_-tq,...,X_-1]を読み出して、[X_0,...,X_tl]に付け加えることとする。
 よって、時間幅T_lの時系列データには、特異値が含まれていないとし、時間幅T_pの時系列データには、特異値が含まれることとなる。
 次に、時間幅T_pの時系列データに対して、特異値判別手段201により、特異値モデルを判別する。
 そして、時間幅T_pの時系列データに対して、補正量算出手段1101により、最適な補正量を算出する。
 次に、特異値補正手段202において、時間幅T_θの時系列データを補正し、時間幅T_θの補正済み時系列データを生成する。
 時系列予測手段203により、補正済み時系列データを用いて、時間幅T_θから先の所定の予測幅nの時系列データを予測し、出力装置103によって予測結果が出力される。さらに、記憶装置104に、時系列予測結果を記憶する。
 図21は、第4の実施例の動作の一例を説明するためのシーケンス図である。以下では、特異値検出手段2001により、時間幅T_θのうちに特異値が含まれているとして説明する。
 時間幅T_θの時系列データ内に対して、初めに特異値検出手段2001により、時系列の時間幅T_θ内の特異値を検出する(S2101)。
 特異値が検出された場合、時間幅T_θのうち、特異値が検出されるまでの時間幅T_lの時系列データ[X_0,...,X_tl]と特異値が検出された時刻からの時間幅T_pの時系列データ[X_tl+1,...,X_ tθ]に分割する。
 その後のステップS301、S1601~S1603、S304は、図16の前記第3の実施例と同様であるため、詳細を省略する。
 本実施例によれば、特異値検出手段を有することにより、入力装置102から時系列データを入力しただけで、人手による不適切な補正済み時系列データの生成を防ぐとともに、要因情報を特定しない方法によって、特異値による予測精度の低下を防ぐことができる。
 特異値モデルの候補を複数設定することで、様々な特異値による予測精度の低下を防ぐことができる。
 特異値の検出手段を有することで、人手を介すことによる不適切な補正済み時系列データの生成を防ぐことができる。
<実施例4:変形例1>
 図22は、図20の特異値補正予測装置101Fの変形列を示す図である。図22を参照すると、特異値補正予測装置101Gにおいては、図20の構成に、図7の補正情報記憶部701が追加されている。その他は、前記第4の実施例と同一であるため、同一要素の説明は省略する。
 補正情報記憶部701は、時系列予測手段による予測結果と補正済み時系列データを保存する。補正情報記憶部701に、過去の履歴を保存することにより、過去の補正精度を考慮した、補正量算出手段1101が実現できる。
 補正情報記憶部701を活用することで、予測精度の低下を防ぐことができる。
 図22の特異値補正予測装置101Gの動作は、前記第1乃至第4の実施例と重複するため、省略する。
<実施例4:変形例2>
 図22の特異値補正予測装置101Gを、特異値補正装置1001と時系列予測装置1002に分けた構成にしてもよい。
<実施例4:変形例3>
 図22において、特異値検出手段2001は、時系列データから特異値を検出することが実現されていれば良く、特異値検出手段2001は、上記に限られるものではない。
 なお、特異値検出手段2001は、「異常値検出手段」、「外れ値検出手段」などと呼ばれることもある。
<実施例4:変形例4>
 図23は、本発明の第4の実施例の変形例4の構成を示す図である。図23に示すように、特異値検出手段2001を、特異値判別手段201と時系列予測手段203によって代用する構成としてもよい。
 図23の特異値補正予測装置101Hの動作を以下に説明する。
 時系列の時間幅T_θ内の特異値を検出するために、時間幅T_θの時系列データを、最初の時間幅T_lの時系列データ[X_0,...,X_tl]と時間幅T_pの時系列データ[X_tl+1,...,X_ tp]に分割する。ここで、T_l+T_p ≦T_θとする。
 次に、時間幅T_lの時系列データ[X_0,...,X_tl]を用いて、時間幅T_pの時系列データ[X_tl+1,...,X_ tp]内の特異値を検出するために、図16に示したシーケンス図におけるS301、S1601の処理を用いる。
 初めに、時間幅T_lの時系列データを用いて、時間幅T_pの時系列データを予測する(S301)。
 次に、時間幅T_pの時系列データ、時間幅T_p の予測データを基に、特異値モデルを判別する(S1601)。特異値モデルの判別の処理は、図18のフローチャートに従って行われる。
 時間幅T_pの時系列データを、特異な状態ではないと判断した場合には(図18のS1803)において、時間幅T_pの時系列データに特異値が検出されなかったとする。
 さらに、ステップS604、S605、S1802に相等する場合は、時間幅T_pの時系列データに、特異値が検出されたとする。
 このように、時間幅T_θの時系列データの特異値を検出するために、T_l+T_p ≦T_θが成り立つT_l、T_pの全ての組み合わせに対して、上記のアルゴリズムを実行することで、時間幅T_θの時系列データの特異値を検出することができる。
 特異値検出手段2001を、特異値判別手段201と時系列予測手段203によって、代用することができる。
<実施例4:変形例5>
 本実施例において、一定時間が進む都度、その時点から決められた期間の過去のデータを用いて、時系列予測手段により予測を繰り返すことは、第1の実施例の変形例3と同様に行うことができるため、詳細は省略する。
<実データでの実験>
 以下に、実データに即した実験の具体例を説明する。
 マネージドサービス(ネットワーク装置、サーバ類の保守・運用を行うサービス)でされる時系列データを対象に時系列予測を行う。
 本実施例においては、データに起こる特異値のうち、特に分析に大きな影響を与えるトレンド成分の嵩上げ、嵩下げ状態、イレギュラー状態を扱う。
 また、ここでは、トレンド成分の嵩上げ、嵩下げ状態を「トレンドシフト状態」と呼ぶ。トレンドシフト状態は、例えばシステムや機器の増設などのリソース環境の変更により、これまでの観測値の傾向に嵩上げがかかるように変化することで発生する。このような状況で時系列予測手段による予測期間の時系列予測を行うと、予測値の傾向が、特異値である嵩上げに引きずられて予測精度の低下をまねく。
 イレギュラー状態とは、通常のデータの挙動と独立な特異な挙動が発生した特異状態を表す。トレンド成分、周期成分、自己回帰成分の一定量の変化以外の特異な状態である。イレギュラー状態は、例えば、監視対象がwebサーバの場合、その企業が商品の販売促進のためにキャンペーンを行うことで、急激にwebサーバへのアクセスが増加し、キャンペーン終了後にはアクセスが急激に減少することで発生する。このような状況で時系列予測手段による予測を行うと、イレギュラー状態によって予測精度の低下をまねく。
 なお、本実験は、前述した第4の実施例の変形例4、5の構成を用いて行った。時系列予測装置(図23の時系列予測手段203)として、特許文献1と同様の時系列予測装置を用いて実験を行った。この時系列予測装置には、時系列予測に用いる時系列中の欠損値を自動的に補間する機能が備わっており、欠損化の影響を軽減できる。つまり、特許文献1の時系列予測装置には、
補正済み時系列データ[X^_0,...,X^_ tθ]に、欠損値があっても、自動的に保管する機能が備わっている。
 以下の実験例では、一定時間が進む都度、その時点から決められた期間の過去のデータを用いて、時系列予測手段による長期予測を繰り返す状況を考える。
 実験データには、特異な挙動が発生する期間が含まれた、ネットワークハードウェア機器の2種類のリソースデータ1年分(1日,1点)を用いた。
 実験データには、以下の2種類を用いる。
<実験データ1>
 実験データ1は、ファイルサーバ専用機とキャッシュ間の書き込み時間率を表す時系列データである。実験データ1は、トレンドシフト状態、イレギュラー状態が発生している。webサーバへの突発的なアクセスの集中やシステムの増設などが原因として考えられる。図24に実験データ1を示す。
<実験データ2>
 実験データ2は、ハードディスク使用率を表す時系列データである。実験データ2は、トレンドシフト状態が発生している。大量なデータを一時的に移動させたことにより、トレンドシフト状態が発生したと考えられる。図25に、実験データ2を示す。
 前記第4の実施例で用いる各種パラメータは、時間幅T_θ、T_l、T_p、予測時間幅nであり、この実験では、それぞれ、時間幅T_θ=90、T_l=83、T_p=7、予測時間幅n=90と設定した。
 よって、この実験においては、時間幅T_θ=90の時系列データ(X _0,...,X _89)を入力装置から入力する。そして、時間幅T_θの最初の時間幅T_l=83の時系列データ(X _0,...,X _82)と、その後の時間幅T_p=7の時系列データ(X _83,...,X _89)とに分割することとなる。ここで、Xは、時系列の値を示す。
 時間幅は、T_θ- T_p =T_lという関係が成り立ち、90-7=83となる。
 予測時間幅nをn=90として、時間幅T_θ=90から先の所定の予測時間幅n=90を予測期間として、T_θ=90から先の時点の値を、時系列予測手段203によって予測する。すなわち、3ヶ月(90日)分の時系列データを用いて、次の3ヶ月(90日)のデータの予測を7日分の間隔で、時系列予測を繰り返す。
 特異値判別手段201で使用する前記第4の実施例で定義した各閾値は、Thre_shift=7.0,Thre_shift_rmse=5.0,Thre_irregular_rmse=5.0と設定する。
 以下に各実験結果を説明する。
<実験データ1>
 特異値補正予測装置101を用いない場合の予測結果を図26に示す。予測期間以前の時系列データ2601を用いて、時系列予測を行った結果、予測値2602と実測値2603の誤差が大きくなり、特異値によって予測精度が低下している。
 特異値補正予測装置101を用いた予測結果を図27に示す。特異値補正予測装置101により、補正済み時系列データ2701を用いて時系列予測を行った結果、予測値2704と実測値2603の誤差が、図26と比べて小さくなり、特異値による予測精度の低下を防ぐことができたことがわかる。
 補正済みデータ2702は、図27に示す予測期間よりも、前の時刻で生成された補正済み時系列データである。補正済みデータ2701は、補正済みデータ2702を特異値補正予測装置101によって算出された補正量2703によって、補正されている。
 補正済み時系列データ2701、2702において、欠損している値は、時系列データが補正されたためである。
<実験データ2>
 特異値補正予測装置101を用いない場合の予測結果を図28に示す。予測期間以前の時系列2801を用いて、時系列予測を行った結果、予測値2802と実測値2803の誤差が大きくなり、特異値によって予測精度が低下している。
 特異値補正予測装置101を用いた予測結果を図29に示す。特異値補正予測装置101により、補正済み時系列データ2901を用いて時系列予測を行った結果、予測値2902と実測値2803の誤差が、図28と比べて小さくなり、特異値による予測精度の低下を防ぐことができていることがわかる。
 補正済み時系列データ2901は、予測期間以前の時系列データ2801が特異値補正予測装置101により補正されて、特異値の影響を取り除かれていた時系列データである。
 補正済み時系列データ2901において、欠損している値は、時系列データが補正されたためである。 
 上記実験では、2種類のデータを用いた実験の結果、特異値の自動処理を行った場合のほうが自動処理を行わなかった場合に比べて、予測精度の低下を防ぐことが確認できた。
 特異値補正予測装置により、人手による不適切な補正済み時系列データの生成を防ぐとともに、要因情報を特定しない方法によって、特異値による予測精度の低下を防ぐことができた。
 なお、本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。

Claims (59)

  1.  特異値を含まない第1の時間幅の時系列データに対して時間的に後方に位置する第2の時間幅の時系列データの特異値モデルに対応して、前記第1の時間幅の時系列データに補正を施す特異値補正手段を含む、ことを特徴とする時系列データ処理装置。
  2.  前記特異値補正手段は、前記第2の時間幅の時系列データの前記特異値モデルに対応して前記第2の時間幅の時系列データを欠損値とし、特異値の影響を除く補正を行う、ことを特徴とする請求項1に記載の時系列データ処理装置。
  3.  補正済みの前記第1の時間幅の時系列データ、又は、補正済みの前記第1及び第2の時間幅の時系列データが、予測期間の時系列予測を行う時系列予測手段に供せられる、ことを特徴とする請求項1又は2に記載の時系列データ処理装置。
  4.  前記時系列予測手段が、補正済みの前記第1時間幅の時系列データ、又は、補正済みの前記第1及び第2の時間幅の時系列データを用いて、前記第2の時間幅の時系列データよりも時間的に後方の予測期間における時系列予測を行うほか、
     さらに、前記第2の時間幅に関する予測データを前記第1の時間幅の時系列データから予測する、ことを特徴とする請求項3に記載の時系列データ処理装置。
  5.  前記時系列予測手段で予測された前記第2の時間幅に関する予測データと、前記第2の時間幅の時系列データとに基づき、前第2の時間幅の時系列データの特異値モデルを判別する特異値判別手段をさらに備えている、ことを特徴とする請求項4に記載の時系列データ処理装置。
  6.  前記時系列予測手段で予測された前記第2の時間幅の予測データと、前記第2の時間幅の時系列データとに基づき、予め設定された特異値モデルにしたがって、補正量を算出する補正量算出手段をさらに備えている、ことを特徴とする請求項4に記載の時系列データ処理装置。
  7.  予め複数の特異値モデルを用意しておき、
     前記時系列予測手段で予測された前記第2の時間幅に関する予測データと、前記第2の時間幅の時系列データとに基づき、前記複数の特異値モデルの中から、前第2の時間幅の時系列データに最も良く当てはまる特異値モデルを決定する特異値判別手段と、
     前記特異値モデルに対応する補正量を算出する補正量算出手段と、
     を備えている、ことを特徴とする請求項4に記載の時系列データ処理装置。
  8.  前記特異値補正手段は、前記第2の時間幅の時系列データが特異値モデルに該当しない異常値の場合、前記第2の時間幅の時系列データの補正として、前記第2の時間幅の時系列データを欠損値として扱い、前記第1の時間幅の時系列データを補正した時系列データを出力する、ことを特徴とする請求項1乃至7のいずれか1項に記載の時系列データ処理装置。
  9.  前記第1の時間幅の時系列データから前記第2の時間幅の時系列データを予測する時系列予測手段と、
     前記時系列予測手段で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、予め用意された複数の特異値モデルの中から、前記第2の時間幅の時系列データの特異値モデルを判別する特異値判別手段と、
     を備え、
     前記特異値補正手段は、
     前記特異値判別手段で判別された前記特異値モデルに対応して、前記第1の時間幅の時系列データ、又は、前記第1及び第2の時間幅の時系列データの補正を行い、
     前記時系列予測手段は、
     前記第1及び第2の時間幅の時系列データについて、前記特異値モデルに対応した補正が施された時系列データを用いて、前記第2の時間幅の時系列データよりも後の時点の予測期間の値の予測を行う、ことを特徴とする請求項1又は2に記載の時系列データ処理装置。
  10.  前記特異値補正手段は、
     前記特異値モデルの判別結果に基づき、前記第2の時間幅の時系列データを欠損値として扱う場合、補正済みの前記第1の時間幅の時系列データを、もとの前記第1及び第2の時間幅の時系列データに置き換えて出力する、ことを特徴とする請求項9に記載の時系列データ処理装置。
  11.  前記第1の時間幅の時系列データから前記第2の時間幅の時系列データを予測する時系列予測手段と、
     前記時系列予測手段で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、予め設定された特異値モデルにしたがって、前記第1の時間幅の時系列データに対する補正量を算出する補正量算出手段と、
     を備え、
     前記特異値補正手段は、
     前記補正量算出手段で算出された補正量に従って、前記第1の時間幅の時系列データの補正を行い、
     前記時系列予測手段は、
     前記第1及び第2の時間幅の時系列データについて、補正が施された時系列データを用いて、前記第2の時間幅の時系列データよりも時間的に後方の予測期間の値の予測を行う、ことを特徴とする請求項1又は2に記載の時系列データ処理装置。
  12.  前記特異値補正手段は、
     前記補正量算出手段で算出された補正量に基づき、前記第2の時間幅の時系列データを欠損値として扱う場合、補正済みの前記第1の時間幅の時系列データを、もとの前記第1及び第2の時間幅の時系列データに置き換えて出力する、ことを特徴とする請求項11に記載の時系列データ処理装置。
  13.  前記時系列予測手段の予測結果と前記補正済み時系列データとを関連付け履歴として記憶する補正情報記憶部を備えている、ことを特徴とする請求項3乃至7、9乃至12のいずれか1項に記載の時系列データ処理装置。
  14.  前記補正情報記憶部は、時間情報、特異値判定結果、補正量、予測誤差を、組として、関連付けて記憶する、ことを特徴とする請求項13に記載の時系列データ処理装置。
  15.  前記時系列データの特異値を検出する特異値検出手段を備えている、ことを特徴とする請求項1乃至14のいずれか1項に記載の時系列データ処理装置。
  16.  前記時系列予測手段と、前記特異値判別手段と、を備え、前記時系列データの特異値を検出する特異値検出手段を備えている、ことを特徴とする請求項5に記載の時系列データ処理装置。
  17.  補正された前記第1の時間幅の時系列データと前記第2の時間幅の時系列データを、新たな第1の時間幅の時系列データとし、
     次に入力される新たな時系列データを新たな第2の時間幅の時系列データとし、
     前記新たな第2の時間幅の時系列データに関する予測、特異値モデルに応じた、前記新たな第1の時間幅の時系列データ、又は、前記新たな第1の時間幅の時系列データと前記新たな第2の時間幅の時系列データの補正を行う、ことを特徴とする請求項5乃至16のいずれか1項に記載の時系列データ処理装置。
  18.  前記特異値判別手段は、前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
     前記時系列の成分に嵩上げ又は嵩下げが起こった状態、
     前記時系列の成分の分散に変動が起こった状態、
     前記時系列の成分が上昇又は下降する変化が起こった状態
     のうちのいずれかを判別する、ことを特徴とする請求項5、7、9のいずれか1項に記載の時系列データ処理装置。
  19.  前記補正量算出手段は、前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
     前記時系列の成分に嵩上げ又は嵩下げが起こった状態の補正量、
     前記時系列の成分の分散に変動が起こった状態の補正量、
     前記時系列の成分が上昇又は下降する変化が起こった状態の補正量、
     のうちのいずれかを算出する、ことを特徴とする請求項6、7、11のいずれか1項に記載の時系列データ処理装置。
  20.  特異値を含まない第1の時間幅の時系列データに対して時間的に後方に位置する第2の時間幅の時系列データの特異値モデルに対応して、前記第1の時間幅の時系列データに補正を施す特異値補正工程を含む、ことを特徴とする時系列データ処理方法。
  21.  前記特異値補正工程において、
     前記第2の時間幅の時系列データの特異値モデルに対応して前記第2の時間幅の時系列データを欠損値とし、特異値の影響を除く補正を行う、ことを特徴とする請求項20に記載の時系列データ処理方法。
  22.  補正済みの前記第1の時間幅の時系列データ、又は、補正済みの前記第1及び第2の時間幅の時系列データが、予測期間の時系列予測に供せられる、ことを特徴とする請求項20又は21に記載の時系列データ処理方法。
  23.  前記時系列予測を行う時系列予測工程において、
     補正済みの前記第1時間幅の時系列データ、又は、補正済みの前記第1及び第2の時間幅の時系列データを用いて、前記第2の時間幅の時系列データよりも時間的に後方の予測期間における時系列予測を行うほか、
     さらに、
     前記第2の時間幅に関する予測データを、前記第1の時間幅の時系列データから予測する、ことを特徴とする請求項22に記載の時系列データ処理方法。
  24.  前記時系列予測工程で予測された前記第2の時間幅の予測データと、前記第2の時間幅の時系列データとに基づき、前第2の時間幅の時系列データの特異値モデルを判別する特異値判別工程をさらに含む、ことを特徴とする請求項23に記載の時系列データ処理方法。
  25.  前記時系列予測工程で予測された第2の時間幅の予測データと、前記第2の時間幅の時系列データとに基づき、予め設定された特異値モデルにしたがって補正量を算出する補正量算出工程をさらに含む、ことを特徴とする請求項23に記載の時系列データ処理方法。
  26.  予め複数の特異値モデルを用意しておき、
     前記時系列予測工程で予測された前記第2の時間幅に関する予測データと、前記第2の時間幅の時系列データとに基づき、複数の特異値モデルの中から、前記第2の時間幅の時系列データに最も良く当てはまる特異値モデルを決定する特異値判別工程と、
     決定された前記特異値モデルに対応する補正量を算出する補正量算出工程と、
     をさらに含む、ことを特徴とする請求項23に記載の時系列データ処理方法。
  27.  前記特異値補正工程は、前記第2の時間幅の時系列データが特異値モデルに該当しない異常値の場合、前記第2の時間幅の時系列データの補正として、前記第2の時間幅の時系列データを欠損値として扱い、前記第1の時間幅の時系列データを補正した時系列データを出力する、ことを特徴とする請求項20乃至26のいずれか1項に記載の時系列データ処理方法。
  28.  前記第1の時間幅の時系列データから前記第2の時間幅の時系列データを予測する時系列予測工程と、
     前記時系列予測工程で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、予め用意された複数の特異値モデルの中から、前記第2の時間幅の時系列データの特異値モデルを判別する前記特異値判別工程と、
     を含み、
     前記特異値補正工程は、
     前記特異値判別工程で判別された前記特異値モデルに対応して、前記第1の時間幅の時系列データ、又は、前記第1及び第2の時間幅の時系列データの補正を行い、
     前記時系列予測工程は、
     前記第1及び第2の時間幅の時系列データについて、前記特異値モデルに対応した補正が施された時系列データを用いて、
     前記第2の時間幅の時系列データよりも時間的に後方の予測期間の値の予測を行う、ことを特徴とする請求項20又は21に記載の時系列データ処理方法。
  29.  前記特異値補正工程は、
     前記特異値モデルの判別結果に基づき、前記第2の時間幅の時系列データを欠損値として扱う場合、補正された前記第1の時間幅の時系列データを、もとの前記第1及び第2の時間幅の時系列データに置き換えて出力する、ことを特徴とする請求項28に記載の時系列データ処理方法。
  30.  前記第1の時間幅の時系列データから前記第2の時間幅の時系列データを予測する時系列予測工程と、
     前記時系列予測工程で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、予め設定された特異値モデルにしたがって、前記第1の時間幅の時系列データに対する補正量を算出する補正量算出工程と、
     を含み、
     前記特異値補正工程は、
     前記補正量算出工程で算出された補正量に従って、前記第1の時間幅の時系列データの補正を行い、
     前記時系列予測工程は、
     前記第1及び第2の時間幅の時系列データに関して、補正が施された時系列データを用いて、前記第2の時間幅の時系列データよりも時間的に後方の予測期間の値の予測を行う、ことを特徴とする請求項20又は21に記載の時系列データ処理方法。
  31.  前記特異値補正工程は、
     前記補正量算出工程で算出された補正量に基づき、前記第2の時間幅の時系列データを欠損値として扱う場合、補正された前記第1の時間幅の時系列データを、もとの前記第1及び第2の時間幅の時系列データに置き換えて出力する、ことを特徴とする請求項30に記載の時系列データ処理方法。
  32.  前記時系列予測工程の予測結果と前記補正済み時系列データとを関連付け履歴として記憶する補正情報記憶部を含む、ことを特徴とする請求項23乃至26、28乃至31のいずれか1項に記載の時系列データ処理方法。
  33.  前記補正情報記憶部は、時間情報、特異値判定結果、補正量、予測誤差を、組として、関連付けて記憶する、ことを特徴とする請求項32に記載の時系列データ処理方法。
  34.  前記時系列データの特異値を検出する特異値検出工程を含む、ことを特徴とする請求項20乃至33のいずれか1項に記載の時系列データ処理方法。
  35.  前記時系列予測工程と、前記特異値判別工程を含み、前記時系列データの特異値を検出する特異値検出工程を含む、ことを特徴とする請求項24に記載の時系列データ処理方法。
  36.  補正された前記第1の時間幅の時系列データと前記第2の時間幅の時系列データを、新たな第1の時間幅の時系列データとし、
     次に入力される新たな時系列データを新たな第2の時間幅の時系列データとし、
     前記新たな第2の時間幅の時系列データに関する予測、特異値モデルに応じた、前記新たな第1の時間幅の時系列データ、又は、前記新たな第1の時間幅の時系列データと前記新たな第2の時間幅の時系列データの補正を行う、ことを特徴とする請求項24乃至35のいずれか1項に記載の時系列データ処理方法。
  37.  前記特異値判別工程が、前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
     前記時系列の成分に嵩上げ又は嵩下げが起こった状態、
     前記時系列の成分の分散に変動が起こった状態、
     前記時系列の成分が上昇又は下降する変化が起こった状態
     のうちのいずれかを判別する、ことを特徴とする請求項24、26、28のいずれか1項に記載の時系列データ処理方法。
  38.  前記補正量算出工程は、前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
     前記時系列の成分に嵩上げ又は嵩下げが起こった状態の補正量、
     前記時系列の成分の分散に変動が起こった状態の補正量、
     前記時系列の成分が上昇又は下降する変化が起こった状態の補正量、
     のうちのいずれかを算出する、ことを特徴とする請求項25、26、29のいずれか1項に記載の時系列データ処理方法。
  39.  特異値を含まない第1の時間幅の時系列データに対して時間的に後方に位置し、第2の時間幅の時系列データの特異値モデルに対応して、前記第1の時間幅の時系列データに補正を施す特異値補正処理を、コンピュータに実行させるプログラム。
  40.  前記特異値補正処理は、前記第2の時間幅の時系列データの前記特異値モデルに対応して前記第2の時間幅の時系列データを欠損値とし、特異値の影響を除く補正を行う、請求項39に記載のプログラム。
  41.  補正済みの前記第1の時間幅の時系列データ、又は、補正済みの前記第1及び第2の時間幅の時系列データを、予測期間の時系列予測を行う処理を、前記コンピュータに実行させる請求項39又は40に記載のプログラム。
  42.  前記予測期間における時系列予測を行う時系列予測処理が、
     補正済みの前記第1時間幅の時系列データ、又は、補正済みの前記第1及び第2の時間幅の時系列データを用いて、前記予測期間における時系列予測を行うほか、
     さらに、
     前記第2の時間幅に関する予測データを、前記第1の時間幅の時系列データから予測する、請求項41に記載のプログラム。
  43.  前記時系列予測処理で予測された特異値を含む前記第2の時間幅に関する予測データと、前記第2の時間幅の時系列データとに基づき、前第2の時間幅の時系列データの特異値モデルを判別する特異値判別処理を、前記コンピュータに実行させる請求項42に記載のプログラム。
  44.  前記時系列予測処理で予測された第2の時間幅の予測データと、前記第2の時間幅の時系列データとに基づき、予め設定された特異値モデルにしたがって補正量を算出する補正量算出処理を、前記コンピュータに実行させる請求項42に記載のプログラム。
  45.  前記時系列予測処理で予測された前記第2の時間幅に関する予測データと、前記第2の時間幅の時系列データとに基づき、
     予め用意された複数の特異値モデルの中から、前記第2の時間幅の時系列データに最も良く当てはまる特異値モデルを決定する特異値判別処理と、
     決定された前記特異値モデルに対応する補正量を算出する補正量算出処理と、
     を前記コンピュータに実行させる請求項42に記載のプログラム。
  46.  前記特異値補正処理は、前記特異値モデルの判別結果に基づき、前記第2の時間幅の時系列データの補正として、前記第2の時間幅の時系列データを欠損値として扱い、前記第1の時間幅の時系列データを補正した時系列データを出力する、ことを特徴とする請求項40乃至45のいずれか1項に記載のプログラム。
  47.  前記第1の時間幅の時系列データから前記第2の時間幅の時系列データを予測する時系列予測処理と、
     前記時系列予測処理で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、前記第2の時間幅の時系列データの特異値モデルを判別する前記特異値判別処理と、
     を含み、
     前記特異値補正処理は、
     前記特異値判別処理で判別された前記特異値モデルに対応して、前記第1及び第2の時間幅の時系列データの補正を行い、
     前記時系列予測処理では、
     前記第1及び第2の時間幅の時系列データについて、前記特異値モデルに対応した補正が施された時系列データを用いて、
     前記第2の時間幅の時系列データよりも時間的に後方の予測期間の値の予測を行う、請求項40又は41に記載のプログラム。
  48.  前記特異値補正処理において、
     前記特異値モデルの判別結果に基づき、前記第2の時間幅の時系列データを欠損値として扱う場合、補正された前記第1の時間幅の時系列データを、もとの前記第1及び第2の時間幅の時系列データに置き換えて出力する処理を、前記コンピュータに実行させる請求項47に記載のプログラム。
  49.  前記第1の時間幅の時系列データから前記第2の時間幅の時系列データを予測する時系列予測処理と、
     前記時系列予測処理で予測された前記第2の時間幅の前記予測データと、前記第2の時間幅の時系列データとを基に、予め設定された特異値モデルにしたがって、前記第1の時間幅の時系列データに対する補正量を算出する補正量算出処理と、
     を含み、
     前記特異値補正処理では、
     前記補正量算出処理で算出された補正量に従って、前記第1の時間幅の時系列データの補正を行い、
     前記時系列予測処理では、
     前記第1及び第2の時間幅の時系列データについて、補正が施された時系列データを用いて、前記第2の時間幅の時系列データよりも時間的に後方の予測期間の値の予測を行う、請求項40又は41に記載のプログラム。
  50.  前記特異値補正処理として、
     前記補正量算出処理で算出された補正量に基づき、前記第2の時間幅の時系列データを欠損値として扱う場合、補正された前記第1の時間幅の時系列データを、もとの前記第1及び第2の時間幅の時系列データに置き換えて出力する処理を、前記コンピュータに実行させる請求項49に記載のプログラム。
  51.  前記時系列予測処理の予測結果と前記補正済み時系列データとを関連付け履歴として補正情報記憶部に記憶する処理を、前記コンピュータに実行させる請求項42乃至45、47乃至50のいずれか1項に記載のプログラム。
  52.  前記補正情報記憶部に、時間情報、特異値判定結果、補正量、予測誤差を、組として、関連付けて記憶する処理を、前記コンピュータに実行させる請求項51に記載のプログラム。
  53.  前記時系列データの特異値を検出する特異値検出処理を、前記コンピュータに実行させる請求項40乃至52のいずれか1項に記載のプログラム。
  54.  前記時系列予測処理と、前記特異値判別処理を含み、前記時系列データの特異値を検出する特異値検出処理を、前記コンピュータに実行させる請求項44に記載のプログラム。
  55.  補正された前記第1の時間幅の時系列データと前記第2の時間幅の時系列データを、新たな第1の時間幅の時系列データとし、
     次に入力される新たな時系列データを新たな第2の時間幅の時系列データとし、
     前記新たな第2の時間幅の時系列データに関する予測、特異値モデルに応じた、前記新たな第1の時間幅の時系列データ、又は、前記新たな第1の時間幅の時系列データと前記新たな第2の時間幅の時系列データの補正を行う処理を、前記コンピュータに実行させる請求項43乃至54のいずれか1項に記載のプログラム。
  56.  前記特異値判別処理が、前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
     前記時系列の成分に嵩上げ又は嵩下げが起こった状態、
     前記時系列の成分の分散に変動が起こった状態、
     前記時系列の成分が上昇又は下降する変化が起こった状態
     のうちのいずれかを判別する処理を、前記コンピュータに実行させる請求項43、45、47のいずれか1項に記載のプログラム。
  57.  前記補正量算出処理は、前記時系列データのトレンド成分、周期成分、自己回帰成分のうちの少なくとも一つを含む時系列の成分に関して、
     前記時系列の成分に嵩上げ又は嵩下げが起こった状態の補正量、
     前記時系列の成分の分散に変動が起こった状態の補正量、
     前記時系列の成分が上昇又は下降する変化が起こった状態の補正量、
     のうちのいずれかを算出する処理を、前記コンピュータに実行させる請求項44、45、49のいずれか1項に記載のプログラム。
  58.  第1の時間幅の時系列データに基づき、前記第1の時間幅の時系列データよりも時間的に後方に位置する第2の時間幅の時系列データに関する予測データを生成する時系列予測手段と、
     前記時系列予測手段で予測された前記第2の時間幅の予測データと、前記第2の時間幅の時系列データとに基づき、前記第2の時間幅の時系列データの特異値モデルを判別する特異値判別手段と、
     前記特異値判別手段で前記第2の時間幅の時系列データの特異値モデルが判別された場合、前記特異値モデルに対応して前記第1の時間幅の時系列データに補正を施し、その際、前記第2の時間幅の時系列データが特異値モデルに該当しない所定の異常値の場合には、前記第2の時間幅の時系列データを欠損値として扱う特異値補正手段と、
     を含み、
     前記特異値補正手段で補正された前記第1の時間幅の時系列データと前記第2の時間幅の時系列データをともに含む時系列データを、新たな第1の時間幅の時系列データとし、前記新たな第1の時間幅の時系列データには特異値は含まれず、
     次に入力される新たな時系列データが第2の時間幅の時系列データとして、前記新たな第1の時間幅の時系列データとともに、前記時系列予測手段に供せられる、ことを特徴とする時系列データ処理装置。
  59.  第1の時間幅の時系列データに基づき、前記第1の時間幅の時系列データよりも時間的に後方に位置する第2の時間幅の時系列データに関する予測データを生成する時系列予測工程と、
     前記時系列予測工程で予測された前記第2の時間幅の予測データと、前記第2の時間幅の時系列データとに基づき、前記第2の時間幅の時系列データの特異値モデルを判別する特異値判別工程と、
     前記特異値判別工程で前記第2の時間幅の時系列データの特異値モデルが判別された場合、前記特異値モデルに対応して前記第1の時間幅の時系列データに補正を施し、その際、前記第2の時間幅の時系列データが特異値モデルに該当しない所定の異常値の場合には、前記第2の時間幅の時系列データを欠損値として扱う特異値補正工程と、
     を含み、
     前記特異値補正工程で補正された前記第1の時間幅の時系列データと前記第2の時間幅の時系列データをともに含む時系列データを、新たな第1の時間幅の時系列データとし、前記新たな第1の時間幅の時系列データには特異値は含まれず、
     次に入力される新たな時系列データが第2の時間幅の時系列データとして、前記新たな第1の時間幅の時系列データとともに、前記時系列予測工程に供せられる、ことを特徴とする時系列データ処理方法。
PCT/JP2009/062139 2008-07-03 2009-07-02 時系列データ処理装置およびその方法とプログラム WO2010001966A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008174193 2008-07-03
JP2008-174193 2008-07-03

Publications (1)

Publication Number Publication Date
WO2010001966A1 true WO2010001966A1 (ja) 2010-01-07

Family

ID=41466057

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/062139 WO2010001966A1 (ja) 2008-07-03 2009-07-02 時系列データ処理装置およびその方法とプログラム

Country Status (1)

Country Link
WO (1) WO2010001966A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107491830A (zh) * 2017-07-03 2017-12-19 北京奇艺世纪科技有限公司 一种时间序列曲线的处理方法和装置
CN113961548A (zh) * 2021-09-22 2022-01-21 航天宏康智能科技(北京)有限公司 用水量时序数据的异常值处理方法和异常值处理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101947A (ja) * 1995-10-06 1997-04-15 Hitachi Ltd 時系列予測方法
JP2003346070A (ja) * 2002-05-27 2003-12-05 Matsushita Electric Works Ltd 需要量予測方法及び需要量予測システム
JP2006092106A (ja) * 2004-09-22 2006-04-06 Canon System Solutions Inc 予測装置及び予測方法並びにプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09101947A (ja) * 1995-10-06 1997-04-15 Hitachi Ltd 時系列予測方法
JP2003346070A (ja) * 2002-05-27 2003-12-05 Matsushita Electric Works Ltd 需要量予測方法及び需要量予測システム
JP2006092106A (ja) * 2004-09-22 2006-04-06 Canon System Solutions Inc 予測装置及び予測方法並びにプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GENSHIRO KITAKAWA: "Jikeiretsu Model ni yoru Tairyo Data kara no Joho Chushutsu Chika Suii Data no Kaiseki", JOURNAL OF JAPANESE SOCIETY FOR ARTIFICIAL INTELLIGENCE, vol. 15, no. 4, 1 July 2000 (2000-07-01), pages 673 - 680 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107491830A (zh) * 2017-07-03 2017-12-19 北京奇艺世纪科技有限公司 一种时间序列曲线的处理方法和装置
CN107491830B (zh) * 2017-07-03 2021-03-26 北京奇艺世纪科技有限公司 一种时间序列曲线的处理方法和装置
CN113961548A (zh) * 2021-09-22 2022-01-21 航天宏康智能科技(北京)有限公司 用水量时序数据的异常值处理方法和异常值处理装置

Similar Documents

Publication Publication Date Title
US10698372B2 (en) Computer system and method for building and deploying predictive inferential models online to predict behavior of industrial processes
US11533238B2 (en) Capacity management of computing resources based on time series analysis
Susto et al. A hidden-Gamma model-based filtering and prediction approach for monotonic health factors in manufacturing
JP6531079B2 (ja) スマートアラートのためのシステム及び方法
WO2016161263A1 (en) Predictive analytic reliability tool set for detecting equipment failures
US11775502B2 (en) Facilitating efficient and effective anomaly detection via minimal human interaction
JP2008165352A (ja) 定期点検データ分析装置およびその方法
US20130346441A1 (en) Stream data processing server and a non-transitory computer-readable storage medium storing a stream data processing program
CN106056239B (zh) 一种产品库存预测方法及装置
WO2010001966A1 (ja) 時系列データ処理装置およびその方法とプログラム
JP6502062B2 (ja) 通信品質予測装置及び通信品質予測プログラム
JP5219783B2 (ja) 不正アクセス検知装置及び不正アクセス検知プログラム及び記録媒体及び不正アクセス検知方法
KR20170008632A (ko) 설비 부품 사용량 예측 방법
JP2007164346A (ja) 決定木変更方法、異常性判定方法およびプログラム
CN112418534B (zh) 揽件量预测方法及装置、电子设备、计算机可读存储介质
JP5636922B2 (ja) 性能予測装置、性能予測方法およびプログラム
CN113329128B (zh) 话务数据预测方法及装置、电子设备、存储介质
JP2005063208A (ja) ソフトウェア信頼度成長モデル選択方法、ソフトウェア信頼度成長モデル選択装置、ソフトウェア信頼度成長モデル選択プログラム、およびプログラム記録媒体
US20130041626A1 (en) Hybrid Analysis of Emerging Trends for Process Control
EP3934175B1 (en) Anomaly detection method and anomaly detection program
US11829226B2 (en) Anomaly detection apparatus, anomaly detection method, and anomaly detection program
US20230409421A1 (en) Anomaly detection in computer systems
US11754985B2 (en) Information processing apparatus, information processing method and computer program product
US20230418701A1 (en) Apparatus, method, and non-transitory computer-readable medium for anomaly detection
GB2606163A (en) System and method for analysing data

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09773544

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 09773544

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP