JP2012247998A - Time series data prediction apparatus, prediction method, prediction program and memory medium - Google Patents

Time series data prediction apparatus, prediction method, prediction program and memory medium Download PDF

Info

Publication number
JP2012247998A
JP2012247998A JP2011119194A JP2011119194A JP2012247998A JP 2012247998 A JP2012247998 A JP 2012247998A JP 2011119194 A JP2011119194 A JP 2011119194A JP 2011119194 A JP2011119194 A JP 2011119194A JP 2012247998 A JP2012247998 A JP 2012247998A
Authority
JP
Japan
Prior art keywords
data
time
series data
prediction
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011119194A
Other languages
Japanese (ja)
Other versions
JP5777404B2 (en
Inventor
Yoshiki Murakami
好樹 村上
Takenori Kobayashi
武則 小林
Yoshiro Hasegawa
義朗 長谷川
Hideo Kusano
日出男 草野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2011119194A priority Critical patent/JP5777404B2/en
Publication of JP2012247998A publication Critical patent/JP2012247998A/en
Application granted granted Critical
Publication of JP5777404B2 publication Critical patent/JP5777404B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S50/00Market activities related to the operation of systems integrating technologies related to power network operation or related to communication or information technologies
    • Y04S50/10Energy trading, including energy flowing from end-user application to grid

Abstract

PROBLEM TO BE SOLVED: To provide a time series data prediction apparatus capable of appropriately selecting previous result data and capable of appropriately predicting even when the time to give a maximum value or minimum value of previous result data is not matched.SOLUTION: The time series data prediction apparatus comprises: a data selecting section 120 that selects data of a date similar to a prediction target date from previous time series data; a probability density distribution creating section 150 that calculates the probability density distribution which varies at each point of time from the data selected by the data selecting section; a random number generating section 160 that generates a set of plural random numbers in accordance with the probability density distribution which varies at each point of time calculated by the probability density distribution creating section; a correlation coefficient calculating section 180 that calculates a correlation among the times in the previous time series data; a random number converting section 210 that converts the set of random numbers generated by the random number generating section based on the correlation calculated by the correlation coefficient calculating section into a set of random numbers having a correlation with each other; and a prediction result creating section 230 that creates a prediction result by predicting time series data value based on the set of random numbers obtained by converting made by the random number converting section.

Description

本発明の実施形態は、時系列データの将来の値を予測する時系列データの予測装置、予測方法、予測プログラムおよび記憶媒体に関する。   Embodiments described herein relate generally to a time-series data prediction apparatus, a prediction method, a prediction program, and a storage medium that predict future values of time-series data.

株価、気温、電力需要または太陽光発電の発電量など、時間によって変化する量を時間経過に従って並べたデータを時系列データと呼ぶ。時系列データの将来の値を予測することは、株の取引で利益を上げたり、気温によって売り上げが変わる商品の販売計画を立てたり、発電機の運転計画を作成したり、または、電力の販売計画を作成するために重要である。このため、時系列データを予測する種々の手法が提案されている。   Data obtained by arranging amounts that change with time, such as stock price, temperature, power demand, or power generation amount of photovoltaic power generation, as time elapses is called time-series data. Predicting future values of time series data can be profitable from stock trading, planning sales of products whose sales change depending on temperature, creating generator operation plans, or selling power It is important to create a plan. For this reason, various methods for predicting time-series data have been proposed.

特開2007−47996号公報JP 2007-47996 A 特開平5−18995号公報Japanese Patent Laid-Open No. 5-18995 特開2010−20442号公報JP 2010-20442 A

時系列データを予測する手法として、特許文献1は、気象情報に基づき将来の一定期間の電力需要を予測する技術を開示する。特許文献2は、気温および湿度データと過去の需要データから将来の電力総需要を予測する技術を開示する。特許文献3は、確率的に需要シナリオを多数発生することにより誤差を含めて需要予測する技術を開示する。   As a method for predicting time-series data, Patent Document 1 discloses a technique for predicting power demand in a certain period in the future based on weather information. Patent Document 2 discloses a technique for predicting future total power demand from temperature and humidity data and past demand data. Patent Document 3 discloses a technique for predicting demand including errors by generating a large number of demand scenarios stochastically.

図9は、特許文献3に開示された技術を用いて作成された需要シナリオの例を示す。図9(a)は、過去の需要実績を示す過去の実績データの例である。図9(b)は、過去の実績データに基づき作成された需要予測結果(需要シナリオ)を示す。図9の例では、1時から24時までの24点の需要データを時系列データとし、7組の過去の時系列データに基づき将来起こりうる需要データを時系列データの組として、100通りの需要シナリオを予測する。各需要シナリオは同じ確率で実現し、需要シナリオを用いて総需要の計算や発電計画の作成が行われる。その結果、総需要の期待値や発電コストの期待値などを計算できる。この場合、各時刻における需要データが正規分布に従うと仮定して、各時刻の需要の平均および分散を計算するとともに、時刻間の相関を計算し、これら平均、分散および相関に従う乱数を発生させることにより将来の需要データである多数の時系列データを発生させる。将来の時系列データの数は必要に応じて何組でも作成できるが、特許文献3では100組の時系列データを作成して表示する。この例では、図9(b)に示す需要予測結果は、過去の実績データの特徴をよく反映している。   FIG. 9 shows an example of a demand scenario created using the technique disclosed in Patent Document 3. FIG. 9A is an example of past performance data indicating past demand results. FIG. 9B shows a demand forecast result (demand scenario) created based on past performance data. In the example of FIG. 9, the demand data of 24 points from 1 o'clock to 24 o'clock are time series data, and demand data that can occur in the future based on the seven sets of past time series data is set as time series data, and 100 types of data Predict demand scenarios. Each demand scenario is realized with the same probability, and total demand is calculated and a power generation plan is created using the demand scenario. As a result, the expected value of total demand, the expected value of power generation cost, etc. can be calculated. In this case, assuming that the demand data at each time follows a normal distribution, calculate the average and variance of the demand at each time, calculate the correlation between the times, and generate random numbers according to these average, variance and correlation To generate a large number of time series data as future demand data. The number of future time series data can be created as many as necessary, but in Patent Document 3, 100 sets of time series data are created and displayed. In this example, the demand prediction result shown in FIG. 9B well reflects the characteristics of past performance data.

図10は、特許文献3に開示された技術を用いて作成された需要シナリオの他の例を示す。図10(a)は、過去の実績データの例である。図10に示す例は、図9に示した例とは異なり、過去の実績データが特徴の異なる2種類のデータ群から構成される。図10(b)は、図10(a)に示した過去の実績データに基づき作成された需要予測結果(需要シナリオ)を示す図である。図10(b)に示された予測結果を見ると、各時刻の需要データが正規分布していると仮定しているため、全体として過去の実績と大きく異なった予測結果になっている。   FIG. 10 shows another example of a demand scenario created using the technique disclosed in Patent Document 3. FIG. 10A is an example of past performance data. In the example shown in FIG. 10, unlike the example shown in FIG. 9, the past performance data is composed of two types of data groups having different characteristics. FIG. 10B is a diagram showing a demand prediction result (demand scenario) created based on the past performance data shown in FIG. Looking at the prediction results shown in FIG. 10B, since it is assumed that the demand data at each time is normally distributed, the prediction results largely differ from the past results as a whole.

図10(a)に示す例では、過去の実績データは傾向が異なる2組の時系列データからなり、時系列データが最大となる時刻が異なっている。結果として、各時刻における過去の実績データの分布は、正規分布とは大きく異なる二山を有している。一方、図10(b)に示す例では、各時刻の需要予測結果は、中心にピークを持つ一山の分布をしている。これは、各時刻の需要データの分布が正規分布をしていると仮定したためである。   In the example shown in FIG. 10A, past performance data is composed of two sets of time-series data having different tendencies, and the time at which the time-series data is maximum is different. As a result, the distribution of past performance data at each time has two peaks that are significantly different from the normal distribution. On the other hand, in the example shown in FIG. 10B, the demand prediction result at each time has a mountain distribution with a peak at the center. This is because it is assumed that the distribution of demand data at each time is a normal distribution.

各時刻の分布が正規分布でなくても、最初の近似として正規分布を仮定することは通常行われているが、この場合の予測結果において重要なことは、24時間のまとまりとしてみた時系列データが、過去の実績を正しく再現できているかどうかである。過去の実績が2つのグループからなっている場合には、予測結果も2つのグループからなっていることが望ましい。   Even if the distribution at each time is not a normal distribution, a normal distribution is usually assumed as the first approximation. However, what is important in the prediction result in this case is time series data viewed as a unit of 24 hours. However, it is whether the past results can be correctly reproduced. When the past performance is composed of two groups, it is desirable that the prediction result is also composed of two groups.

予測された需要シナリオにおいて最も実現確率が高いのは各時刻の平均値を結んだような時系列データであり、これは過去の実績データの実現頻度に比べてみても明らかに不自然である。したがって、従来技術では、過去の実績データの特徴が正確に再現されていないという問題がある。これは、そもそも過去の実績データの選択方法がよくないという考え方もできる。即ち、時系列データの最大値や最小値を与える時刻が一致していないことが問題とも言える。しかし、これらの時刻を厳密に一致させることは困難であるため、最大値や最小値を与える時刻が異なる場合でも予測を行うことができる必要がある。   In the predicted demand scenario, the highest realization probability is time-series data that connects the average values at each time, which is clearly unnatural even when compared with the realization frequency of past performance data. Therefore, in the prior art, there is a problem that the characteristics of past performance data are not accurately reproduced. In the first place, it is possible to think that the past performance data selection method is not good. That is, it can be said that the time at which the maximum value and the minimum value of the time series data do not match is a problem. However, since it is difficult to make these times exactly the same, it is necessary to be able to perform prediction even when the time for giving the maximum value and the minimum value is different.

このように、従来技術では、各時刻における過去の実績データの分布が正確に再現できていないため、精度のよい予測モデルを作成することが困難であるという問題がある。また、過去の実績データの選択方法に関しても定められていないという問題がある。   Thus, in the prior art, since the distribution of past performance data at each time cannot be accurately reproduced, there is a problem that it is difficult to create an accurate prediction model. There is also a problem that the method for selecting past performance data is not defined.

本発明が解決しようとする課題は、過去の実績データの最大値や最小値を与える時刻が不一致でも適切な予測が可能で、過去の実績データの選択を適切に行うことができる時系列データの予測装置を提供する。   The problem to be solved by the present invention is that time series data that can be appropriately predicted even when the time at which the maximum value or minimum value of the past result data is given does not match can be selected appropriately. A prediction device is provided.

実施形態に係る時系列データの予測装置によれば、過去の時系列データから予測対象日と類似した日のデータを選択するデータ選択部と、データ選択部で選択されたデータから時刻毎に異なる確率密度分布を計算する確率密度分布作成部と、確率密度分布作成部からの時刻毎に異なる確率密度分布に従った複数の乱数の組を発生させる乱数発生部と、過去の時系列データにおける時刻間の相関を計算する相関係数計算部と、相関係数計算部で計算された相関に基づいて乱数発生部で発生された乱数の組を互いに相関を有する乱数の組に変換する乱数変換部と、乱数変換部における変換により得られた乱数の組に基づいて時系列データの値を予測して予測結果を作成する予測結果作成部を備えることを特徴とする。   According to the time-series data prediction device according to the embodiment, the data selection unit that selects data similar to the prediction target date from the past time-series data, and the time selected from the data selected by the data selection unit differs from time to time. Probability density distribution creation unit that calculates probability density distribution, random number generation unit that generates a set of multiple random numbers according to different probability density distributions for each time from probability density distribution creation unit, and time in past time series data A correlation coefficient calculation unit for calculating a correlation between the random numbers, and a random number conversion unit for converting a set of random numbers generated by the random number generation unit based on the correlation calculated by the correlation coefficient calculation unit into a set of random numbers having a correlation with each other And a prediction result creation unit that predicts a value of time-series data based on a random number set obtained by conversion in the random number conversion unit and creates a prediction result.

第1の実施形態に係る時系列データの予測装置で得られた時系列データの予測結果の例を示す図である。It is a figure which shows the example of the prediction result of the time series data obtained with the prediction apparatus of the time series data which concerns on 1st Embodiment. 第1の実施形態に係る時系列データの予測装置で使用される過去の需要の分布の例を示す図である。It is a figure which shows the example of distribution of the past demand used with the prediction apparatus of the time series data which concerns on 1st Embodiment. 第1の実施形態に係る時系列データの予測装置で使用される頻度分布関数の例を示す図である。It is a figure which shows the example of the frequency distribution function used with the prediction apparatus of the time series data which concerns on 1st Embodiment. 第1の実施形態に係る時系列データの予測装置の構成を示す図である。It is a figure which shows the structure of the prediction apparatus of the time series data which concerns on 1st Embodiment. 第2の実施形態に係る時系列データの予測装置の構成を示す図である。It is a figure which shows the structure of the prediction apparatus of the time series data which concerns on 2nd Embodiment. 第2の実施形態に係る時系列データの予測装置で使用される、予測された値と類似する過去の実績データの選択方法を説明するための図である。It is a figure for demonstrating the selection method of the past performance data similar to the predicted value used with the prediction apparatus of the time series data which concerns on 2nd Embodiment. 第3の実施形態に係る時系列データの予測装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the prediction apparatus of the time series data which concerns on 3rd Embodiment. 第4の実施形態に係る時系列データの予測装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the prediction apparatus of the time series data concerning 4th Embodiment. 従来の技術を用いて作成された需要シナリオの例を示す図である。It is a figure which shows the example of the demand scenario created using the prior art. 従来技術を用いて作成された需要シナリオの他の例を示す図である。It is a figure which shows the other example of the demand scenario created using the prior art.

以下、本発明の実施例について、図面を参照しながら詳細に説明する。
[第1の実施形態]
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[First Embodiment]

この時系列データの予測装置は、将来の一定期間の電力需要量などのような時間的に連なった一連のデータのまとまりを複数のシナリオとして予測し、その期間の発電機や関連する装置の運転パターンを複数のシナリオとして再現し、その期間の総需要や売り上げ、発電機や関連する装置の運転計画を、不確実性を考慮して予測するものである。   This time-series data prediction device predicts a series of time-series data such as power demand for a certain period in the future as multiple scenarios, and operates generators and related devices during that period. The pattern is reproduced as a plurality of scenarios, and the total demand and sales during that period, and the operation plan of the generator and related devices are predicted in consideration of uncertainties.

図1は、第1の実施形態に係る時系列データの予測装置で得られた時系列データの予測結果の例を示す図である。ここで、図1(a)は、予測の元になった過去の実績データを示しており、図10(a)に示した従来の過去の実績データと同じものである。図1(b)は、第1の実施形態に係る時系列データの予測装置で予測を実施した結果を示す図である。図1(b)は、図10(b)と異なり、需要シナリオが2つのグループに分かれており、過去の実績データの特徴をよく反映していることが分かる。   FIG. 1 is a diagram illustrating an example of a prediction result of time-series data obtained by the time-series data prediction apparatus according to the first embodiment. Here, FIG. 1A shows the past performance data that is the basis of the prediction, and is the same as the past past performance data shown in FIG. FIG. 1B is a diagram illustrating a result of prediction performed by the time-series data prediction apparatus according to the first embodiment. FIG. 1B differs from FIG. 10B in that the demand scenarios are divided into two groups, and reflect the characteristics of past performance data well.

次に、第1の実施形態に係る時系列データの予測装置で使用されるアルゴリズムを具体的に説明する。ここでは、予測を行う周期を1日とし、予測を行う時間間隔を1時間として、24個のデータの時系列を予測する場合を例にとって説明する。1日分で24個の過去の実績データを日数分集めて、時刻毎にK個(Kは2以上の整数)の過去の実績データからi番目(i=1、2、…、24)の時刻のK個の需要データが得られる。ここで、まず、K個の需要データの確率密度分布を求める。   Next, an algorithm used in the time-series data prediction apparatus according to the first embodiment will be specifically described. Here, a case where a time series of prediction is assumed to be one day and a time interval of prediction is assumed to be one hour and a time series of 24 data is predicted will be described as an example. 24 past performance data for one day are collected for the number of days, and the i-th (i = 1, 2,..., 24) from the past performance data of K pieces (K is an integer of 2 or more) at each time. K pieces of demand data of time are obtained. Here, first, a probability density distribution of K pieces of demand data is obtained.

各時刻における需要データの分布は、平均と分散によって特徴づけられる。平均や分散は分布の形状にはよらないパラメータである。時刻毎にK個の過去の実績データを集めてきてi番目の時刻のK個の平均μiと分散viを計算する。これを時刻毎に行い、24個の平均データμiと分散データviが得られる。分散を計算するためにはKは2以上である必要がある。 The distribution of demand data at each time is characterized by an average and variance. Mean and variance are parameters that do not depend on the shape of the distribution. K pieces of past performance data are collected for each time, and K average μ i and variance v i at the i-th time are calculated. This is performed for each time, and 24 average data μ i and distributed data v i are obtained. In order to calculate the variance, K needs to be 2 or more.

一方、時刻毎の需要データの分布は平均や分散だけでは表現できない。時刻毎に分布形状を計算する必要がある。図2(a)はi=12、つまり12時における過去の需要の分布の例を示しており、図2(b)は、i=20、つまり20時における過去の需要の分布の例を示している。この例では、時刻によって分布の形状が大きく異なることが分かる。すなわち、12時の需要は比較的に正規分布に近い形状を有するが、20時の需要分布は正規分布と大きく異なり、2つの山を有するように見える。この場合、分布の形が正規分布と異なっていることが問題ではなく、時刻によって分布の形状が異なっていることが問題である。例えば、20時の分布の形状をすべての時刻に用いると、すべての時刻で二山を有する分布形状となってしまい、元のデータの分布を再現することはできない。   On the other hand, the distribution of demand data for each time cannot be expressed only by average or variance. It is necessary to calculate the distribution shape at each time. 2A shows an example of the distribution of past demand at i = 12, that is, 12:00, and FIG. 2B shows an example of the distribution of past demand at i = 20, that is, 20:00. ing. In this example, it can be seen that the shape of the distribution varies greatly with time. That is, the demand at 12 o'clock has a shape that is relatively close to the normal distribution, but the demand distribution at 20:00 differs greatly from the normal distribution and appears to have two peaks. In this case, it is not a problem that the shape of the distribution is different from the normal distribution, but a problem that the shape of the distribution is different depending on the time. For example, if the distribution shape at 20:00 is used at all times, the distribution shape has two peaks at all times, and the original data distribution cannot be reproduced.

すなわち、確率密度分布の形状を正規分布以外の一定の形状と仮定することではなく、時刻毎に需要データが従う確率密度分布を定めることが必要である。このためには、時刻毎に過去の需要データの発生頻度に比例した確率密度分布を持つ乱数を発生させればよい。発生頻度の合計は過去の実績データの数であるが、確率密度分布は積分が1になるように規格化された関数である。このような乱数を発生させる方法としては、頻度分布から計算された累積分布関数の逆関数を用いることができる。   That is, it is necessary not to assume the shape of the probability density distribution as a fixed shape other than the normal distribution, but to determine the probability density distribution that the demand data follows at each time. For this purpose, random numbers having a probability density distribution proportional to the occurrence frequency of past demand data may be generated at each time. The total occurrence frequency is the number of past performance data, but the probability density distribution is a function standardized so that the integral becomes 1. As a method for generating such random numbers, an inverse function of the cumulative distribution function calculated from the frequency distribution can be used.

ただし、この関数は縦軸(頻度の累積数)に関して必ず値を持つ必要があるので、連続関数になるように工夫する必要がある。以下では、時刻毎に確率密度分布を定める方法を具体的に示す。   However, since this function must always have a value with respect to the vertical axis (cumulative number of frequencies), it must be devised to be a continuous function. Hereinafter, a method for determining the probability density distribution for each time will be specifically described.

選択された過去の需要データにおいて、時刻iの需要xがXkからXk+1の間にある頻度をFkとすると、需要xの発生頻度の分布を表す頻度分布関数Fは、下記(1)式で表すことができる。 In the selected past demand data, assuming that the frequency at which the demand x at time i is between X k and X k + 1 is F k , the frequency distribution function F representing the distribution of the occurrence frequency of the demand x is 1) It can be expressed by the formula.

F=Fk (Xk≦x≦Xk+1)…(1)
この頻度分布関数Fは、xの確率密度関数の形状を近似した分布になっている。図3(a)は、xの頻度分布関数Fの例を示す。
F = F k (X k ≦ x ≦ X k + 1 ) (1)
This frequency distribution function F has a distribution approximating the shape of the probability density function of x. FIG. 3A shows an example of the frequency distribution function F of x.

一方、需要xの累積分布関数yを、連続関数として定義するために、Y0=0および
On the other hand, in order to define the cumulative distribution function y of demand x as a continuous function, Y 0 = 0 and

として、
As

(3)式から、
From equation (3)

となるので、0〜YL-1の間の値を取る一様乱数yを発生させて、(4)式に代入することにより、頻度分布関数Fに従ったX1〜XLの間の乱数を発生させることができる。このようにして発生された乱数は、時刻iにおける過去の需要データと近似的に同じ平均値、同じ分散、および、同様の分布形状を有しており、過去の需要データの発生確率を近似的に再現したものとなる。なお、過去の実績データの数を増やし、頻度分布を計測する区分を増やすことにより、確率分布の近似精度を向上させることも可能である。 Therefore, by generating a uniform random number y that takes a value between 0 and Y L-1 and substituting it into the equation (4), the interval between X 1 and X L according to the frequency distribution function F is obtained. A random number can be generated. The random numbers generated in this way have approximately the same average value, the same variance, and the same distribution shape as the past demand data at time i, and approximate the occurrence probability of the past demand data. It will be reproduced. In addition, it is also possible to improve the approximation accuracy of the probability distribution by increasing the number of past result data and increasing the number of sections for measuring the frequency distribution.

次に、時刻間の相関を考慮するために、各時刻間の共分散を計算する。これは時刻1のK個の需要データと時刻2のK個の需要データの共分散v1,2、時刻1のK個の需要データと時刻3のK個の需要データの共分散v1,3、...、時刻23のK個の需要データと時刻24のK個の需要データの共分散v23,24を計算することにより行われる。これにより、24個の時刻から重複を許さず2個の組を選ぶ組み合わせの数である276個の共分散が得られる。これらの共分散の値と、先に計算した各時刻の平均、分散および確率密度関数の分布形状によって過去の実績データの特徴が決定される。 Next, in order to consider the correlation between the times, the covariance between the times is calculated. This time 1 of the K demand data and time 2 of the K demand data covariance v 1, 2, covariance v 1 of the K demand data of K demand data and time 3 times 1, 3 ,. . . This is done by calculating the covariance v 23,24 of the K demand data at time 23 and the K demand data at time 24. As a result, 276 covariances, which are the number of combinations for selecting two sets without allowing duplication from 24 times, are obtained. The characteristics of past performance data are determined by these covariance values and the distribution shape of the mean, variance, and probability density function calculated at each time.

次に、需要シナリオの作成について説明する。各時刻の需要を1時間毎に分解して時刻iの発電量をdiで表し、d1からd24まで並べたベクトルである時系列データを考える。一方、複数の日から時刻毎の発電データを集めたデータ{di}が得られる。ここで、時刻間の発電量の関係を考慮するために、分散共分散行列作成機能により、(5)式に示す24×24の成分を持つ分散共分散行列Σを作成する。ここで、var(di)は{di}の分散を、cov(di,dj)は、{di}と{dj}の共分散である。分散や共分散を計算するためには、需要量を示す需要データを取得する日は最低でも2日必要である。なお、需要データを取得する日数は2日でもかまわないが、日数が多いほど予測精度は高くなる。
Next, creation of a demand scenario will be described. Consider time-series data that is a vector in which the demand at each time is decomposed every hour and the power generation amount at time i is represented by d i and arranged from d 1 to d 24 . On the other hand, data {d i } obtained by collecting power generation data for each time from a plurality of days is obtained. Here, in order to consider the relationship between the power generation amounts between times, a variance-covariance matrix Σ having 24 × 24 components shown in Equation (5) is created by the variance-covariance matrix creation function. Here, var (d i ) is the variance of {d i }, and cov (d i , d j ) is the covariance of {d i } and {d j }. In order to calculate variance and covariance, at least two days are required to acquire demand data indicating demand. The number of days for acquiring the demand data may be two days, but the prediction accuracy increases as the number of days increases.

次に、特定の確率分布に従い、かつ、相互に与えられた相関を持つ乱数の組をL組だけ作成する方法を説明する。ここでは、互いに相関を持つ24個の乱数の組をL組生成する場合を例にとって説明する。   Next, a method of creating only L sets of random numbers that follow a specific probability distribution and have a correlation given to each other will be described. Here, a case will be described as an example where L sets of 24 random numbers that are correlated with each other are generated.

まず、先に説明したように時刻毎に過去のデータの分布を求め、その分布に従う乱数をL個発生する。これを、24時間の各時刻において繰り返す。これにより、L個の乱数が、24時間分作成される。この段階では各時刻の乱数の組は他の時刻の乱数の組と相関がなく互いに独立である。この結果、L行24列(L×24)の成分を持つ乱数行列が得られる。この段階で先に計算した平均と分散を用いて各乱数の標準偏差が1、平均が0になるように変数変換により正規化する(平均を引いてから標準偏差で割って規格化する)。このようにして、正規乱数行列Gが得られる。   First, as described above, the distribution of past data is obtained for each time, and L random numbers according to the distribution are generated. This is repeated at each time of 24 hours. Thereby, L random numbers are generated for 24 hours. At this stage, the set of random numbers at each time has no correlation with the set of random numbers at other times and is independent of each other. As a result, a random matrix having components of L rows and 24 columns (L × 24) is obtained. At this stage, normalization is performed by variable transformation so that the standard deviation of each random number is 1 and the average is 0 using the average and variance calculated earlier (subtract the average and then normalize by dividing by the standard deviation). In this way, a normal random number matrix G is obtained.

次に、24×24の相関係数行列Rをコレスキー分解し、(6)式のように上三角行列TUと下三角行列TLに分解する。相関係数行列は、分散共分散行列Σを規格化することにより得られる。 Next, the 24 × 24 correlation coefficient matrix R is subjected to Cholesky decomposition, and is decomposed into an upper triangular matrix T U and a lower triangular matrix T L as shown in Equation (6). The correlation coefficient matrix is obtained by normalizing the variance-covariance matrix Σ.

R=TUL…(6)
その後、正規乱数行列Gに上三角行列TUを右から掛けることにより、相関を持った正規乱数行列G’を作成できる。
R = T U T L (6)
Then, by multiplying the upper triangular matrix T U from right to normal random matrix G, you can create a regular random matrix G 'having a correlation.

G’=GTU…(7)
これに、各時刻の標準偏差を対角線上におき、他の成分が0である24行24列(24×24)の標準偏差行列Sを右から掛け、平均値ベクトルμをL行並べたL行24列(L×24)の平均値行列Aを加えることにより、最終的に求める平均と分散および相関を持った乱数行列G”が得られる。
G ′ = GT U (7)
The standard deviation matrix S of 24 rows by 24 columns (24 × 24) in which the standard deviation at each time is placed on a diagonal line and the other components are 0 is multiplied from the right, and the average vector μ is arranged in L rows. By adding the average value matrix A of 24 rows and 24 columns (L × 24), a random number matrix G ″ having a mean, variance, and correlation finally obtained is obtained.

G”=G’S+A…(8)
この行列G”が時系列データの予測結果そのものであり、G”のN個の各行ベクトル(1行24列)が、各シナリオに相当する。
G ″ = G ′S + A (8)
This matrix G ″ is the prediction result of the time series data itself, and N row vectors (1 row and 24 columns) of G ″ correspond to each scenario.

なお、時刻分割数が大きい場合や、需要量の相関が強い場合などは、数値計算上の問題として桁落ちによる誤差が大きくなり、相関係数行列Rのコレスキー分解が困難な場合がある。この場合には、必要に応じて固有値分解や特異値分解を用いることができる。また、1日を1時間毎に24に分割する代わりに任意の時間で分割することもできる。   In addition, when the number of time divisions is large or when the correlation of the demand amount is strong, an error due to the digit loss becomes large as a problem in numerical calculation, and the Cholesky decomposition of the correlation coefficient matrix R may be difficult. In this case, eigenvalue decomposition or singular value decomposition can be used as necessary. Moreover, instead of dividing the day into 24 every hour, it is also possible to divide it at an arbitrary time.

以上の方法でM個の乱数の組を発生させることによりM個の需要シナリオが得られる。なお、Mの値は任意であり、Kの値やNの値にはよらない。例えば、過去の実績データが2日分しかなくても、100万通りのシナリオを発生させることもできる。   M demand scenarios can be obtained by generating a set of M random numbers by the above method. Note that the value of M is arbitrary and does not depend on the value of K or the value of N. For example, even if there are only two days of past performance data, one million scenarios can be generated.

図4は、第1の実施形態に係る時系列データの予測装置の構成を示す図である。時系列データの予測装置は、いずれも図示は省略するが、入力装置、表示装置、記憶装置および中央処理装置などを備えたコンピュータで構成されている。時系列データの予測装置は、第1過去の実績データ記憶部110、データ選択部120、第2過去の実績データ記憶部130、平均・分散計算部140、確率密度分布作成部150、乱数発生部160、乱数組記憶部170、相関係数計算部180、相関係数行列記憶部190、乱数変換部210、乱数組記憶部220、予測結果作成部230、予測結果記憶部240、予測結果表示部310および表示装置320を備えている。   FIG. 4 is a diagram illustrating the configuration of the time-series data prediction apparatus according to the first embodiment. The time-series data prediction device is composed of a computer including an input device, a display device, a storage device, a central processing unit, and the like, although not shown. The time series data prediction apparatus includes a first past record data storage unit 110, a data selection unit 120, a second past record data storage unit 130, an average / variance calculation unit 140, a probability density distribution creation unit 150, and a random number generation unit. 160, random number set storage unit 170, correlation coefficient calculation unit 180, correlation coefficient matrix storage unit 190, random number conversion unit 210, random number set storage unit 220, prediction result creation unit 230, prediction result storage unit 240, prediction result display unit 310 and a display device 320 are provided.

第1過去の実績データ記憶部110は、過去の実績データを記憶する。この過去の実績データ記憶部110に記憶されている過去の実績データは、データ選択部120によって読み出される。   The first past result data storage unit 110 stores past result data. The past performance data stored in the past performance data storage unit 110 is read by the data selection unit 120.

データ選択部120は、第1過去の実績データ記憶部110から読み出した過去の実績データから、予測対象日と類似した日のデータを選択し、第2過去の実績データ記憶部130に送る。このデータ選択部120における選択基準としては、例えば同じ月の日や同じ曜日の日、または、同じ天候の日などが用いられる。   The data selection unit 120 selects data similar to the prediction target date from the past performance data read from the first past performance data storage unit 110 and sends the data to the second past performance data storage unit 130. As a selection criterion in the data selection unit 120, for example, the day of the same month, the day of the same day of the week, or the day of the same weather is used.

第2過去の実績データ記憶部130は、データ選択部120から送られてきた「選択された過去の実績データ」を記憶する。この第2過去の実績データ記憶部130に記憶されている選択された過去の実績データは、平均・分散計算部140、確率密度分布作成部150および相関係数計算部180によって読み出される。   The second past record data storage unit 130 stores “selected past record data” sent from the data selection unit 120. The selected past performance data stored in the second past performance data storage unit 130 is read by the average / variance calculation unit 140, the probability density distribution creation unit 150, and the correlation coefficient calculation unit 180.

平均・分散計算部140は、第2過去の実績データ記憶部130から過去の実績データを読み出して時刻毎の平均および分散を計算し、乱数発生部170に送る。確率密度分布作成部150は、第2過去の実績データ記憶部130から過去の実績データを読み出して時刻毎に確率密度分布を計算し、乱数発生部170に送る。   The average / dispersion calculation unit 140 reads past performance data from the second past performance data storage unit 130, calculates the average and variance for each time, and sends the average and variance to the random number generation unit 170. The probability density distribution creation unit 150 reads past performance data from the second past performance data storage unit 130, calculates a probability density distribution at each time, and sends the probability density distribution to the random number generation unit 170.

乱数発生部160は、平均・分散計算部140から送られてくる時刻毎の平均と分散、および、確率密度分布作成部150から送られてくる時刻毎の確率密度分布に基づき乱数を発生して時刻毎の乱数の組を作成し、乱数組記憶部170に送る。乱数組記憶部170は、乱数発生部160から送られてくる時刻毎の乱数の組を記憶する。この乱数組記憶部170に記憶されている時刻毎の乱数の組は、乱数変換部210によって読み出される。   The random number generator 160 generates random numbers based on the average and variance for each time sent from the average / variance calculator 140 and the probability density distribution for each time sent from the probability density distribution generator 150. A set of random numbers for each time is created and sent to the random number set storage unit 170. The random number set storage unit 170 stores a set of random numbers for each time sent from the random number generation unit 160. The random number set stored for each time stored in the random number set storage unit 170 is read by the random number conversion unit 210.

相関係数計算部180は、第2過去の実績データ記憶部130から読み出した過去の実績データに基づき時刻間の相関係数(共分散)を計算して相関係数行列を作成し、相関係数行列記憶部190に送る。相関係数行列記憶部190は、相関係数計算部180から送られてくる相関係数行列を記憶する。この相関係数行列作成部190に記憶されている相関係数行列は、乱数変換部210によって読み出される。   The correlation coefficient calculation unit 180 calculates a correlation coefficient (covariance) between times based on the past performance data read from the second past performance data storage unit 130, creates a correlation coefficient matrix, and It is sent to the number matrix storage unit 190. The correlation coefficient matrix storage unit 190 stores the correlation coefficient matrix sent from the correlation coefficient calculation unit 180. The correlation coefficient matrix stored in the correlation coefficient matrix creation unit 190 is read by the random number conversion unit 210.

乱数変換部210は、相関係数行列記憶部190から読み出した相関係数行列を用いて、乱数組記憶部170から読み出した時刻毎の乱数の組を、相関を持った乱数の組へ変換し、乱数組記憶部220に送る。乱数組記憶部220は、乱数変換部210から送られてきた相関を持った乱数の組を記憶する。この乱数組記憶部220に記憶されている相関を持った乱数の組は、予測結果作成部230によって読み出される。   The random number conversion unit 210 uses the correlation coefficient matrix read from the correlation coefficient matrix storage unit 190 to convert a random number set read from the random number set storage unit 170 into a correlated random number set. And sent to the random number set storage unit 220. The random number set storage unit 220 stores a set of random numbers having a correlation sent from the random number conversion unit 210. A set of correlated random numbers stored in the random number set storage unit 220 is read by the prediction result creation unit 230.

予測結果作成部230は、乱数組記憶部220から読み出した乱数の組に基づいて時系列データの値を予測して予測結果を作成し、予測結果記憶部240に送る。予測結果記憶部240は、予測結果作成部230から送られてくる時系列データの予測結果を記憶する。この予測結果記憶部240に記憶されている時系列データの予測結果は、予測結果表示部310によって読み出される。   The prediction result creation unit 230 creates a prediction result by predicting the value of the time-series data based on the random number set read from the random number set storage unit 220, and sends the prediction result to the prediction result storage unit 240. The prediction result storage unit 240 stores the prediction result of the time series data sent from the prediction result creation unit 230. The prediction result of the time series data stored in the prediction result storage unit 240 is read out by the prediction result display unit 310.

予測結果表示部310は、予測結果記憶部240から読み出した時系列データの予測結果を表示データに変換し、表示装置320に送る。表示装置320は、予測結果表示部310から送られてきた表示データに基づき時系列データの予測結果を表示する。   The prediction result display unit 310 converts the prediction result of the time series data read from the prediction result storage unit 240 into display data, and sends the display data to the display device 320. The display device 320 displays the prediction result of the time series data based on the display data sent from the prediction result display unit 310.

次に、上記のように構成される第1の実施形態に係る時系列データの予測装置の動作を説明する。   Next, the operation of the time-series data prediction apparatus according to the first embodiment configured as described above will be described.

時系列データの予測装置の動作が開始されると、データ選択部120は、第1過去の実績データ記憶部110から予測対象日と類似した日の過去の実績データを選択し、第2過去の実績データ記憶部130に送って準備する。次いで、平均・分散計算部140は、第2過去の実績データ記憶部130から過去の実績データを読み出して時刻毎の平均および分散を計算し、乱数発生部170に送る。同様に、確率密度分布作成部150は、第2過去の実績データ記憶部130から過去の実績データを読み出して時刻毎に確率密度分布を計算し、乱数発生部170に送る。   When the operation of the time-series data prediction apparatus is started, the data selection unit 120 selects past performance data on a date similar to the prediction target date from the first past performance data storage unit 110, and the second past data Prepared by sending it to the result data storage unit 130. Next, the average / dispersion calculation unit 140 reads past performance data from the second past performance data storage unit 130, calculates an average and variance for each time, and sends the average and variance to the random number generation unit 170. Similarly, the probability density distribution creation unit 150 reads past performance data from the second past performance data storage unit 130, calculates a probability density distribution at each time, and sends the probability density distribution to the random number generation unit 170.

乱数発生部160は、平均・分散計算部140から送られてくる時刻毎の平均と分散、および、確率密度分布作成部150から送られてくる時刻毎の確率密度分布に基づき乱数を発生して時刻毎の乱数の組を作成し、乱数組記憶部170に送って記憶させる。   The random number generator 160 generates random numbers based on the average and variance for each time sent from the average / variance calculator 140 and the probability density distribution for each time sent from the probability density distribution generator 150. A set of random numbers for each time is created and sent to the random number set storage unit 170 for storage.

一方、相関係数計算部180は、第2過去の実績データ記憶部130から読み出した過去の実績データに基づき時刻間の相関係数(共分散)を計算して相関係数行列を作成し、相関係数行列記憶部190に送って記憶させる。   On the other hand, the correlation coefficient calculation unit 180 calculates a correlation coefficient (covariance) between times based on past performance data read from the second past performance data storage unit 130 to create a correlation coefficient matrix, It is sent to the correlation coefficient matrix storage unit 190 for storage.

次いで、乱数変換部210は、相関係数行列記憶部190から読み出した相関係数行列を用いて、乱数組記憶部170から読み出した時刻毎の乱数の組を、相関を持った乱数の組へ変換し、乱数組記憶部220に送って記憶させる。   Next, the random number conversion unit 210 uses the correlation coefficient matrix read from the correlation coefficient matrix storage unit 190 to convert the random number set read out from the random number set storage unit 170 into a correlated random number set. The data is converted and sent to the random number set storage unit 220 for storage.

次いで、予測結果作成部230は、時系列データの予測結果を作成し、予測結果記憶部240に送って記憶させる。予測結果表示部310は、予測結果記憶部240から読み出した時系列データの予測結果を表示データに変換し、表示装置320に送る。これにより、表示装置320には、予測結果表示部310から送られてきた表示データに基づき時系列データの予測結果が表示される。
[第2の実施形態]
Next, the prediction result creation unit 230 creates a prediction result of the time series data, and sends it to the prediction result storage unit 240 for storage. The prediction result display unit 310 converts the prediction result of the time series data read from the prediction result storage unit 240 into display data, and sends the display data to the display device 320. As a result, the prediction result of the time series data is displayed on the display device 320 based on the display data sent from the prediction result display unit 310.
[Second Embodiment]

図5は、第2の実施形態に係る時系列データの予測装置の構成を示す図である。なお、図5では、図4に示した第1の実施形態に係る時系列データの予測装置の構成要素の一部を、便宜的に簡略化して示している。   FIG. 5 is a diagram illustrating a configuration of a time-series data prediction apparatus according to the second embodiment. In FIG. 5, some components of the time-series data prediction apparatus according to the first embodiment shown in FIG. 4 are simplified for convenience.

この時系列データの予測装置では、データ選択部120は、第1過去の実績データ記憶部110から読み出した過去の実績データを用いて、従来の予測手法である重回帰分析やニューラルネットワーク等による既知の予測処理1211を実行し、その結果を用いて予測対象の時系列データの一部または全部を予測する処理1212を実行し、その予測した値が近い過去の実績データを全過去の実績データから選択する処理1213を実行する。この処理1213により選択された過去の実績データが、予測に用いる過去の実績データとして第2過去の実績データ記憶部130に送られて記憶される。   In this time-series data prediction apparatus, the data selection unit 120 uses the past performance data read from the first past performance data storage unit 110, and is known by a multiple regression analysis or a neural network that is a conventional prediction method. Is executed, and a process 1212 for predicting a part or all of the time-series data to be predicted is executed using the result, and past performance data whose predicted values are close are obtained from all past performance data. A selection process 1213 is executed. The past performance data selected by this processing 1213 is sent to and stored in the second past performance data storage unit 130 as past performance data used for prediction.

図5においては、従来の予測手法によって予測された結果と値が類似した過去の実績データが選択されるが、類似の判断基準としては、種々の値を用いることができる。例えば、(9)式に示すような非類似度を定義し、この非類似度が小さな方から予め定められた日数だけ選択して類似と判断することができる。
In FIG. 5, past performance data whose values are similar to those predicted by the conventional prediction method are selected, but various values can be used as similar determination criteria. For example, a dissimilarity as shown in the equation (9) is defined, and it can be determined that the dissimilarity is selected by selecting a predetermined number of days from the one with the smaller dissimilarity.

ここで、Xiは予測対象時系列データのi番目の時刻の予測値であり、xj,iはj番目の過去の実績データにおけるi番目の時刻の実績値である。また、wiはi番目の時刻に対する重み係数である。なお、Xiとしては、時系列データの最大値や最小値を用いることもできる。 Here, X i is the predicted value at the i-th time of the prediction target time-series data, and x j, i is the actual value at the i-th time in the j-th past actual data. W i is a weighting coefficient for the i-th time. Note that the maximum value or the minimum value of the time series data can also be used as X i .

図6は、上述した予測された値と類似する過去の実績データの選択方法を説明するための図である。図6において、折れ線A、B、CおよびDは過去の実績データであり、折れ線Zは、予測対象の時系列データのうち、予め予測された点(X1〜Xn)を結んだ線分である。この例の場合、折れ線Bが最も類似した過去の実績データとなる。この第2の実施形態では、過去の実績データとしては2つ以上選択する必要があるので、例えば、折れ線Bと折れ線Cを選択することができる。 FIG. 6 is a diagram for explaining a method of selecting past performance data similar to the predicted value described above. In FIG. 6, the broken lines A, B, C, and D are past performance data, and the broken line Z is a line segment connecting points (X 1 to X n ) predicted in advance in the time series data to be predicted. It is. In the case of this example, the broken line B is the past result data that is most similar. In the second embodiment, since it is necessary to select two or more past performance data, for example, a broken line B and a broken line C can be selected.

この他にも、類似性の判断には、時系列データの一部または全部、あるいは、最大値または最小値を予め予測し、この予測結果と過去の実績データの対応する値との差を用いて、重みを付けた差の自乗和を用いることができる。また、時系列データの各時刻の値を位置ベクトルとみなして、距離の近いデータを選択する手法等を用いることができる。距離の定義としては、通常のユークリッド距離の他に、マハラノビスの距離などを用いることができる。なお、(9)式に示す非類似度も距離の一種と考えることができる。   In addition to this, in determining similarity, a part or all of the time series data, or the maximum value or the minimum value is predicted in advance, and the difference between the prediction result and the corresponding value of the past performance data is used. Thus, a sum of squares of weighted differences can be used. Further, it is possible to use a method of selecting data having a short distance by regarding each time value of time series data as a position vector. As a definition of the distance, in addition to a normal Euclidean distance, a Mahalanobis distance or the like can be used. Note that the dissimilarity shown in equation (9) can also be considered as a kind of distance.

このようにして選択された類似日において、第1の実施形態と同様にして、確率密度分布作成部150は、各時刻の確率密度分布を作成し、時間・分散・共分散計算部141に送る。時間・分散・共分散計算部141は、各時刻の平均、分散および時刻間の相関係数(共分散)を計算し、乱数発生部161に送る。   On the similar days selected in this way, the probability density distribution creating unit 150 creates a probability density distribution at each time and sends it to the time / variance / covariance calculation unit 141 in the same manner as in the first embodiment. . The time / variance / covariance calculation unit 141 calculates the average, variance, and correlation coefficient (covariance) between the times and sends them to the random number generation unit 161.

乱数発生部161は、平均・分散・共分散計算部141から送られてくる時刻毎の平均、分散および時刻間の相関係数(共分散)に基づき時刻毎の乱数の組を作成し、これを、相関を持った乱数の組へ変換する。そして、相関を持った乱数の組に基づいて時系列データの値を予測して予測結果を作成し、予測結果記憶部240に送る。それ以後の動作は、第1の実施形態と同じである。
[第3の実施形態]
The random number generator 161 creates a set of random numbers for each time based on the average, variance, and correlation coefficient (covariance) between the times sent from the average / variance / covariance calculator 141. Is converted to a set of correlated random numbers. Then, based on a set of correlated random numbers, the value of the time-series data is predicted to create a prediction result, which is sent to the prediction result storage unit 240. The subsequent operation is the same as that of the first embodiment.
[Third Embodiment]

第3の実施形態に係る時系列データの予測装置の構成は、図5に示した第2の実施形態に係る時系列データの予測装置の構成と同じである。以下、第3の実施形態に係る時系列データの予測装置の動作についてのみ説明する。   The configuration of the time-series data prediction apparatus according to the third embodiment is the same as the configuration of the time-series data prediction apparatus according to the second embodiment shown in FIG. Only the operation of the time-series data prediction apparatus according to the third embodiment will be described below.

図7は、第3の実施形態に係る時系列データの予測装置の動作を示すフローチャートである。この第3の実施形態では、時系列データとして1日の需要カーブを例にあげて説明する。   FIG. 7 is a flowchart showing the operation of the time-series data prediction apparatus according to the third embodiment. In the third embodiment, a daily demand curve will be described as an example of time series data.

動作が開始されると、まず、予測対象日の属性が決定される(ステップS11)。次いで、属性が同じ過去の実績データが選定される(ステップS12)。ここで、属性とは、年、月、曜日、天候、その他の過去の実績データを特徴づける性質である。この過去の実績データを用いて、まず、重回帰分析等の予測手法を用いて、時系列データにおいて基準となる予測値が予測される(ステップS13)。基準となる予測値としては、時系列データの最大値や最小値を用いることができる。なお、基準となる時刻の予測結果や、1日の初めや終わりの値を用いることもできる。1日の初めの値として前日の終わりの値を与えると、前日との連続性を考慮して類似日を選択することができる。次いで、ステップS13で得られた最大値や最小値を用いて、過去の実績データから類似日が選択される(ステップS14)。類似日の選択には、第2の実施形態と同様な方法を用いることができる。   When the operation is started, first, the attribute of the prediction target day is determined (step S11). Next, past performance data having the same attribute is selected (step S12). Here, the attribute is a property that characterizes past performance data such as year, month, day of the week, weather, and the like. Using the past performance data, first, a prediction value serving as a reference in time series data is predicted using a prediction method such as multiple regression analysis (step S13). As the reference predicted value, the maximum value or the minimum value of the time series data can be used. In addition, the prediction result of the time used as a reference | standard and the value of the beginning and end of a day can also be used. If the value of the end of the previous day is given as the first value of the day, a similar day can be selected in consideration of continuity with the previous day. Next, similar dates are selected from past performance data using the maximum and minimum values obtained in step S13 (step S14). A method similar to that in the second embodiment can be used for selecting similar days.

類似日が選択されると、第1の実施形態と同様な方法で、各時刻における需要の確率密度分布が作成され(ステップS15)、次いで、これらの類似日において、各時刻における平均と分散、時刻間の相関(共分散)が計算される(ステップS16)。次いで、これらの統計的な性質を再現する乱数が生成され(ステップS17)、その後、需要シナリオが作成される(ステップS18)。これにより、分布を考慮した予測を行うことができる。   When similar days are selected, a probability density distribution of demand at each time is created in the same manner as in the first embodiment (step S15), and then, on these similar days, the mean and variance at each time, A correlation (covariance) between times is calculated (step S16). Next, random numbers that reproduce these statistical properties are generated (step S17), and then a demand scenario is created (step S18). As a result, it is possible to perform prediction in consideration of distribution.

以上のようにして分布を考慮した時系列データを予測することができるので、この時系列データのシナリオを用いて将来の種々の現象を期待値として予測することができる。
[4の実施形態]
Since time series data considering the distribution can be predicted as described above, various future phenomena can be predicted as expected values using this time series data scenario.
[Fourth Embodiment]

第4の実施形態に係る時系列データの予測装置の構成は、図4に示した第1の実施形態に係る時系列データの予測装置の構成と同じである。以下、第4の実施形態に係る時系列データの予測装置の動作についてのみ説明する。   The configuration of the time-series data prediction apparatus according to the fourth embodiment is the same as the configuration of the time-series data prediction apparatus according to the first embodiment shown in FIG. Only the operation of the time-series data prediction apparatus according to the fourth embodiment will be described below.

図8は、第4の実施形態に係る時系列データの予測装置の動作を示すフローチャートであり、上述した期待値の計算方法を示している。この処理は、第1の実施形態で説明した予測結果作成部230で予測結果が作成された後に開始される。予測結果が作成されると、まず、時系列データの予測シナリオ(M個)が予測結果記憶部240に格納される(ステップS21)。次いで、評価量pの時刻i、シナリオ番号mにおける値が定義される(ステップS22)。ここで、評価量pを「p=p(i,m)」と表す。   FIG. 8 is a flowchart showing the operation of the time-series data prediction apparatus according to the fourth embodiment, and shows the above-described expected value calculation method. This process is started after a prediction result is created by the prediction result creation unit 230 described in the first embodiment. When a prediction result is created, first, prediction scenarios (M) of time series data are stored in the prediction result storage unit 240 (step S21). Next, the value of the evaluation amount p at time i and scenario number m is defined (step S22). Here, the evaluation amount p is expressed as “p = p (i, m)”.

次いで、シナリオ番号mが「0」に初期化される(ステップS23)。その後、シナリオ番号mがインクリメント(+1)される(ステップS24)。次いで、m番目の時系列データの時刻iにおいて評価量pが評価される(ステップS25)。次いで、シナリオ番号mがMになったかどうかが調べられる(ステップS26)。このステップS26において、シナリオ番号mがMになっていないことが判断されると、ステップS24に戻り、上述した処理が繰り返される。   Next, the scenario number m is initialized to “0” (step S23). Thereafter, the scenario number m is incremented (+1) (step S24). Next, the evaluation amount p is evaluated at time i of the m-th time series data (step S25). Next, it is checked whether or not the scenario number m becomes M (step S26). If it is determined in step S26 that the scenario number m is not M, the process returns to step S24 and the above-described processing is repeated.

一方、ステップS26において、シナリオ番号mがMになったことが判断されると、次いで、期待値が計算される(ステップS27)。期待値は、下記(10)式で表すことができる。その後、評価量pの各時刻における期待値<p(i)>が記憶装置(図示しない)に記憶される(ステップS28)。
On the other hand, if it is determined in step S26 that the scenario number m has become M, then an expected value is calculated (step S27). The expected value can be expressed by the following equation (10). Thereafter, the expected value <p (i)> at each time of the evaluation amount p is stored in a storage device (not shown) (step S28).

なお、期待値としては、単純な時系列データの値そのもの、例えば、時系列データの一定期間の合計値を用いることもできるが、時系列データの値に種々の演算を施した結果、または、この結果を平均して得られる値を用いることもできる。この場合、期待値が望ましい値になるように演算の方法を変更する、より詳しくは、入力パラメータを変更して再計算するように構成できる。   As the expected value, the value of simple time-series data itself, for example, the total value of a certain period of time-series data can be used, but the result of performing various operations on the value of time-series data, or A value obtained by averaging the results can also be used. In this case, the calculation method can be changed so that the expected value becomes a desirable value, more specifically, the input parameter can be changed and recalculated.

具体的には、予測結果が1日の電力需要のシナリオであれば、各シナリオの1日の総需要を計算し、平均を計算することにより1日の総電力需要の期待値を計算できる。また、予測結果が太陽光等の自然エネルギー発電の発電量であれば、最適な制御方法や電力売買計画を検討することができる。また、発電量の期待値や電力売買による収益の期待値を予測することもできる。   Specifically, if the prediction result is a scenario of daily power demand, the expected value of daily total power demand can be calculated by calculating the total daily demand for each scenario and calculating the average. Moreover, if the prediction result is the amount of power generated by natural energy such as sunlight, an optimal control method and power trading plan can be examined. It is also possible to predict the expected value of power generation and the expected value of revenue from power trading.

また、予測結果が将来の商品の販売量であれば、適切な在庫量や仕入れ量を検討することもできる。さらに、予測結果が将来の株価の推移であれば、株式の最適な売買のタイミングを決定することができる。   In addition, if the prediction result is the sales volume of future products, it is possible to consider an appropriate inventory volume or purchase volume. Furthermore, if the prediction result is a transition of the future stock price, it is possible to determine the optimal trading timing of the stock.

このように、時系列データを統計的に正しく過去の実績データを再現したシナリオとして予測することができれば、応用範囲は非常に広く、有効性は大きい。   As described above, if the time series data can be predicted as a scenario in which the past actual data is reproduced correctly and statistically, the application range is very wide and the effectiveness is large.

以上のように、いくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   As mentioned above, although several embodiment was described, these embodiment is shown as an example and is not intending limiting the range of invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.

110 第1過去実績データ記憶部
120 データ選択部
130 第2過去実績データ記憶部
140、141 平均・分散計算部
150 確率密度分布作成部
160、161 乱数発生部
170 乱数記憶部
180 相関係数計算部
190 相関係数行列記憶部
210 乱数変換部
220 乱数記憶部
230 予測結果作成部
240 予測結果記憶
250 予測結果表示部
320 表示装置
110 First past record data storage unit 120 Data selection unit 130 Second past record data storage unit 140, 141 Average / variance calculation unit 150 Probability density distribution creation unit 160, 161 Random number generation unit 170 Random number storage unit 180 Correlation coefficient calculation unit 190 correlation coefficient matrix storage unit 210 random number conversion unit 220 random number storage unit 230 prediction result creation unit 240 prediction result storage 250 prediction result display unit 320 display device

Claims (9)

過去の時系列データから、予測対象日と類似した日のデータを選択するデータ選択ステップと、
前記データ選択ステップで選択されたデータから時刻毎に異なる確率密度分布を計算する確率密度分布作成ステップと、
前記確率密度分布作成ステップで計算された時刻毎に異なる確率密度分布に従った複数の乱数を発生させる乱数発生ステップと、
過去の時系列データにおける時刻間の相関を計算する相関係数計算ステップと、
前記相関係数計算ステップで計算された相関に基づいて前記乱数発生ステップで発生された乱数の組を互いに相関を有する乱数の組に変換する乱数変換ステップと、
前記乱数変換ステップにおける変換により得られた乱数の組に基づいて時系列データの値を予測して予測結果を作成する予測結果作成ステップと、
を備えることを特徴とする時系列データの予測方法。
A data selection step for selecting data similar to the forecast date from past time series data,
A probability density distribution creating step of calculating a different probability density distribution for each time from the data selected in the data selection step;
A random number generation step for generating a plurality of random numbers according to different probability density distributions at each time calculated in the probability density distribution creating step;
A correlation coefficient calculating step for calculating a correlation between times in past time series data;
A random number conversion step for converting a set of random numbers generated in the random number generation step into a set of random numbers having a correlation with each other based on the correlation calculated in the correlation coefficient calculation step;
A prediction result creating step of predicting a value of time series data based on a set of random numbers obtained by the conversion in the random number conversion step and creating a prediction result;
A method for predicting time-series data, comprising:
前記データ選択ステップは、
過去の時系列データから、既知の予測手法による予測結果を用いて予測対象の時系列データの一部または全部を予測する予測ステップと、
前記予測ステップで予測された結果に値が類似する過去の実績データを、すべての過去の実績データの中から選択する選択ステップを備えることを特徴とする請求項1記載の時系列データの予測方法。
The data selection step includes:
A prediction step for predicting a part or all of the time series data to be predicted from the past time series data using a prediction result by a known prediction method;
2. The method for predicting time-series data according to claim 1, further comprising a selection step of selecting past performance data whose value is similar to the result predicted in the prediction step from all past performance data. .
前記予測ステップにおいては、時系列データの最大値と最小値を、重回帰分析を用いて予め予測しておくことを特徴とする請求項2記載の時系列データの予測方法。   3. The time series data prediction method according to claim 2, wherein in the prediction step, the maximum value and the minimum value of the time series data are predicted in advance using multiple regression analysis. 前記予測ステップにおいては、時系列データの最大値と最小値を、ニューラルネットを用いて予め予測しておくことを特徴とする請求項2記載の時系列データの予測方法。   3. The time series data prediction method according to claim 2, wherein in the prediction step, a maximum value and a minimum value of the time series data are predicted in advance using a neural network. 前記選択ステップにおいては、前記予測ステップで予測された結果に値が類似するかどうかを判断するために、該予測された結果と過去の実績データの対応する値との差を用いて重みを付けた差の自乗和、ユークリッド距離またはマハラノビス距離を用いることを特徴とする請求項2乃至請求項4のいずれか1項記載の時系列データの予測方法。   In the selection step, weighting is performed using a difference between the predicted result and a corresponding value of past performance data in order to determine whether the value is similar to the result predicted in the prediction step. 5. The method for predicting time-series data according to claim 2, wherein the sum of squares of differences, Euclidean distance, or Mahalanobis distance is used. 前記予測結果作成ステップで作成された予測結果によって示される時系列データのシナリオから、時系列データの一定期間の合計値で示される期待値または各シナリオの一定期間のデータに対して演算を施した結果を平均して得られる期待値を算出し、該期待値が望ましい値になるように演算の方法を変更するステップを備えることを特徴とする請求項1乃至請求項5のいずれか1項記載の時系列データの予測方法。   From the scenario of the time series data indicated by the prediction result created in the prediction result creation step, an operation was performed on the expected value indicated by the total value for a certain period of time series data or the data for a certain period of each scenario. 6. The method according to claim 1, further comprising a step of calculating an expected value obtained by averaging the results and changing a calculation method so that the expected value becomes a desired value. To predict time series data. 請求項1乃至請求項6のいずれか1項に記載の時系列データの予測方法をコンピュータで実行するための予測プログラム。   A prediction program for executing the time-series data prediction method according to any one of claims 1 to 6 by a computer. 請求項1乃至請求項6のいずれか1項に記載の時系列データの予測方法をコンピュータで実行する予測プログラムを記憶したコンピュータ読取り可能な記憶媒体。   A computer-readable storage medium storing a prediction program for executing the time-series data prediction method according to any one of claims 1 to 6 by a computer. 過去の時系列データから予測対象日と類似した日のデータを選択するデータ選択部と、
前記データ選択部で選択されたデータから時刻毎に異なる確率密度分布を計算する確率密度分布作成部と、
前記確率密度分布作成部からの時刻毎に異なる確率密度分布に従った複数の乱数の組を発生させる乱数発生部と、
過去の時系列データにおける時刻間の相関を計算する相関係数計算部と、
前記相関係数計算部で計算された相関に基づいて前記乱数発生部で発生された乱数の組を互いに相関を有する乱数の組に変換する乱数変換部と、
前記乱数変換部における変換により得られた乱数の組に基づいて時系列データの値を予測して予測結果を作成する予測結果作成部と、
とを備えることを特徴とする時系列データの予測装置。
A data selection unit that selects data similar to the prediction target date from past time series data,
A probability density distribution creating unit that calculates a different probability density distribution for each time from the data selected by the data selection unit;
A random number generator for generating a set of a plurality of random numbers according to a different probability density distribution for each time from the probability density distribution creating unit;
A correlation coefficient calculation unit for calculating a correlation between times in past time series data;
A random number conversion unit that converts a set of random numbers generated by the random number generation unit into a set of random numbers having a correlation with each other based on the correlation calculated by the correlation coefficient calculation unit;
A prediction result creation unit that creates a prediction result by predicting a value of time-series data based on a set of random numbers obtained by conversion in the random number conversion unit;
A time-series data prediction apparatus comprising:
JP2011119194A 2011-05-27 2011-05-27 Time series data prediction apparatus, prediction method, prediction program, and storage medium Active JP5777404B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011119194A JP5777404B2 (en) 2011-05-27 2011-05-27 Time series data prediction apparatus, prediction method, prediction program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011119194A JP5777404B2 (en) 2011-05-27 2011-05-27 Time series data prediction apparatus, prediction method, prediction program, and storage medium

Publications (2)

Publication Number Publication Date
JP2012247998A true JP2012247998A (en) 2012-12-13
JP5777404B2 JP5777404B2 (en) 2015-09-09

Family

ID=47468385

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011119194A Active JP5777404B2 (en) 2011-05-27 2011-05-27 Time series data prediction apparatus, prediction method, prediction program, and storage medium

Country Status (1)

Country Link
JP (1) JP5777404B2 (en)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013088980A (en) * 2011-10-17 2013-05-13 Chugoku Electric Power Co Inc:The Interval prediction device, waiting time prediction device, interval prediction method, waiting time prediction method and program
JP2013088981A (en) * 2011-10-17 2013-05-13 Chugoku Electric Power Co Inc:The Time prediction device, time prediction method and program
CN103679288A (en) * 2013-12-04 2014-03-26 华北电力大学 Method for short-term prediction of generated output of runoff small hydropower station cluster and prediction system
JP2016053925A (en) * 2014-09-04 2016-04-14 株式会社東芝 Power market price prediction device, power market price prediction method and program
JP2017153259A (en) * 2016-02-25 2017-08-31 中国電力株式会社 Power demand prediction device and power demand prediction method
JP2018156468A (en) * 2017-03-17 2018-10-04 株式会社東芝 Deviation determination device, day type discrimination device, prediction device, program, and deviation determination method
CN110780997A (en) * 2019-09-27 2020-02-11 苏州浪潮智能科技有限公司 Method and device for eliminating load burrs of hard disk prediction data acquisition end
CN111461377A (en) * 2019-01-18 2020-07-28 中国科学院上海高等研究院 Prediction method/system, storage medium and equipment for total energy demand
JP2020154950A (en) * 2019-03-22 2020-09-24 株式会社 みずほ銀行 Market sign management system, market sign management method, and market sign management program
CN113408797A (en) * 2021-06-07 2021-09-17 北京京东振世信息技术有限公司 Method for generating flow-traffic prediction multi-time-sequence model, information sending method and device
WO2023109417A1 (en) * 2021-12-16 2023-06-22 广州城市理工学院 Weighted allocation-based frequency prediction method for small hydropower station
JP7387422B2 (en) 2019-12-24 2023-11-28 株式会社東芝 Order recommendation system, order recommendation method, and program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09215192A (en) * 1996-02-08 1997-08-15 Fuji Electric Co Ltd Method for predicting daily load curve
JP2004112869A (en) * 2002-09-13 2004-04-08 Toshiba Corp Predictive system for electric power demand
JP2009169930A (en) * 2007-12-21 2009-07-30 Fuji Electric Systems Co Ltd Energy demand predicting device
JP2009200604A (en) * 2008-02-19 2009-09-03 Nippon Telegr & Teleph Corp <Ntt> Link band extension amount calculating method, system and program
JP2010213477A (en) * 2009-03-11 2010-09-24 Toshiba Corp Method, device and program for planning of power generation, and storage device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09215192A (en) * 1996-02-08 1997-08-15 Fuji Electric Co Ltd Method for predicting daily load curve
JP2004112869A (en) * 2002-09-13 2004-04-08 Toshiba Corp Predictive system for electric power demand
JP2009169930A (en) * 2007-12-21 2009-07-30 Fuji Electric Systems Co Ltd Energy demand predicting device
JP2009200604A (en) * 2008-02-19 2009-09-03 Nippon Telegr & Teleph Corp <Ntt> Link band extension amount calculating method, system and program
JP2010213477A (en) * 2009-03-11 2010-09-24 Toshiba Corp Method, device and program for planning of power generation, and storage device

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013088981A (en) * 2011-10-17 2013-05-13 Chugoku Electric Power Co Inc:The Time prediction device, time prediction method and program
JP2013088980A (en) * 2011-10-17 2013-05-13 Chugoku Electric Power Co Inc:The Interval prediction device, waiting time prediction device, interval prediction method, waiting time prediction method and program
CN103679288A (en) * 2013-12-04 2014-03-26 华北电力大学 Method for short-term prediction of generated output of runoff small hydropower station cluster and prediction system
JP2016053925A (en) * 2014-09-04 2016-04-14 株式会社東芝 Power market price prediction device, power market price prediction method and program
JP2017153259A (en) * 2016-02-25 2017-08-31 中国電力株式会社 Power demand prediction device and power demand prediction method
JP2018156468A (en) * 2017-03-17 2018-10-04 株式会社東芝 Deviation determination device, day type discrimination device, prediction device, program, and deviation determination method
CN111461377B (en) * 2019-01-18 2024-02-02 中国科学院上海高等研究院 Prediction method/system, storage medium and apparatus for total energy demand
CN111461377A (en) * 2019-01-18 2020-07-28 中国科学院上海高等研究院 Prediction method/system, storage medium and equipment for total energy demand
JP2020154950A (en) * 2019-03-22 2020-09-24 株式会社 みずほ銀行 Market sign management system, market sign management method, and market sign management program
CN110780997A (en) * 2019-09-27 2020-02-11 苏州浪潮智能科技有限公司 Method and device for eliminating load burrs of hard disk prediction data acquisition end
JP7387422B2 (en) 2019-12-24 2023-11-28 株式会社東芝 Order recommendation system, order recommendation method, and program
CN113408797B (en) * 2021-06-07 2023-09-26 北京京东振世信息技术有限公司 Method for generating multi-time sequence model of flow quantity prediction, method and device for sending information
CN113408797A (en) * 2021-06-07 2021-09-17 北京京东振世信息技术有限公司 Method for generating flow-traffic prediction multi-time-sequence model, information sending method and device
WO2023109417A1 (en) * 2021-12-16 2023-06-22 广州城市理工学院 Weighted allocation-based frequency prediction method for small hydropower station

Also Published As

Publication number Publication date
JP5777404B2 (en) 2015-09-09

Similar Documents

Publication Publication Date Title
JP5777404B2 (en) Time series data prediction apparatus, prediction method, prediction program, and storage medium
Huang et al. A hybrid model for carbon price forecasting using GARCH and long short-term memory network
Gilbert et al. Leveraging turbine-level data for improved probabilistic wind power forecasting
Amjady Day-ahead price forecasting of electricity markets by a new fuzzy neural network
Bello et al. Medium-term probabilistic forecasting of electricity prices: A hybrid approach
Gonzalez et al. Forecasting power prices using a hybrid fundamental-econometric model
Aytac et al. Characterization of demand for short life-cycle technology products
JP5248372B2 (en) Power generation plan creation method, device, program, and storage device
Costa et al. Statistical evaluation of Data Envelopment Analysis versus COLS Cobb–Douglas benchmarking models for the 2011 Brazilian tariff revision
CN102165442A (en) Methods and apparatus to calibrate a choice forecasting system for use in market share forecasting
JP2016053925A (en) Power market price prediction device, power market price prediction method and program
KR20190143543A (en) Methode for Performance Improvement of Portfolio Asset Allocation Using Recurrent Reinforcement Learning
Díaz et al. Valuation of wind power distributed generation by using Longstaff–Schwartz option pricing method
Matsumura et al. Forecasting the yield curve with linear factor models
Sobieraj et al. Application of the Bayesian New Keynesian DSGE Model to Polish Macroeconomic Data
Castro et al. Improvements to Modern Portfolio Theory based models applied to electricity systems
US20190180376A1 (en) Financial Correlation Prediction System and the Method Thereof
JP2005122438A (en) Predicting method, predicting device, predicting program and recording medium
Newham Power system investment planning using stochastic dual dynamic programming
Benchimol Central bank losses, monetary policy rules, and limited information
Guo et al. Reliability assessment of scenarios generated for stock index returns incorporating momentum
KR20220147968A (en) A stock price prediction system based on real-time macro index prediction
Seya et al. Application of model averaging techniques to spatial hedonic land price models
Cantore et al. The science and art of DSGE modelling: I–construction and Bayesian estimation
Akosah Estimated DSGE Model for Macroeconomic Analysis in a Small-Open Economy: A Ghanaian Perspective

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140325

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150707

R151 Written notification of patent or utility model registration

Ref document number: 5777404

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151