JP2011107782A - Volatility prediction system and volatility prediction method - Google Patents

Volatility prediction system and volatility prediction method Download PDF

Info

Publication number
JP2011107782A
JP2011107782A JP2009259343A JP2009259343A JP2011107782A JP 2011107782 A JP2011107782 A JP 2011107782A JP 2009259343 A JP2009259343 A JP 2009259343A JP 2009259343 A JP2009259343 A JP 2009259343A JP 2011107782 A JP2011107782 A JP 2011107782A
Authority
JP
Japan
Prior art keywords
value
prediction
numerical
confidence interval
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009259343A
Other languages
Japanese (ja)
Other versions
JP5543177B2 (en
Inventor
Kenichi Yoshihara
健一 吉原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2009259343A priority Critical patent/JP5543177B2/en
Publication of JP2011107782A publication Critical patent/JP2011107782A/en
Application granted granted Critical
Publication of JP5543177B2 publication Critical patent/JP5543177B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To determine a confidence interval of the same type of estimated numeric values by using numeric values obtained so far, for a numerical string obtained by continuously observing a natural phenomenon or a social phenomenon. <P>SOLUTION: The volatility prediction system is configured to process numeric values obtained by a prediction start time for a numerical string obtained by continuously observing the numeric values of a target phenomenon, and to apply the bootstrap method of the latest statistical theory, and to create a region (called, confidence band) configured of connecting the upper limit and the lower limit of the confidence interval of values at each point of time of the regression curve of predetermined confidence coefficients, and to input a predicted request time to determine the confidence interval of the prediction value on the point of time. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、目的とする現象の変動数値の将来における予測範囲を、予測前に継続的に観測して得られる数値列から予測する変動数値予測に関する。   The present invention relates to a fluctuation numerical prediction for predicting a future prediction range of a fluctuation numerical value of a target phenomenon from a numerical string obtained by continuously observing before prediction.

自然現象または社会現象を継続的に観測して得られる数値列に対し、現時点までに得られている数値を利用して、同種の数値の指定された時点における予測値を得るために作られている従来の方法は、「得られている数値列はすべて独立に同じ正規分布に従う」という大前提に立った従来の統計理論に基づいている。また、特許文献1には、関連性が推測される現象において他の現象に基づいて予測する方法が開示されている。   Created to obtain a predicted value at a specified point in time for the same kind of numerical value using a numerical value obtained so far for a numerical sequence obtained by continuously observing natural or social phenomena The conventional method is based on the conventional statistical theory based on the major premise that “the obtained numerical sequences independently follow the same normal distribution”. Further, Patent Document 1 discloses a method of predicting a phenomenon whose relevance is estimated based on another phenomenon.

特開2004−205233号公報JP 2004-205233 A

しかしながら、現実の問題では、「得られている数値列はすべて独立に同じ正規分布に従う」という大前提が正しいということを確かめる術がない。例えば、金融商品価格が正規分布に従っているか否かを検証することはできず、2008年のサブプライムローンをきっかけに起きたような経済現象に対応することはできなかった。その上、f(t)の推定量の分布は一般には求められない。   However, in the real problem, there is no way to confirm that the major premise that “the obtained numerical sequences independently follow the same normal distribution” is correct. For example, it was not possible to verify whether the price of a financial product follows a normal distribution, and it was not possible to cope with an economic phenomenon caused by the 2008 subprime loan. In addition, the distribution of estimators of f (t) is generally not determined.

本発明は、自然現象または社会現象を継続的に観測して得られる数値列に対し、現在までに得られている数値を利用して、同種の数値の予測値の信頼区間を求める変動数値予測システムおよびその方法を提供する。   The present invention relates to a numerical sequence obtained by continuously observing a natural phenomenon or a social phenomenon, using a numerical value obtained so far, and obtaining a confidence interval of a predicted value of the same type of numerical value. A system and method are provided.

かかる課題を解決するために、本発明の変動数値予測システムは、目的とする現象の変動数値の将来における予測範囲を、予測前に継続的に観測して得られる数値列から予測する変動数値予測システムであって、目的とする現象の数値を継続的に観測して得られる数値列を、…、x-m-r、x-m-r+1、…、x-1、x0、x1、x2、…とするとき、予測開始時点の値をx0、その前の値をx-1、…、そのm+r-1前の値をx-m-r+1とおいて、

Figure 2011107782
を計算し、元データとしてx-1、…、x-mを作成する元データ作成手段と、前記元データ作成手段により作成された元データに統計理論のブートストラップ法を適用して、前記元データの中から無作為復元抽出法でn(≦m)個のデータをリサンプルし、このリサンプルの操作をB回(Bは正の整数)行って得られたB組のリサンプルを用いて、予め与えられた信頼係数の回帰関数の各点における信頼区間を算出し、該信頼区間の上限及び下限をそれぞれ結んで回帰関数の信頼帯を求め、得られた回帰関数に予測日時を入力して、得られた信頼帯を使って予測値の信頼区間を算出する信頼区間算出手段とを備え、得られた予測値の信頼区間を変動数値の未来における予測範囲として出力することを特徴とする。 In order to solve such a problem, the fluctuation numerical value prediction system of the present invention predicts the future prediction range of the fluctuation value of a target phenomenon from a numerical sequence obtained by continuously observing before prediction, A numerical sequence obtained by continuously observing a numerical value of a target phenomenon, which is a system, ..., x -mr , x -m-r + 1 , ..., x -1 , x 0 , x 1 , When x 2 ,..., the prediction start time value is x 0 , the previous value is x −1 ,..., and the previous m + r−1 value is x −m−r + 1 .
Figure 2011107782
And x- 1 ,..., X -m as original data, and applying the statistical theory bootstrap method to the original data created by the original data creating means, Resample n (≦ m) data from the data by random restoration extraction method, and use B sets of resamples obtained by performing this resample operation B times (B is a positive integer). Calculate the confidence interval at each point of the regression function with a given confidence coefficient, connect the upper and lower limits of the confidence interval to obtain the confidence band of the regression function, and enter the prediction date and time in the obtained regression function And a confidence interval calculation means for calculating a confidence interval of the predicted value using the obtained confidence band, and outputting the confidence interval of the obtained predicted value as a prediction range in the future of the fluctuation value, To do.

又、目的とする現象の変動数値が継続的に観測され、現時点までに得られた数値列から、未知の定数を含むxのp次多項式、f(x) = a0 + a1x + a2x2 + … + apxpを用いて、将来の前記現象の数値範囲を予測する変動数値予測システムであって、目的とする現象の数値を継続的に観測して得られる数値列を、…、x-m-r、x-m-r+1、…、y-1、y0、y1、y2、…とするとき、予測開始時点の値をy0、その前の値をy-1、…、そのm+r-1前の値をy-m-r+1とおいて、

Figure 2011107782
を計算し、元データとして2次元データ(1,y1)、(2,y2)、…、(m,ym)を生成する手段と、前記元データを用いて未知の定数a0、a1、…、apの推定値、
Figure 2011107782
を計算する手段と、前記元データの中から無作為復元抽出法でm個のデータ、
Figure 2011107782
をリサンプルし、このリサンプルしたm個のデータを使って未知の定数a1、a2、…、apの推定値、
Figure 2011107782
を計算する操作をn回(nは正の整数)繰り返して、p行n列の値、
Figure 2011107782
を作成する手段と、
各行の平均値、
Figure 2011107782
と標準偏差、
Figure 2011107782
とを計算し、これら平均値と標準偏差とを使って、
Figure 2011107782
を求める操作をB回(Bは正の整数)行って、p行B列の値、
Figure 2011107782
を作成する手段と、
各行の標準偏差、
Figure 2011107782
を計算して、信頼係数(1-α)に対して、正の数uの整数部分を表す記号[u]を用いて、Z1,1、 Z1,2、…、Z1,Bを大きさの順に並べて、小さい方からαB/2番目のZ1,αB/2の値をZ1,α、(1-α/2)B番目のZ1,(1-α/2)Bの値をZ1,1-α、標準正規分布の上裾の面積が(1-α/2)になる値をz1-α/2とおくとき、実数c,dの内小さくない方を表す記号max(c,d)を用いて、
Figure 2011107782
ならば、a1の信頼区間を、
Figure 2011107782
また上の条件が成り立たない場合は、a1の信頼区間を、
Figure 2011107782
とし、a2、a3、…、apの信頼区間、
Figure 2011107782
も同様に計算して、x = (1 + 2+ … + m)/mとおくときa0の信頼区間を、
Figure 2011107782
および
Figure 2011107782
と決定する手段と、予測に使う関数の下限、上限を、
Figure 2011107782
として、この関数からt日後における予測値の下限及び上限として、
Figure 2011107782
を計算して、その結果を記憶する手段と、上記処理をq回(qは正の整数)繰り返してその都度結果を記憶し、それぞれ下限及び上限の平均値を計算してt日後における予測値の下限、上限として計算して、t日後における予測値の信頼区間を生成する手段とを有し、得られた予測値の信頼区間を変動数値の未来における予測範囲として出力することを特徴とする。 Moreover, the fluctuation value of the target phenomenon is continuously observed, and the p-order polynomial of x including unknown constants, f (x) = a 0 + a 1 x + a, from the numerical sequence obtained up to the present time. 2 x 2 +… + a p x p is a fluctuating numerical prediction system that predicts the numerical range of the phenomenon in the future, and a numerical sequence obtained by continuously observing the numerical value of the target phenomenon , ..., x -mr , x -m-r + 1 , ..., y -1 , y 0 , y 1 , y 2 , ..., the value at the prediction start time is y 0 , and the previous value is y -1 , ..., the value before m + r-1 is y- m-r + 1 ,
Figure 2011107782
, A unit for generating two-dimensional data (1, y 1 ), (2, y 2 ),..., (M, y m ) as original data, and an unknown constant a 0 using the original data, a 1 , ..., an estimate of a p ,
Figure 2011107782
And m data by a random restoration extraction method from the original data,
Figure 2011107782
, And using the resampled m pieces of data, the estimated values of unknown constants a 1 , a 2 , ..., a p ,
Figure 2011107782
The operation of calculating n is repeated n times (n is a positive integer), the value of p rows and n columns,
Figure 2011107782
And a means to create
The average value for each row,
Figure 2011107782
And standard deviation,
Figure 2011107782
And using these mean and standard deviation,
Figure 2011107782
Is performed B times (B is a positive integer), the value of p rows and B columns,
Figure 2011107782
And a means to create
Standard deviation for each row,
Figure 2011107782
The calculated relative confidence factor (1-alpha), with the symbol [u] represents an integer portion of a positive number u, Z 1,1, Z 1,2, ..., the Z 1, B Arrange in order of size , the αB / 2th Z 1, αB / 2 values from the smallest to Z 1, α , (1-α / 2) Bth Z 1, (1-α / 2) B When the value is Z 1,1-α , and the value where the area of the upper tail of the standard normal distribution is (1-α / 2) is z 1-α / 2 , it represents the lesser of the real numbers c and d Using the symbol max (c, d),
Figure 2011107782
Then the confidence interval for a 1
Figure 2011107782
If the above condition does not hold, the confidence interval of a 1 is
Figure 2011107782
And a confidence interval of a 2 , a 3 , ..., a p ,
Figure 2011107782
Similarly, if x = (1 + 2+… + m) / m, the confidence interval of a 0
Figure 2011107782
and
Figure 2011107782
And the lower and upper limits of the function used for prediction,
Figure 2011107782
As the lower limit and upper limit of the predicted value after t days from this function,
Figure 2011107782
And a means for storing the result, and the above process is repeated q times (q is a positive integer), the result is stored each time, and the average value of the lower limit and the upper limit is calculated, respectively, and the predicted value after t days And a means for generating a confidence interval for the predicted value after t days, and outputting the confidence interval of the obtained predicted value as a prediction range in the future of the fluctuation value .

更に、上記変動数値予測システムをコンピュータ・システムに実現させるプログラムや該プログラムを記憶する記憶媒体、変動数値予測方法も提供する。   Furthermore, a program for causing a computer system to realize the fluctuation numerical value prediction system, a storage medium for storing the program, and a variable numerical value prediction method are also provided.

本発明により、自然現象または社会現象を継続的に観測して得られる数値列に対し、現在までに得られている数値を利用して、同種の数値の予測値の信頼区間を求める変動数値予測システムおよびその方法を提供できる。すなわち、本発明では、f(t)の推定量を効果的に推定できるので、結果として金融商品価格等の予測値の分布を仮定しないで、よい予測値が得られる。   According to the present invention, a numerical sequence obtained by continuously observing a natural phenomenon or a social phenomenon is used to obtain a confidence interval for a predicted value of the same kind of numerical value using a numerical value obtained so far. A system and method thereof can be provided. That is, in the present invention, the estimated amount of f (t) can be estimated effectively, and as a result, a good predicted value can be obtained without assuming a distribution of predicted values such as financial product prices.

本実施例の変動数値予測システムの構成例を示すブロック図である。It is a block diagram which shows the structural example of the fluctuation | variation numerical value prediction system of a present Example. 図1のメモリ24の記憶構成例を示す図である。It is a figure which shows the memory | storage structure example of the memory 24 of FIG. 図1の補助記憶装置26の記憶構成例を示す図である。It is a figure which shows the memory | storage structure example of the auxiliary storage device 26 of FIG. 本実施例の変動数値予測システムの動作手順例を示すフローチャートである。It is a flowchart which shows the example of an operation | movement procedure of the fluctuation | variation numerical prediction system of a present Example. 本実施例の変動数値予測システムの動作手順例を示すフローチャートである。It is a flowchart which shows the example of an operation | movement procedure of the fluctuation | variation numerical prediction system of a present Example. 本実施例の変動数値予測システムの動作例を説明する模式図である。It is a schematic diagram explaining the operation example of the fluctuation | variation numerical prediction system of a present Example. 本実施例の信頼帯の概念を示す図である。It is a figure which shows the concept of the trust zone of a present Example. 本実施例の変動数値予測の具体的な予測結果を示す図であり、(a)は日経平均株価の予測結果、(b)は原油価格の予測結果を示す図である。It is a figure which shows the specific prediction result of the fluctuation | variation numerical value prediction of a present Example, (a) is a prediction result of a Nikkei average stock price, (b) is a figure which shows the prediction result of a crude oil price.

以下、添付図面を参照しながら、本発明の一実施例及び具体的な適用例を詳細に説明する。なお、実施例及び具体的では、好適な例として日経平均株価を例に説明するが、これに限定されない。   Hereinafter, an embodiment and a specific application example of the present invention will be described in detail with reference to the accompanying drawings. In the examples and specific examples, the Nikkei average stock price will be described as a preferred example, but the present invention is not limited to this.

<本実施例の変動数値予測システムの構成例>
本実施例による変動数値予測は、通常のコンピュータ・システムを用いて実行している。図1は、本実施例の変動数値予測システムのハードウエアの構成例を示すブロック図である。
<Configuration example of fluctuation numerical value prediction system of this embodiment>
The fluctuation numerical value prediction according to the present embodiment is executed using a normal computer system. FIG. 1 is a block diagram illustrating a hardware configuration example of a fluctuation numerical value prediction system according to the present embodiment.

図1において、処理装置本体20中にCPU22、メモリ24、各インターフェース28およびインターフェース28の1つと接続されているディスク等の補助記憶装置26を備えている。また、インターフェース28を介して、入力装置(キーボード等)30、出力装置( ディスプレイ等)40と接続されている。本実施例のシステムは、補助記憶装置26に本実施例の機能を実現するプログラムとして格納され、入力装置30からの指示により起動されると、メモリ24上にロードされ、CPU22で実行される。実行結果は、ディスプレイやプリンタ等の出力装置40に出力される。   In FIG. 1, a processing apparatus main body 20 includes a CPU 22, a memory 24, each interface 28, and an auxiliary storage device 26 such as a disk connected to one of the interfaces 28. Further, an input device (such as a keyboard) 30 and an output device (such as a display) 40 are connected via an interface 28. The system of the present embodiment is stored in the auxiliary storage device 26 as a program that implements the functions of the present embodiment. When activated by an instruction from the input device 30, the system is loaded on the memory 24 and executed by the CPU 22. The execution result is output to an output device 40 such as a display or a printer.

(メモリ24の記憶構成例)
図2は、本実施例の変動数値予測を実現するために必要とするデータを記憶するメモリ24の記憶構成例を示している。なお、図2には本実施例に特有のデータのみを示し汎用のデータや変数パラメータ(例えば、フローチャートのiやjなど)は省かれている。
(Storage configuration example of the memory 24)
FIG. 2 shows a storage configuration example of the memory 24 that stores data necessary for realizing the fluctuation numerical value prediction of this embodiment. FIG. 2 shows only data peculiar to this embodiment, and general-purpose data and variable parameters (for example, i and j in the flowchart) are omitted.

24aは、入力装置30などからオペレータにより指示された設定パラメータが記憶される領域である。かかる設定パラメータはデータの計算やフローチャートでの繰り返し回数などとして使用される。本実施例の設定パラメータには、回帰曲線の次数p(p=1の場合は、以下の具体例で示す回帰直線を表す)、元データの数m、元データ算出に使用するデータ数r、本実施例の復元抽出法のリサンプル回数n、復元抽出法の抽出回数B、信頼係数(1ーα)、予測までの日数t、予測値の算出回数qが含まれる。   Reference numeral 24a denotes an area for storing setting parameters instructed by an operator from the input device 30 or the like. Such setting parameters are used as data calculation or the number of repetitions in the flowchart. The setting parameters of this example include the order p of the regression curve (when p = 1, the regression line shown in the following specific example represents the regression line), the number m of original data, the number r of data used to calculate the original data, The number of resampling times n of the restoration extraction method of the present embodiment, the number of times of extraction B of the restoration extraction method, the reliability coefficient (1−α), the number of days t until the prediction, and the number of times q of the prediction value calculation are included.

24bは、元データyi(i=1〜m)が記憶される領域である。24cは、元データyi(i=1〜m)から算出される回帰係数bの推定量b^を記憶する領域である。24dは、リサンプルの平均値x、y、回帰係数bj(j=1〜n)を記憶する領域である。24eは、回帰係数bj(j=1〜n)の平均値bk、標準偏差Sk、Zk(k=1〜B)=(n(bkーb^)/Sk1/2を記憶する領域である。24fは、平均値bk(k=1〜B)の標準偏差Vを記憶する領域である。24gは、回帰係数bの上限値bmax、下限値bminを記憶する領域である。24hは、回帰係数aの上限値amax、下限値aminを記憶する領域である。なお、24g及び24hは後述の具体例であるp=1の回帰直線y=a+bxの場合を示しており、p次回帰曲線に一般化すると、24gにはa1、a2、…、apの上下限値が記憶され、24hにはa0の上下限値が記憶される。24iは、上限・下限の回帰曲線(直線)から日数tに基づいて算出された上限値Fmax,h、下限値min,h(h=1〜q)を記憶する領域である。24jは、予測結果として、h個の上限値を平均した上限予測値、h個の下限値を平均した下限予測値を記憶する領域である。 Reference numeral 24b denotes an area in which original data y i (i = 1 to m) is stored. An area 24c stores an estimated amount b ^ of the regression coefficient b calculated from the original data y i (i = 1 to m). Reference numeral 24d denotes an area for storing the average value x, y of the resample and the regression coefficient b j (j = 1 to n). 24e is an average value b k of regression coefficients b j (j = 1 to n), standard deviation S k , Z k (k = 1 to B) = (n (b k −b ^) / S k ) 1 / This is an area for storing 2 . Reference numeral 24f denotes an area for storing the standard deviation V of the average value b k (k = 1 to B). 24g is an area for storing an upper limit value b max and a lower limit value b min of the regression coefficient b. 24h is an area for storing an upper limit value a max and a lower limit value a min of the regression coefficient a. Incidentally, 24 g and 24h shows the case of the regression line y = a + bx of p = 1 is a specific example described later, is generalized to the p-th order regression curve, the 24g a 1, a 2, ... , a p And the upper and lower limit values of a 0 are stored in 24h. 24i is an area for storing the upper limit value F max, h and the lower limit value min, h (h = 1 to q) calculated based on the number of days t from the upper and lower limit regression curves (straight lines). 24j is an area for storing an upper limit predicted value obtained by averaging h upper limit values and a lower limit predicted value obtained by averaging h lower limit values as prediction results.

(補助記憶装置26の記憶構成例)
図3は、本実施例の変動数値予測を実現するために必要とするデータを記憶する補助記憶装置26の記憶構成例を示している。なお、図3には本実施例に特有のデータ及びプログラムのみを示し汎用のデータやプログラム(例えば、OSやBIOSなど)は省かれている。
(Storage configuration example of the auxiliary storage device 26)
FIG. 3 shows a storage configuration example of the auxiliary storage device 26 that stores data necessary for realizing the fluctuation numerical value prediction of this embodiment. FIG. 3 shows only data and programs peculiar to this embodiment, and general-purpose data and programs (for example, OS and BIOS) are omitted.

26bは、予測に使用される過去の変動数値(例えば、日経平均株価や為替、原油価格など)を蓄積するデータベースの領域である。26cは、本実施例の変動数値予測を実現する変動数値予測プログラム(図4A及び図4Bに従って後述)を記憶する領域である。26d〜26hには、変動数値予測プログラムで使用する計算ルーチンが記憶される。26dは、元データ作成ルーチンを記憶する領域である。26eは、元データyi(i=1〜m)から回帰係数bの推定量b^を算出するルーチンを記憶する領域である。26fは、回帰係数bj(j=1〜n)を作成する作成ルーチンを記憶する領域である。26gは、回帰係数bj(j=1〜n)の平均値bk、標準偏差Skから、Zk(k=1〜B)=(n(bk−b^)/Sk1/2を算出するルーチンを記憶する領域である。26gは、平均値bk(k=1〜B)の標準偏差Vを記憶する領域である。24gは、回帰係数a,bの信頼区間(上限値、下限値)を算出するルーチンを記憶する領域である。なお、26gは後述の具体例であるp=1の回帰直線y=a+bxの場合を示しており、p次回帰曲線に一般化すると、26gはa0、a1、a2、…、apの上下限値を算出する。26hは、上限・下限の回帰曲線(直線)から日数tに基づいて算出された上限値Fmax,h、下限値min,h(h=1〜q)、更に、予測結果として、h個の上限値を平均した上限予測値、h個の下限値を平均した下限予測値を算出するルーチンを記憶する領域である。 Reference numeral 26b denotes an area of a database that accumulates past fluctuation numerical values (for example, Nikkei average stock price, exchange rate, crude oil price, etc.) used for prediction. 26c is an area for storing a fluctuation numerical value prediction program (which will be described later with reference to FIGS. 4A and 4B) for realizing the fluctuation numerical value prediction of this embodiment. In 26d to 26h, a calculation routine used in the fluctuation numerical value prediction program is stored. An area 26d stores an original data creation routine. An area 26e stores a routine for calculating an estimated amount b ^ of the regression coefficient b from the original data y i (i = 1 to m). An area 26f stores a creation routine for creating a regression coefficient b j (j = 1 to n). 26 g represents Z k (k = 1 to B) = (n (b k −b ^) / S k ) 1 from the average value b k and standard deviation S k of the regression coefficients b j (j = 1 to n). This area stores a routine for calculating / 2 . 26 g is an area for storing the standard deviation V of the average value b k (k = 1 to B). An area 24g stores a routine for calculating confidence intervals (upper limit value and lower limit value) of the regression coefficients a and b. In addition, 26g shows the case of the regression line y = a + bx of p = 1 which is a specific example described later. When generalized to a p-order regression curve, 26g is a 0 , a 1 , a 2 ,. The upper and lower limit values are calculated. 26h is an upper limit value F max, h calculated from the upper limit / lower limit regression curve (straight line) based on the number of days t, a lower limit value min, h (h = 1 to q), and h This is an area for storing a routine for calculating an upper limit predicted value obtained by averaging the upper limit values and a lower limit predicted value obtained by averaging h lower limit values.

<本実施例の変動数値予測システムの動作例>
図4A及び図4Bは、本実施例の変動数値予測システムの動作手順例を示すフローチャートである。以下、図4A及び図4Bに従って、具体的な動作手順と一般化された動作手順を関連付けて説明する。
<Operation Example of Fluctuation Numerical Prediction System of This Example>
4A and 4B are flowcharts illustrating an example of an operation procedure of the fluctuation numerical value prediction system according to this embodiment. Hereinafter, according to FIGS. 4A and 4B, a specific operation procedure and a generalized operation procedure will be described in association with each other.

(ステップS10) オペレータや外部装置からの指示により、CPU22は本変動数値予測システムの初期化とパラメータの設定を行う。設定パラメータは、図2で上述したように、回帰曲線の次数p、元データの数m、元データ算出に使用するデータ数r、本実施例の復元抽出法のリサンプル回数n、復元抽出法の抽出回数B、信頼係数(1ーα)、予測までの日数t、予測値の算出回数qを含み、メモリ24に記憶する。   (Step S10) In response to an instruction from an operator or an external device, the CPU 22 initializes the variable numerical value prediction system and sets parameters. As described above with reference to FIG. 2, the setting parameters include the order p of the regression curve, the number m of the original data, the number r of data used for calculating the original data, the number n of resamples of the restoration extraction method of the present embodiment, and the restoration extraction method. The number of times of extraction B, the reliability coefficient (1−α), the number of days t until prediction, and the number of times q of calculation of the predicted value are stored in the memory 24.

本例では、目的とする現象の変動数値が継続的に観測され、現時点までに得られた数値列から、未知の定数を含むxのp次多項式、f(x) = a0 + a1x + a2x2 + … + apxpを用いて、将来の前記現象の数値範囲を予測する。以下、図4A及び図4Bでは、具体例で示すようなp=1の場合、すなわち回帰直線の場合を例に示し、その一般形、すなわちp≧2の場合(以下では回帰曲線という)を各ステップにおいて対応して示す。 In this example, the fluctuation value of the target phenomenon is continuously observed, and the p-degree polynomial of x including unknown constants, f (x) = a 0 + a 1 x + a 2 x 2 +… + a p x p is used to predict the numerical range of the phenomenon in the future. Hereinafter, in FIG. 4A and FIG. 4B, the case of p = 1 as shown in a specific example, that is, the case of a regression line is shown as an example, and the general form thereof, that is, the case of p ≧ 2 (hereinafter referred to as a regression curve) is shown. The corresponding steps are shown.

(ステップS20) CPU22は、目的とする現象の数値を継続的に観測して得られる数値列を、…、x-m-r、x-m-r+1、…、y-1、y0、y1、y2、…とするとき、予測開始時点の値をy0、その前の値をy-1、…、そのm+r-1前の値をy-m-r+1とおいて、

Figure 2011107782
を計算し、元データとして2次元データ(1,y1)、(2,y2)、…、(m,ym)を生成して、メモリ24に記憶する。。 (Step S20) CPU 22 is a numeric string obtained by continuously monitoring the value of the phenomenon of interest, ..., x -mr, x -m -r + 1, ..., y -1, y 0, y When 1 , y 2 ,..., The prediction start time value is y 0 , the previous value is y −1 , ..., and the previous m + r−1 value is y −m−r + 1 ,
Figure 2011107782
, Two-dimensional data (1, y 1 ), (2, y 2 ),..., (M, y m ) are generated as original data and stored in the memory 24. .

(ステップS30) CPU22は、元データを用いて、回帰直線y=a+bxの回帰係数bの推定量b^を算出して、メモリ24に記憶する。   (Step S30) The CPU 22 calculates an estimated amount b ^ of the regression coefficient b of the regression line y = a + bx using the original data, and stores it in the memory 24.

一般の回帰曲線の場合、CPU22は、前記元データを用いて未知の定数a0、a1、…、apの推定値、

Figure 2011107782
を計算して、メモリ24に記憶する。 For general regression curve, CPU 22, the unknown constants a 0, using the original data a 1, ..., estimated value of a p,
Figure 2011107782
Is stored in the memory 24.

(ステップS40−S50) CPU22は、復元抽出法による各リサンプルの平均値xj、yj、回帰直線の回帰係数bの推定量b^jを算出して、メモリ24に記憶する。かかるリサンプルをステップS40に戻ってn回繰り返す(J=1〜n)。 (Steps S40 to S50) The CPU 22 calculates the average values x j and y j of each resample by the restoration extraction method and the estimated amount b ^ j of the regression coefficient b of the regression line, and stores them in the memory 24. Such re-sampling returns to step S40 and is repeated n times (J = 1 to n).

一般の回帰曲線の場合、CPU22は、前記元データの中から無作為復元抽出法でm個のデータ、

Figure 2011107782
をリサンプルし、このリサンプルしたm個のデータを使って未知の定数a1、a2、…、apの推定値、
Figure 2011107782
を計算する操作をn回(nは正の整数)繰り返して、p行n列の値、
Figure 2011107782
を作成する。 In the case of a general regression curve, the CPU 22 selects m pieces of data from the original data by a random restoration extraction method,
Figure 2011107782
, And using the resampled m pieces of data, the estimated values of unknown constants a 1 , a 2 , ..., a p ,
Figure 2011107782
The operation of calculating n is repeated n times (n is a positive integer), the value of p rows and n columns,
Figure 2011107782
Create

(ステップS60−S70) CPU22は、b^j(J=1〜n)の平均値をbk、標準偏差をSkとして、Zk=(n(bk−b^)/Sk1/2を算出して、メモリ24に記憶する。かかる復元抽出法による計算をステップS40に戻ってB回繰り返す(k=1〜B)。 (Steps S60-S70) The CPU 22 sets Z k = (n (b k −b ^) / S k ) 1/2 where b k is the average value of b ^ j (J = 1 to n) and Sk is the standard deviation. Is calculated and stored in the memory 24. The calculation by the restoration extraction method returns to step S40 and is repeated B times (k = 1 to B).

一般の回帰曲線の場合、CPU22は、p行n列の値から各行の平均値、

Figure 2011107782
と標準偏差、
Figure 2011107782
とを計算し、これら平均値と標準偏差とを使って、
Figure 2011107782
を求める操作をB回(Bは正の整数)行って、p行B列の値、
Figure 2011107782
を作成する。 In the case of a general regression curve, the CPU 22 calculates the average value of each row from the value of p rows and n columns,
Figure 2011107782
And standard deviation,
Figure 2011107782
And using these mean and standard deviation,
Figure 2011107782
Is performed B times (B is a positive integer), the value of p rows and B columns,
Figure 2011107782
Create

(ステップS80) CPU22は、bk(k=1〜B)の標準偏差Vに基づいて、回帰係数bの目標とする信頼係数(1ーα)の信頼区間(bmax,h、bmin,h)を求める。 (Step S80) Based on the standard deviation V of b k (k = 1 to B), the CPU 22 sets the confidence interval (b max, h , b min, h ).

一般の回帰曲線の場合、CPU22は、p行B列の値から各行の標準偏差、

Figure 2011107782
を計算して、信頼係数(1-α)に対して、正の数uの整数部分を表す記号[u]を用いて、Z1,1、 Z1,2、…、Z1,Bを大きさの順に並べて、小さい方からαB/2番目のZ1,αB/2の値をZ1,α、(1-α/2)B番目のZ1,(1-α/2)Bの値をZ1,1-α、標準正規分布の上裾の面積が(1-α/2)になる値をz1-α/2とおくとき、実数c,dの内小さくない方を表す記号max(c,d)を用いて、
Figure 2011107782
ならば、a1の信頼区間を、
Figure 2011107782
また上の条件が成り立たない場合は、a1の信頼区間を、
Figure 2011107782
とし、a2、a3、…、apの信頼区間、
Figure 2011107782
も同様に計算する。 In the case of a general regression curve, the CPU 22 calculates the standard deviation of each row from the value of p row B column,
Figure 2011107782
The calculated relative confidence factor (1-alpha), with the symbol [u] represents an integer portion of a positive number u, Z 1,1, Z 1,2, ..., the Z 1, B Arrange in order of size , the αB / 2th Z 1, αB / 2 values from the smallest to Z 1, α , (1-α / 2) Bth Z 1, (1-α / 2) B When the value is Z 1,1-α , and the value where the area of the upper tail of the standard normal distribution is (1-α / 2) is z 1-α / 2 , it represents the lesser of the real numbers c and d Using the symbol max (c, d),
Figure 2011107782
Then the confidence interval for a 1
Figure 2011107782
If the above condition does not hold, the confidence interval of a 1 is
Figure 2011107782
And a confidence interval of a 2 , a 3 , ..., a p ,
Figure 2011107782
Calculate in the same way.

(ステップS90) CPU22は、ステップS80で求めた信頼区間(bmax,h、bmin,h)から、回帰係数aの信頼係数(1ーα)の信頼区間(amax,h、amin,h)を求める。 (Step S90) CPU 22, the confidence interval calculated in step S80 (b max, h, b min, h) from the confidence interval (a max of confidence factors of the regression coefficients a (1 over alpha), h, a min, h ).

一般の回帰曲線の場合、CPU22は、ステップS80で求めたa1、a2、a3、…、apの信頼区間から、x = (1 + 2+ … + m)/mとおくときa0の信頼区間を、

Figure 2011107782
および
Figure 2011107782
と決定する。 For general regression curve, CPU 22 is, a 1 obtained in step S80, a 2, a 3, ..., the confidence interval of a p, x = (1 + 2+ ... + m) when placing a / m a A confidence interval of 0
Figure 2011107782
and
Figure 2011107782
And decide.

(ステップS100) CPU22は、上限・下限の回帰直線(y=a+bx)から、t日後の上限予測値Fmax,h、Fmin,hを算出して、メモリ24に記憶する。 (Step S <b> 100) The CPU 22 calculates the upper limit predicted values F max, h and F min, h after t days from the upper / lower regression line (y = a + bx) and stores them in the memory 24.

一般の回帰曲線の場合、CPU22は、予測に使う関数の下限、上限を、

Figure 2011107782
として、この関数からt日後における予測値の下限及び上限として、
Figure 2011107782
を計算して、その結果をメモリ24に記憶する。 In the case of a general regression curve, the CPU 22 sets the lower limit and upper limit of the function used for prediction,
Figure 2011107782
As the lower limit and upper limit of the predicted value after t days from this function,
Figure 2011107782
And the result is stored in the memory 24.

(ステップS110) CPU22は、上記ステップS40からS100の処理をステップS40に戻ってq回繰り返す(h=1〜q)。一般の回帰曲線の場合も、CPU22は、上記ステップS40からS100の処理をq回(qは正の整数)繰り返してその都度結果をメモリ24に記憶する。   (Step S110) The CPU 22 returns to Step S40 and repeats the processes from Step S40 to S100 q times (h = 1 to q). Also in the case of a general regression curve, the CPU 22 repeats the processing of steps S40 to S100 q times (q is a positive integer) and stores the result in the memory 24 each time.

(ステップS120) CPU22は、上限値Fmax,h(h=1〜q)の平均値を予測上限値とし、下限値Fmin,h(h=1〜q)の平均値を予測下限値として、出力装置40に出力(表示あるいは印刷)する。一般の回帰曲線の場合も、CPU22は、それぞれ下限及び上限の平均値を計算してt日後における予測値の下限、上限として計算して、t日後における予測値の信頼区間を生成し、得られた予測値の信頼区間を変動数値の未来における予測範囲として出力装置40に出力する。 (Step S120) The CPU 22 sets the average value of the upper limit value F max, h (h = 1 to q) as the predicted upper limit value, and sets the average value of the lower limit value F min, h (h = 1 to q) as the predicted lower limit value. And output (display or print) to the output device 40. Also in the case of a general regression curve, the CPU 22 calculates the average value of the lower limit and the upper limit, respectively, calculates the lower limit and the upper limit of the predicted value after t days, and generates a confidence interval for the predicted value after t days. The confidence interval of the predicted value is output to the output device 40 as the future prediction range of the fluctuation value.

なお、上記フローチャートの各ステップは説明の便宜上に分けられており、それらのステップは統合されても、更に分割されてもよい。   Note that each step of the flowchart is divided for convenience of description, and these steps may be integrated or further divided.

<日経平均株価の予測の具体例>
図5を参照しながら、平成21年9月25日までの日経平均株価を使って、4週間後の10月23日の日経平均株価を予測する方法を考える。この場合の、設定パラメータは、p=1, m=16, r=3, n=7, B=120, α= 0.05, t=20, q=10が設定される。
<Examples of Nikkei Stock Average Forecast>
With reference to FIG. 5, a method of predicting the Nikkei Stock Average on October 23, four weeks later, using the Nikkei Stock Average until September 25, 2009 will be considered. In this case, the setting parameters are set to p = 1, m = 16, r = 3, n = 7, B = 120, α = 0.05, t = 20, and q = 10.

(1) 最初に、9月25日から営業日18日(=m+r-1=16+3-1)遡った8月28日以降9月25日までの日経平均株価を日順に、

Figure 2011107782
のように並べ(図5の51参照)、これを使って連続する3日間(r=3)の移動平均yiを順次計算し、それぞれに番号xをつける。これを表示すると次のようになる。 (1) First, the Nikkei Stock Average from August 28 to September 25, which is 18 days after September 25 (= m + r-1 = 16 + 3-1)
Figure 2011107782
(See 51 in FIG. 5), and using this, the moving average y i for three consecutive days (r = 3) is sequentially calculated, and a number x is assigned to each. This is displayed as follows.

Figure 2011107782
Figure 2011107782

この組{(xi,yi)、i=1, 2,…, 16}(図5の52参照)を元データと考える。ここで、xの平均値 = (1 + 2 + … + 16)/16 = 8.5 である、Yの平均値 = (10518.91 + 10434.35 + … + 10230.15)/16 = 10353.70 となる。 This set {(x i , y i ), i = 1, 2,..., 16} (see 52 in FIG. 5) is considered as original data. Here, the average value of x = (1 + 2 +++ 16) /16=8.5, and the average value of Y = (10518.91 + 10434.35 + ... + 10230.15) /16=10353.70.

この2次元データから得られる回帰直線(y=a+bx)の回帰係数bの推定量b^を計算すると、

Figure 2011107782
となる。 When calculating the estimated amount b ^ of the regression coefficient b of the regression line (y = a + bx) obtained from this two-dimensional data,
Figure 2011107782
It becomes.

(第一段階)
(2) 次に、元データから、復元抽出法により、無作為に元データの個数と同数のリサンプルをとる(図5の53ー1参照)。その結果は、

Figure 2011107782
となる。 (the first stage)
(2) Next, the same number of resamples as the number of original data are taken from the original data by the restoration extraction method (see 53-1 in FIG. 5). The result is
Figure 2011107782
It becomes.

これを使って、(1)の場合と同様に、このリサンプルに対する各平均値x、 Y 及び 回帰係数b1 *を計算すると、
平均値x1 = 9.4375 , 平均値Y1 = 10342.61, b1 * = -6.98052となる。
Using this, as in the case of (1), calculating each average value x, Y and regression coefficient b 1 * for this resample,
The average value x 1 = 9.4375, the average value Y 1 = 10342.61, b 1 * = -6.98052.

(3) (2)を7回(n=7)繰り返すと、各リサンプルに対してそれぞれ1個の回帰係数が得られる(図5の53ー1〜53ー7参照)。それらをb1 *、…、b7 *とおくと
b1 * = -6.98052, b2 * = -3.04553, b3 * = -1.91733, b4 * = 0.095334,
b5 * = -3.334066, b6 * = -4.17861, b7 * = -1.17185 となる。
(3) If (2) is repeated seven times (n = 7), one regression coefficient is obtained for each resample (see 53-1 to 53-7 in FIG. 5). If we put them as b 1 * , ..., b 7 *
b 1 * = -6.98052, b 2 * = -3.04553, b 3 * = -1.91733, b 4 * = 0.095334,
b 5 * = -3.334066, b 6 * = -4.17861, b 7 * = -1.17185.

(4) (3)のb1 *, … b7 *の平均をb* 1、標準偏差をS* 1とし、Z1=(7(b* 1-b^)/S* 11/2を計算する(図5の54ー1参照)と、
b* 1 = -1.6458, S* 1 = 3.480352, Z1 = -0.51755 となる。
(4) The average of b 1 * ,… b 7 * in (3) is b * 1 and the standard deviation is S * 1, and Z 1 = (7 (b * 1 -b ^) / S * 1 ) 1 / 2 is calculated (see 54-1 in FIG. 5),
b * 1 = -1.6458, S * 1 = 3.480352, Z 1 = -0.51755.

(5) (3)及び(4)を120回(B=120)繰り返し(図5の54ー1〜54ー120参照)、その都度結果を記録する。結果のうち、{b* 1, b* 2,…,b* 120}、{Z1, Z2,…,Z120}を使う。 (5) Repeat (3) and (4) 120 times (B = 120) (see 54-1 to 54-120 in FIG. 5), and record the results each time. Of consequence, {b * 1, b * 2, ..., b * 120}, {Z 1, Z 2, ..., Z 120} use.

(5-1) {b* 1, b* 2,…,b* 120}の標準偏差を求める(図5の55参照)と、

Figure 2011107782
となる。 (5-1) Obtain the standard deviation of {b * 1 , b * 2 ,..., B * 120 } (see 55 in FIG. 5).
Figure 2011107782
It becomes.

(5-2) 回帰係数bの信頼係数0.95(1-α=1-0.05)の信頼区間を求めるので、上、下裾とも0.025の点で切り捨てるため、{Z1, Z2,…,Z120} を大きさの順に並べたとき、小さい方から3番目(=0.025B=0.025×120=3)のものZ(3)と、117番目(0.975B=0.975×120=117)のZ(117)のものを選ぶ。今の場合は、
Z(3) = -3.24476 , Z(117) = 3.13832 となる。
(5-2) Since a confidence interval of 0.95 (1-α = 1-0.05) confidence coefficient for regression coefficient b is calculated, {Z 1 , Z 2 , ..., Z 120 } are arranged in order of size, the third (= 0.025B = 0.025 × 120 = 3) Z (3) and the 117th (0.975B = 0.975 × 120 = 117) Z ( Select 117) . In this case,
Z (3) = -3.24476 and Z (117) = 3.13832.

(6) (6-1) |Z(3)|≦1.96 および |Z(117)|≦1.96 が成り立てば、回帰係数bの信頼係数0.95の信頼区間は、
[b^-Z(117)・V、b^-Z(3)・V]と考える。
(6) (6-1) If | Z (3) | ≦ 1.96 and | Z (117) | ≦ 1.96, then the confidence interval of 0.95 for the regression coefficient b is
Consider [b ^ -Z (117) · V, b ^ -Z (3) · V].

(6-2) (6-1)の条件が成り立たない場合は、回帰係数bの信頼係数0.95の信頼区間は、
[b^-1.96V、b^-1.96V]と考える。
(6-2) If the condition of (6-1) does not hold, the confidence interval of 0.95 confidence coefficient for regression coefficient b is
Consider [b ^ -1.96V, b ^ -1.96V].

本例の場合は(6-1)の条件は成り立たないので、(6-2)を使って回帰係数bの信頼係数0.95の信頼区間は、
[b^-1.96V、b^-1.96V]
=[-0.96501 - 1.96×2.111998 , -0.96501 + 1.96 × 2.111998 ]
=[-5.00452, 3.07451]となる。
In the case of this example, the condition of (6-1) does not hold, so using (6-2) the confidence interval of 0.95 confidence coefficient for regression coefficient b is
[B ^ -1.96V, b ^ -1.96V]
= [-0.96501-1.96 × 2.111998, -0.96501 + 1.96 × 2.111998]
= [-5.00452, 3.07451].

(7) (6)より回帰係数aの信頼係数0.95の信頼区間は、
[y - 3.07451x, Y - (-5.00452)x]
=[10353.70 - 3.07451 × 8.5, 10353.70 + 5.00452 × 8.5]
=[10327.56667, 10396.23842]となる。
(7) From (6), the confidence interval of 0.95 confidence coefficient of regression coefficient a is
[Y-3.07451x, Y-(-5.00452) x]
= [10353.70-3.07451 x 8.5, 10353.70 + 5.00452 x 8.5]
= [10327.56667, 10396.23842].

(8) (6)及び(7)より得られる回帰直線は、
下限:y = f(x) = 10327.56667 - 5.00452x
上限:y = f(x) = 10396.23842 + 3.07451x
となる。
(8) The regression line obtained from (6) and (7) is
Lower limit: y = f (x) = 10327.56667-5.00452x
Upper limit: y = f (x) = 10396.23842 + 3.07451x
It becomes.

かかる上限と下限の回帰曲線に囲まれた領域を信頼帯と呼び、図6のその概念図を示した。図6で61が上限の回帰曲線、62が下限の回帰曲線である。この回帰曲線の間が信頼帯であり、横軸の予想対象日63が決まると、信頼区間(予測上限値、予測下限値)が決定する。   The area surrounded by the upper and lower regression curves is called a confidence band, and the conceptual diagram of FIG. 6 is shown. In FIG. 6, 61 is an upper limit regression curve, and 62 is a lower limit regression curve. Between the regression curves is a confidence band, and when the prediction target date 63 on the horizontal axis is determined, the confidence interval (prediction upper limit value, prediction lower limit value) is determined.

(9) (8)を使って、営業日t日後の日経平均株価の下限の予測値F(t)と上限の予測値F(t)は、それぞれ、
下限:F(t) = f(16+t) = 10327.56667 - 5.00452(16+t)
上限:F(t) = f(16+t) = 10396.23842 + 3.07451(16+t)
と考える。
(9) Using (8), the lower limit forecast value F (t) and the upper limit forecast value F (t) of the Nikkei Stock Average after business day t
Lower limit: F (t) = f (16 + t) = 10327.56667-5.00452 (16 + t)
Upper limit: F (t) = f (16 + t) = 10396.23842 + 3.07451 (16 + t)
I think.

(10) (9)を使い、営業日20日後(t=20)の予測値を考える場合は、
下限:F(20) = 10327.56667 - 5.00452(16+20) = 10147.40
上限:F(20) = 10396.23842 + 3.07451(16+20) = 10506.92
である。
(10) When using (9) and considering the forecast value after 20 business days (t = 20),
Lower limit: F (20) = 10327.56667-5.00452 (16 + 20) = 10147.40
Upper limit: F (20) = 10396.23842 + 3.07451 (16 + 20) = 10506.92
It is.

(11) 以上(2)〜(10)の結果をストックする(図5の56ー1参照)。   (11) Stock the results of (2) to (10) above (see 56-1 in FIG. 5).

(第二段階)
(12) 第一段階の(2)〜(10)を計10回(q=10)繰り返し、得られた結果をストックする(図5の56ー1〜56ー10参照)。
(Second stage)
(12) Repeat (2) to (10) of the first step 10 times (q = 10) in total, and stock the obtained results (see 56-1 to 56-10 in FIG. 5).

(13) (12)で得られた結果の下限だけの平均、上限だけの平均をそれぞれ求めて、それらを目的の予測値の下限、上限とする(図5の57参照)。   (13) Obtain the average of only the lower limit and the average of the upper limit of the results obtained in (12), respectively, and use them as the lower and upper limits of the target predicted value (see 57 in FIG. 5).

なお、本発明の最初の部分のr個の値の平均は推定値のバラツキを抑えるため、これをB回行うのはリサンプルを通して元データから得られる回帰係数の分布状態、従って「真」の回帰係数を推測するため、最後にq回の平均をとるのは、バラツキを抑えるためもあるが、予測値のチェックのためもある。また、「営業日t日後」のtは1、2、… 20、… などなんでもよいが、(2)〜(13)を実行中は変えることはできない。また、回帰係数bの推定を信頼係数0.95で行った場合、最終の予測値の信頼区間の信頼係数は大体0.90ほどとなる。   Note that the average of the r values in the first part of the present invention suppresses the variation of the estimated value, so that this is performed B times because the distribution state of the regression coefficient obtained from the original data through resampling, and therefore “true”. In order to estimate the regression coefficient, the average of q times is used for the purpose of checking the prediction value as well as suppressing variation. In addition, “t” after “business day t” may be anything such as 1, 2,..., 20,..., But cannot be changed while (2) to (13) are being executed. Further, when the regression coefficient b is estimated with a confidence coefficient of 0.95, the confidence coefficient of the confidence interval of the final predicted value is about 0.90.

<本実施例による変動数値予測の例>
図7に、本実施例による変動数値予測を「日経平均株価」(図7の(a)参照)、「原油価格」(図7の(b)参照)に適用した例の予測結果と実際の数値を比較した表を示す。なお、共に、上記具体例で示した20日(3週間)後の予測値であり、「日経平均株価」は2009年の3月から8月の1月置きの予測、「原油価格」は2008年の3月から10月の1月半置きの予測である。
<Example of fluctuation numerical prediction according to this embodiment>
FIG. 7 shows an example of prediction results and actual values obtained by applying the numerical fluctuation prediction according to the present embodiment to “Nikkei average stock price” (see FIG. 7A) and “crude oil price” (see FIG. 7B). A table comparing the numerical values is shown. In addition, both are forecast values after 20 days (3 weeks) shown in the above specific example, “Nikkei Stock Average” is forecast every March to August of 2009, and “Crude Oil Price” is 2008 This is a forecast for every half of January from March to October of the year.

これらの結果から、本発明の変動数値予測は、上述のように、回帰係数bの推定を信頼係数0.95で行った場合、最終の予測値の信頼区間の信頼係数は大体0.90ほどとなるとの予想も当っており、自然現象または社会現象を継続的に観測して得られる数値列に対し、現在までに得られている数値を利用して、同種の数値の予測値の信頼区間を求めることができる。すなわち、本発明では、f(t)の推定量を効果的に推定できるので、結果として金融商品価格等の予測値の分布を仮定しないで、よい予測値が得られる。   From these results, the fluctuation value prediction of the present invention predicts that the reliability coefficient of the confidence interval of the final predicted value is about 0.90 when the regression coefficient b is estimated with the reliability coefficient 0.95 as described above. It is possible to obtain confidence intervals for predicted values of the same kind of numerical values using numerical values obtained so far for numerical sequences obtained by continuously observing natural or social phenomena. it can. That is, in the present invention, the estimated amount of f (t) can be estimated effectively, and as a result, a good predicted value can be obtained without assuming a distribution of predicted values such as financial product prices.

Claims (5)

目的とする現象の変動数値の将来における予測範囲を、予測前に継続的に観測して得られる数値列から予測する変動数値予測システムであって、
目的とする現象の数値を継続的に観測して得られる数値列を、…、x-m-r、x-m-r+1、…、x-1、x0、x1、x2、…とするとき、予測開始時点の値をx0、その前の値をx-1、…、そのm+r-1前の値をx-m-r+1とおいて、
Figure 2011107782
を計算し、元データとしてx-1、…、x-mを作成する元データ作成手段と、
前記元データ作成手段により作成された元データに統計理論のブートストラップ法を適用して、前記元データの中から無作為復元抽出法でn(≦m)個のデータをリサンプルし、このリサンプルの操作をB回(Bは正の整数)行って得られたB組のリサンプルを用いて、予め与えられた信頼係数の回帰関数の各点における信頼区間を算出し、該信頼区間の上限及び下限をそれぞれ結んで回帰関数の信頼帯を求め、得られた回帰関数に予測日時を入力して、得られた信頼帯を使って予測値の信頼区間を算出する信頼区間算出手段とを備え、
得られた予測値の信頼区間を変動数値の未来における予測範囲として出力することを特徴とする変動数値予測システム。
A fluctuation numerical prediction system that predicts a future prediction range of a fluctuation value of a target phenomenon from a numerical sequence obtained by continuously observing before prediction,
The numerical sequence obtained by continuously observing the numerical value of the target phenomenon is as follows: x -mr , x -m-r + 1 , ..., x -1 , x 0 , x 1 , x 2 , ... When the prediction start point value is x 0 , the previous value is x −1 ,..., The m + r−1 previous value is x −m−r + 1 ,
Figure 2011107782
And original data creating means for creating x −1 ,..., X -m as original data,
A statistical theory bootstrap method is applied to the original data created by the original data creating means, and n (≦ m) data are resampled from the original data by a random restoration extraction method. Using the B sets of resamples obtained by performing the sample operation B times (B is a positive integer), a confidence interval at each point of the regression function of a given confidence coefficient is calculated. A confidence interval calculation means for calculating a confidence band of a regression function by connecting an upper limit and a lower limit, inputting a prediction date and time to the obtained regression function, and calculating a confidence interval of the predicted value using the obtained confidence band; Prepared,
A fluctuation numerical prediction system, wherein the confidence interval of the obtained prediction value is output as a prediction range in the future of the fluctuation numerical value.
目的とする現象の変動数値が継続的に観測され、現時点までに得られた数値列から、
未知の定数を含むxのp次多項式、
f(x) = a0 + a1x + a2x2 + … + apxpを用いて、将来の前記現象の数値範囲を予測する変動数値予測システムであって、
目的とする現象の数値を継続的に観測して得られる数値列を、…、x-m-r、x-m-r+1、…、y-1、y0、y1、y2、…とするとき、予測開始時点の値をy0、その前の値をy-1、…、そのm+r-1前の値をy-m-r+1とおいて、
Figure 2011107782
を計算し、元データとして2次元データ(1,y1)、(2,y2)、…、(m,ym)を生成する手段と、
前記元データを用いて未知の定数a0、a1、…、apの推定値、
Figure 2011107782
を計算する手段と、
前記元データの中から無作為復元抽出法でm個のデータ、
Figure 2011107782
をリサンプルし、このリサンプルしたm個のデータを使って未知の定数a1、a2、…、apの推定値、
Figure 2011107782
を計算する操作をn回(nは正の整数)繰り返して、p行n列の値、
Figure 2011107782
を作成する手段と、
各行の平均値、
Figure 2011107782
と標準偏差、
Figure 2011107782
とを計算し、これら平均値と標準偏差とを使って、
Figure 2011107782
を求める操作をB回(Bは正の整数)行って、p行B列の値、
Figure 2011107782
を作成する手段と、
各行の標準偏差、
Figure 2011107782
を計算して、信頼係数(1-α)に対して、正の数uの整数部分を表す記号[u]を用いて、Z1,1、 Z1,2、…、Z1,Bを大きさの順に並べて、小さい方からαB/2番目のZ1,αB/2の値をZ1,α、(1-α/2)B番目のZ1,(1-α/2)Bの値をZ1,1-α、標準正規分布の上裾の面積が(1-α/2)になる値をz1-α/2とおくとき、実数c,dの内小さくない方を表す記号max(c,d)を用いて、
Figure 2011107782
ならば、a1の信頼区間を、
Figure 2011107782
また上の条件が成り立たない場合は、a1の信頼区間を、
Figure 2011107782
とし、a2、a3、…、apの信頼区間、
Figure 2011107782
も同様に計算して、
x = (1 + 2+ … + m)/mとおくときa0の信頼区間を、
Figure 2011107782
および
Figure 2011107782
と決定する手段と、
予測に使う関数の下限、上限を、
Figure 2011107782
として、この関数からt日後における予測値の下限及び上限として、
Figure 2011107782
を計算して、その結果を記憶する手段と、
上記処理をq回(qは正の整数)繰り返してその都度結果を記憶し、それぞれ下限及び上限の平均値を計算してt日後における予測値の下限、上限として計算して、t日後における予測値の信頼区間を生成する手段とを有し、
得られた予測値の信頼区間を変動数値の未来における予測範囲として出力することを特徴とする変動数値予測システム。
The numerical value of fluctuation of the target phenomenon is continuously observed, and from the numerical sequence obtained so far,
A p-th order polynomial of x containing unknown constants,
f (x) = a 0 + a 1 x + a 2 x 2 +… + a p x p , a fluctuating numerical prediction system that predicts the numerical range of the phenomenon in the future,
The numerical sequence obtained numerical phenomena of interest continuously observed by, ..., x -mr, x -m -r + 1, ..., y -1, y 0, y 1, y 2, ... a When the prediction start time value is y 0 , the previous value is y −1 ,..., And the previous m + r−1 value is y −m−r + 1 .
Figure 2011107782
To generate two-dimensional data (1, y 1 ), (2, y 2 ), ..., (m, y m ) as original data;
Estimated values of unknown constants a 0 , a 1 ,..., A p using the original data,
Figure 2011107782
A means of calculating
M data from the original data by random restoration extraction method,
Figure 2011107782
, And using the resampled m pieces of data, the estimated values of unknown constants a 1 , a 2 , ..., a p ,
Figure 2011107782
The operation of calculating n is repeated n times (n is a positive integer), the value of p rows and n columns,
Figure 2011107782
And a means to create
The average value for each row,
Figure 2011107782
And standard deviation,
Figure 2011107782
And using these mean and standard deviation,
Figure 2011107782
, B times (B is a positive integer)
Figure 2011107782
And a means to create
Standard deviation for each row,
Figure 2011107782
The calculated relative confidence factor (1-alpha), with the symbol [u] represents an integer portion of a positive number u, Z 1,1, Z 1,2, ..., the Z 1, B Arrange in order of size , the αB / 2th Z 1, αB / 2 values from the smallest to Z 1, α , (1-α / 2) Bth Z 1, (1-α / 2) B When the value is Z 1,1-α , and the value where the area of the upper tail of the standard normal distribution is (1-α / 2) is z 1-α / 2 , it represents the lesser of the real numbers c and d Using the symbol max (c, d),
Figure 2011107782
Then the confidence interval for a 1
Figure 2011107782
If the above condition does not hold, the confidence interval of a 1 is
Figure 2011107782
And a confidence interval of a 2 , a 3 , ..., a p ,
Figure 2011107782
Is calculated in the same way,
a confidence interval of a 0 when you put the x = (1 + 2+ ... + m) / m,
Figure 2011107782
and
Figure 2011107782
Means to determine,
The lower and upper limits of the function used for prediction
Figure 2011107782
As the lower limit and upper limit of the predicted value after t days from this function,
Figure 2011107782
Means for calculating and storing the result;
Repeat the above process q times (q is a positive integer), store the results each time, calculate the lower limit and upper limit average values respectively, calculate the lower limit and upper limit of the predicted value after t days, and predict after t days Means for generating confidence intervals for the values,
A fluctuation numerical prediction system, wherein the confidence interval of the obtained prediction value is output as a prediction range in the future of the fluctuation numerical value.
請求項1又は2に記載の変動数値予測システムをコンピュータ・システムに実現させることができるプログラムを格納した記憶媒体。   A storage medium storing a program capable of causing a computer system to realize the fluctuating numerical value prediction system according to claim 1. 請求項1又は2に記載の変動数値予測システムをコンピュータ・システムに実現させることができるプログラム。   The program which can make a computer system implement | achieve the fluctuation | variation numerical value prediction system of Claim 1 or 2. 目的とする現象の変動数値が継続的に観測され、現時点までに得られた数値列から、
未知の定数を含むxのp次多項式、
f(x) = a0 + a1x + a2x2 + … + apxpを用いて、将来の前記現象の数値範囲を予測する変動数値予測方法であって、
目的とする現象の数値を継続的に観測して得られる数値列を、…、x-m-r、x-m-r+1、…、y-1、y0、y1、y2、…とするとき、予測開始時点の値をy0、その前の値をy-1、…、そのm+r-1前の値をy-m-r+1とおいて、
Figure 2011107782
を計算し、元データとして2次元データ(1,y1)、(2,y2)、…、(m,ym)を生成するステップと、
前記元データを用いて未知の定数a0、a1、…、apの推定値、
Figure 2011107782
を計算するステップと、
前記元データの中から無作為復元抽出法でm個のデータ、
Figure 2011107782
をリサンプルし、このリサンプルしたm個のデータを使って未知の定数a1、a2、…、apの推定値、
Figure 2011107782
を計算する操作をn回(nは正の整数)繰り返して、p行n列の値、
Figure 2011107782
を作成するステップと、
各行の平均値、
Figure 2011107782
と標準偏差、
Figure 2011107782
とを計算し、これら平均値と標準偏差とを使って、
Figure 2011107782
を求める操作をB回(Bは正の整数)行って、p行B列の値、
Figure 2011107782
を作成するステップと、
各行の標準偏差、
Figure 2011107782
を計算して、信頼係数(1-α)に対して、正の数uの整数部分を表す記号[u]を用いて、Z1,1、 Z1,2、…、Z1,Bを大きさの順に並べて、小さい方からαB/2番目のZ1,αB/2の値をZ1,α、(1-α/2)B番目のZ1,(1-α/2)Bの値をZ1,1-α、標準正規分布の上裾の面積が(1-α/2)になる値をz1-α/2とおくとき、実数c,dの内小さくない方を表す記号max(c,d)を用いて、
Figure 2011107782
ならば、a1の信頼区間を、
Figure 2011107782
また上の条件が成り立たない場合は、a1の信頼区間を、
Figure 2011107782
とし、a2、a3、…、apの信頼区間、
Figure 2011107782
も同様に計算して、
x = (1 + 2+ … + m)/mとおくときa0の信頼区間を、
Figure 2011107782
および
Figure 2011107782
と決定するステップと、
予測に使う関数の下限、上限を、
Figure 2011107782
として、この関数からt日後における予測値の下限及び上限として、
Figure 2011107782
を計算して、その結果を記憶するステップと、
上記処理をq回(qは正の整数)繰り返してその都度結果を記憶し、それぞれ下限及び上限の平均値を計算してt日後における予測値の下限、上限として計算して、t日後における予測値の信頼区間を生成するステップとを有し、
得られた予測値の信頼区間を変動数値の未来における予測範囲として出力することを特徴とする変動数値予測方法。
The numerical value of fluctuation of the target phenomenon is continuously observed, and from the numerical sequence obtained so far,
A p-th order polynomial of x containing unknown constants,
f (x) = a 0 + a 1 x + a 2 x 2 +… + a p x p , a fluctuating numerical prediction method for predicting the numerical range of the phenomenon in the future,
The numerical sequence obtained by continuously observing the numerical value of the target phenomenon is, ..., x -mr , x -m-r + 1 , ..., y -1 , y 0 , y 1 , y 2 , ... When the prediction start time value is y 0 , the previous value is y −1 ,..., And the previous m + r−1 value is y −m−r + 1 .
Figure 2011107782
Calculating two-dimensional data (1, y 1 ), (2, y 2 ),..., (M, y m ) as original data;
Estimated values of unknown constants a 0 , a 1 ,..., A p using the original data,
Figure 2011107782
A step of calculating
M data from the original data by random restoration extraction method,
Figure 2011107782
, And using the resampled m pieces of data, the estimated values of unknown constants a 1 , a 2 , ..., a p ,
Figure 2011107782
The operation of calculating n is repeated n times (n is a positive integer), the value of p rows and n columns,
Figure 2011107782
The steps of creating
The average value for each row,
Figure 2011107782
And standard deviation,
Figure 2011107782
And using these mean and standard deviation,
Figure 2011107782
Is performed B times (B is a positive integer), the value of p rows and B columns,
Figure 2011107782
The steps of creating
Standard deviation for each row,
Figure 2011107782
The calculated relative confidence factor (1-alpha), with the symbol [u] represents an integer portion of a positive number u, Z 1,1, Z 1,2, ..., the Z 1, B Arrange in order of size , the αB / 2th Z 1, αB / 2 values from the smallest to Z 1, α , (1-α / 2) Bth Z 1, (1-α / 2) B When the value is Z 1,1-α , and the value where the area of the upper tail of the standard normal distribution is (1-α / 2) is z 1-α / 2 , it represents the lesser of the real numbers c and d Using the symbol max (c, d),
Figure 2011107782
Then, the confidence interval of a1 is
Figure 2011107782
If the above condition does not hold, the confidence interval of a 1 is
Figure 2011107782
And a confidence interval of a 2 , a 3 , ..., a p ,
Figure 2011107782
Is calculated in the same way,
a confidence interval of a 0 when you put the x = (1 + 2+ ... + m) / m,
Figure 2011107782
and
Figure 2011107782
A step of determining
The lower and upper limits of the function used for prediction
Figure 2011107782
As the lower limit and upper limit of the predicted value after t days from this function,
Figure 2011107782
Calculating and storing the result;
Repeat the above process q times (q is a positive integer), store the results each time, calculate the average value of the lower limit and upper limit respectively, calculate the lower limit and upper limit of the predicted value after t days, and predict after t days Generating a confidence interval for the value;
A variation numerical prediction method, wherein the confidence interval of the obtained prediction value is output as a prediction range in the future of the variation numerical value.
JP2009259343A 2009-11-12 2009-11-12 Fluctuation numerical prediction system and fluctuation numerical prediction method Expired - Fee Related JP5543177B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009259343A JP5543177B2 (en) 2009-11-12 2009-11-12 Fluctuation numerical prediction system and fluctuation numerical prediction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009259343A JP5543177B2 (en) 2009-11-12 2009-11-12 Fluctuation numerical prediction system and fluctuation numerical prediction method

Publications (2)

Publication Number Publication Date
JP2011107782A true JP2011107782A (en) 2011-06-02
JP5543177B2 JP5543177B2 (en) 2014-07-09

Family

ID=44231211

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009259343A Expired - Fee Related JP5543177B2 (en) 2009-11-12 2009-11-12 Fluctuation numerical prediction system and fluctuation numerical prediction method

Country Status (1)

Country Link
JP (1) JP5543177B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013084057A (en) * 2011-10-06 2013-05-09 Nippon Steel & Sumitomo Metal Management method for product quality and management device for product quality
JP2014232506A (en) * 2013-05-30 2014-12-11 日産自動車株式会社 Arithmetic device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185213A (en) * 1997-09-02 1999-03-30 N K S Kk Prediction method for time sequence continuous data, control method using the same and record medium
JP2007122592A (en) * 2005-10-31 2007-05-17 Toshiba Corp System, method and program for supporting wholesale merchandise market bidding price setting

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185213A (en) * 1997-09-02 1999-03-30 N K S Kk Prediction method for time sequence continuous data, control method using the same and record medium
JP2007122592A (en) * 2005-10-31 2007-05-17 Toshiba Corp System, method and program for supporting wholesale merchandise market bidding price setting

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200900540002; 石川 真吾: '軌道不安定性と長期記憶性を考慮した先物為替レート予測' 日本経営工学会論文誌 Vol.60 No.4, 20091015, pp.227-236 *
JPN6014002125; 石川 真吾: '軌道不安定性と長期記憶性を考慮した先物為替レート予測' 日本経営工学会論文誌 Vol.60 No.4, 20091015, pp.227-236 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013084057A (en) * 2011-10-06 2013-05-09 Nippon Steel & Sumitomo Metal Management method for product quality and management device for product quality
JP2014232506A (en) * 2013-05-30 2014-12-11 日産自動車株式会社 Arithmetic device

Also Published As

Publication number Publication date
JP5543177B2 (en) 2014-07-09

Similar Documents

Publication Publication Date Title
US8166387B2 (en) DataGrid user interface control with row details
US9442475B2 (en) Method and system to unify and display simulation and real-time plant data for problem-solving
US8219435B2 (en) Determining task status based upon identifying milestone indicators in project-related files
US11042823B2 (en) Business management system
Lippiello et al. Parameter estimation in the ETAS model: Approximations and novel methods
JP2007317082A (en) Recommendation device, recommendation method, recommendation program, and recording medium for recording this program
US20100145668A1 (en) Method for dynamic repartitioning in adaptive mesh processing
Hicks et al. A methodology for evaluating technology readiness during product development
JP2007323315A (en) Cooperative filtering method, cooperative filtering device, cooperative filtering program and recording medium with the same program recorded thereon
JP6012860B2 (en) Work time estimation device
Gürel et al. Rescheduling with controllable processing times for number of disrupted jobs and manufacturing cost objectives
JP5543177B2 (en) Fluctuation numerical prediction system and fluctuation numerical prediction method
Dahabreh et al. A review of validation and calibration methods for health care modeling and simulation
US20100030732A1 (en) System and method to create process reference maps from links described in a business process model
JP5077427B2 (en) Measure selection program, measure selection device, and measure selection method
WO2012053059A1 (en) Design support system
JP5506470B2 (en) Test design / interpretation methods, equipment, and programs for censored life or censored strength tests
Borsuk et al. Uncertainty, imprecision, and the precautionary principle in climate change assessment
JP2015187773A (en) Data analysis device, data analysis program, and data analysis method
JP6617605B2 (en) Demand amount prediction program, demand amount prediction method, and information processing apparatus
CN114445044A (en) Court execution checking and controlling case processing method and device combining RPA and AI
Wang et al. Performance evaluation of resource allocation strategies for new product development under different workload scenarios
JP2021089591A (en) Project management system, project management method, and program
Blažević et al. Modelling regional economic development
JP2008217356A (en) Measures selection program, device, and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140325

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140508

R150 Certificate of patent or registration of utility model

Ref document number: 5543177

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees