JP2001175735A - Device, system and method for predicting time series and storage medium - Google Patents

Device, system and method for predicting time series and storage medium

Info

Publication number
JP2001175735A
JP2001175735A JP35980999A JP35980999A JP2001175735A JP 2001175735 A JP2001175735 A JP 2001175735A JP 35980999 A JP35980999 A JP 35980999A JP 35980999 A JP35980999 A JP 35980999A JP 2001175735 A JP2001175735 A JP 2001175735A
Authority
JP
Japan
Prior art keywords
time
series
feature
prediction
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP35980999A
Other languages
Japanese (ja)
Inventor
Hiroto Yoshii
裕人 吉井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP35980999A priority Critical patent/JP2001175735A/en
Publication of JP2001175735A publication Critical patent/JP2001175735A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

PROBLEM TO BE SOLVED: To predict future data by fetching reproducibility and future predictability from time series having strong nonlinearity. SOLUTION: A characteristic extraction processing 12 acquires the characteristic of a time series concerned from past time series data 11. Regression tree preparation processing 13 prepares a regression tree 14 on the basis of acquired characteristic quantity. Meanwhile, characteristic extraction processing 16 acquires characteristic quantity from the current time series data 15 by using the same algorithm as that of the processing 12. Future prediction processing 17 calculates a future predicted value 18 by tracing the regression tree 14 by using the characteristic quantity acquired by the processing 16.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は例えば株式市場の値
動きといった、非線形性の強い時系列を予測する時系列
予測装置及びシステム及び方法及び記憶媒体に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a time series prediction apparatus, system, method, and storage medium for predicting a time series having a strong nonlinearity such as a stock market price movement.

【0002】[0002]

【従来の技術】一般に時系列といえば、物理現象から得
られる変量を時刻順に並べて得られる時系列を意味して
いた。そして、その解析の中心的な方法は線形回帰分析
と呼ばれる方法であった。この方法は過去のデータから
未来のデータを予測する際に、その関係が線形関数で近
似できるという理論に基づいている。さらに、最近は経
済現象も時系列の一種だと解釈して、色々な経済指数を
予測するアルゴリズムも登場してきた。
2. Description of the Related Art In general, a time series means a time series obtained by arranging variables obtained from physical phenomena in chronological order. And the central method of the analysis was a method called linear regression analysis. This method is based on the theory that when predicting future data from past data, the relationship can be approximated by a linear function. In addition, recently, algorithms that interpret economic phenomena as a kind of time series and predict various economic indices have appeared.

【0003】現在、例えば「適応的モデルによる経済時
系列分析」(杉原 敏夫著、工学図書株式会社ISBN4-76
92-0369-1 C3058)にあるように、経済時系列の予測を
カルマンフィルターやニューラルネットといったアルゴ
リズムを用いて行う方法が提案されている。これらの方
法は時系列のある程度の非線形性にも対応でき、例えば
“日本国内における電力需要の時系列”といったデータ
に対しては非常に良い予測性能を発揮していた。
[0003] At present, for example, "Economic time series analysis by adaptive model" (Toshio Sugihara, Engineering Book Co., Ltd. ISBN4-76)
92-0369-1 C3058), there has been proposed a method of predicting an economic time series using an algorithm such as a Kalman filter or a neural network. These methods can cope with a certain degree of nonlinearity in the time series, and have demonstrated very good prediction performance for data such as "time series of power demand in Japan".

【0004】[0004]

【発明が解決しようとする課題】しかしながら、従来の
技術によれば、例えば株式市場の個々の銘柄の値動きと
いったような非線形性の非常に強い時系列には、予測性
能が著しく落ちてしまうという問題が存在した。
However, according to the conventional technique, the prediction performance is significantly reduced in a time series having a very strong nonlinearity such as a price movement of each stock in a stock market. There was.

【0005】経済現象の中に現れてくる時系列は、経済
システムそのものが複雑なこともあり、単純な構造を持
ったものは稀である。現在、その多くは全くランダムな
時系列過程だという扱いで確率的解析が行われている。
ところが、一見ランダムに見れる時系列に何らかの再現
性があって、それを抽出することが出来得るならば、そ
の方法は非常に大きな価値があるわけである。
[0005] The time series that appears in economic phenomena is that the economic system itself is complicated and rarely has a simple structure. At present, probabilistic analysis is being performed, treating most of them as completely random time series processes.
However, if the seemingly random time series has some reproducibility and it can be extracted, the method is of great value.

【0006】本発明は上記の問題に鑑みてなされたもの
であり、その目的とするところは、非線形性の強い時系
列から再現性・未来予測性を取り出し、未来のデータを
予測可能とすることにある。
SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and an object thereof is to extract reproducibility and future predictability from a time series having a strong nonlinearity so that future data can be predicted. It is in.

【0007】[0007]

【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様による時系列予測装置は例えば以下
の構成を備える。すなわち、過去の時系列データから当
該時系列の特徴を取得する特徴取得手段と、前記特徴取
得手段で取得された特徴量を元に回帰木を作成する作成
手段と、前記特徴取得手段と同じアルゴリズムを用いて
現在の時系列データから特徴量を取得する現時系列特徴
取得手段と前記現時系列特徴取得手段で取得された特徴
量と、前記作成手段で作成された回帰木とを用いて将来
の予測値を求める予測手段とを備える。
Means for Solving the Problems A time series prediction apparatus according to an aspect of the present invention for achieving the above object has, for example, the following configuration. That is, a feature acquiring unit that acquires a feature of the time series from past time-series data, a creating unit that creates a regression tree based on the feature amount acquired by the feature acquiring unit, and an algorithm that is the same as the feature acquiring unit. The present time series feature acquisition means for acquiring a feature quantity from the current time series data using the feature quantity acquired by the current time series feature acquisition means, and the future prediction using the regression tree created by the creation means Prediction means for obtaining a value.

【0008】また、上記の目的を達成するための本発明
の態様による時系列予測システムは、上記時系列予測装
置と、前記時系列予測装置によって取得された予測値を
他の情報処理装置へ配信する配信手段とを備える。
A time series prediction system according to an aspect of the present invention for achieving the above object distributes the above time series prediction apparatus and a prediction value obtained by the time series prediction apparatus to another information processing apparatus. And distribution means for performing the distribution.

【0009】[0009]

【発明の実施の形態】以下、添付の図面に基づいて本発
明の好適な一実施形態を説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A preferred embodiment of the present invention will be described below with reference to the accompanying drawings.

【0010】図1は実施形態による時系列予測システム
を最もよく表す図である。本システムは学習フェーズと
予測フェーズの2段階のフェーズからなっている。学習
フェーズにおいて、11は過去の時系列データ、12は
過去の時系列データ11から特徴量を抽出する特徴抽出
処理、13は特徴抽出処理12より得られた特徴量を用
いて回帰木を作成する回帰木作成処理、14は回帰木作
成処理13で得られた「回帰木」である。学習フェーズ
におけるインプットは過去の時系列データ11で、アウ
トプットは回帰木14となる。
FIG. 1 is a diagram best representing a time-series prediction system according to an embodiment. This system has two phases, a learning phase and a prediction phase. In the learning phase, reference numeral 11 denotes past time-series data, 12 denotes a feature extraction process for extracting a feature amount from the past time-series data 11, and 13 denotes a regression tree using the feature amount obtained from the feature extraction process 12. The regression tree creation process 14 is the “regression tree” obtained in the regression tree creation process 13. The input in the learning phase is the past time-series data 11, and the output is the regression tree 14.

【0011】予測フェーズにおいて、15は現在の時系
列データ、16は現在の時系列データ15より特徴量を
算出する現時系列特徴抽出処理、17は現特徴量抽出処
理16スと回帰木14とを用いて将来の時系列値を予測
する将来予測処理17、18は将来予測処理17より得
られた予測値である。予測フェーズにおけるインプット
は現在の時系列データ15で、アウトプットは予測値1
8となる。
In the prediction phase, 15 is current time series data, 16 is current time series feature extraction processing for calculating feature values from the current time series data 15, and 17 is current feature value extraction processing 16 and regression tree 14. The future prediction processes 17 and 18 for predicting a future time-series value by using these are prediction values obtained from the future prediction process 17. The input in the prediction phase is the current time-series data 15, and the output is the predicted value 1
It becomes 8.

【0012】図1において重要なことは、一般に週去の
時系列データは非常に膨大になることである。よって、
特徴抽出処理12より得られた特徴量が回帰木作成処理
13に入力される際、非常に大きな回数のループが回る
ことになる。
What is important in FIG. 1 is that the time series data of the past week is generally very large. Therefore,
When the feature amount obtained from the feature extraction process 12 is input to the regression tree creation process 13, a very large number of loops are performed.

【0013】また、特徴抽出処理12と現時系列特徴抽
出処理16は全く同じアルゴリズムを使用している。図
2を用いてこのアルゴリズムを詳しく説明する。
The feature extraction process 12 and the current time series feature extraction process 16 use exactly the same algorithm. This algorithm will be described in detail with reference to FIG.

【0014】図2の上に描かれているグラフはいわゆる
株価の“ローソク足”グラフである。図では20日分の
株価変動の履歴がグラフとして描かれている。グラフに
は、始値、終値、高値、安値の情報が盛り込まれてい
る。本実施形態が試みようとしている時系列予測とは、
例えば図2の上の“ローソク足”グラフが与えられた
時、明日の株価がどのようになるかを予測することにな
る。以下、株価変動を予測するシステムを実施形態とし
て本発明を説明していく。なお、もちろん時系列データ
としては日足データだけではなく、週足、年足と時間間
隔の大きな時系列データにも本発明は適用できる。
The graph depicted at the top of FIG. 2 is a so-called "candlestick" graph of stock prices. In the figure, the history of the stock price fluctuation for 20 days is drawn as a graph. The graph includes information on the opening price, closing price, high price, and low price. The time series prediction that this embodiment is trying to perform is:
For example, given the "candlestick" graph at the top of FIG. 2, it will predict what the stock price will be tomorrow. Hereinafter, the present invention will be described using a system for predicting stock price fluctuations as an embodiment. Of course, the present invention can be applied not only to daily data but also to time-series data having a large time interval between weekly and annual data.

【0015】本実施形態では、例えばある年度のある銘
柄の第1日目から第20日目までの20日間の始値、終
値、高値、安値を第1の時系列データセット、次の20
日間(第2日目から第21日目まで)の始値、終値、高
値、安値を第2の時系列データセットというように、時
系列データセットを決定する。そして、各時系列データ
セットを規格化することにより複数銘柄の全ての時系列
データセットを同じ時系列モデルとして使用する。
In the present embodiment, for example, the opening price, closing price, high price, and low price of a certain stock in a certain year from the first day to the twentieth day are described in a first time-series data set,
The time series data set is determined such that the opening price, the closing price, the high price, and the low price of the day (from the second day to the 21st day) are referred to as a second time series data set. Then, all the time series data sets of a plurality of brands are used as the same time series model by normalizing each time series data set.

【0016】まず、規格化について説明する。株式市場
には多くの銘柄が存在し、その値はまちまちである。し
かし、株価の銘柄それぞれに対して本実施形態の回帰木
を作成していたのでは、学習データが慢性的に不足して
しまう。よって、全ての銘柄を規格化して、同じ時系列
モデルであるという前提で学習を進めていく。
First, the normalization will be described. There are many stocks in the stock market, and their values vary. However, if the regression tree according to the present embodiment is created for each stock price, learning data is chronically insufficient. Therefore, all brands are standardized, and learning proceeds on the premise that they are the same time-series model.

【0017】規格化としては、規格化する時系列データ
セット(ターゲットとしているグラフ)の最終日の終値
を基準(1.0)として、当該時系列データセットの各
値段を相対値段に変換する。すなわち、各時系列データ
セット毎に、当該時系列データセットの最終日の終値で
過去20日分の始値、終値、高値、安値の各々を割って
相対値段に変換する。すると、時系列パターンの特徴量
としては、20×4=80個の実数値が得られることに
なる。
For normalization, each price of the time-series data set is converted into a relative price with the closing price of the last day of the time-series data set to be standardized (the target graph) as a reference (1.0). That is, for each time-series data set, the opening price, the closing price, the high price, and the low price for the past 20 days are divided by the closing price on the last day of the time-series data set, and converted into relative prices. Then, as the feature amount of the time-series pattern, 20 × 4 = 80 real numerical values are obtained.

【0018】本実施形態では、学習フェーズにおいて、
上記の規格化された時系列データセットを用いて、後述
する手順で回帰木を作成する。そして、予測フェーズで
は、所望の銘柄の今日を最終日とする過去20日間の規
格化された時系列データセット(現在の時系列データ1
5)を用いてその回帰木をたどり、当該所望の銘柄につ
いて、明日の株価の今日の終値に対する相対値段を予想
する。
In the present embodiment, in the learning phase,
Using the standardized time-series data set, a regression tree is created in a procedure described later. Then, in the prediction phase, a standardized time-series data set (the current time-series data 1
Tracing the regression tree using 5), and predicting the relative price of tomorrow's stock price to today's closing price for the desired stock.

【0019】このように、規格化によって、全ての銘柄
の全ての期間が学習データとして使用できることにな
り、十分大量の学習データが確保できるようになる。上
記の例を、統計の言葉を用いて言えば、「80次元の特
徴空間で記述される説明変数/1次元の被説明変数の組
が大量に学習データとして与えられた時の回帰問題を解
く課題」という問題の図式化ができることになる。
As described above, by standardization, all periods of all brands can be used as learning data, and a sufficiently large amount of learning data can be secured. The above example is described in terms of statistics, "Solving a regression problem when a large set of explanatory variables / one-dimensional explained variables described in an 80-dimensional feature space is given as learning data. The problem of "the problem" can be schematized.

【0020】上記の例では始値、終値、高値、安値の4
つの値を用いたが、出来高や季節(日付)なども特徴量
を算出するための値として使用することもできる。ま
た、上記の例では、今日(=ターゲットとしているグラ
フの最終日)の終値を基準値にしたが、最終日から遡っ
て任意の日の任意の値を基準値としてもよい。また、日
経平均株価や住宅着工件数といった統計的な経済データ
や、景気一致指数といった主観的な経済データを用いて
特徴量を算出してもよい。
In the above example, the open price, the close price, the high price, and the low price
Although the two values are used, the trading volume, season (date), and the like can also be used as values for calculating the feature amount. Further, in the above example, the closing price of today (= the last day of the targeted graph) is used as the reference value, but any value on any day retroactively from the last day may be used as the reference value. Further, the feature value may be calculated using statistical economic data such as the Nikkei Stock Average or the number of housing starts, or subjective economic data such as the economic coincidence index.

【0021】また、上記の例では、もともとの値段を基
準値となる値段で割ることによって相対値段を導いてい
たが、それの自然対数を取るなどの非線形処理を施し
て、特徴量を算出してもよい。また、例えば株価チャー
ト解析でよく用いられる“25日移動平均”などのよう
な、複数の日付にまたがるデータを変換することによっ
て導きだされる新しい特徴量を用いてもよい。
Further, in the above example, the relative price was derived by dividing the original price by the price serving as the reference value, but a non-linear process such as taking a natural logarithm thereof is performed to calculate the feature amount. You may. Further, a new feature amount derived by converting data over a plurality of dates, such as “25 day moving average” often used in stock price chart analysis, may be used.

【0022】次に図1の回帰木14について、図3を用
いて説明する。図3は本実施形態による回帰木の例を示
す図である。回帰木とは木構造を持った予測システムの
ことである。図3にある通り、回帰木は“ノード”と呼
ばれる“節”とそれらを結ぶ“枝”で構成されている。
例えば、図3の回帰木には15個のノードと14個の枝
があることになる。特に回帰木の大元のノード(図3の
0番のノード)を“ルートノード”と呼ぶ。図3におい
て、枝を持つノードは必ず2つの枝を出しているが、こ
れはいわゆる“2分木”と呼ばれる回帰木であり、一般
に枝の本数は何本でもよい。
Next, the regression tree 14 in FIG. 1 will be described with reference to FIG. FIG. 3 is a diagram illustrating an example of a regression tree according to the present embodiment. A regression tree is a prediction system with a tree structure. As shown in FIG. 3, the regression tree is composed of "nodes" called "nodes" and "branches" connecting them.
For example, the regression tree of FIG. 3 has 15 nodes and 14 branches. In particular, the origin node (node 0 in FIG. 3) of the regression tree is called a “root node”. In FIG. 3, although a node having a branch always outputs two branches, this is a regression tree called a so-called "binary tree", and in general, the number of branches may be any.

【0023】枝でつながれたノードには親子関係があ
り、例えば、「ルートノードの子ノードは1番と6番の
ノードであり、また、1番と6番のノードの親がルート
ノードである」という。子ノードを持たないノードは、
リーフノードと呼ぶ。なお、リーフノードの特別な例と
してヌルノードがある。なお、ヌルノードの定義は後で
詳しく述べる。また、2分木の回帰木にはヌルノードは
存在し得ない。
Nodes connected by branches have a parent-child relationship. For example, "child nodes of the root node are the first and sixth nodes, and the parent of the first and sixth nodes is the root node. " Nodes without child nodes are
Call it a leaf node. A special example of a leaf node is a null node. The definition of the null node will be described later in detail. In addition, a null node cannot exist in a regression tree of a binary tree.

【0024】リーフノード以外のノードを“インターナ
ルノード’と呼ぶ。インターナルノードには、枝分かれ
をするための条件式がある。例えば図2の株式データ予
測を例にすると、ルートノードでは「2日前の始値が今
日の終値に対して0.85以上ならば1番のノード、そ
れ以外なら6番のノード」というような条件になる。こ
の子ノードに枝分かれするための条件を“ノード分岐条
件”と呼ぶ。週去の時系列データを元に、ノード分岐条
件を作成していくのが学習フェーズであり、ノード分岐
条件に従って現在の時系列データを分類していくのが予
測フェーズとなる。
Nodes other than leaf nodes are called "internal nodes." The internal nodes have conditional expressions for branching. For example, in the case of stock data prediction in FIG. If the opening price of the previous day is 0.85 or more of the closing price of the current day, the first node, otherwise, the sixth node ". The condition for branching to the child node is called a “node branch condition”. The learning phase is to create node branch conditions based on the time series data of the last week, and the prediction phase is to classify the current time series data according to the node branch conditions.

【0025】学習フェーズにおいては、ノード分岐条件
を作っていくと同時に、過去の時系列データそのものも
分類されていく。すなわち、規格化された時系列データ
セットを単位として、インターナルノードへの分割が行
われていく。ルートノードでは全ての過去のデータが残
っているが、インターナルノードを作成していくに従っ
て、どんどん条件が厳しくなり、残る時系列データセッ
トは少なくなっていく。そして、新しく出来た子ノード
に全く過去の時系列データセットがなくなると、そのノ
ードをヌルノードとする。リーフノードとは、ある条件
を満たすノードで、その条件が満たされるとそれ以上子
ノードは作らない。この条件のことを“リーフノード成
立条件”と呼ぶ。リーフノード成立条件としては、「残
っている過去のデータがある数より小さくなる」とか
「残っている過去のデータの予測値(本実施形態では、
各時系列データセットの最終日の翌日における当該銘柄
の実際の株価)の分散がある値より小さくなる」などの
条件が適用される。
In the learning phase, past time-series data itself is classified at the same time as node branch conditions are created. That is, division into internal nodes is performed in units of a normalized time-series data set. Although all past data remains in the root node, as the internal node is created, the conditions become more and more strict and the remaining time-series data set decreases. Then, when there is no past time-series data set in the newly created child node, the node is set as a null node. A leaf node is a node that satisfies a certain condition. When the condition is satisfied, no further child nodes are created. This condition is called "leaf node establishment condition". The conditions for establishing a leaf node include “remaining past data becomes smaller than a certain number” or “predicted value of remaining past data (in the present embodiment,
The variance of the actual stock price of the stock on the day after the last day of each time-series data set becomes smaller than a certain value. "

【0026】学習フェーズにおいて、ヌルノード以外の
任意のノードには過去のデータが残っている。あるノー
ドに残っている過去のデータの予測値の相加平均・相乗
平均・中央値などの代表値をそのノードの予測値とす
る。特にルートノードに付随する予測値は、過去の時系
列データ全ての予測値の代表値(平均)となる。ヌルノ
ードに付随する予測値は、親ノードに付随する予測値と
することによって、全てのノードに予測値が割り振られ
ることになる。例えば図3の回帰木では、ノードの右側
に書かれている数字がこのノードに付随する予測値を示
す。
In the learning phase, past data remains at any node other than the null node. A representative value such as an arithmetic mean, a geometric mean, or a median of the predicted values of the past data remaining in a certain node is set as the predicted value of the node. In particular, the predicted value associated with the root node is a representative value (average) of the predicted values of all past time-series data. By setting the predicted value associated with the null node as the predicted value associated with the parent node, the predicted value is allocated to all nodes. For example, in the regression tree of FIG. 3, a number written on the right side of a node indicates a predicted value associated with this node.

【0027】予測フェーズにおいては、それぞれのノー
ド分岐条件に基づいてルートノードからノードをたどっ
ていくことになる。この時、たどっていったノードに付
随する予測値が、現在の時系列データの予測値となる。
例えば、現在の時系列データを図3の回帰木を使ってた
どった時、0番1番3番4番という結果になれば、予測
値は1.2/1.5/1.3/1.1ということにな
る。結局、現在の時系列データの未来値として、たどっ
た階層分の予測値がえられることになる。
In the prediction phase, nodes are traced from the root node based on each node branch condition. At this time, the predicted value associated with the traced node becomes the predicted value of the current time-series data.
For example, when the current time-series data is traced using the regression tree of FIG. 3, if the result is 0, 1, 3, 4, the predicted value is 1.2 / 1.5 / 1.3 / 1. .1. As a result, as the future value of the current time-series data, the predicted value of the traced hierarchy is obtained.

【0028】一般に回帰木の階層が深くなれば深くなる
ほど、この予測値は精度が高くなる。従って、上記の例
では、一番深い階層における予測値である1.1を当該
時系列データに対する予測値とすればよい。しかしなが
ら、階層がある深さを過ぎると、かえって予測値が不正
確になることがある。この現象は、過去の時系列データ
の“過学習”と呼ばれる現象である。このことを防止す
るために、「最後からn番目のノードの予測値を現在の
時系列データの予測値とする」というようなことをする
こともある。この処理はいわゆる“回帰木の技刈り”と
呼ばれる処理であるが、ターゲットとしている時系列パ
ターンが本質的にランダムな現象を含む場合、特に有効
となる。
In general, the deeper the hierarchy of the regression tree, the higher the accuracy of this predicted value. Therefore, in the above example, 1.1, which is the predicted value in the deepest hierarchy, may be used as the predicted value for the time-series data. However, beyond a certain depth in the hierarchy, the predicted values may be inaccurate. This phenomenon is a phenomenon called “over-learning” of past time-series data. In order to prevent this, there may be a case where “the predicted value of the nth node from the end is used as the predicted value of the current time-series data”. This processing is a so-called “regression tree cutting”, and is particularly effective when the target time-series pattern includes an essentially random phenomenon.

【0029】次に図1の回帰木作成処理13について、
図4のフローチャートを用いて説明する。回帰木作成処
理13においては、回帰木のノードを再帰的プログラム
という方法で作成する。例えば図3の回帰木でいえば、
ノードに割り振られた番号の順でノードが作成されてい
く。回帰木作成処理13には“当該ノード”(curentnod
e)という概念があり、そのノードを中心にフローチャ
ートは回る。
Next, the regression tree creation processing 13 in FIG.
This will be described with reference to the flowchart of FIG. In the regression tree creation processing 13, nodes of the regression tree are created by a method called a recursive program. For example, in the regression tree of FIG.
Nodes are created in the order of the numbers assigned to the nodes. The “relevant node” (curentnod
There is the concept of e), and the flowchart turns around that node.

【0030】まず、ルートノードを当該ノードとする
(ステップS401)。次に、当該ノードの分岐条件の
決定を行う(ステップS402)。なお、分岐条件の決
定方法については後に詳しく説明する。分岐条件が決定
されたら、子ノード作成のループ(ステップS403)
によって、その分岐条件に従って当該ノードに属する過
去の時系列パターンを分割していく。例えば、回帰木が
2分木だったら、当該ノードで残っている過去の時系列
パターンが2つに分割されることになる。
First, the root node is set as the node concerned (step S401). Next, the branch condition of the node is determined (step S402). The method for determining the branch condition will be described later in detail. When the branch condition is determined, a loop for creating a child node (step S403)
Divides the past time-series pattern belonging to the node according to the branch condition. For example, if the regression tree is a binary tree, the past time-series pattern remaining at the node is divided into two.

【0031】ステップS404以下はループ処理とな
る。まず、ステップS404で当該ノードの次の子ノー
ドを当該ノードとする。但し、ループの最初では、一番
目の子ノードを当該ノードとする。ステップS404の
処理は、上記の過去の時系列データの分割の処理も含
む。その結果、過去の時系列データが全く残らなけれ
ば、すなわち、当該ノードがヌルノードであれば(ステ
ップS405)ヌルノードの確定(ステップS406)
を行い、ループの終了判定(ステップS409)に進
む。
The process from step S404 is a loop process. First, in step S404, the next child node of the node is set as the node. However, at the beginning of the loop, the first child node is the node. The process of step S404 includes the above-described process of dividing the past time-series data. As a result, if no past time-series data remains, that is, if the node is a null node (step S405), a null node is determined (step S406).
And the flow proceeds to loop end determination (step S409).

【0032】当該ノードがヌルノードでない場合で、リ
ーフノード成立条件を満たす場合は(ステップS40
7)、リーフノードの確定(ステップS408)を行
い、ループの終了判定(ステップS409)に進む。当
該ノードがヌルノードでもリーフノードでもない場合、
当該ノードを親ノードとして、更に深く子ノードを作っ
ていく。つまり、当該ノードのノード分岐条件の決定
(ステップS402)に戻る。
If the node is not a null node and the condition for establishing a leaf node is satisfied (step S40)
7), a leaf node is determined (step S408), and the process proceeds to loop end determination (step S409). If the node is neither a null node nor a leaf node,
With this node as a parent node, child nodes are created more deeply. That is, the process returns to the determination of the node branch condition of the node (step S402).

【0033】ステップS409のループの終了判定で
は、当該ノードの親ノードに接続されている全ての子ノ
ードについてステップS404からS408の処理を実
行した場合にループの終了とする。例えば、本実施形態
のように2分木であれば、当該ループは2回実行される
こととなる。以上のようにして子ノードを作成するルー
プ(ステップS404〜S409)が終了すると、親ノ
ードが存在するかどうかチェックする(ステップS41
0)。もし、親ノードがあれば、そのノードを当該ノー
ドとして(ステップS411)からステップS404へ
戻り、次の子ノードを当該ノードとする。ここで注意す
べきなのは、子ノード作成のループは終了しているの
で、当該ノードは「子ノード作成ループ」の中のノード
からみれば、親ノードに移っていることである。つま
り、ステップS410では「子ノード作成ループ」の中
のノードから見れば、親ノードの親ノードがあるかどう
かの判定を行うことになる。よって、ノード作成が進ん
でいき、ルートノードの全ての子ノードが作成される
と、ステップS410の親ノード存在判定でルートノー
ドの親ノードは存在しないので、ステップS412の回
帰木作成終了になり、プログラムは終了する。
In the loop end determination of step S409, the loop ends when the processing of steps S404 to S408 has been executed for all child nodes connected to the parent node of the node. For example, in the case of a binary tree as in the present embodiment, the loop is executed twice. When the loop for creating the child node (steps S404 to S409) ends as described above, it is checked whether or not the parent node exists (step S41).
0). If there is a parent node, the node is set as the node (step S411) and the process returns to step S404 to set the next child node as the node. It should be noted here that since the loop for creating the child node has been completed, the node has moved to the parent node when viewed from the nodes in the “child node creation loop”. That is, in step S410, from the viewpoint of the nodes in the “child node creation loop”, it is determined whether or not there is a parent node of the parent node. Therefore, the node creation proceeds, and when all the child nodes of the root node are created, the parent node of the root node does not exist in the parent node existence determination in step S410, and the regression tree creation in step S412 is completed. The program ends.

【0034】次に図4のノード分岐条件の決定(ステッ
プS402)について、図5を使って説明する。前述し
たように、ノード分岐条件は、例えば「最後から2日前
の始値が最後の日の終値に対して0.85以上ならば左
のノード、それ以外なら右のノード」というふうにな
る。回帰木が2分木の場合、一般的には、このノード分
岐条件は当該ノードに残っている過去の時系列データの
集合を2つに分けるものならば、なんでもよい(k分木
の場合は、k分割する)。過去の時系列データがn次元
の特徴量で記述されるならば、n次元の空間を分割する
ものなら、なんでもよいことになる。ノード分岐条件を
ニューラルネットを使って作成しようとすれば、この分
割を実現する面はn次元中の超曲面となる。
Next, the determination of the node branch condition (step S402) in FIG. 4 will be described with reference to FIG. As described above, the node branch condition is, for example, "the left node if the opening price two days before the last is 0.85 or more of the closing price of the last day, otherwise the right node". When the regression tree is a binary tree, in general, this node branch condition may be anything as long as the set of past time-series data remaining at the node is divided into two (in the case of a k-ary tree, , Divided by k). If the past time-series data is described by n-dimensional feature amounts, anything may be used as long as it divides the n-dimensional space. If a node branch condition is to be created using a neural network, the surface that realizes this division is a hypersurface in n dimensions.

【0035】しかしながら、個々のノードでニューラル
ネットを使って学習させるのは非常にコストがかかる。
よって、通常は超平面を使用して分割を行う。また、超
平面で当該ノードに残っている過去の時糸列データを分
割するといっても、特徴量の次元が大きくなってくる
と、超平面の法線ベクトルの自由度は急激に上がってき
て、学習コストが大きくなってくる。
However, it is very costly to train each node using a neural network.
Therefore, division is usually performed using a hyperplane. Even if the past thread string data remaining at the node is divided on the hyperplane, the degree of freedom of the normal vector of the hyperplane sharply increases as the dimension of the feature increases. , The learning cost will increase.

【0036】そこで、過去の時系列データが非常に多
く、特徴量の次元が大きい場合は、特徴量の軸に垂直な
超平面に限って、ノード分岐条件(超平面)を探索する
ことがよく行われる。その様子を図に示したのが図5で
ある。
Therefore, when the past time-series data is very large and the dimension of the feature is large, it is often the case that the node branch condition (hyperplane) is searched for only the hyperplane perpendicular to the axis of the feature. Done. FIG. 5 shows this state.

【0037】51は当該ノードを示し、52と53はそ
れぞれの子ノードを示す。54のグラフは、ある特徴量
を横軸、当該ノードに残っている過去の時系列データの
分布密度を縦軸に取ったグラフである。図5にあるよう
に、間仕切りを特徴量の小さい方から大きい方へ移動し
ていった時の分割効率の良さを計算していって、もっと
も分割効率の高い位置を分割面とする。ここで述べた分
割効率とは親ノードの予測値の分散をP、子ノードの予
測値の分散をそれぞれp1,p2、子ノードで残る過去
の時系列データの個数をそれぞれn1,n2とすると、 P−{n1・p1+n2・p2}/{n1+n2} で表される数値である。上記の例ではノードに残ってい
るデータの予測値の分散を用いて分割効率を計算した
が、通常の統計学でいう分散、 1/n Σ(y−mean)2 に代えて、次の式で示される絶対分散 1/n Σ|y−median| を用いてもよい。
Reference numeral 51 denotes the node, and reference numerals 52 and 53 denote respective child nodes. The graph 54 is a graph in which a horizontal axis indicates a certain feature amount and a vertical axis indicates the distribution density of past time-series data remaining at the node. As shown in FIG. 5, good partitioning efficiency when the partition is moved from a smaller feature amount to a larger feature amount is calculated, and a position having the highest partitioning efficiency is defined as a divided surface. The division efficiency described here means that the variance of the predicted value of the parent node is P, the variance of the predicted value of the child node is p1 and p2, and the number of past time-series data remaining in the child node is n1 and n2, respectively. P− {n1 · p1 + n2 · p2} / {n1 + n2}. In the above example, the division efficiency was calculated using the variance of the predicted value of the data remaining in the node. Instead of the variance in ordinary statistics, 1 / nn (y-mean) 2 , The absolute variance 1 / nn | y-median |

【0038】以上の処理の結果、特徴量毎に最適な分割
面と、その分割面における分割効率が求められる。最後
に全ての特徴量の結果を集計し、一番、分割効率の高い
特徴量の分割を当該ノードの分岐条件とする。
As a result of the above processing, the optimum division plane for each feature amount and the division efficiency in the division plane are obtained. Finally, the results of all the feature amounts are totaled, and the division of the feature amount with the highest division efficiency is set as the branch condition of the node.

【0039】さらにノードの分岐条件を高速、かつ安定
に探索する方法を図5、図6、図7を元に説明する。図
5の54において、分割する間仕切りが極端に小さい方
や大きい方になると、子ノードで残る時系列データの個
数は、極端に子ノードのどちらかに偏ってしまうことに
なる。特徴量の軸のどこで間仕切りしてもあまり分割効
率に差がない場合、子ノードの個数の偏りは予測性能の
低下につながってしまう。また、一般に過去の時系列デ
ータにランダムな要素が多く含まれる場合、上記の間仕
切りの位置で分割効率に大差がない状況が発生しやすく
なる。この状況を避けるために、図6の61にあるよう
に当該ノードで残っている過去の時系列データの分布の
中央付近で間仕切りするように、間仕切りの仕方を制限
すると予測性能の高い回帰木ができるようになる。この
中央付近は平均値や中央値、最大値と最小値の中間値な
どの値をもとに求めることができる。さらに、この方法
を取ると間仕切りの探索範囲がずっと狭められ、ノード
分岐条件の探索時間の節約にもなる。
A method for quickly and stably searching for a branch condition of a node will be described with reference to FIGS. 5, 6, and 7. FIG. In 54 of FIG. 5, when the partition to be divided becomes extremely small or large, the number of time series data remaining in the child node is extremely biased toward one of the child nodes. If there is not much difference in the division efficiency even if the partitioning is performed on the axis of the feature amount, the bias in the number of the child nodes leads to a decrease in the prediction performance. In general, when many random elements are included in past time-series data, a situation in which there is not much difference in the division efficiency at the position of the partition tends to occur. In order to avoid this situation, if the partitioning method is restricted so as to partition around the center of the distribution of the past time-series data remaining at the node as shown at 61 in FIG. become able to. The vicinity of the center can be obtained based on values such as an average value, a median value, and an intermediate value between the maximum value and the minimum value. Furthermore, this method further narrows the search range of the partition and saves the search time for the node branch condition.

【0040】以上、説明してきたノード分岐条件の探索
は、図5にある54のような当該ノードに残った過去の
時系列データの分布密度関数が元になっている。つま
り、この分布関数はノードに固有な関数となるわけであ
る。よって、図6で示したような分布の中央も、厳密に
はノードが異なると異なってくる。しかし、ルートノー
ドでの分布を元に、各特徴量の間仕切りを予め固定して
も、予測性能にあまり影響のない場合が多い。図7にあ
るように、ルートノードに存在する(=全部の)過去の
時系列データの特徴量に対する分布密度関数を元に予め
“階層的な固定の間仕切り”をすると、特徴量が連続値
であったのが量子化された値になることと同値になる。
このことによって、メモリーの節約ばかりでなく、ノー
ド分岐条件の探索時間の大幅な削減が実現できる。
The search for the node branch condition described above is based on the distribution density function of past time-series data remaining at the node, such as 54 in FIG. That is, this distribution function is a function unique to the node. Therefore, the center of the distribution as shown in FIG. 6 also differs strictly if the nodes are different. However, even if the partition of each feature is fixed in advance based on the distribution at the root node, the prediction performance is often not significantly affected. As shown in FIG. 7, if “hierarchical fixed partitioning” is performed in advance based on the distribution density function for the feature amount of the past time series data (= all) existing at the root node, the feature amount becomes a continuous value. What is present is the same value as the quantized value.
This not only saves memory, but also significantly reduces the search time for node branch conditions.

【0041】また、以上説明してきた2分木の回帰木を
使った時系列予測システムは、全く同様に、4分木また
は一般のn分木の回帰木を使用する時系列予測システム
に適用できる。
The time series prediction system using a binary tree regression tree described above can be applied to a time series prediction system using a quadtree tree or a general n-ary tree regression tree. .

【0042】次に、本実施形態の時系列予測システムを
実現するためのハードウエア構成について説明する。
Next, a hardware configuration for realizing the time-series prediction system of the present embodiment will be described.

【0043】図8は本実施形態における時系列予測シス
テムのハードウエア構成の一例を示すブロック図であ
る。81は回線であり、電話回線や衝星回線、または専
用線などの回線を示す。回線81から現在の時系列デー
タが予測システムに入力されることになる。82はCP
Uであり、実施形態で説明した、具体的な予測システム
のプログラムを実行する。83はメモリであり、現在の
時系列データをストアしたり、プログラムの使用するテ
ンポラリーの作業領域を確保したりする働きがある。8
4のはハードディスク(HDD)であり、制御プログラ
ムや、時系列予測システムで使用する回帰木などが保存
される。最後に、85はディスプレイであり、予測結果
等の表示を含む各種表示が実行される。
FIG. 8 is a block diagram showing an example of a hardware configuration of the time-series prediction system according to this embodiment. Reference numeral 81 denotes a line, such as a telephone line, a star line, or a dedicated line. The current time-series data is input from the line 81 to the prediction system. 82 is CP
U, which executes the specific prediction system program described in the embodiment. A memory 83 stores current time-series data and secures a temporary work area used by the program. 8
A hard disk (HDD) 4 stores a control program, a regression tree used in the time-series prediction system, and the like. Finally, reference numeral 85 denotes a display on which various displays including a display of a prediction result and the like are executed.

【0044】図8で示した時系列予測システムの構成
は、本実施形態の時系列予測処理を、いわゆる“スタン
ドアロン”のアプリケーションプログラムによって実現
するものである。これに対して、予測結果をサーバーか
ら受け取り、クライアントにその結果を表示する時系列
予測システムの構成を図9に示す。図9における個々の
クライアント92、93、94の中身は図8と同様であ
るが、決定的に異なるのは、図9のクライアントマシン
92、93、94は回帰木の情報を含んでおらず、サー
バ91が回帰木を含んでいることである。
The configuration of the time-series prediction system shown in FIG. 8 realizes the time-series prediction processing of this embodiment by a so-called “stand-alone” application program. In contrast, FIG. 9 shows a configuration of a time-series prediction system that receives prediction results from a server and displays the results on a client. The contents of the individual clients 92, 93, 94 in FIG. 9 are the same as in FIG. 8, except that the client machines 92, 93, 94 in FIG. 9 do not include the information of the regression tree. That is, the server 91 includes a regression tree.

【0045】図8のディスプレイ、および、図9のクラ
イアントマシンのディスプレイに表示される画面の例を
図10に示す。予測しようとしている時系列が株価の変
動であれば、実施形態で説明した時系列予測処理によ
り、例えば、明日の値上がり期待銘柄のTOP3と明日
の値下がり期待銘柄TOP3を表示したりすることがで
きる。
FIG. 10 shows an example of a screen displayed on the display of FIG. 8 and the display of the client machine of FIG. If the time series to be predicted is a change in the stock price, the time series prediction processing described in the embodiment can display, for example, TOP3 of the expected stock price increase tomorrow and TOP3 of the expected stock price decrease tomorrow.

【0046】また、図9のクライアントサーバシステム
上で本実施形態の時系列予測システムを実現した場合、
Web等の公共の回線網を使用することが可能である。
この場合、サーバ91からクライアント92〜94への
データが非常に価値の高いものとなる。これに対してク
ライアントを操作しているユーザが代金を支払うシステ
ムが存在する。例えば図11に見られるように、ユーザ
ーのIDとパスワードを入力させることによって、ユー
ザーが予め指定した口座からお金を引き落とすようにす
るのである。また、公共の回線網を使用するため、SS
Lなどの暗証化技術を使用して、ユーザIDとパスワー
ドを安全に転送することが一般的に行われている。この
ようにすることによって、Web等の公共の回線網を使
用したクライアントサーバー環境に本実施形態の時系列
予測システムをインプリメントしても、安全確実にサー
ビスに対しての課金ができるようになる。
When the time-series prediction system according to the present embodiment is realized on the client-server system shown in FIG.
It is possible to use a public network such as the Web.
In this case, the data from the server 91 to the clients 92 to 94 becomes very valuable. On the other hand, there is a system in which a user operating a client pays the price. For example, as shown in FIG. 11, by inputting a user ID and a password, money is debited from an account designated in advance by the user. In addition, since the public network is used, SS
It is common practice to securely transfer a user ID and a password by using an encryption technique such as L. By doing so, even if the time-series prediction system of the present embodiment is implemented in a client-server environment using a public line network such as the Web, it is possible to securely charge for services.

【0047】以上説明したように、上記実施形態によれ
ば、株価等のランダム性の高い時系列データについて、
再現性を取りだし、将来の時系列データの変動を予測で
きるようになる。
As described above, according to the above embodiment, time series data with high randomness such as stock prices
You will be able to predict reproducibility and predict future changes in time series data.

【0048】また、図6及び図7を参照して説明した方
法によって回帰木の分岐条件の導出に制約を加えること
により、メモリーを節約し、かつ、高速に回帰木を作成
できるという効果もある。
Also, by adding a constraint to the derivation of the branch condition of the regression tree by the method described with reference to FIGS. 6 and 7, there is also an effect that the memory can be saved and the regression tree can be created at high speed. .

【0049】なお、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
An object of the present invention is to supply a storage medium (or a recording medium) on which a program code of software for realizing the functions of the above-described embodiments is recorded to a system or an apparatus, and to provide a computer (a computer) of the system or the apparatus. It is needless to say that the present invention can also be achieved by a CPU or an MPU) reading and executing the program code stored in the storage medium. In this case, the program code itself read from the storage medium implements the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention. Also,
When the computer executes the readout program code, not only the functions of the above-described embodiments are realized, but also the operating system (OS) running on the computer based on the instructions of the program code.
It goes without saying that a case where the functions of the above-described embodiments are implemented by performing some or all of the actual processing, and the processing performs the functions of the above-described embodiments.

【0050】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
Further, after the program code read from the storage medium is written into a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer, the program code is read based on the instruction of the program code. Needless to say, the CPU included in the function expansion card or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0051】[0051]

【発明の効果】以上説明したように、本発明によれば、
非線形性の強い時系列から再現性・未来予測性を取り出
し、未来のデータを予測することが可能となる。
As described above, according to the present invention,
It is possible to extract reproducibility and future predictability from a time series with strong nonlinearity and predict future data.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施形態の時系列予測処理を説明する図であ
る。
FIG. 1 is a diagram illustrating a time-series prediction process according to an embodiment.

【図2】本実施形態の時系列予測システムが適用される
時系列、及び時系列からの特徴抽出パターンの例を示す
図である。
FIG. 2 is a diagram showing an example of a time series to which the time series prediction system of the present embodiment is applied, and a feature extraction pattern from the time series.

【図3】本実施形態の時系列予測システムで作成される
回帰木の例を示す図である。
FIG. 3 is a diagram illustrating an example of a regression tree created by the time-series prediction system according to the embodiment.

【図4】本発明の時系列予測システムの回帰木作成処理
を示すフローチャートである。
FIG. 4 is a flowchart showing a regression tree creation process of the time series prediction system of the present invention.

【図5】回帰木作成処理におけるノード分岐条件探索の
方法を示した図である。
FIG. 5 is a diagram illustrating a method of searching for a node branch condition in a regression tree creation process.

【図6】回帰木作成処理におけるノード分岐条件探索に
おいて処理の高速化のために加えられる制限を説明する
図である。
FIG. 6 is a diagram illustrating restrictions imposed for speeding up processing in a node branch condition search in regression tree creation processing.

【図7】回帰木作成処理におけるノード分岐条件探索に
おける特徴量の量子化を説明する図である。
FIG. 7 is a diagram illustrating quantization of a feature amount in a node branch condition search in a regression tree creation process.

【図8】単独のアプリケーションプログラムとして、本
実施形態の時系列予測処理を実現するための装置構成を
示すブロック図である。
FIG. 8 is a block diagram showing a device configuration for realizing the time-series prediction processing of the present embodiment as a single application program.

【図9】クライアントサーバーシステムにおいて本実施
形態の時系列予測処理を実現する構成を示すブロック図
である。
FIG. 9 is a block diagram showing a configuration for realizing the time-series prediction processing of the embodiment in a client-server system.

【図10】本実施形態の時系列予測システムによる結果
表示画面の例を示す図である。
FIG. 10 is a diagram showing an example of a result display screen by the time-series prediction system of the embodiment.

【図11】クライアントサーバーシステムに、本時系列
予測システムをインプリメントした時に、課金に使用す
る画面例を示す図である。
FIG. 11 is a diagram showing an example of a screen used for billing when the present time series prediction system is implemented in a client server system.

【符号の説明】[Explanation of symbols]

11 過去の時系列データ 12 特徴抽出処理 13 回帰木作成処理 14 回帰木 15 現在の時系列データ 16 現時系列特徴抽出処理 17 将来予測処理 18 予測値 11 Past time series data 12 Feature extraction processing 13 Regression tree creation processing 14 Regression tree 15 Current time series data 16 Current time series feature extraction processing 17 Future prediction processing 18 Predicted value

Claims (20)

【特許請求の範囲】[Claims] 【請求項1】 過去の時系列データから当該時系列の特
徴を取得する特徴取得手段と、 前記特徴取得手段で取得された特徴量を元に回帰木を作
成する作成手段と、 前記特徴取得手段と同じアルゴリズムを用いて現在の時
系列データから特徴量を取得する現時系列特徴取得手段
と、 前記現時系列特徴取得手段で取得された特徴量と、前記
作成手段で作成された回帰木とを用いて将来の予測値を
求める予測手段とを備えることを特徴とする時系列予測
装置。
A feature acquisition unit configured to acquire a feature of the time series from past time series data; a creation unit configured to create a regression tree based on the feature amount acquired by the feature acquisition unit; A current time series feature acquisition unit that acquires a feature amount from current time series data using the same algorithm as above, a feature amount acquired by the current time series feature acquisition unit, and a regression tree created by the creation unit. A time-series prediction device, comprising: a prediction unit that obtains a future predicted value.
【請求項2】 前記作成手段は、回帰木の枝分かれを決
定する特徴量の分割位置を複数の分割位置の中からそれ
ぞれの分割効率に基づいて探索することを特徴とする請
求項1に記載の時系列予測装置。
2. The method according to claim 1, wherein the creating unit searches for a division position of a feature amount for determining branching of the regression tree from a plurality of division positions based on each division efficiency. Time series prediction device.
【請求項3】 前記作成手段は、回帰木の枝分かれを決
定する特徴量の分割位置の探索範囲を、特徴量の分布の
平均値付近、または中央値付近、または最大値と最小値
の中間値の付近に制限するものであることを特徴とする
請求項2に記載の時系列予測装置。
3. The method according to claim 1, wherein the generating unit sets a search range of a feature value division position for determining a branch of the regression tree to a vicinity of an average value or a median value of the feature value distribution, or an intermediate value between a maximum value and a minimum value. 3. The time-series prediction device according to claim 2, wherein the time-series prediction device is configured to restrict the time-series to near.
【請求項4】 前記作成手段は、前記特徴量を量子化し
た値の中から前記分割位置を探索することを特徴とする
請求項2に記載の時系列予測装置。
4. The time-series prediction device according to claim 2, wherein the creation unit searches for the division position from a value obtained by quantizing the feature amount.
【請求項5】 前記予測手段は、前記現時系列特徴取得
手段で取得された特徴量を用いて前記作成手段で作成さ
れた回帰木をたどる際に、該回帰木の途中で止めて予測
値を取得することを特徴とする請求項1乃至4のいずれ
かに記載の時系列予測装置。
5. When tracing a regression tree created by the creation means using the feature quantity acquired by the current time series feature acquisition means, the prediction means stops the prediction value in the middle of the regression tree. The time-series prediction device according to claim 1, wherein the time-series prediction device obtains the time-series prediction data.
【請求項6】 請求項1乃至5のいずれかに記載の時系
列予測装置と、 前記時系列予測装置によって取得された予測値を他の情
報処理装置へ配信する配信手段とを備えることを特徴と
する時系列予測システム。
6. A time-series prediction device according to claim 1, further comprising: a distribution unit that distributes a prediction value obtained by the time-series prediction device to another information processing device. Time series forecasting system.
【請求項7】 前記配信手段は、インターネット上のW
ebシステムを用いて形成されることを特徴とする請求
項6に記載の時系列予測システム。
7. The distribution means according to claim 5, wherein the distribution means
The time series prediction system according to claim 6, wherein the time series prediction system is formed using an eb system.
【請求項8】 前記配信手段は、前記時系列予測装置を
サーバとし、前記他の情報処理装置をクライアントとす
るクライアントサーバシステムを用いて形成されること
を特徴とする請求項6に記載の時系列予測システム。
8. The method according to claim 6, wherein the distribution unit is formed using a client server system in which the time-series prediction device is a server and the other information processing device is a client. Series prediction system.
【請求項9】 ユーザとの契約に基づき、前記配信手段
による前記予測値の配信に際して課金をする課金手段を
更に備えることを特徴とする請求項6乃至8のいずれか
に記載の時系列予測システム。
9. The time-series prediction system according to claim 6, further comprising a charging unit configured to charge when said distribution value is distributed by said distribution unit based on a contract with a user. .
【請求項10】 過去の時系列データから当該時系列の
特徴を取得する特徴取得工程と、 前記特徴取得工程で取得された特徴量を元に回帰木を作
成する作成工程と、 前記特徴取得工程と同じアルゴリズムを用いて現在の時
系列データから特徴量を取得する現時系列特徴取得工程
と前記現時系列特徴取得工程で取得された特徴量と、前
記作成工程で作成された回帰木とを用いて将来の予測値
を求める予測工程とを備えることを特徴とする時系列予
測方法。
10. A feature acquiring step of acquiring a feature of the time series from past time series data; a creating step of creating a regression tree based on the feature amount acquired in the feature acquiring step; Using the current time series feature acquisition step of acquiring the feature quantity from the current time series data using the same algorithm as the feature quantity acquired in the current time series feature acquisition step, and the regression tree created in the creation step A prediction step of obtaining a predicted value of the future.
【請求項11】 前記作成工程は、回帰木の枝分かれを
決定する特徴量の分割位置を複数の分割位置の中からそ
れぞれの分割効率に基づいて探索することを特徴とする
請求項10に記載の時系列予測方法。
11. The method according to claim 10, wherein, in the creating step, a division position of a feature amount for determining a branch of the regression tree is searched from a plurality of division positions based on each division efficiency. Time series prediction method.
【請求項12】 前記作製工程は、回帰木の枝分かれを
決定する特徴量の分割位置の探索範囲を、特徴量の分布
の平均値付近、または中央値付近、または最大値と最小
値の中間値の付近に制限するものであることを特徴とす
る請求項11に記載の時系列予測方法。
12. The method according to claim 1, wherein a search range of a feature amount division position for determining branching of a regression tree is set near an average value or a median value of the feature value distribution, or an intermediate value between a maximum value and a minimum value. 12. The time-series prediction method according to claim 11, wherein the time-series prediction method is limited to the vicinity of.
【請求項13】 前記作成工程は、前記特徴量を量子化
した値の中から前記分割位置を探索することを特徴とす
る請求項11に記載の時系列予測方法。
13. The time-series prediction method according to claim 11, wherein in the creating step, the division position is searched from a value obtained by quantizing the feature amount.
【請求項14】 前記予測工程は、前記現時系列特徴取
得工程で取得された特徴量を用いて前記作成工程で作成
された回帰木をたどる際に、該回帰木の途中で止めて予
測値を取得することを特徴とする請求項10乃至13の
いずれかに記載の時系列予測方法。
14. The predicting step, when tracing a regression tree created in the creation step using the feature amount acquired in the current time series feature acquisition step, stops the regression tree in the middle of the regression tree to calculate a prediction value. The time-series prediction method according to claim 10, wherein the time-series prediction method is acquired.
【請求項15】 請求項10乃至14のいずれかに記載
の時系列予測方法を実行する時系列予測工程と、 前記時系列予測工程によって取得された予測値を他の情
報処理装置へ配信する配信工程とを備えることを特徴と
する時系列予測システムの制御方法。
15. A time-series prediction step for executing the time-series prediction method according to claim 10, and a distribution for distributing a prediction value obtained in the time-series prediction step to another information processing apparatus. And a control method for the time-series prediction system.
【請求項16】 前記配信工程は、インターネット上の
Webシステムを用いて前記予測値を配信することを特
徴とする請求項15に記載の時系列予測システムの制御
方法。
16. The control method for a time-series prediction system according to claim 15, wherein the distribution step distributes the predicted value using a Web system on the Internet.
【請求項17】 前記配信工程は、前記時系列予測方法
をサーバとし、前記他の情報処理装置をクライアントと
するクライアントサーバシステムを用いて前記予測値を
配信することを特徴とする請求項15に記載の時系列予
測システムの制御方法。
17. The method according to claim 15, wherein, in the distribution step, the predicted value is distributed using a client server system in which the time-series prediction method is a server and the other information processing apparatus is a client. The control method of the time-series prediction system described in the above.
【請求項18】 ユーザとの契約に基づき、前記配信工
程による前記予測値の配信に際して課金をする課金工程
を更に備えることを特徴とする請求項15乃至17のい
ずれかに記載の時系列予測システム。
18. The time-series prediction system according to claim 15, further comprising a charging step of charging when said predicted value is distributed by said distribution step based on a contract with a user. .
【請求項19】 請求項10乃至14のいずれかに記載
の時系列予測方法を実現するプログラムを格納した記憶
媒体。
19. A storage medium storing a program for realizing the time-series prediction method according to claim 10. Description:
【請求項20】 コンピュータによる時系列予測処理を
実現するための制御プログラムを格納する記憶媒体であ
って、該制御プログラムが、 過去の時系列データから当該時系列の特徴を取得する特
徴取得工程のコードと、 前記特徴取得工程で取得された特徴量を元に回帰木を作
成する作成工程のコードと、 前記特徴取得工程と同じアルゴリズムを用いて現在の時
系列データから特徴量を取得する現時系列特徴取得工程
のコードと、 前記現時系列特徴取得工程で取得された特徴量と、前記
作成工程で作成された回帰木とを用いて将来の予測値を
求める予測工程のコードとを備えることを特徴とする記
憶媒体。
20. A storage medium for storing a control program for realizing a time series prediction process by a computer, the control program comprising: a feature acquisition step of acquiring a feature of the time series from past time series data. A code of a creation step of creating a regression tree based on the feature amount acquired in the feature acquisition step, and a current time series of acquiring a feature amount from current time series data using the same algorithm as the feature acquisition step A code for a feature acquisition step, a code for a prediction step for determining a future prediction value using the feature amount acquired in the current time series feature acquisition step, and the regression tree created in the creation step. Storage medium.
JP35980999A 1999-12-17 1999-12-17 Device, system and method for predicting time series and storage medium Withdrawn JP2001175735A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP35980999A JP2001175735A (en) 1999-12-17 1999-12-17 Device, system and method for predicting time series and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP35980999A JP2001175735A (en) 1999-12-17 1999-12-17 Device, system and method for predicting time series and storage medium

Publications (1)

Publication Number Publication Date
JP2001175735A true JP2001175735A (en) 2001-06-29

Family

ID=18466409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP35980999A Withdrawn JP2001175735A (en) 1999-12-17 1999-12-17 Device, system and method for predicting time series and storage medium

Country Status (1)

Country Link
JP (1) JP2001175735A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006338534A (en) * 2005-06-03 2006-12-14 Dainippon Printing Co Ltd Variation event prediction system
US7200584B2 (en) 2003-03-20 2007-04-03 Kabushiki Kaisha Toshiba Time series pattern extraction apparatus and method
JP2007524897A (en) * 2003-03-05 2007-08-30 モルガン・スタンレー Intelligent simulation analysis method and system
JP2018173837A (en) * 2017-03-31 2018-11-08 三菱重工業株式会社 Prediction device, prediction system, prediction method and program
JP2018200513A (en) * 2017-05-26 2018-12-20 国立大学法人茨城大学 Stock price prediction system, stock price prediction method and stock price prediction program
WO2019188273A1 (en) * 2018-03-30 2019-10-03 オムロン株式会社 Control device, control method, and control program

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007524897A (en) * 2003-03-05 2007-08-30 モルガン・スタンレー Intelligent simulation analysis method and system
US7865415B2 (en) 2003-03-05 2011-01-04 Morgan Stanley Intelligent simulation analysis method and system
US7200584B2 (en) 2003-03-20 2007-04-03 Kabushiki Kaisha Toshiba Time series pattern extraction apparatus and method
JP2006338534A (en) * 2005-06-03 2006-12-14 Dainippon Printing Co Ltd Variation event prediction system
JP2018173837A (en) * 2017-03-31 2018-11-08 三菱重工業株式会社 Prediction device, prediction system, prediction method and program
JP2018200513A (en) * 2017-05-26 2018-12-20 国立大学法人茨城大学 Stock price prediction system, stock price prediction method and stock price prediction program
WO2019188273A1 (en) * 2018-03-30 2019-10-03 オムロン株式会社 Control device, control method, and control program
JP2019179468A (en) * 2018-03-30 2019-10-17 オムロン株式会社 Control unit, control method, and control program
CN111699444A (en) * 2018-03-30 2020-09-22 欧姆龙株式会社 Control device, control method, and control program
CN111699444B (en) * 2018-03-30 2022-05-24 欧姆龙株式会社 Control device, control method, and computer-readable recording medium
US11762347B2 (en) 2018-03-30 2023-09-19 Omron Corporation Control device, control method, and non-transitory computer-readable recording medium

Similar Documents

Publication Publication Date Title
US20200050968A1 (en) Interactive interfaces for machine learning model evaluations
US20210374610A1 (en) Efficient duplicate detection for machine learning data sets
US11379755B2 (en) Feature processing tradeoff management
CA2953826C (en) Machine learning service
CN107358247B (en) Method and device for determining lost user
US20180349790A1 (en) Time-Based Features and Moving Windows Sampling For Machine Learning
WO2019015631A1 (en) Method for generating combined features for machine learning samples and system
CN104346419A (en) Database analysis apparatus and method
CN108280541A (en) Customer service strategies formulating method, device based on random forest and decision tree
US20170262773A1 (en) Method and system for generating a training model for fabricating synthetic data and for fabricating synthetic data
Xia et al. An effective classification-based framework for predicting cloud capacity demand in cloud services
WO2020259325A1 (en) Feature processing method applicable to machine learning, and device
JP2001175735A (en) Device, system and method for predicting time series and storage medium
Kapoor Data mining: Past, present and future scenario
CN114495137B (en) Bill abnormity detection model generation method and bill abnormity detection method
Kumar et al. Stocks Analysis and Prediction of Indian Oil Trading Using Big Data Analytics
CN110941952A (en) Method and device for perfecting audit analysis model
Poornima et al. Prediction of Water Consumption Using Machine Learning Algorithm
CN113138977A (en) Transaction conversion analysis method, device, equipment and storage medium
Casturi et al. Script based migration toolkit for cloud computing architecture in building scalable investment platforms
Dong et al. Computing moment inequality models using constrained optimization
US10628452B2 (en) Providing multidimensional attribute value information
Pérez-Chacón et al. Pattern sequence-based algorithm for multivariate big data time series forecasting: Application to electricity consumption
US11520680B2 (en) Predicting statistics gathering times for database activity data using machine learning techniques
CN117078406A (en) Customer loss early warning method and device, computer equipment and storage medium

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070306