JP6879552B2 - 株価予測システム、株価予測方法及び株価予測プログラム - Google Patents

株価予測システム、株価予測方法及び株価予測プログラム Download PDF

Info

Publication number
JP6879552B2
JP6879552B2 JP2017104050A JP2017104050A JP6879552B2 JP 6879552 B2 JP6879552 B2 JP 6879552B2 JP 2017104050 A JP2017104050 A JP 2017104050A JP 2017104050 A JP2017104050 A JP 2017104050A JP 6879552 B2 JP6879552 B2 JP 6879552B2
Authority
JP
Japan
Prior art keywords
output data
stock price
prediction
predicted
predicted values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017104050A
Other languages
English (en)
Other versions
JP2018200513A (ja
Inventor
鈴木 智也
智也 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ibaraki University NUC
Original Assignee
Ibaraki University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibaraki University NUC filed Critical Ibaraki University NUC
Priority to JP2017104050A priority Critical patent/JP6879552B2/ja
Publication of JP2018200513A publication Critical patent/JP2018200513A/ja
Application granted granted Critical
Publication of JP6879552B2 publication Critical patent/JP6879552B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Description

本発明は、株価の予測に適した株価予測システム、株価予測方法及び株価予測プログラムに関する。
近年のICT(Information and Communication Technology)技術の発達に伴い、金融業務においても人工知能を応用する動きが盛んである。特に、フィンテック(FinTech)と呼ばれる金融とIT(Information Technology)とを融合した金融工学分野での技術革新に目を見張るものがある。
このような金融業務における金融商品の売買を支援するものとして、特許文献1では、金融派生商品の価格シナリオに基づき2種類の特徴量を算出し、2種類の特徴量から夫々変動の度合いの頻度分布を算出し、夫々の頻度分布を集計し金融派生商品の購入比率を決定する売買契約支援システムを提案している。
また、特許文献2では、予測したい資産に対し、資産とそれ以外に複数の資産を一様乱数を発生させて資産群を設定し、設定した資産群に対し、観測方程式と状態方程式とからなる状態空間モデルを適用し、過去の資産価格から方程式構造を推定し、推定された方程式を用いて資産の価格予測を行う金融資産価格予測システムを提案している。なお、観測方程式は因子分析により推定し、状態方程式は観測方程式と状態方程式から生成されるカルマンフィルタから時系列構造をもつ状態変数を推定している。
特開2003−296577号公報 特開平05−108652号公報
上述した特許文献1の売買契約支援システムでは、価格シナリオに基づいた2種類の特徴量から算出した変動の度合いの夫々の頻度分布を集計し、金融派生商品の購入比率を決定するので、適切な売買計画を立案できる。
一方、上述した特許文献2の金融資産価格予測システムでは、予測したい資産とそれ以外に複数の資産とに対し、一様乱数を発生させて資産群を設定し、過去の資産価格から推定した方程式構造による方程式を用いて資産の価格予測を行うので、予測精度を向上させることができる。
ところで、特許文献1の売買契約支援システム、又は特許文献2の金融資産価格予測システムを、株式投資における収益性の予測に適用しようとすると、次のような不具合を生じるおそれがある。
すなわち、特許文献1の売買契約支援システムは、夫々の頻度分布の集計結果から購入比率を決定するものの、夫々の頻度分布のバラツキが多いため、売買計画における収益予測の精度が低下するおそれがある。
また、特許文献2の金融資産価格予測システムは、観測方程式と状態方程式とからなる状態空間モデルを適用し、過去の資産価格から方程式構造を推定するため、たとえば状態変数の推定結果によっては資産の収益予測の精度が低下するおそれがある。
このようなことから、収益予測の精度を高めることで、株式投資における収益性を高めることができるシステムの開発が望まれている。
本発明は、このような状況に鑑みてなされたものであり、株式投資における収益性を高めることができる株価予測システム、株価予測方法及び株価予測プログラムを提供することを目的とする。
本発明の株価予測システムは、株価の変化要素を示す入力データに基づき、株価の予測値の集合を取得する予測集合取得手段と、前記株価の予測値の集合から予測精度の高い株価の集合知を取得する集合知取得手段とを備え、前記予測集合取得手段は、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する無作為復元抽出部と、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する集団学習部とを有し、前記集合知取得手段は、前記第2の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する平均値取得部を有することを特徴とする
また、前記集合知取得手段は、前記平均値取得部が取得した予測精度の高い予測値の集合知からコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する標準偏差取得部を有することを特徴とする。
また、前記予測集合取得手段は、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する無作為復元抽出部と、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する集団学習部とを有し、前記集合知取得手段は、前記第2の出力データからコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する標準偏差取得部と、前記第4の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する平均値取得部とを有することを特徴とする。
本発明の株価予測方法は、予測集合取得手段により、株価の変化要素を示す入力データに基づき、株価の予測値の集合を取得する工程と、集合知取得手段により、前記株価の予測値の集合から予測精度の高い株価の集合知を取得する工程とを有し、前記予測集合取得手段は、無作為復元抽出部により、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する工程と、
集団学習部により、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する工程とを有し、前記集合知取得手段は、平均値取得部により、前記第2の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する工程を有することを特徴とする
また、前記集合知取得手段は、標準偏差取得部により、前記平均値取得部が取得した予測精度の高い予測値の集合知からコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する工程を有することを特徴とする。
また、前記予測集合取得手段は、無作為復元抽出部により、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する工程と、集団学習部により、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する工程とを有し、前記集合知取得手段は、標準偏差取得部により、前記第2の出力データからコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する工程と、平均値取得部により、前記第4の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する工程とを有することを特徴とする。
本発明の株価予測プログラムは、株価予測システムを制御するコンピューターに実行させる株価予測プログラムであって、予測集合取得手段により、株価の変化要素を示す入力データに基づき、株価の予測値の集合を取得する工程と、集合知取得手段により、前記株価の予測値の集合から予測精度の高い株価の集合知を取得する工程とを有し、前記予測集合取得手段は、無作為復元抽出部により、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する工程と、集団学習部により、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する工程とを有し、前記集合知取得手段は、平均値取得部により、前記第2の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する工程を有することを特徴とする
また、前記集合知取得手段は、標準偏差取得部により、前記平均値取得部が取得した予測精度の高い予測値の集合知からコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する工程を有することを特徴とする。
また、前記予測集合取得手段は、無作為復元抽出部により、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する工程と、集団学習部により、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する工程とを有し、前記集合知取得手段は、標準偏差取得部により、前記第2の出力データからコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する工程と、平均値取得部により、前記第4の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する工程とを有することを特徴とする。
本発明の株価予測システム、株価予測方法及び株価予測プログラムでは、予測集合取得手段により、株価の変化要素を示す入力データに基づき、株価の予測値の集合を取得し、集合知取得手段により、株価の予測値の集合から予測精度の高い株価の集合知を取得する。
すなわち、集合知取得手段により、予測集合取得手段が取得した株価の予測値の集合から予測精度の高い株価の集合知を取得でき、収益予測の精度を高めることができる。
本発明の株価予測システム、株価予測方法及び株価予測プログラムによれば、集合知取得手段により、予測集合取得手段が取得した株価の予測値の集合から予測精度の高い株価の集合知を取得でき、収益予測の精度を高めることができるので、株式投資における収益性を高めることができる。
本発明の株価予測システムの構成の一例を示す図である。 図1の予測集合取得部での集団学習について説明するための図である。 図1の予測集合取得部でのバックテスト(Back-test)とフォワードテスト(Forward-test)について説明するための図である。 図1の予測集合取得部に入力される入力データの一例を示す図である。 図4の入力データの元となるデータの一例について説明するための図である。 図1の2段階選択部での予測集合取得部からの出力データに基づいた集合知の取得を説明するためのものであり、同図(a)は第1の選択(First selection)について説明する図であり、同図(b)は第2の選択(Ssecond selection)について説明するための図である。 図1の2段階選択部の平均値取得部からの出力に基づいた予測精度の一例を示す図である。 図1の2段階選択部の出力であり、図6(b)の第2の選択(Ssecond selection)で選択された株価銘柄に対する予測精度の一例を示す図である。 図1の株価予測システムにおける株価予測の処理について説明するためのフローチャートである。 図1の株価予測システムによる東京証券取引所(Tokyo stock exchange)における第1期(a)〜第4期(d)でのシミュレーションの一例を示す図である。 図1の株価予測システムによるニューヨーク証券取引所(New York stock exchange)における第1期(a)〜第4期(d)でのシミュレーションの一例を示す図である。 一般的なニューラルネットワークによる予測モデルについて説明するための図である。 図10の予測モデルによる予測精度の一例を示す図である。
以下、本発明の株価予測システムの一実施形態について説明する。
なお、本発明の株価予測システムの一実施形態を説明するに先立ち、図12および図13を用い、一般的なニューラルネットワークによる予測精度について説明する。また、以下に説明する予測値は、株価の収益率である。また、以下に説明する予測精度とは、株価の収益率の予測の精度を意味する。
まず、ニューラルネットワークは、どのような予測モデルであっても、次の数1のように記述できる。
Figure 0006879552

すなわち、未来= F(過去)として記述できる。 ここで、「F」は過去および将来の動きの関係を意味する。関数Fが「過去」のデータを入力として受け取る場合、関数Fからの出力として「未来」を予測することができる。
また、一般的なニューラルネットワークの予測モデルは、たとえば図12に示すように、非線形フィルタ11を有する複数のニューロン10と、複数のニューロン10からの出力に基づき予測値(株価の収益率)を出力するニューロン12とを混在させた予測モデルで示される。
また、複数のニューロン10を混在させた予測モデルは、次の数2によって表すことができる。
Figure 0006879552
ここで、{Wl,W2,…,WN}と数3の変数とは、予測モデルのパラメータである。また、dは図示しない第1層のニューロンの数、Nは第2層のニューロン10の数であり、0jは第2の層のj番目のニューロン10からの出力値である。
Figure 0006879552
Figure 0006879552


また、数4で示す式は、[0,1]の値である。
また、一般的なニューラルネットワークでは、入力データから以前の出力データを正確に再現するために、予測モデルのパラメータwをすべて最適化する必要がある。
ここで、概要を説明すると、数5で示す式が最急降下法によって数6のように修正される。
Figure 0006879552
Figure 0006879552
ここで、j∈{1、...、N}であり、ηは訓練係数である。
また、数7での
Figure 0006879552


は出力データであり、数8の
Figure 0006879552


は、教師データ(Teacher data)である。
次に、ニューロン10の数が図12のような数であれば、予測モデルパラメータwは、バックプロパゲーションアルゴリズムによって数9のように修正される。
Figure 0006879552


ここで、i∈{0、...、d}および j ∈{1、...、N}である。
そして、数10の平均二乗誤差Eが十分に小さくなるように、上記の数9の修正を繰り返す。
Figure 0006879552
このようなトレーニングプロセスをバックテスト(Back-test)と呼び、数10におけるαはバックテスト(Back-test)の開始時間であり、βはバックテストのトータルの長さである。
また、バックテスト(Back-test)でのトレーニングの合計は数11の平均二乗誤差Eで示される。
Figure 0006879552
ここで、αはバックテスト(Back-test)の開始時間であり、βはテストのトータルの長さである。
そして、すべてのパラメータを訓練した後、ニューラルネットワークを使用して新しいデータを予測することができる。訓練されたニューラルネットワークをFとすると、数12に示す予測値(株価の収益率)は、数13で表される。
Figure 0006879552


Figure 0006879552
ここで、数13における{x(t)、x(t−1)、...、x(t−d)}は未学習の新しい入力データである。ここでは、この予測をフォワードテスト(Forward-test)という。
以上のような一般的なニューラルネットワークを用いることで、たとえば図13に示すフォワードテスト(Forward-test)での予測結果が得られる。すなわち、図13では、たとえば東京証券取引所(Tokyo stock exchange)とニューヨーク証券取引所(New York stock exchange)での特定の銘柄の株価の収益率の予測結果を示している。
すなわち、たとえば東京証券取引所(Tokyo stock exchange)の場合、第1期が54.8%、第2期が55.8%、第3期が51.6%、第4期が54.8%とした予測値(株価の収益率)が得られたことを示している。また、ニューヨーク証券取引所(New York stock exchange)場合、第1期が59.1%、第2期が52.7%、第3期が52.0%、第4期が53.2とした予測精度(上昇又は下降の2択による)が得られたことを示している。
次に、本発明の株価予測システムの一実施形態を、図1〜図11を参照しながら説明する。なお、以下に説明する入力データaである訓練データ(Training data)は、株価の変化要素を示すものである。株価の変化要素としては、次の式で示される株価の変化率を用いることができる。
株価の変化率x(t) = [株価(t) - 株価(t-1)] / 株価(t-1)
また、株価の変化要素としては、株価の変化率に限らず、次の式で示される対数差分を用いることができる。
株価の対数差分x(t) = log株価(t) - log株価(t-1)
まず、図1を参照し、本発明の株価予測システムの構成の一例について説明する。図1の株価予測システム100は、予測集合取得部110と2段階選択部140とを有している。予測集合取得部110は、無作為復元抽出部120と集団学習部130とを有している。
無作為復元抽出部120は、詳細については後述するが、入力データaが示す訓練データ(Training data)から複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す出力データbを出力する。集団学習部130は、無作為復元抽出部120からの出力データbが示す訓練データの集合を用いて複数の予測モデルを訓練し、個々に予測値の集合を示す出力データcを出力する。
2段階選択部140は、平均値取得部150と標準偏差取得部160とを有している。
平均値取得部150は、詳細については後述するが、予測集合取得部110からの予測値(株価の収益率)の集合を示す出力データcから予測精度(Prediction accuracy)の低い予測値(株価の収益率)の平均値をとることで互いの予測誤差を相殺し、予測精度(Prediction accuracy)の高い予測値(株価の収益率)の集合知を取得し、取得した集合知を示す出力データdを出力する。標準偏差取得部160は、詳細については後述するが、平均値取得部150が取得した予測精度(Prediction accuracy)の高い予測値(株価の収益率)の集合知からコンセンサス比率(Consensus Ratio)の高い(最も信頼性の高い)予測値(株価の収益率)の集合を取得し、取得した集合知の合意度を示す出力データeを出力する。
なお、詳細については後述するが、出力データdは株の売買の投資判断に使用でき、出力データeは予測の自信度の確認に使用できる。
次に、図2を参照し、図1の予測集合取得部110での集団学習について説明する。まず、無作為復元抽出部120は、複数の予測モデル120a〜120nを有している。これらの予測モデル120a〜120nは、入力データaの訓練データ(Training data)を再サンプリングしたそれぞれのデータセット(data set)a1〜anに基づいて複製されたものである。なお、訓練データ(Training data)および再サンプリングしたデータセット(data set)a1〜anの詳細については後述する。これらの予測モデル120a〜120nは、それぞれのデータセット(data set)a1〜anに基づき、上述したバックテスト(Back-test)およびフォワードテスト(Forward-test)を実行し、たとえばUp又はDownを示す訓練データ(Training data)の集合を示す出力データbを出力する。なお、データセット(data set)a1〜anおよび予測モデル120a〜120nの数は任意であるが、本実施形態ではたとえば1000個としている。
ここで、バックテスト(Back-test)およびフォワードテスト(Forward-test)は、オーバーフィッティングを防ぐための処理である。すなわち、予測集合取得部110での集団学習において、評価を最良にするようにNとdとを最適化する。次に、予測モデル120a〜120nの汎用性を評価するために未学習の新しい教師データ(Teacher data)を用いてフォワードテスト(Forward-test)を行う。まず、バックテスト(Back-test)においては、たとえば図3に示すように、最初の段階でモデルパラメータwの訓練(Training of w)と、予測精度の評価(Evaluation of prediction accuracy)とを実行し、次の段階でモデルパラメータwの訓練(Training of w)と、予測精度の評価(Evaluation of prediction accuracy)とを入れ替え、Nとdとを最適化する。続いて、フォワードテスト(Forward-test)において、未学習の新しい教師データ(Teacher data)を用いバックテスト(Back-test)で最適化された予測モデルを評価する。また、バックテスト(Back-test)においての{w1,w2,・・・,wN}のパラメータは、上記の数6のように修正される。
また、図2において、集団学習部130は、無作為復元抽出部120からの出力データdを用いて複数の予測モデルを訓練することで、フォワードテスト(Forward-test)の新しいデータを個々に予測する。すなわち、集団学習部130は、たとえば以下の数14により、予測値(株価の収益率)を得ることができる。
Figure 0006879552

数14においては、たとえば独立している予測モデルが19個あり、それぞれの予測精度をpとした場合を示している。このときx個の予測モデルが正解する確率は数14で計算できる。次に、多数決が正解する確率は、数15のようにxが10以上のP(x)の和を取ることで計算できる。仮に、pが0.53である場合,多数決が正解する確率は0.60まで向上する。
Figure 0006879552



つまり、集団学習部130は、集団学習の効果により、たとえば予測精度を53%から60%に上げることができる。
次に、図4を参照し、図1の予測集合取得部110に与える入力データaが示す訓練データ(Training data)について説明する。まず、図4(a)は、データセット(data set)a1〜anを生成するための訓練データ(Training data)を示している。なお、この訓練データ(Training data)は、特定の銘柄の株価を示している。
訓練データ(Training data)は、たとえば#1に示すように、x(t−1),x(t−2),・・・x(t−d−1)で示すデータおよびx(t)で示す教師データ(Teacher data)とを有している。
図4(b)は、図4(a)の#1〜#10までの訓練データ(Training data)をランダムに並べた1個のデータセット(data set)a1を示している。なお、他のデータセット(data set)a2〜anについても、同様にして図4(a)の#1〜#10までの訓練データ(Training data)がランダムに並べられたものとなる。つまり、図4(a)の#1〜#10までの訓練データ(Training data)をランダムに並べることで、複数のデータセット(data set)a1〜anが複製されることになる。なお、図4では、説明の都合上、1セットのデータを#1〜#10までの10個として示している。ただし、1セットのデータの個数は、10個に限られるものではなく、11個以上であってもよい。
次に、図5を参照し、訓練データ(Training data)の元となるデータについて説明する。すなわち、訓練データ(Training data)は、任意の銘柄の株価に該当する。株価の取得元となる市場(Market)は、たとえば東京証券取引所(Tokyo stock exchange)とニューヨーク証券取引所(New York stock exchange)としている。また、株価の取得期間については、第1期(First term)、第2期(Second term)、第3期(Third term)、第4期(Fourth term)に分けている。また、第1期〜第4期毎に、バックテスト(Back-test)で用いるデータ(株価)を5年分とし、フォワードテスト(Forward-test)で用いるデータ(株価)を2.5年分としている。
また、東京証券取引所(Tokyo stock exchange)において、たとえば590銘柄の上場株をサンプルとしている。また、ニューヨーク証券取引所(New York stock exchange)において、たとえば500銘柄の上場株をサンプルとしている。上場株のサンプルを決定するに当たり、継続的なサンプル値(株価)が必要であるため、たとえば上場廃止期間の無い銘柄を選択している。なお、サンプル数については、東京証券取引所(Tokyo stock exchange)においての590銘柄、ニューヨーク証券取引所(New York stock exchange)においての500銘柄に限定されるものではない。任意にサンプル数を決定してもよい。
また、第1期(First term)でのバックテスト(Back-test)のデータ(株価)のサンプル期間は、1991/1~1995/12としている。また、第1期(First term)でのフォワードテスト(Forward-test)のデータ(株価)のサンプル期間は、1996/1~1998/6としている。また、第2期(Second term)でのバックテスト(Back-test)のデータ(株価)のサンプル期間は、1996/1~2000/12としている。また、第2期(Second term)でのフォワードテスト(Forward-test)の入力データ(株価)のサンプル期間は、2001/1~2003/6としている。また、第3期(Third term)でのバックテスト(Back-test)のデータ(株価)のサンプル期間は、200/1~2005/12としている。また、第3期(Third term)でのフォワードテスト(Forward-test)のデータ(株価)のサンプル期間は、2006/1~2008/6としている。また、第4期(Fourth term)でのバックテスト(Back-test)のデータ(株価)のサンプル期間は、2006/1~2010/12としている。また、第4期(Fourth term)でのフォワードテスト(Forward-test)のデータ(株価)のサンプル期間は、2011/1~2013/6としている。
なお、第1期(First term)〜第4期(Fourth term)におけるバックテスト(Back-test)で用いる入力データ(株価)のサンプル期間を5年分としているが、5年に限定されるものではない。ただし、期間を長くしたり、短くしたりすると、予測精度の低下を招くおそれがあるため、5年程度が好ましい。また、フォワードテスト(Forward-test)で用いる入力データ(株価)のサンプル期間は、2.5年分としているが、2.5年に限定されるものではない。ただし、期間を長くしたり、短くしたりすると、予測精度の低下を招くおそれがあるため、2.5年程度が好ましい。
次に、図6を参照し、2段階選択部140の平均値取得部150および標準偏差取得部160による2段階の選択ついて説明する。まず、図6(a)は、平均値取得部150による第1の選択について説明する図である。図6(a)では、縦軸を予測精度(Prediction accuracy)とし、横軸を株番号(Stock No.)としている。平均値取得部150は、集団学習部130の予測値(株価の収益率)の集合である出力データcから収益性の高い株式銘柄を取得するために、予測精度の低い株式銘柄を取り除き(Removed)、予測精度の高い株式銘柄を取得する。
すなわち、無作為復元抽出部120でのバックテスト(Back-test)において、予測困難な株式銘柄が適用された場合、集団学習部130からの予測値(株価の収益率)の集合には偶発的に高いコンセンサス(Consensus)が含まれることがある。これは後述する標準偏差取得部160において悪影響を及ぼすので、あらかじめ平均値取得部150において予測困難な株式銘柄を取り除く。たとえば集団学習部130からの出力データcから予測精度の低い株式銘柄を75%取り除き、予測精度の高い(収益性の高い)25%の株式銘柄を取得する。取得したそれそれの株式銘柄に対する集合知を出力データdとして出力する。
次に、図6(b)は、標準偏差取得部160による第2の選択ついて説明する図である。図6(b)では、縦軸をコンセンサス比率(Consensus Ratios)とし、横軸を時間である毎日のチャート(Daily chart)としている。ここで、標準偏差取得部160は、毎日の最大のコンセンサス比率(Consensus Ratios)を示す最も信頼性の高い株式銘柄を適応的に検出する。すなわち、標準偏差取得部160でのフォワードテスト(Forward-test)において、コンセンサス比率(Consensus Ratios)Cが使用される。コンセンサス比率Cは、予測可能な株式銘柄であっても、常に高い値を取るとは限らない。このため、標準偏差取得部160は、毎日において最大のコンセンサス比率を示す最も信頼性の高い予測値(株価の収益率)を適応的に検出する。すなわち、標準偏差取得部160が出力する出力データeは、平均値取得部150が取得した集合知に対する合意度を示すものとなる。
ここで、標準偏差取得部160は、予測精度を向上させるために、以下の数16を用い、コンセンサス比率(Consensus Ratios)Cを求める。
Figure 0006879552
ここで、コンセンサス比率(Consensus Ratios)Cの値が大きいほど、平均値取得部150が取得した集合知の信頼性が高いことを示す。
次に、図7を参照し、平均値取得部150から出力される出力データdの一例について説明する。なお、出力データdは、平均値取得部150が取得した集合知であり、特定の銘柄の予測値(株価の収益率)でもある。図7に示すように、東京証券取引所(Tokyo stock exchange)の場合、第1期(First term)が59.9%、第2期(Second term)が57.9%、第3期(Third term)が55.5%、第4期(Fourth term)が57.0%とした予測精度が得られた。また、ニューヨーク証券取引所(New York stock exchange)の場合、第1期(First term)が61.7%、第2期(Second term)が55.6%、第3期(Third term)が55.3%、第4期(Fourth term)が54.6%とした予測精度が得られた。なお、平均値取得部150によって求められた予測値(株価の収益率)は、株の売買の投資判断に使用できる。
次に、図8を参照し、標準偏差取得部160から出力される出力データeの一例について説明する。なお、出力データeは、標準偏差取得部160が平均値取得部150によって取得された予測精度(Prediction accuracy)の高い予測値(株価の収益率)の集合知に対するコンセンサス比率(Consensus Ratio)を取得したものであり、図6(b)の第2の選択(Ssecond selection)で選択された株価銘柄に対する予測精度の一例を示す図である。
図8に示すように、東京証券取引所(Tokyo stock exchange)の場合、第1期(First term)が65.9%、第2期(Second term)が71.6%、第3期(Third term)が60.4%、第4期(Fourth term)が62.1%とした予測精度が得られた。また、ニューヨーク証券取引所(New York stock exchange)の場合、第1期(First term)が84.0%、第2期(Second term)が69.0%、第3期(Third term)が60.5%、第4期(Fourth term)が57.0%とした予測精度が得られた。
ここで、図7の予測精度と、図8の予測精度とを比較すると、平均値取得部150から出力される集合知からコンセンサス比率(Consensus Ratio)の高い(最も信頼性の高い)集合知を取得することで、より精度の高い予測値(株価の収益率)が得られていることが分かる。
また、図7の予測精度および図8の予測精度と、図13の一般的なニューラルネットワークによる予測精度とを比較してみると、次のようなことが分かる。
すなわち、上述したように、図13の予測精度では、東京証券取引所(Tokyo stock exchange)の場合、第1期(First term)が54.8%、第2期(Second term)が55.8%、第3期(Third term)が51.6%、第4期(Fourth term)が54.8%とした予測精度となっている。また、ニューヨーク証券取引所(New York stock exchange)の場合、第1期(First term)が59.1%、第2期(Second term)が52.7%、第3期(Third term)が52.0%、第4期(Fourth term)が53.2とした予測精度となっている。
図7の予測精度と図13の予測精度とを比較すると、平均値取得部150からの出力データdである集合知による予測精度が図13の第1期(First term)から第4期(Fourth term)のいずれの予測精度よりも高いことが分かる。また、図8の予測精度と図13の予測精度とを比較すると、標準偏差取得部160からの出力データeである集合知の合意度を利用した予測精度の方が、図13の第1期(First term)から第4期(Fourth term)のいずれの予測精度よりも高いことが分かる。
特に、図13のニューヨーク証券取引所(New York stock exchange)の第1期(First term)の予測精度が59.1%であるのに対し、図8のニューヨーク証券取引所(New York stock exchange)の第1期(First term)の予測精度が84.0%であることからも、本実施形態での株価予測システム100による予測精度がより高められていることが分かる。
次に、図9を参照し、株価予測システム100による株価予測の処理について説明する。
(ステップS101)
訓練データ(Training data)の集合を取得する。
この場合、予測集合取得部110の無作為復元抽出部120が、訓練データ(Training data)を示す入力データaから複数のデータセットを複製し、その訓練データ(Training data)の集合を取得する。
(ステップS102)
訓練データ(Training data)の集合を出力する。
この場合、無作為復元抽出部120が取得した訓練データ(Training data)の集合を示す出力データbを出力する。
(ステップS103)
訓練データ(Training data)の集合から複数の予測モデルを独立に訓練し、それぞれの予測モデルから予測値(株価の収益率)を取得する。
この場合、予測集合取得部110の集団学習部130が訓練データ(Training data)の集合を示す出力データbに対し、複数の予測モデルによって予測値(株価の収益率)の集合を取得する。
(ステップS104)
予測値(株価の収益率)の集合を出力する。
この場合、集団学習部130が取得した予測値(株価の収益率)の集合を示す出力データcを出力する。
(ステップS105)
予測値(株価の収益率)の集合から予測精度の高い集合知を取得する。
さらに,バックテストとして全ての株価銘柄の集合知を取得し、教師データと比較することで予測精度を取得する。この予測精度は、たとえば上述した図7の予測精度のような結果として得られる。
(ステップS106)
バックテストを通じて予測精度の低い株式銘柄を取り除いた予測値(株価の収益率)の集合知を出力する。
この場合、平均値取得部150が予測精度の低い株式銘柄を取り除き、予測精度の高い株式銘柄の予測値(株価の収益率)の集合知を、出力データdとして出力する。
(ステップS107)
フォーワードテストにおいて、予測値(株価の収益率)の集合知からコンセンサス比率(Consensus Ratios)の高い株式銘柄を取得し,その予測値(株価の収益率)の集合知を取得する。
この場合、2段階選択部140の標準偏差取得部160が、平均値取得部150によって取得された予測精度(Prediction accuracy)の高い株式銘柄の集合知からコンセンサス比率(Consensus Ratio)の高い(最も信頼性の高い)集合知の予測値(株価の収益率)を取得する。
(ステップS108)
集合知の合意度と予測値とを出力する。
この場合、標準偏差取得部160が取得したコンセンサス比率(Consensus Ratio)の高い(最も信頼性の高い)集合知の予測値(株価の収益率)およびその集合知の合意度を示す出力データeを出力する。
この出力データeを利用することにより、たとえば上述した図8の予測精度のような結果が得られる。また、この出力データeは、上述したように、株の予測の自信度の確認に使用できる。
次に、図10および図11を参照し、株価予測システム100によるシミュレーションについて説明する。
まず、図10は、図5に示した東京証券取引所(Tokyo stock exchange)においてのサンプルを、たとえば590銘柄とした場合のシミュレーションの結果を示している。また、図11は、図5に示したニューヨーク証券取引所(New York stock exchange)においてのサンプルを、たとえば500銘柄とした場合のシミュレーションの結果を示している。ただし、図10および図11に示すシミュレーションでは、説明の都合上、株の売買に関わる手数料については省いた結果を示している。
また、図10および図11において、符号hは株価予測システム100によって予測した特定銘柄の投資パフォーマンス(資産増幅率)を示している。また、符号iは、投資銘柄を毎日ランダムに選択した場合(ランダム戦略)の投資パフォーマンスを示している。また、符号jは、東京証券取引所(Tokyo stock exchange)での590銘柄の値動きのパフォーマンスの平均、ニューヨーク証券取引所(New York stock exchange)での500銘柄の値動きのパフォーマンスの平均を示している。
図10および図11から分かる通り、株価予測システム100によって得られた投資パフォーマンスhは、市場の平均パフォーマンスjやランダム戦略によるパフォーマンスiを上回っている。このことは、株価予測システム100による予測値(株価の収益率)が実際の株式市場での予測可能性と収益性との確認に有益であることを意味するものである。
このように、本実施形態では、株価予測システム100の予測集合取得部110(予測集合取得手段)により、株価の変化要素(株価の変化率又は対数差分)を示す入力データaに基づき、株価の予測値の集合を取得し、2段階選択部140(集合知取得手段)により、株価の予測値の集合から予測精度の高い株価の集合知を取得している。
これにより、2段階選択部140(集合知取得手段)により、予測集合取得部110(予測集合取得手段)が取得した株価の予測値の集合から予測精度の高い株価の集合知を取得でき、収益予測の精度を高めることができるので、投資における収益性を高めることができる。
すなわち、平均値取得部150からの出力データdは、集団学習部130からの出力データcに含まれる予測値(株価の収益率)の集合から予測精度の低い予測値(株価の収益率)の平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値(株価の収益率)の集合知を取得したものであるため、株の売買の投資判断に有効となる。
また、標準偏差取得部160が出力する出力データeは、平均値取得部150が取得した集合知に対する合意度であり、予測精度の高い株価銘柄の厳選に有効となる。
なお、本実施形態では、平均値取得部150が予測集合取得部110からの予測値(株価の収益率)の集合を示す出力データcから予測精度(Prediction accuracy)の低い予測値(株価の収益率)の平均値をとることで互いの予測誤差を相殺し、予測精度(Prediction accuracy)の高い予測値(株価の収益率)の集合知を取得し、取得した集合知を示す出力データdを出力し、標準偏差取得部160が平均値取得部150の取得した予測精度(Prediction accuracy)の高い予測値(株価の収益率)の集合知からコンセンサス比率(Consensus Ratio)の高い(最も信頼性の高い)予測値(株価の収益率)の集合を取得し、取得した集合知の合意度を示す出力データeを出力する場合として説明したが、この例に限られるものではない。
すなわち、標準偏差取得部160が予測集合取得部110からの予測値(株価の収益率)の集合を示す出力データcからコンセンサス比率(Consensus Ratio)の高い(最も信頼性の高い)予測値(株価の収益率)の集合を取得し、平均値取得部150が標準偏差取得部160の取得した集合知から予測精度(Prediction accuracy)の低い予測値(株価の収益率)の平均値をとることで互いの予測誤差を相殺し、予測精度(Prediction accuracy)の高い予測値(株価の収益率)の集合知を取得するようにしてもよい。
10、12 ニューロン
11 非線形フィルタ
100 株価予測システム
110 予測集合取得部
120a〜120n 予測モデル
120 無作為復元抽出部
130 集団学習部
140 2段階選択部
150 平均値取得部
160 標準偏差取得部
a 入力データ
a1〜an データセット
b〜e 出力データ

Claims (9)

  1. 株価の変化要素を示す入力データに基づき、株価の予測値の集合を取得する予測集合取得手段と、
    前記株価の予測値の集合から予測精度の高い株価の集合知を取得する集合知取得手段とを備え、
    前記予測集合取得手段は、
    前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する無作為復元抽出部と、
    前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する集団学習部とを有し、
    前記集合知取得手段は、
    前記第2の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する平均値取得部を有する
    ことを特徴とする株価予測システム。
  2. 前記集合知取得手段は、前記平均値取得部が取得した予測精度の高い予測値の集合知からコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する標準偏差取得部を有することを特徴とする請求項1に記載の株価予測システム。
  3. 前記予測集合取得手段は、
    前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する無作為復元抽出部と、
    前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する集団学習部とを有し、
    前記集合知取得手段は、
    前記第2の出力データからコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する標準偏差取得部と、
    前記第4の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する平均値取得部とを有する
    ことを特徴とする請求項1に記載の株価予測システム。
  4. 予測集合取得手段により、株価の変化要素を示す入力データに基づき、株価の予測値の集合を取得する工程と、
    集合知取得手段により、前記株価の予測値の集合から予測精度の高い株価の集合知を取得する工程とを有し、
    前記予測集合取得手段は、
    無作為復元抽出部により、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する工程と、
    集団学習部により、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する工程とを有し、
    前記集合知取得手段は、
    平均値取得部により、前記第2の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する工程を有する
    ことを特徴とする株価予測方法。
  5. 前記集合知取得手段は、
    標準偏差取得部により、前記平均値取得部が取得した予測精度の高い予測値の集合知からコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する工程を有する
    ことを特徴とする請求項4に記載の株価予測方法。
  6. 前記予測集合取得手段は、
    無作為復元抽出部により、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する工程と、
    集団学習部により、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する工程とを有し、
    前記集合知取得手段は、
    標準偏差取得部により、前記第2の出力データからコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する工程と、
    平均値取得部により、前記第4の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する工程とを有する
    ことを特徴とする請求項4に記載の株価予測方法。
  7. 株価予測システムを制御するコンピューターに実行させる株価予測プログラムであって、
    予測集合取得手段により、株価の変化要素を示す入力データに基づき、株価の予測値の集合を取得する工程と、
    集合知取得手段により、前記株価の予測値の集合から予測精度の高い株価の集合知を取得する工程とを有し、
    前記予測集合取得手段は、
    無作為復元抽出部により、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する工程と、
    集団学習部により、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する工程とを有し、
    前記集合知取得手段は、
    平均値取得部により、前記第2の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する工程を有する
    ことを特徴とする株価予測プログラム。
  8. 前記集合知取得手段は、
    標準偏差取得部により、前記平均値取得部が取得した予測精度の高い予測値の集合知からコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する工程を有する
    ことを特徴とする請求項7に記載の株価予測プログラム。
  9. 前記予測集合取得手段は、
    無作為復元抽出部により、前記入力データが示す訓練データから複数のデータセットを作成して複数の予測モデルを複製し、それぞれの予測モデルの訓練データの集合を示す第1の出力データを出力する工程と、
    集団学習部により、前記第1の出力データが示す訓練データを用いて複数の予測モデルを訓練し、個々に予測値を示す第2の出力データを出力する工程とを有し、
    前記集合知取得手段は、
    標準偏差取得部により、前記第2の出力データからコンセンサス比率の高い予測値の集合を取得し、取得した集合知の合意度を示す第4の出力データを出力する工程と、
    平均値取得部により、前記第4の出力データから平均値をとることで互いの予測誤差を相殺し、予測精度の高い予測値の集合知を示す第3の出力データを出力する工程とを有する
    ことを特徴とする請求項7に記載の株価予測プログラム。
JP2017104050A 2017-05-26 2017-05-26 株価予測システム、株価予測方法及び株価予測プログラム Active JP6879552B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017104050A JP6879552B2 (ja) 2017-05-26 2017-05-26 株価予測システム、株価予測方法及び株価予測プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017104050A JP6879552B2 (ja) 2017-05-26 2017-05-26 株価予測システム、株価予測方法及び株価予測プログラム

Publications (2)

Publication Number Publication Date
JP2018200513A JP2018200513A (ja) 2018-12-20
JP6879552B2 true JP6879552B2 (ja) 2021-06-02

Family

ID=64668175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017104050A Active JP6879552B2 (ja) 2017-05-26 2017-05-26 株価予測システム、株価予測方法及び株価予測プログラム

Country Status (1)

Country Link
JP (1) JP6879552B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102597042B1 (ko) * 2021-06-15 2023-10-31 김상율 머신러닝 알고리즘을 활용한 주식시장 예측 장치 및 방법
KR102847417B1 (ko) * 2024-12-18 2025-08-19 주식회사 커넥트 블록딜 거래 후 주식 종가 예측 시스템

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001175735A (ja) * 1999-12-17 2001-06-29 Canon Inc 時系列予測装置及びシステム及び方法及び記憶媒体
JP4461245B2 (ja) * 2003-05-07 2010-05-12 学校法人慶應義塾 株価変動数値解析装置
AU2004284807A1 (en) * 2003-10-23 2005-05-06 Financial Technology & Research Llc Analysis system for predicting performance
US20100114745A1 (en) * 2008-10-30 2010-05-06 Sap Ag System and method for calculating and applying market data change rate sets
JP6082657B2 (ja) * 2013-05-28 2017-02-15 日本電信電話株式会社 ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム

Also Published As

Publication number Publication date
JP2018200513A (ja) 2018-12-20

Similar Documents

Publication Publication Date Title
CN113099729B (zh) 生产调度的深度强化学习
Carbonneau et al. Application of machine learning techniques for supply chain demand forecasting
Athanassopoulos et al. A comparison of data envelopment analysis and artificial neural networks as tools for assessing the efficiency of decision making units
Koenig et al. Improving measurement and prediction in personnel selection through the application of machine learning
Pradhan et al. Forecasting exchange rate in India: An application of artificial neural network model
WO2015094545A1 (en) System and method for modeling and quantifying regulatory capital, key risk indicators, probability of default, exposure at default, loss given default, liquidity ratios, and value at risk, within the areas of asset liability management, credit risk, market risk, operational risk, and liquidity risk for banks
US20210117828A1 (en) Information processing apparatus, information processing method, and program
US20190244299A1 (en) System and method for evaluating decision opportunities
Naresh Kumar Reddy Forecasting e-commerce trends: utilizing linear regression, polynomial regression, random forest, and gradient boosting for accurate sales and demand prediction
Costain et al. Logit price dynamics
KR20190134966A (ko) 정책망 및 가치망을 이용한 온라인 쇼핑몰에서의 프로모션 성과 예측 및 추천 장치
López et al. A scenario-based modeling method for controlling ECM performance
US12223713B2 (en) Geospatial vegetation correlation system and method
Chica et al. Identimod: Modeling and managing brand value using soft computing
JP6879552B2 (ja) 株価予測システム、株価予測方法及び株価予測プログラム
CN109754104B (zh) 应用人工智能优化企业供应链的方法、系统、设备及介质
KR20190134967A (ko) 정책망 및 가치망을 이용한 온라인 쇼핑몰에서의 프로모션 이미지 수정 장치
Hosseini et al. Reinforcement learning-based simulation optimization for an integrated manufacturing-warehouse system: a two-stage approach
Tan et al. Modeling financial ratios of Malaysian plantation stocks using Bayesian Networks
Upreti et al. Assessing the effect of task automation in labor markets: Case of IT services industry
Chou et al. Estimating software project effort for manufacturing firms
Khumaidi et al. Forecasting of Sales Based on Long Short Term Memory Algorithm with Hyperparameter
Reza et al. An approach to make comparison of ARIMA and NNAR Models for Forecasting Price of Commodities
Chaveesuk et al. Economic valuation of capital projects using neural network metamodels
Sugiarti et al. Price Prediction of Aglaonema Ornamental Plants Using the Long Short-Term Memory (LSTM) Algorithm

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200417

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210420

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210422

R150 Certificate of patent or registration of utility model

Ref document number: 6879552

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250