JP6801149B1 - 情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP6801149B1 JP6801149B1 JP2020555257A JP2020555257A JP6801149B1 JP 6801149 B1 JP6801149 B1 JP 6801149B1 JP 2020555257 A JP2020555257 A JP 2020555257A JP 2020555257 A JP2020555257 A JP 2020555257A JP 6801149 B1 JP6801149 B1 JP 6801149B1
- Authority
- JP
- Japan
- Prior art keywords
- model
- models
- fitness
- population
- virtual model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 34
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000605 extraction Methods 0.000 claims abstract description 68
- 238000004364 calculation method Methods 0.000 claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 47
- 230000008569 process Effects 0.000 claims abstract description 35
- 239000000284 extract Substances 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 64
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 21
- 230000002068 genetic effect Effects 0.000 claims description 18
- 230000009471 action Effects 0.000 claims description 10
- 108090000623 proteins and genes Proteins 0.000 claims description 5
- 238000010801 machine learning Methods 0.000 description 22
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 239000000126 substance Substances 0.000 description 5
- 238000007726 management method Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Physiology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Communication Control (AREA)
Abstract
Description
金融商品取引に応用されるこの種の機械学習モデルは、例えば、景気動向、金利水準、外国為替、チャート等を入力データとして、特定銘柄の株式等を買うか(Buy)、売るか(Sell)、何もしないか(No Action:N/A)のいずれかを示す取引サインを出力する。
具体的には、特許文献1の投資モデル管理方法において、投資モデル管理サーバは、データベースに登録した各投資モデルについて、現実の取引市場における取引データに基づいて、過去及び/又は将来の仮想運用実績を算出し、各投資モデルの詳細や仮想運用実績(ランキング情報等)を、要求のあったユーザ端末に表示し、ユーザ端末から当該投資モデルによる実取引の申込みを受付けて必要な処理を実行する。
また、いわゆるアンサンブル学習等により、複数の機械学習モデルを融合させて1つの機械学習モデルを生成することが技術的に可能である。しかしながら、個々の機械学習モデルは異なるハイパーパラメータセットをそれぞれ有しており、異なる機械学習モデル同士を融合する場合、これら異なるハイパーパラメータセット同士で構成される多数のモデルの組み合わせをグリッドサーチにより最適化していくには、膨大な計算量を必要とし、多くのコンピュータ資源を長時間占有しかねない。
このため、機械学習モデルも、こうした市場変動に対してリアルタイムに追従して変化していかなければ市場予測における精度の低下を招いてしまう。したがって、多数の機械学習モデルから、最適な機械学習モデルを自動的に選択する処理は、より低負荷かつ高速で実行可能であることが要請される。
上記した本発明の目的、態様及び効果並びに上記されなかった本発明の目的、態様及び効果は、当業者であれば添付図面及び請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。
以下、本実施形態に係る学習モデル抽出装置により抽出される機械学習用の学習済みモデルを、単に、「モデル」または「学習モデル」という。
本実施形態では、遺伝的アルゴリズムにおける適応度関数として、金融商品取引における効用ないし有用度を定量的に評価するユーティリティ(utility)関数を用いる。なお、上述したような金融商品取引以外の応用分野において本実施形態を適用する場合も同様に、最適化したい重要な指標を含むユーティリティ関数を用いればよい。
図1は、本実施形態に係る学習モデル抽出装置の機能構成の一例を示すブロック図である。
図1に示す学習モデル抽出装置1は、モデル記憶部11、データ入力部12、有用値算出部13、仮想モデル生成部14、モデル置換部15、モデル抽出部16、通信部17、および表示制御部18を備える。
モデル記憶部11は、学習モデル抽出装置1の記憶装置内に構成される。記憶装置は、RAM(Random Access Memory)等の揮発性メモリ、ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の不揮発性メモリ、着脱可能な外部メモリ等から構成されてよい。記憶装置は、システムバスを介して、学習モデル抽出装置1内の各ブロック11〜17が共有して利用可能な記憶領域であり、各種データの保存やワークメモリとして使用されてよい。なお、記憶装置は、学習モデル抽出装置1の内部に備えられてもよいし、学習モデル抽出装置1と通信可能な外部装置(例えば、サーバ等)として備えられてもよい。
本実施形態におけるモデルは、金融商品取引のマクロ経済データや為替データ等を入力データとし、取引のアクションを示す取引サインを最適解として推論して出力データとする。
モデルが出力する出力データである取引サインは、例えば、特定銘柄の株式等の金融商品を買うか(Buy)、売るか(Sell)、何もしないか(No Action:N/A)のいずれかの取引のアクションを示す。この取引サインは、株式先物、インデックス先物(日経(NK)225、NYダウ(DJI)等)、債券先物(日本国債(JGB)、米ドル建て(USD)債券等)、商品先物等の各種金融商品の取引に使用される。
金融取引の実績に関するデータは、例えば、入力データに対応する金融商品の価格変動実績(例えば、上昇、下降等)に関するデータや、入力データに対応する金融取引の正解データ(例えば、金融商品の価格の上昇に対して「買い」を示すデータ)を含む。
モデルには任意の機械学習のアルゴリズムを適用することができ、例えば、SVM(Supprt Vector Machine)、CNN(Convolutional Neural Network)、ランダムフォレスト(Random Forests)等のいずれか、またはこれらの組み合わせを用いてよい。
なお、本実施形態は、複数の所与の学習済みモデルから最適化されたモデルを抽出することを主題とするものであり、学習済みモデルの構築および訓練自体につき、以降では詳述しない。
より具体的には、データ入力部12に入力されるサンプルデータは、それぞれのモデルの金融商品取引におけるパフォーマンスないし効用を定量的に算出するユーティリティ関数(utility function)のパラメータ値を導出して、金融商品取引市場におけるモデルの効用を定量的に評価する有用値を算出するためのデータであり、所定期間の過去のマクロ経済データ、為替データ、取引実績、すなわち取引実行内容と取引実行結果のデータを含む。
データ入力部12は、入力された所定数のサンプルデータを、記憶装置に予め記憶し、有用値算出部13が記憶装置に記憶されたサンプルデータを読み出してユーティリティ関数のパラメータ値を導出してもよい。
親モデル同士をクロスオーバすることで生成される仮想モデルは、学習モデルとしての実体を有さず、親モデルを示す情報を有する仮想的なモデルである。親モデルから仮想モデルを生成する処理の詳細は、図2および図3を参照して後述する。
仮想モデル生成部14によって生成された仮想モデルの有用値は、有用値算出部13によって、ユーティリティ関数を用いて算出される。
モデル置換部15は、所定の終了条件に到達するまで、母集団に含まれるモデルの置換処理を繰り返す。
多数のモデルの中から、モデル抽出部16により抽出されたモデルは、最適化された学習済みモデルであり、抽出されたモデルに対して、予測すべき時点のマクロ経済データや為替データ等の入力データを入力することで、将来の取引サインを高精度に推論予測することが可能となる。
なお、有用値算出部13は、請求項における第1の適応度算出部および第2の適応度算出部に、仮想モデル生成部14は、請求項における仮想モデル生成部に、モデル置換部15は、請求項におけるモデル置換部に、モデル抽出部16は、請求項におけるモデル抽出部に、それぞれ相当する。
遺伝的アルゴリズム(genetic algorithm)とは、自然進化の理論に基づく進化型アルゴリズムと呼ばれる最適化手法の1つであり、次世代の子孫を生み出すために、生殖に最適な固体が選択されるという自然淘汰(natural selection)のプロセスを反映している。
遺伝的アルゴリズムは、複数の解の候補のうちから、より適応度(fitness)の高い最適解を探索するアルゴリズムである。
具体的には、本実施形態において、学習モデル抽出装置1は、遺伝的アルゴリズムを、以下のとおりに応用する。
遺伝的アルゴリズムにおける適応度関数(fitness function)として、詳細を後述する上記のユーティリティ関数(utility function)を用いて、各モデルのパフォーマンスないし効用を評価する。
親モデルのクロスオーバプロセスとして、決定された2個の親モデルが出力する取引サイン同士を組み合わせることにより、組み合わせられた取引サインを出力する仮想モデルを子孫モデルとして生成する。なお、本実施形態に係る遺伝的アルゴリズムにおけるクロスオーバの手法の詳細は、図3を参照して後述する。
なお、遺伝的アルゴリズムにおける変異(mutation)は、本実施形態では適用しない例を説明するが、代替的に、本実施形態の学習モデル抽出装置1は、変異を適用して、子孫モデルにおいて、取引サインの一部を変異させてもよい。
図2は、本実施形態に係る学習モデル抽出装置1が実行する学習モデル抽出処理の処理手順の一例を示すフローチャートである。
なお、図2の各ステップは、学習モデル抽出装置1の記憶装置に記憶されたプログラムをCPUが読み出し、実行することで実現される。また、図2に示すフローチャートの少なくとも一部をハードウエアにより実現してもよい。ハードウエアにより実現する場合、例えば、所定のコンパイラを用いることで、各ステップを実現するためのプログラムからFPGA(Field Programmable Gate Array)上に自動的に専用回路を生成すればよい。また、FPGAと同様にしてGate Array回路を形成し、ハードウエアとして実現するようにしてもよい。また、ASIC(Application Specific Integrated Circuit)により実現するようにしてもよい。
S2で、有用値算出部13は、S1で初期化したN個のモデルのそれぞれを、下記式1で示されるユーティリティ関数を用いて評価する。
ユーティリティ関数のパラメータであるこれらR、WR、SR、TF、およびΔWRは、いずれも金融商品取引における取引指標(trading metrics)である。また、α、β、γ、δ、εは、いずれも、それぞれ異なる取引指標に対して適宜調整されるべき任意の係数である。非限定的一例として、各係数は、α=[1,2]、β=[1,2,5]、γ=[1,5,10]、δ=[0]、ε=[1]から選択されてよい。
S4で、仮想モデル生成部14およびモデル置換部15は、世代数のカウンタCを1に設定し、第1世代において遺伝的アルゴリズムに基づくS5〜S12までの処理を実行する。
S6で、仮想モデル生成部14は、S5で選択されたn個の個別モデルのうち、最大の有用値を有する2個の個別モデルを、第1世代でクロスオーバ(交叉)させるべき親モデルとして選択する。なお、S6で親モデルとして選択される個別モデルの数は、2個に限定されず、3個以上であってもよい。
本実施形態において、仮想モデル生成部14は、子孫モデルとして、学習モデルとしての実体(パラメータ群)を持たず、親モデルが出力する取引サインを組み合わせることによって仮想モデルを生成する。
すなわち、仮想モデルは、親モデルを示す情報として、所定数の親モデルの出力結果を組み合わせ演算した出力結果、または組み合わせ演算した出力結果を算出するための親モデルの出力結果の情報を記憶し、当該出力結果の基となった親モデルの世代(系譜)の情報を、例えば木構造で記憶する仮想的なモデルである。
ここで、組み合わせの基となる出力結果を出力するモデルを親モデル(先祖モデル)といい、これらの親モデルの出力結果に対して所定の組み合わせ演算を行うことによって得られる出力結果を出力するモデルを子モデル(子孫モデル)という。
各親モデルは、過去の所定期間(例えば、365日、250営業日)において所定間隔毎に、買い(Buy)、売り(Sell)、何もしない(N/A)という取引のアクションをそれぞれ示す取引サインを出力する。
図3に示す例では、クロスオーバ(交叉)されるべき親1モデルは、出力結果である取引サインとして、Buy、Sell、N/A、Buy、Sell、Buyの6つの取引サインを過去に出力したものとする。一方、クロスオーバされるべき親2モデルは、取引サインとして、Buy、N/A、N/A、Sell、Sell、Sellの6つの取引サインを過去に出力したものとする。
6つの取引サインは、親1および親2モデルから所定間隔毎に出力される取引サインであり、所定間隔は、例えば数秒、数分、数時間、数日等の任意の間隔に設定される。例えば、任意の間隔は、取引が行われる間隔に合わせて、例えば4時間に設定されてもよく、6つの取引サインは、24時間分の取引サインを示してもよい。本実施形態では、親1および親2モデルが出力するこのような取引サインのシーケンスが、クロスオーバにおいて使用される。ただし、過去の所定期間において出力される取引サインの数は、図3に例示する6つに限定されない。
なお、子モデルである仮想モデルは、図3に示す取引サインのシーケンス自体を保持しなくてもよい。この場合、子モデルである仮想モデルは、クロスオーバされるべき親モデル(親1、親2)のそれぞれの出力結果である取引サインの情報と、親モデルの世代(系譜)を示す情報とを保持すればよく、親1および親2モデルの出力結果である取引サインを組み合わせることによって、子モデルの取引サインを動的に導出(算出)可能であればよい。
上述したように、S7で生成された取引サインは、過去の所定期間において所定間隔毎に子モデルが出力した取引サインとして扱われる。
本実施形態では、子モデルが出力する取引サインを過去の取引において実際に使用したと仮定した場合に、どのような取引実績が得られたかを確認することによって、取引指標を算出する。
図3に示す例では、子モデルである仮想モデルは、取引サインとして、Buy、Sell、N/A、N/A、Sell、N/Aの6つの取引サインを出力している。上述したように、子モデルの取引指標としての取引頻度TFは、買いまたは売りの取引が実際に行われた頻度である。したがって、子モデルの6つの取引サインのうち、3つのN/A(何もしない)の取引サインに対応する取引は行われなかったことになるから、子モデルの取引頻度TFは50%と算出される。
また、リターンRは、子モデルが出力する取引サインを使用した取引において得られる合計リターンとして算出される。上述したように、子モデルの3つのN/Aの取引サインに対応する取引は行われなかったことになるから、3つのN/Aの取引サインに対応するリターンは0になる。一方、Buy、Sell、Sellの取引サインを使用した取引において得られる合計リターンとして、リターンRが算出されることになる。
シャープレシオSR、買いおよび売りの間の勝率の差分ΔWRも、子モデルが出力する取引サインを過去の取引において実際に使用したと仮定した場合に得られる取引実績に基づいて、同様に算出され得る。ただし、取引サインから取引指標を算出する方法は、上述した例に限定されず、任意の他の算出方法が用いられてもよい。また、S2で、初期モデルを評価する際にも、初期モデルが出力する取引サインを過去の取引において実際に使用したと仮定した場合に得られる取引実績に基づいて、初期モデルの取引指標が同様に算出され、ユーティリティ関数に代入されてもよい。
S10で、モデル置換部15は、S7で生成され、S9でユーティリティ関数を用いて有用値が算出された子モデル(仮想モデル)を、S2で準備された母集団に追加する。すなわち、S10の段階で、母集団には、1個の子モデルを含むN+1個のモデルが含まれることになる。
S11で、モデル置換部15は、母集団を構成するN+1個のモデルのうち、最低の有用値を有する1個のモデルを削除する。すなわち、S11の段階で、母集団に属するモデルは、N個に戻ることになる。
S13で、モデル置換部15は、世代数のカウンタCが、閾値である最大世代数MaxCより小さいか否かを判定する。非限定的一例として、最大世代数MaxCは、5000である。
世代数のカウンタCが、最大世代数MaxCより小さい場合(S13:Y)、S5に戻って、次の世代について、S5からS12までの処理を繰り返す。各世代において、高い有用値を有する親モデル同士のクロスオーバにより子孫モデル(仮想モデル)が生成されて、母集団に加えられるが、モデル置換部15は、母集団の数を、S3の初期値であるN個に維持する。
S14で、モデル抽出部16は、母集団に属するN個のモデルのうち、最も高い有用値を持つ1個のモデルを、最適化されたモデルとして抽出(選択)する。表示制御部18は、抽出されたモデルを、表示装置を介してユーザに提示してもよい。そして、学習モデル抽出装置1は、処理を終了する。
S14では、母集団には、S3で母集団に含められた学習モデルとしての実体を有する初期の個別モデルと、親モデル同士のクロスオーバで生成された子孫モデル(仮想モデル)とが混在している。
ここで、S14で最終的に最も高い有用値を持つ最適化モデルとして選択されたモデルが、仮想モデルである子孫モデルである場合、当該仮想モデルは、親モデルの出力結果(取引サイン)を組み合わせ演算して当該仮想モデルの出力結果(取引サイン)を出力するための情報を持つが、学習モデルとしての実体を持たないから、当該仮想モデルに直接マクロ経済データや為替データ等の入力データを入力して、取引サインを推論予測させることができない。
同時に、仮想モデル生成部14は、どの親モデルがどの世代で当該子孫モデル(仮想モデル)を生成するためのクロスオーバに追加されたのかを示す情報として、例えば、木構造で記述される、親モデルの世代(系譜)の情報を、当該子孫モデルに対応付けてモデル記憶部11に記憶しておく。
図4を参照して、第1世代(Generation−1)には、親1モデルM[1]と親2モデルM[2]とが属し、親1モデルと親2モデルとをクロスオーバすることで、第2世代(Generation−2)の子孫モデルM[1,2]が生成されたものとする。
さらに、第2世代の子孫モデルM[1,2]を親1モデルとし、親2モデルであるモデルM[3]とクロスオーバすることで、第3世代(Generation−3)の子孫モデルM[1,2,3]が生成されたものとする。
この場合、第3世代の子孫モデルM[1,2,3]は、実体のある3つの親モデルM[1]、M[2]、およびM[3]の情報を、これら親モデルが属する世代の情報とともに、保持することとなる。
さらに、モデル抽出部16により抽出された最適化モデルである子孫モデルをクロスオーバで生成する基となった先祖モデルに世代を遡って、先祖モデルの実体を融合することによって、最適化モデルである子孫モデルの実体を構築し、学習済みモデルとして直接利用可能としてよい。
上記実施形態の変形例として、学習モデル抽出装置1は、異なる係数の組み合わせを含む複数のユーティリティ関数を備え、複数のユーティリティ関数のそれぞれについて最適化モデルを選択して、選択された複数のモデルをユーザに提示してもよい。
図5は、本変形例に係る学習モデル抽出装置1が実行する複数の学習モデルの抽出処理の処理手順の一例を示すフローチャートである。
S52で、有用値算出部13は、S51で取得された異なる係数の組み合わせを含む複数のユーティリティ関数を設定する。
S53で、学習モデル抽出装置1は、S52で設定された複数のユーティリティ関数のそれぞれについて、図2のS2〜S14の処理を実行する。なお、複数のユーティリティ関数の間で、S1で初期化される個別モデル群は共通である。
タイプ1:[α,β,・・・]=[1,1,・・・]:Utility=1*R+1*WR+・・・
タイプ2:[α,β,・・・]=[1,2,・・・]:Utility=1*R+2*WR+・・・
タイプ3:[α,β,・・・]=[2,1,・・・]:Utility=2*R+1*WR+・・・
タイプ4:[α,β,・・・]=[2,2,・・・]:Utility=2*R+2*WR+・・・
この場合、当初、図2のS2では、タイプ1〜4のユーティリティ関数毎に、共通の初期モデルの評価を開始することになる。
しかしながら、異なる係数の組み合わせを含むタイプ1〜4のユーティリティ関数を用いて異なる有用値を算出し、遺伝的アルゴリズムによりランダム選択が実行されることにより、最終的に図2のS14では、タイプ1〜4のユーティリティ関数毎に異なる複数のモデルが最適化モデルとして選択され得る。
これにより、多数のモデルの中から絞り込まれた複数の候補モデルの中から、実際の金融商品取引において使用するモデルをユーザに決定させることができる。したがって、マニュアルで多数のモデルから1つのモデルをユーザに選択させる場合と比較して、ユーザにモデル選択の余地を残しつつ、モデル選択に係るユーザの労力を大幅に軽減することができる。
具体的には、学習モデル抽出装置1は、S7で生成しようとする仮想モデルが参照する先祖モデルの数が閾値を超える場合、図2のS7〜S11の処理をスキップしてよい。すなわち、この場合、仮想モデル生成部14は、仮想モデルを生成せず、また、モデル置換部15は、母集団を構成するモデル群を更新しない、すなわち母集団に含まれるモデルを置き換えない。
これにより、多数の先祖モデルを持つ仮想モデルについての計算量が膨大化することを予め回避することができ、モデル抽出における処理負荷が軽減する。
これにより、子モデルを効率よく生成することができ、最大世代数MaxCが小さい値に設定されていた場合でも、初期の個別モデルと多数の子孫モデルの中から、最適化モデルを抽出できる。
図6は、本実施形態に係る学習モデル抽出装置1のハードウエア構成の一例を示す図である。
本実施形態に係る学習モデル抽出装置1は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上に実装することができる。
図6に示すように、学習モデル抽出装置1は、CPU21と、ROM22と、RAM23と、外部メモリ24と、入力部25と、表示部26と、通信I/F27と、システムバス28とを備える。学習モデル抽出装置1はまた、HDDを内蔵してよい。
学習モデル抽出装置はさらに、仮想モデルを母集団に追加するとともに、母集団に属する複数のモデルのうち、有用値が低いモデルを母集団から削除することで、母集団を形成するモデルを置き換え、仮想モデル生成、有用値算出、およびモデル置換の各処理を、所定の終了条件に到達するまで繰り返して、母集団から有用値の最も高いモデルを抽出する。
したがって、本実施形態によれば、コンピュータ資源への負荷を低減しつつ、多数の学習モデルから、より高精度な学習モデルを、高速で自動的に抽出することができ、最適化された学習モデルによる高精度の推論が実現される。
Claims (15)
- 母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出する第1の適応度算出部と、
前記複数のモデルのうち、前記第1の適応度算出部により算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成する仮想モデル生成部と、
前記所定の関数を用いて前記仮想モデルの前記適応度を算出する第2の適応度算出部と、
前記仮想モデルを前記母集団に追加するとともに、前記母集団に属する前記複数のモデルのうち、前記適応度が低いモデルを前記母集団から削除することで、前記母集団を形成するモデルを置き換えるモデル置換部と、
前記仮想モデル生成部、前記第2の適応度算出部、および前記モデル置換部による処理を、所定の終了条件に到達するまで繰り返して、前記母集団から前記適応度の高いモデルを抽出するモデル抽出部と
を備える情報処理装置。 - 前記第2の適応度算出部は、前記仮想モデルの前記出力結果から、前記所定の関数に代入すべきパラメータを導出し、導出された前記パラメータを前記所定の関数に代入することにより、前記仮想モデルの前記適応度を算出する
請求項1に記載の情報処理装置。 - 前記仮想モデル生成部により生成される前記仮想モデルは、前記複数の親モデルのそれぞれの出力結果および世代の情報を有する
請求項1または2に記載の情報処理装置。 - 前記仮想モデル生成部は、前記複数のモデルのうち、ランダムに選択された複数のモデルでサブセットを形成し、形成された前記サブセットに属する複数のモデルのうち、前記適応度がより高い複数のモデルを親モデルとして選択する
請求項1から3のいずれか1項に記載の情報処理装置。 - 前記仮想モデル生成部は、生成しようとする前記仮想モデルが参照する前記親モデルの数が所定の閾値を超える場合、前記仮想モデルを生成しない
請求項1から4のいずれか1項に記載の情報処理装置。 - 前記第1の適応度算出部および前記第2の適応度算出部は、モデルの取引指標をパラメータとしてユーティリティ関数に代入することにより、前記モデルの市場における効用を定量的に示す有用値を、前記適応度として算出する
請求項1から5いずれか1項に記載の情報処理装置。 - 前記取引指標は、前記モデルを使用した取引におけるリターン、勝率、シャープレシオ、取引頻度、買いおよび売り間の勝率の差分のいずれか1つ以上を含む
請求項6記載の情報処理装置。 - 前記仮想モデル生成部により生成される前記仮想モデルは、前記複数の親モデルの取引のアクションを示す取引サインを演算して得られた取引サインを出力する
請求項1から6のいずれか1項に記載の情報処理装置。 - 前記取引サインは、買い(Buy)、売り(Sell)、およびノーアクション(N/A)のいずれかを示す
請求項8記載の情報処理装置。 - 前記仮想モデル生成部は、前記複数の親モデルが出力する前記取引サインの各々に対応する所定の点数を付与し、付与された前記点数を加算することにより、前記仮想モデルの取引サインを生成する
請求項8または9に記載の情報処理装置。 - 前記仮想モデル生成部は、前記複数の親モデルが出力する前記取引サインのそれぞれを遺伝子として、遺伝的アルゴリズムを用いて前記複数の親モデルをクロスオーバすることにより、前記仮想モデルを生成する
ことを特徴とする請求項8から10のいずれか1項に記載の情報処理装置。 - 前記第1の適応度算出部および前記第2の適応度算出部は、異なる係数の組み合わせを含む複数の所定の関数を用いて、前記適用度を算出し、
前記モデル抽出部は、前記仮想モデル生成部、前記第2の適応度算出部、および前記モデル置換部による処理を、前記複数の所定の関数のそれぞれについて、所定の終了条件に到達するまで繰り返して、前記複数の所定の関数ごとに、モデルを抽出する
請求項1から10のいずれか1項に記載の情報処理装置。 - 前記モデル抽出部により抽出された複数のモデルを候補モデルとして表示出力するとともに、前記候補モデルの中からいずれか1つ以上のモデルを選択する入力を受け付けるユーザインタフェースを提供する表示制御部をさらに備える
請求項12に記載の情報処理装置。 - 情報処理装置が実行する情報処理方法であって、
母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出するステップと、
前記複数のモデルのうち、算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成するステップと、
前記所定の関数を用いて前記仮想モデルの前記適応度を算出するステップと、
前記仮想モデルを前記母集団に追加するとともに、前記母集団に属する前記複数のモデルのうち、前記適応度が低いモデルを前記母集団から削除することで、前記母集団を形成するモデルを置き換えるステップと、
前記仮想モデルを生成するステップ、前記仮想モデルの適応度を算出するステップ、および前記モデルを置き換えるステップを、所定の終了条件に到達するまで繰り返して、前記母集団から前記適応度の高いモデルを抽出するステップと
を含む情報処理方法。 - 情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出する第1の適応度算出処理と、
前記複数のモデルのうち、前記第1の適応度算出処理により算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成する仮想モデル生成処理と、
前記所定の関数を用いて前記仮想モデルの前記適応度を算出する第2の適応度算出処理と、
前記仮想モデルを前記母集団に追加するとともに、前記母集団に属する前記複数のモデルのうち、前記適応度が低いモデルを前記母集団から削除することで、前記母集団を形成するモデルを置き換えるモデル置換処理と、
前記仮想モデル生成処理、前記第2の適応度算出処理、および前記モデル置換処理を、所定の終了条件に到達するまで繰り返して、前記母集団から前記適応度の高いモデルを抽出するモデル抽出処理と、を含む処理を実行させるためのものである、
情報処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/001767 WO2021149118A1 (ja) | 2020-01-20 | 2020-01-20 | 情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6801149B1 true JP6801149B1 (ja) | 2020-12-16 |
JPWO2021149118A1 JPWO2021149118A1 (ja) | 2021-07-29 |
Family
ID=73741003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020555257A Active JP6801149B1 (ja) | 2020-01-20 | 2020-01-20 | 情報処理装置、情報処理方法およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11928698B2 (ja) |
EP (1) | EP3876181B1 (ja) |
JP (1) | JP6801149B1 (ja) |
TW (1) | TWI781461B (ja) |
WO (1) | WO2021149118A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022215559A1 (ja) * | 2021-04-05 | 2022-10-13 | パナソニックIpマネジメント株式会社 | ハイブリッドモデル作成方法、ハイブリッドモデル作成装置、及び、プログラム |
JP7544633B2 (ja) | 2021-03-18 | 2024-09-03 | 株式会社奥村組 | シールド掘進機の施工管理方法 |
JP7556983B2 (ja) | 2020-12-25 | 2024-09-26 | ファナック株式会社 | 機械学習装置、及び機械学習方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3876181B1 (en) * | 2020-01-20 | 2023-09-06 | Rakuten Group, Inc. | Information processing device, information processing method, and program |
CN114820167A (zh) * | 2022-04-27 | 2022-07-29 | 中国农业银行股份有限公司 | 一种银行网点的运营管理方法、装置及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008204103A (ja) * | 2007-02-19 | 2008-09-04 | Yokohama National Univ | 画像認識システム |
JP2012525650A (ja) * | 2009-04-28 | 2012-10-22 | ジェネティック ファイナンス (バルバドス) リミテッド | クラスベースの資産管理及び資産取引の為の分散型進化的アルゴリズム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002057946A1 (en) * | 2001-01-18 | 2002-07-25 | The Board Of Trustees Of The University Of Illinois | Method for optimizing a solution set |
US20050005261A1 (en) * | 2003-07-02 | 2005-01-06 | Severin William B. | Component integration engine |
WO2006085460A1 (ja) | 2005-02-10 | 2006-08-17 | Ssd Company Limited | 投資モデル管理方法及び投資モデル管理サーバ |
US8909570B1 (en) * | 2008-11-07 | 2014-12-09 | Genetic Finance (Barbados) Limited | Data mining technique with experience-layered gene pool |
CN101939727A (zh) * | 2007-11-08 | 2011-01-05 | 遗传学金融(巴巴多斯)有限公司 | 执行复杂算法的分布式网络 |
JP5695030B2 (ja) * | 2009-04-28 | 2015-04-01 | センティエント テクノロジーズ (バルバドス) リミテッド | 資産管理及び資産取引の為の分散型進化的アルゴリズム |
WO2011091054A1 (en) * | 2010-01-19 | 2011-07-28 | Johannes Ronald L | Computing trading strategies for portfolio management and associated probability distributions for option pricing |
WO2011120200A1 (zh) * | 2010-04-01 | 2011-10-06 | 江苏六维物流设备实业有限公司 | 堆垛机的遗传优化控制技术 |
TWI560634B (en) * | 2011-05-13 | 2016-12-01 | Univ Nat Taiwan Science Tech | Generating method for transaction modes with indicators for option |
US9002759B2 (en) * | 2011-07-15 | 2015-04-07 | Sentient Technologies (Barbados) Limited | Data mining technique with maintenance of fitness history |
US11055730B2 (en) * | 2017-06-05 | 2021-07-06 | International Business Machines Corporation | Optimizing predictive precision for actionable forecasts of revenue change |
US10366322B2 (en) * | 2017-10-06 | 2019-07-30 | DeepCube LTD. | System and method for compact and efficient sparse neural networks |
US11348032B1 (en) * | 2018-09-02 | 2022-05-31 | Meta Platforms, Inc. | Automated generation of machine learning models |
US11386496B2 (en) * | 2019-07-26 | 2022-07-12 | International Business Machines Corporation | Generative network based probabilistic portfolio management |
US11055783B2 (en) * | 2019-08-28 | 2021-07-06 | Ttc Holdings Inc. | Trading platforms using market sentiment and dynamic risk assessment profiles |
EP3876181B1 (en) * | 2020-01-20 | 2023-09-06 | Rakuten Group, Inc. | Information processing device, information processing method, and program |
-
2020
- 2020-01-20 EP EP20803073.4A patent/EP3876181B1/en active Active
- 2020-01-20 WO PCT/JP2020/001767 patent/WO2021149118A1/ja unknown
- 2020-01-20 JP JP2020555257A patent/JP6801149B1/ja active Active
- 2020-01-20 US US17/056,071 patent/US11928698B2/en active Active
- 2020-10-14 TW TW109135501A patent/TWI781461B/zh active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008204103A (ja) * | 2007-02-19 | 2008-09-04 | Yokohama National Univ | 画像認識システム |
JP2012525650A (ja) * | 2009-04-28 | 2012-10-22 | ジェネティック ファイナンス (バルバドス) リミテッド | クラスベースの資産管理及び資産取引の為の分散型進化的アルゴリズム |
Non-Patent Citations (2)
Title |
---|
王 亜騰 ほか: "「多目的GAで獲得した非劣解集合の多数決戦略に基づく外国為替取引手法」", 情報処理学会研究報告 数理モデル化と問題解決(MPS) [オンライン], vol. 第2016-MPS-111巻, 第26号, JPN6020006271, 2016, pages 1 - 6, ISSN: 0004386910 * |
辻岡 卓 ほか: "「取引戦略生成に適した評価指標の検討」", 第7回 人工知能学会 ファイナンスにおける人工知能応用研究会(SIG−FIN) [オンライン], JPN6020006272, 21 February 2013 (2013-02-21), pages 26 - 30, ISSN: 0004386911 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7556983B2 (ja) | 2020-12-25 | 2024-09-26 | ファナック株式会社 | 機械学習装置、及び機械学習方法 |
JP7544633B2 (ja) | 2021-03-18 | 2024-09-03 | 株式会社奥村組 | シールド掘進機の施工管理方法 |
WO2022215559A1 (ja) * | 2021-04-05 | 2022-10-13 | パナソニックIpマネジメント株式会社 | ハイブリッドモデル作成方法、ハイブリッドモデル作成装置、及び、プログラム |
Also Published As
Publication number | Publication date |
---|---|
EP3876181A1 (en) | 2021-09-08 |
TWI781461B (zh) | 2022-10-21 |
EP3876181A4 (en) | 2021-09-08 |
TW202129584A (zh) | 2021-08-01 |
WO2021149118A1 (ja) | 2021-07-29 |
US11928698B2 (en) | 2024-03-12 |
US20210406932A1 (en) | 2021-12-30 |
EP3876181B1 (en) | 2023-09-06 |
JPWO2021149118A1 (ja) | 2021-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6801149B1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
Dixon et al. | Classification-based financial markets prediction using deep neural networks | |
Zięba et al. | Ensemble boosted trees with synthetic features generation in application to bankruptcy prediction | |
Ozturk et al. | Heuristic based trading system on Forex data using technical indicator rules | |
Geva et al. | Empirical evaluation of an automated intraday stock recommendation system incorporating both market data and textual news | |
Nadkarni et al. | Combining NeuroEvolution and Principal Component Analysis to trade in the financial markets | |
Özorhan et al. | A strength-biased prediction model for forecasting exchange rates using support vector machines and genetic algorithms | |
Sun et al. | Solving the multi-stage portfolio optimization problem with a novel particle swarm optimization | |
Radojičić et al. | The impact of stock market price fourier transform analysis on the gated recurrent unit classifier model | |
Duda et al. | Collective intelligence of genetic programming for macroeconomic forecasting | |
Alzaman | Forecasting and optimization stock predictions: Varying asset profile, time window, and hyperparameter factors | |
Ghezelbash et al. | Design and implementation of artificial neural network system for stock exchange prediction | |
Wang et al. | Non-linear stochastic optimization using genetic algorithm for portfolio selection | |
Deng et al. | A new fuzzy random multi-objective portfolio model with different entropy measures using fuzzy programming based on artificial bee colony algorithm | |
Erica et al. | Agglomerative clustering and genetic algorithm in portfolio optimization | |
Yang et al. | A comparison of US and Chinese financial market microstructure: heterogeneous agent-based multi-asset artificial stock markets approach | |
Mehta et al. | Analyzing Portfolio of biotech companies and predicting stock market using machine learning | |
De Amorim et al. | Assessing the interactions amongst index tracking model formulations and genetic algorithm approaches with different rebalancing strategies | |
De Amorim et al. | Evaluation of index tracking portfolios during the covid-19 pandemic | |
Layfield et al. | Explainability and Interpretability in Decision Trees and Agent based Modelling when Approximating Financial Time series. A matter of balance with performance | |
Osei-Bryson | Post-pruning in regression tree induction: An integrated approach | |
Khan et al. | Evolving technical trading strategies using genetic algorithms: A case about Pakistan stock exchange | |
Bulusu et al. | Near future stock market forecasting based on chaos theory, sentiment analysis, and quantum computing | |
Xu et al. | The double-edged role of social learning: Flash crash and lower total volatility | |
Blaszczyk et al. | Assessment of the risk of the project's contractor bankruptcy using the Partial Least Squares approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201008 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20201008 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20201026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6801149 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |