JP6801149B1 - 情報処理装置、情報処理方法およびプログラム - Google Patents

情報処理装置、情報処理方法およびプログラム Download PDF

Info

Publication number
JP6801149B1
JP6801149B1 JP2020555257A JP2020555257A JP6801149B1 JP 6801149 B1 JP6801149 B1 JP 6801149B1 JP 2020555257 A JP2020555257 A JP 2020555257A JP 2020555257 A JP2020555257 A JP 2020555257A JP 6801149 B1 JP6801149 B1 JP 6801149B1
Authority
JP
Japan
Prior art keywords
model
models
fitness
population
virtual model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020555257A
Other languages
English (en)
Other versions
JPWO2021149118A1 (ja
Inventor
ディネシュ ドルタニ
ディネシュ ドルタニ
ブリューノ アンドレ シャロン
ブリューノ アンドレ シャロン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rakuten Group Inc
Original Assignee
Rakuten Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rakuten Inc filed Critical Rakuten Inc
Application granted granted Critical
Publication of JP6801149B1 publication Critical patent/JP6801149B1/ja
Publication of JPWO2021149118A1 publication Critical patent/JPWO2021149118A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Technology Law (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Physiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Communication Control (AREA)

Abstract

情報処理装置(1)は、母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出する第1の適応度算出部(13)と、複数のモデルのうち、第1の適応度算出部により算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成する仮想モデル生成部(14)と、所定の関数を用いて仮想モデルの適応度を算出する第2の適応度算出部(13)と、仮想モデルを母集団に追加するとともに、母集団に属する前記複数のモデルのうち、適応度が低いモデルを母集団から削除することで、母集団を形成するモデルを置き換えるモデル置換部(15)と、仮想モデル生成部、第2の適応度算出部、およびモデル置換部による処理を、所定の終了条件に到達するまで繰り返して、母集団から適応度の高いモデルを抽出するモデル抽出部(16)とを備える。

Description

本発明は、情報処理装置、情報処理方法およびプログラムに関し、特に、機械学習用の学習モデルを自動抽出する技術に関する。
機械学習モデルは、例えば、デイトレーディング等の投資などの各種金融商品取引に応用されており、機械学習による金融市場動向の予測等を可能にしている。
金融商品取引に応用されるこの種の機械学習モデルは、例えば、景気動向、金利水準、外国為替、チャート等を入力データとして、特定銘柄の株式等を買うか(Buy)、売るか(Sell)、何もしないか(No Action:N/A)のいずれかを示す取引サインを出力する。
現状、多数の機械学習モデルが、このような投資などの金融商品取引に応用されるために存在しており、これら多数の機械学習モデルのうち、いかなる機械学習モデルを選択するかが、金融市場動向の予測精度を左右する。
特許文献1(WO2006/085460号公報)は、複数の投資モデルから実取引に用いる投資モデルをユーザに選択させる投資モデル管理方法を開示する。
具体的には、特許文献1の投資モデル管理方法において、投資モデル管理サーバは、データベースに登録した各投資モデルについて、現実の取引市場における取引データに基づいて、過去及び/又は将来の仮想運用実績を算出し、各投資モデルの詳細や仮想運用実績(ランキング情報等)を、要求のあったユーザ端末に表示し、ユーザ端末から当該投資モデルによる実取引の申込みを受付けて必要な処理を実行する。
WO2006/085460号公報
しかしながら、多数の機械学習モデルから、予測精度の高い機械学習モデルをマニュアルで選択することは、膨大な時間および労力を要し、実用性に欠ける。一方、ランダムに機械学習モデルを選択することは、労力を軽減する一方、予測精度を低下させてしまう。
また、いわゆるアンサンブル学習等により、複数の機械学習モデルを融合させて1つの機械学習モデルを生成することが技術的に可能である。しかしながら、個々の機械学習モデルは異なるハイパーパラメータセットをそれぞれ有しており、異なる機械学習モデル同士を融合する場合、これら異なるハイパーパラメータセット同士で構成される多数のモデルの組み合わせをグリッドサーチにより最適化していくには、膨大な計算量を必要とし、多くのコンピュータ資源を長時間占有しかねない。
特に、金融商品取引においては、金融市場が時々刻々と変動し、取引実行の最適解も時々刻々と変化していく。例えば、市場において1日に実行すべき為替取引のトランザクションのボリュームは、例えば、数百億米ドルに上り、為替レートの更新頻度も、例えば、5msと極めて高頻度であって、1日に数百万回に及ぶレートの更新が発生する。
このため、機械学習モデルも、こうした市場変動に対してリアルタイムに追従して変化していかなければ市場予測における精度の低下を招いてしまう。したがって、多数の機械学習モデルから、最適な機械学習モデルを自動的に選択する処理は、より低負荷かつ高速で実行可能であることが要請される。
本発明は上記課題を解決するためになされたものであり、その目的は、コンピュータ資源への負荷を低減しつつ、多数の学習モデルから、より高精度な学習モデルを、高速で自動的に抽出することが可能な情報処理装置、情報処理方法およびプログラムを提供することにある。
上記課題を解決するために、本発明に係る情報処理装置の一態様は、母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出する第1の適応度算出部と、前記複数のモデルのうち、前記第1の適応度算出部により算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成する仮想モデル生成部と、前記所定の関数を用いて前記仮想モデルの前記適応度を算出する第2の適応度算出部と、前記仮想モデルを前記母集団に追加するとともに、前記母集団に属する前記複数のモデルのうち、前記適応度が低いモデルを前記母集団から削除することで、前記母集団を形成するモデルを置き換えるモデル置換部と、前記仮想モデル生成部、前記第2の適応度算出部、および前記モデル置換部による処理を、所定の終了条件に到達するまで繰り返して、前記母集団から前記適応度の高いモデルを抽出するモデル抽出部と、を備える。
前記第2の適応度算出部は、前記仮想モデルの前記出力結果から、前記所定の関数に代入すべきパラメータを導出し、導出された前記パラメータを前記所定の関数に代入することにより、前記仮想モデルの前記適応度を算出してよい。
前記仮想モデル生成部により生成される前記仮想モデルは、前記複数の親モデルのそれぞれの出力結果および世代の情報を有してよい。
前記仮想モデル生成部は、前記複数のモデルのうち、ランダムに選択された複数のモデルでサブセットを形成し、形成された前記サブセットに属する複数のモデルのうち、前記適応度がより高い複数のモデルを親モデルとして選択してよい。
前記仮想モデル生成部は、生成しようとする前記仮想モデルが参照する前記親モデルの数が所定の閾値を超える場合、前記仮想モデルを生成しなくてよい。
前記第1の適応度算出部および前記第2の適応度算出部は、モデルの取引指標をパラメータとしてユーティリティ関数に代入することにより、前記モデルの市場における効用を定量的に示す有用値を、前記適応度として算出してよい。
前記取引指標は、前記モデルを使用した取引におけるリターン、勝率、シャープレシオ、取引頻度、買いおよび売り間の勝率の差分のいずれか1つ以上を含んでよい。
前記仮想モデル生成部により生成される前記仮想モデルは、前記複数の親モデルの取引のアクションを示す取引サインを演算して得られた取引サインを出力してよい。
前記取引サインは、買い(Buy)、売り(Sell)、およびノーアクション(N/A)のいずれかを示してよい。
前記仮想モデル生成部は、前記複数の親モデルが出力する前記取引サインの各々に対応する所定の点数を付与し、付与された前記点数を加算することにより、前記仮想モデルの取引サインを生成してよい。
前記仮想モデル生成部は、前記複数の親モデルが出力する前記取引サインのそれぞれを遺伝子として、遺伝的アルゴリズムを用いて前記複数の親モデルをクロスオーバすることにより、前記仮想モデルを生成してよい。
前記第1の適応度算出部および前記第2の適応度算出部は、異なる係数の組み合わせを含む複数の所定の関数を用いて、前記適用度を算出し、前記モデル抽出部は、前記仮想モデル生成部、前記第2の適応度算出部、および前記モデル置換部による処理を、前記複数の所定の関数のそれぞれについて、所定の終了条件に到達するまで繰り返して、前記複数の所定の関数ごとに、モデルを抽出してよい。
前記モデル抽出部により抽出された複数のモデルを候補モデルとして表示出力するとともに、前記候補モデルの中からいずれか1つ以上のモデルを選択する入力を受け付けるユーザインタフェースを提供する表示制御部をさらに備えてよい。
本発明に係る情報処理方法の一態様は、情報処理装置が実行する情報処理方法であって、母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出するステップと、前記複数のモデルのうち、算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成するステップと、前記所定の関数を用いて前記仮想モデルの前記適応度を算出するステップと、前記仮想モデルを前記母集団に追加するとともに、前記母集団に属する前記複数のモデルのうち、前記適応度が低いモデルを前記母集団から削除することで、前記母集団を形成するモデルを置き換えるステップと、前記仮想モデルを生成するステップ、前記仮想モデルの適応度を算出するステップ、および前記モデルを置き換えるステップを、所定の終了条件に到達するまで繰り返して、前記母集団から前記適応度の高いモデルを抽出するステップとを含む。
本発明に係る情報処理プログラムの一態様は、情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出する第1の適応度算出処理と、前記複数のモデルのうち、前記第1の適応度算出処理により算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成する仮想モデル生成処理と、前記所定の関数を用いて前記仮想モデルの前記適応度を算出する第2の適応度算出処理と、前記仮想モデルを前記母集団に追加するとともに、前記母集団に属する前記複数のモデルのうち、前記適応度が低いモデルを前記母集団から削除することで、前記母集団を形成するモデルを置き換えるモデル置換処理と、前記仮想モデル生成処理、前記第2の適応度算出処理、および前記モデル置換処理を、所定の終了条件に到達するまで繰り返して、前記母集団から前記適応度の高いモデルを抽出するモデル抽出処理と、を含む処理を実行させるためのものである。 
本発明によれば、コンピュータ資源への負荷を低減しつつ、多数の学習モデルから、より高精度な学習モデルを、高速で自動的に抽出することができる。
上記した本発明の目的、態様及び効果並びに上記されなかった本発明の目的、態様及び効果は、当業者であれば添付図面及び請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。
図1は、本発明の実施形態に係る学習モデル抽出装置の機能構成の一例を示すブロック図である。 図2は、本発明の実施形態に係る学習モデル抽出装置が実行する学習モデル抽出処理の処理手順の一例を示すフローチャートである。 図3は、2つの親モデルをクロスオーバして子モデルである仮想モデルを生成する処理の一例を説明する模式図である。 図4は、木構造を有するモデルの世代(系譜)の情報の一例を説明する模式図である。 図5は、本発明の実施形態の変形例に係る学習モデル抽出装置が実行する複数の学習モデルの抽出処理の処理手順の一例を示すフローチャートである。 図6は、本発明の実施形態に係る学習モデル抽出装置のハードウエア構成の一例を示す図である。
以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
以下、本実施形態に係る情報処理装置としての学習モデル抽出装置が、例えば、証券、保険、債券、投資信託、外国為替等の各種金融商品取引に関するデータを入力として取引のアクションを示す取引サインを出力する複数の学習済みモデルから、自動的に最適な学習済みモデルを抽出する非限定的一例を説明するが、本実施形態はこれに限定されず、あらゆる応用分野のための学習済みモデルの抽出に適用することができる。
以下、本実施形態に係る学習モデル抽出装置により抽出される機械学習用の学習済みモデルを、単に、「モデル」または「学習モデル」という。
本実施形態に係る学習モデル抽出装置は、遺伝的アルゴリズム(Genetic Algorithms)を用いて、親モデルをクロスオーバして学習モデルとしての実体を有さない仮想モデルを生成し、所与のモデルおよび仮想モデルの適応度(fitness)を比較することで、多数のモデルから適応度の高いモデルを抽出する。このように動作することで、本実施形態に係る学習モデル抽出装置は、複数のモデルを融合して1つの学習モデルを生成する手法であるアンサンブル学習を、より低負荷で近似する。
本実施形態では、遺伝的アルゴリズムにおける適応度関数として、金融商品取引における効用ないし有用度を定量的に評価するユーティリティ(utility)関数を用いる。なお、上述したような金融商品取引以外の応用分野において本実施形態を適用する場合も同様に、最適化したい重要な指標を含むユーティリティ関数を用いればよい。
<学習モデル抽出装置の機能構成>
図1は、本実施形態に係る学習モデル抽出装置の機能構成の一例を示すブロック図である。
図1に示す学習モデル抽出装置1は、モデル記憶部11、データ入力部12、有用値算出部13、仮想モデル生成部14、モデル置換部15、モデル抽出部16、通信部17、および表示制御部18を備える。
モデル記憶部11は、金融商品取引の機械学習で用いられる複数の学習モデルを記憶する。
モデル記憶部11は、学習モデル抽出装置1の記憶装置内に構成される。記憶装置は、RAM(Random Access Memory)等の揮発性メモリ、ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の不揮発性メモリ、着脱可能な外部メモリ等から構成されてよい。記憶装置は、システムバスを介して、学習モデル抽出装置1内の各ブロック11〜17が共有して利用可能な記憶領域であり、各種データの保存やワークメモリとして使用されてよい。なお、記憶装置は、学習モデル抽出装置1の内部に備えられてもよいし、学習モデル抽出装置1と通信可能な外部装置(例えば、サーバ等)として備えられてもよい。
本実施形態において、モデル記憶部11は、多数の機械学習用のモデルを記憶する。非限定的一例として、モデル記憶部11において記憶されるモデルの数は、約500〜1000である。
本実施形態におけるモデルは、金融商品取引のマクロ経済データや為替データ等を入力データとし、取引のアクションを示す取引サインを最適解として推論して出力データとする。
具体的に、モデルへ入力される入力データは、景気動向、金利水準、外国為替、チャート等のデータであり、例えば、マクロ経済データ(TOPIXインデックス、日経インデックス、日本国債、原油価格)、為替データ(USD/JPY、EUR/USD、GBP/USD、CHF/USD、CAD/USD、AUD/USD、NZD/USD、CNY/USD、KRW/USD等)を含む。
モデルが出力する出力データである取引サインは、例えば、特定銘柄の株式等の金融商品を買うか(Buy)、売るか(Sell)、何もしないか(No Action:N/A)のいずれかの取引のアクションを示す。この取引サインは、株式先物、インデックス先物(日経(NK)225、NYダウ(DJI)等)、債券先物(日本国債(JGB)、米ドル建て(USD)債券等)、商品先物等の各種金融商品の取引に使用される。
上記のモデルは、所定期間(例えば、5年間)に亘る過去のマクロ経済データや為替データを入力データとし、入力データに対応する金融取引の実績に関するデータを教師ラベルとして、特徴量エンジニアリングにより特徴抽出を実行し、機械学習アルゴリズムを適用することで、予め構築および訓練された学習済みモデルである。
金融取引の実績に関するデータは、例えば、入力データに対応する金融商品の価格変動実績(例えば、上昇、下降等)に関するデータや、入力データに対応する金融取引の正解データ(例えば、金融商品の価格の上昇に対して「買い」を示すデータ)を含む。
特徴抽出は、例えば、日々の入力データにつき、過去所定区間(例えば、180日分)の単純移動平均や指数加重移動平均を算出することで実行することができる。
モデルには任意の機械学習のアルゴリズムを適用することができ、例えば、SVM(Supprt Vector Machine)、CNN(Convolutional Neural Network)、ランダムフォレスト(Random Forests)等のいずれか、またはこれらの組み合わせを用いてよい。
なお、本実施形態は、複数の所与の学習済みモデルから最適化されたモデルを抽出することを主題とするものであり、学習済みモデルの構築および訓練自体につき、以降では詳述しない。
データ入力部12は、モデル記憶部11において記憶される各モデルの有用値を算出するために使用される所定数のサンプルデータの入力を受け付ける。
より具体的には、データ入力部12に入力されるサンプルデータは、それぞれのモデルの金融商品取引におけるパフォーマンスないし効用を定量的に算出するユーティリティ関数(utility function)のパラメータ値を導出して、金融商品取引市場におけるモデルの効用を定量的に評価する有用値を算出するためのデータであり、所定期間の過去のマクロ経済データ、為替データ、取引実績、すなわち取引実行内容と取引実行結果のデータを含む。
データ入力部12は、入力された所定数のサンプルデータを、記憶装置に予め記憶し、有用値算出部13が記憶装置に記憶されたサンプルデータを読み出してユーティリティ関数のパラメータ値を導出してもよい。
有用値算出部13は、データ入力部12に入力された、あるいは記憶装置に記憶されたサンプルデータに基づいて、ユーティリティ関数の各パラメータである取引指標(trading metrics)のパラメータ値を導出して、導出された取引指標のパラメータ値をユーティリティ関数に対して代入して、有用値を算出する。有用値算出部13は、モデル記憶部11において記憶される複数のモデルのそれぞれについて、ユーティリティ関数の取引指標のそれぞれのパラメータ値を代入して、有用値を算出する。なお、ユーティリティ関数は複数の取引指標をパラメータとして持つが、ユーティリティ関数の詳細は、図2を参照して後述する。
仮想モデル生成部14は、モデル記憶部11において記憶される母集団となる複数のモデルから仮想モデルを生成する。具体的には、仮想モデル生成部14はまず、遺伝的アルゴリズムを用いて、モデル記憶部11において記憶される母集団となる複数のモデルから、ランダムに、より少ない複数のモデルを母集団のサブセットとして選択する。仮想モデル生成部14は、サブセット中で選択された複数のモデルのうち有用値の高い複数のモデル(例えば、2個のモデル、以下、親モデルを2個とする例を説明する)を親(parent)モデルとし、親モデル同士をクロスオーバすることにより、子孫(offspring)モデルである仮想モデルを生成する。
親モデル同士をクロスオーバすることで生成される仮想モデルは、学習モデルとしての実体を有さず、親モデルを示す情報を有する仮想的なモデルである。親モデルから仮想モデルを生成する処理の詳細は、図2および図3を参照して後述する。
仮想モデル生成部14によって生成された仮想モデルの有用値は、有用値算出部13によって、ユーティリティ関数を用いて算出される。
モデル置換部15は、母集団に含まれるモデルを置き換えることにより更新する。具体的には、モデル置換部15は、仮想モデル生成部14により生成された仮想モデルを、モデルの母集団に追加するとともに、仮想モデルが追加された母集団の中から、最も低い有用値を有するモデルを削除することで、母集団のモデルの数を増減させることなく所定数に維持する。
モデル置換部15は、所定の終了条件に到達するまで、母集団に含まれるモデルの置換処理を繰り返す。
モデル抽出部16は、モデル置換部15により、母集団に属するモデルの置換が繰り返された後、母集団に属するモデルのうち、最も大きい有用値を有するモデルを、最適化されたモデルとして抽出する。
多数のモデルの中から、モデル抽出部16により抽出されたモデルは、最適化された学習済みモデルであり、抽出されたモデルに対して、予測すべき時点のマクロ経済データや為替データ等の入力データを入力することで、将来の取引サインを高精度に推論予測することが可能となる。
通信部17は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。通信部17を介して、外部装置との間で、例えばモデルに入力されるべき入力データ、サンプルデータ、取引実績データ等が受信され、モデルの出力結果である取引サインやユーティリティ関数の出力結果、これらの履歴の情報等が送信される。本実施形態では、通信部17は、イーサネット(登録商標)等の通信規格に準拠する有線LAN(Local Area Network)や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Bluetooth(登録商標)、ZigBee(登録商標)、UWB(Ultra Wide Band)等の無線PAN(Personal Area Network)を含む。また、Wi−Fi(Wireless Fidelity)(登録商標)等の無線LAN(Local Area Network)や、WiMAX(登録商標)等の無線MAN(Metropolitan Area Network)を含む。さらに、LTE/3G、4G、5G等の無線WAN(Wide Area Network)を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。
表示制御部18は、学習モデル抽出装置1が実行する学習モデル抽出処理の実行結果を、表示装置を介して表示出力する。表示制御部18はまた、学習モデル抽出処理で使用される各種パラメータや、他の装置との通信で使用される通信パラメータ等を学習モデル抽出装置1へ指示入力するためのGUI(Graphical User Interface)を提供してよい。
なお、有用値算出部13は、請求項における第1の適応度算出部および第2の適応度算出部に、仮想モデル生成部14は、請求項における仮想モデル生成部に、モデル置換部15は、請求項におけるモデル置換部に、モデル抽出部16は、請求項におけるモデル抽出部に、それぞれ相当する。
<モデル抽出における遺伝的アルゴリズムの応用>
遺伝的アルゴリズム(genetic algorithm)とは、自然進化の理論に基づく進化型アルゴリズムと呼ばれる最適化手法の1つであり、次世代の子孫を生み出すために、生殖に最適な固体が選択されるという自然淘汰(natural selection)のプロセスを反映している。
遺伝的アルゴリズムは、複数の解の候補のうちから、より適応度(fitness)の高い最適解を探索するアルゴリズムである。
本実施形態では、遺伝的アルゴリズムを用いて、複数の親モデルの出力結果を演算して子孫モデルを生成し、初期モデルおよび子孫モデルを、それぞれユーティリティ関数を用いて有用値で評価することによって、最適なモデルを抽出する。
具体的には、本実施形態において、学習モデル抽出装置1は、遺伝的アルゴリズムを、以下のとおりに応用する。
遺伝的アルゴリズムを適用する初期母集団(initial population)は、モデル記憶部11において記憶される個別のモデル(individual model)全部または一部により構成する。個別のモデルが所定期間について出力する取引サインをそれぞれ遺伝子として見做す。すなわち、従来の遺伝的アルゴリズムでは、モデル自体を構成する要素(例えばDNA)を遺伝子として扱っていたが、本実施形態では便宜上、モデルから出力される取引サインを、後世のモデルに受け継がれる要素であるという観点から、遺伝子と見做すことにする。
遺伝的アルゴリズムにおける適応度関数(fitness function)として、詳細を後述する上記のユーティリティ関数(utility function)を用いて、各モデルのパフォーマンスないし効用を評価する。
選択(selection)プロセスとして、n個のサンプルモデルをランダムに母集団のサブセットとして選択し、選択されたサンプルモデルから、ユーティリティ関数により最も高い有用値を持つと評価された2個のサンプルモデルを、親モデルとして決定する。
親モデルのクロスオーバプロセスとして、決定された2個の親モデルが出力する取引サイン同士を組み合わせることにより、組み合わせられた取引サインを出力する仮想モデルを子孫モデルとして生成する。なお、本実施形態に係る遺伝的アルゴリズムにおけるクロスオーバの手法の詳細は、図3を参照して後述する。
なお、遺伝的アルゴリズムにおける変異(mutation)は、本実施形態では適用しない例を説明するが、代替的に、本実施形態の学習モデル抽出装置1は、変異を適用して、子孫モデルにおいて、取引サインの一部を変異させてもよい。
<学習モデル抽出処理の詳細処理手順>
図2は、本実施形態に係る学習モデル抽出装置1が実行する学習モデル抽出処理の処理手順の一例を示すフローチャートである。
なお、図2の各ステップは、学習モデル抽出装置1の記憶装置に記憶されたプログラムをCPUが読み出し、実行することで実現される。また、図2に示すフローチャートの少なくとも一部をハードウエアにより実現してもよい。ハードウエアにより実現する場合、例えば、所定のコンパイラを用いることで、各ステップを実現するためのプログラムからFPGA(Field Programmable Gate Array)上に自動的に専用回路を生成すればよい。また、FPGAと同様にしてGate Array回路を形成し、ハードウエアとして実現するようにしてもよい。また、ASIC(Application Specific Integrated Circuit)により実現するようにしてもよい。
S1で、有用値算出部13は、モデル記憶部11において記憶されるN個のモデルのすべてをそれぞれ初期化する。非限定的一例として、S1で初期化される学習済みモデルの数Nは、例えば、432であってよい。
S2で、有用値算出部13は、S1で初期化したN個のモデルのそれぞれを、下記式1で示されるユーティリティ関数を用いて評価する。
Figure 0006801149
(式1)
上記式1において、Rは正規化されたリターン、WRは、勝率(%)、SRは、リターンとリスクとの関係を示す指標であるシャープレシオ、TFは、取引頻度(%)、ΔWRは、買い(Buy)および売り(Sell)の間の勝率の差分をそれぞれ示す。なお、本実施形態では、取引頻度は、買いまたは売りの取引が実際に行われた頻度を意味する。
ユーティリティ関数のパラメータであるこれらR、WR、SR、TF、およびΔWRは、いずれも金融商品取引における取引指標(trading metrics)である。また、α、β、γ、δ、εは、いずれも、それぞれ異なる取引指標に対して適宜調整されるべき任意の係数である。非限定的一例として、各係数は、α=[1,2]、β=[1,2,5]、γ=[1,5,10]、δ=[0]、ε=[1]から選択されてよい。
有用値算出部13は、データ入力部12に入力されたサンプルデータを各モデルに入力し、それぞれのモデルについて、上述したようなリターン等の取引指標の値を予め算出する。そして、有用値算出部13は、上記式1で示されるユーティリティ関数に、予め算出された取引指標の値を代入することによって、当該モデルの所定期間における金融商品取引におけるパフォーマンスないし効用を定量的に示す有用値(ユーティリティ値)を算出する。
S3で、仮想モデル生成部14は、母集団に、S2で評価されたN個の個別モデルを準備する。
S4で、仮想モデル生成部14およびモデル置換部15は、世代数のカウンタCを1に設定し、第1世代において遺伝的アルゴリズムに基づくS5〜S12までの処理を実行する。
具体的には、S5で、仮想モデル生成部14は、母集団に準備されたN個の個別モデルから、n個をランダムに母集団のサブセットとして選択する。非限定的一例において、ランダムに選択される個別モデルの数nは、20、または40であってよい。
S6で、仮想モデル生成部14は、S5で選択されたn個の個別モデルのうち、最大の有用値を有する2個の個別モデルを、第1世代でクロスオーバ(交叉)させるべき親モデルとして選択する。なお、S6で親モデルとして選択される個別モデルの数は、2個に限定されず、3個以上であってもよい。
S7で、仮想モデル生成部14は、S6で選択された2個の親モデルをクロスオーバ(交叉)させて、子孫モデルを生成する。S6で親モデルとして選択された個別モデルの数が、3個以上であった場合、仮想モデル生成部14は、選択された数の親モデルをクロスオーバさせればよい。
本実施形態において、仮想モデル生成部14は、子孫モデルとして、学習モデルとしての実体(パラメータ群)を持たず、親モデルが出力する取引サインを組み合わせることによって仮想モデルを生成する。
本実施形態において、クロスオーバ(交叉)とは、所定数(例えば、2個)の親(parent)モデルから子孫(offspring)モデルを生成することをいう。具体的には、本実施形態において、仮想モデル生成部14は、親モデルの出力結果に対して所定の組み合わせ演算を行うことにより得られる出力結果を算出する。そして、仮想モデル生成部14は、組み合わせ演算により算出された出力結果を、仮想モデルが出力すべき出力結果として、当該出力結果を出力するための仮想的なモデルを逆生成する。
すなわち、仮想モデルは、親モデルを示す情報として、所定数の親モデルの出力結果を組み合わせ演算した出力結果、または組み合わせ演算した出力結果を算出するための親モデルの出力結果の情報を記憶し、当該出力結果の基となった親モデルの世代(系譜)の情報を、例えば木構造で記憶する仮想的なモデルである。
ここで、組み合わせの基となる出力結果を出力するモデルを親モデル(先祖モデル)といい、これらの親モデルの出力結果に対して所定の組み合わせ演算を行うことによって得られる出力結果を出力するモデルを子モデル(子孫モデル)という。
親モデル同士の実体を融合して子モデルの実体を算出することは、極めて処理負荷が高く、限られたコンピュータ資源では実装が困難である。そこで、本実施形態においては、子モデルの実体を算出するのではなく、親モデルを示す情報を子モデルとして生成することにより、処理負荷を軽減している。すなわち、本実施形態における子モデルは、実体を伴うモデルではなく、組み合わせの基となる出力結果を出力する親モデルを示す情報としての仮想モデルである。
子モデルである仮想モデルは、実体を伴わないため、入力データを直接入力して出力結果を得ることができない。そこで、本実施形態に係る学習モデル抽出装置1は、子モデルの出力結果を間接的に算出する。具体的には、子モデルが新たな入力値に対する出力結果(出力値)を算出する際には、子モデルが参照する複数の親モデルのそれぞれからその入力値に対する出力値を算出し、算出した出力値に対して組み合わせ演算を行うことによって、子モデルの出力値を算出する。
図3は、2つの親モデルをクロスオーバして子モデルである仮想モデルを生成する処理の一例を説明する模式図である。
各親モデルは、過去の所定期間(例えば、365日、250営業日)において所定間隔毎に、買い(Buy)、売り(Sell)、何もしない(N/A)という取引のアクションをそれぞれ示す取引サインを出力する。
図3に示す例では、クロスオーバ(交叉)されるべき親1モデルは、出力結果である取引サインとして、Buy、Sell、N/A、Buy、Sell、Buyの6つの取引サインを過去に出力したものとする。一方、クロスオーバされるべき親2モデルは、取引サインとして、Buy、N/A、N/A、Sell、Sell、Sellの6つの取引サインを過去に出力したものとする。
6つの取引サインは、親1および親2モデルから所定間隔毎に出力される取引サインであり、所定間隔は、例えば数秒、数分、数時間、数日等の任意の間隔に設定される。例えば、任意の間隔は、取引が行われる間隔に合わせて、例えば4時間に設定されてもよく、6つの取引サインは、24時間分の取引サインを示してもよい。本実施形態では、親1および親2モデルが出力するこのような取引サインのシーケンスが、クロスオーバにおいて使用される。ただし、過去の所定期間において出力される取引サインの数は、図3に例示する6つに限定されない。
本実施形態において、仮想モデル生成部14は、これら取引サインのそれぞれに点数を付与する。図3を参照して、仮想モデル生成部14は、例えば、買い(Buy)には+1点、売り(Sell)には−1点、N/Aには0点という所定の点数を付与する。そして、親1と親2モデルが同じタイミングで出力する取引サインのそれぞれについて、付与された点数の合計点を算出して、子モデルの取引サインのシーケンスを生成する。仮想モデル生成部14は、多数決理論を応用し、合計点が+ならBuy、合計点が−ならSell、合計点が0ならN/Aを、子モデルが出力する取引サインとして生成する。
図3では、親1および親2をクロスオーバした子(offspring)モデルは、取引サインの合計点として、+2、−1、0、0、−2、0のシーケンスを持つため、取引サインとして、Buy、Sell、N/A、N/A、Sell,N/Aの取引サインのシーケンスを出力することになる。
なお、子モデルである仮想モデルは、図3に示す取引サインのシーケンス自体を保持しなくてもよい。この場合、子モデルである仮想モデルは、クロスオーバされるべき親モデル(親1、親2)のそれぞれの出力結果である取引サインの情報と、親モデルの世代(系譜)を示す情報とを保持すればよく、親1および親2モデルの出力結果である取引サインを組み合わせることによって、子モデルの取引サインを動的に導出(算出)可能であればよい。
図2に戻り、S8で、仮想モデル生成部14は、S7で生成された子モデルである仮想モデルが出力する取引サインに基づいて、取引サインが出力された過去の所定期間に相当する対象期間における取引実績を参照して、子モデル(仮想モデル)の取引指標を逆算する。
上述したように、S7で生成された取引サインは、過去の所定期間において所定間隔毎に子モデルが出力した取引サインとして扱われる。
本実施形態では、子モデルが出力する取引サインを過去の取引において実際に使用したと仮定した場合に、どのような取引実績が得られたかを確認することによって、取引指標を算出する。
以下、図3を参照して、取引指標の算出方法の例について説明する。
図3に示す例では、子モデルである仮想モデルは、取引サインとして、Buy、Sell、N/A、N/A、Sell、N/Aの6つの取引サインを出力している。上述したように、子モデルの取引指標としての取引頻度TFは、買いまたは売りの取引が実際に行われた頻度である。したがって、子モデルの6つの取引サインのうち、3つのN/A(何もしない)の取引サインに対応する取引は行われなかったことになるから、子モデルの取引頻度TFは50%と算出される。
また、リターンRは、子モデルが出力する取引サインを使用した取引において得られる合計リターンとして算出される。上述したように、子モデルの3つのN/Aの取引サインに対応する取引は行われなかったことになるから、3つのN/Aの取引サインに対応するリターンは0になる。一方、Buy、Sell、Sellの取引サインを使用した取引において得られる合計リターンとして、リターンRが算出されることになる。
また、勝率WRは、子モデルが出力する取引サインを使用した取引に関する勝率として算出される。上述したように、子モデルの3つのN/Aの取引サインに対応する取引は行われなかったことになるから、N/Aの取引サインは、勝率WRに影響を及ぼさない。一方、Buy、Sell、Sellの取引サインを使用した取引において、例えば、Buyの取引サインに対応する取引では損失があり、2つのSellの取引サインに対応する取引では利益が得られたとき、勝率WRは66.7%と算出される。
シャープレシオSR、買いおよび売りの間の勝率の差分ΔWRも、子モデルが出力する取引サインを過去の取引において実際に使用したと仮定した場合に得られる取引実績に基づいて、同様に算出され得る。ただし、取引サインから取引指標を算出する方法は、上述した例に限定されず、任意の他の算出方法が用いられてもよい。また、S2で、初期モデルを評価する際にも、初期モデルが出力する取引サインを過去の取引において実際に使用したと仮定した場合に得られる取引実績に基づいて、初期モデルの取引指標が同様に算出され、ユーティリティ関数に代入されてもよい。
図2に戻り、S9で、有用値算出部13は、S8で逆算された子モデルの取引指標をパラメータとして、ユーティリティ関数に代入することにより、子モデルを評価するための有用値を算出する。
S10で、モデル置換部15は、S7で生成され、S9でユーティリティ関数を用いて有用値が算出された子モデル(仮想モデル)を、S2で準備された母集団に追加する。すなわち、S10の段階で、母集団には、1個の子モデルを含むN+1個のモデルが含まれることになる。
S11で、モデル置換部15は、母集団を構成するN+1個のモデルのうち、最低の有用値を有する1個のモデルを削除する。すなわち、S11の段階で、母集団に属するモデルは、N個に戻ることになる。
S12で、モデル置換部15は、世代数のカウンタCを1インクリメントする。
S13で、モデル置換部15は、世代数のカウンタCが、閾値である最大世代数MaxCより小さいか否かを判定する。非限定的一例として、最大世代数MaxCは、5000である。
世代数のカウンタCが、最大世代数MaxCより小さい場合(S13:Y)、S5に戻って、次の世代について、S5からS12までの処理を繰り返す。各世代において、高い有用値を有する親モデル同士のクロスオーバにより子孫モデル(仮想モデル)が生成されて、母集団に加えられるが、モデル置換部15は、母集団の数を、S3の初期値であるN個に維持する。
一方、世代数のカウンタCが、最大世代数MaxCに到達した場合(S13:N)、S14に進む。
S14で、モデル抽出部16は、母集団に属するN個のモデルのうち、最も高い有用値を持つ1個のモデルを、最適化されたモデルとして抽出(選択)する。表示制御部18は、抽出されたモデルを、表示装置を介してユーザに提示してもよい。そして、学習モデル抽出装置1は、処理を終了する。
S14では、母集団には、S3で母集団に含められた学習モデルとしての実体を有する初期の個別モデルと、親モデル同士のクロスオーバで生成された子孫モデル(仮想モデル)とが混在している。
ここで、S14で最終的に最も高い有用値を持つ最適化モデルとして選択されたモデルが、仮想モデルである子孫モデルである場合、当該仮想モデルは、親モデルの出力結果(取引サイン)を組み合わせ演算して当該仮想モデルの出力結果(取引サイン)を出力するための情報を持つが、学習モデルとしての実体を持たないから、当該仮想モデルに直接マクロ経済データや為替データ等の入力データを入力して、取引サインを推論予測させることができない。
そこで、本実施形態では、仮想モデル生成部14は、子孫モデルをクロスオーバにより生成する基となった先祖モデル(初期の個別モデルとしての実体を有する親モデル)の少なくとも出力結果(取引サイン)の情報を、当該仮想モデル(子孫モデル)に対応付けて、例えば上述したようなモデル記憶部11に記憶しておく。
同時に、仮想モデル生成部14は、どの親モデルがどの世代で当該子孫モデル(仮想モデル)を生成するためのクロスオーバに追加されたのかを示す情報として、例えば、木構造で記述される、親モデルの世代(系譜)の情報を、当該子孫モデルに対応付けてモデル記憶部11に記憶しておく。
図4は、このような木構造を有するモデルの世代(系譜)の情報の一例を示す模式図である。
図4を参照して、第1世代(Generation−1)には、親1モデルM[1]と親2モデルM[2]とが属し、親1モデルと親2モデルとをクロスオーバすることで、第2世代(Generation−2)の子孫モデルM[1,2]が生成されたものとする。
さらに、第2世代の子孫モデルM[1,2]を親1モデルとし、親2モデルであるモデルM[3]とクロスオーバすることで、第3世代(Generation−3)の子孫モデルM[1,2,3]が生成されたものとする。
この場合、第3世代の子孫モデルM[1,2,3]は、実体のある3つの親モデルM[1]、M[2]、およびM[3]の情報を、これら親モデルが属する世代の情報とともに、保持することとなる。
これにより、最大世代数MaxCに到達するまでクロスオーバが繰り返されて得られた子孫モデル(仮想モデル)であっても、先祖モデルの取引サインの情報を組み合わせることにより、最適化モデルである子孫モデルの取引サインの情報を取得することができる。
さらに、モデル抽出部16により抽出された最適化モデルである子孫モデルをクロスオーバで生成する基となった先祖モデルに世代を遡って、先祖モデルの実体を融合することによって、最適化モデルである子孫モデルの実体を構築し、学習済みモデルとして直接利用可能としてよい。
<変形例>
上記実施形態の変形例として、学習モデル抽出装置1は、異なる係数の組み合わせを含む複数のユーティリティ関数を備え、複数のユーティリティ関数のそれぞれについて最適化モデルを選択して、選択された複数のモデルをユーザに提示してもよい。
図5は、本変形例に係る学習モデル抽出装置1が実行する複数の学習モデルの抽出処理の処理手順の一例を示すフローチャートである。
図5を参照して、S51で、データ入力部12は、複数のユーティリティ関数に対して設定すべき係数の組み合わせを取得する。データ入力部12に入力されるユーティリティ関数の係数の組み合わせは、ユーザインタフェースを介してユーザにより入力されてもよく、予め記憶装置に記憶されていてもよい。
S52で、有用値算出部13は、S51で取得された異なる係数の組み合わせを含む複数のユーティリティ関数を設定する。
S53で、学習モデル抽出装置1は、S52で設定された複数のユーティリティ関数のそれぞれについて、図2のS2〜S14の処理を実行する。なお、複数のユーティリティ関数の間で、S1で初期化される個別モデル群は共通である。
例えば、係数の組み合わせの数が以下の4種類である場合を仮定する。
タイプ1:[α,β,・・・]=[1,1,・・・]:Utility=1*R+1*WR+・・・
タイプ2:[α,β,・・・]=[1,2,・・・]:Utility=1*R+2*WR+・・・
タイプ3:[α,β,・・・]=[2,1,・・・]:Utility=2*R+1*WR+・・・
タイプ4:[α,β,・・・]=[2,2,・・・]:Utility=2*R+2*WR+・・・
この場合、当初、図2のS2では、タイプ1〜4のユーティリティ関数毎に、共通の初期モデルの評価を開始することになる。
しかしながら、異なる係数の組み合わせを含むタイプ1〜4のユーティリティ関数を用いて異なる有用値を算出し、遺伝的アルゴリズムによりランダム選択が実行されることにより、最終的に図2のS14では、タイプ1〜4のユーティリティ関数毎に異なる複数のモデルが最適化モデルとして選択され得る。
S54では、このため、表示制御部18は、複数の異なる最適化モデルを候補モデルとして、表示装置を介して表示出力してユーザに提示する。また、表示制御部18は、表示出力された複数の候補モデルの中から、使用するモデルとして1つ以上のモデルを選択する入力を受け付けるGUIをユーザに提供する。なお、表示装置は、学習モデル抽出装置1自体に備えられてもよいし、学習モデル抽出装置1と通信可能な外部装置として備えられてもよい。
これにより、多数のモデルの中から絞り込まれた複数の候補モデルの中から、実際の金融商品取引において使用するモデルをユーザに決定させることができる。したがって、マニュアルで多数のモデルから1つのモデルをユーザに選択させる場合と比較して、ユーザにモデル選択の余地を残しつつ、モデル選択に係るユーザの労力を大幅に軽減することができる。
他の変形例として、1つの仮想モデルを生成するためにクロスオーバ(交叉)できる先祖モデルの数に閾値を設定してもよい。
具体的には、学習モデル抽出装置1は、S7で生成しようとする仮想モデルが参照する先祖モデルの数が閾値を超える場合、図2のS7〜S11の処理をスキップしてよい。すなわち、この場合、仮想モデル生成部14は、仮想モデルを生成せず、また、モデル置換部15は、母集団を構成するモデル群を更新しない、すなわち母集団に含まれるモデルを置き換えない。
これにより、多数の先祖モデルを持つ仮想モデルについての計算量が膨大化することを予め回避することができ、モデル抽出における処理負荷が軽減する。
また、他の変形例として、S7で生成される子モデルの数は、1個に限定されず、2個以上であってもよい。例えば、S6で親モデルとして選択された個別モデルの数が、3個以上であった場合、異なる組み合わせの親モデルから、2個以上の子モデルが一度に生成されてもよい。この場合、S11で削除されるモデルの数も、生成された子モデルの数に合わせればよい。
これにより、子モデルを効率よく生成することができ、最大世代数MaxCが小さい値に設定されていた場合でも、初期の個別モデルと多数の子孫モデルの中から、最適化モデルを抽出できる。
<学習モデル抽出装置1のハードウエア構成>
図6は、本実施形態に係る学習モデル抽出装置1のハードウエア構成の一例を示す図である。
本実施形態に係る学習モデル抽出装置1は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上に実装することができる。
図6に示すように、学習モデル抽出装置1は、CPU21と、ROM22と、RAM23と、外部メモリ24と、入力部25と、表示部26と、通信I/F27と、システムバス28とを備える。学習モデル抽出装置1はまた、HDDを内蔵してよい。
CPU21は、学習モデル抽出装置1における動作を統括的に制御するものであり、データ伝送路であるシステムバス28を介して、各構成部(22〜27)を制御する。ROM22は、CPU21が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、当該プログラムは、外部メモリ24や着脱可能な記憶媒体(不図示)に記憶されていてもよい。RAM23は、CPU21の主メモリ、ワークエリア等として機能する。すなわち、CPU21は、処理の実行に際してROM22から必要なプログラム等をRAM23にロードし、当該プログラム等を実行することで各種の機能動作を実現する。
HDDや外部メモリ24は、例えば、CPU21がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、HDDや外部メモリ24には、例えば、CPU21がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。入力部25は、キーボードやマウス等のポインティングデバイスにより構成される。表示装置としての表示部26は、液晶ディスプレイ(LCD)等のモニターにより構成される。通信I/F27は、学習モデル抽出装置1と外部装置との通信を制御するインタフェースである。
図1に示す学習モデル抽出装置1の各要素のうち少なくとも一部の機能は、CPU21がプログラムを実行することで実現することができる。ただし、図2に示す学習モデル抽出装置1の各要素のうち少なくとも一部の機能が専用のハードウエアとして動作するようにしてもよい。この場合、専用のハードウエアは、CPU21の制御に基づいて動作する。
以上説明したように、本実施形態によれば、学習モデル抽出装置は、母集団に属する複数のモデルのそれぞれについてユーティリティ関数を用いて有用値を算出し、複数のモデルのうち、算出された有用値がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成し、ユーティリティ関数を用いて仮想モデルの有用値を算出する。
学習モデル抽出装置はさらに、仮想モデルを母集団に追加するとともに、母集団に属する複数のモデルのうち、有用値が低いモデルを母集団から削除することで、母集団を形成するモデルを置き換え、仮想モデル生成、有用値算出、およびモデル置換の各処理を、所定の終了条件に到達するまで繰り返して、母集団から有用値の最も高いモデルを抽出する。
したがって、本実施形態によれば、コンピュータ資源への負荷を低減しつつ、多数の学習モデルから、より高精度な学習モデルを、高速で自動的に抽出することができ、最適化された学習モデルによる高精度の推論が実現される。
なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置及び方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換及び変更をなすこともできる。かかる省略、置換及び変更をなした形態は、請求の範囲に記載されたもの及びこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。
1…学習モデル抽出装置、11…モデル記憶部、12…データ入力部、13…有用値算出部、14…仮想モデル生成部、15…モデル置換部、16…モデル抽出部、17…通信部、21…CPU、22…ROM、23…RAM、24…外部メモリ、25…入力部、26…表示部、27…通信I/F

Claims (15)

  1. 母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出する第1の適応度算出部と、
    前記複数のモデルのうち、前記第1の適応度算出部により算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成する仮想モデル生成部と、
    前記所定の関数を用いて前記仮想モデルの前記適応度を算出する第2の適応度算出部と、
    前記仮想モデルを前記母集団に追加するとともに、前記母集団に属する前記複数のモデルのうち、前記適応度が低いモデルを前記母集団から削除することで、前記母集団を形成するモデルを置き換えるモデル置換部と、
    前記仮想モデル生成部、前記第2の適応度算出部、および前記モデル置換部による処理を、所定の終了条件に到達するまで繰り返して、前記母集団から前記適応度の高いモデルを抽出するモデル抽出部と
    を備える情報処理装置。
  2. 前記第2の適応度算出部は、前記仮想モデルの前記出力結果から、前記所定の関数に代入すべきパラメータを導出し、導出された前記パラメータを前記所定の関数に代入することにより、前記仮想モデルの前記適応度を算出する
    請求項1に記載の情報処理装置。
  3. 前記仮想モデル生成部により生成される前記仮想モデルは、前記複数の親モデルのそれぞれの出力結果および世代の情報を有する
    請求項1または2に記載の情報処理装置。
  4. 前記仮想モデル生成部は、前記複数のモデルのうち、ランダムに選択された複数のモデルでサブセットを形成し、形成された前記サブセットに属する複数のモデルのうち、前記適応度がより高い複数のモデルを親モデルとして選択する
    請求項1から3のいずれか1項に記載の情報処理装置。
  5. 前記仮想モデル生成部は、生成しようとする前記仮想モデルが参照する前記親モデルの数が所定の閾値を超える場合、前記仮想モデルを生成しない
    請求項1から4のいずれか1項に記載の情報処理装置。
  6. 前記第1の適応度算出部および前記第2の適応度算出部は、モデルの取引指標をパラメータとしてユーティリティ関数に代入することにより、前記モデルの市場における効用を定量的に示す有用値を、前記適応度として算出する
    請求項1から5いずれか1項に記載の情報処理装置。
  7. 前記取引指標は、前記モデルを使用した取引におけるリターン、勝率、シャープレシオ、取引頻度、買いおよび売り間の勝率の差分のいずれか1つ以上を含む
    請求項6記載の情報処理装置。
  8. 前記仮想モデル生成部により生成される前記仮想モデルは、前記複数の親モデルの取引のアクションを示す取引サインを演算して得られた取引サインを出力する
    請求項1から6のいずれか1項に記載の情報処理装置。
  9. 前記取引サインは、買い(Buy)、売り(Sell)、およびノーアクション(N/A)のいずれかを示す
    請求項8記載の情報処理装置。
  10. 前記仮想モデル生成部は、前記複数の親モデルが出力する前記取引サインの各々に対応する所定の点数を付与し、付与された前記点数を加算することにより、前記仮想モデルの取引サインを生成する
    請求項8または9に記載の情報処理装置。
  11. 前記仮想モデル生成部は、前記複数の親モデルが出力する前記取引サインのそれぞれを遺伝子として、遺伝的アルゴリズムを用いて前記複数の親モデルをクロスオーバすることにより、前記仮想モデルを生成する
    ことを特徴とする請求項8から10のいずれか1項に記載の情報処理装置。
  12. 前記第1の適応度算出部および前記第2の適応度算出部は、異なる係数の組み合わせを含む複数の所定の関数を用いて、前記適用度を算出し、
    前記モデル抽出部は、前記仮想モデル生成部、前記第2の適応度算出部、および前記モデル置換部による処理を、前記複数の所定の関数のそれぞれについて、所定の終了条件に到達するまで繰り返して、前記複数の所定の関数ごとに、モデルを抽出する
    請求項1から10のいずれか1項に記載の情報処理装置。
  13. 前記モデル抽出部により抽出された複数のモデルを候補モデルとして表示出力するとともに、前記候補モデルの中からいずれか1つ以上のモデルを選択する入力を受け付けるユーザインタフェースを提供する表示制御部をさらに備える
    請求項12に記載の情報処理装置。
  14. 情報処理装置が実行する情報処理方法であって、
    母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出するステップと、
    前記複数のモデルのうち、算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成するステップと、
    前記所定の関数を用いて前記仮想モデルの前記適応度を算出するステップと、
    前記仮想モデルを前記母集団に追加するとともに、前記母集団に属する前記複数のモデルのうち、前記適応度が低いモデルを前記母集団から削除することで、前記母集団を形成するモデルを置き換えるステップと、
    前記仮想モデルを生成するステップ、前記仮想モデルの適応度を算出するステップ、および前記モデルを置き換えるステップを、所定の終了条件に到達するまで繰り返して、前記母集団から前記適応度の高いモデルを抽出するステップと
    を含む情報処理方法。
  15. 情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
    母集団に属する複数のモデルのそれぞれについて所定の関数を用いて適応度を算出する第1の適応度算出処理と、
    前記複数のモデルのうち、前記第1の適応度算出処理により算出された前記適応度がより高い複数のモデルを親モデルとして選択し、選択された複数の親モデルの出力結果を演算して得られた出力結果を出力する仮想モデルを生成する仮想モデル生成処理と、
    前記所定の関数を用いて前記仮想モデルの前記適応度を算出する第2の適応度算出処理と、
    前記仮想モデルを前記母集団に追加するとともに、前記母集団に属する前記複数のモデルのうち、前記適応度が低いモデルを前記母集団から削除することで、前記母集団を形成するモデルを置き換えるモデル置換処理と、
    前記仮想モデル生成処理、前記第2の適応度算出処理、および前記モデル置換処理を、所定の終了条件に到達するまで繰り返して、前記母集団から前記適応度の高いモデルを抽出するモデル抽出処理と、を含む処理を実行させるためのものである、
    情報処理プログラム。

JP2020555257A 2020-01-20 2020-01-20 情報処理装置、情報処理方法およびプログラム Active JP6801149B1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/001767 WO2021149118A1 (ja) 2020-01-20 2020-01-20 情報処理装置、情報処理方法およびプログラム

Publications (2)

Publication Number Publication Date
JP6801149B1 true JP6801149B1 (ja) 2020-12-16
JPWO2021149118A1 JPWO2021149118A1 (ja) 2021-07-29

Family

ID=73741003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020555257A Active JP6801149B1 (ja) 2020-01-20 2020-01-20 情報処理装置、情報処理方法およびプログラム

Country Status (5)

Country Link
US (1) US11928698B2 (ja)
EP (1) EP3876181B1 (ja)
JP (1) JP6801149B1 (ja)
TW (1) TWI781461B (ja)
WO (1) WO2021149118A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022215559A1 (ja) * 2021-04-05 2022-10-13 パナソニックIpマネジメント株式会社 ハイブリッドモデル作成方法、ハイブリッドモデル作成装置、及び、プログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6801149B1 (ja) * 2020-01-20 2020-12-16 楽天株式会社 情報処理装置、情報処理方法およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008204103A (ja) * 2007-02-19 2008-09-04 Yokohama National Univ 画像認識システム
JP2012525650A (ja) * 2009-04-28 2012-10-22 ジェネティック ファイナンス (バルバドス) リミテッド クラスベースの資産管理及び資産取引の為の分散型進化的アルゴリズム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002057946A1 (en) * 2001-01-18 2002-07-25 The Board Of Trustees Of The University Of Illinois Method for optimizing a solution set
US20050005261A1 (en) * 2003-07-02 2005-01-06 Severin William B. Component integration engine
JPWO2006085460A1 (ja) 2005-02-10 2008-06-26 新世代株式会社 投資モデル管理方法及び投資モデル管理サーバ
CN106095570A (zh) * 2007-11-08 2016-11-09 思腾科技(巴巴多斯)有限公司 执行复杂算法的分布式网络
US8909570B1 (en) * 2008-11-07 2014-12-09 Genetic Finance (Barbados) Limited Data mining technique with experience-layered gene pool
AU2010241594B2 (en) * 2009-04-28 2015-05-21 Sentient Technologies (Barbados) Limited Distributed evolutionary algorithm for asset management and trading
WO2011091054A1 (en) * 2010-01-19 2011-07-28 Johannes Ronald L Computing trading strategies for portfolio management and associated probability distributions for option pricing
WO2011120200A1 (zh) * 2010-04-01 2011-10-06 江苏六维物流设备实业有限公司 堆垛机的遗传优化控制技术
TWI560634B (en) * 2011-05-13 2016-12-01 Univ Nat Taiwan Science Tech Generating method for transaction modes with indicators for option
US9002759B2 (en) * 2011-07-15 2015-04-07 Sentient Technologies (Barbados) Limited Data mining technique with maintenance of fitness history
US11055730B2 (en) * 2017-06-05 2021-07-06 International Business Machines Corporation Optimizing predictive precision for actionable forecasts of revenue change
US10366322B2 (en) * 2017-10-06 2019-07-30 DeepCube LTD. System and method for compact and efficient sparse neural networks
US11348032B1 (en) * 2018-09-02 2022-05-31 Meta Platforms, Inc. Automated generation of machine learning models
US11386496B2 (en) * 2019-07-26 2022-07-12 International Business Machines Corporation Generative network based probabilistic portfolio management
US11055783B2 (en) * 2019-08-28 2021-07-06 Ttc Holdings Inc. Trading platforms using market sentiment and dynamic risk assessment profiles
JP6801149B1 (ja) * 2020-01-20 2020-12-16 楽天株式会社 情報処理装置、情報処理方法およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008204103A (ja) * 2007-02-19 2008-09-04 Yokohama National Univ 画像認識システム
JP2012525650A (ja) * 2009-04-28 2012-10-22 ジェネティック ファイナンス (バルバドス) リミテッド クラスベースの資産管理及び資産取引の為の分散型進化的アルゴリズム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王 亜騰 ほか: "「多目的GAで獲得した非劣解集合の多数決戦略に基づく外国為替取引手法」", 情報処理学会研究報告 数理モデル化と問題解決(MPS) [オンライン], vol. 第2016-MPS-111巻, 第26号, JPN6020006271, 2016, pages 1 - 6, ISSN: 0004386910 *
辻岡 卓 ほか: "「取引戦略生成に適した評価指標の検討」", 第7回 人工知能学会 ファイナンスにおける人工知能応用研究会(SIG−FIN) [オンライン], JPN6020006272, 21 February 2013 (2013-02-21), pages 26 - 30, ISSN: 0004386911 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022215559A1 (ja) * 2021-04-05 2022-10-13 パナソニックIpマネジメント株式会社 ハイブリッドモデル作成方法、ハイブリッドモデル作成装置、及び、プログラム

Also Published As

Publication number Publication date
WO2021149118A1 (ja) 2021-07-29
US20210406932A1 (en) 2021-12-30
JPWO2021149118A1 (ja) 2021-07-29
EP3876181A1 (en) 2021-09-08
US11928698B2 (en) 2024-03-12
TWI781461B (zh) 2022-10-21
EP3876181B1 (en) 2023-09-06
EP3876181A4 (en) 2021-09-08
TW202129584A (zh) 2021-08-01

Similar Documents

Publication Publication Date Title
Dixon et al. Classification-based financial markets prediction using deep neural networks
Zięba et al. Ensemble boosted trees with synthetic features generation in application to bankruptcy prediction
Nadkarni et al. Combining NeuroEvolution and Principal Component Analysis to trade in the financial markets
WO2002084925A2 (en) Model-based and data-driven analytic support for strategy development
Radojičić et al. The impact of stock market price fourier transform analysis on the gated recurrent unit classifier model
JP6801149B1 (ja) 情報処理装置、情報処理方法およびプログラム
Duda et al. Collective intelligence of genetic programming for macroeconomic forecasting
Ghezelbash et al. Design and implementation of artificial neural network system for stock exchange prediction
Wang et al. Non-linear stochastic optimization using genetic algorithm for portfolio selection
Erica et al. Agglomerative clustering and genetic algorithm in portfolio optimization
Chan et al. Genetic algorithms in multi-stage portfolio optimization system
Mehta et al. Analyzing Portfolio of biotech companies and predicting stock market using machine learning
Yang et al. A comparison of US and Chinese financial market microstructure: heterogeneous agent-based multi-asset artificial stock markets approach
Deng et al. A new fuzzy random multi-objective portfolio model with different entropy measures using fuzzy programming based on artificial bee colony algorithm
De Amorim et al. Evaluation of index tracking portfolios during the covid-19 pandemic
Layfield et al. Explainability and Interpretability in Decision Trees and Agent based Modelling when Approximating Financial Time series. A matter of balance with performance
Khan et al. Evolving technical trading strategies using genetic algorithms: A case about Pakistan stock exchange
de Amorim et al. Assessing the interactions amongst index tracking model formulations and genetic algorithm approaches with different rebalancing strategies
Blaszczyk et al. Assessment of the risk of the project's contractor bankruptcy using the Partial Least Squares approach
Fair et al. Endogenous labour flow networks
Ryś et al. Machine Learning Methods in Algorithmic Trading Strategy Optimization–Design and Time Efficiency
Durga et al. Machine Learning Classification Methods for Stock Market Forecasting
Bulusu et al. Near future stock market forecasting based on chaos theory, sentiment analysis, and quantum computing
KUMARI et al. A NOVEL STOCK MARKET MODEL USING STATISTICAL METHODS.
Bansal et al. Major Project Report on Analysis and Prediction of Mergers & Acquisitions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201008

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20201008

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20201026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201125

R150 Certificate of patent or registration of utility model

Ref document number: 6801149

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250