JP7235329B2 - Economic indicator estimation system and its program - Google Patents
Economic indicator estimation system and its program Download PDFInfo
- Publication number
- JP7235329B2 JP7235329B2 JP2020097567A JP2020097567A JP7235329B2 JP 7235329 B2 JP7235329 B2 JP 7235329B2 JP 2020097567 A JP2020097567 A JP 2020097567A JP 2020097567 A JP2020097567 A JP 2020097567A JP 7235329 B2 JP7235329 B2 JP 7235329B2
- Authority
- JP
- Japan
- Prior art keywords
- economic
- event
- vector
- economic event
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 claims description 132
- 238000004220 aggregation Methods 0.000 claims description 62
- 230000002776 aggregation Effects 0.000 claims description 62
- 238000012545 processing Methods 0.000 claims description 27
- 238000000034 method Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 10
- 230000004931 aggregating effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 24
- 238000010606 normalization Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000010779 crude oil Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- JCYWCSGERIELPG-UHFFFAOYSA-N imes Chemical compound CC1=CC(C)=CC(C)=C1N1C=CN(C=2C(=CC(C)=CC=2C)C)[C]1 JCYWCSGERIELPG-UHFFFAOYSA-N 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、経済指標を推定する経済指標推定システムおよびそのプログラムに関する。 The present invention relates to an economic indicator estimation system for estimating economic indicators and a program thereof.
従来、ニュース記事などの様々なテキストデータを活用して、経済環境や金融市場の動向を予測する手法が知られている。例えば、非特許文献1には、日々配信されている経済ニュースを指数化して景気動向のナウキャスティングを行い、景況感ニュース指数による資産価格のボラティリティ予測を行う手法が開示されている。この手法の特徴は、第1に、経済ニュースより景況感を推定するにあたって、深層学習モデルの一つである畳み込みニューラル・ネットワーク(CNN)を用いる点、そして、第2に、日次のニュースを指数化することによって、日次での景気動向を計測する点である。ニュース指数を構築するために、まず、内閣府が公表している景気ウォッチャー調査の景気判断理由集を訓練データとして、CNNによる教師あり学習を行い、テキスト分類を行う学習器を構築する。つぎに、訓練した学習器を用いて、経済ニュースの日本語記事を構成する文に対して景況感に関するスコアを付与する。最後に、スコアが付与された文章を月次および日次で集計することによって、ニュース指数を構築する。
Conventionally, there is known a method of predicting trends in the economic environment and financial markets by utilizing various text data such as news articles. For example, Non-Patent
非特許文献2には、再帰型ニューラルネットワーク(RNN)によって自動的にテキストの景気センチメントを判別することで、金融レポートのテキストを低コストかつ高速に数値(センチメント指数)化して集計する手法が開示されている。景気ウォッチャー調査のテキストから、その景気センチメント(ポジティブ/ネガティブ)を予測するタスクをRNNで学習させた上で、文書の景気センチメントを判別させる。また、非特許文献2には、このようなセンチメント推定モデルを使って政府や日銀が発行する月次レポートのセンチメントを推定し指数化したところ、得られた指数の変動はマクロの景気変動の動きと良く連動していること、および、日経平均との相関を算出したところ、既に投資指標として広く用いられている日銀短観や景気ウォッチャー指数と比べても高い値を示したことが記載されている。
Non-Patent
また、非特許文献3には、日本銀行の景気に対するセンチメントを日本銀行の発行するテキストに対して、トピックモデルおよびニューラルネットワーク用いて、トピック毎に分解した指数化を行う手法が開示されている。
In addition, Non-Patent
さらに、特許文献1には、ニュース情報等の公表に有無にかかわらず経済指標を予測する情報処理装置が開示されている。この情報処理装置は、モデル記憶部と、取得部と、予測部とを有する。モデル記憶部は、端末の位置情報に基づいて設定された予測モデルを記憶する。取得部は、一または複数の端末の位置情報を取得する。予測部は、モデル記憶部に記憶された予測モデルを、取得部により取得された位置情報を適用して、指定された経済指標を予測する。
Furthermore,
本発明の目的は、経済指標を任意の時間分解能で推定する新規な手法を提供することである。 An object of the present invention is to provide a novel technique for estimating economic indicators with arbitrary time resolution.
かかる課題を解決すべく、第1の発明は、特定の経済指標を表す経済指標値の離散的な時系列と、経済指標値に影響を及ぼす経済事象とに基づいて、所望の時間分解能で経済指標を推定する経済指標推定システムを提供する。このシステムは、ダイジェスト生成部と、経済事象データベースと、頻度集計部と、ベクトル集計部と、学習処理部とを有する。ダイジェスト生成部は、外部より収集されたニュース群から抽出された経済事象の内容を、予め定められた複数の項目で構造化した経済事象ダイジェストを生成する。経済事象データベースには、経済事象ダイジェストが格納される。頻度集計部は、経済事象データベースに格納された経済事象ダイジェストの群を集計対象として、所定の集計時間単位毎に、経済事象ダイジェストを内容的な共通性を有する経済事象パターン別に分類し、それぞれの経済事象パターンの出現頻度を集計する。ベクトル推定部は、集計時間単位毎の経済事象パターンのそれぞれに対して、共通の空間に写像させた非負の実数値よりなる経済事象頻度ベクトルが、集計時間単位毎の経済事象パターンのそれぞれの出現頻度を再現するように推定する。ベクトル集計部は、経済指標値の時間分解能に相当する第1の時間単位毎に、第1の時間単位に属する経済事象頻度ベクトルを集計して、第1の時間単位内における各経済事象パターンの出現度合いを表す第1の経済事象集計ベクトルを生成する。学習処理部は、第1の経済事象集計ベクトルの入力に対して、これと時間的に対応する経済指標値が応答するように、経済指標を推定するための回帰モデルの学習を行う。 In order to solve such a problem, a first invention is an economic An economic indicator estimation system for estimating indicators is provided. This system has a digest generator, an economic phenomenon database, a frequency totalizer, a vector totalizer, and a learning processor. The digest generation unit generates an economic event digest by structuring the content of economic events extracted from news groups collected from the outside with a plurality of predetermined items. The economic event database stores economic event digests. The frequency aggregating unit classifies the economic event digests stored in the economic event database into groups of economic event digests stored in the economic event database as aggregation targets, and classifies the economic event digests into economic event patterns having commonalities in content for each predetermined aggregation time unit. Aggregate the frequency of occurrence of economic event patterns. The vector estimator calculates, for each economic event pattern for each aggregated time unit, an economic event frequency vector consisting of non-negative real values mapped onto a common space, which corresponds to the appearance of each economic event pattern for each aggregated time unit. Estimate to reproduce the frequency. The vector aggregation unit aggregates the economic event frequency vectors belonging to the first time unit for each first time unit corresponding to the time resolution of the economic index value, and calculates each economic event pattern within the first time unit. A first economic event aggregation vector representing the degree of occurrence is generated. The learning processing unit learns a regression model for estimating an economic index so that an economic index value temporally corresponding to the input of the first economic event aggregation vector responds.
ここで、第1の発明において、ニュース群のうち、予め設定されたニュースメディアリストに記述されたメディア名のものを抽出して、ダイジェスト生成部に出力するニュースフィルタ部を設けてもよい。また、ダイジェスト生成部によって生成された経済事象ダイジェストのうち、予め設定された絞込条件に合致したものを抽出して、経済事象データベースに格納する絞込処理部を設けてもよい。この場合、上記絞込処理部は、上記絞込条件として、推定対象となる特定の経済指標値に影響を与える経済事象ダイジェストのパターンが記述された業績要因リストを参照して、経済事象ダイジェストを抽出することが好ましい。 Here, in the first invention, a news filter section may be provided that extracts media names described in a preset news media list from the news group and outputs the extracted media names to the digest generation section. Further, a narrowing processing unit may be provided that extracts economic phenomenon digests that match preset narrowing conditions from among the economic event digests generated by the digest generating unit and stores them in the economic phenomenon database. In this case, the narrowing-down processing unit refers to, as the narrowing-down condition, a performance factor list describing patterns of economic event digests that affect specific economic index values to be estimated, and selects economic event digests. Extraction is preferred.
第1の発明において、上記ベクトル集計部は、各次元の構成要素の和が1になるように正規化された経済事象頻度ベクトルの和を算出し、第1の時間単位における出現頻度で正規化することによって、第1の経済事象集計ベクトルを生成することが好ましい。 In the first invention, the vector aggregation unit calculates the sum of economic event frequency vectors normalized so that the sum of the components of each dimension is 1, and normalizes by the appearance frequency in the first time unit Preferably, the first economic event aggregation vector is generated by:
第1の発明において、第2の経済事象集計ベクトルの入力に対する学習済の回帰モデルの応答を、第2の経済事象集計ベクトルと時間的に対応する経済指標の推定値として出力する推定処理部を設けてもよい。この場合、上記ベクトル集計部は、経済指標値とは時間分解能が異なる第2の時間単位に属する経済事象頻度ベクトルを集計して、第2の時間単位内における各経済事象パターンの出現度合いを表す第2の経済事象集計ベクトルを生成することが好ましい。また、上記ベクトル集計部は、各次元の構成要素の和が1になるように正規化された経済事象頻度ベクトルの和を算出し、第2の時間単位における出現頻度で正規化することによって、第2の経済事象集計ベクトルを生成することが好ましい。 In the first invention, an estimation processing unit that outputs a response of the learned regression model to the input of the second aggregate vector of economic events as an estimated value of an economic indicator temporally corresponding to the second aggregate vector of economic events. may be provided. In this case, the vector aggregating unit aggregates economic event frequency vectors belonging to a second time unit having a time resolution different from that of the economic index value, and expresses the degree of occurrence of each economic event pattern within the second time unit. Preferably, a second economic event aggregation vector is generated. In addition, the vector counting unit calculates the sum of economic event frequency vectors normalized so that the sum of the components of each dimension is 1, and normalizes by the appearance frequency in the second time unit, Preferably, a second economic event aggregation vector is generated.
第2の発明は、特定の経済指標を表す経済指標値の離散的な時系列と、経済指標値に影響を及ぼす経済事象とに基づいて、所望の時間分解能で経済指標を推定する経済指標推定プログラムを提供する。このプログラムは、以下の第1から第6までのステップを有する処理をコンピュータに実行させる。第1のステップでは、外部より収集されたニュース群から抽出された経済事象の内容を、予め定められた複数の項目で構造化した経済事象ダイジェストを生成する。第2のステップでは、経済事象ダイジェストを経済事象データベースに格納する。第3のステップでは、経済事象データベースに格納された経済事象ダイジェストの群を集計対象として、所定の集計時間単位毎に、経済事象ダイジェストを内容的な共通性を有する経済事象パターン別に分類し、それぞれの経済事象パターンの出現頻度を集計する。第4のステップでは、集計時間単位毎の経済事象パターンのそれぞれに対して、共通の空間に写像させた非負の実数値よりなる経済事象頻度ベクトルが、集計時間単位毎の経済事象パターンのそれぞれの出現頻度を再現するように推定する。第5のステップでは、経済指標値の時間分解能に相当する第1の時間単位毎に、第1の時間単位に属する経済事象頻度ベクトルを集計して、第1の時間単位内における各経済事象パターンの出現度合いを表す第1の経済事象集計ベクトルを生成する。第6のステップでは、第1の経済事象集計ベクトルの入力に対して、これと時間的に対応する経済指標値が応答するように、経済指標を推定するための回帰モデルの学習を行う。 A second invention is an economic indicator estimation method for estimating an economic indicator with a desired time resolution based on a discrete time series of economic indicator values representing specific economic indicators and economic events affecting the economic indicator values. Offer a program. This program causes the computer to execute processing having the following first to sixth steps. In the first step, an economic event digest is generated by structuring the content of the economic event extracted from the news group collected from the outside with a plurality of predetermined items. In a second step, the economic event digest is stored in the economic event database. In the third step, a group of economic event digests stored in the economic event database is targeted for aggregation, and the economic event digests are classified into economic event patterns having commonalities in content for each predetermined aggregation time unit. aggregate the frequency of occurrence of economic event patterns. In the fourth step, for each aggregated time unit economic event pattern, an economic event frequency vector consisting of non-negative real values mapped onto a common space is obtained as Estimate so as to reproduce the appearance frequency. In the fifth step, for each first time unit corresponding to the time resolution of the economic index value, the economic event frequency vectors belonging to the first time unit are aggregated, and each economic event pattern within the first time unit generates a first economic event aggregation vector representing the degree of occurrence of . In the sixth step, a regression model for estimating economic indices is learned so that economic index values temporally corresponding to the input of the first economic event aggregation vector respond.
ここで、第2の発明において、上記第1のステップは、ニュース群のうち、予め設定されたニュースメディアリストに記述されたメディア名のものを抽出するステップを有していてもよい。また、上記第1のステップは、経済事象ダイジェストのうち、予め設定された絞込条件に合致したものを抽出して、経済事象データベースに格納するステップを有していてもよい。この場合、上記第1のステップは、上記絞込条件として、推定対象となる特定の経済指標値に影響を与える経済事象ダイジェストのパターンが記述された業績要因リストを参照して、経済事象ダイジェストを抽出することが好ましい。 Here, in the second invention, the first step may have a step of extracting, from among the news groups, news items with media names described in a preset news media list. Further, the first step may include a step of extracting economic event digests that match preset narrowing conditions and storing them in the economic event database. In this case, the first step refers to, as the narrowing condition, a performance factor list describing patterns of economic event digests that affect specific economic index values to be estimated, and extracts the economic event digests. Extraction is preferred.
第2の発明において、上記第3のステップは、各次元の構成要素の和が1になるように正規化された経済事象頻度ベクトルの和を算出し、第1の時間単位における出現頻度で正規化することによって、第1の経済事象集計ベクトルを生成することが好ましい。 In the second invention, the third step calculates the sum of the economic event frequency vectors normalized so that the sum of the components of each dimension is 1, and normalizes the sum of the economic event frequency vectors in the first time unit It is preferable to generate the first economic event aggregation vector by unifying.
第2の発明において、上述したステップに加えて、以下の第7および第7のステップを有する処理をコンピュータに実行させてもよい。第7のステップでは、第2の経済事象集計ベクトルの入力に対する学習済の回帰モデルの応答を、第2の経済事象集計ベクトルと時間的に対応する経済指標の推定値として出力する。第8のステップでは、経済指標値とは時間分解能が異なる第2の時間単位に属する経済事象頻度ベクトルを集計して、第2の時間単位内における各経済事象パターンの出現度合いを表す第2の経済事象集計ベクトルを生成する。この場合、上記第8のステップは、各次元の構成要素の和が1になるように正規化された経済事象頻度ベクトルの和を算出し、第2の時間単位における出現頻度で正規化することによって、第2の経済事象集計ベクトルを生成することが好ましい。 In the second invention, in addition to the steps described above, the computer may be caused to execute processing having the following seventh and seventh steps. In the seventh step, the response of the trained regression model to the input of the second aggregate vector of economic events is output as the estimated value of the economic index temporally corresponding to the second aggregate vector of economic events. In the eighth step, economic event frequency vectors belonging to a second time unit with a time resolution different from the economic index value are aggregated to obtain a second time unit representing the degree of occurrence of each economic event pattern within the second time unit. Generate an economic event aggregation vector. In this case, the eighth step calculates the sum of the normalized economic event frequency vectors so that the sum of the components of each dimension is 1, and normalizes by the appearance frequency in the second time unit. It is preferred to generate the second economic event aggregation vector by:
第1および第2の発明において、上記第2の時間単位は、経済指標値よりも時間分解能が高くてもよい。 In the first and second inventions, the second time unit may have higher time resolution than the economic indicator value.
第1および第2の発明において、上記第2の時間単位は、経済指標値よりも時間分解能が高くてもよい。 In the first and second inventions, the second time unit may have higher time resolution than the economic indicator value.
本発明によれば、第1の経済事象集計ベクトルの入力に対して、これと時間的に対応する経済指標値が応答するように、回帰モデルの学習を行う。第1の経済事象集計ベクトルは、第1の時間単位内における各経済事象パターンの出現度合いを表している。回帰モデルの学習結果として、パターン化された経済事象の出現頻度、換言すれば、ある経済指標値に対する経済事象の影響度合いが考慮された形で、経済事象と経済指標値とが関連付けられる。このようにして構築された回帰モデルを利用することで、任意の時間分解能の入力に対する回帰モデルの応答として、この時間分解能に相当する経済指標推定が可能になる。 According to the present invention, the regression model is learned so that the economic indicator value temporally corresponding to the input of the first economic event aggregation vector responds. The first economic event aggregation vector represents the degree of occurrence of each economic event pattern within the first time unit. As a learning result of the regression model, an economic event and an economic index value are associated in a form that takes into consideration the frequency of occurrence of patterned economic events, in other words, the degree of influence of an economic event on a certain economic index value. By using the regression model constructed in this way, it becomes possible to estimate economic indicators corresponding to this time resolution as the response of the regression model to the input of arbitrary time resolution.
図1は、本実施形態に係る経済指標推定システムのブロック図である。この経済指標推定システム1は、既知の経済指標値と、既知のニュース群より抽出される経済事象とに基づいて、所望の時間分解能で経済指標を推定する。ここで、「経済指標値」とは、特定の経済指標を表しており、日次や月次の如く、離散的な時系列(経済指標データ)として提供される。また、「経済事象」とは、推定対象となる特定の経済指標値に影響を及ぼす出来事をいう。経済事象および経済指標値は何らかの因果関係を有しており、ある時間内において経済事象(一つとは限らない。)が発生すると、これと時間的に対応する経済指標値の変動が起こり得る。
FIG. 1 is a block diagram of an economic index estimation system according to this embodiment. This economic
図2は、経済指標値の時系列の一例として、月次で公表される景気ウォッチャー製造業指数の時系列を示している。この経済指標値の時間分解能は月単位であり、経済指標推定システム1に入力すべきデータとして外部から取得される。このような経済指標値としては、景気ウォッチャー製造業指数の他に、日銀短観、鉱工業生産指数、失業率、自動車販売台数、住宅着工統計などを含めて、経済事象との因果関係を有するものであれば、任意の経済指標値を用いることができる。また、経済指標値の公表周期(時間分解能)は、四半期毎や半月毎でもよく、更には不定期なものやランダムなものであっても構わない。
FIG. 2 shows the time series of the Economy Watchers Manufacturing Index released monthly as an example of the time series of economic index values. The time resolution of this economic index value is monthly, and is obtained from the outside as data to be input to the economic
図3は、経済事象の抽出元となるニュース群の一例を示す図である。このニュース群は、記事ID、メディア名、配信日時、記事本文からなるニュース記事の集合(1件であってもよい。)であって、インターネット上などに存在する様々な外部ソースより随時収集される。 FIG. 3 is a diagram showing an example of a news group from which economic events are extracted. This news group is a collection of news articles (may be one article) consisting of an article ID, media name, distribution date and time, and article text, and is collected from various external sources such as the Internet as needed. be.
経済指標推定システム1は、ニュースフィルタ部2と、ダイジェスト生成部3と、絞込処理部4と、経済事象データベース5と、指標推定部6とを主体に構成されている。
The economic
ニュースフィルタ部2は、入力されたニュース群のうち、経済事象に関するニュース記事を配信している可能性が高いメディア名のもののみを抽出し、それ以外については除外する。このメディア名は、ニュースメディアリストとして予め設定されており、ここに記述されていないメディア名のものは、経済事象とは本来的に無関係なノイズとみなされる。図3の例では、ニュースメディアリストに記載されていない、記事ID=「1005」の芸能新聞や記事ID=「1006」の農業新聞などのニュース記事が除外されることになる。このようなニュースのソースに基づくフィルタリングを行うことで、それ以降の処理負荷の軽減を図る。
The
ダイジェスト生成部3は、ニュースフィルタ部2によってフィルタリングされたニュース群に基づいて、経済事象を抽出する。一つのニュース記事から複数の経済事象が抽出されることもあるし、一つも抽出されないこともある。抽出された経済事象の内容は、経済事象ダイジェストの形で出力される。図4は、ニュース群より抽出された経済事象ダイジェストの一例を示す図である。経済事象ダイジェストは、経済事象の内容を予め定められた複数の項目に区分することによって構造化したものであり、冗長性を排した形で経済事象の特徴(特徴量)を端的に表している。一例として、経済事象ダイジェストは、「名前(item)」、「要素(element)」および「変動(predicate)」のセットによって構成することができる。「名前(item)」は、「原油」や「ガソリン」のように、経済事象の名前を表す項目である。「要素(element)」は、「価格」や「需要」のように、経済事象の定量または傾向を表す項目である。「変動(predicate)」は、「上昇」や「増加」のように、経済事象(「要素」)の変動方向(+/-)を表す項目である。ただし、これらの3項目のうち、経済事象を特徴付けるものとして最も重要なものは、「要素(element)」および「変動(predicate)」、すなわち、「何」が「どうした」(例えば「価格」が「下落」した)である。したがって、「要素(element)」および「変動(predicate)」は必要不可欠であるが、「名前(item)」については必要に応じて適宜採用すればよく、あるいは、これら以外の別の項目を追加してもよい。
The digest
なお、「名前(item)」、「要素(element)」および「変動(predicate)」は、表現の揺らぎを解消すべく、正規化辞書を用いて、抽出テキストを正規テキストに正規化、すなわち、表現を統一することが好ましい。図5は、正規化辞書の一例を示す。例えば、変動(predicate)に関して、「高騰」、「増加」、「多い」といった抽出テキストは、変動方向がプラスである「増」という正規テキストに変換され、「下落」、「下降」、「急落」といった抽出テキストは、変動方向がマイナスである「減」という正規テキストに変換される。これにより、抽出テキストの表現が異なっていても、システム上、同一の意味として統一的に取り扱うことが可能になる。 In addition, "name (item)", "element (element)" and "variation (predicate)" normalize the extracted text to regular text using a normalization dictionary in order to eliminate fluctuations in expression, that is, It is preferable to unify the expressions. FIG. 5 shows an example of a normalization dictionary. For example, with regard to fluctuations (predicate), the extracted texts such as "soaring", "increasing", and "many" are converted to the regular text of "increasing", which has a positive fluctuation direction. is converted to regular text "decrease" with a negative change direction. As a result, even if the expression of the extracted text is different, it becomes possible to uniformly handle it as the same meaning on the system.
絞込処理部4は、予め設定された絞込条件に従って、ダイジェスト生成部4によって生成された経済事象ダイジェストを個別に評価して、推定対象となる特定の経済指標値と関連性を有する経済事象ダイジェストを抽出する。図6は、絞込条件の一例を示している。本実施形態において、絞込条件は、推定対象となる特定の経済指標値に影響を与える経済事象ダイジェストのパターンが記述された業績要因リストとして規定されている。これにより、ダイジェスト生成部4によって生成された経済事象ダイジェストのうち、業績要因リストに記述されたパターンに合致するものが抽出され、それに合致しないものは、推定対象となる特定の経済指標値とは関連しないものとして除去される。 The narrowing-down processing unit 4 individually evaluates the economic event digests generated by the digest generating unit 4 according to preset narrowing-down conditions, and identifies economic events related to specific economic index values to be estimated. Extract the digest. FIG. 6 shows an example of narrowing-down conditions. In this embodiment, the narrowing-down condition is defined as a performance factor list describing patterns of economic event digests that affect specific economic index values to be estimated. As a result, among the economic event digests generated by the digest generation unit 4, those that match the pattern described in the performance factor list are extracted, and those that do not match are extracted from the specific economic index value to be estimated. Removed as irrelevant.
業績要因リストは、例えば、企業リストと、企業の業績要因データという2種類のデータを用いて作成することができる。図7に示すように、企業リストには、推定対象である特定の経済指標値に影響を及ぼす企業名がリストアップされている。企業名の記述は、企業の名称であってもよいが、上場企業の場合には銘柄コードなどを用いれば曖昧さをなくすことができる。また、東証33業種などの分類データを活用すれば、企業リスト自体を容易に作成することができる。一方、図8に示すように、業績要因データには、「企業名」と、「経済事象ダイジェスト」と、「影響」とのセットがリストアップされており、過去の実績として、どのような経済事象ダイジェストが企業にどのような影響を与えたのかが記述されている。例えば、同図において、「白物家電/需要/増加」という経済事象ダイジェストは、「いろは電機」の「増収」という影響を、「ドル円/相場/下落」という経済事象ダイジェストは、「いろは電機」の「減収」という影響をそれぞれ与えたことを示している。このような業績要因データについては、本出願人が既に提案した特開2020-24689号公報に記載された手法を想定しているので、必要ならば参照されたい。そして、図8に示した企業の業績要因データのうち、図7に示した企業に関するものが抽出され、これによって、図6に示した業績要因リストが作成される。 The performance factor list can be created, for example, using two types of data: a company list and company performance factor data. As shown in FIG. 7, the company list lists the names of companies that influence specific economic index values to be estimated. The description of the company name may be the name of the company, but in the case of a listed company, the ambiguity can be eliminated by using the brand code or the like. In addition, if classification data such as the 33 industries of the Tokyo Stock Exchange are used, the company list itself can be easily created. On the other hand, as shown in Figure 8, the performance factor data lists sets of "company name," "economic event digest," and "impact." It describes how the event digest affected the company. For example, in the same figure, the economic event digest “white goods/demand/increase” shows the impact of “increase in sales” of “Iroha Denki”, while the economic event digest “dollar yen/market price/decrease” , respectively. For such performance factor data, the method described in Japanese Patent Application Laid-Open No. 2020-24689, which has already been proposed by the present applicant, is assumed, so please refer to it if necessary. 7 are extracted from the company performance factor data shown in FIG. 8, and the performance factor list shown in FIG. 6 is created.
絞込処理部4によって抽出された経済事象ダイジェストは、経済事象データベース5に新規に追加される。経済事象データベース5には、今回追加される経済事象ダイジェストのみならず、それ以前に抽出された過去分の経済事象ダイジェストも格納されている。
The economic phenomenon digest extracted by the narrowing processing unit 4 is newly added to the
指標推定部6は、上述した経済指標値と、経済事象データベース5に格納された経済事象ダイジェストとに基づいて、所望の時間分解能で経済指標を推定する。図9は、指標推定部6のブロック図である。この指標推定部6は、頻度集計部6aと、ベクトル推定部6bと、ベクトル集計部6cと、学習処理部6dと、推定処理部6eと、回帰モデル6fとを主体に構成されている。頻度集計部6aおよびベクトル推定部6bは、経済事象データベース5より読みされた経済事象ダイジェストの群を入力とした前処理を行う。ベクトル集計部6cおよび学習処理部6dは、回帰モデル6fの学習を行って、経済事象ダイジェストと経済指標値との関連付けを行う。ベクトル集計部6cおよび推定処理部6eは、学習済の回帰モデル6fを用いて所望の時間分解能で経済指標を推定し、その推定結果として経済指標の推定値を出力する。
The
頻度集計部6aは、経済事象ダイジェストの群を集計対象として、所定の集計時間単位毎に、集計対象となる経済事象ダイジェストを内容的な共通性を有する経済事象パターン別に分類する。そして、頻度集計部6aは、それぞれの集計時間単位について、分類された経済事象パターンのそれぞれの出現頻度を集計する。集計時間単位は、本実施形態では日次としているが、これに限らず週次や月次のように任意に設定することができ、この集計時間単位が指標推定における最も高い時間分解能に相当する。
The
図10は、経済事象パターンの出現頻度を日次で集計した結果の一例を示す。上述したように、経済事象パターンは、「名前(item)×要素(element)×変動(predicate)」のセットとして規定され、このセットが共通するものが同一の経済事象パターンとしてカウントされる。その結果、2018年12月14日(日次)について、経済事象パターンA(原油×価格×下落)の出現回数は3回、経済事象パターンB(自動車×販売×増加)の出現回数は2回、経済事象パターンC(携帯電話×輸出×堅調)の出現回数は1回、経済事象パターンD(ドル×価格×下落)の出現回数は1回、経済事象パターンE(住宅×需要×好調)の出現回数は1回、経済事象パターンF(ガソリン×需要×増加)の出現回数は1回となる。それぞれの経済事象パターンA~Fの出現頻度は、これと時間的に対応する経済指標値(例えば、2018年12月14日付の経済指標値、または、同日を含む所定期間の経済指標値)と相関性を有しており、出現頻度が高いものほど、この経済指標値に与える影響の度合いが大きいものとみなされる。 FIG. 10 shows an example of the result of summing up the frequency of occurrence of economic event patterns on a daily basis. As described above, an economic event pattern is defined as a set of "item x element x predicate", and those that have this set in common are counted as the same economic event pattern. As a result, on December 14, 2018 (daily), economic event pattern A (crude oil x price x decline) occurred three times, and economic event pattern B (automobiles x sales x increase) occurred twice. , economic event pattern C (mobile phones x exports x solid) appears once, economic event pattern D (dollar x price x decline) appears once, and economic event pattern E (housing x demand x strong) appears once. The number of occurrences is one, and the number of occurrences of economic phenomenon pattern F (gasoline x demand x increase) is one. The frequency of occurrence of each of the economic event patterns A to F is the economic index value corresponding to this in time (for example, the economic index value on December 14, 2018, or the economic index value for a predetermined period including the same day). There is a correlation, and the higher the frequency of appearance, the greater the degree of impact on this economic indicator value.
ベクトル推定部6bは、集計時間単位毎の経済事象パターンのそれぞれに対して、共通の空間に写像させた経済事象頻度ベクトルが、集計時間単位毎の経済事象パターンのそれぞれの出現頻度を再現するように推定する。経済事象頻度ベクトルを推定する目的は、ニュースのような離散的なデータを連続的な特徴量に変換することで、例えば、「自動車」と「石油」、または、「販売」と「需要」などを離散的な記号に写像するのではなく、r(r≧2)次元の共通の空間に写像して、同一の尺度で表現するためである。これにより、オブジェクト間の意味の差異や類似度を測ることが可能になる。この点、離散的な記号、例えば、「自動車」=id1、「石油」=id2のような表現では、四則演算などの数学的処理を行うことができない(後述するベクトル集計部6cの処理ができない。)。 The vector estimating unit 6b is configured so that the economic event frequency vector mapped to the common space for each economic event pattern for each aggregated time unit reproduces the appearance frequency of each economic event pattern for each aggregated time unit. estimated to . The purpose of estimating economic event frequency vectors is to convert discrete data such as news into continuous features, such as "automobiles" and "oil", or "sales" and "demand". is not mapped to discrete symbols, but to a common space of r (r≧2) dimensions and expressed on the same scale. This makes it possible to measure the difference and similarity in meaning between objects. In this regard, discrete symbols, such as expressions such as “automobile”=id1 and “oil”=id2, cannot be used for mathematical processing such as four arithmetic operations (the processing of the vector counting unit 6c, which will be described later, cannot be performed). .).
経済事象頻度ベクトルの推定は、以下の数式1に示す仮定に基づいている。ここで、記号「~」は、左辺が右辺の確率分布に従うという意味である。xdijkは、特定の集計時間単位(日付)における特定の経済事象パターンの出現頻度である。また、θd,θi,θj,θkは、r次元の潜在ベクトルであり、それぞれ、日付(集計時間単位)、名前(item)、要素(element)、変動(predicate)といったオブジェクトの連続的な数値を持つパラメータである。なお、θは非負(マイナスではないこと。)を満たす。
The estimation of the economic event frequency vector is based on the assumptions shown in
具体的には、経済事象頻度ベクトルは、以下の数式2に基づいて推定される。ここで、xdijkは日付dにおける経済事象パターンijkの出現頻度(観測数)、θ*は経済事象頻度ベクトル(推定対象)のパラメータである。rは経済事象頻度ベクトルの次元番号であり、次元数は適宜設定される。また、dは日付に対応する添字、mdは日付dに対応する月の添字、iは経済事象パターンの名前(item)に対応する添字、jは経済事象パターンの要素(element)に対応する添字、kは経済事象パターンの変動(predicate)に相当する添字である。同数式2において、集計時間単位内における経済事象パターンの出現頻度は、ポアソン分布に従うことを仮定としている。なお、θは非負を満たしさえすれば、eθのような関数やニューラルネットのような非線形関数の形を取ることが可能である。
Specifically, the economic event frequency vector is estimated based on
上記数式2における各パラメータθd,θi,θj,θkは、離散的な記号を共通の空間に写像した結果となる。経済事象パターン毎の出現頻度xdijkをうまく再現できるように、これらのパラメータθd,θi,θj,θkを推定(学習)できれば、その集計時間単位(日次)内において、どのような経済事象(経済事象パターン)が出現しているかといった状況、換言すれば、各経済事象パターンの出現度合いを表現することが可能となる。
The parameters .theta.d, .theta.i, .theta.j, and .theta.k in
上記数式1および2に基づいて推定結果として、経済事象頻度ベクトルは、非負の実数値によって構成される。図11から図14は、4つのパラメータθ*に分解して表現された経済事象頻度ベクトルの一例を示す図である(r=10の場合のθ*の結果)。経済事象頻度ベクトルθ*の各次元は、オブジェクト間で共通の意味を持つため、例えば、異なる名前(item)であっても非負の実数値として同じ尺度で比較することが可能になる。また、名前(item)間で推定されたパラメータの実数値が似ている傾向があると、これらを含む経済事象は同時に観測され易くなる。
As an estimation result based on
また、ベクトル推定部6bは、経済事象頻度ベクトルの各次元の構成要素(非負の実数値)の和が1になるように、経済事象頻度ベクトルを正規化する。この正規化によって、経済事象頻度ベクトル同士を同じ数値基準で評価することが可能になる。具体的には、特定の日付において出現する経済事象パターン毎に推定された経済事象頻度ベクトルに対して、以下の数式3を適用することによって正規化が行われる。この正規化を行えば、θ*の値が非負の実数値を取るため、それぞれの経済事象パターンについて正規化された経済事象頻度ベクトルΛdijkrの和が必ず1になる。この結果は、経済事象パターンの潜在的に出現率として解釈できるので、経済事象パターン毎に出現頻度を足し上げる処理が可能となる。
The vector estimator 6b also normalizes the economic event frequency vector so that the sum of the constituent elements (non-negative real numbers) of each dimension of the economic event frequency vector becomes one. This normalization allows economic event frequency vectors to be evaluated on the same numerical basis. Specifically, normalization is performed by applying
なお、ベクトル推定部6bによって生成された経済事象頻度ベクトルは、図示しない記憶装置に格納される。この記憶装置に格納された経済事象頻度ベクトルは、経済事象頻度ベクトルの集計を行う際、ベクトル集計部6cによって随時読み出される。 The economic event frequency vector generated by the vector estimator 6b is stored in a storage device (not shown). The economic event frequency vectors stored in this storage device are read by the vector counting unit 6c whenever the economic event frequency vectors are counted.
ベクトル集計部6cは、所定の時間単位毎に、この時間単位に属する経済事象頻度ベクトルを集計して、経済事象集計ベクトルを生成する。ここでいう時間単位は、回帰モデル6fの学習時では、経済指標値の時間分解能に相当する時間単位(本実施形態では月次)である。また、回帰モデル6fを用いた指標推定時では、経済指標値の時間分解能とは異なる時間単位、典型的には、経済指標値よりも時間分解能が高い時間単位(本実施形態では日次)である。経済事象集計ベクトルは、上記時間単位内における各経済事象パターンの出現度合いを表す。すなわち、上記学習時には、月次集計の結果として、1ヶ月における各経済事象パターンの出現度合いを表す経済事象集計ベクトル(第1の経済事象集計ベクトル)が生成される。また、上記指標予測時には、日次集計の結果として、1日における各経済事象パターンの出現度合いを表す経済事象集計ベクトル(第2の経済事象集計ベクトル)が生成される。
The vector totalization unit 6c totalizes the economic event frequency vectors belonging to each predetermined time unit to generate an economic event total vector. The time unit here is a time unit (monthly in this embodiment) corresponding to the time resolution of the economic index value during learning of the
具体的には、経済事象集計ベクトルは、以下の数式4によって計算される。上記数式3において、Λdijkrの総和が必ず1になることを利用すれば、xdijkがd日の経済事象パターンijkの出現頻度なので、xdijkΛdijkrとして、日付d日の名前(item)i、要素(element)jについてすべて和を取り、上記時間単位における出現頻度で正規化することによって、d日の経済事象集計ベクトルを計算できる。
Specifically, the economic event aggregation vector is calculated by Equation 4 below. Using the fact that the sum of Λdijkr is always 1 in the
この処理は、変動(predicate)k毎に別々に行われる。なお、変動(predicate)に代えて、図8に示した企業の業績要因データにおける「影響」毎に行ってもよい。この「影響」を用いる利点としては、第1に、回帰係数の値の動向を上手く表現できること、そして、第2に、回帰係数の結果が増収ならば必ずプラス、減収ならば必ずマイナスになることを制約できることが挙げられる。また、和を取る際は、任意の関数を使って和を取ることや、過去の経済事象集計ベクトルが現在の経済事象集計ベクトルに影響を与えると仮定して和を取ることも可能である。この処理を行うことで、日付dについて、r次元のどの位置に属する事象が出現し易いかという解釈を行うことが可能になる。 This process is done separately for each predicate k. It should be noted that instead of fluctuation (predicate), it may be performed for each "impact" in the performance factor data of the company shown in FIG. The advantage of using this "influence" is, firstly, that the trend of the value of the regression coefficient can be expressed well, and secondly, the result of the regression coefficient is always positive if the revenue increases, and negative if the revenue decreases. can be constrained. In addition, when taking the sum, it is possible to take the sum using an arbitrary function, or to take the sum assuming that the past economic event aggregate vector affects the current economic event aggregate vector. By performing this process, it becomes possible to interpret which position in the r dimension the event belonging to on the date d is likely to appear.
図15は、日次単位の経済事象集計ベクトルの一例を示す図である。図示した数値の意味は、各次元が経済事象の特性を表しており、ある任意の日dに関して、どのような経済事象が出現し易いのかを表している。換言すれば、その日dにおける各経済事象パターンの出現度合いとして、次元1は石油関連の事象の特性が強いとか、次元2は自動車関連の事象の特性が強いといった傾向を表している。これは、計算上必ずそうなるというわけでなく、コンピュータの計算結果を人間が解釈した結果として、そうなる可能性があるということである。
FIG. 15 is a diagram showing an example of a daily unit economic event aggregation vector. The numerical values shown in the figure represent the characteristics of economic events in each dimension, and represent what kind of economic events are likely to occur on any given day d. In other words, as the degree of appearance of each economic event pattern on the day d,
一方、月次単位の経済事象集計ベクトルを算出する場合には、上記数式4にしたがって、月次単位毎に、その月次に属する経済事象パターン毎の経済事象頻度ベクトルを集計すればよい。回帰モデル6fの学習用の事象集計ベクトルを月次単位としているのは、経済指標値の時間分解能と整合させるためである。したがって、もし、経済指標値の時間分解能が四半期単位であるならば、学習用の事象集計ベクトルも四半期単位で生成される。
On the other hand, when calculating the economic event aggregate vector for each month, the economic event frequency vector for each economic event pattern belonging to that month should be aggregated for each monthly unit according to Equation 4 above. The reason why the event aggregation vector for learning of the
回帰モデル6fは、統計的手法によって二つの変数の関係を推計するモデルであり、経済指標の推定を任意の時間分解能で行うために用いられる。回帰モデル6fとしては、リッジ回帰、Lasso、ガウス過程回帰、XGboost、ニューラルネットワーク、サポートベクターマシン(SVM)など含む任意のモデルを利用することができる。
The
学習処理部6dは、ベクトル集計部6cによって生成された月次単位の経済事象集計ベクトル(月次集計)の入力に対して、これと時間的に対応する経済指標値が応答するように、回帰モデル6fの学習を行う。図16は、回帰モデル6fにおける入力変数と応答変数との関係の一例を示す図である。例えば、2014年1月の経済事象集計ベクトルの入力に対して、同年同月の経済指標値(57.7)が応答するように、回帰モデル6fの学習が行われることになる。
The
推定処理部6eは、ベクトル集計部6cによって生成された日次単位の経済事象集計ベクトル(日次集計)を用いて、これと時間的に対応する経済指標値を推定する。具体的には、経済事象集計ベクトルが学習済の回帰モデル6fに入力され、この入力に対する回帰モデル6fの応答が経済指標の推定値として出力される。日次および月次の経済事象集計ベクトルについて同一の方法で標準化計算を行うことで、r次元の合計を1に制約をかけることができるので、月次のデータによる学習結果を用いて日次の経済指標の推定を行ったとしても、推定精度を保つことが可能となる。なお、経済指標の推定値は、日次単位よりも時間分解能が高い場合、および、これが低い場合のどちらであっても出力可能であり、また、現時点のみならず過去分についても出力可能である。
The estimation processing unit 6e uses the daily economic event aggregation vector (daily aggregation) generated by the vector aggregation unit 6c to estimate an economic indicator value temporally corresponding thereto. Specifically, the economic event aggregate vector is input to the learned
また、推定処理部6eは、必要に応じて、回帰モデル6fの応答である経済指標の推定値に対して平滑化や季節調整といった処理を行う。図17は、カルマンフィルタによる平滑化が行われた経済指標の推定値の一例を示す図である。図2に示した元の経済指標値が月次単位であるのに対して、同図に示す経済指標の推定値の日次単位となっており、元の経済指標値よりも時間分解能が高く、かつ、なめらかに変化している。
In addition, the estimation processing unit 6e performs processing such as smoothing and seasonal adjustment on the estimated values of the economic indicators, which are the responses of the
このように、本実施形態によれば、経済事象集計ベクトルの入力に対して、これと時間的に対応する経済指標値が応答するように、回帰モデル6fの学習を行う。経済事象集計ベクトルは、例えば月次といった時間単位内における各経済事象パターンの出現度合いを表している。回帰モデル6fの学習結果として、パターン化された経済事象の出現頻度、換言すれば、ある経済指標値に対する経済事象の影響度合いが考慮された形で、経済事象と経済指標値とが関連付けられる。このようにして構築された回帰モデル7を利用することで、任意の時間分解能の経済事象集計ベクトルの入力に対する応答として、この時間分解能に相当する経済指標の推定を精度良く行うことができる。
As described above, according to the present embodiment, the
さらに、本発明は、図1および図9に示した機能ブロックを等価的に実現する経済指標推定プログラムとして捉えることができる。この経済指標推定プログラムは、概略的には、以下の処理をコンピュータに実行させる。まず、ニュース群から抽出された経済事象について、経済事象ダイジェストを生成する。つぎに、予め設定された絞込条件に従って、経済指標値と関連性を有する経済事象ダイジェストを抽出すると共に、抽出された経済事象ダイジェストを経済事象データベース5に格納する。つぎに、経済事象データベース5に格納された経済事象ダイジェストの群を集計対象として、所定の集計時間単位毎に、経済事象ダイジェストを経済事象パターン別に分類し、それぞれの経済事象パターンの出現頻度を集計する。つぎに、集計時間単位毎の経済事象パターンのそれぞれに対して、共通の空間に写像させた経済事象頻度ベクトルが、集計時間単位毎の経済事象パターンのそれぞれの出現頻度を再現するように推定する。つぎに、月次単位毎に、月次単位に属する経済事象頻度ベクトルを集計して、経済事象集計ベクトル(月次)を生成する。つぎに、経済事象集計ベクトル(月次)の入力に対して、これと時間的に対応する経済指標値(月次)が応答するように、回帰モデル6fの学習を行う。つぎに、日次単位に属する経済事象頻度ベクトルを集計して、経済事象集計ベクトル(日次)を生成する。最後に、経済事象集計ベクトル(日次)の入力に対する学習済の回帰モデル6fの応答を、経済事象集計ベクトル(日次)と時間的に対応する経済指標の推定値(日次)として出力する。
Furthermore, the present invention can be regarded as an economic indicator estimation program that equivalently implements the functional blocks shown in FIGS. This economic index estimation program generally causes a computer to execute the following processes. First, an economic event digest is generated for the economic events extracted from the news group. Next, according to the narrowing-down conditions set in advance, economic event digests having relevance to the economic index value are extracted, and the extracted economic event digests are stored in the
1 経済指標推定システム
2 ニュースフィルタ部
3 ダイジェスト生成部
4 絞込処理部
5 経済事象データベース
6 指標推定部
6a 頻度集計部
6b ベクトル推定部
6c ベクトル集計部
6d 学習処理部
6e 推定処理部
6f 回帰モデル
1 economic
Claims (16)
外部より収集されたニュース群から抽出された経済事象の内容を、予め定められた複数の項目で構造化した経済事象ダイジェストを生成するダイジェスト生成部と、
前記経済事象ダイジェストを格納する経済事象データベースと、
前記経済事象データベースに格納された前記経済事象ダイジェストの群を集計対象として、所定の集計時間単位毎に、前記経済事象ダイジェストを内容的な共通性を有する経済事象パターン別に分類し、それぞれの経済事象パターンの出現頻度を集計する頻度集計部と、
前記集計時間単位毎の経済事象パターンのそれぞれに対して、共通の空間に写像させた非負の実数値よりなる経済事象頻度ベクトルが、前記集計時間単位毎の経済事象パターンのそれぞれの出現頻度を再現するように推定するベクトル推定部と、
前記経済指標値の時間分解能に相当する第1の時間単位毎に、前記第1の時間単位に属する経済事象頻度ベクトルを集計して、前記第1の時間単位内における各経済事象パターンの出現度合いを表す第1の経済事象集計ベクトルを生成するベクトル集計部と、
前記第1の経済事象集計ベクトルの入力に対して、これと時間的に対応する経済指標値が応答するように、前記経済指標を推定するための回帰モデルの学習を行う学習処理部と
を有することを特徴とする経済指標推定システム。 An economic indicator estimation system for estimating an economic indicator with a desired time resolution based on a discrete time series of economic indicator values representing a specific economic indicator and economic events that affect the economic indicator values,
a digest generation unit that generates an economic event digest in which the content of the economic event extracted from the news group collected from the outside is structured with a plurality of predetermined items;
an economic event database that stores the economic event digest;
The group of economic event digests stored in the economic event database is subject to aggregation, and the economic event digests are classified into economic event patterns having content commonality for each predetermined aggregation time unit, and each economic event is classified into a frequency counting unit that counts the frequency of occurrence of patterns;
For each of the economic event patterns for each aggregated time unit, an economic event frequency vector composed of non-negative real values mapped to a common space reproduces the appearance frequency of each of the economic event patterns for each aggregated time unit. a vector estimator that estimates such that
For each first time unit corresponding to the time resolution of the economic index value, an economic event frequency vector belonging to the first time unit is aggregated, and the degree of occurrence of each economic event pattern within the first time unit. a vector aggregation unit that generates a first economic event aggregation vector representing
a learning processing unit that learns a regression model for estimating the economic index so that the economic index value temporally corresponding to the input of the first economic event aggregate vector responds to the input An economic index estimation system characterized by:
前記ベクトル集計部は、前記経済指標値とは時間分解能が異なる第2の時間単位に属する経済事象頻度ベクトルを集計して、前記第2の時間単位内における各経済事象パターンの出現度合いを表す前記第2の経済事象集計ベクトルを生成することを特徴とする請求項1に記載された経済指標推定システム。 further comprising an estimation processing unit that outputs a response of the learned regression model to the input of the second aggregate vector of economic events as an estimated value of an economic indicator temporally corresponding to the second aggregate vector of economic events;
The vector aggregation unit aggregates economic event frequency vectors belonging to a second time unit having a time resolution different from that of the economic index value, and expresses the degree of occurrence of each economic event pattern within the second time unit. 2. The economic indicator estimation system according to claim 1, wherein the second economic event aggregation vector is generated.
外部より収集されたニュース群から抽出された経済事象の内容を、予め定められた複数の項目で構造化した経済事象ダイジェストを生成する第1のステップと、
前記経済事象ダイジェストを経済事象データベースに格納する第2のステップと、
前記経済事象データベースに格納された前記経済事象ダイジェストの群を集計対象として、所定の集計時間単位毎に、前記経済事象ダイジェストを内容的な共通性を有する経済事象パターン別に分類し、それぞれの経済事象パターンの出現頻度を集計する第3のステップと、
前記集計時間単位毎の経済事象パターンのそれぞれに対して、共通の空間に写像させた非負の実数値よりなる経済事象頻度ベクトルが、前記集計時間単位毎の経済事象パターンのそれぞれの出現頻度を再現するように推定する第4のステップと、
前記経済指標値の時間分解能に相当する第1の時間単位毎に、前記第1の時間単位に属する経済事象頻度ベクトルを集計して、前記第1の時間単位内における各経済事象パターンの出現度合いを表す第1の経済事象集計ベクトルを生成する第5のステップと、
前記第1の経済事象集計ベクトルの入力に対して、これと時間的に対応する経済指標値が応答するように、前記経済指標を推定するための回帰モデルの学習を行う第6のステップと
を有する処理をコンピュータに実行させることを特徴とする経済指標推定プログラム。 In an economic indicator estimation program for estimating an economic indicator with a desired time resolution based on a discrete time series of economic indicator values representing a specific economic indicator and economic events that affect the economic indicator values,
a first step of generating an economic event digest in which the content of the economic event extracted from the news group collected from the outside is structured with a plurality of predetermined items;
a second step of storing the economic event digest in an economic event database;
The group of economic event digests stored in the economic event database is subject to aggregation, and the economic event digests are classified into economic event patterns having content commonality for each predetermined aggregation time unit, and each economic event is classified into a third step of aggregating the frequency of occurrence of patterns;
For each of the economic event patterns for each aggregated time unit, an economic event frequency vector composed of non-negative real values mapped to a common space reproduces the appearance frequency of each of the economic event patterns for each aggregated time unit. a fourth step of estimating that
For each first time unit corresponding to the time resolution of the economic index value, an economic event frequency vector belonging to the first time unit is aggregated, and the degree of occurrence of each economic event pattern within the first time unit. a fifth step of generating a first economic event aggregation vector representing
a sixth step of learning a regression model for estimating the economic index so that the economic index value temporally corresponding to the input of the first economic event aggregation vector responds; An economic indicator estimation program characterized by causing a computer to execute a process comprising:
前記経済指標値とは時間分解能が異なる第2の時間単位に属する経済事象頻度ベクトルを集計して、前記第2の時間単位内における各経済事象パターンの出現度合いを表す前記第2の経済事象集計ベクトルを生成する第8のステップと
を有することを特徴とする請求項9に記載された経済指標推定プログラム。 a seventh step of outputting a response of the learned regression model to the input of the second aggregate vector of economic events as an estimated value of an economic indicator temporally corresponding to the second aggregate vector of economic events;
aggregating economic event frequency vectors belonging to a second time unit having a time resolution different from that of the economic index value, and a second economic event aggregation representing the degree of occurrence of each economic event pattern within the second time unit; 10. The economic indicator estimation program according to claim 9, further comprising an eighth step of generating vectors.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020097567A JP7235329B2 (en) | 2020-06-04 | 2020-06-04 | Economic indicator estimation system and its program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020097567A JP7235329B2 (en) | 2020-06-04 | 2020-06-04 | Economic indicator estimation system and its program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021189995A JP2021189995A (en) | 2021-12-13 |
JP7235329B2 true JP7235329B2 (en) | 2023-03-08 |
Family
ID=78849643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020097567A Active JP7235329B2 (en) | 2020-06-04 | 2020-06-04 | Economic indicator estimation system and its program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7235329B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123795A (en) | 2009-12-14 | 2011-06-23 | Nomura Research Institute Ltd | Stock price affecting company detection system and program |
WO2016063341A1 (en) | 2014-10-21 | 2016-04-28 | 株式会社日立製作所 | Time series prediction apparatus and time series prediction method |
JP2020024689A (en) | 2018-07-26 | 2020-02-13 | 株式会社xenodata lab. | Causal relationship extraction system and causal relationship extraction program |
-
2020
- 2020-06-04 JP JP2020097567A patent/JP7235329B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123795A (en) | 2009-12-14 | 2011-06-23 | Nomura Research Institute Ltd | Stock price affecting company detection system and program |
WO2016063341A1 (en) | 2014-10-21 | 2016-04-28 | 株式会社日立製作所 | Time series prediction apparatus and time series prediction method |
JP2020024689A (en) | 2018-07-26 | 2020-02-13 | 株式会社xenodata lab. | Causal relationship extraction system and causal relationship extraction program |
Non-Patent Citations (1)
Title |
---|
和泉 潔,経済因果チェーン検索のシステム紹介と応用,第33回人工知能学会全国大会論文集 [ONLINE],2019年07月01日,4Rin1-28 |
Also Published As
Publication number | Publication date |
---|---|
JP2021189995A (en) | 2021-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Bitcoin price prediction using machine learning: An approach to sample dimension engineering | |
Mohan et al. | Stock price prediction using news sentiment analysis | |
CN108256052B (en) | Tri-tracking-based potential customer identification method for automobile industry | |
Tseng et al. | Price prediction of e-commerce products through Internet sentiment analysis | |
Han et al. | Forecasting dry bulk freight index with improved SVM | |
CN113642826B (en) | Provider default risk prediction method | |
CN109636482B (en) | Data processing method and system based on similarity model | |
Liu et al. | Stock prices prediction using deep learning models | |
Zhou et al. | Corporate communication network and stock price movements: insights from data mining | |
Moedjahedy et al. | Stock price forecasting on telecommunication sector companies in Indonesia Stock Exchange using machine learning algorithms | |
CN115080868A (en) | Product pushing method, product pushing device, computer equipment, storage medium and program product | |
CN111626331B (en) | Automatic industry classification device and working method thereof | |
She et al. | Research on advertising click-through rate prediction based on CNN-FM hybrid model | |
JP7235329B2 (en) | Economic indicator estimation system and its program | |
CN114511345B (en) | Sales prediction method based on policy-public opinion-purchase two-stage deep learning | |
CN116523301A (en) | System for predicting risk rating based on big data of electronic commerce | |
JP7246736B2 (en) | Index estimation system and its program | |
CN115147091A (en) | Intelligent salary query method and system | |
Amir et al. | Sales Forecasting Using Convolution Neural Network | |
CN113269610A (en) | Bank product recommendation method and device and storage medium | |
Wang et al. | Modeling price and risk in Chinese financial derivative market with deep neural network architectures | |
Kanthimathi et al. | Stock Market Prediction Using AI | |
Nguyen¹ et al. | Check for updates | |
CN117195061B (en) | Event response prediction model processing method and device and computer equipment | |
Chen | The Application Value of Big Data Analysis Technology in Financial Forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221125 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20221125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7235329 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |