JP6849084B2 - Information analyzer, information analysis method and information analysis program - Google Patents
Information analyzer, information analysis method and information analysis program Download PDFInfo
- Publication number
- JP6849084B2 JP6849084B2 JP2019541555A JP2019541555A JP6849084B2 JP 6849084 B2 JP6849084 B2 JP 6849084B2 JP 2019541555 A JP2019541555 A JP 2019541555A JP 2019541555 A JP2019541555 A JP 2019541555A JP 6849084 B2 JP6849084 B2 JP 6849084B2
- Authority
- JP
- Japan
- Prior art keywords
- learning model
- group
- prediction target
- partial
- estimation error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、複数の予測対象をグループ化して情報を分析する情報分析装置、情報分析方法および情報分析プログラムに関する。 The present invention relates to an information analyzer, an information analysis method, and an information analysis program for grouping a plurality of prediction targets and analyzing information.
全体としての予測結果を得ようとする場合、個々の対象ごとに予測モデルを作成する代わりに、複数の対象をグループ化し、そのグループ毎に予測を行う場合がある。 When trying to obtain a prediction result as a whole, instead of creating a prediction model for each individual target, a plurality of targets may be grouped and prediction may be performed for each group.
例えば、特許文献1には、電力系統に接続された多数の需要家からなるエネルギーコミュニティに係る電力需要調整システムが記載されている。具体的には、特許文献1には、需要数が増加するほど、すなわち需要家グループの規模が大きくなるほど、その需要家グループの需要予測精度が高くなり、分散が小さくなることが記載されている。また、特許文献1には、需要家グループの規模とその需要家グループの需要電力の総量とがほぼ比例し、このような状況において、需要家グループの規模が或る値になるときに予測と実績との差が最小になり、それより需要家数が増加および減少すると、その差が増加することが記載されている。特許文献1に記載された電力需要調整システムは、このような需要家グループの規模と予測と実績との関係を利用して、需要家グループの規模を決定し、その需要家グループの電力需要を予測する。
For example,
しかし、特許文献1に記載された電力需要調整システムは、個々の需要家が互いに異なる性質を有していることを考慮していない。具体的には、特許文献1に記載された電力需要調整システムは、「需要家グループの規模」と「推定精度・分散・需要電力総量・予測と実績との差」との間に、上述する関係が成立することを前提とする。しかし、個々の需要家が互いに異なる性質を有している場合、グループ化する需要家に応じて、上述する関係は変化する。
However, the electric power demand adjustment system described in
すなわち、特許文献1に記載された電力需要調整システムは、予測精度の観点からどの需要家同士を同じグループにするのか考慮されていないため、グループ化することによって必ずしも予測精度を向上できるとは言い難い。
That is, since the electric power demand adjustment system described in
そこで、本発明は、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる情報分析装置、情報分析方法および情報分析プログラムを提供することを目的とする。 Therefore, in the present invention, even when a plurality of prediction targets have different properties from each other, a desired prediction target is expressed by the sum of the plurality of prediction targets. It is an object of the present invention to provide an information analyzer, an information analysis method, and an information analysis program capable of realizing a grouping of prediction targets so as to improve the prediction accuracy of the above.
本発明による情報分析装置は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部とを備えたことを特徴とする。 The information analyzer according to the present invention has a unit model generation unit that generates a learning model for each partial prediction target when the prediction target is represented by the sum of a plurality of partial prediction targets, and a partial prediction target using the learning model. The time axis of the estimation error calculation unit that calculates the estimation error when estimating the value of is along the time axis, and the estimation error of one learning model and the estimation error of another learning model by inputting the estimation error. Based on the similarity in the above, the set generation part that generates a set of groups by grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into a group, and the group include It is equipped with a partial sum model generation unit that generates a learning model with the sum of the partial prediction targets as the objective variable, and a prediction target calculation unit that calculates the value of the prediction target from the prediction values of the group calculated using the learning model. It is characterized by that.
本発明による情報分析システムは、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部とを備えたことを特徴とする。 The information analysis system according to the present invention has a unit model generation unit that generates a learning model for each partial prediction target when the prediction target is represented by the sum of a plurality of partial prediction targets, and a partial prediction target using the learning model. The time axis of the estimation error calculation unit that calculates the estimation error when estimating the value of is along the time axis, and the estimation error of one learning model and the estimation error of another learning model by inputting the estimation error. Based on the similarity in the above, by grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into a group, the composition of the group set is different from that of the first group. For each of the set generator that generates the set and the set of the second group, and the set of the first group and the set of the second group, the sum of the partial prediction targets included in the group is used as the objective variable. For each of the partial sum model generator that generates the training model to be used, the set of the first group, and the set of the second group, the value to be predicted is calculated from the predicted value of the group calculated using the learning model. Evaluation that evaluates the set of groups based on the difference between the value of the prediction target and the actual value of the prediction target for each of the calculation unit of the prediction target to be calculated and the set of the first group and the set of the second group. It is characterized by having a part.
本発明による情報分析方法は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成し、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出することを特徴とする。 In the information analysis method according to the present invention, when the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each partial prediction target, and the value of the partial prediction target is estimated using the learning model. The case estimation error is calculated along the time axis, and the estimation error is used as an input, based on the similarity between the estimation error for one learning model and the estimation error for the other learning model on the time axis. A learning model in which the sum of the partial prediction targets included in the group is used as the objective variable is generated by grouping the partial prediction targets corresponding to the learning model and the partial prediction targets corresponding to other learning models into a group. It is characterized in that the value of the prediction target is calculated from the prediction value of the group generated and calculated using the learning model.
本発明による他の情報分析方法は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成し、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出し、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価することを特徴とする。 In another information analysis method according to the present invention, when the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each partial prediction target, and the value of the partial prediction target is calculated using the learning model. The estimation error when estimated is calculated along the time axis, and the estimation error is used as an input, based on the similarity between the estimation error for one learning model and the estimation error for the other learning model on the time axis. By grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into a group, the composition of the group set is different from that of the first group set and the second group set. And are generated respectively, and for each of the set of the first group and the set of the second group, a learning model in which the sum of the partial prediction targets included in the group is the objective variable is generated, and the first group For each of the set and the set of the second group, the value to be predicted is calculated from the predicted value of the group calculated using the learning model, and the set of the first group and the set of the second group are each calculated. On the other hand, it is characterized in that the set of groups is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target.
本発明による情報分析プログラムは、コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成処理、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出処理を実行させることを特徴とする。 The information analysis program according to the present invention uses a unit model generation process and a learning model to generate a learning model for each partial prediction target when the prediction target is represented by the sum of a plurality of partial prediction targets on a computer. Estimate error calculation processing that calculates the estimation error when estimating the value of the prediction target along the time axis, the time between the estimation error for one learning model and the estimation error for the other learning model with the estimation error as input A set generation process that generates a set of groups by grouping a partial prediction target corresponding to one learning model and a partial prediction target corresponding to another learning model based on the similarity on the axis, and is included in the group. Executes the partial sum model generation process that generates a learning model with the sum of the partial prediction targets as the objective variable, and the prediction target calculation process that calculates the value of the prediction target from the prediction values of the group calculated using the learning model. It is characterized by letting it.
本発明による他の情報分析プログラムは、コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成処理、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出処理、および、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価処理を実行させることを特徴とする。 Another information analysis program according to the present invention uses a unit model generation process and a learning model that generate a learning model for each partial prediction target when the prediction target is represented by the sum of a plurality of partial prediction targets on a computer. Estimate error calculation processing that calculates the estimation error when the value of the partial prediction target is estimated along the time axis, and the estimation error for one learning model and the estimation error for the other learning model by inputting the estimation error By grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into a group based on the similarity on the time axis of, the composition of the set of the groups is different from each other. The purpose is the sum of the partial prediction targets included in the group for each of the set of the first group and the set of the second group, which is the set generation process for generating the set of the first group and the set of the second group, respectively. For each of the partial sum model generation process that generates the training model as a variable, the set of the first group and the set of the second group, the value to be predicted from the predicted value of the group calculated using the training model. For each of the prediction target calculation process for calculating and the first group set and the second group set, the group set is evaluated based on the difference between the prediction target value and the prediction target actual value. It is characterized in that the evaluation process is executed.
本発明によれば、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できるという技術的効果を奏する。 According to the present invention, even when a plurality of prediction targets have different properties from each other, a desired prediction target is expressed by the sum of the plurality of prediction targets. It has the technical effect of being able to realize grouping of prediction targets that improves the prediction accuracy of.
以下、本発明の実施形態を図面を参照して説明する。図1は、本発明による情報分析装置の一実施形態を示すブロック図である。なお、本実施形態の情報分析装置の構成については後述される。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of an information analyzer according to the present invention. The configuration of the information analyzer of this embodiment will be described later.
本発明では、ある時間における予測対象Yの値(予測結果)が、同じ時間における複数の予測対象y1,y2,…,ynの足し合わせにより構成されるものとする。すなわち、ある時刻における予測対象が、同じ時刻における複数の部分予測対象の和により表現される。具体的には、Y=y1+y2+…+ynである。In the present invention, it is assumed that the value of the prediction target Y (prediction result) at a certain time is composed of the sum of a plurality of prediction targets y 1 , y 2 , ..., Y n at the same time. That is, the prediction target at a certain time is represented by the sum of a plurality of partial prediction targets at the same time. Specifically, Y = y 1 + y 2 + ... + y n .
なお、複数の予測対象y1,y2,…,ynの足し合わせにより所望の予測対象Yが構成されることから、以下の説明では、個々の予測対象y1,y2,…,ynのことを、部分予測対象と記す。したがって、ある時間における予測対象Yの値は、同じ時間における部分予測対象y1,y2,…,ynの総和で算出される。例えば、予測対象Yが、工場が製造する商品の需要総数(受注総数)とした場合、部分予測対象ynは、個々の店舗の商品需要数(受注数)である。Since the desired prediction target Y is formed by adding a plurality of prediction targets y 1 , y 2 , ..., Y n , in the following description, the individual prediction targets y 1 , y 2 , ..., Y n is referred to as a partial prediction target. Therefore, the value of the prediction target Y at a certain time is calculated by the sum of the partial prediction targets y 1 , y 2 , ..., Y n at the same time. For example, when the forecast target Y is the total demand for products manufactured by the factory (total number of orders), the partial forecast target y n is the number of product demands (number of orders) for each store.
また、本発明では、部分予測対象を複数のグループ(Y1,Y2,…,YN)に纏め、グループごとに予測モデルの学習、予測対象の予測値や実績値の算出を行う。Further, in the present invention, the partial prediction targets are grouped into a plurality of groups (Y 1 , Y 2 , ..., Y N ), the prediction model is learned for each group, and the prediction value and the actual value of the prediction target are calculated.
以下、具体例を用いて、予測対象と部分予測対象との関係を説明する。以下、ある商品を製造して各店舗に納品する工場があると想定し、この工場の生産管理部門の立場に立って、過去の実績データに基づいて未来の商品需要(受注数)を予測するとする。 Hereinafter, the relationship between the prediction target and the partial prediction target will be described with reference to a specific example. Below, assuming that there is a factory that manufactures a certain product and delivers it to each store, from the standpoint of the production control department of this factory, predicting future product demand (number of orders) based on past actual data. To do.
図2は、部分予測対象の候補の例を示す説明図である。図2に示す例では、自工場が図2に例示する200店舗(店舗コード:C−001〜C−200)へ商品を納品することを示す。また、図3は、実績データとして、日ごと及び店舗ごとの商品の売上数の例を示す説明図である。また、図3に例示する表には、前日の最高気温および最低気温が含まれる。以下の説明では、図3に例示するような実際に取得された過去データ(実績データ)のことを、評価用データと記すこともある。 FIG. 2 is an explanatory diagram showing an example of candidates for partial prediction. In the example shown in FIG. 2, it is shown that the own factory delivers the product to the 200 stores (store code: C-001 to C-200) illustrated in FIG. Further, FIG. 3 is an explanatory diagram showing an example of the number of sales of products for each day and each store as actual data. In addition, the table illustrated in FIG. 3 includes the maximum temperature and the minimum temperature of the previous day. In the following description, the past data (actual data) actually acquired as illustrated in FIG. 3 may be referred to as evaluation data.
このような情報が存在する場合に翌日の商品の受注数を予測する状況を想定する。例えば、一般的な方法の場合、各日の各店舗の売上数の総数を目的変数に設定し、図3に例示する表に含まれるような最高気温、最低気温などを説明変数に設定して予測モデルを学習することが考えられる。 If such information exists, it is assumed that the number of orders for products on the next day is predicted. For example, in the general method, the total number of sales of each store on each day is set as the objective variable, and the maximum temperature, the minimum temperature, etc. as included in the table illustrated in FIG. 3 are set as the explanatory variables. It is conceivable to learn a predictive model.
しかし、例えば200店舗の中に、他と著しく異なる性質を有する店舗(例えば、売上規模、発注の増減が大きい店舗など)が含まれている場合も存在する。このような異なる性質を有する店舗を一まとめにして学習を行っても、高い予測精度が得られない可能性が高い。そこで、このような複数の店舗を、同様の性質を有する店舗ごとに分類して予測を行うことが考えられる。 However, for example, there are cases where the 200 stores include stores having significantly different properties from the others (for example, stores with a large increase / decrease in sales scale and orders). There is a high possibility that high prediction accuracy cannot be obtained even if learning is performed by grouping stores having such different properties. Therefore, it is conceivable to classify such a plurality of stores into stores having similar properties and make a prediction.
しかし、対象とする商品の売上が、必ずしも図2に例示するような各店舗の所在地や売場面積、昨年売上高だけで分類できるとは限らない。例えば、同じ所在地の店舗であっても、ビルの中の店舗と路面店とでは売上の傾向が異なると考えられるし、同程度の売り場面積を有する店舗であっても、近隣の環境に応じて商品の需要傾向が異なることも考えられる。 However, the sales of the target products cannot always be classified only by the location and sales floor area of each store and the sales last year as illustrated in FIG. For example, even if the stores are located at the same location, the sales tendency may differ between the stores in the building and the roadside stores, and even if the stores have the same sales floor area, depending on the neighboring environment. It is possible that the demand trends for products are different.
そこで、以下の実施形態では、推定誤差の傾向が類似する店舗(部分予測対象)をグループ化して予測を行うことで、所望の予測対象の実績値に対する予測値の推定誤差を小さくする方法を説明する。以下、上述する具体例を適宜使用しながら、本発明の情報分析装置を説明する。 Therefore, in the following embodiment, a method of reducing the estimation error of the predicted value with respect to the actual value of the desired prediction target by grouping stores (partial prediction targets) having similar estimation error tendencies will be described. To do. Hereinafter, the information analyzer of the present invention will be described while appropriately using the above-mentioned specific examples.
図1に例示する情報分析装置100は、受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24と、記憶部30とを備えている。
The
記憶部30は、部分予測対象に関する情報を記憶する。記憶部30は、例えば、図2に例示する店舗のような、部分予測対象を記憶していてもよい。他にも、記憶部30は、図3に例示するような、部分予測対象に関する実績データを記憶していてもよい。
The
実績データは、後述する単位モデル生成部12および部分和モデル生成部16が学習モデルを生成する際のデータとして用いられる。他にも、実績データは、後述する評価部20が予測モデルを評価する際のデータとして用いられる。例えば、実績データのうち、一定の割合のデータを学習用データとして用い、残りのデータを評価用データとして用いてもよい。
The actual data is used as data when the unit
ただし、記憶部30が記憶するデータは、これらのデータに限定されない。記憶部30は、例えば、後述する単位モデル生成部12および部分和モデル生成部16が生成した学習モデルを記憶してもよい。記憶部30は、例えば、磁気ディスク装置により実現される。
However, the data stored by the
受付部10は、所望の予測対象の指定を受け付ける。また、受付部10は、所望の予測対象を構成する複数の部分予測対象の指定を受け付けてもよい。
The
単位モデル生成部12は、部分予測対象単位に学習モデルを生成する。具体的には、単位モデル生成部12は、部分予測対象y1,y2,…,ynのそれぞれについて学習モデルを生成する。The unit
例えば、図2に例示する各店舗が部分予測対象である場合、単位モデル生成部12は、店舗ごとに学習モデルを生成する。予測対象に影響する要因の類似性を判断できるように、単位モデル生成部12は、説明変数の重みで予測対象を予測可能な学習モデル(例えば、線形重回帰モデル)を生成してもよい。ただし、単位モデル生成部12が生成する学習モデルは線形重回帰モデルに限られない。単位モデル生成部12は、任意の方法で学習モデルを生成すればよい。
For example, when each store illustrated in FIG. 2 is a partial prediction target, the unit
図4は、単位モデル生成部12が部分予測対象単位で生成した学習モデルの例を示す説明図である。図4に示す例では、店舗コード「C−001」で特定される店舗の商品の売上予測y001が、前日の最高気温(説明変数x1)、一週間前の売上(説明変数x2)、および、売り場面積(説明変数x3)と正の相関があることを示す。一方、図4に示す例では、店舗コード「C−200」で特定される店舗の商品の売上予測y200が、一週間前の売上(説明変数x2)、および、売り場面積(説明変数x3)と正の相関がある一方、週末(説明変数x4)と負の相関があることを示す。FIG. 4 is an explanatory diagram showing an example of a learning model generated by the unit
推定誤差算出部13は、学習モデルを用いて、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。具体的には、推定誤差算出部13は、単位モデル生成部12によって生成された学習モデルを用いて、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。
The estimation
なお、推定誤差算出部13は、後述する部分和モデル生成部16によって生成された学習モデルを用いて、同様に、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。部分和モデル生成部16によって生成された学習モデルを用いる処理については後述される。
The estimation
図5は、推定誤差を算出する処理の例を示す説明図である。例えば、図3に例示する2017年の6月の実績データが評価用データとして用いられ、対応する学習モデルが図4に例示する予測式で表されているとする。 FIG. 5 is an explanatory diagram showing an example of processing for calculating the estimation error. For example, it is assumed that the actual data of June 2017 illustrated in FIG. 3 is used as the evaluation data, and the corresponding learning model is represented by the prediction formula illustrated in FIG.
まず、推定誤差算出部13は、部分予測対象である店舗コード「C−001」で特定される店舗の売上の推定値を、図4に例示する予測式(y001=0.1x1+0.18x2+0.06x3+1.6)を用いて算出する。例えば、2017年6月2日の売上の推定値を算出するとする場合、店舗の売り場面積は120m2であり、前日の最高気温は26度である。また、一週間前の売上数が20であったとすると、売上の推定値はy^001=0.1×26+0.18×10+0.06×120+1.6=13.2と算出される。 First, the estimation error calculation unit 13 uses a prediction formula (y 001 = 0.1 x 1 + 0.) Illustrating the estimated value of the sales of the store specified by the store code "C-001" which is the partial prediction target. It is calculated using 18 x 2 + 0.06 x 3 + 1.6). For example, when calculating the estimated value of sales on June 2, 2017, the sales floor area of the store is 120 m 2 , and the maximum temperature on the previous day is 26 degrees. Further, assuming that the number of sales one week ago was 20, the estimated value of sales is calculated as y ^ 001 = 0.1 × 26 + 0.18 × 10 + 0.06 × 120 + 1.6 = 13.2.
そして、推定誤差算出部13は、2017年6月2日の売上の実績値である15と、推定値である13.2の誤差(推定誤差)を、15−13.2=1.8と算出する。推定誤差算出部13は、以下の日付についても同様に推定誤差を算出することで、時間軸に沿った(時系列の)推定誤差を算出する。また、推定誤差算出部13は、他の部分予測対象(店舗)についても、同様に時間軸に沿った推定誤差を算出する。
Then, the estimation
図6は、時間軸に沿って算出した推定誤差の例を示す説明図である。図6に示す例は、図3に例示するデータを用いて、店舗ごと及び日ごとに推定誤差を算出した結果を示す。また、図7は、時間軸に沿って算出した推定誤差をグラフ化した例を示す説明図である。図7に示す例は、図6に例示する時間軸に沿った推定誤差を、店舗ごとに折れ線グラフで表している。 FIG. 6 is an explanatory diagram showing an example of an estimation error calculated along the time axis. The example shown in FIG. 6 shows the result of calculating the estimation error for each store and each day using the data illustrated in FIG. Further, FIG. 7 is an explanatory diagram showing an example in which the estimation error calculated along the time axis is graphed. In the example shown in FIG. 7, the estimation error along the time axis illustrated in FIG. 6 is represented by a line graph for each store.
なお、売上規模の差異に応じ、推定誤差算出部13は、各部分予測対象の推定誤差を標準化してもよい。具体的には、推定誤差算出部13は、各部分予測対象の推定誤差の平均および分散に基づいて推定誤差を標準化してもよい。このような標準化を行うことで、時間軸に沿った推定誤差の傾向を、同じ尺度で判断できる。
The estimation
集合生成部14は、部分予測対象を複数のグループに纏めることにより、グループの集合を生成する。なお、集合生成部14は、後述する制御部24の制御に応じてグループの集合を生成する。
The
まず、集合生成部14は、推定誤差算出部13が算出した推定誤差を入力する。そして、集合生成部14は、入力された一の学習モデルについての推定誤差と、他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。
First, the
なお、集合生成部14は、後述する部分和モデル生成部16によって生成された学習モデルによる推定誤差の時間軸上における類似性に基づいて、同様に、グループの集合を生成する。なお、部分和モデル生成部16によって生成された学習モデルによる推定誤差を用いる処理については後述される。
The
集合生成部14が、推定誤差の時間軸上における類似性を判断する方法は任意である。集合生成部14は、例えば、時間軸方向の各区間の推定誤差の変化をベクトル(推定誤差ベクトル)で表し、比較する他の学習モデルによる推定誤差ベクトルとの内積の各区間における総和が、より大きいほど類似性が高いと判断してもよい。また、集合生成部14は、図7に例示するグラフの形状が類似しているほど、時間軸上における推定誤差がより類似すると判断してもよい。
The method by which the
また、集合生成部14が纏めるグループの数も任意である。図8は、部分予測対象をグループ化する処理の例を示す説明図である。集合生成部14は、推定誤差の類似性が高い学習モデルに対応する部分予測対象を順次グループ化し、グループ化された部分予測対象を除外しながらグループ化を繰り返してもよい。具体的には、集合生成部14は、図8(a)に例示するように、推定誤差の類似性が高い部分予測対象をグループ化したグループG1を生成し、その後、グループG1に含まれる部分予測対象を除いて、次に推定誤差の類似性が高い部分予測対象をグループ化したグループG2を生成してもよい。例えば、推定誤差の類似する学習モデルのペアをそれぞれ抽出してグループを生成する場合、図2に例示する200の部分予測対象から、100のグループの集合が生成される。
Further, the number of groups collected by the
また。集合生成部14は、推定誤差の類似性が高い学習モデルに対応する部分予測対象を順次グループ化し、グループ化された部分予測対象を除外せずにグループ化を繰り返してもよい。具体的には、集合生成部14は、図8(b)に例示するように、推定誤差の類似性が高い部分予測対象をグループ化したグループG1を生成し、その後、グループG1に含まれる部分予測対象も含めて、次に推定誤差の類似性が高い部分予測対象をグループ化したグループG3を生成してもよい。
Also. The
また、集合生成部14は、すでに生成されたグループの集合とは異なる構成のグループの集合を、別途生成してもよい。具体的には、集合生成部14は、グループの集合を構成するグループの数が、すでに生成されたグループの集合を構成するグループの数と変わるようにグループの集合を生成してもよい。例えば、図2に例示する200の部分予測対象が存在する場合、集合生成部14は、2つの部分予測対象を纏めた100のグループの集合を生成し、さらに、4つの部分予測対象を纏めた50のグループの集合を生成してもよい。
Further, the
なお、集合生成部14が生成する各グループに含まれる部分予測対象の数は、同数であってもよく、異なっていてもよい。
The number of partial prediction targets included in each group generated by the
図9は、グループの集合を生成する処理の例を示す説明図である。図7に例示する推定誤差が算出されている場合、例えば、店舗コード「C−001」で特定される店舗の推定誤差の傾向と、店舗コード「C−003」で特定される店舗の推定誤差の傾向とは、その推定誤差の傾向(変化度合)が類似すると言える。そこで、集合生成部14は、店舗コード「C−001」で特定される店舗と、店舗コード「C−003」で特定される店舗とをまとめて1つのグループを生成する。集合生成部14は、このグループ化を他の店舗についても繰り返し行う。
FIG. 9 is an explanatory diagram showing an example of a process of generating a set of groups. When the estimation error illustrated in FIG. 7 is calculated, for example, the tendency of the estimation error of the store specified by the store code "C-001" and the estimation error of the store specified by the store code "C-003". It can be said that the tendency of the estimation error (degree of change) is similar to the tendency of. Therefore, the
部分和モデル生成部16は、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。すなわち、部分和モデル生成部16は、グループ化された複数の部分予測対象のグループ(Y1,Y2,…,YN)ごとに学習モデルを生成する。なお、部分和モデル生成部16が学習モデルを生成する方法は、集合生成部14が学習モデルを生成する方法と同様である。The partial sum
例えば、図9に例示するように、店舗コード「C−001」で特定される店舗と、店舗コード「C−003」で特定される店舗とをまとめて1つのグループを生成したとする。この場合、部分和モデル生成部16は、この2つの店舗の商品の売上の和を目的変数とする学習モデルを生成する。
For example, as illustrated in FIG. 9, it is assumed that the store specified by the store code "C-001" and the store specified by the store code "C-003" are collectively generated into one group. In this case, the partial sum
予測対象算出部18は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。具体的には、予測対象算出部18は、単位モデル生成部12によって生成された学習モデルを用いて算出されるグループの予測値を合計して予測対象の値を算出する。さらに、予測対象算出部18は、部分和モデル生成部16によって生成された学習モデルを用いて算出されるグループの予測値を合計して予測対象の値を算出する。
The prediction
評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいて、グループの集合を評価する。予測対象の実績値は、例えば、予め記憶部30に記憶されている。評価部20は、例えば、グループの集合の良さを評価するための評価関数を用いてもよい。
The
具体的には、評価部20は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。予測値と実測値の誤差が小さいほど、適切なグループ化ができていると言えるからである。この場合の評価関数は、例えば、以下に例示する式1で設計されていてもよい。評価関数Wは、値が小さいほど、よりよい評価を示す。式1に例示する予測対象Yの誤差とは、部分予測対象の和である全体の誤差である。
Specifically, the
評価関数W=β・(予測対象Yの誤差) (式1) Evaluation function W = β · (Error of prediction target Y) (Equation 1)
また、評価部20は、上述する評価に加え、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。グループの数が少ないほど、生成されるモデルの数も少なくなるため、人間の解釈性を高めることができるからである。この場合の評価関数は、例えば、以下に例示する式2で設計されていてもよい。
Further, in addition to the above-mentioned evaluation, the
評価関数W=α・モデル数+β・(予測対象Yの誤差) (式2) Evaluation function W = α · Number of models + β · (Error of prediction target Y) (Equation 2)
また、評価部20は、グループの集合を構成するグループの数の評価に代えて、各グループに対応する各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。非ゼロ係数を有する説明変数の個数が少ないほど、人間の解釈性を高めることができるからである。
Further, instead of evaluating the number of groups constituting the set of groups, the
さらに、非ゼロ係数を有する説明変数の個数が少ないほど、モデルの複雑性を回避できる。モデルが複雑になるほど、そのモデルにうまく当てはまる評価データが見つかりやすいため、適切な評価ができないおそれがある。一方、モデルを単純化できるほど、上述するおそれを避けられるため、モデル評価時には精度が良いにもかかわらず、運用中に精度が悪くなるといった現象が起こることを抑制できる。この場合の評価関数は、例えば、以下に例示する式3で設計されていてもよい。
Moreover, the smaller the number of explanatory variables with nonzero coefficients, the less complex the model can be. The more complex the model, the easier it is to find evaluation data that fits the model well, which may lead to inadequate evaluation. On the other hand, the more simplistic the model is, the more the above-mentioned fear can be avoided. Therefore, it is possible to suppress the phenomenon that the accuracy deteriorates during operation even though the accuracy is good at the time of model evaluation. The evaluation function in this case may be designed by, for example,
評価関数W=α・(Σ各モデルの非ゼロ係数の数)+β・(予測対象Yの誤差)(式3) Evaluation function W = α · (number of non-zero coefficients of each Σ model) + β · (error of prediction target Y) (Equation 3)
制御部24は、集合生成部14がグループの集合を生成する際の動作を制御する。具体的には、制御部24は、個々の部分予測対象を、予め定めた数のグループに纏めるように集合生成部14を制御する。図10は、グループの集合を生成する処理の例を示す説明図である。
The
例えば、図2に例示する200の部分予測対象が存在する場合、制御部24は、2つの部分予測対象を纏めた100のグループの集合を生成するよう、集合生成部14を制御してもよい(図10におけるステップS1)。
For example, when there are 200 partial prediction targets illustrated in FIG. 2, the
さらに、制御部24は、グループの集合を構成するグループの数が、すでに生成されたグループの集合を構成するグループの数と変わるように、集合生成部14を制御してもよい。このとき、制御部24は、個々の部分予測対象を対象としてグループ化するよう、集合生成部14を制御してもよいし、集合生成部14がすでに生成したグループをさらにグループに纏めることによりグループの集合を生成するよう制御してもよい。
Further, the
集合生成部14がすでに生成したグループをさらにグループに纏める方法を、より具体的に説明する。まず、制御部24は、部分和モデル生成部16が生成した学習モデルについての推定誤差が算出されるように推定誤差算出部13を制御する。この制御に応じ、推定誤差算出部13は、部分和モデル生成部16が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。
A method of further grouping the groups already generated by the
さらに、制御部24は、集合生成部14を制御する際に、部分和モデル生成部16により生成された学習モデルについての推定誤差を集合生成部14に入力する。この制御に応じ、集合生成部14は、部分和モデル生成部16により生成された学習モデルについての推定誤差を入力として、グループの集合を生成する。
Further, when the
例えば、集合生成部14が、すでに2つの部分予測対象を纏めた100のグループの集合を生成している場合、制御部24は、この100のグループをさらにグループに纏めることにより、例えば、50のグループの集合を生成するように制御してもよい(図10におけるステップS2)。また、制御部24は、初めの200の部分予測対象を対象として、4つの部分予測対象を纏めた50のグループの集合を生成するよう、集合生成部14を制御してもよい(図10におけるステップS3)。
For example, when the
このように、制御部24は、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部14を制御する。制御部24の制御により複数の構成のグループの集合が生成されると、部分和モデル生成部16は、それぞれのグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。そして、予測対象算出部18は、生成された学習モデルを用いて算出されるグループの予測値から予測対象の値を算出し、評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する。
In this way, the
出力部22は、評価部20の評価に応じてグループの集合を出力する。具体的には、出力部22は、より良い評価のグループの集合を出力する。このとき、出力部22は、グループの集合だけでなく、その集合を構成するグループごとに生成された学習モデルを出力してもよい。
The
受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24とは、プログラム(情報分析プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array ))によって実現される。
The
例えば、プログラムは、記憶部30に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、受付部10、単位モデル生成部12、推定誤差算出部13、集合生成部14、部分和モデル生成部16、予測対象算出部18、評価部20、出力部22および制御部24として動作してもよい。また、情報分析装置の機能がSaaS(Software as a Service )形式で提供されてもよい。
For example, the program is stored in the
受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
The
また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。 Further, when a part or all of each component of each device is realized by a plurality of information processing devices and circuits, the plurality of information processing devices and circuits may be centrally arranged or distributed. May be done. For example, the information processing device, the circuit, and the like may be realized as a form in which each is connected via a communication network, such as a client-and-server system and a cloud computing system.
次に、本実施形態の情報分析装置の動作を説明する。図11は、本実施形態の情報分析装置の動作例を示すフローチャートである。 Next, the operation of the information analyzer of the present embodiment will be described. FIG. 11 is a flowchart showing an operation example of the information analyzer of the present embodiment.
単位モデル生成部12は、部分予測対象単位に学習モデルを生成する(ステップS11)。予測対象算出部18は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する(ステップS12)。そして、評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいて、グループの集合を評価する(ステップS13)。ここでは、評価部20は、個々の部分予測対象について学習モデルを生成した場合について評価する。
The unit
制御部24は、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するか否か判断する(ステップS14)。グループの集合を生成すると判断した場合(ステップS14におけるYes)、制御部24は、推定誤差算出部13を制御することにより、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する(ステップS21)。そして、制御部24は、集合生成部14を制御することにより、部分予測対象を複数のグループに纏めてグループの集合を生成する(ステップS15)。具体的には、集合生成部14は、算出された推定誤差の時間軸上における類似性に基づいて部分予測対象をグループに纏めることにより、グループの集合を生成する。
The
部分和モデル生成部16は、生成されたグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する(ステップS16)。学習モデルが生成されると、予測対象算出部18が予測対象の値を算出し、評価部20がグループの集合を評価するステップS12およびステップS13の処理が繰り返される。
The partial sum
一方、ステップS14において、グループの集合を生成しないと判断した場合(ステップS14におけるNo)、出力部22は、最も評価の良いグループの集合を出力する(ステップS17)。
On the other hand, when it is determined in step S14 that the set of groups is not generated (No in step S14), the
以上のように、本実施形態では、単位モデル生成部12が、部分予測対象ごとに学習モデルを生成し、推定誤差算出部13が、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。また、集合生成部14が、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。そして、部分和モデル生成部16が、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、予測対象算出部18が、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。
As described above, in the present embodiment, the unit
よって、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。 Therefore, even if each of the plurality of prediction targets has different properties, when the desired prediction target is expressed by the sum of the plurality of prediction targets, the prediction accuracy of the desired prediction target can be determined. It is possible to realize a grouping of forecast targets that improves.
すなわち、本実施形態では、時間軸に対する推定誤差の傾向が類似する部分予測対象をグループ化して学習モデルが生成される。このように傾向の類似する部分予測対象をまとめることで、大数の法則により推定誤差が小さくなり、結果、予測精度をより向上させることが可能になる。 That is, in the present embodiment, a learning model is generated by grouping partial prediction targets having a similar tendency of estimation error with respect to the time axis. By grouping partial prediction targets with similar tendencies in this way, the estimation error is reduced by the law of large numbers, and as a result, the prediction accuracy can be further improved.
次に、上記実施形態の変形例を説明する。上記実施形態では、制御部24が異なる構成のグループの集合を生成するように集合生成部14を制御することで、生成されたグループをさらに纏めて順次グループ化する方法を説明した。
Next, a modified example of the above embodiment will be described. In the above embodiment, a method has been described in which the
一方、グループ化する粒度を変更して評価を行うことも効果的である。例えば、k−meansによるグルーピングを、kの値を変更しつつ何度も行うことが考えられる。また、学習処理には多くの時間がかかることが想定されるため、複数のサーバを並列に動作させて、評価を行うことも好ましい。 On the other hand, it is also effective to change the grouping granularity for evaluation. For example, it is conceivable to perform grouping by k-means many times while changing the value of k. Further, since it is expected that the learning process will take a lot of time, it is also preferable to operate a plurality of servers in parallel for evaluation.
例えば、部分予測対象が200存在するとする。このとき、k=50のグルーピング処理とk=100のグルーピング処理とを、別のサーバが並列に実行し、それぞれのグループの集合に対して、学習処理、予測処理および評価処理を行ったうえで、最も評価の良いグループを出力してもよい。 For example, suppose there are 200 partial prediction targets. At this time, another server executes the grouping process of k = 50 and the grouping process of k = 100 in parallel, and after performing the learning process, the prediction process, and the evaluation process on the set of each group. , You may output the group with the best evaluation.
図12は、本発明による情報分析システムの構成例を示すブロック図である。図12に例示する情報分析システム200は、受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14aと、部分和モデル生成部16aと、予測対象算出部18aと、評価部20aと、出力部22と、記憶部30とを備えている。受付部10、単位モデル生成部12、推定誤差算出部13、出力部22および記憶部30の構成は、情報分析装置100が備える構成と同様である。
FIG. 12 is a block diagram showing a configuration example of the information analysis system according to the present invention. The
本変形例の集合生成部14aも、集合生成部14と同様、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、部分予測対象を複数のグループに纏めることにより、グループの集合を生成する。具体的には、集合生成部14aは、推定誤差算出部13が算出した推定誤差を入力する。そして、集合生成部14aは、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する。なお、集合生成部14aがグループの集合を生成する方法は、情報分析装置100における集合生成部14がグループの集合を生成する方法と同様である。
Similar to the
なお、図12に示す例では集合生成部14aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに集合生成部14aを備えていてもよい。また、集合生成部14aが生成するグループの集合の種類は、2種類に限定されず、3種類以上であってもよい。
In the example shown in FIG. 12, only one set
部分和モデル生成部16aは、第1のグループの集合と第2のグループの集合のそれぞれに対して、そのグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。部分和モデル生成部16aが学習モデルを生成する方法は、情報分析装置100における部分和モデル生成部16が学習モデルを生成する方法と同様である。
The partial sum
なお、図12に示す例では部分和モデル生成部16aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに部分和モデル生成部16aを備えていてもよい。
In the example shown in FIG. 12, only one partial sum
予測対象算出部18aは、第1のグループの集合と第2のグループの集合とのそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。予測対象算出部18aが予測対象の値を算出する方法は、情報分析装置100における予測対象算出部18が予測対象の値を算出する方法と同様である。
The prediction
なお、図12に示す例では予測対象算出部18aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに予測対象算出部18aを備えていてもよい。
In the example shown in FIG. 12, only one prediction
評価部20aは、第1のグループの集合と第2のグループの集合のそれぞれに対して、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する。評価部20aがグループの集合を評価する方法は、情報分析装置100における評価部20がグループの集合を評価する方法と同様である。
The
なお、図12に示す例では評価部20aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに評価部20aを備えていてもよい。
In the example shown in FIG. 12, only one
以上のように、本変形例では、集合生成部14aが、部分予測対象を複数のグループに纏めることにより、グループの集合の構成が互いに異なる複数のグループ(第1のグループの集合と第2のグループの集合)をそれぞれ生成する。そのため、上記実施形態の効果に加え、より適切に部分予測対象をグループ化できる。
As described above, in the present modification, the
次に、本発明の概要を説明する。図13は、本発明による情報分析装置の概要を示すブロック図である。本発明による情報分析装置80は、予測対象(例えば、予測対象Y)が、複数の部分予測対象(例えば、部分予測対象y1,y2,…,yn)の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部81(例えば、単位モデル生成部12)と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部82(例えば、推定誤差算出部13)と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部83(例えば、集合生成部14)と、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部84(例えば、部分和モデル生成部16)と、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部85(例えば、予測対象算出部18)とを備えている。Next, the outline of the present invention will be described. FIG. 13 is a block diagram showing an outline of the information analyzer according to the present invention. In the
そのような構成により、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。 With such a configuration, even if each of the plurality of prediction targets has different properties from each other, the desired prediction target is represented by the sum of the plurality of prediction targets. It is possible to realize a grouping of prediction targets that improves the prediction accuracy of.
また、情報分析装置80は、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部(例えば、評価部20)と、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部83を制御する制御部(例えば、制御部24)とを備えていてもよい。そして、集合生成部83は、制御部の制御に応じてグループの集合を生成し、評価部は、生成された各グループの集合を評価してもよい。
Further, the
さらに、制御部は、部分和モデル生成部84が生成した学習モデルについての推定誤差が算出されるように推定誤差算出部82を制御してもよい。このとき、推定誤差算出部82は、部分和モデル生成部84が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。また、制御部は、集合生成部83を制御する際に、部分和モデル生成部84が生成した学習モデルについての推定誤差を、集合生成部83に入力してもよい。このとき、集合生成部83は、部分和モデル生成部84が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する。そのような構成により、グループの集合を順次少なくしていくことが可能になる。
Further, the control unit may control the estimation
また、情報分析装置80は、評価部の評価に応じてグループの集合を出力する出力部(例えば、出力部22)を備えていてもよい。このとき、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数(例えば、上記式1に示す評価関数W)を用いてグループの集合を評価し、出力部は、評価がより良いグループの集合を出力してもよい。
Further, the
また、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数(例えば、上記式2に示す評価関数W)を用いてグループの集合を評価してもよい。 Further, in the evaluation unit, the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and the smaller the number of groups constituting the group set, the better the evaluation. An evaluation function designed as described above (for example, the evaluation function W shown in the above equation 2) may be used to evaluate a set of groups.
また、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、各グループに対応する各学習モデルについて、各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数(例えば、上記式3に示す評価関数W)を用いてグループの集合を評価してもよい。
In addition, the evaluation unit is included in each learning model so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and each learning model corresponding to each group. A set of groups may be evaluated using an evaluation function (for example, the evaluation function W shown in
図14は、本発明による情報分析システムの概要を示すブロック図である。本発明による情報分析システム90は、予測対象(例えば、予測対象Y)が、複数の部分予測対象(例えば、部分予測対象y1,y2,…,yn)の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部91(例えば、単位モデル生成部12)と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部92(例えば、推定誤差算出部13)と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部93(例えば、集合生成部14a)と、第1のグループの集合と第2のグループの集合とのそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部94(例えば、部分和モデル生成部16a)と、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部95(例えば、予測対象算出部18a)と、第1のグループの集合と第2のグループの集合とのそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部96(例えば、評価部20a)とを備えている。FIG. 14 is a block diagram showing an outline of the information analysis system according to the present invention. In the
そのような構成によっても、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。 Even with such a configuration, even if each of the plurality of prediction targets has different properties from each other, the desired prediction target is expressed by the sum of the plurality of prediction targets. It is possible to realize grouping of prediction targets so as to improve the prediction accuracy of the targets.
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。 Some or all of the above embodiments may also be described, but not limited to:
(付記1)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部とを備えたことを特徴とする情報分析装置。 (Appendix 1) When the prediction target is represented by the sum of a plurality of partial prediction targets, a unit model generation unit that generates a learning model for each partial prediction target and the partial prediction target using the learning model. The time axis of the estimation error calculation unit that calculates the estimation error when the value is estimated along the time axis, and the estimation error of one learning model and the estimation error of the other learning model by inputting the estimation error. Based on the similarity in the above, the set generation unit that generates a set of groups by grouping the partial prediction target corresponding to the one learning model and the partial prediction target corresponding to the other learning model into a group, and the above-mentioned A prediction target that calculates the value of the prediction target from the partial sum model generation unit that generates a learning model with the sum of the partial prediction targets included in the group as the objective variable and the prediction value of the group calculated using the learning model. An information analyzer characterized by having a calculation unit.
(付記2)算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部と、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部を制御する制御部とを備え、集合生成部は、前記制御部の制御に応じてグループの集合を生成し、前記評価部は、生成された各グループの集合を評価する付記1記載の情報分析装置。
(Appendix 2) An evaluation unit that evaluates a set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target, and a set of groups having a structure different from the already generated set of groups are generated. A control unit that controls the set generation unit is provided, the set generation unit generates a set of groups according to the control of the control unit, and the evaluation unit evaluates the set of each generated group. The information analyzer according to
(付記3)制御部は、部分和モデル生成部が生成した学習モデルについての推定誤差が算出されるように前記推定誤差算出部を制御し、推定誤差算出部は、部分和モデル生成部が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、制御部は、集合生成部を制御する際に、部分和モデル生成部が生成した学習モデルについての推定誤差を、集合生成部に入力し、集合生成部は、部分和モデル生成部が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する付記2に記載の情報分析装置。
(Appendix 3) The control unit controls the estimation error calculation unit so that the estimation error for the learning model generated by the partial sum model generation unit is calculated, and the estimation error calculation unit is generated by the partial sum model generation unit. The estimation error when the value of the partial prediction target is estimated using the training model is calculated along the time axis, and the control unit controls the set generation unit, and the control unit generates the learning model generated by the partial sum model generation unit. The information analyzer according to
(付記4)評価部の評価に応じてグループの集合を出力する出力部を備え、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記出力部は、前記評価がより良いグループの集合を出力する付記2または付記3記載の情報分析装置。
(Appendix 4) An output unit that outputs a set of groups according to the evaluation of the evaluation unit is provided, and the evaluation unit has a better evaluation as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. The information analyzer according to
(付記5)評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する付記4記載の情報分析装置。
(Appendix 5) In the evaluation section, the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and the smaller the number of groups constituting the group set, the better the evaluation. The information analyzer according to
(付記6)評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、各グループに対応する各学習モデルについて、当該各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する付記4記載の情報分析装置。
(Appendix 6) The evaluation unit evaluates each learning model corresponding to each group so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. The information analyzer according to
(付記7)推定誤差算出部は、各部分予測対象の推定誤差を標準化し、集合生成部は、標準化された推定誤差を入力としてグループの集合を生成する付記1から付記6のうちのいずれか1つに記載の情報分析装置。 (Appendix 7) The estimation error calculation unit standardizes the estimation error of each partial prediction target, and the set generation unit generates a set of groups by inputting the standardized estimation error. The information analyzer described in one.
(付記8)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価部とを備えたことを特徴とする情報分析システム。 (Appendix 8) When the prediction target is represented by the sum of a plurality of partial prediction targets, a unit model generation unit that generates a learning model for each partial prediction target and the partial prediction target using the learning model. The time axis of the estimation error calculation unit that calculates the estimation error when the value is estimated along the time axis, and the estimation error of one learning model and the estimation error of the other learning model by inputting the estimation error. Based on the similarity in the above, by grouping the partial prediction target corresponding to the one learning model and the partial prediction target corresponding to the other learning model into a group, the composition of the set of the groups is different from each other. Partial prediction included in the group for each of the set generator that generates the set of the first group and the set of the second group, and the set of the first group and the set of the second group, respectively. Calculated using the learning model for each of the partial sum model generation unit that generates a learning model with the sum of the objects as the objective variable, the set of the first group, and the set of the second group. For each of the prediction target calculation unit that calculates the value of the prediction target from the prediction value of the group, the set of the first group and the set of the second group, the value of the prediction target and the value of the prediction target An information analysis system including an evaluation unit that evaluates a set of the groups based on a difference from an actual value.
(付記9)評価部の評価に応じてグループの集合を出力する出力部を備え、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記出力部は、前記評価がより良いグループの集合を出力する付記8記載の情報分析システム。
(Appendix 9) An output unit that outputs a set of groups according to the evaluation of the evaluation unit is provided, and the evaluation unit has a better evaluation as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. The information analysis system according to
(付記10)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成し、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出することを特徴とする情報分析方法。 (Appendix 10) When the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each of the partial prediction targets, and the value of the partial prediction target is estimated using the learning model. Is calculated along the time axis, and the estimation error is used as an input, and the estimation error for one learning model and the estimation error for another learning model are based on the similarity on the time axis. A set of groups is generated by grouping the partial prediction target corresponding to the learning model of the above and the partial prediction target corresponding to the other learning model into a group, and the sum of the partial prediction targets included in the group is used as the objective variable. An information analysis method characterized in that a learning model is generated and the value of the prediction target is calculated from the prediction value of a group calculated using the learning model.
(付記11)すでに生成されたグループの集合とは異なる構成のグループの集合を1つ以上生成し、算出された予測対象の値と予測対象の実績値との差分に基づいて各グループの集合を評価する付記10記載の情報分析方法。
(Appendix 11) One or more sets of groups having a configuration different from the already generated set of groups are generated, and the set of each group is created based on the difference between the calculated value of the prediction target and the actual value of the prediction target. The information analysis method according to
(付記12)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成し、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価することを特徴とする情報分析方法。 (Appendix 12) When the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each of the partial prediction targets, and the value of the partial prediction target is estimated using the learning model. Is calculated along the time axis, and the estimation error is used as an input, and the estimation error for one learning model and the estimation error for another learning model are based on the similarity on the time axis. By grouping the partial prediction target corresponding to the training model of the above and the partial prediction target corresponding to the other learning model into a group, the composition of the set of the groups is different from that of the first group and the second group. A set is generated, and a learning model in which the sum of the partial prediction targets included in the group is the objective variable is generated for each of the set of the first group and the set of the second group. For each of the set of the first group and the set of the second group, the value of the prediction target is calculated from the predicted value of the group calculated by using the learning model, and the value of the prediction target is calculated for each of the first group. An information analysis method for evaluating each of the set and the set of the second group based on the difference between the value of the prediction target and the actual value of the prediction target.
(付記13)算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記評価がより良いグループの集合を出力する付記12記載の情報分析方法。
(Appendix 13) A group with a better evaluation is evaluated by using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. The information analysis method according to
(付記14)コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理を実行させるための情報分析プログラム。 (Appendix 14) When the prediction target is represented by the sum of a plurality of partial prediction targets on a computer, a unit model generation process that generates a learning model for each partial prediction target, and the partial prediction using the learning model. Estimated error calculation processing that calculates the estimated error when estimating the target value along the time axis, the time between the estimated error for one learning model and the estimated error for the other learning model using the estimated error as an input A set generation process for generating a set of groups by grouping a partial prediction target corresponding to the one learning model and a partial prediction target corresponding to the other learning model based on the similarity on the axis. Partial sum model generation processing that generates a learning model with the sum of the partial prediction targets included in the group as the objective variable, and prediction that calculates the value of the prediction target from the prediction value of the group calculated using the learning model. An information analysis program for executing the target calculation process.
(付記15)コンピュータに、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価処理、および、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成処理を制御する制御処理を実行させ、集合生成処理で、前記制御処理による制御に応じてグループの集合を生成させ、前記評価処理で、生成された各グループの集合を評価させる付記14記載の情報分析プログラム。
(Appendix 15) An evaluation process in which a computer evaluates a set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target, and a group having a configuration different from the already generated set of groups. A control process for controlling the set generation process is executed so as to generate a set of, a set of groups is generated according to the control by the control process in the set generation process, and each group generated in the evaluation process is generated. The information analysis program according to
(付記16)コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理、および、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価処理を実行させるための情報分析プログラム。 (Appendix 16) When the prediction target is represented by the sum of a plurality of partial prediction targets on a computer, a unit model generation process that generates a learning model for each partial prediction target, and the partial prediction using the learning model. Estimated error calculation processing that calculates the estimated error when estimating the target value along the time axis, the time between the estimated error for one learning model and the estimated error for the other learning model using the estimated error as an input By grouping the partial prediction target corresponding to the one learning model and the partial prediction target corresponding to the other learning model into groups based on the similarity on the axis, the composition of the set of the groups is different from each other. A set generation process for generating a set of one group and a set of a second group, respectively, and the partial prediction included in the group for each of the set of the first group and the set of the second group. A partial sum model generation process that generates a learning model with the sum of the objects as the objective variable, a group calculated using the learning model for each of the first group set and the second group set. For each of the prediction target calculation process for calculating the value of the prediction target from the prediction value of the first group and the set of the first group and the set of the second group, the value of the prediction target and the value of the prediction target An information analysis program for executing an evaluation process that evaluates a set of the groups based on the difference from the actual value.
(付記17)コンピュータに、評価処理での評価に応じてグループの集合を出力する出力処理を実行させ、評価処理で、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価させ、前記出力処理で、前記評価がより良いグループの集合を出力させる付記16記載の情報分析プログラム。
(Appendix 17) The computer is made to execute an output process that outputs a set of groups according to the evaluation in the evaluation process, and the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target in the evaluation process, the smaller the difference. The information analysis program according to
10 受付部
12 単位モデル生成部
13 推定誤差算出部
14,14a 集合生成部
16,16a 部分和モデル生成部
18,18a 予測対象算出部
20,20a 評価部
22 出力部
24 制御部
30 記憶部
100 情報分析装置
200 情報分析システム10
Claims (10)
前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部とを備えた
ことを特徴とする情報分析装置。 When the prediction target is represented by the sum of multiple partial prediction targets,
A unit model generation unit that generates a learning model for each partial prediction target,
An estimation error calculation unit that calculates the estimation error when the value of the partial prediction target is estimated using the learning model along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set generator that generates a set of groups by grouping the partial prediction targets corresponding to the learning model of
A partial sum model generation unit that generates a learning model with the sum of the partial prediction targets included in the group as the objective variable, and
An information analysis device including a prediction target calculation unit that calculates a prediction target value from a group prediction value calculated using the learning model.
すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部を制御する制御部とを備え、
集合生成部は、前記制御部の制御に応じてグループの集合を生成し、
前記評価部は、生成された各グループの集合を評価する
請求項1記載の情報分析装置。 An evaluation unit that evaluates a set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target,
It is provided with a control unit that controls a set generation unit so as to generate a set of groups having a configuration different from that of a group that has already been generated.
The set generation unit generates a set of groups according to the control of the control unit.
The information analyzer according to claim 1, wherein the evaluation unit evaluates a set of each generated group.
推定誤差算出部は、部分和モデル生成部が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
制御部は、集合生成部を制御する際に、部分和モデル生成部が生成した学習モデルについての推定誤差を、集合生成部に入力し、
集合生成部は、部分和モデル生成部が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する
請求項2に記載の情報分析装置。 The control unit controls the estimation error calculation unit so that the estimation error for the learning model generated by the partial sum model generation unit is calculated.
The estimation error calculation unit calculates the estimation error when the value of the partial prediction target is estimated using the learning model generated by the partial sum model generation unit along the time axis.
When controlling the set generation unit, the control unit inputs the estimation error for the learning model generated by the partial sum model generation unit into the set generation unit.
The information analyzer according to claim 2, wherein the set generation unit generates a set of groups by inputting an estimation error of the learning model generated by the partial sum model generation unit.
評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、
前記出力部は、前記評価がより良いグループの集合を出力する
請求項2または請求項3記載の情報分析装置。 Equipped with an output unit that outputs a set of groups according to the evaluation of the evaluation unit
The evaluation unit evaluates a set of groups using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation.
The information analyzer according to claim 2 or 3, wherein the output unit outputs a set of groups having a better evaluation.
請求項4記載の情報分析装置。 In the evaluation section, the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and the smaller the number of groups that make up the set of groups, the better the evaluation. The information analyzer according to claim 4, which evaluates a set of groups using a designed evaluation function.
前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価部とを備えた
ことを特徴とする情報分析システム。 When the prediction target is represented by the sum of multiple partial prediction targets,
A unit model generation unit that generates a learning model for each partial prediction target,
An estimation error calculation unit that calculates the estimation error when the value of the partial prediction target is estimated using the learning model along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. By grouping the partial prediction targets corresponding to the learning model of, the set generator that generates the set of the first group and the set of the second group, which have different configurations of the set of the groups, and a set generation unit.
For each of the set of the first group and the set of the second group, a partial sum model generation unit that generates a learning model with the sum of the partial prediction targets included in the group as an objective variable, and
For each of the set of the first group and the set of the second group, a prediction target calculation unit that calculates the value of the prediction target from the prediction value of the group calculated by using the learning model, and a prediction target calculation unit.
For each of the set of the first group and the set of the second group, an evaluation unit that evaluates the set of the group based on the difference between the value of the prediction target and the actual value of the prediction target. An information analysis system characterized by being equipped.
前記部分予測対象ごとに学習モデルを生成し、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する
ことを特徴とする情報分析方法。 When the prediction target is represented by the sum of multiple partial prediction targets,
A learning model is generated for each of the partial prediction targets,
The estimation error when the value of the partial prediction target is estimated using the learning model is calculated along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set of groups is generated by grouping the partial prediction targets corresponding to the learning model of
A learning model with the sum of the partial prediction targets included in the group as the objective variable is generated.
An information analysis method characterized in that the value of the prediction target is calculated from the prediction value of the group calculated using the learning model.
前記部分予測対象ごとに学習モデルを生成し、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する
ことを特徴とする情報分析方法。 When the prediction target is represented by the sum of multiple partial prediction targets,
A learning model is generated for each of the partial prediction targets,
The estimation error when the value of the partial prediction target is estimated using the learning model is calculated along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. By grouping the partial prediction targets corresponding to the learning model of, a first group set and a second group set having different configurations of the group sets are generated.
For each of the set of the first group and the set of the second group, a learning model in which the sum of the partial prediction targets included in the group is the objective variable is generated.
For each of the set of the first group and the set of the second group, the value of the prediction target is calculated from the prediction value of the group calculated by using the learning model.
For each of the set of the first group and the set of the second group, the set of the group is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target. Information analysis method to do.
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理
を実行させるための情報分析プログラム。 On the computer
When the prediction target is represented by the sum of multiple partial prediction targets,
Unit model generation process that generates a learning model for each partial prediction target,
Estimation error calculation processing that calculates the estimation error when the value of the partial prediction target is estimated using the learning model along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set generation process that generates a set of groups by grouping the partial prediction targets corresponding to the learning model of
A partial sum model generation process that generates a learning model with the sum of the partial prediction targets included in the group as the objective variable, and
An information analysis program for executing a prediction target calculation process that calculates the value of the prediction target from the prediction value of the group calculated using the learning model.
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理、および、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価処理
を実行させるための情報分析プログラム。 On the computer
When the prediction target is represented by the sum of multiple partial prediction targets,
Unit model generation process that generates a learning model for each partial prediction target,
Estimation error calculation processing that calculates the estimation error when the value of the partial prediction target is estimated using the learning model along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set generation process that generates a set of a first group and a set of a second group, which have different configurations of the sets of the groups, by grouping the partial prediction targets corresponding to the learning model of.
A partial sum model generation process for generating a learning model with the sum of the partial prediction targets included in the group as an objective variable for each of the set of the first group and the set of the second group.
For each of the set of the first group and the set of the second group, a prediction target calculation process for calculating the value of the prediction target from the prediction value of the group calculated using the learning model, and a prediction target calculation process.
For each of the first group set and the second group set, an evaluation process is executed to evaluate the set of the group based on the difference between the value of the prediction target and the actual value of the prediction target. Information analysis program to let you.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/033107 WO2019053827A1 (en) | 2017-09-13 | 2017-09-13 | Information analysis device, information analysis method, and information analysis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019053827A1 JPWO2019053827A1 (en) | 2020-04-09 |
JP6849084B2 true JP6849084B2 (en) | 2021-03-24 |
Family
ID=65722603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019541555A Active JP6849084B2 (en) | 2017-09-13 | 2017-09-13 | Information analyzer, information analysis method and information analysis program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6849084B2 (en) |
WO (1) | WO2019053827A1 (en) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10240799A (en) * | 1997-02-27 | 1998-09-11 | Nri & Ncc Co Ltd | Support device for new store opening evaluation |
JP4230975B2 (en) * | 2004-09-17 | 2009-02-25 | キヤノンItソリューションズ株式会社 | Data prediction apparatus, data prediction method, and program |
JP2013196037A (en) * | 2012-03-15 | 2013-09-30 | Hitachi Ltd | Demand prediction system and demand prediction method |
US10755395B2 (en) * | 2015-11-27 | 2020-08-25 | Canon Medical Systems Corporation | Dynamic image denoising using a sparse representation |
-
2017
- 2017-09-13 JP JP2019541555A patent/JP6849084B2/en active Active
- 2017-09-13 WO PCT/JP2017/033107 patent/WO2019053827A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2019053827A1 (en) | 2020-04-09 |
WO2019053827A1 (en) | 2019-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Claveria et al. | Forecasting tourism demand to Catalonia: Neural networks vs. time series models | |
JP6992526B2 (en) | Demand forecasting program, demand forecasting method and demand forecasting device | |
US9286573B2 (en) | Cost-aware non-stationary online learning | |
JP6299759B2 (en) | Prediction function creation device, prediction function creation method, and program | |
CN111753952A (en) | Learning parameters of a probabilistic model including a Gaussian process | |
JP2014157457A (en) | Prediction device and prediction method | |
WO2017037881A1 (en) | Online prediction system and method | |
WO2018079367A1 (en) | Commodity demand prediction system, commodity demand prediction method, and commodity demand prediction program | |
KR102533460B1 (en) | Attention-based stacking method for time series forecasting | |
JPWO2018150798A1 (en) | Model estimation system, method and program | |
WO2018088277A1 (en) | Prediction model generation system, method, and program | |
US20180052441A1 (en) | Simulation system, simulation method, and simulation program | |
JP2020187417A (en) | Physical property prediction device and physical property prediction method | |
JP6201556B2 (en) | Prediction model learning device, prediction model learning method, and computer program | |
JP2021043477A (en) | Demand forecasting device, demand forecasting method, and program | |
Claveria et al. | Tourism demand forecasting with different neural networks models | |
Park et al. | On the long-term predictive capability of data-driven software reliability model: an empirical evaluation | |
JP5457737B2 (en) | Plant control information generating apparatus and method, and computer program therefor | |
CA3119351C (en) | Extending finite rank deep kernel learning to forecasting over long time horizons | |
JP6849084B2 (en) | Information analyzer, information analysis method and information analysis program | |
JP6973493B2 (en) | Information analyzer, information analysis method and information analysis program | |
JP6828830B2 (en) | Evaluation system, evaluation method and evaluation program | |
WO2019187289A1 (en) | Evaluation system, evaluation method, and program for evaluation | |
KR20200010644A (en) | Computer-enabled cloud-based ai computing service method | |
JPWO2018008391A1 (en) | Linear parameter variation model estimation system, method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191204 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6849084 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |