JP6849084B2 - Information analyzer, information analysis method and information analysis program - Google Patents

Information analyzer, information analysis method and information analysis program Download PDF

Info

Publication number
JP6849084B2
JP6849084B2 JP2019541555A JP2019541555A JP6849084B2 JP 6849084 B2 JP6849084 B2 JP 6849084B2 JP 2019541555 A JP2019541555 A JP 2019541555A JP 2019541555 A JP2019541555 A JP 2019541555A JP 6849084 B2 JP6849084 B2 JP 6849084B2
Authority
JP
Japan
Prior art keywords
learning model
group
prediction target
partial
estimation error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019541555A
Other languages
Japanese (ja)
Other versions
JPWO2019053827A1 (en
Inventor
洋介 本橋
洋介 本橋
圭介 梅津
圭介 梅津
梓 鷲田
梓 鷲田
政司 中臣
政司 中臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019053827A1 publication Critical patent/JPWO2019053827A1/en
Application granted granted Critical
Publication of JP6849084B2 publication Critical patent/JP6849084B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、複数の予測対象をグループ化して情報を分析する情報分析装置、情報分析方法および情報分析プログラムに関する。 The present invention relates to an information analyzer, an information analysis method, and an information analysis program for grouping a plurality of prediction targets and analyzing information.

全体としての予測結果を得ようとする場合、個々の対象ごとに予測モデルを作成する代わりに、複数の対象をグループ化し、そのグループ毎に予測を行う場合がある。 When trying to obtain a prediction result as a whole, instead of creating a prediction model for each individual target, a plurality of targets may be grouped and prediction may be performed for each group.

例えば、特許文献1には、電力系統に接続された多数の需要家からなるエネルギーコミュニティに係る電力需要調整システムが記載されている。具体的には、特許文献1には、需要数が増加するほど、すなわち需要家グループの規模が大きくなるほど、その需要家グループの需要予測精度が高くなり、分散が小さくなることが記載されている。また、特許文献1には、需要家グループの規模とその需要家グループの需要電力の総量とがほぼ比例し、このような状況において、需要家グループの規模が或る値になるときに予測と実績との差が最小になり、それより需要家数が増加および減少すると、その差が増加することが記載されている。特許文献1に記載された電力需要調整システムは、このような需要家グループの規模と予測と実績との関係を利用して、需要家グループの規模を決定し、その需要家グループの電力需要を予測する。 For example, Patent Document 1 describes an electric power demand adjustment system related to an energy community consisting of a large number of consumers connected to an electric power system. Specifically, Patent Document 1 describes that as the number of demands increases, that is, as the size of the consumer group increases, the demand forecast accuracy of the consumer group increases and the variance decreases. .. Further, in Patent Document 1, the size of the consumer group is almost proportional to the total amount of power demand of the consumer group, and in such a situation, it is predicted when the size of the consumer group becomes a certain value. It is stated that the difference from the actual result is minimized, and the difference increases as the number of consumers increases and decreases. The electric power demand adjustment system described in Patent Document 1 determines the size of the consumer group by utilizing the relationship between the size of the consumer group and the forecast and the actual result, and determines the electric power demand of the consumer group. Predict.

国際公開第2016/084313号International Publication No. 2016/0843313

しかし、特許文献1に記載された電力需要調整システムは、個々の需要家が互いに異なる性質を有していることを考慮していない。具体的には、特許文献1に記載された電力需要調整システムは、「需要家グループの規模」と「推定精度・分散・需要電力総量・予測と実績との差」との間に、上述する関係が成立することを前提とする。しかし、個々の需要家が互いに異なる性質を有している場合、グループ化する需要家に応じて、上述する関係は変化する。 However, the electric power demand adjustment system described in Patent Document 1 does not consider that individual consumers have different properties from each other. Specifically, the electric power demand adjustment system described in Patent Document 1 is described above between "the size of the consumer group" and "estimation accuracy / dispersion / total amount of electric power demand / difference between forecast and actual result". It is assumed that a relationship is established. However, if the individual consumers have different properties from each other, the relationships described above will vary depending on the consumers being grouped.

すなわち、特許文献1に記載された電力需要調整システムは、予測精度の観点からどの需要家同士を同じグループにするのか考慮されていないため、グループ化することによって必ずしも予測精度を向上できるとは言い難い。 That is, since the electric power demand adjustment system described in Patent Document 1 does not consider which consumers are in the same group from the viewpoint of prediction accuracy, it is said that the prediction accuracy can always be improved by grouping. hard.

そこで、本発明は、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる情報分析装置、情報分析方法および情報分析プログラムを提供することを目的とする。 Therefore, in the present invention, even when a plurality of prediction targets have different properties from each other, a desired prediction target is expressed by the sum of the plurality of prediction targets. It is an object of the present invention to provide an information analyzer, an information analysis method, and an information analysis program capable of realizing a grouping of prediction targets so as to improve the prediction accuracy of the above.

本発明による情報分析装置は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部とを備えたことを特徴とする。 The information analyzer according to the present invention has a unit model generation unit that generates a learning model for each partial prediction target when the prediction target is represented by the sum of a plurality of partial prediction targets, and a partial prediction target using the learning model. The time axis of the estimation error calculation unit that calculates the estimation error when estimating the value of is along the time axis, and the estimation error of one learning model and the estimation error of another learning model by inputting the estimation error. Based on the similarity in the above, the set generation part that generates a set of groups by grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into a group, and the group include It is equipped with a partial sum model generation unit that generates a learning model with the sum of the partial prediction targets as the objective variable, and a prediction target calculation unit that calculates the value of the prediction target from the prediction values of the group calculated using the learning model. It is characterized by that.

本発明による情報分析システムは、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部とを備えたことを特徴とする。 The information analysis system according to the present invention has a unit model generation unit that generates a learning model for each partial prediction target when the prediction target is represented by the sum of a plurality of partial prediction targets, and a partial prediction target using the learning model. The time axis of the estimation error calculation unit that calculates the estimation error when estimating the value of is along the time axis, and the estimation error of one learning model and the estimation error of another learning model by inputting the estimation error. Based on the similarity in the above, by grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into a group, the composition of the group set is different from that of the first group. For each of the set generator that generates the set and the set of the second group, and the set of the first group and the set of the second group, the sum of the partial prediction targets included in the group is used as the objective variable. For each of the partial sum model generator that generates the training model to be used, the set of the first group, and the set of the second group, the value to be predicted is calculated from the predicted value of the group calculated using the learning model. Evaluation that evaluates the set of groups based on the difference between the value of the prediction target and the actual value of the prediction target for each of the calculation unit of the prediction target to be calculated and the set of the first group and the set of the second group. It is characterized by having a part.

本発明による情報分析方法は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成し、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出することを特徴とする。 In the information analysis method according to the present invention, when the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each partial prediction target, and the value of the partial prediction target is estimated using the learning model. The case estimation error is calculated along the time axis, and the estimation error is used as an input, based on the similarity between the estimation error for one learning model and the estimation error for the other learning model on the time axis. A learning model in which the sum of the partial prediction targets included in the group is used as the objective variable is generated by grouping the partial prediction targets corresponding to the learning model and the partial prediction targets corresponding to other learning models into a group. It is characterized in that the value of the prediction target is calculated from the prediction value of the group generated and calculated using the learning model.

本発明による他の情報分析方法は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成し、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出し、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価することを特徴とする。 In another information analysis method according to the present invention, when the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each partial prediction target, and the value of the partial prediction target is calculated using the learning model. The estimation error when estimated is calculated along the time axis, and the estimation error is used as an input, based on the similarity between the estimation error for one learning model and the estimation error for the other learning model on the time axis. By grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into a group, the composition of the group set is different from that of the first group set and the second group set. And are generated respectively, and for each of the set of the first group and the set of the second group, a learning model in which the sum of the partial prediction targets included in the group is the objective variable is generated, and the first group For each of the set and the set of the second group, the value to be predicted is calculated from the predicted value of the group calculated using the learning model, and the set of the first group and the set of the second group are each calculated. On the other hand, it is characterized in that the set of groups is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target.

本発明による情報分析プログラムは、コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成処理、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出処理を実行させることを特徴とする。 The information analysis program according to the present invention uses a unit model generation process and a learning model to generate a learning model for each partial prediction target when the prediction target is represented by the sum of a plurality of partial prediction targets on a computer. Estimate error calculation processing that calculates the estimation error when estimating the value of the prediction target along the time axis, the time between the estimation error for one learning model and the estimation error for the other learning model with the estimation error as input A set generation process that generates a set of groups by grouping a partial prediction target corresponding to one learning model and a partial prediction target corresponding to another learning model based on the similarity on the axis, and is included in the group. Executes the partial sum model generation process that generates a learning model with the sum of the partial prediction targets as the objective variable, and the prediction target calculation process that calculates the value of the prediction target from the prediction values of the group calculated using the learning model. It is characterized by letting it.

本発明による他の情報分析プログラムは、コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成処理、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出処理、および、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価処理を実行させることを特徴とする。 Another information analysis program according to the present invention uses a unit model generation process and a learning model that generate a learning model for each partial prediction target when the prediction target is represented by the sum of a plurality of partial prediction targets on a computer. Estimate error calculation processing that calculates the estimation error when the value of the partial prediction target is estimated along the time axis, and the estimation error for one learning model and the estimation error for the other learning model by inputting the estimation error By grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into a group based on the similarity on the time axis of, the composition of the set of the groups is different from each other. The purpose is the sum of the partial prediction targets included in the group for each of the set of the first group and the set of the second group, which is the set generation process for generating the set of the first group and the set of the second group, respectively. For each of the partial sum model generation process that generates the training model as a variable, the set of the first group and the set of the second group, the value to be predicted from the predicted value of the group calculated using the training model. For each of the prediction target calculation process for calculating and the first group set and the second group set, the group set is evaluated based on the difference between the prediction target value and the prediction target actual value. It is characterized in that the evaluation process is executed.

本発明によれば、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できるという技術的効果を奏する。 According to the present invention, even when a plurality of prediction targets have different properties from each other, a desired prediction target is expressed by the sum of the plurality of prediction targets. It has the technical effect of being able to realize grouping of prediction targets that improves the prediction accuracy of.

本発明による情報分析装置の一実施形態を示すブロック図である。It is a block diagram which shows one Embodiment of the information analyzer according to this invention. 部分予測対象の候補の例を示す説明図である。It is explanatory drawing which shows the example of the candidate of a partial prediction target. 実績データの例を示す説明図である。It is explanatory drawing which shows the example of the actual data. 部分予測対象単位で生成した学習モデルの例を示す説明図である。It is explanatory drawing which shows the example of the learning model generated by the partial prediction target unit. 推定誤差を算出する処理の例を示す説明図である。It is explanatory drawing which shows the example of the processing which calculates the estimation error. 時間軸に沿って算出した推定誤差の例を示す説明図である。It is explanatory drawing which shows the example of the estimation error calculated along the time axis. 時間軸に沿って算出した推定誤差をグラフ化した例を示す説明図である。It is explanatory drawing which shows the example which graphed the estimation error calculated along the time axis. 部分予測対象をグループ化する処理の例を示す説明図である。It is explanatory drawing which shows the example of the process of grouping a partial prediction target. グループの集合を生成する処理の例を示す説明図である。It is explanatory drawing which shows the example of the process which generates the set of a group. グループの集合を生成する処理の例を示す説明図である。It is explanatory drawing which shows the example of the process which generates the set of a group. 情報分析装置の動作例を示すフローチャートである。It is a flowchart which shows the operation example of an information analyzer. 本発明による情報分析システムの構成例を示すブロック図である。It is a block diagram which shows the structural example of the information analysis system by this invention. 本発明による情報分析装置の概要を示すブロック図である。It is a block diagram which shows the outline of the information analyzer according to this invention. 本発明による情報分析システムの概要を示すブロック図である。It is a block diagram which shows the outline of the information analysis system by this invention.

以下、本発明の実施形態を図面を参照して説明する。図1は、本発明による情報分析装置の一実施形態を示すブロック図である。なお、本実施形態の情報分析装置の構成については後述される。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of an information analyzer according to the present invention. The configuration of the information analyzer of this embodiment will be described later.

本発明では、ある時間における予測対象Yの値(予測結果)が、同じ時間における複数の予測対象y,y,…,yの足し合わせにより構成されるものとする。すなわち、ある時刻における予測対象が、同じ時刻における複数の部分予測対象の和により表現される。具体的には、Y=y+y+…+yである。In the present invention, it is assumed that the value of the prediction target Y (prediction result) at a certain time is composed of the sum of a plurality of prediction targets y 1 , y 2 , ..., Y n at the same time. That is, the prediction target at a certain time is represented by the sum of a plurality of partial prediction targets at the same time. Specifically, Y = y 1 + y 2 + ... + y n .

なお、複数の予測対象y,y,…,yの足し合わせにより所望の予測対象Yが構成されることから、以下の説明では、個々の予測対象y,y,…,yのことを、部分予測対象と記す。したがって、ある時間における予測対象Yの値は、同じ時間における部分予測対象y,y,…,yの総和で算出される。例えば、予測対象Yが、工場が製造する商品の需要総数(受注総数)とした場合、部分予測対象yは、個々の店舗の商品需要数(受注数)である。Since the desired prediction target Y is formed by adding a plurality of prediction targets y 1 , y 2 , ..., Y n , in the following description, the individual prediction targets y 1 , y 2 , ..., Y n is referred to as a partial prediction target. Therefore, the value of the prediction target Y at a certain time is calculated by the sum of the partial prediction targets y 1 , y 2 , ..., Y n at the same time. For example, when the forecast target Y is the total demand for products manufactured by the factory (total number of orders), the partial forecast target y n is the number of product demands (number of orders) for each store.

また、本発明では、部分予測対象を複数のグループ(Y,Y,…,Y)に纏め、グループごとに予測モデルの学習、予測対象の予測値や実績値の算出を行う。Further, in the present invention, the partial prediction targets are grouped into a plurality of groups (Y 1 , Y 2 , ..., Y N ), the prediction model is learned for each group, and the prediction value and the actual value of the prediction target are calculated.

以下、具体例を用いて、予測対象と部分予測対象との関係を説明する。以下、ある商品を製造して各店舗に納品する工場があると想定し、この工場の生産管理部門の立場に立って、過去の実績データに基づいて未来の商品需要(受注数)を予測するとする。 Hereinafter, the relationship between the prediction target and the partial prediction target will be described with reference to a specific example. Below, assuming that there is a factory that manufactures a certain product and delivers it to each store, from the standpoint of the production control department of this factory, predicting future product demand (number of orders) based on past actual data. To do.

図2は、部分予測対象の候補の例を示す説明図である。図2に示す例では、自工場が図2に例示する200店舗(店舗コード:C−001〜C−200)へ商品を納品することを示す。また、図3は、実績データとして、日ごと及び店舗ごとの商品の売上数の例を示す説明図である。また、図3に例示する表には、前日の最高気温および最低気温が含まれる。以下の説明では、図3に例示するような実際に取得された過去データ(実績データ)のことを、評価用データと記すこともある。 FIG. 2 is an explanatory diagram showing an example of candidates for partial prediction. In the example shown in FIG. 2, it is shown that the own factory delivers the product to the 200 stores (store code: C-001 to C-200) illustrated in FIG. Further, FIG. 3 is an explanatory diagram showing an example of the number of sales of products for each day and each store as actual data. In addition, the table illustrated in FIG. 3 includes the maximum temperature and the minimum temperature of the previous day. In the following description, the past data (actual data) actually acquired as illustrated in FIG. 3 may be referred to as evaluation data.

このような情報が存在する場合に翌日の商品の受注数を予測する状況を想定する。例えば、一般的な方法の場合、各日の各店舗の売上数の総数を目的変数に設定し、図3に例示する表に含まれるような最高気温、最低気温などを説明変数に設定して予測モデルを学習することが考えられる。 If such information exists, it is assumed that the number of orders for products on the next day is predicted. For example, in the general method, the total number of sales of each store on each day is set as the objective variable, and the maximum temperature, the minimum temperature, etc. as included in the table illustrated in FIG. 3 are set as the explanatory variables. It is conceivable to learn a predictive model.

しかし、例えば200店舗の中に、他と著しく異なる性質を有する店舗(例えば、売上規模、発注の増減が大きい店舗など)が含まれている場合も存在する。このような異なる性質を有する店舗を一まとめにして学習を行っても、高い予測精度が得られない可能性が高い。そこで、このような複数の店舗を、同様の性質を有する店舗ごとに分類して予測を行うことが考えられる。 However, for example, there are cases where the 200 stores include stores having significantly different properties from the others (for example, stores with a large increase / decrease in sales scale and orders). There is a high possibility that high prediction accuracy cannot be obtained even if learning is performed by grouping stores having such different properties. Therefore, it is conceivable to classify such a plurality of stores into stores having similar properties and make a prediction.

しかし、対象とする商品の売上が、必ずしも図2に例示するような各店舗の所在地や売場面積、昨年売上高だけで分類できるとは限らない。例えば、同じ所在地の店舗であっても、ビルの中の店舗と路面店とでは売上の傾向が異なると考えられるし、同程度の売り場面積を有する店舗であっても、近隣の環境に応じて商品の需要傾向が異なることも考えられる。 However, the sales of the target products cannot always be classified only by the location and sales floor area of each store and the sales last year as illustrated in FIG. For example, even if the stores are located at the same location, the sales tendency may differ between the stores in the building and the roadside stores, and even if the stores have the same sales floor area, depending on the neighboring environment. It is possible that the demand trends for products are different.

そこで、以下の実施形態では、推定誤差の傾向が類似する店舗(部分予測対象)をグループ化して予測を行うことで、所望の予測対象の実績値に対する予測値の推定誤差を小さくする方法を説明する。以下、上述する具体例を適宜使用しながら、本発明の情報分析装置を説明する。 Therefore, in the following embodiment, a method of reducing the estimation error of the predicted value with respect to the actual value of the desired prediction target by grouping stores (partial prediction targets) having similar estimation error tendencies will be described. To do. Hereinafter, the information analyzer of the present invention will be described while appropriately using the above-mentioned specific examples.

図1に例示する情報分析装置100は、受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24と、記憶部30とを備えている。 The information analysis device 100 illustrated in FIG. 1 includes a reception unit 10, a unit model generation unit 12, an estimation error calculation unit 13, a set generation unit 14, a partial sum model generation unit 16, and a prediction target calculation unit 18. , The evaluation unit 20, the output unit 22, the control unit 24, and the storage unit 30 are provided.

記憶部30は、部分予測対象に関する情報を記憶する。記憶部30は、例えば、図2に例示する店舗のような、部分予測対象を記憶していてもよい。他にも、記憶部30は、図3に例示するような、部分予測対象に関する実績データを記憶していてもよい。 The storage unit 30 stores information regarding the partial prediction target. The storage unit 30 may store a partial prediction target, for example, a store illustrated in FIG. 2. In addition, the storage unit 30 may store actual data regarding the partial prediction target as illustrated in FIG.

実績データは、後述する単位モデル生成部12および部分和モデル生成部16が学習モデルを生成する際のデータとして用いられる。他にも、実績データは、後述する評価部20が予測モデルを評価する際のデータとして用いられる。例えば、実績データのうち、一定の割合のデータを学習用データとして用い、残りのデータを評価用データとして用いてもよい。 The actual data is used as data when the unit model generation unit 12 and the partial sum model generation unit 16 described later generate a learning model. In addition, the actual data is used as data when the evaluation unit 20 described later evaluates the prediction model. For example, of the actual data, a certain percentage of data may be used as learning data, and the remaining data may be used as evaluation data.

ただし、記憶部30が記憶するデータは、これらのデータに限定されない。記憶部30は、例えば、後述する単位モデル生成部12および部分和モデル生成部16が生成した学習モデルを記憶してもよい。記憶部30は、例えば、磁気ディスク装置により実現される。 However, the data stored by the storage unit 30 is not limited to these data. The storage unit 30 may store, for example, the learning model generated by the unit model generation unit 12 and the partial sum model generation unit 16, which will be described later. The storage unit 30 is realized by, for example, a magnetic disk device.

受付部10は、所望の予測対象の指定を受け付ける。また、受付部10は、所望の予測対象を構成する複数の部分予測対象の指定を受け付けてもよい。 The reception unit 10 receives the designation of a desired prediction target. Further, the reception unit 10 may accept the designation of a plurality of partial prediction targets constituting the desired prediction target.

単位モデル生成部12は、部分予測対象単位に学習モデルを生成する。具体的には、単位モデル生成部12は、部分予測対象y,y,…,yのそれぞれについて学習モデルを生成する。The unit model generation unit 12 generates a learning model in the partial prediction target unit. Specifically, the unit model generation unit 12 generates a learning model for each of the partial prediction targets y 1 , y 2 , ..., And y n.

例えば、図2に例示する各店舗が部分予測対象である場合、単位モデル生成部12は、店舗ごとに学習モデルを生成する。予測対象に影響する要因の類似性を判断できるように、単位モデル生成部12は、説明変数の重みで予測対象を予測可能な学習モデル(例えば、線形重回帰モデル)を生成してもよい。ただし、単位モデル生成部12が生成する学習モデルは線形重回帰モデルに限られない。単位モデル生成部12は、任意の方法で学習モデルを生成すればよい。 For example, when each store illustrated in FIG. 2 is a partial prediction target, the unit model generation unit 12 generates a learning model for each store. The unit model generation unit 12 may generate a learning model (for example, a linear multiple regression model) in which the prediction target can be predicted by the weight of the explanatory variable so that the similarity of the factors affecting the prediction target can be determined. However, the learning model generated by the unit model generation unit 12 is not limited to the linear multiple regression model. The unit model generation unit 12 may generate a learning model by any method.

図4は、単位モデル生成部12が部分予測対象単位で生成した学習モデルの例を示す説明図である。図4に示す例では、店舗コード「C−001」で特定される店舗の商品の売上予測y001が、前日の最高気温(説明変数x)、一週間前の売上(説明変数x)、および、売り場面積(説明変数x)と正の相関があることを示す。一方、図4に示す例では、店舗コード「C−200」で特定される店舗の商品の売上予測y200が、一週間前の売上(説明変数x)、および、売り場面積(説明変数x)と正の相関がある一方、週末(説明変数x)と負の相関があることを示す。FIG. 4 is an explanatory diagram showing an example of a learning model generated by the unit model generation unit 12 in the partial prediction target unit. In the example shown in FIG. 4, a store code "C-001" forecast y 001 items from the store that are identified in the previous day's highest temperature (explanatory variable x 1), one week prior to the sales (explanatory variable x 2) , And, it is shown that there is a positive correlation with the sales floor area (explanatory variable x 3). On the other hand, in the example shown in FIG. 4, a store code forecast y 200 items from the store specified by "C-200" is one week before the sales (explanatory variable x 2), and, floor space (explanatory variable x It shows that there is a positive correlation with 3 ), while there is a negative correlation with the weekend (explanatory variable x 4).

推定誤差算出部13は、学習モデルを用いて、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。具体的には、推定誤差算出部13は、単位モデル生成部12によって生成された学習モデルを用いて、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。 The estimation error calculation unit 13 calculates the estimation error when the value of the partial prediction target is estimated by using the learning model along the time axis. Specifically, the estimation error calculation unit 13 calculates the estimation error when the value of the partial prediction target is estimated by using the learning model generated by the unit model generation unit 12 along the time axis.

なお、推定誤差算出部13は、後述する部分和モデル生成部16によって生成された学習モデルを用いて、同様に、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。部分和モデル生成部16によって生成された学習モデルを用いる処理については後述される。 The estimation error calculation unit 13 similarly calculates the estimation error when the value of the partial prediction target is estimated by using the learning model generated by the partial sum model generation unit 16 described later along the time axis. .. The process using the learning model generated by the partial sum model generation unit 16 will be described later.

図5は、推定誤差を算出する処理の例を示す説明図である。例えば、図3に例示する2017年の6月の実績データが評価用データとして用いられ、対応する学習モデルが図4に例示する予測式で表されているとする。 FIG. 5 is an explanatory diagram showing an example of processing for calculating the estimation error. For example, it is assumed that the actual data of June 2017 illustrated in FIG. 3 is used as the evaluation data, and the corresponding learning model is represented by the prediction formula illustrated in FIG.

まず、推定誤差算出部13は、部分予測対象である店舗コード「C−001」で特定される店舗の売上の推定値を、図4に例示する予測式(y001=0.1x+0.18x+0.06x+1.6)を用いて算出する。例えば、2017年6月2日の売上の推定値を算出するとする場合、店舗の売り場面積は120mであり、前日の最高気温は26度である。また、一週間前の売上数が20であったとすると、売上の推定値はy^001=0.1×26+0.18×10+0.06×120+1.6=13.2と算出される。 First, the estimation error calculation unit 13 uses a prediction formula (y 001 = 0.1 x 1 + 0.) Illustrating the estimated value of the sales of the store specified by the store code "C-001" which is the partial prediction target. It is calculated using 18 x 2 + 0.06 x 3 + 1.6). For example, when calculating the estimated value of sales on June 2, 2017, the sales floor area of the store is 120 m 2 , and the maximum temperature on the previous day is 26 degrees. Further, assuming that the number of sales one week ago was 20, the estimated value of sales is calculated as y ^ 001 = 0.1 × 26 + 0.18 × 10 + 0.06 × 120 + 1.6 = 13.2.

そして、推定誤差算出部13は、2017年6月2日の売上の実績値である15と、推定値である13.2の誤差(推定誤差)を、15−13.2=1.8と算出する。推定誤差算出部13は、以下の日付についても同様に推定誤差を算出することで、時間軸に沿った(時系列の)推定誤差を算出する。また、推定誤差算出部13は、他の部分予測対象(店舗)についても、同様に時間軸に沿った推定誤差を算出する。 Then, the estimation error calculation unit 13 sets the error (estimation error) between 15 which is the actual value of sales on June 2, 2017 and 13.2 which is the estimated value as 15-13.2 = 1.8. calculate. The estimation error calculation unit 13 calculates the estimation error (in time series) along the time axis by similarly calculating the estimation error for the following dates. Further, the estimation error calculation unit 13 similarly calculates the estimation error along the time axis for other partial prediction targets (stores).

図6は、時間軸に沿って算出した推定誤差の例を示す説明図である。図6に示す例は、図3に例示するデータを用いて、店舗ごと及び日ごとに推定誤差を算出した結果を示す。また、図7は、時間軸に沿って算出した推定誤差をグラフ化した例を示す説明図である。図7に示す例は、図6に例示する時間軸に沿った推定誤差を、店舗ごとに折れ線グラフで表している。 FIG. 6 is an explanatory diagram showing an example of an estimation error calculated along the time axis. The example shown in FIG. 6 shows the result of calculating the estimation error for each store and each day using the data illustrated in FIG. Further, FIG. 7 is an explanatory diagram showing an example in which the estimation error calculated along the time axis is graphed. In the example shown in FIG. 7, the estimation error along the time axis illustrated in FIG. 6 is represented by a line graph for each store.

なお、売上規模の差異に応じ、推定誤差算出部13は、各部分予測対象の推定誤差を標準化してもよい。具体的には、推定誤差算出部13は、各部分予測対象の推定誤差の平均および分散に基づいて推定誤差を標準化してもよい。このような標準化を行うことで、時間軸に沿った推定誤差の傾向を、同じ尺度で判断できる。 The estimation error calculation unit 13 may standardize the estimation error of each partial prediction target according to the difference in sales scale. Specifically, the estimation error calculation unit 13 may standardize the estimation error based on the average and variance of the estimation error of each partial prediction target. By performing such standardization, the tendency of the estimation error along the time axis can be judged on the same scale.

集合生成部14は、部分予測対象を複数のグループに纏めることにより、グループの集合を生成する。なお、集合生成部14は、後述する制御部24の制御に応じてグループの集合を生成する。 The set generation unit 14 generates a set of groups by grouping the partial prediction targets into a plurality of groups. The set generation unit 14 generates a set of groups according to the control of the control unit 24 described later.

まず、集合生成部14は、推定誤差算出部13が算出した推定誤差を入力する。そして、集合生成部14は、入力された一の学習モデルについての推定誤差と、他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。 First, the set generation unit 14 inputs the estimation error calculated by the estimation error calculation unit 13. Then, the set generation unit 14 makes a partial prediction corresponding to one learning model based on the similarity on the time axis between the input estimation error of one learning model and the estimation error of another learning model. A set of groups is generated by grouping the target and the partial prediction target corresponding to other learning models into a group.

なお、集合生成部14は、後述する部分和モデル生成部16によって生成された学習モデルによる推定誤差の時間軸上における類似性に基づいて、同様に、グループの集合を生成する。なお、部分和モデル生成部16によって生成された学習モデルによる推定誤差を用いる処理については後述される。 The set generation unit 14 similarly generates a set of groups based on the similarity of the estimation error by the learning model generated by the partial sum model generation unit 16 described later on the time axis. The process of using the estimation error by the learning model generated by the partial sum model generation unit 16 will be described later.

集合生成部14が、推定誤差の時間軸上における類似性を判断する方法は任意である。集合生成部14は、例えば、時間軸方向の各区間の推定誤差の変化をベクトル(推定誤差ベクトル)で表し、比較する他の学習モデルによる推定誤差ベクトルとの内積の各区間における総和が、より大きいほど類似性が高いと判断してもよい。また、集合生成部14は、図7に例示するグラフの形状が類似しているほど、時間軸上における推定誤差がより類似すると判断してもよい。 The method by which the set generation unit 14 determines the similarity of the estimation error on the time axis is arbitrary. The set generation unit 14 represents, for example, a change in the estimation error of each section in the time axis direction by a vector (estimation error vector), and the sum of the inner products with the estimation error vector by another learning model to be compared is calculated by increasing the sum. It may be judged that the larger the value, the higher the similarity. Further, the set generation unit 14 may determine that the more similar the shapes of the graphs illustrated in FIG. 7, the more similar the estimation error on the time axis is.

また、集合生成部14が纏めるグループの数も任意である。図8は、部分予測対象をグループ化する処理の例を示す説明図である。集合生成部14は、推定誤差の類似性が高い学習モデルに対応する部分予測対象を順次グループ化し、グループ化された部分予測対象を除外しながらグループ化を繰り返してもよい。具体的には、集合生成部14は、図8(a)に例示するように、推定誤差の類似性が高い部分予測対象をグループ化したグループG1を生成し、その後、グループG1に含まれる部分予測対象を除いて、次に推定誤差の類似性が高い部分予測対象をグループ化したグループG2を生成してもよい。例えば、推定誤差の類似する学習モデルのペアをそれぞれ抽出してグループを生成する場合、図2に例示する200の部分予測対象から、100のグループの集合が生成される。 Further, the number of groups collected by the set generation unit 14 is also arbitrary. FIG. 8 is an explanatory diagram showing an example of processing for grouping partial prediction targets. The set generation unit 14 may sequentially group the partial prediction targets corresponding to the learning models having high estimation error similarity, and repeat the grouping while excluding the grouped partial prediction targets. Specifically, as illustrated in FIG. 8A, the set generation unit 14 generates a group G1 in which partial prediction targets having high estimation error similarity are grouped, and then a portion included in the group G1. Group G2 may be generated by grouping partial prediction targets having the next highest estimation error similarity, excluding the prediction target. For example, when each pair of learning models having similar estimation errors is extracted to generate a group, a set of 100 groups is generated from the 200 partial prediction targets illustrated in FIG.

また。集合生成部14は、推定誤差の類似性が高い学習モデルに対応する部分予測対象を順次グループ化し、グループ化された部分予測対象を除外せずにグループ化を繰り返してもよい。具体的には、集合生成部14は、図8(b)に例示するように、推定誤差の類似性が高い部分予測対象をグループ化したグループG1を生成し、その後、グループG1に含まれる部分予測対象も含めて、次に推定誤差の類似性が高い部分予測対象をグループ化したグループG3を生成してもよい。 Also. The set generation unit 14 may sequentially group the partial prediction targets corresponding to the learning models having high estimation error similarity, and repeat the grouping without excluding the grouped partial prediction targets. Specifically, as illustrated in FIG. 8B, the set generation unit 14 generates a group G1 in which partial prediction targets having high estimation error similarity are grouped, and then a portion included in the group G1. A group G3 may be generated in which partial prediction targets having the next highest estimation error similarity, including the prediction target, are grouped.

また、集合生成部14は、すでに生成されたグループの集合とは異なる構成のグループの集合を、別途生成してもよい。具体的には、集合生成部14は、グループの集合を構成するグループの数が、すでに生成されたグループの集合を構成するグループの数と変わるようにグループの集合を生成してもよい。例えば、図2に例示する200の部分予測対象が存在する場合、集合生成部14は、2つの部分予測対象を纏めた100のグループの集合を生成し、さらに、4つの部分予測対象を纏めた50のグループの集合を生成してもよい。 Further, the set generation unit 14 may separately generate a set of groups having a configuration different from the set of groups already generated. Specifically, the set generation unit 14 may generate a set of groups so that the number of groups constituting the set of groups is different from the number of groups constituting the set of already generated groups. For example, when there are 200 partial prediction targets illustrated in FIG. 2, the set generation unit 14 generates a set of 100 groups that summarizes the two partial prediction targets, and further summarizes the four partial prediction targets. A set of 50 groups may be generated.

なお、集合生成部14が生成する各グループに含まれる部分予測対象の数は、同数であってもよく、異なっていてもよい。 The number of partial prediction targets included in each group generated by the set generation unit 14 may be the same or different.

図9は、グループの集合を生成する処理の例を示す説明図である。図7に例示する推定誤差が算出されている場合、例えば、店舗コード「C−001」で特定される店舗の推定誤差の傾向と、店舗コード「C−003」で特定される店舗の推定誤差の傾向とは、その推定誤差の傾向(変化度合)が類似すると言える。そこで、集合生成部14は、店舗コード「C−001」で特定される店舗と、店舗コード「C−003」で特定される店舗とをまとめて1つのグループを生成する。集合生成部14は、このグループ化を他の店舗についても繰り返し行う。 FIG. 9 is an explanatory diagram showing an example of a process of generating a set of groups. When the estimation error illustrated in FIG. 7 is calculated, for example, the tendency of the estimation error of the store specified by the store code "C-001" and the estimation error of the store specified by the store code "C-003". It can be said that the tendency of the estimation error (degree of change) is similar to the tendency of. Therefore, the set generation unit 14 collectively generates one group by combining the store specified by the store code "C-001" and the store specified by the store code "C-003". The set generation unit 14 repeats this grouping for other stores as well.

部分和モデル生成部16は、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。すなわち、部分和モデル生成部16は、グループ化された複数の部分予測対象のグループ(Y,Y,…,Y)ごとに学習モデルを生成する。なお、部分和モデル生成部16が学習モデルを生成する方法は、集合生成部14が学習モデルを生成する方法と同様である。The partial sum model generation unit 16 generates a learning model in which the sum of the partial prediction targets included in the group is the objective variable. That is, the partial sum model generation unit 16 generates a learning model for each of a plurality of grouped partial prediction target groups (Y 1 , Y 2 , ..., Y N). The method in which the partial sum model generation unit 16 generates the learning model is the same as the method in which the set generation unit 14 generates the learning model.

例えば、図9に例示するように、店舗コード「C−001」で特定される店舗と、店舗コード「C−003」で特定される店舗とをまとめて1つのグループを生成したとする。この場合、部分和モデル生成部16は、この2つの店舗の商品の売上の和を目的変数とする学習モデルを生成する。 For example, as illustrated in FIG. 9, it is assumed that the store specified by the store code "C-001" and the store specified by the store code "C-003" are collectively generated into one group. In this case, the partial sum model generation unit 16 generates a learning model in which the sum of the sales of the products of these two stores is used as the objective variable.

予測対象算出部18は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。具体的には、予測対象算出部18は、単位モデル生成部12によって生成された学習モデルを用いて算出されるグループの予測値を合計して予測対象の値を算出する。さらに、予測対象算出部18は、部分和モデル生成部16によって生成された学習モデルを用いて算出されるグループの予測値を合計して予測対象の値を算出する。 The prediction target calculation unit 18 calculates the value of the prediction target from the prediction value of the group calculated using the learning model. Specifically, the prediction target calculation unit 18 calculates the prediction target value by summing the prediction values of the groups calculated using the learning model generated by the unit model generation unit 12. Further, the prediction target calculation unit 18 calculates the prediction target value by summing the prediction values of the groups calculated using the learning model generated by the partial sum model generation unit 16.

評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいて、グループの集合を評価する。予測対象の実績値は、例えば、予め記憶部30に記憶されている。評価部20は、例えば、グループの集合の良さを評価するための評価関数を用いてもよい。 The evaluation unit 20 evaluates a set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target. The actual value of the prediction target is stored in the storage unit 30 in advance, for example. The evaluation unit 20 may use, for example, an evaluation function for evaluating the goodness of a set of groups.

具体的には、評価部20は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。予測値と実測値の誤差が小さいほど、適切なグループ化ができていると言えるからである。この場合の評価関数は、例えば、以下に例示する式1で設計されていてもよい。評価関数Wは、値が小さいほど、よりよい評価を示す。式1に例示する予測対象Yの誤差とは、部分予測対象の和である全体の誤差である。 Specifically, the evaluation unit 20 evaluates a set of groups using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. May be good. This is because it can be said that the smaller the error between the predicted value and the measured value, the more appropriate the grouping is. The evaluation function in this case may be designed by, for example, Equation 1 illustrated below. The smaller the value of the evaluation function W, the better the evaluation. The error of the prediction target Y exemplified in Equation 1 is the total error which is the sum of the partial prediction targets.

評価関数W=β・(予測対象Yの誤差) (式1) Evaluation function W = β · (Error of prediction target Y) (Equation 1)

また、評価部20は、上述する評価に加え、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。グループの数が少ないほど、生成されるモデルの数も少なくなるため、人間の解釈性を高めることができるからである。この場合の評価関数は、例えば、以下に例示する式2で設計されていてもよい。 Further, in addition to the above-mentioned evaluation, the evaluation unit 20 may evaluate the set of groups by using an evaluation function designed so that the smaller the number of groups constituting the set of groups, the better the evaluation. This is because the smaller the number of groups, the smaller the number of models generated, which can improve human interpretation. The evaluation function in this case may be designed by, for example, Equation 2 illustrated below.

評価関数W=α・モデル数+β・(予測対象Yの誤差) (式2) Evaluation function W = α · Number of models + β · (Error of prediction target Y) (Equation 2)

また、評価部20は、グループの集合を構成するグループの数の評価に代えて、各グループに対応する各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。非ゼロ係数を有する説明変数の個数が少ないほど、人間の解釈性を高めることができるからである。 Further, instead of evaluating the number of groups constituting the set of groups, the evaluation unit 20 evaluates better as the total number of explanatory variables having a non-zero coefficient included in each learning model corresponding to each group is smaller. A set of groups may be evaluated using an evaluation function designed to be. This is because the smaller the number of explanatory variables having a non-zero coefficient, the higher the human interpretability.

さらに、非ゼロ係数を有する説明変数の個数が少ないほど、モデルの複雑性を回避できる。モデルが複雑になるほど、そのモデルにうまく当てはまる評価データが見つかりやすいため、適切な評価ができないおそれがある。一方、モデルを単純化できるほど、上述するおそれを避けられるため、モデル評価時には精度が良いにもかかわらず、運用中に精度が悪くなるといった現象が起こることを抑制できる。この場合の評価関数は、例えば、以下に例示する式3で設計されていてもよい。 Moreover, the smaller the number of explanatory variables with nonzero coefficients, the less complex the model can be. The more complex the model, the easier it is to find evaluation data that fits the model well, which may lead to inadequate evaluation. On the other hand, the more simplistic the model is, the more the above-mentioned fear can be avoided. Therefore, it is possible to suppress the phenomenon that the accuracy deteriorates during operation even though the accuracy is good at the time of model evaluation. The evaluation function in this case may be designed by, for example, Equation 3 illustrated below.

評価関数W=α・(Σ各モデルの非ゼロ係数の数)+β・(予測対象Yの誤差)(式3) Evaluation function W = α · (number of non-zero coefficients of each Σ model) + β · (error of prediction target Y) (Equation 3)

制御部24は、集合生成部14がグループの集合を生成する際の動作を制御する。具体的には、制御部24は、個々の部分予測対象を、予め定めた数のグループに纏めるように集合生成部14を制御する。図10は、グループの集合を生成する処理の例を示す説明図である。 The control unit 24 controls the operation when the set generation unit 14 generates a set of groups. Specifically, the control unit 24 controls the set generation unit 14 so as to group individual partial prediction targets into a predetermined number of groups. FIG. 10 is an explanatory diagram showing an example of a process for generating a set of groups.

例えば、図2に例示する200の部分予測対象が存在する場合、制御部24は、2つの部分予測対象を纏めた100のグループの集合を生成するよう、集合生成部14を制御してもよい(図10におけるステップS1)。 For example, when there are 200 partial prediction targets illustrated in FIG. 2, the control unit 24 may control the set generation unit 14 so as to generate a set of 100 groups in which the two partial prediction targets are put together. (Step S1 in FIG. 10).

さらに、制御部24は、グループの集合を構成するグループの数が、すでに生成されたグループの集合を構成するグループの数と変わるように、集合生成部14を制御してもよい。このとき、制御部24は、個々の部分予測対象を対象としてグループ化するよう、集合生成部14を制御してもよいし、集合生成部14がすでに生成したグループをさらにグループに纏めることによりグループの集合を生成するよう制御してもよい。 Further, the control unit 24 may control the set generation unit 14 so that the number of groups constituting the set of groups is different from the number of groups constituting the set of already generated groups. At this time, the control unit 24 may control the set generation unit 14 so as to group the individual partial prediction targets, or the group already generated by the set generation unit 14 may be further grouped into groups. You may control to generate a set of.

集合生成部14がすでに生成したグループをさらにグループに纏める方法を、より具体的に説明する。まず、制御部24は、部分和モデル生成部16が生成した学習モデルについての推定誤差が算出されるように推定誤差算出部13を制御する。この制御に応じ、推定誤差算出部13は、部分和モデル生成部16が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。 A method of further grouping the groups already generated by the set generation unit 14 into groups will be described more specifically. First, the control unit 24 controls the estimation error calculation unit 13 so that the estimation error for the learning model generated by the partial sum model generation unit 16 is calculated. In response to this control, the estimation error calculation unit 13 calculates the estimation error when the value of the partial prediction target is estimated using the learning model generated by the partial sum model generation unit 16 along the time axis.

さらに、制御部24は、集合生成部14を制御する際に、部分和モデル生成部16により生成された学習モデルについての推定誤差を集合生成部14に入力する。この制御に応じ、集合生成部14は、部分和モデル生成部16により生成された学習モデルについての推定誤差を入力として、グループの集合を生成する。 Further, when the control unit 24 controls the set generation unit 14, the control unit 24 inputs the estimation error for the learning model generated by the partial sum model generation unit 16 to the set generation unit 14. In response to this control, the set generation unit 14 generates a set of groups by inputting the estimation error of the learning model generated by the partial sum model generation unit 16.

例えば、集合生成部14が、すでに2つの部分予測対象を纏めた100のグループの集合を生成している場合、制御部24は、この100のグループをさらにグループに纏めることにより、例えば、50のグループの集合を生成するように制御してもよい(図10におけるステップS2)。また、制御部24は、初めの200の部分予測対象を対象として、4つの部分予測対象を纏めた50のグループの集合を生成するよう、集合生成部14を制御してもよい(図10におけるステップS3)。 For example, when the set generation unit 14 has already generated a set of 100 groups in which two partial prediction targets are grouped together, the control unit 24 further groups the 100 groups into groups, for example, 50. It may be controlled to generate a set of groups (step S2 in FIG. 10). Further, the control unit 24 may control the set generation unit 14 so as to generate a set of 50 groups in which the four partial prediction targets are grouped with respect to the first 200 partial prediction targets (in FIG. 10). Step S3).

このように、制御部24は、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部14を制御する。制御部24の制御により複数の構成のグループの集合が生成されると、部分和モデル生成部16は、それぞれのグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。そして、予測対象算出部18は、生成された学習モデルを用いて算出されるグループの予測値から予測対象の値を算出し、評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する。 In this way, the control unit 24 controls the set generation unit 14 so as to generate a set of groups having a configuration different from the set of groups already generated. When a set of groups having a plurality of configurations is generated by the control of the control unit 24, the partial sum model generation unit 16 generates a learning model in which the sum of the partial prediction targets included in each group is the objective variable. Then, the prediction target calculation unit 18 calculates the value of the prediction target from the prediction value of the group calculated using the generated learning model, and the evaluation unit 20 calculates the calculated value of the prediction target and the actual result of the prediction target. Evaluate a set of groups based on the difference from the value.

出力部22は、評価部20の評価に応じてグループの集合を出力する。具体的には、出力部22は、より良い評価のグループの集合を出力する。このとき、出力部22は、グループの集合だけでなく、その集合を構成するグループごとに生成された学習モデルを出力してもよい。 The output unit 22 outputs a set of groups according to the evaluation of the evaluation unit 20. Specifically, the output unit 22 outputs a set of better evaluation groups. At this time, the output unit 22 may output not only the set of groups but also the learning model generated for each group constituting the set.

受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24とは、プログラム(情報分析プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array ))によって実現される。 The reception unit 10, the unit model generation unit 12, the estimation error calculation unit 13, the set generation unit 14, the partial sum model generation unit 16, the prediction target calculation unit 18, the evaluation unit 20, and the output unit 22. The control unit 24 is realized by a computer processor (for example, a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), an FPGA (field-programmable gate array)) that operates according to a program (information analysis program).

例えば、プログラムは、記憶部30に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、受付部10、単位モデル生成部12、推定誤差算出部13、集合生成部14、部分和モデル生成部16、予測対象算出部18、評価部20、出力部22および制御部24として動作してもよい。また、情報分析装置の機能がSaaS(Software as a Service )形式で提供されてもよい。 For example, the program is stored in the storage unit 30, the processor reads the program, and according to the program, the reception unit 10, the unit model generation unit 12, the estimation error calculation unit 13, the set generation unit 14, and the partial sum model generation unit 16. , The prediction target calculation unit 18, the evaluation unit 20, the output unit 22, and the control unit 24 may operate. Further, the function of the information analyzer may be provided in the SAAS (Software as a Service) format.

受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。 The reception unit 10, the unit model generation unit 12, the estimation error calculation unit 13, the set generation unit 14, the partial sum model generation unit 16, the prediction target calculation unit 18, the evaluation unit 20, and the output unit 22. Each of the control units 24 may be realized by dedicated hardware. Further, a part or all of each component of each device may be realized by a general-purpose or dedicated circuitry, a processor, or a combination thereof. These may be composed of a single chip or may be composed of a plurality of chips connected via a bus. A part or all of each component of each device may be realized by a combination of the above-mentioned circuit or the like and a program.

また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。 Further, when a part or all of each component of each device is realized by a plurality of information processing devices and circuits, the plurality of information processing devices and circuits may be centrally arranged or distributed. May be done. For example, the information processing device, the circuit, and the like may be realized as a form in which each is connected via a communication network, such as a client-and-server system and a cloud computing system.

次に、本実施形態の情報分析装置の動作を説明する。図11は、本実施形態の情報分析装置の動作例を示すフローチャートである。 Next, the operation of the information analyzer of the present embodiment will be described. FIG. 11 is a flowchart showing an operation example of the information analyzer of the present embodiment.

単位モデル生成部12は、部分予測対象単位に学習モデルを生成する(ステップS11)。予測対象算出部18は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する(ステップS12)。そして、評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいて、グループの集合を評価する(ステップS13)。ここでは、評価部20は、個々の部分予測対象について学習モデルを生成した場合について評価する。 The unit model generation unit 12 generates a learning model for the partial prediction target unit (step S11). The prediction target calculation unit 18 calculates the prediction target value from the prediction value of the group calculated using the learning model (step S12). Then, the evaluation unit 20 evaluates the set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target (step S13). Here, the evaluation unit 20 evaluates the case where a learning model is generated for each partial prediction target.

制御部24は、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するか否か判断する(ステップS14)。グループの集合を生成すると判断した場合(ステップS14におけるYes)、制御部24は、推定誤差算出部13を制御することにより、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する(ステップS21)。そして、制御部24は、集合生成部14を制御することにより、部分予測対象を複数のグループに纏めてグループの集合を生成する(ステップS15)。具体的には、集合生成部14は、算出された推定誤差の時間軸上における類似性に基づいて部分予測対象をグループに纏めることにより、グループの集合を生成する。 The control unit 24 determines whether or not to generate a set of groups having a configuration different from the set of groups already generated (step S14). When it is determined to generate a set of groups (Yes in step S14), the control unit 24 controls the estimation error calculation unit 13 to estimate the estimation error when the value of the partial prediction target is estimated using the learning model. Calculate along the time axis (step S21). Then, the control unit 24 controls the set generation unit 14 to group the partial prediction targets into a plurality of groups and generate a set of groups (step S15). Specifically, the set generation unit 14 generates a set of groups by grouping the partial prediction targets into groups based on the similarity of the calculated estimation errors on the time axis.

部分和モデル生成部16は、生成されたグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する(ステップS16)。学習モデルが生成されると、予測対象算出部18が予測対象の値を算出し、評価部20がグループの集合を評価するステップS12およびステップS13の処理が繰り返される。 The partial sum model generation unit 16 generates a learning model in which the sum of the partial prediction targets included in the generated group is the objective variable (step S16). When the learning model is generated, the prediction target calculation unit 18 calculates the value of the prediction target, and the evaluation unit 20 repeats the processes of steps S12 and S13 for evaluating the set of groups.

一方、ステップS14において、グループの集合を生成しないと判断した場合(ステップS14におけるNo)、出力部22は、最も評価の良いグループの集合を出力する(ステップS17)。 On the other hand, when it is determined in step S14 that the set of groups is not generated (No in step S14), the output unit 22 outputs the set of the group with the best evaluation (step S17).

以上のように、本実施形態では、単位モデル生成部12が、部分予測対象ごとに学習モデルを生成し、推定誤差算出部13が、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。また、集合生成部14が、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。そして、部分和モデル生成部16が、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、予測対象算出部18が、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。 As described above, in the present embodiment, the unit model generation unit 12 generates a learning model for each partial prediction target, and the estimation error calculation unit 13 estimates the value of the partial prediction target using the learning model. The estimation error is calculated along the time axis. Further, the set generation unit 14 takes the estimation error as an input and corresponds to one learning model based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set of groups is generated by grouping the partial prediction target and the partial prediction target corresponding to other learning models into a group. Then, the partial sum model generation unit 16 generates a learning model in which the sum of the partial prediction targets included in the group is the objective variable, and the prediction target calculation unit 18 is based on the prediction value of the group calculated using the learning model. Calculate the value to be predicted.

よって、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。 Therefore, even if each of the plurality of prediction targets has different properties, when the desired prediction target is expressed by the sum of the plurality of prediction targets, the prediction accuracy of the desired prediction target can be determined. It is possible to realize a grouping of forecast targets that improves.

すなわち、本実施形態では、時間軸に対する推定誤差の傾向が類似する部分予測対象をグループ化して学習モデルが生成される。このように傾向の類似する部分予測対象をまとめることで、大数の法則により推定誤差が小さくなり、結果、予測精度をより向上させることが可能になる。 That is, in the present embodiment, a learning model is generated by grouping partial prediction targets having a similar tendency of estimation error with respect to the time axis. By grouping partial prediction targets with similar tendencies in this way, the estimation error is reduced by the law of large numbers, and as a result, the prediction accuracy can be further improved.

次に、上記実施形態の変形例を説明する。上記実施形態では、制御部24が異なる構成のグループの集合を生成するように集合生成部14を制御することで、生成されたグループをさらに纏めて順次グループ化する方法を説明した。 Next, a modified example of the above embodiment will be described. In the above embodiment, a method has been described in which the set generation unit 14 is controlled so that the control unit 24 generates a set of groups having different configurations, so that the generated groups are further grouped together and sequentially grouped.

一方、グループ化する粒度を変更して評価を行うことも効果的である。例えば、k−meansによるグルーピングを、kの値を変更しつつ何度も行うことが考えられる。また、学習処理には多くの時間がかかることが想定されるため、複数のサーバを並列に動作させて、評価を行うことも好ましい。 On the other hand, it is also effective to change the grouping granularity for evaluation. For example, it is conceivable to perform grouping by k-means many times while changing the value of k. Further, since it is expected that the learning process will take a lot of time, it is also preferable to operate a plurality of servers in parallel for evaluation.

例えば、部分予測対象が200存在するとする。このとき、k=50のグルーピング処理とk=100のグルーピング処理とを、別のサーバが並列に実行し、それぞれのグループの集合に対して、学習処理、予測処理および評価処理を行ったうえで、最も評価の良いグループを出力してもよい。 For example, suppose there are 200 partial prediction targets. At this time, another server executes the grouping process of k = 50 and the grouping process of k = 100 in parallel, and after performing the learning process, the prediction process, and the evaluation process on the set of each group. , You may output the group with the best evaluation.

図12は、本発明による情報分析システムの構成例を示すブロック図である。図12に例示する情報分析システム200は、受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14aと、部分和モデル生成部16aと、予測対象算出部18aと、評価部20aと、出力部22と、記憶部30とを備えている。受付部10、単位モデル生成部12、推定誤差算出部13、出力部22および記憶部30の構成は、情報分析装置100が備える構成と同様である。 FIG. 12 is a block diagram showing a configuration example of the information analysis system according to the present invention. The information analysis system 200 illustrated in FIG. 12 includes a reception unit 10, a unit model generation unit 12, an estimation error calculation unit 13, a set generation unit 14a, a partial sum model generation unit 16a, and a prediction target calculation unit 18a. , The evaluation unit 20a, the output unit 22, and the storage unit 30 are provided. The configuration of the reception unit 10, the unit model generation unit 12, the estimation error calculation unit 13, the output unit 22, and the storage unit 30 is the same as the configuration included in the information analysis device 100.

本変形例の集合生成部14aも、集合生成部14と同様、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、部分予測対象を複数のグループに纏めることにより、グループの集合を生成する。具体的には、集合生成部14aは、推定誤差算出部13が算出した推定誤差を入力する。そして、集合生成部14aは、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する。なお、集合生成部14aがグループの集合を生成する方法は、情報分析装置100における集合生成部14がグループの集合を生成する方法と同様である。 Similar to the set generation unit 14, the set generation unit 14a of this modification also sets the partial prediction target based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set of groups is generated by grouping them into multiple groups. Specifically, the set generation unit 14a inputs the estimation error calculated by the estimation error calculation unit 13. Then, the set generation unit 14a groups the partial prediction target corresponding to one learning model and the partial prediction target corresponding to the other learning model into a group, so that the configuration of the set of the groups is different from that of the first group. Generate a set and a second group of sets, respectively. The method in which the set generation unit 14a generates a set of groups is the same as the method in which the set generation unit 14 in the information analyzer 100 generates a set of groups.

なお、図12に示す例では集合生成部14aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに集合生成部14aを備えていてもよい。また、集合生成部14aが生成するグループの集合の種類は、2種類に限定されず、3種類以上であってもよい。 In the example shown in FIG. 12, only one set generation unit 14a is shown, but when processing is executed by a plurality of servers, the information analysis system 200 may include the set generation unit 14a for each server. Good. Further, the type of the set of the group generated by the set generation unit 14a is not limited to two types, and may be three or more types.

部分和モデル生成部16aは、第1のグループの集合と第2のグループの集合のそれぞれに対して、そのグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。部分和モデル生成部16aが学習モデルを生成する方法は、情報分析装置100における部分和モデル生成部16が学習モデルを生成する方法と同様である。 The partial sum model generation unit 16a generates a learning model for each of the set of the first group and the set of the second group, with the sum of the partial prediction targets included in the group as the objective variable. The method in which the partial sum model generation unit 16a generates the learning model is the same as the method in which the partial sum model generation unit 16 in the information analyzer 100 generates the learning model.

なお、図12に示す例では部分和モデル生成部16aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに部分和モデル生成部16aを備えていてもよい。 In the example shown in FIG. 12, only one partial sum model generation unit 16a is shown, but when processing is executed by a plurality of servers, the information analysis system 200 uses the partial sum model generation unit 16a for each server. You may have it.

予測対象算出部18aは、第1のグループの集合と第2のグループの集合とのそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。予測対象算出部18aが予測対象の値を算出する方法は、情報分析装置100における予測対象算出部18が予測対象の値を算出する方法と同様である。 The prediction target calculation unit 18a calculates the value of the prediction target from the prediction value of the group calculated by using the learning model for each of the set of the first group and the set of the second group. The method in which the prediction target calculation unit 18a calculates the value of the prediction target is the same as the method in which the prediction target calculation unit 18 in the information analyzer 100 calculates the value of the prediction target.

なお、図12に示す例では予測対象算出部18aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに予測対象算出部18aを備えていてもよい。 In the example shown in FIG. 12, only one prediction target calculation unit 18a is shown, but when processing is executed by a plurality of servers, the information analysis system 200 includes a prediction target calculation unit 18a for each server. You may.

評価部20aは、第1のグループの集合と第2のグループの集合のそれぞれに対して、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する。評価部20aがグループの集合を評価する方法は、情報分析装置100における評価部20がグループの集合を評価する方法と同様である。 The evaluation unit 20a evaluates the set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target for each of the set of the first group and the set of the second group. The method in which the evaluation unit 20a evaluates the group set is the same as the method in which the evaluation unit 20 in the information analyzer 100 evaluates the group set.

なお、図12に示す例では評価部20aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに評価部20aを備えていてもよい。 In the example shown in FIG. 12, only one evaluation unit 20a is shown, but when processing is executed by a plurality of servers, the information analysis system 200 may include an evaluation unit 20a for each server.

以上のように、本変形例では、集合生成部14aが、部分予測対象を複数のグループに纏めることにより、グループの集合の構成が互いに異なる複数のグループ(第1のグループの集合と第2のグループの集合)をそれぞれ生成する。そのため、上記実施形態の効果に加え、より適切に部分予測対象をグループ化できる。 As described above, in the present modification, the set generation unit 14a groups the partial prediction targets into a plurality of groups, so that the configuration of the group sets is different from each other (the first group set and the second group). A set of groups) is generated respectively. Therefore, in addition to the effects of the above-described embodiment, the partial prediction targets can be grouped more appropriately.

次に、本発明の概要を説明する。図13は、本発明による情報分析装置の概要を示すブロック図である。本発明による情報分析装置80は、予測対象(例えば、予測対象Y)が、複数の部分予測対象(例えば、部分予測対象y,y,…,y)の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部81(例えば、単位モデル生成部12)と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部82(例えば、推定誤差算出部13)と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部83(例えば、集合生成部14)と、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部84(例えば、部分和モデル生成部16)と、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部85(例えば、予測対象算出部18)とを備えている。Next, the outline of the present invention will be described. FIG. 13 is a block diagram showing an outline of the information analyzer according to the present invention. In the information analyzer 80 according to the present invention, when the prediction target (for example, the prediction target Y) is represented by the sum of a plurality of partial prediction targets (for example, partial prediction targets y 1 , y 2 , ..., Y n). , The unit model generation unit 81 (for example, the unit model generation unit 12) that generates a learning model for each partial prediction target, and the estimation error when the value of the partial prediction target is estimated using the training model along the time axis. With the estimation error calculation unit 82 (for example, estimation error calculation unit 13) to be calculated and the estimation error as input, the similarity between the estimation error for one learning model and the estimation error for another learning model on the time axis Based on this, a set generation unit 83 (for example, a set generation unit 14) that generates a set of groups by grouping a partial prediction target corresponding to one learning model and a partial prediction target corresponding to another learning model into a group. , Partial sum model generation unit 84 (for example, partial sum model generation unit 16) that generates a learning model with the sum of the partial prediction targets included in the group as the objective variable, and the predicted value of the group calculated using the learning model. It is provided with a prediction target calculation unit 85 (for example, a prediction target calculation unit 18) that calculates the value of the prediction target from the above.

そのような構成により、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。 With such a configuration, even if each of the plurality of prediction targets has different properties from each other, the desired prediction target is represented by the sum of the plurality of prediction targets. It is possible to realize a grouping of prediction targets that improves the prediction accuracy of.

また、情報分析装置80は、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部(例えば、評価部20)と、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部83を制御する制御部(例えば、制御部24)とを備えていてもよい。そして、集合生成部83は、制御部の制御に応じてグループの集合を生成し、評価部は、生成された各グループの集合を評価してもよい。 Further, the information analyzer 80 includes an evaluation unit (for example, an evaluation unit 20) that evaluates a set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target, and the already generated group. A control unit (for example, a control unit 24) that controls the set generation unit 83 so as to generate a set of groups having a configuration different from that of the set may be provided. Then, the set generation unit 83 may generate a set of groups according to the control of the control unit, and the evaluation unit may evaluate the set of each generated group.

さらに、制御部は、部分和モデル生成部84が生成した学習モデルについての推定誤差が算出されるように推定誤差算出部82を制御してもよい。このとき、推定誤差算出部82は、部分和モデル生成部84が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。また、制御部は、集合生成部83を制御する際に、部分和モデル生成部84が生成した学習モデルについての推定誤差を、集合生成部83に入力してもよい。このとき、集合生成部83は、部分和モデル生成部84が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する。そのような構成により、グループの集合を順次少なくしていくことが可能になる。 Further, the control unit may control the estimation error calculation unit 82 so that the estimation error for the learning model generated by the partial sum model generation unit 84 is calculated. At this time, the estimation error calculation unit 82 calculates the estimation error when the value of the partial prediction target is estimated using the learning model generated by the partial sum model generation unit 84 along the time axis. Further, when controlling the set generation unit 83, the control unit may input the estimation error of the learning model generated by the partial sum model generation unit 84 into the set generation unit 83. At this time, the set generation unit 83 generates a set of groups by inputting the estimation error of the learning model generated by the partial sum model generation unit 84. With such a configuration, it becomes possible to gradually reduce the set of groups.

また、情報分析装置80は、評価部の評価に応じてグループの集合を出力する出力部(例えば、出力部22)を備えていてもよい。このとき、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数(例えば、上記式1に示す評価関数W)を用いてグループの集合を評価し、出力部は、評価がより良いグループの集合を出力してもよい。 Further, the information analyzer 80 may include an output unit (for example, an output unit 22) that outputs a set of groups according to the evaluation of the evaluation unit. At this time, the evaluation unit uses an evaluation function (for example, the evaluation function W shown in the above equation 1) designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. It may be used to evaluate a set of groups and the output unit may output a set of groups with a better evaluation.

また、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数(例えば、上記式2に示す評価関数W)を用いてグループの集合を評価してもよい。 Further, in the evaluation unit, the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and the smaller the number of groups constituting the group set, the better the evaluation. An evaluation function designed as described above (for example, the evaluation function W shown in the above equation 2) may be used to evaluate a set of groups.

また、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、各グループに対応する各学習モデルについて、各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数(例えば、上記式3に示す評価関数W)を用いてグループの集合を評価してもよい。 In addition, the evaluation unit is included in each learning model so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and each learning model corresponding to each group. A set of groups may be evaluated using an evaluation function (for example, the evaluation function W shown in Equation 3 above) designed so that the smaller the total number of explanatory variables having a non-zero coefficient, the better the evaluation.

図14は、本発明による情報分析システムの概要を示すブロック図である。本発明による情報分析システム90は、予測対象(例えば、予測対象Y)が、複数の部分予測対象(例えば、部分予測対象y,y,…,y)の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部91(例えば、単位モデル生成部12)と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部92(例えば、推定誤差算出部13)と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部93(例えば、集合生成部14a)と、第1のグループの集合と第2のグループの集合とのそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部94(例えば、部分和モデル生成部16a)と、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部95(例えば、予測対象算出部18a)と、第1のグループの集合と第2のグループの集合とのそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部96(例えば、評価部20a)とを備えている。FIG. 14 is a block diagram showing an outline of the information analysis system according to the present invention. In the information analysis system 90 according to the present invention, when the prediction target (for example, the prediction target Y) is represented by the sum of a plurality of partial prediction targets (for example, partial prediction targets y 1 , y 2 , ..., Y n). , The unit model generation unit 91 (for example, the unit model generation unit 12) that generates a learning model for each partial prediction target, and the estimation error when the value of the partial prediction target is estimated using the training model along the time axis. With the estimation error calculation unit 92 (for example, estimation error calculation unit 13) to be calculated and the estimation error as input, the similarity between the estimation error for one learning model and the estimation error for another learning model on the time axis Based on this, by grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into a group, the composition of the group set is different from that of the first group set and the second group set. For each of the set generation unit 93 (for example, the set generation unit 14a) that generates a set of groups, and the set of the first group and the set of the second group, the partial prediction targets included in the group. A learning model for each of the partial sum model generation unit 94 (for example, the partial sum model generation unit 16a) that generates a learning model with the sum as the objective variable, and the set of the first group and the set of the second group. The prediction target calculation unit 95 (for example, the prediction target calculation unit 18a) that calculates the value of the prediction target from the prediction value of the group calculated using the above, and the set of the first group and the set of the second group, respectively. On the other hand, an evaluation unit 96 (for example, an evaluation unit 20a) that evaluates a set of groups based on the difference between the value of the prediction target and the actual value of the prediction target is provided.

そのような構成によっても、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。 Even with such a configuration, even if each of the plurality of prediction targets has different properties from each other, the desired prediction target is expressed by the sum of the plurality of prediction targets. It is possible to realize grouping of prediction targets so as to improve the prediction accuracy of the targets.

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。 Some or all of the above embodiments may also be described, but not limited to:

(付記1)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部とを備えたことを特徴とする情報分析装置。 (Appendix 1) When the prediction target is represented by the sum of a plurality of partial prediction targets, a unit model generation unit that generates a learning model for each partial prediction target and the partial prediction target using the learning model. The time axis of the estimation error calculation unit that calculates the estimation error when the value is estimated along the time axis, and the estimation error of one learning model and the estimation error of the other learning model by inputting the estimation error. Based on the similarity in the above, the set generation unit that generates a set of groups by grouping the partial prediction target corresponding to the one learning model and the partial prediction target corresponding to the other learning model into a group, and the above-mentioned A prediction target that calculates the value of the prediction target from the partial sum model generation unit that generates a learning model with the sum of the partial prediction targets included in the group as the objective variable and the prediction value of the group calculated using the learning model. An information analyzer characterized by having a calculation unit.

(付記2)算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部と、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部を制御する制御部とを備え、集合生成部は、前記制御部の制御に応じてグループの集合を生成し、前記評価部は、生成された各グループの集合を評価する付記1記載の情報分析装置。 (Appendix 2) An evaluation unit that evaluates a set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target, and a set of groups having a structure different from the already generated set of groups are generated. A control unit that controls the set generation unit is provided, the set generation unit generates a set of groups according to the control of the control unit, and the evaluation unit evaluates the set of each generated group. The information analyzer according to Appendix 1.

(付記3)制御部は、部分和モデル生成部が生成した学習モデルについての推定誤差が算出されるように前記推定誤差算出部を制御し、推定誤差算出部は、部分和モデル生成部が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、制御部は、集合生成部を制御する際に、部分和モデル生成部が生成した学習モデルについての推定誤差を、集合生成部に入力し、集合生成部は、部分和モデル生成部が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する付記2に記載の情報分析装置。 (Appendix 3) The control unit controls the estimation error calculation unit so that the estimation error for the learning model generated by the partial sum model generation unit is calculated, and the estimation error calculation unit is generated by the partial sum model generation unit. The estimation error when the value of the partial prediction target is estimated using the training model is calculated along the time axis, and the control unit controls the set generation unit, and the control unit generates the learning model generated by the partial sum model generation unit. The information analyzer according to Appendix 2, wherein the estimation error of the above is input to the set generation unit, and the set generation unit generates a set of groups by inputting the estimation error of the learning model generated by the partial sum model generation unit.

(付記4)評価部の評価に応じてグループの集合を出力する出力部を備え、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記出力部は、前記評価がより良いグループの集合を出力する付記2または付記3記載の情報分析装置。 (Appendix 4) An output unit that outputs a set of groups according to the evaluation of the evaluation unit is provided, and the evaluation unit has a better evaluation as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. The information analyzer according to Appendix 2 or Appendix 3, which evaluates a set of groups using the evaluation function designed in (1) and outputs a set of groups having a better evaluation.

(付記5)評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する付記4記載の情報分析装置。 (Appendix 5) In the evaluation section, the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and the smaller the number of groups constituting the group set, the better the evaluation. The information analyzer according to Appendix 4, which evaluates a set of groups using an evaluation function designed to be.

(付記6)評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、各グループに対応する各学習モデルについて、当該各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する付記4記載の情報分析装置。 (Appendix 6) The evaluation unit evaluates each learning model corresponding to each group so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. The information analyzer according to Appendix 4, which evaluates a set of groups using an evaluation function designed so that the smaller the total number of explanatory variables having a non-zero coefficient contained in is, the better the evaluation is.

(付記7)推定誤差算出部は、各部分予測対象の推定誤差を標準化し、集合生成部は、標準化された推定誤差を入力としてグループの集合を生成する付記1から付記6のうちのいずれか1つに記載の情報分析装置。 (Appendix 7) The estimation error calculation unit standardizes the estimation error of each partial prediction target, and the set generation unit generates a set of groups by inputting the standardized estimation error. The information analyzer described in one.

(付記8)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価部とを備えたことを特徴とする情報分析システム。 (Appendix 8) When the prediction target is represented by the sum of a plurality of partial prediction targets, a unit model generation unit that generates a learning model for each partial prediction target and the partial prediction target using the learning model. The time axis of the estimation error calculation unit that calculates the estimation error when the value is estimated along the time axis, and the estimation error of one learning model and the estimation error of the other learning model by inputting the estimation error. Based on the similarity in the above, by grouping the partial prediction target corresponding to the one learning model and the partial prediction target corresponding to the other learning model into a group, the composition of the set of the groups is different from each other. Partial prediction included in the group for each of the set generator that generates the set of the first group and the set of the second group, and the set of the first group and the set of the second group, respectively. Calculated using the learning model for each of the partial sum model generation unit that generates a learning model with the sum of the objects as the objective variable, the set of the first group, and the set of the second group. For each of the prediction target calculation unit that calculates the value of the prediction target from the prediction value of the group, the set of the first group and the set of the second group, the value of the prediction target and the value of the prediction target An information analysis system including an evaluation unit that evaluates a set of the groups based on a difference from an actual value.

(付記9)評価部の評価に応じてグループの集合を出力する出力部を備え、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記出力部は、前記評価がより良いグループの集合を出力する付記8記載の情報分析システム。 (Appendix 9) An output unit that outputs a set of groups according to the evaluation of the evaluation unit is provided, and the evaluation unit has a better evaluation as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. The information analysis system according to Appendix 8, which evaluates a set of groups using the evaluation function designed in 1 and outputs a set of groups having a better evaluation.

(付記10)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成し、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出することを特徴とする情報分析方法。 (Appendix 10) When the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each of the partial prediction targets, and the value of the partial prediction target is estimated using the learning model. Is calculated along the time axis, and the estimation error is used as an input, and the estimation error for one learning model and the estimation error for another learning model are based on the similarity on the time axis. A set of groups is generated by grouping the partial prediction target corresponding to the learning model of the above and the partial prediction target corresponding to the other learning model into a group, and the sum of the partial prediction targets included in the group is used as the objective variable. An information analysis method characterized in that a learning model is generated and the value of the prediction target is calculated from the prediction value of a group calculated using the learning model.

(付記11)すでに生成されたグループの集合とは異なる構成のグループの集合を1つ以上生成し、算出された予測対象の値と予測対象の実績値との差分に基づいて各グループの集合を評価する付記10記載の情報分析方法。 (Appendix 11) One or more sets of groups having a configuration different from the already generated set of groups are generated, and the set of each group is created based on the difference between the calculated value of the prediction target and the actual value of the prediction target. The information analysis method according to Appendix 10 to be evaluated.

(付記12)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成し、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価することを特徴とする情報分析方法。 (Appendix 12) When the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each of the partial prediction targets, and the value of the partial prediction target is estimated using the learning model. Is calculated along the time axis, and the estimation error is used as an input, and the estimation error for one learning model and the estimation error for another learning model are based on the similarity on the time axis. By grouping the partial prediction target corresponding to the training model of the above and the partial prediction target corresponding to the other learning model into a group, the composition of the set of the groups is different from that of the first group and the second group. A set is generated, and a learning model in which the sum of the partial prediction targets included in the group is the objective variable is generated for each of the set of the first group and the set of the second group. For each of the set of the first group and the set of the second group, the value of the prediction target is calculated from the predicted value of the group calculated by using the learning model, and the value of the prediction target is calculated for each of the first group. An information analysis method for evaluating each of the set and the set of the second group based on the difference between the value of the prediction target and the actual value of the prediction target.

(付記13)算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記評価がより良いグループの集合を出力する付記12記載の情報分析方法。 (Appendix 13) A group with a better evaluation is evaluated by using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. The information analysis method according to Appendix 12, which outputs a set of.

(付記14)コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理を実行させるための情報分析プログラム。 (Appendix 14) When the prediction target is represented by the sum of a plurality of partial prediction targets on a computer, a unit model generation process that generates a learning model for each partial prediction target, and the partial prediction using the learning model. Estimated error calculation processing that calculates the estimated error when estimating the target value along the time axis, the time between the estimated error for one learning model and the estimated error for the other learning model using the estimated error as an input A set generation process for generating a set of groups by grouping a partial prediction target corresponding to the one learning model and a partial prediction target corresponding to the other learning model based on the similarity on the axis. Partial sum model generation processing that generates a learning model with the sum of the partial prediction targets included in the group as the objective variable, and prediction that calculates the value of the prediction target from the prediction value of the group calculated using the learning model. An information analysis program for executing the target calculation process.

(付記15)コンピュータに、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価処理、および、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成処理を制御する制御処理を実行させ、集合生成処理で、前記制御処理による制御に応じてグループの集合を生成させ、前記評価処理で、生成された各グループの集合を評価させる付記14記載の情報分析プログラム。 (Appendix 15) An evaluation process in which a computer evaluates a set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target, and a group having a configuration different from the already generated set of groups. A control process for controlling the set generation process is executed so as to generate a set of, a set of groups is generated according to the control by the control process in the set generation process, and each group generated in the evaluation process is generated. The information analysis program according to Appendix 14 for evaluating a set.

(付記16)コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理、および、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価処理を実行させるための情報分析プログラム。 (Appendix 16) When the prediction target is represented by the sum of a plurality of partial prediction targets on a computer, a unit model generation process that generates a learning model for each partial prediction target, and the partial prediction using the learning model. Estimated error calculation processing that calculates the estimated error when estimating the target value along the time axis, the time between the estimated error for one learning model and the estimated error for the other learning model using the estimated error as an input By grouping the partial prediction target corresponding to the one learning model and the partial prediction target corresponding to the other learning model into groups based on the similarity on the axis, the composition of the set of the groups is different from each other. A set generation process for generating a set of one group and a set of a second group, respectively, and the partial prediction included in the group for each of the set of the first group and the set of the second group. A partial sum model generation process that generates a learning model with the sum of the objects as the objective variable, a group calculated using the learning model for each of the first group set and the second group set. For each of the prediction target calculation process for calculating the value of the prediction target from the prediction value of the first group and the set of the first group and the set of the second group, the value of the prediction target and the value of the prediction target An information analysis program for executing an evaluation process that evaluates a set of the groups based on the difference from the actual value.

(付記17)コンピュータに、評価処理での評価に応じてグループの集合を出力する出力処理を実行させ、評価処理で、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価させ、前記出力処理で、前記評価がより良いグループの集合を出力させる付記16記載の情報分析プログラム。 (Appendix 17) The computer is made to execute an output process that outputs a set of groups according to the evaluation in the evaluation process, and the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target in the evaluation process, the smaller the difference. The information analysis program according to Appendix 16, wherein a set of groups is evaluated by using an evaluation function designed to give a good evaluation, and a set of groups having a better evaluation is output by the output process.

10 受付部
12 単位モデル生成部
13 推定誤差算出部
14,14a 集合生成部
16,16a 部分和モデル生成部
18,18a 予測対象算出部
20,20a 評価部
22 出力部
24 制御部
30 記憶部
100 情報分析装置
200 情報分析システム
10 Reception unit 12 Unit model generation unit 13 Estimation error calculation unit 14, 14a Set generation unit 16, 16a Partial sum model generation unit 18, 18a Prediction target calculation unit 20, 20a Evaluation unit 22 Output unit 24 Control unit 30 Storage unit 100 Information Analyzer 200 Information analysis system

Claims (10)

予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部とを備えた
ことを特徴とする情報分析装置。
When the prediction target is represented by the sum of multiple partial prediction targets,
A unit model generation unit that generates a learning model for each partial prediction target,
An estimation error calculation unit that calculates the estimation error when the value of the partial prediction target is estimated using the learning model along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set generator that generates a set of groups by grouping the partial prediction targets corresponding to the learning model of
A partial sum model generation unit that generates a learning model with the sum of the partial prediction targets included in the group as the objective variable, and
An information analysis device including a prediction target calculation unit that calculates a prediction target value from a group prediction value calculated using the learning model.
算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部と、
すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部を制御する制御部とを備え、
集合生成部は、前記制御部の制御に応じてグループの集合を生成し、
前記評価部は、生成された各グループの集合を評価する
請求項1記載の情報分析装置。
An evaluation unit that evaluates a set of groups based on the difference between the calculated value of the prediction target and the actual value of the prediction target,
It is provided with a control unit that controls a set generation unit so as to generate a set of groups having a configuration different from that of a group that has already been generated.
The set generation unit generates a set of groups according to the control of the control unit.
The information analyzer according to claim 1, wherein the evaluation unit evaluates a set of each generated group.
制御部は、部分和モデル生成部が生成した学習モデルについての推定誤差が算出されるように前記推定誤差算出部を制御し、
推定誤差算出部は、部分和モデル生成部が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
制御部は、集合生成部を制御する際に、部分和モデル生成部が生成した学習モデルについての推定誤差を、集合生成部に入力し、
集合生成部は、部分和モデル生成部が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する
請求項2に記載の情報分析装置。
The control unit controls the estimation error calculation unit so that the estimation error for the learning model generated by the partial sum model generation unit is calculated.
The estimation error calculation unit calculates the estimation error when the value of the partial prediction target is estimated using the learning model generated by the partial sum model generation unit along the time axis.
When controlling the set generation unit, the control unit inputs the estimation error for the learning model generated by the partial sum model generation unit into the set generation unit.
The information analyzer according to claim 2, wherein the set generation unit generates a set of groups by inputting an estimation error of the learning model generated by the partial sum model generation unit.
評価部の評価に応じてグループの集合を出力する出力部を備え、
評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、
前記出力部は、前記評価がより良いグループの集合を出力する
請求項2または請求項3記載の情報分析装置。
Equipped with an output unit that outputs a set of groups according to the evaluation of the evaluation unit
The evaluation unit evaluates a set of groups using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation.
The information analyzer according to claim 2 or 3, wherein the output unit outputs a set of groups having a better evaluation.
評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する
請求項4記載の情報分析装置。
In the evaluation section, the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and the smaller the number of groups that make up the set of groups, the better the evaluation. The information analyzer according to claim 4, which evaluates a set of groups using a designed evaluation function.
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価部とを備えた
ことを特徴とする情報分析システム。
When the prediction target is represented by the sum of multiple partial prediction targets,
A unit model generation unit that generates a learning model for each partial prediction target,
An estimation error calculation unit that calculates the estimation error when the value of the partial prediction target is estimated using the learning model along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. By grouping the partial prediction targets corresponding to the learning model of, the set generator that generates the set of the first group and the set of the second group, which have different configurations of the set of the groups, and a set generation unit.
For each of the set of the first group and the set of the second group, a partial sum model generation unit that generates a learning model with the sum of the partial prediction targets included in the group as an objective variable, and
For each of the set of the first group and the set of the second group, a prediction target calculation unit that calculates the value of the prediction target from the prediction value of the group calculated by using the learning model, and a prediction target calculation unit.
For each of the set of the first group and the set of the second group, an evaluation unit that evaluates the set of the group based on the difference between the value of the prediction target and the actual value of the prediction target. An information analysis system characterized by being equipped.
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成し、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する
ことを特徴とする情報分析方法。
When the prediction target is represented by the sum of multiple partial prediction targets,
A learning model is generated for each of the partial prediction targets,
The estimation error when the value of the partial prediction target is estimated using the learning model is calculated along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set of groups is generated by grouping the partial prediction targets corresponding to the learning model of
A learning model with the sum of the partial prediction targets included in the group as the objective variable is generated.
An information analysis method characterized in that the value of the prediction target is calculated from the prediction value of the group calculated using the learning model.
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成し、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する
ことを特徴とする情報分析方法。
When the prediction target is represented by the sum of multiple partial prediction targets,
A learning model is generated for each of the partial prediction targets,
The estimation error when the value of the partial prediction target is estimated using the learning model is calculated along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. By grouping the partial prediction targets corresponding to the learning model of, a first group set and a second group set having different configurations of the group sets are generated.
For each of the set of the first group and the set of the second group, a learning model in which the sum of the partial prediction targets included in the group is the objective variable is generated.
For each of the set of the first group and the set of the second group, the value of the prediction target is calculated from the prediction value of the group calculated by using the learning model.
For each of the set of the first group and the set of the second group, the set of the group is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target. Information analysis method to do.
コンピュータに、
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理
を実行させるための情報分析プログラム。
On the computer
When the prediction target is represented by the sum of multiple partial prediction targets,
Unit model generation process that generates a learning model for each partial prediction target,
Estimation error calculation processing that calculates the estimation error when the value of the partial prediction target is estimated using the learning model along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set generation process that generates a set of groups by grouping the partial prediction targets corresponding to the learning model of
A partial sum model generation process that generates a learning model with the sum of the partial prediction targets included in the group as the objective variable, and
An information analysis program for executing a prediction target calculation process that calculates the value of the prediction target from the prediction value of the group calculated using the learning model.
コンピュータに、
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理、および、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価処理
を実行させるための情報分析プログラム。
On the computer
When the prediction target is represented by the sum of multiple partial prediction targets,
Unit model generation process that generates a learning model for each partial prediction target,
Estimation error calculation processing that calculates the estimation error when the value of the partial prediction target is estimated using the learning model along the time axis.
Using the estimation error as an input, the partial prediction target corresponding to the one learning model and the other are based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. A set generation process that generates a set of a first group and a set of a second group, which have different configurations of the sets of the groups, by grouping the partial prediction targets corresponding to the learning model of.
A partial sum model generation process for generating a learning model with the sum of the partial prediction targets included in the group as an objective variable for each of the set of the first group and the set of the second group.
For each of the set of the first group and the set of the second group, a prediction target calculation process for calculating the value of the prediction target from the prediction value of the group calculated using the learning model, and a prediction target calculation process.
For each of the first group set and the second group set, an evaluation process is executed to evaluate the set of the group based on the difference between the value of the prediction target and the actual value of the prediction target. Information analysis program to let you.
JP2019541555A 2017-09-13 2017-09-13 Information analyzer, information analysis method and information analysis program Active JP6849084B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/033107 WO2019053827A1 (en) 2017-09-13 2017-09-13 Information analysis device, information analysis method, and information analysis program

Publications (2)

Publication Number Publication Date
JPWO2019053827A1 JPWO2019053827A1 (en) 2020-04-09
JP6849084B2 true JP6849084B2 (en) 2021-03-24

Family

ID=65722603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019541555A Active JP6849084B2 (en) 2017-09-13 2017-09-13 Information analyzer, information analysis method and information analysis program

Country Status (2)

Country Link
JP (1) JP6849084B2 (en)
WO (1) WO2019053827A1 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240799A (en) * 1997-02-27 1998-09-11 Nri & Ncc Co Ltd Support device for new store opening evaluation
JP4230975B2 (en) * 2004-09-17 2009-02-25 キヤノンItソリューションズ株式会社 Data prediction apparatus, data prediction method, and program
JP2013196037A (en) * 2012-03-15 2013-09-30 Hitachi Ltd Demand prediction system and demand prediction method
US10755395B2 (en) * 2015-11-27 2020-08-25 Canon Medical Systems Corporation Dynamic image denoising using a sparse representation

Also Published As

Publication number Publication date
JPWO2019053827A1 (en) 2020-04-09
WO2019053827A1 (en) 2019-03-21

Similar Documents

Publication Publication Date Title
Claveria et al. Forecasting tourism demand to Catalonia: Neural networks vs. time series models
JP6992526B2 (en) Demand forecasting program, demand forecasting method and demand forecasting device
US9286573B2 (en) Cost-aware non-stationary online learning
JP6299759B2 (en) Prediction function creation device, prediction function creation method, and program
CN111753952A (en) Learning parameters of a probabilistic model including a Gaussian process
JP2014157457A (en) Prediction device and prediction method
WO2017037881A1 (en) Online prediction system and method
WO2018079367A1 (en) Commodity demand prediction system, commodity demand prediction method, and commodity demand prediction program
KR102533460B1 (en) Attention-based stacking method for time series forecasting
JPWO2018150798A1 (en) Model estimation system, method and program
WO2018088277A1 (en) Prediction model generation system, method, and program
US20180052441A1 (en) Simulation system, simulation method, and simulation program
JP2020187417A (en) Physical property prediction device and physical property prediction method
JP6201556B2 (en) Prediction model learning device, prediction model learning method, and computer program
JP2021043477A (en) Demand forecasting device, demand forecasting method, and program
Claveria et al. Tourism demand forecasting with different neural networks models
Park et al. On the long-term predictive capability of data-driven software reliability model: an empirical evaluation
JP5457737B2 (en) Plant control information generating apparatus and method, and computer program therefor
CA3119351C (en) Extending finite rank deep kernel learning to forecasting over long time horizons
JP6849084B2 (en) Information analyzer, information analysis method and information analysis program
JP6973493B2 (en) Information analyzer, information analysis method and information analysis program
JP6828830B2 (en) Evaluation system, evaluation method and evaluation program
WO2019187289A1 (en) Evaluation system, evaluation method, and program for evaluation
KR20200010644A (en) Computer-enabled cloud-based ai computing service method
JPWO2018008391A1 (en) Linear parameter variation model estimation system, method and program

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191204

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210215

R150 Certificate of patent or registration of utility model

Ref document number: 6849084

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150