JPWO2019053827A1 - Information analysis device, information analysis method, and information analysis program - Google Patents

Information analysis device, information analysis method, and information analysis program Download PDF

Info

Publication number
JPWO2019053827A1
JPWO2019053827A1 JP2019541555A JP2019541555A JPWO2019053827A1 JP WO2019053827 A1 JPWO2019053827 A1 JP WO2019053827A1 JP 2019541555 A JP2019541555 A JP 2019541555A JP 2019541555 A JP2019541555 A JP 2019541555A JP WO2019053827 A1 JPWO2019053827 A1 JP WO2019053827A1
Authority
JP
Japan
Prior art keywords
learning model
group
prediction target
partial
estimation error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019541555A
Other languages
Japanese (ja)
Other versions
JP6849084B2 (en
Inventor
洋介 本橋
洋介 本橋
圭介 梅津
圭介 梅津
梓 鷲田
梓 鷲田
政司 中臣
政司 中臣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019053827A1 publication Critical patent/JPWO2019053827A1/en
Application granted granted Critical
Publication of JP6849084B2 publication Critical patent/JP6849084B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Abstract

単位モデル生成部81は、部分予測対象ごとに学習モデルを生成する。推定誤差算出部82は、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。集合生成部83は、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。部分和モデル生成部84は、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。予測対象算出部85は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。The unit model generation unit 81 generates a learning model for each partial prediction target. The estimation error calculation unit 82 calculates an estimation error when the value of the partial prediction target is estimated using the learning model along the time axis. The set generation unit 83 receives the estimation error as an input, and based on the similarity on the time axis between the estimation error of the one learning model and the estimation error of the other learning model, the partial prediction corresponding to the one learning model. A group set is generated by grouping the target and the partial prediction target corresponding to another learning model. The partial sum model generation unit 84 generates a learning model in which the sum of partial prediction targets included in the group is used as an objective variable. The prediction target calculation unit 85 calculates the value of the prediction target from the predicted value of the group calculated using the learning model.

Description

本発明は、複数の予測対象をグループ化して情報を分析する情報分析装置、情報分析方法および情報分析プログラムに関する。   The present invention relates to an information analysis device, an information analysis method, and an information analysis program for analyzing information by grouping a plurality of prediction targets.

全体としての予測結果を得ようとする場合、個々の対象ごとに予測モデルを作成する代わりに、複数の対象をグループ化し、そのグループ毎に予測を行う場合がある。   When trying to obtain a prediction result as a whole, instead of creating a prediction model for each individual object, a plurality of objects may be grouped and prediction may be performed for each group.

例えば、特許文献1には、電力系統に接続された多数の需要家からなるエネルギーコミュニティに係る電力需要調整システムが記載されている。具体的には、特許文献1には、需要数が増加するほど、すなわち需要家グループの規模が大きくなるほど、その需要家グループの需要予測精度が高くなり、分散が小さくなることが記載されている。また、特許文献1には、需要家グループの規模とその需要家グループの需要電力の総量とがほぼ比例し、このような状況において、需要家グループの規模が或る値になるときに予測と実績との差が最小になり、それより需要家数が増加および減少すると、その差が増加することが記載されている。特許文献1に記載された電力需要調整システムは、このような需要家グループの規模と予測と実績との関係を利用して、需要家グループの規模を決定し、その需要家グループの電力需要を予測する。   For example, Patent Literature 1 describes a power demand adjustment system related to an energy community including a large number of customers connected to a power system. Specifically, Patent Literature 1 describes that as the number of demands increases, that is, as the size of the customer group increases, the demand prediction accuracy of the customer group increases and the variance decreases. . Further, in Patent Literature 1, the size of a customer group and the total amount of demand power of the customer group are almost proportional to each other. It is stated that the difference from actual results is minimized, and the difference increases as the number of customers increases and decreases. The power demand adjustment system described in Patent Literature 1 determines the size of a customer group by using such a relationship between the size of the customer group, the prediction, and the actual performance, and determines the power demand of the customer group. Predict.

国際公開第2016/084313号WO 2016/084313

しかし、特許文献1に記載された電力需要調整システムは、個々の需要家が互いに異なる性質を有していることを考慮していない。具体的には、特許文献1に記載された電力需要調整システムは、「需要家グループの規模」と「推定精度・分散・需要電力総量・予測と実績との差」との間に、上述する関係が成立することを前提とする。しかし、個々の需要家が互いに異なる性質を有している場合、グループ化する需要家に応じて、上述する関係は変化する。   However, the power demand adjustment system described in Patent Literature 1 does not consider that individual consumers have different properties. Specifically, the power demand adjustment system described in Patent Literature 1 describes the relationship between “the size of the customer group” and “the difference between the estimation accuracy, variance, the total amount of demanded power, and the forecast and actual results”. It is assumed that the relationship is established. However, when the individual customers have different properties from each other, the above-described relationship changes according to the customers to be grouped.

すなわち、特許文献1に記載された電力需要調整システムは、予測精度の観点からどの需要家同士を同じグループにするのか考慮されていないため、グループ化することによって必ずしも予測精度を向上できるとは言い難い。   That is, the power demand adjustment system described in Patent Literature 1 does not consider which customers belong to the same group from the viewpoint of prediction accuracy, so that it can be said that prediction accuracy can always be improved by grouping. hard.

そこで、本発明は、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる情報分析装置、情報分析方法および情報分析プログラムを提供することを目的とする。   Therefore, the present invention provides a method for generating a desired prediction target even when each of the plurality of prediction targets has a different property from each other, when the desired prediction target is expressed by the sum of the plurality of prediction targets. It is an object of the present invention to provide an information analysis device, an information analysis method, and an information analysis program capable of realizing a grouping of prediction targets to improve the prediction accuracy of the information.

本発明による情報分析装置は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部とを備えたことを特徴とする。   An information analysis device according to the present invention includes a unit model generation unit that generates a learning model for each partial prediction target when the prediction target is expressed by a sum of a plurality of partial prediction targets, and a partial prediction target using the learning model. An estimation error calculation unit that calculates an estimation error along the time axis when the value of is estimated, and a time axis between the estimation error of one learning model and the estimation error of another learning model with the estimation error as an input. A set generation unit that generates a group set by grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into groups based on the similarity described above; A partial sum model generation unit that generates a learning model using the sum of the partial prediction targets to be calculated as the objective variable, and a prediction target from the prediction values of the group calculated using the learning model. Characterized in that a prediction target calculation unit for calculating a value.

本発明による情報分析システムは、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部とを備えたことを特徴とする。   An information analysis system according to the present invention, when a prediction target is represented by a sum of a plurality of partial prediction targets, a unit model generation unit that generates a learning model for each partial prediction target, and a partial prediction target using the learning model. An estimation error calculation unit that calculates an estimation error along the time axis when the value of is estimated, and a time axis between the estimation error of one learning model and the estimation error of another learning model with the estimation error as an input. Based on the above similarity, the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model are put into a group, so that the configuration of the first group is different from that of the first group. A set generation unit for generating a set and a set of the second group, respectively, and a group for each of the set of the first group and the set of the second group A partial sum model generation unit that generates a learning model using a sum of partial prediction targets included as an objective variable, and a first group set and a second group set, each of which is calculated using a learning model. A prediction target calculation unit that calculates a value of a prediction target from a prediction value of a group to be predicted, and a set of a prediction target value and a prediction target actual value for each of a first group set and a second group set. An evaluation unit that evaluates a set of groups based on the difference.

本発明による情報分析方法は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成し、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出することを特徴とする。   The information analysis method according to the present invention generates a learning model for each partial prediction target when the prediction target is expressed by a sum of a plurality of partial prediction targets, and estimates the value of the partial prediction target using the learning model. The estimation error of the case is calculated along the time axis, and the estimation error is used as an input, based on the similarity on the time axis between the estimation error of one learning model and the estimation error of the other learning model. A set of groups is generated by grouping a partial prediction target corresponding to a learning model and a partial prediction target corresponding to another learning model, and a learning model in which the sum of the partial prediction targets included in the group is used as an objective variable. The value of the prediction target is calculated from the predicted value of the group generated and calculated using the learning model.

本発明による他の情報分析方法は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成し、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出し、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価することを特徴とする。   Another information analysis method according to the present invention is such that, when a prediction target is represented by a sum of a plurality of partial prediction targets, a learning model is generated for each partial prediction target, and the value of the partial prediction target is calculated using the learning model. The estimation error in the case of estimation is calculated along the time axis, and the estimation error is used as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model, By grouping a partial prediction target corresponding to one learning model and a partial prediction target corresponding to another learning model into a group, a set of a first group and a set of a second group having different group configurations from each other And a learning model in which the sum of the partial prediction targets included in the group is used as an objective variable for each of the first group set and the second group set. Generating, for each of the first group set and the second group set, a value to be predicted from the predicted value of the group calculated using the learning model, and calculating the value of the first group and For each set of the second group, the set of groups is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target.

本発明による情報分析プログラムは、コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成処理、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出処理を実行させることを特徴とする。   An information analysis program according to the present invention is configured such that, when a prediction target is represented by a sum of a plurality of partial prediction targets, a computer uses a unit model generation process for generating a learning model for each partial prediction target, Estimation error calculation processing for calculating the estimation error along the time axis when the value of the prediction target is estimated, and the time between the estimation error for one learning model and the estimation error for the other learning model with the estimation error as input. Set generation processing for generating a group set by grouping a partial prediction target corresponding to one learning model and a partial prediction target corresponding to another learning model into a group based on the similarity on the axis, included in the group Partial sum model generation processing for generating a learning model using the sum of the partial prediction targets to be calculated as the objective variable, and calculation using the learning model. Characterized in that to execute the prediction target calculation process for calculating the value of the predicted target from the predicted value of the group.

本発明による他の情報分析プログラムは、コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成処理、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出処理、および、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価処理を実行させることを特徴とする。   Another information analysis program according to the present invention uses a unit model generation process that generates a learning model for each partial prediction target when a prediction target is expressed by a sum of a plurality of partial prediction targets, and a learning model. Estimation error calculation processing for calculating the estimation error when estimating the value of the partial prediction target along the time axis, using the estimation error as an input, the estimation error for one learning model and the estimation error for the other learning model. By grouping the partial prediction targets corresponding to one learning model and the partial prediction targets corresponding to the other learning models into groups based on the similarity on the time axis of Generation processing for generating a group set of the first group and a set of the second group, respectively, that of the first group set and the second group set On the other hand, a partial sum model generation process of generating a learning model using the sum of the partial prediction targets included in the group as an objective variable, a learning process for each of the first group set and the second group set A prediction target calculation process of calculating a value of a prediction target from a prediction value of a group calculated using a model; and a prediction target value and a prediction target value for each of a first group set and a second group set. An evaluation process for evaluating a set of groups based on a difference from an actual value of a prediction target is performed.

本発明によれば、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できるという技術的効果を奏する。   According to the present invention, even when each of a plurality of prediction targets has different properties, if the desired prediction target is expressed by the sum of the plurality of prediction targets, the desired prediction target The technical effect that the grouping of the prediction object which can improve the prediction accuracy of this can be realized.

本発明による情報分析装置の一実施形態を示すブロック図である。It is a block diagram showing one embodiment of an information analysis device by the present invention. 部分予測対象の候補の例を示す説明図である。It is explanatory drawing which shows the example of the candidate of a partial prediction target. 実績データの例を示す説明図である。It is explanatory drawing which shows the example of performance data. 部分予測対象単位で生成した学習モデルの例を示す説明図である。FIG. 9 is an explanatory diagram illustrating an example of a learning model generated in units of partial prediction targets. 推定誤差を算出する処理の例を示す説明図である。FIG. 9 is an explanatory diagram illustrating an example of a process for calculating an estimation error. 時間軸に沿って算出した推定誤差の例を示す説明図である。FIG. 9 is an explanatory diagram illustrating an example of an estimation error calculated along a time axis. 時間軸に沿って算出した推定誤差をグラフ化した例を示す説明図である。It is explanatory drawing which shows the example which graphed the estimation error calculated along the time axis. 部分予測対象をグループ化する処理の例を示す説明図である。FIG. 11 is an explanatory diagram illustrating an example of a process of grouping partial prediction targets. グループの集合を生成する処理の例を示す説明図である。FIG. 9 is an explanatory diagram illustrating an example of a process of generating a group set. グループの集合を生成する処理の例を示す説明図である。FIG. 9 is an explanatory diagram illustrating an example of a process of generating a group set. 情報分析装置の動作例を示すフローチャートである。5 is a flowchart illustrating an operation example of the information analysis device. 本発明による情報分析システムの構成例を示すブロック図である。1 is a block diagram illustrating a configuration example of an information analysis system according to the present invention. 本発明による情報分析装置の概要を示すブロック図である。It is a block diagram showing the outline of the information analysis device by the present invention. 本発明による情報分析システムの概要を示すブロック図である。It is a block diagram showing the outline of the information analysis system by the present invention.

以下、本発明の実施形態を図面を参照して説明する。図1は、本発明による情報分析装置の一実施形態を示すブロック図である。なお、本実施形態の情報分析装置の構成については後述される。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of the information analyzer according to the present invention. The configuration of the information analyzer according to the present embodiment will be described later.

本発明では、ある時間における予測対象Yの値(予測結果)が、同じ時間における複数の予測対象y,y,…,yの足し合わせにより構成されるものとする。すなわち、ある時刻における予測対象が、同じ時刻における複数の部分予測対象の和により表現される。具体的には、Y=y+y+…+yである。In the present invention, the value of the prediction target Y at a certain time (prediction result), a plurality of candidate prediction y 1, y 2 at the same time, ..., and it shall consist of alignment sum of y n. That is, the prediction target at a certain time is represented by the sum of a plurality of partial prediction targets at the same time. Specifically, a Y = y 1 + y 2 + ... + y n.

なお、複数の予測対象y,y,…,yの足し合わせにより所望の予測対象Yが構成されることから、以下の説明では、個々の予測対象y,y,…,yのことを、部分予測対象と記す。したがって、ある時間における予測対象Yの値は、同じ時間における部分予測対象y,y,…,yの総和で算出される。例えば、予測対象Yが、工場が製造する商品の需要総数(受注総数)とした場合、部分予測対象yは、個々の店舗の商品需要数(受注数)である。Incidentally, a plurality of candidate prediction y 1, y 2, ..., since the desired prediction target Y is constituted by a combination adding the y n, in the following description, the individual prediction target y 1, y 2, ..., y Let n be a partial prediction target. Therefore, the value of the prediction target Y at a certain time, partial prediction target y 1, y 2 at the same time, ..., are calculated by the sum of y n. For example, the prediction target Y is, if the plant is demand total number of items which are manufactured (order total) partial prediction target y n is the trade demand number of individual stores (order number).

また、本発明では、部分予測対象を複数のグループ(Y,Y,…,Y)に纏め、グループごとに予測モデルの学習、予測対象の予測値や実績値の算出を行う。In the present invention, the partial prediction targets are grouped into a plurality of groups (Y 1 , Y 2 ,..., Y N ), and the learning of the prediction model and the calculation of the predicted value and the actual value of the prediction target are performed for each group.

以下、具体例を用いて、予測対象と部分予測対象との関係を説明する。以下、ある商品を製造して各店舗に納品する工場があると想定し、この工場の生産管理部門の立場に立って、過去の実績データに基づいて未来の商品需要(受注数)を予測するとする。   Hereinafter, the relationship between the prediction target and the partial prediction target will be described using a specific example. In the following, it is assumed that there is a factory that manufactures a certain product and delivers it to each store, and from the standpoint of the production management department of this factory, forecasting future product demand (number of orders) based on past performance data I do.

図2は、部分予測対象の候補の例を示す説明図である。図2に示す例では、自工場が図2に例示する200店舗(店舗コード:C−001〜C−200)へ商品を納品することを示す。また、図3は、実績データとして、日ごと及び店舗ごとの商品の売上数の例を示す説明図である。また、図3に例示する表には、前日の最高気温および最低気温が含まれる。以下の説明では、図3に例示するような実際に取得された過去データ(実績データ)のことを、評価用データと記すこともある。   FIG. 2 is an explanatory diagram illustrating an example of a partial prediction target candidate. In the example shown in FIG. 2, the own factory delivers goods to 200 stores (store codes: C-001 to C-200) illustrated in FIG. FIG. 3 is an explanatory diagram showing an example of the number of products sold for each day and for each store as performance data. The table illustrated in FIG. 3 includes the highest temperature and the lowest temperature of the previous day. In the following description, past data (actual data) actually acquired as illustrated in FIG. 3 may be referred to as evaluation data.

このような情報が存在する場合に翌日の商品の受注数を予測する状況を想定する。例えば、一般的な方法の場合、各日の各店舗の売上数の総数を目的変数に設定し、図3に例示する表に含まれるような最高気温、最低気温などを説明変数に設定して予測モデルを学習することが考えられる。   It is assumed that when such information exists, the number of orders for a product on the next day is predicted. For example, in the case of a general method, the total number of sales at each store on each day is set as an objective variable, and the highest temperature, the lowest temperature, and the like included in the table illustrated in FIG. 3 are set as explanatory variables. It is conceivable to learn a prediction model.

しかし、例えば200店舗の中に、他と著しく異なる性質を有する店舗(例えば、売上規模、発注の増減が大きい店舗など)が含まれている場合も存在する。このような異なる性質を有する店舗を一まとめにして学習を行っても、高い予測精度が得られない可能性が高い。そこで、このような複数の店舗を、同様の性質を有する店舗ごとに分類して予測を行うことが考えられる。   However, for example, there are cases where stores having characteristics significantly different from other stores (for example, stores whose sales scale and order increase / decrease are large) are included in, for example, 200 stores. Even if the stores having such different properties are collectively learned, it is highly likely that high prediction accuracy cannot be obtained. Therefore, it is conceivable to perform prediction by classifying such a plurality of stores for each store having similar properties.

しかし、対象とする商品の売上が、必ずしも図2に例示するような各店舗の所在地や売場面積、昨年売上高だけで分類できるとは限らない。例えば、同じ所在地の店舗であっても、ビルの中の店舗と路面店とでは売上の傾向が異なると考えられるし、同程度の売り場面積を有する店舗であっても、近隣の環境に応じて商品の需要傾向が異なることも考えられる。   However, the sales of the target product cannot always be categorized only by the location, the floor space of each store, and the sales last year as illustrated in FIG. For example, even if a store is located at the same location, it is considered that sales trends are different between a store in a building and a road surface store, and even if a store has the same sales floor area, It is also conceivable that demand trends for commodities are different.

そこで、以下の実施形態では、推定誤差の傾向が類似する店舗(部分予測対象)をグループ化して予測を行うことで、所望の予測対象の実績値に対する予測値の推定誤差を小さくする方法を説明する。以下、上述する具体例を適宜使用しながら、本発明の情報分析装置を説明する。   Therefore, in the following embodiment, a method for reducing the estimation error of the predicted value with respect to the actual value of the desired prediction target by grouping stores (partial prediction targets) having similar estimation error trends and performing prediction is described. I do. Hereinafter, the information analyzer of the present invention will be described using the above-described specific examples as appropriate.

図1に例示する情報分析装置100は、受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24と、記憶部30とを備えている。   The information analysis device 100 illustrated in FIG. 1 includes a reception unit 10, a unit model generation unit 12, an estimation error calculation unit 13, a set generation unit 14, a partial sum model generation unit 16, a prediction target calculation unit 18, , An evaluation unit 20, an output unit 22, a control unit 24, and a storage unit 30.

記憶部30は、部分予測対象に関する情報を記憶する。記憶部30は、例えば、図2に例示する店舗のような、部分予測対象を記憶していてもよい。他にも、記憶部30は、図3に例示するような、部分予測対象に関する実績データを記憶していてもよい。   The storage unit 30 stores information on the partial prediction target. The storage unit 30 may store a partial prediction target such as a store illustrated in FIG. 2, for example. In addition, the storage unit 30 may store actual data regarding the partial prediction target as illustrated in FIG.

実績データは、後述する単位モデル生成部12および部分和モデル生成部16が学習モデルを生成する際のデータとして用いられる。他にも、実績データは、後述する評価部20が予測モデルを評価する際のデータとして用いられる。例えば、実績データのうち、一定の割合のデータを学習用データとして用い、残りのデータを評価用データとして用いてもよい。   The performance data is used as data when the unit model generation unit 12 and the partial sum model generation unit 16 described later generate a learning model. In addition, the performance data is used as data when the evaluation unit 20 described later evaluates the prediction model. For example, a certain percentage of the performance data may be used as learning data, and the remaining data may be used as evaluation data.

ただし、記憶部30が記憶するデータは、これらのデータに限定されない。記憶部30は、例えば、後述する単位モデル生成部12および部分和モデル生成部16が生成した学習モデルを記憶してもよい。記憶部30は、例えば、磁気ディスク装置により実現される。   However, the data stored in the storage unit 30 is not limited to such data. The storage unit 30 may store, for example, a learning model generated by the unit model generation unit 12 and the partial sum model generation unit 16 described below. The storage unit 30 is realized by, for example, a magnetic disk device.

受付部10は、所望の予測対象の指定を受け付ける。また、受付部10は、所望の予測対象を構成する複数の部分予測対象の指定を受け付けてもよい。   The receiving unit 10 receives a designation of a desired prediction target. Further, the receiving unit 10 may receive designation of a plurality of partial prediction targets constituting a desired prediction target.

単位モデル生成部12は、部分予測対象単位に学習モデルを生成する。具体的には、単位モデル生成部12は、部分予測対象y,y,…,yのそれぞれについて学習モデルを生成する。The unit model generation unit 12 generates a learning model for each partial prediction target unit. Specifically, the unit model generating unit 12, partial prediction target y 1, y 2, ..., to generate a learning model for each of the y n.

例えば、図2に例示する各店舗が部分予測対象である場合、単位モデル生成部12は、店舗ごとに学習モデルを生成する。予測対象に影響する要因の類似性を判断できるように、単位モデル生成部12は、説明変数の重みで予測対象を予測可能な学習モデル(例えば、線形重回帰モデル)を生成してもよい。ただし、単位モデル生成部12が生成する学習モデルは線形重回帰モデルに限られない。単位モデル生成部12は、任意の方法で学習モデルを生成すればよい。   For example, when each store illustrated in FIG. 2 is a partial prediction target, the unit model generation unit 12 generates a learning model for each store. The unit model generation unit 12 may generate a learning model (for example, a linear multiple regression model) that can predict the prediction target with the weight of the explanatory variable so that the similarity of the factors affecting the prediction target can be determined. However, the learning model generated by the unit model generation unit 12 is not limited to the linear multiple regression model. The unit model generation unit 12 may generate the learning model by an arbitrary method.

図4は、単位モデル生成部12が部分予測対象単位で生成した学習モデルの例を示す説明図である。図4に示す例では、店舗コード「C−001」で特定される店舗の商品の売上予測y001が、前日の最高気温(説明変数x)、一週間前の売上(説明変数x)、および、売り場面積(説明変数x)と正の相関があることを示す。一方、図4に示す例では、店舗コード「C−200」で特定される店舗の商品の売上予測y200が、一週間前の売上(説明変数x)、および、売り場面積(説明変数x)と正の相関がある一方、週末(説明変数x)と負の相関があることを示す。FIG. 4 is an explanatory diagram illustrating an example of a learning model generated by the unit model generation unit 12 in units of partial prediction targets. In the example illustrated in FIG. 4, the sales forecast y 001 of the product of the store specified by the store code “C-001” is the highest temperature of the previous day (explanatory variable x 1 ), and the sales one week ago (explanatory variable x 2 ). , And the sales floor area (explanatory variable x 3 ). On the other hand, in the example illustrated in FIG. 4, the sales forecast y 200 of the product of the store identified by the store code “C-200” is the sales one week ago (explanatory variable x 2 ) and the sales floor area (explanatory variable x 3 ) indicates a positive correlation with the weekend (explanatory variable x 4 ) and a negative correlation.

推定誤差算出部13は、学習モデルを用いて、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。具体的には、推定誤差算出部13は、単位モデル生成部12によって生成された学習モデルを用いて、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。   The estimation error calculation unit 13 calculates an estimation error along the time axis when the value of the partial prediction target is estimated using the learning model. Specifically, the estimation error calculation unit 13 calculates an estimation error along the time axis when the value of the partial prediction target is estimated using the learning model generated by the unit model generation unit 12.

なお、推定誤差算出部13は、後述する部分和モデル生成部16によって生成された学習モデルを用いて、同様に、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。部分和モデル生成部16によって生成された学習モデルを用いる処理については後述される。   In addition, the estimation error calculation unit 13 similarly calculates an estimation error along the time axis when the value of the partial prediction target is estimated using the learning model generated by the partial sum model generation unit 16 described later. . Processing using the learning model generated by the partial sum model generation unit 16 will be described later.

図5は、推定誤差を算出する処理の例を示す説明図である。例えば、図3に例示する2017年の6月の実績データが評価用データとして用いられ、対応する学習モデルが図4に例示する予測式で表されているとする。   FIG. 5 is an explanatory diagram illustrating an example of a process of calculating an estimation error. For example, it is assumed that the performance data in June 2017 illustrated in FIG. 3 is used as evaluation data, and the corresponding learning model is represented by a prediction formula illustrated in FIG.

まず、推定誤差算出部13は、部分予測対象である店舗コード「C−001」で特定される店舗の売上の推定値を、図4に例示する予測式(y001=0.1x+0.18x+0.06x+1.6)を用いて算出する。例えば、2017年6月2日の売上の推定値を算出するとする場合、店舗の売り場面積は120mであり、前日の最高気温は26度である。また、一週間前の売上数が20であったとすると、売上の推定値はy^001=0.1×26+0.18×10+0.06×120+1.6=13.2と算出される。First, the estimation error calculation unit 13 calculates the estimated value of the sales of the store identified by the store code “C-001” to be partially predicted by the prediction formula (y 001 = 0.1 × 1 + 0. It is calculated using the 18x 2 + 0.06x 3 +1.6). For example, when calculating the estimated value of the sales on June 2, 2017, the sales floor area of the store is 120 m 2 , and the maximum temperature of the previous day is 26 degrees. Assuming that the number of sales one week ago was 20, the estimated sales value is calculated as y ^ 001 = 0.1 × 26 + 0.18 × 10 + 0.06 × 120 + 1.6 = 13.2.

そして、推定誤差算出部13は、2017年6月2日の売上の実績値である15と、推定値である13.2の誤差(推定誤差)を、15−13.2=1.8と算出する。推定誤差算出部13は、以下の日付についても同様に推定誤差を算出することで、時間軸に沿った(時系列の)推定誤差を算出する。また、推定誤差算出部13は、他の部分予測対象(店舗)についても、同様に時間軸に沿った推定誤差を算出する。   Then, the estimated error calculation unit 13 calculates the error (estimated error) of the actual value of sales on June 2, 2017, 15 and the estimated value of 13.2, as 15-13.2 = 1.8. calculate. The estimation error calculation unit 13 calculates an estimation error along the time axis (in a time series) by similarly calculating the estimation error for the following dates. The estimation error calculation unit 13 similarly calculates the estimation error along the time axis for other partial prediction targets (stores).

図6は、時間軸に沿って算出した推定誤差の例を示す説明図である。図6に示す例は、図3に例示するデータを用いて、店舗ごと及び日ごとに推定誤差を算出した結果を示す。また、図7は、時間軸に沿って算出した推定誤差をグラフ化した例を示す説明図である。図7に示す例は、図6に例示する時間軸に沿った推定誤差を、店舗ごとに折れ線グラフで表している。   FIG. 6 is an explanatory diagram illustrating an example of the estimation error calculated along the time axis. The example illustrated in FIG. 6 illustrates the result of calculating the estimation error for each store and each day using the data illustrated in FIG. FIG. 7 is an explanatory diagram showing an example in which the estimation error calculated along the time axis is graphed. In the example illustrated in FIG. 7, the estimation error along the time axis illustrated in FIG. 6 is represented by a line graph for each store.

なお、売上規模の差異に応じ、推定誤差算出部13は、各部分予測対象の推定誤差を標準化してもよい。具体的には、推定誤差算出部13は、各部分予測対象の推定誤差の平均および分散に基づいて推定誤差を標準化してもよい。このような標準化を行うことで、時間軸に沿った推定誤差の傾向を、同じ尺度で判断できる。   Note that the estimation error calculation unit 13 may standardize the estimation error of each partial prediction target according to the difference in the sales scale. Specifically, the estimation error calculation unit 13 may standardize the estimation error based on the average and variance of the estimation error of each partial prediction target. By performing such standardization, the tendency of the estimation error along the time axis can be determined on the same scale.

集合生成部14は、部分予測対象を複数のグループに纏めることにより、グループの集合を生成する。なお、集合生成部14は、後述する制御部24の制御に応じてグループの集合を生成する。   The set generation unit 14 generates a set of groups by grouping the partial prediction targets into a plurality of groups. The set generation unit 14 generates a set of groups under the control of the control unit 24 described later.

まず、集合生成部14は、推定誤差算出部13が算出した推定誤差を入力する。そして、集合生成部14は、入力された一の学習モデルについての推定誤差と、他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。   First, the set generation unit 14 inputs the estimation error calculated by the estimation error calculation unit 13. Then, the set generation unit 14 performs partial prediction corresponding to one learning model based on the similarity on the time axis between the input estimation error of one learning model and the estimation error of another learning model. A group set is generated by combining the target and the partial prediction target corresponding to another learning model into a group.

なお、集合生成部14は、後述する部分和モデル生成部16によって生成された学習モデルによる推定誤差の時間軸上における類似性に基づいて、同様に、グループの集合を生成する。なお、部分和モデル生成部16によって生成された学習モデルによる推定誤差を用いる処理については後述される。   In addition, the set generation unit 14 similarly generates a set of groups based on the similarity on the time axis of the estimation error by the learning model generated by the partial sum model generation unit 16 described later. The process using the estimation error by the learning model generated by the partial sum model generation unit 16 will be described later.

集合生成部14が、推定誤差の時間軸上における類似性を判断する方法は任意である。集合生成部14は、例えば、時間軸方向の各区間の推定誤差の変化をベクトル(推定誤差ベクトル)で表し、比較する他の学習モデルによる推定誤差ベクトルとの内積の各区間における総和が、より大きいほど類似性が高いと判断してもよい。また、集合生成部14は、図7に例示するグラフの形状が類似しているほど、時間軸上における推定誤差がより類似すると判断してもよい。   The method by which the set generation unit 14 determines the similarity of the estimation error on the time axis is arbitrary. The set generation unit 14 represents, for example, a change in the estimation error in each section in the time axis direction as a vector (estimation error vector), and the sum in each section of the inner product with the estimation error vector by another learning model to be compared is more significant. It may be determined that the larger the value, the higher the similarity. The set generation unit 14 may determine that the more similar the shapes of the graphs illustrated in FIG. 7, the more similar the estimation error on the time axis is.

また、集合生成部14が纏めるグループの数も任意である。図8は、部分予測対象をグループ化する処理の例を示す説明図である。集合生成部14は、推定誤差の類似性が高い学習モデルに対応する部分予測対象を順次グループ化し、グループ化された部分予測対象を除外しながらグループ化を繰り返してもよい。具体的には、集合生成部14は、図8(a)に例示するように、推定誤差の類似性が高い部分予測対象をグループ化したグループG1を生成し、その後、グループG1に含まれる部分予測対象を除いて、次に推定誤差の類似性が高い部分予測対象をグループ化したグループG2を生成してもよい。例えば、推定誤差の類似する学習モデルのペアをそれぞれ抽出してグループを生成する場合、図2に例示する200の部分予測対象から、100のグループの集合が生成される。   Further, the number of groups to be collected by the set generation unit 14 is also arbitrary. FIG. 8 is an explanatory diagram illustrating an example of a process of grouping partial prediction targets. The set generation unit 14 may sequentially group the partial prediction targets corresponding to the learning models having high similarity of the estimation error, and repeat the grouping while excluding the grouped partial prediction targets. Specifically, as illustrated in FIG. 8A, the set generation unit 14 generates a group G1 in which partial prediction targets having high similarity in estimation error are grouped, and then generates a group G1 included in the group G1. Except for the prediction target, a group G2 in which partial prediction targets having the next highest similarity in estimation error are grouped may be generated. For example, when a group of learning models having similar estimation errors is extracted to generate groups, a set of 100 groups is generated from 200 partial prediction targets illustrated in FIG.

また。集合生成部14は、推定誤差の類似性が高い学習モデルに対応する部分予測対象を順次グループ化し、グループ化された部分予測対象を除外せずにグループ化を繰り返してもよい。具体的には、集合生成部14は、図8(b)に例示するように、推定誤差の類似性が高い部分予測対象をグループ化したグループG1を生成し、その後、グループG1に含まれる部分予測対象も含めて、次に推定誤差の類似性が高い部分予測対象をグループ化したグループG3を生成してもよい。   Also. The set generation unit 14 may sequentially group the partial prediction targets corresponding to the learning models having high similarity of the estimation error, and repeat the grouping without excluding the grouped partial prediction targets. Specifically, as illustrated in FIG. 8B, the set generation unit 14 generates a group G1 in which partial prediction targets having a high similarity in estimation error are grouped, and then generates a group G1 included in the group G1. A group G3 in which partial prediction targets having the next highest similarity in estimation error, including the prediction target, may be generated.

また、集合生成部14は、すでに生成されたグループの集合とは異なる構成のグループの集合を、別途生成してもよい。具体的には、集合生成部14は、グループの集合を構成するグループの数が、すでに生成されたグループの集合を構成するグループの数と変わるようにグループの集合を生成してもよい。例えば、図2に例示する200の部分予測対象が存在する場合、集合生成部14は、2つの部分予測対象を纏めた100のグループの集合を生成し、さらに、4つの部分予測対象を纏めた50のグループの集合を生成してもよい。   In addition, the set generation unit 14 may separately generate a group set having a configuration different from that of the already generated group set. Specifically, the set generation unit 14 may generate a set of groups such that the number of groups forming the set of groups is different from the number of groups forming the set of groups already generated. For example, when there are 200 partial prediction targets illustrated in FIG. 2, the set generation unit 14 generates a set of 100 groups in which two partial prediction targets are combined, and further groups four partial prediction targets. A set of 50 groups may be generated.

なお、集合生成部14が生成する各グループに含まれる部分予測対象の数は、同数であってもよく、異なっていてもよい。   Note that the number of partial prediction targets included in each group generated by the set generation unit 14 may be the same or different.

図9は、グループの集合を生成する処理の例を示す説明図である。図7に例示する推定誤差が算出されている場合、例えば、店舗コード「C−001」で特定される店舗の推定誤差の傾向と、店舗コード「C−003」で特定される店舗の推定誤差の傾向とは、その推定誤差の傾向(変化度合)が類似すると言える。そこで、集合生成部14は、店舗コード「C−001」で特定される店舗と、店舗コード「C−003」で特定される店舗とをまとめて1つのグループを生成する。集合生成部14は、このグループ化を他の店舗についても繰り返し行う。   FIG. 9 is an explanatory diagram illustrating an example of a process of generating a group set. When the estimated error illustrated in FIG. 7 is calculated, for example, the tendency of the estimated error of the store identified by the store code “C-001” and the estimated error of the store identified by the store code “C-003” It can be said that the tendency (degree of change) of the estimation error is similar. Therefore, the set generation unit 14 generates one group by combining the store specified by the store code “C-001” and the store specified by the store code “C-003”. The set generation unit 14 repeats this grouping for other stores.

部分和モデル生成部16は、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。すなわち、部分和モデル生成部16は、グループ化された複数の部分予測対象のグループ(Y,Y,…,Y)ごとに学習モデルを生成する。なお、部分和モデル生成部16が学習モデルを生成する方法は、集合生成部14が学習モデルを生成する方法と同様である。The partial sum model generation unit 16 generates a learning model using the sum of the partial prediction targets included in the group as an objective variable. In other words, the partial sum model generation unit 16 generates a learning model for each of the plurality of partial prediction target groups (Y 1 , Y 2 ,..., Y N ). The method by which the partial sum model generation unit 16 generates a learning model is the same as the method by which the set generation unit 14 generates a learning model.

例えば、図9に例示するように、店舗コード「C−001」で特定される店舗と、店舗コード「C−003」で特定される店舗とをまとめて1つのグループを生成したとする。この場合、部分和モデル生成部16は、この2つの店舗の商品の売上の和を目的変数とする学習モデルを生成する。   For example, as illustrated in FIG. 9, it is assumed that a store identified by a store code “C-001” and a store identified by a store code “C-003” are generated as one group. In this case, the partial sum model generation unit 16 generates a learning model using the sum of the sales of the products of the two stores as the objective variable.

予測対象算出部18は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。具体的には、予測対象算出部18は、単位モデル生成部12によって生成された学習モデルを用いて算出されるグループの予測値を合計して予測対象の値を算出する。さらに、予測対象算出部18は、部分和モデル生成部16によって生成された学習モデルを用いて算出されるグループの予測値を合計して予測対象の値を算出する。   The prediction target calculation unit 18 calculates the value of the prediction target from the prediction value of the group calculated using the learning model. Specifically, the prediction target calculation unit 18 calculates the value of the prediction target by summing up the prediction values of the groups calculated using the learning model generated by the unit model generation unit 12. Further, the prediction target calculation unit 18 calculates the value of the prediction target by summing the prediction values of the groups calculated using the learning model generated by the partial sum model generation unit 16.

評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいて、グループの集合を評価する。予測対象の実績値は、例えば、予め記憶部30に記憶されている。評価部20は、例えば、グループの集合の良さを評価するための評価関数を用いてもよい。   The evaluation unit 20 evaluates the group set based on the difference between the calculated value of the prediction target and the actual value of the prediction target. The actual value of the prediction target is stored in the storage unit 30 in advance, for example. The evaluation unit 20 may use, for example, an evaluation function for evaluating the goodness of the group set.

具体的には、評価部20は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。予測値と実測値の誤差が小さいほど、適切なグループ化ができていると言えるからである。この場合の評価関数は、例えば、以下に例示する式1で設計されていてもよい。評価関数Wは、値が小さいほど、よりよい評価を示す。式1に例示する予測対象Yの誤差とは、部分予測対象の和である全体の誤差である。   Specifically, the evaluation unit 20 evaluates a set of groups using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. Is also good. This is because it can be said that the smaller the error between the predicted value and the actually measured value is, the more appropriate the grouping is. The evaluation function in this case may be designed, for example, by Expression 1 illustrated below. The smaller the value of the evaluation function W, the better the evaluation. The error of the prediction target Y exemplified in Expression 1 is the entire error that is the sum of the partial prediction targets.

評価関数W=β・(予測対象Yの誤差) (式1)   Evaluation function W = β · (error of prediction target Y) (Equation 1)

また、評価部20は、上述する評価に加え、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。グループの数が少ないほど、生成されるモデルの数も少なくなるため、人間の解釈性を高めることができるからである。この場合の評価関数は、例えば、以下に例示する式2で設計されていてもよい。   Further, in addition to the above-described evaluation, the evaluation unit 20 may evaluate the group set using an evaluation function designed so that the smaller the number of groups constituting the group set, the better the evaluation. This is because the smaller the number of groups, the smaller the number of models to be generated, so that human interpretability can be improved. The evaluation function in this case may be designed by, for example, Expression 2 illustrated below.

評価関数W=α・モデル数+β・(予測対象Yの誤差) (式2)   Evaluation function W = α · number of models + β · (error of prediction target Y) (Equation 2)

また、評価部20は、グループの集合を構成するグループの数の評価に代えて、各グループに対応する各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。非ゼロ係数を有する説明変数の個数が少ないほど、人間の解釈性を高めることができるからである。   In addition, the evaluation unit 20 performs, instead of evaluating the number of groups included in the set of groups, a better evaluation as the sum of the number of explanatory variables having non-zero coefficients included in each learning model corresponding to each group is smaller. A set of groups may be evaluated using an evaluation function designed to be. This is because human interpretability can be improved as the number of explanatory variables having non-zero coefficients is smaller.

さらに、非ゼロ係数を有する説明変数の個数が少ないほど、モデルの複雑性を回避できる。モデルが複雑になるほど、そのモデルにうまく当てはまる評価データが見つかりやすいため、適切な評価ができないおそれがある。一方、モデルを単純化できるほど、上述するおそれを避けられるため、モデル評価時には精度が良いにもかかわらず、運用中に精度が悪くなるといった現象が起こることを抑制できる。この場合の評価関数は、例えば、以下に例示する式3で設計されていてもよい。   Further, the fewer the number of explanatory variables having non-zero coefficients, the more the complexity of the model can be avoided. The more complex the model, the easier it is to find evaluation data that fits well with the model, which may prevent proper evaluation. On the other hand, the more the model can be simplified, the more the above-mentioned fear can be avoided. Therefore, it is possible to suppress the occurrence of a phenomenon in which the accuracy is deteriorated during operation, even though the accuracy is high at the time of model evaluation. The evaluation function in this case may be designed by, for example, Expression 3 illustrated below.

評価関数W=α・(Σ各モデルの非ゼロ係数の数)+β・(予測対象Yの誤差)(式3)   Evaluation function W = α · (Σthe number of non-zero coefficients of each model) + β · (error of prediction target Y) (Equation 3)

制御部24は、集合生成部14がグループの集合を生成する際の動作を制御する。具体的には、制御部24は、個々の部分予測対象を、予め定めた数のグループに纏めるように集合生成部14を制御する。図10は、グループの集合を生成する処理の例を示す説明図である。   The control unit 24 controls an operation when the set generation unit 14 generates a set of groups. Specifically, the control unit 24 controls the set generation unit 14 so as to group the individual partial prediction targets into a predetermined number of groups. FIG. 10 is an explanatory diagram illustrating an example of a process of generating a group set.

例えば、図2に例示する200の部分予測対象が存在する場合、制御部24は、2つの部分予測対象を纏めた100のグループの集合を生成するよう、集合生成部14を制御してもよい(図10におけるステップS1)。   For example, when there are 200 partial prediction targets illustrated in FIG. 2, the control unit 24 may control the set generation unit 14 to generate a set of 100 groups in which two partial prediction targets are put together. (Step S1 in FIG. 10).

さらに、制御部24は、グループの集合を構成するグループの数が、すでに生成されたグループの集合を構成するグループの数と変わるように、集合生成部14を制御してもよい。このとき、制御部24は、個々の部分予測対象を対象としてグループ化するよう、集合生成部14を制御してもよいし、集合生成部14がすでに生成したグループをさらにグループに纏めることによりグループの集合を生成するよう制御してもよい。   Furthermore, the control unit 24 may control the set generation unit 14 such that the number of groups forming the group set is different from the number of groups forming the already generated group set. At this time, the control unit 24 may control the set generation unit 14 to group the individual partial prediction targets as targets, or may further group the groups already generated by the set generation unit 14 into groups. May be controlled to generate a set of

集合生成部14がすでに生成したグループをさらにグループに纏める方法を、より具体的に説明する。まず、制御部24は、部分和モデル生成部16が生成した学習モデルについての推定誤差が算出されるように推定誤差算出部13を制御する。この制御に応じ、推定誤差算出部13は、部分和モデル生成部16が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。   A method of further grouping the groups already generated by the set generation unit 14 into groups will be described more specifically. First, the control unit 24 controls the estimation error calculation unit 13 so that the estimation error for the learning model generated by the partial sum model generation unit 16 is calculated. In accordance with this control, the estimation error calculation unit 13 calculates an estimation error when the value of the partial prediction target is estimated using the learning model generated by the partial sum model generation unit 16 along the time axis.

さらに、制御部24は、集合生成部14を制御する際に、部分和モデル生成部16により生成された学習モデルについての推定誤差を集合生成部14に入力する。この制御に応じ、集合生成部14は、部分和モデル生成部16により生成された学習モデルについての推定誤差を入力として、グループの集合を生成する。   Further, when controlling the set generation unit 14, the control unit 24 inputs the estimation error about the learning model generated by the partial sum model generation unit 16 to the set generation unit 14. In response to this control, the set generation unit 14 generates a group set with the estimation error of the learning model generated by the partial sum model generation unit 16 as an input.

例えば、集合生成部14が、すでに2つの部分予測対象を纏めた100のグループの集合を生成している場合、制御部24は、この100のグループをさらにグループに纏めることにより、例えば、50のグループの集合を生成するように制御してもよい(図10におけるステップS2)。また、制御部24は、初めの200の部分予測対象を対象として、4つの部分予測対象を纏めた50のグループの集合を生成するよう、集合生成部14を制御してもよい(図10におけるステップS3)。   For example, when the set generation unit 14 has already generated a set of 100 groups in which two partial prediction targets are put together, the control unit 24 further puts the 100 groups into groups, for example, 50 Control may be performed to generate a set of groups (step S2 in FIG. 10). Further, the control unit 24 may control the set generation unit 14 so as to generate a set of 50 groups in which four partial prediction targets are put together for the first 200 partial prediction targets (see FIG. 10). Step S3).

このように、制御部24は、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部14を制御する。制御部24の制御により複数の構成のグループの集合が生成されると、部分和モデル生成部16は、それぞれのグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。そして、予測対象算出部18は、生成された学習モデルを用いて算出されるグループの予測値から予測対象の値を算出し、評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する。   As described above, the control unit 24 controls the set generation unit 14 so as to generate a set of groups having a different configuration from the set of groups already generated. When a group of a plurality of groups is generated under the control of the control unit 24, the partial sum model generation unit 16 generates a learning model using the sum of the partial prediction targets included in each group as an objective variable. Then, the prediction target calculation unit 18 calculates the value of the prediction target from the prediction value of the group calculated using the generated learning model, and the evaluation unit 20 calculates the value of the calculated prediction target and the performance of the prediction target. Evaluate the set of groups based on the difference with the value.

出力部22は、評価部20の評価に応じてグループの集合を出力する。具体的には、出力部22は、より良い評価のグループの集合を出力する。このとき、出力部22は、グループの集合だけでなく、その集合を構成するグループごとに生成された学習モデルを出力してもよい。   The output unit 22 outputs a set of groups according to the evaluation of the evaluation unit 20. Specifically, the output unit 22 outputs a set of groups with better evaluation. At this time, the output unit 22 may output not only a set of groups but also a learning model generated for each group included in the set.

受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24とは、プログラム(情報分析プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array ))によって実現される。   A receiving unit 10, a unit model generating unit 12, an estimation error calculating unit 13, a set generating unit 14, a partial sum model generating unit 16, a prediction target calculating unit 18, an evaluating unit 20, an output unit 22, The control unit 24 is realized by a processor (for example, a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), or a FPGA (field-programmable gate array)) that operates according to a program (information analysis program).

例えば、プログラムは、記憶部30に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、受付部10、単位モデル生成部12、推定誤差算出部13、集合生成部14、部分和モデル生成部16、予測対象算出部18、評価部20、出力部22および制御部24として動作してもよい。また、情報分析装置の機能がSaaS(Software as a Service )形式で提供されてもよい。   For example, the program is stored in the storage unit 30, and the processor reads the program, and in accordance with the program, receives the reception unit 10, the unit model generation unit 12, the estimated error calculation unit 13, the set generation unit 14, the partial sum model generation unit 16 It may operate as the prediction target calculation unit 18, the evaluation unit 20, the output unit 22, and the control unit 24. Further, the function of the information analysis device may be provided in a SaaS (Software as a Service) format.

受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。   A receiving unit 10, a unit model generating unit 12, an estimation error calculating unit 13, a set generating unit 14, a partial sum model generating unit 16, a prediction target calculating unit 18, an evaluating unit 20, an output unit 22, Each of the control units 24 may be realized by dedicated hardware. Further, some or all of the components of each device may be realized by a general-purpose or dedicated circuit, a processor, or a combination thereof. These may be configured by a single chip, or may be configured by a plurality of chips connected via a bus. Some or all of the components of each device may be realized by a combination of the above-described circuit and the like and a program.

また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。   When some or all of the components of each device are realized by a plurality of information processing devices or circuits, the plurality of information processing devices or circuits may be centrally arranged, or may be distributedly arranged. May be done. For example, the information processing device, the circuit, and the like may be realized as a form in which each is connected via a communication network, such as a client and server system or a cloud computing system.

次に、本実施形態の情報分析装置の動作を説明する。図11は、本実施形態の情報分析装置の動作例を示すフローチャートである。   Next, the operation of the information analyzer of the present embodiment will be described. FIG. 11 is a flowchart illustrating an operation example of the information analysis device of the present embodiment.

単位モデル生成部12は、部分予測対象単位に学習モデルを生成する(ステップS11)。予測対象算出部18は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する(ステップS12)。そして、評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいて、グループの集合を評価する(ステップS13)。ここでは、評価部20は、個々の部分予測対象について学習モデルを生成した場合について評価する。   The unit model generation unit 12 generates a learning model for each partial prediction target unit (step S11). The prediction target calculation unit 18 calculates the value of the prediction target from the prediction value of the group calculated using the learning model (Step S12). Then, the evaluation unit 20 evaluates the group set based on the calculated difference between the value of the prediction target and the actual value of the prediction target (step S13). Here, the evaluation unit 20 evaluates a case where a learning model is generated for each partial prediction target.

制御部24は、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するか否か判断する(ステップS14)。グループの集合を生成すると判断した場合(ステップS14におけるYes)、制御部24は、推定誤差算出部13を制御することにより、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する(ステップS21)。そして、制御部24は、集合生成部14を制御することにより、部分予測対象を複数のグループに纏めてグループの集合を生成する(ステップS15)。具体的には、集合生成部14は、算出された推定誤差の時間軸上における類似性に基づいて部分予測対象をグループに纏めることにより、グループの集合を生成する。   The control unit 24 determines whether or not to generate a group set having a configuration different from that of the already generated group set (step S14). When it is determined that a set of groups is to be generated (Yes in step S14), the control unit 24 controls the estimation error calculation unit 13 to reduce the estimation error when the value of the partial prediction target is estimated using the learning model. It is calculated along the time axis (step S21). Then, the control unit 24 controls the set generation unit 14 to group the partial prediction targets into a plurality of groups and generate a set of groups (step S15). Specifically, the set generation unit 14 generates a group set by grouping partial prediction targets into groups based on the similarity of the calculated estimation errors on the time axis.

部分和モデル生成部16は、生成されたグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する(ステップS16)。学習モデルが生成されると、予測対象算出部18が予測対象の値を算出し、評価部20がグループの集合を評価するステップS12およびステップS13の処理が繰り返される。   The partial sum model generation unit 16 generates a learning model using the sum of the partial prediction targets included in the generated group as an objective variable (Step S16). When the learning model is generated, the prediction target calculation unit 18 calculates the value of the prediction target, and the evaluation unit 20 repeats the processing of steps S12 and S13 in which the set of groups is evaluated.

一方、ステップS14において、グループの集合を生成しないと判断した場合(ステップS14におけるNo)、出力部22は、最も評価の良いグループの集合を出力する(ステップS17)。   On the other hand, when it is determined in step S14 that a set of groups is not generated (No in step S14), the output unit 22 outputs a set of groups having the highest evaluation (step S17).

以上のように、本実施形態では、単位モデル生成部12が、部分予測対象ごとに学習モデルを生成し、推定誤差算出部13が、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。また、集合生成部14が、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。そして、部分和モデル生成部16が、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、予測対象算出部18が、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。   As described above, in the present embodiment, the unit model generation unit 12 generates a learning model for each partial prediction target, and the estimation error calculation unit 13 estimates the value of the partial prediction target using the learning model. The estimation error is calculated along the time axis. In addition, the set generation unit 14 receives the estimation error as an input and corresponds to one learning model based on the similarity on the time axis between the estimation error of one learning model and the estimation error of another learning model. A group set is generated by grouping the partial prediction targets and the partial prediction targets corresponding to other learning models. Then, the partial sum model generation unit 16 generates a learning model using the sum of the partial prediction targets included in the group as the objective variable, and the prediction target calculation unit 18 calculates the prediction model from the predicted value of the group calculated using the learning model. Calculate the value to be predicted.

よって、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。   Therefore, even when each of the plurality of prediction targets has a property different from each other, if the desired prediction target is expressed by the sum of the plurality of prediction targets, the prediction accuracy of the desired prediction target is reduced. It is possible to realize a grouping of prediction targets that can be improved.

すなわち、本実施形態では、時間軸に対する推定誤差の傾向が類似する部分予測対象をグループ化して学習モデルが生成される。このように傾向の類似する部分予測対象をまとめることで、大数の法則により推定誤差が小さくなり、結果、予測精度をより向上させることが可能になる。   That is, in the present embodiment, a learning model is generated by grouping partial prediction targets having a similar tendency of the estimation error with respect to the time axis. By grouping partial prediction targets having similar tendencies in this way, the estimation error is reduced by the law of large numbers, and as a result, prediction accuracy can be further improved.

次に、上記実施形態の変形例を説明する。上記実施形態では、制御部24が異なる構成のグループの集合を生成するように集合生成部14を制御することで、生成されたグループをさらに纏めて順次グループ化する方法を説明した。   Next, a modified example of the above embodiment will be described. In the above-described embodiment, a method has been described in which the control unit 24 controls the set generation unit 14 so as to generate a set of groups having different configurations, so that the generated groups are further collectively and sequentially grouped.

一方、グループ化する粒度を変更して評価を行うことも効果的である。例えば、k−meansによるグルーピングを、kの値を変更しつつ何度も行うことが考えられる。また、学習処理には多くの時間がかかることが想定されるため、複数のサーバを並列に動作させて、評価を行うことも好ましい。   On the other hand, it is also effective to change the grouping granularity for evaluation. For example, grouping by k-means may be performed many times while changing the value of k. Further, since it is expected that the learning process will take a lot of time, it is preferable to perform the evaluation by operating a plurality of servers in parallel.

例えば、部分予測対象が200存在するとする。このとき、k=50のグルーピング処理とk=100のグルーピング処理とを、別のサーバが並列に実行し、それぞれのグループの集合に対して、学習処理、予測処理および評価処理を行ったうえで、最も評価の良いグループを出力してもよい。   For example, assume that there are 200 partial prediction targets. At this time, another server executes a grouping process of k = 50 and a grouping process of k = 100 in parallel, and performs a learning process, a prediction process, and an evaluation process on each set of groups. , The group with the highest evaluation may be output.

図12は、本発明による情報分析システムの構成例を示すブロック図である。図12に例示する情報分析システム200は、受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14aと、部分和モデル生成部16aと、予測対象算出部18aと、評価部20aと、出力部22と、記憶部30とを備えている。受付部10、単位モデル生成部12、推定誤差算出部13、出力部22および記憶部30の構成は、情報分析装置100が備える構成と同様である。   FIG. 12 is a block diagram showing a configuration example of the information analysis system according to the present invention. The information analysis system 200 illustrated in FIG. 12 includes a receiving unit 10, a unit model generating unit 12, an estimation error calculating unit 13, a set generating unit 14a, a partial sum model generating unit 16a, and a prediction target calculating unit 18a. , An evaluation unit 20a, an output unit 22, and a storage unit 30. The configurations of the receiving unit 10, the unit model generation unit 12, the estimation error calculation unit 13, the output unit 22, and the storage unit 30 are the same as the configurations of the information analysis device 100.

本変形例の集合生成部14aも、集合生成部14と同様、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、部分予測対象を複数のグループに纏めることにより、グループの集合を生成する。具体的には、集合生成部14aは、推定誤差算出部13が算出した推定誤差を入力する。そして、集合生成部14aは、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する。なお、集合生成部14aがグループの集合を生成する方法は、情報分析装置100における集合生成部14がグループの集合を生成する方法と同様である。   Similarly to the set generation unit 14, the set generation unit 14a of the present modification also sets the partial prediction target based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. By grouping a plurality of groups, a set of groups is generated. Specifically, the set generation unit 14a inputs the estimation error calculated by the estimation error calculation unit 13. Then, the set generation unit 14a groups the partial prediction targets corresponding to one learning model and the partial prediction targets corresponding to the other learning models into groups, thereby forming a first group having a different group configuration from each other. A set and a set of the second group are generated respectively. Note that the method by which the set generation unit 14a generates a group set is the same as the method by which the set generation unit 14 in the information analysis device 100 generates a group set.

なお、図12に示す例では集合生成部14aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに集合生成部14aを備えていてもよい。また、集合生成部14aが生成するグループの集合の種類は、2種類に限定されず、3種類以上であってもよい。   Although only one set generation unit 14a is shown in the example illustrated in FIG. 12, when processing is performed by a plurality of servers, the information analysis system 200 may include the set generation unit 14a for each server. Good. Further, the types of sets of groups generated by the set generation unit 14a are not limited to two types, and may be three or more types.

部分和モデル生成部16aは、第1のグループの集合と第2のグループの集合のそれぞれに対して、そのグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。部分和モデル生成部16aが学習モデルを生成する方法は、情報分析装置100における部分和モデル生成部16が学習モデルを生成する方法と同様である。   The partial sum model generation unit 16a generates, for each of the set of the first group and the set of the second group, a learning model using the sum of the partial prediction targets included in the group as an objective variable. The method in which the partial sum model generation unit 16a generates a learning model is the same as the method in which the partial sum model generation unit 16 in the information analysis device 100 generates a learning model.

なお、図12に示す例では部分和モデル生成部16aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに部分和モデル生成部16aを備えていてもよい。   In the example shown in FIG. 12, only one partial sum model generation unit 16a is shown. However, when the processing is executed by a plurality of servers, the information analysis system 200 sets the partial sum model generation unit 16a for each server. You may have.

予測対象算出部18aは、第1のグループの集合と第2のグループの集合とのそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。予測対象算出部18aが予測対象の値を算出する方法は、情報分析装置100における予測対象算出部18が予測対象の値を算出する方法と同様である。   The prediction target calculation unit 18a calculates, for each of the first group set and the second group set, a prediction target value from a predicted value of the group calculated using the learning model. The method in which the prediction target calculation unit 18a calculates the value of the prediction target is the same as the method in which the prediction target calculation unit 18 in the information analysis device 100 calculates the value of the prediction target.

なお、図12に示す例では予測対象算出部18aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに予測対象算出部18aを備えていてもよい。   In the example illustrated in FIG. 12, only one prediction target calculation unit 18a is illustrated. However, when processing is performed by a plurality of servers, the information analysis system 200 includes the prediction target calculation unit 18a for each server. You may.

評価部20aは、第1のグループの集合と第2のグループの集合のそれぞれに対して、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する。評価部20aがグループの集合を評価する方法は、情報分析装置100における評価部20がグループの集合を評価する方法と同様である。   The evaluation unit 20a evaluates the group set based on the difference between the calculated value of the prediction target and the actual value of the prediction target for each of the first group set and the second group set. The method by which the evaluation unit 20a evaluates a group set is the same as the method by which the evaluation unit 20 in the information analysis device 100 evaluates a group set.

なお、図12に示す例では評価部20aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに評価部20aを備えていてもよい。   In the example shown in FIG. 12, only one evaluation unit 20a is shown. However, when processing is performed by a plurality of servers, the information analysis system 200 may include the evaluation unit 20a for each server.

以上のように、本変形例では、集合生成部14aが、部分予測対象を複数のグループに纏めることにより、グループの集合の構成が互いに異なる複数のグループ(第1のグループの集合と第2のグループの集合)をそれぞれ生成する。そのため、上記実施形態の効果に加え、より適切に部分予測対象をグループ化できる。   As described above, in the present modification, the set generation unit 14a groups the partial prediction targets into a plurality of groups, and thereby a plurality of groups (a first group set and a second group set) having different configurations from each other. A set of groups). Therefore, in addition to the effects of the above embodiment, the partial prediction targets can be more appropriately grouped.

次に、本発明の概要を説明する。図13は、本発明による情報分析装置の概要を示すブロック図である。本発明による情報分析装置80は、予測対象(例えば、予測対象Y)が、複数の部分予測対象(例えば、部分予測対象y,y,…,y)の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部81(例えば、単位モデル生成部12)と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部82(例えば、推定誤差算出部13)と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部83(例えば、集合生成部14)と、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部84(例えば、部分和モデル生成部16)と、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部85(例えば、予測対象算出部18)とを備えている。Next, the outline of the present invention will be described. FIG. 13 is a block diagram showing an outline of an information analyzer according to the present invention. The information analyzer 80 according to the present invention, the prediction target (e.g., the prediction target Y) is a plurality of partial prediction target (e.g., partial prediction target y 1, y 2, ..., y n) in the case represented by the sum of A unit model generation unit 81 (for example, unit model generation unit 12) that generates a learning model for each partial prediction target, and an estimation error when a value of the partial prediction target is estimated using the learning model along a time axis. The estimation error calculating unit 82 (for example, the estimation error calculating unit 13) that calculates the estimation error and the similarity on the time axis between the estimation error of one learning model and the estimation error of the other learning model with the estimation error as an input. On the basis of the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model, the group generation unit 83 (e.g., For example, a set generation unit 14), a partial sum model generation unit 84 (for example, a partial sum model generation unit 16) that generates a learning model using a sum of partial prediction targets included in a group as an objective variable, and a learning model And a prediction target calculation unit 85 (for example, the prediction target calculation unit 18) that calculates the value of the prediction target from the prediction value of the group calculated by the calculation.

そのような構成により、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。   With such a configuration, even when each of the plurality of prediction targets has a different property from each other, when the desired prediction target is expressed by the sum of the plurality of prediction targets, the desired prediction target is expressed. Can be grouped such that the prediction accuracy of the prediction target is improved.

また、情報分析装置80は、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部(例えば、評価部20)と、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部83を制御する制御部(例えば、制御部24)とを備えていてもよい。そして、集合生成部83は、制御部の制御に応じてグループの集合を生成し、評価部は、生成された各グループの集合を評価してもよい。   Further, the information analysis device 80 includes an evaluation unit (e.g., the evaluation unit 20) that evaluates a set of groups based on a difference between the calculated value of the prediction target and the actual value of the prediction target, and a A control unit (for example, the control unit 24) that controls the set generation unit 83 so as to generate a set of groups having a configuration different from the set may be provided. Then, the set generation unit 83 generates a set of groups under the control of the control unit, and the evaluation unit may evaluate the generated set of each group.

さらに、制御部は、部分和モデル生成部84が生成した学習モデルについての推定誤差が算出されるように推定誤差算出部82を制御してもよい。このとき、推定誤差算出部82は、部分和モデル生成部84が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。また、制御部は、集合生成部83を制御する際に、部分和モデル生成部84が生成した学習モデルについての推定誤差を、集合生成部83に入力してもよい。このとき、集合生成部83は、部分和モデル生成部84が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する。そのような構成により、グループの集合を順次少なくしていくことが可能になる。   Further, the control unit may control the estimation error calculation unit 82 to calculate an estimation error for the learning model generated by the partial sum model generation unit 84. At this time, the estimation error calculation unit 82 calculates the estimation error along the time axis when the value of the partial prediction target is estimated using the learning model generated by the partial sum model generation unit 84. When controlling the set generation unit 83, the control unit may input the estimation error of the learning model generated by the partial sum model generation unit 84 to the set generation unit 83. At this time, the set generation unit 83 generates a group set by using the estimation error of the learning model generated by the partial sum model generation unit 84 as an input. With such a configuration, it is possible to sequentially reduce the number of groups.

また、情報分析装置80は、評価部の評価に応じてグループの集合を出力する出力部(例えば、出力部22)を備えていてもよい。このとき、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数(例えば、上記式1に示す評価関数W)を用いてグループの集合を評価し、出力部は、評価がより良いグループの集合を出力してもよい。   Further, the information analysis device 80 may include an output unit (for example, the output unit 22) that outputs a set of groups according to the evaluation of the evaluation unit. At this time, the evaluation unit sets an evaluation function (e.g., the evaluation function W shown in the above formula 1) designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. The output unit may output a set of groups having a better evaluation.

また、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数(例えば、上記式2に示す評価関数W)を用いてグループの集合を評価してもよい。   In addition, the evaluation unit performs better as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller, and the smaller the number of groups forming the group set, the better the evaluation. The set of groups may be evaluated using an evaluation function designed as described above (for example, the evaluation function W shown in Expression 2 above).

また、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、各グループに対応する各学習モデルについて、各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数(例えば、上記式3に示す評価関数W)を用いてグループの集合を評価してもよい。   Also, the evaluation unit is included in each learning model so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and for each learning model corresponding to each group. The set of groups may be evaluated using an evaluation function (e.g., the evaluation function W shown in Expression 3) designed so that the smaller the total number of explanatory variables having non-zero coefficients, the better the evaluation.

図14は、本発明による情報分析システムの概要を示すブロック図である。本発明による情報分析システム90は、予測対象(例えば、予測対象Y)が、複数の部分予測対象(例えば、部分予測対象y,y,…,y)の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部91(例えば、単位モデル生成部12)と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部92(例えば、推定誤差算出部13)と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部93(例えば、集合生成部14a)と、第1のグループの集合と第2のグループの集合とのそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部94(例えば、部分和モデル生成部16a)と、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部95(例えば、予測対象算出部18a)と、第1のグループの集合と第2のグループの集合とのそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部96(例えば、評価部20a)とを備えている。FIG. 14 is a block diagram showing an outline of the information analysis system according to the present invention. Information analysis system 90 according to the present invention, the prediction target (e.g., the prediction target Y) is a plurality of partial prediction target (e.g., partial prediction target y 1, y 2, ..., y n) in the case represented by the sum of A unit model generation unit 91 (for example, unit model generation unit 12) that generates a learning model for each partial prediction target, and an estimation error when a value of the partial prediction target is estimated using the learning model along a time axis. The estimation error calculation unit 92 (for example, the estimation error calculation unit 13) that calculates the estimation error and the similarity on the time axis between the estimation error of one learning model and the estimation error of the other learning model are input. By grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into groups based on the A set generation unit 93 (for example, a set generation unit 14a) that generates a set of groups and a set of second groups, respectively, and a set of the first group and a set of the second group, respectively. A partial sum model generation unit 94 (for example, a partial sum model generation unit 16a) that generates a learning model using a sum of partial prediction targets included in a group as an objective variable, a set of a first group and a set of a second group , A prediction target calculation unit 95 (for example, a prediction target calculation unit 18a) that calculates a value of a prediction target from a prediction value of a group calculated using the learning model, a set of the first group, An evaluation unit 96 (e.g., the evaluation unit 20a) that evaluates the group set based on the difference between the value of the prediction target and the actual value of the prediction target for each of the two group sets. There.

そのような構成によっても、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。   According to such a configuration, even when each of the plurality of prediction targets has a different property from each other, the desired prediction target is represented by the sum of the plurality of prediction targets. It is possible to realize grouping of prediction targets that improves the prediction accuracy of the targets.

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。   Some or all of the above embodiments may be described as in the following supplementary notes, but are not limited thereto.

(付記1)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部とを備えたことを特徴とする情報分析装置。 (Supplementary Note 1) When the prediction target is represented by a sum of a plurality of partial prediction targets, a unit model generation unit that generates a learning model for each of the partial prediction targets, and a unit model generation unit that generates a learning model using the learning model. An estimation error calculation unit that calculates an estimation error in the case of estimating a value along a time axis, and a time axis of an estimation error for one learning model and an estimation error for another learning model, using the estimation error as an input. A set generation unit that generates a group set by grouping the partial prediction targets corresponding to the one learning model and the partial prediction targets corresponding to the other learning model based on the similarity above, A partial sum model generation unit that generates a learning model using a sum of partial prediction targets included in a group as an objective variable, and prediction of a group calculated using the learning model Information analysis apparatus is characterized in that a prediction target calculation unit for calculating a value of the prediction target from.

(付記2)算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部と、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部を制御する制御部とを備え、集合生成部は、前記制御部の制御に応じてグループの集合を生成し、前記評価部は、生成された各グループの集合を評価する付記1記載の情報分析装置。 (Supplementary Note 2) An evaluation unit that evaluates a set of groups based on a difference between the calculated value of the prediction target and an actual value of the prediction target, and generates a set of groups having a configuration different from that of the already generated group. And a control unit that controls the set generation unit so that the set generation unit generates a set of groups according to the control of the control unit, and the evaluation unit evaluates the generated set of each group. The information analyzer according to attachment 1.

(付記3)制御部は、部分和モデル生成部が生成した学習モデルについての推定誤差が算出されるように前記推定誤差算出部を制御し、推定誤差算出部は、部分和モデル生成部が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、制御部は、集合生成部を制御する際に、部分和モデル生成部が生成した学習モデルについての推定誤差を、集合生成部に入力し、集合生成部は、部分和モデル生成部が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する付記2に記載の情報分析装置。 (Supplementary Note 3) The control unit controls the estimation error calculation unit so that an estimation error for the learning model generated by the partial sum model generation unit is calculated, and the estimation error calculation unit is configured by the partial sum model generation unit. The estimation error when estimating the value of the partial prediction target using the learned learning model is calculated along the time axis, and the control unit, when controlling the set generation unit, generates the learning model generated by the partial sum model generation unit. The information analysis device according to supplementary note 2, wherein an estimation error about the learning model is input to a set generation unit, and the set generation unit generates a group set using the estimation error about the learning model generated by the partial sum model generation unit as an input.

(付記4)評価部の評価に応じてグループの集合を出力する出力部を備え、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記出力部は、前記評価がより良いグループの集合を出力する付記2または付記3記載の情報分析装置。 (Supplementary Note 4) An output unit that outputs a set of groups according to the evaluation of the evaluation unit is provided, and the evaluation unit performs better as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. The information analysis device according to Supplementary Note 2 or 3, wherein the output unit evaluates a set of groups using an evaluation function designed in (2), and the output unit outputs the set of groups having the better evaluation.

(付記5)評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する付記4記載の情報分析装置。 (Supplementary Note 5) The evaluation unit performs the evaluation such that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target is, the better the evaluation is, and the smaller the number of groups constituting the group set is, the better the evaluation is. The information analysis device according to attachment 4, wherein the set of groups is evaluated using an evaluation function designed to be:

(付記6)評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、各グループに対応する各学習モデルについて、当該各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する付記4記載の情報分析装置。 (Supplementary Note 6) The evaluation unit performs, for each learning model corresponding to each group, a better evaluation as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. 4. The information analysis device according to claim 4, wherein a set of groups is evaluated using an evaluation function designed to perform better as the sum of the number of explanatory variables having non-zero coefficients included in.

(付記7)推定誤差算出部は、各部分予測対象の推定誤差を標準化し、集合生成部は、標準化された推定誤差を入力としてグループの集合を生成する付記1から付記6のうちのいずれか1つに記載の情報分析装置。 (Supplementary Note 7) The estimation error calculation unit standardizes the estimation errors of the respective partial prediction targets, and the set generation unit generates a group set by using the standardized estimation errors as an input. An information analyzer according to one of the above.

(付記8)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価部とを備えたことを特徴とする情報分析システム。 (Supplementary Note 8) In the case where the prediction target is represented by the sum of a plurality of partial prediction targets, a unit model generating unit that generates a learning model for each of the partial prediction targets, and An estimation error calculation unit that calculates an estimation error in the case of estimating a value along a time axis, and a time axis of an estimation error for one learning model and an estimation error for another learning model, using the estimation error as an input. On the basis of the above similarity, a partial prediction target corresponding to the one learning model and a partial prediction target corresponding to the other learning model are grouped into a group, so that the first group is different from the first group in the configuration of the group set. A set generation unit that respectively generates a set of groups of the first group and a set of second groups; and a pair of each of the set of the first group and the set of the second group. A partial sum model generation unit that generates a learning model using a sum of the partial prediction targets included in the group as an objective variable, and a set of the first group and a set of the second group. A prediction target calculation unit that calculates the value of the prediction target from a prediction value of the group calculated using the learning model, and a set of the first group and a set of the second group, An information analysis system, comprising: an evaluation unit that evaluates the set of groups based on a difference between the value of the prediction target and the actual value of the prediction target.

(付記9)評価部の評価に応じてグループの集合を出力する出力部を備え、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記出力部は、前記評価がより良いグループの集合を出力する付記8記載の情報分析システム。 (Supplementary Note 9) An output unit that outputs a set of groups in accordance with the evaluation of the evaluation unit is provided. The evaluation unit performs better as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. 9. The information analysis system according to claim 8, wherein the set of groups is evaluated using an evaluation function designed as described above, and the output unit outputs the set of groups having a better evaluation.

(付記10)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成し、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出することを特徴とする情報分析方法。 (Supplementary Note 10) When the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each of the partial prediction targets, and the value of the partial prediction target is estimated using the learning model. The estimation error is calculated along the time axis, and the estimation error is used as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. The group of partial prediction targets corresponding to the learning model and the partial prediction target corresponding to the other learning model are combined into a group to generate a set of groups, and the sum of the partial prediction targets included in the group is used as the target variable. An information analysis method, comprising: generating a learning model; and calculating a value of the prediction target from a predicted value of a group calculated using the learning model.

(付記11)すでに生成されたグループの集合とは異なる構成のグループの集合を1つ以上生成し、算出された予測対象の値と予測対象の実績値との差分に基づいて各グループの集合を評価する付記10記載の情報分析方法。 (Supplementary Note 11) One or more sets of groups having a configuration different from the set of groups already generated are generated, and each set of groups is determined based on the difference between the calculated value of the prediction target and the actual value of the prediction target. The information analysis method according to Supplementary Note 10 to be evaluated.

(付記12)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成し、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価することを特徴とする情報分析方法。 (Supplementary Note 12) When the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each of the partial prediction targets, and the value of the partial prediction target is estimated using the learning model. The estimation error is calculated along the time axis, and the estimation error is used as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. By grouping the partial prediction target corresponding to the learning model and the partial prediction target corresponding to the other learning model into a group, the first group and the second group are different from each other in the configuration of the group. And generating a sum of the partial prediction targets included in the group for each of the first group set and the second group set. Generating a learning model as an objective variable, and for each of the set of the first group and the set of the second group, the value of the prediction target from the predicted value of the group calculated using the learning model. Is calculated, and for each of the set of the first group and the set of the second group, the set of the groups is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target. An information analysis method, characterized in that:

(付記13)算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記評価がより良いグループの集合を出力する付記12記載の情報分析方法。 (Supplementary Note 13) A set of groups is evaluated using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. 13. The information analysis method according to Supplementary Note 12, wherein the set of information is output.

(付記14)コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理を実行させるための情報分析プログラム。 (Supplementary Note 14) A unit model generation process of generating a learning model for each of the partial prediction targets when the prediction target is represented by a sum of a plurality of partial prediction targets in the computer, and performing the partial prediction using the learning model. Estimation error calculation processing for calculating an estimation error in the case of estimating a target value along a time axis, and using the estimation error as an input, a time between an estimation error for one learning model and an estimation error for another learning model. A set generation process of generating a group set by grouping partial prediction targets corresponding to the one learning model and partial prediction targets corresponding to the other learning model based on the similarity on the axis; A partial sum model generation process for generating a learning model using a sum of partial prediction targets included in a group as an objective variable, and using the learning model Information analysis program for the predicted value of the group is calculated to execute the prediction target calculation processing of calculating a value of the prediction target.

(付記15)コンピュータに、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価処理、および、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成処理を制御する制御処理を実行させ、集合生成処理で、前記制御処理による制御に応じてグループの集合を生成させ、前記評価処理で、生成された各グループの集合を評価させる付記14記載の情報分析プログラム。 (Supplementary Note 15) An evaluation process for evaluating a set of groups based on a difference between the calculated value of the prediction target and the actual value of the prediction target, and a group having a configuration different from that of the already generated group Control processing to control the set generation processing so as to generate a set of groups, in the set generation processing, to generate a set of groups according to the control by the control processing, and in the evaluation processing, for each group generated in the evaluation processing The information analysis program according to Supplementary Note 14, which causes the set to be evaluated.

(付記16)コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理、および、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価処理を実行させるための情報分析プログラム。 (Supplementary Note 16) A unit model generation process of generating a learning model for each of the partial prediction targets when the prediction target is represented by a sum of a plurality of partial prediction targets in the computer, and performing the partial prediction using the learning model. Estimation error calculation processing for calculating an estimation error in the case of estimating a target value along a time axis, and using the estimation error as an input, a time between an estimation error for one learning model and an estimation error for another learning model. Based on the similarity on the axis, the partial prediction target corresponding to the one learning model and the partial prediction target corresponding to the other learning model are grouped into a group, so that the configurations of the groups are different from each other. A set generation process for respectively generating a set of one group and a set of second groups; and a process of generating the set of the first group and the set of the second group. For each of the cases, a partial sum model generation process of generating a learning model using a sum of the partial prediction targets included in the group as an objective variable, and a first group set and a second group set For each, a prediction target calculation process of calculating the value of the prediction target from the prediction value of the group calculated using the learning model, and a set of the first group and a set of the second group An information analysis program for executing an evaluation process for evaluating a set of the groups based on a difference between a value of the prediction target and an actual value of the prediction target.

(付記17)コンピュータに、評価処理での評価に応じてグループの集合を出力する出力処理を実行させ、評価処理で、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価させ、前記出力処理で、前記評価がより良いグループの集合を出力させる付記16記載の情報分析プログラム。 (Supplementary Note 17) The computer causes the computer to execute an output process of outputting a set of groups in accordance with the evaluation in the evaluation process. In the evaluation process, the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the smaller the difference. 17. The information analysis program according to claim 16, wherein a set of groups is evaluated using an evaluation function designed to be a good evaluation, and the set of groups having a better evaluation is output in the output processing.

10 受付部
12 単位モデル生成部
13 推定誤差算出部
14,14a 集合生成部
16,16a 部分和モデル生成部
18,18a 予測対象算出部
20,20a 評価部
22 出力部
24 制御部
30 記憶部
100 情報分析装置
200 情報分析システム
Reference Signs List 10 reception unit 12 unit model generation unit 13 estimation error calculation unit 14, 14a set generation unit 16, 16a partial sum model generation unit 18, 18a prediction target calculation unit 20, 20a evaluation unit 22 output unit 24 control unit 30 storage unit 100 information Analysis device 200 Information analysis system

Claims (12)

予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部とを備えた
ことを特徴とする情報分析装置。
When the prediction target is represented by the sum of a plurality of partial prediction targets,
A unit model generation unit that generates a learning model for each of the partial prediction targets,
An estimation error calculation unit that calculates an estimation error when estimating the value of the partial prediction target using the learning model along a time axis,
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other A set generation unit that generates a set of groups by grouping partial prediction targets corresponding to the learning model of
A partial sum model generation unit that generates a learning model using a sum of partial prediction targets included in the group as an objective variable,
A prediction target calculation unit configured to calculate the value of the prediction target from a prediction value of a group calculated using the learning model.
算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部と、
すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部を制御する制御部とを備え、
集合生成部は、前記制御部の制御に応じてグループの集合を生成し、
前記評価部は、生成された各グループの集合を評価する
請求項1記載の情報分析装置。
An evaluation unit that evaluates a set of groups based on a difference between the calculated value of the prediction target and the actual value of the prediction target,
A control unit that controls a set generation unit to generate a set of groups having a different configuration from the set of groups already generated,
The set generation unit generates a set of groups according to the control of the control unit,
The information analysis device according to claim 1, wherein the evaluation unit evaluates the generated set of each group.
制御部は、部分和モデル生成部が生成した学習モデルについての推定誤差が算出されるように前記推定誤差算出部を制御し、
推定誤差算出部は、部分和モデル生成部が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
制御部は、集合生成部を制御する際に、部分和モデル生成部が生成した学習モデルについての推定誤差を、集合生成部に入力し、
集合生成部は、部分和モデル生成部が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する
請求項2に記載の情報分析装置。
The control unit controls the estimation error calculation unit such that an estimation error for the learning model generated by the partial sum model generation unit is calculated,
The estimation error calculation unit calculates an estimation error when the value of the partial prediction target is estimated using the learning model generated by the partial sum model generation unit along the time axis,
The control unit, when controlling the set generation unit, inputs the estimation error about the learning model generated by the partial sum model generation unit to the set generation unit,
The information analysis device according to claim 2, wherein the set generation unit generates a set of groups by using an estimation error of the learning model generated by the partial sum model generation unit as an input.
評価部の評価に応じてグループの集合を出力する出力部を備え、
評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、
前記出力部は、前記評価がより良いグループの集合を出力する
請求項2または請求項3記載の情報分析装置。
An output unit that outputs a set of groups according to the evaluation of the evaluation unit,
The evaluation unit evaluates the set of groups using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation,
The information analysis device according to claim 2, wherein the output unit outputs a set of groups having the better evaluation.
評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する
請求項4記載の情報分析装置。
The evaluation unit is configured such that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target is, the better the evaluation is, and the smaller the number of groups constituting the group set is, the better the evaluation is. The information analysis device according to claim 4, wherein the set of groups is evaluated using the designed evaluation function.
評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、各グループに対応する各学習モデルについて、当該各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する
請求項4記載の情報分析装置。
The evaluation unit determines that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target is, the better the evaluation is, and for each learning model corresponding to each group, The information analysis device according to claim 4, wherein a set of groups is evaluated using an evaluation function designed to perform better as the total number of explanatory variables having zero coefficients is smaller.
推定誤差算出部は、各部分予測対象の推定誤差を標準化し、
集合生成部は、標準化された推定誤差を入力としてグループの集合を生成する
請求項1から請求項6のうちのいずれか1項に記載の情報分析装置。
The estimation error calculation unit standardizes the estimation error of each partial prediction target,
The information analysis device according to any one of claims 1 to 6, wherein the set generation unit generates a set of groups by using the standardized estimation error as an input.
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価部とを備えた
ことを特徴とする情報分析システム。
When the prediction target is represented by the sum of a plurality of partial prediction targets,
A unit model generation unit that generates a learning model for each of the partial prediction targets,
An estimation error calculation unit that calculates an estimation error when estimating the value of the partial prediction target using the learning model along a time axis,
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other A set generation unit that generates a first group set and a second group set having different configurations from each other by grouping partial prediction targets corresponding to the learning models of
A partial sum model generation unit configured to generate, for each of the set of the first group and the set of the second group, a learning model using a sum of the partial prediction targets included in the group as an objective variable;
For each of the set of the first group and the set of the second group, a prediction target calculation unit that calculates the value of the prediction target from the predicted value of the group calculated using the learning model;
For each of the first group set and the second group set, an evaluation unit that evaluates the group set based on the difference between the value of the prediction target and the actual value of the prediction target. An information analysis system characterized by comprising:
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成し、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する
ことを特徴とする情報分析方法。
When the prediction target is represented by the sum of a plurality of partial prediction targets,
Generating a learning model for each of the partial prediction targets,
Calculate along the time axis an estimation error when estimating the value of the partial prediction target using the learning model,
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other Generate a group set by grouping partial prediction targets corresponding to the learning model of
Generate a learning model using the sum of the partial prediction targets included in the group as an objective variable,
An information analysis method, wherein a value of the prediction target is calculated from a predicted value of a group calculated using the learning model.
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成し、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する
ことを特徴とする情報分析方法。
When the prediction target is represented by the sum of a plurality of partial prediction targets,
Generating a learning model for each of the partial prediction targets,
Calculate along the time axis an estimation error when estimating the value of the partial prediction target using the learning model,
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other By grouping the partial prediction targets corresponding to the learning models of the above into a group, a first group set and a second group set having different configurations of the group sets are respectively generated,
For each of the set of the first group and the set of the second group, generate a learning model using a sum of the partial prediction targets included in the group as an objective variable,
For each of the set of the first group and the set of the second group, calculate the value of the prediction target from the predicted value of the group calculated using the learning model;
For each of the set of the first group and the set of the second group, the set of the groups is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target. Information analysis method.
コンピュータに、
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理
を実行させるための情報分析プログラム。
On the computer,
When the prediction target is represented by the sum of a plurality of partial prediction targets,
A unit model generation process for generating a learning model for each of the partial prediction targets,
An estimation error calculation process of calculating an estimation error when estimating the value of the partial prediction target using the learning model along a time axis;
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other Set generation processing for generating a group set by grouping partial prediction targets corresponding to the learning model of
A partial sum model generation process of generating a learning model using a sum of partial prediction targets included in the group as an objective variable, and
An information analysis program for executing a prediction target calculation process of calculating a value of the prediction target from a prediction value of a group calculated using the learning model.
コンピュータに、
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理、および、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価処理
を実行させるための情報分析プログラム。
On the computer,
When the prediction target is represented by the sum of a plurality of partial prediction targets,
A unit model generation process for generating a learning model for each of the partial prediction targets,
An estimation error calculation process of calculating an estimation error when estimating the value of the partial prediction target using the learning model along a time axis;
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other A set generation process of generating a first group set and a second group set having different configurations of the group sets by grouping partial prediction targets corresponding to the learning models of
A partial sum model generation process for generating, for each of the set of the first group and the set of the second group, a learning model using a sum of the partial prediction targets included in the group as an objective variable;
For each of the set of the first group and the set of the second group, a prediction target calculation process of calculating the value of the prediction target from the prediction value of the group calculated using the learning model; and
For each of the first group set and the second group set, an evaluation process of evaluating the group set based on a difference between the value of the prediction target and the actual value of the prediction target is executed. Information analysis program to let you.
JP2019541555A 2017-09-13 2017-09-13 Information analyzer, information analysis method and information analysis program Active JP6849084B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/033107 WO2019053827A1 (en) 2017-09-13 2017-09-13 Information analysis device, information analysis method, and information analysis program

Publications (2)

Publication Number Publication Date
JPWO2019053827A1 true JPWO2019053827A1 (en) 2020-04-09
JP6849084B2 JP6849084B2 (en) 2021-03-24

Family

ID=65722603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019541555A Active JP6849084B2 (en) 2017-09-13 2017-09-13 Information analyzer, information analysis method and information analysis program

Country Status (2)

Country Link
JP (1) JP6849084B2 (en)
WO (1) WO2019053827A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240799A (en) * 1997-02-27 1998-09-11 Nri & Ncc Co Ltd Support device for new store opening evaluation
JP2006085645A (en) * 2004-09-17 2006-03-30 Canon System Solutions Inc Data predicting device and data predicting method, and program
JP2013196037A (en) * 2012-03-15 2013-09-30 Hitachi Ltd Demand prediction system and demand prediction method
JP2017094097A (en) * 2015-11-27 2017-06-01 株式会社東芝 Medical image processing device, x-ray computer tomographic imaging device, and medical image processing method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240799A (en) * 1997-02-27 1998-09-11 Nri & Ncc Co Ltd Support device for new store opening evaluation
JP2006085645A (en) * 2004-09-17 2006-03-30 Canon System Solutions Inc Data predicting device and data predicting method, and program
JP2013196037A (en) * 2012-03-15 2013-09-30 Hitachi Ltd Demand prediction system and demand prediction method
JP2017094097A (en) * 2015-11-27 2017-06-01 株式会社東芝 Medical image processing device, x-ray computer tomographic imaging device, and medical image processing method

Also Published As

Publication number Publication date
JP6849084B2 (en) 2021-03-24
WO2019053827A1 (en) 2019-03-21

Similar Documents

Publication Publication Date Title
Claveria et al. Forecasting tourism demand to Catalonia: Neural networks vs. time series models
Dejonckheere et al. Measuring and avoiding the bullwhip effect: A control theoretic approach
JP6992526B2 (en) Demand forecasting program, demand forecasting method and demand forecasting device
WO2017037881A1 (en) Online prediction system and method
JP2014157457A (en) Prediction device and prediction method
WO2018079367A1 (en) Commodity demand prediction system, commodity demand prediction method, and commodity demand prediction program
US10074142B1 (en) Computational architecture and method for a time-varying control system
Poler et al. Forecasting model selection through out-of-sample rolling horizon weighted errors
WO2018088277A1 (en) Prediction model generation system, method, and program
JP5251217B2 (en) Sales number prediction system, operation method of sales number prediction system, and sales number prediction program
WO2016205153A1 (en) Incremental estimation for probabilistic forecaster
JP2021043477A (en) Demand forecasting device, demand forecasting method, and program
JPWO2018061623A1 (en) Evaluation apparatus and evaluation method
WO2019187289A1 (en) Evaluation system, evaluation method, and program for evaluation
JP6828830B2 (en) Evaluation system, evaluation method and evaluation program
JPWO2019053828A1 (en) Information analysis device, information analysis method, and information analysis program
JPWO2019053827A1 (en) Information analysis device, information analysis method, and information analysis program
WO2018088276A1 (en) Prediction model generation system, method, and program
JP7212231B2 (en) Information processing device, method and program
JP7480844B2 (en) Demand forecasting device, demand forecasting method, and demand forecasting program
WO2023084781A1 (en) Arrival quantity prediction model generation device, transaction quantity prediction device, arrival quantity prediction model generation method, transaction quantity prediction method, and arrival quantity prediction model generation program
US11586947B2 (en) Visualization system, visualization method, and visualization program
JP6449578B2 (en) Purchase forecast analysis system and program thereof
WO2023209983A1 (en) Parameter generation device, system, method and program
WO2021079457A1 (en) Optimization device, optimization method, and non-transitory computer-readable medium in which optimization program has been stored

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191204

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210215

R150 Certificate of patent or registration of utility model

Ref document number: 6849084

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150