JPWO2019053827A1 - Information analysis device, information analysis method, and information analysis program - Google Patents
Information analysis device, information analysis method, and information analysis program Download PDFInfo
- Publication number
- JPWO2019053827A1 JPWO2019053827A1 JP2019541555A JP2019541555A JPWO2019053827A1 JP WO2019053827 A1 JPWO2019053827 A1 JP WO2019053827A1 JP 2019541555 A JP2019541555 A JP 2019541555A JP 2019541555 A JP2019541555 A JP 2019541555A JP WO2019053827 A1 JPWO2019053827 A1 JP WO2019053827A1
- Authority
- JP
- Japan
- Prior art keywords
- learning model
- group
- prediction target
- partial
- estimation error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims description 55
- 238000004364 calculation method Methods 0.000 claims abstract description 77
- 238000011156 evaluation Methods 0.000 claims description 115
- 238000000034 method Methods 0.000 claims description 54
- 230000008569 process Effects 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 24
- 238000012854 evaluation process Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 23
- 230000008859 change Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Abstract
単位モデル生成部81は、部分予測対象ごとに学習モデルを生成する。推定誤差算出部82は、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。集合生成部83は、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。部分和モデル生成部84は、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。予測対象算出部85は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。The unit model generation unit 81 generates a learning model for each partial prediction target. The estimation error calculation unit 82 calculates an estimation error when the value of the partial prediction target is estimated using the learning model along the time axis. The set generation unit 83 receives the estimation error as an input, and based on the similarity on the time axis between the estimation error of the one learning model and the estimation error of the other learning model, the partial prediction corresponding to the one learning model. A group set is generated by grouping the target and the partial prediction target corresponding to another learning model. The partial sum model generation unit 84 generates a learning model in which the sum of partial prediction targets included in the group is used as an objective variable. The prediction target calculation unit 85 calculates the value of the prediction target from the predicted value of the group calculated using the learning model.
Description
本発明は、複数の予測対象をグループ化して情報を分析する情報分析装置、情報分析方法および情報分析プログラムに関する。 The present invention relates to an information analysis device, an information analysis method, and an information analysis program for analyzing information by grouping a plurality of prediction targets.
全体としての予測結果を得ようとする場合、個々の対象ごとに予測モデルを作成する代わりに、複数の対象をグループ化し、そのグループ毎に予測を行う場合がある。 When trying to obtain a prediction result as a whole, instead of creating a prediction model for each individual object, a plurality of objects may be grouped and prediction may be performed for each group.
例えば、特許文献1には、電力系統に接続された多数の需要家からなるエネルギーコミュニティに係る電力需要調整システムが記載されている。具体的には、特許文献1には、需要数が増加するほど、すなわち需要家グループの規模が大きくなるほど、その需要家グループの需要予測精度が高くなり、分散が小さくなることが記載されている。また、特許文献1には、需要家グループの規模とその需要家グループの需要電力の総量とがほぼ比例し、このような状況において、需要家グループの規模が或る値になるときに予測と実績との差が最小になり、それより需要家数が増加および減少すると、その差が増加することが記載されている。特許文献1に記載された電力需要調整システムは、このような需要家グループの規模と予測と実績との関係を利用して、需要家グループの規模を決定し、その需要家グループの電力需要を予測する。
For example,
しかし、特許文献1に記載された電力需要調整システムは、個々の需要家が互いに異なる性質を有していることを考慮していない。具体的には、特許文献1に記載された電力需要調整システムは、「需要家グループの規模」と「推定精度・分散・需要電力総量・予測と実績との差」との間に、上述する関係が成立することを前提とする。しかし、個々の需要家が互いに異なる性質を有している場合、グループ化する需要家に応じて、上述する関係は変化する。
However, the power demand adjustment system described in
すなわち、特許文献1に記載された電力需要調整システムは、予測精度の観点からどの需要家同士を同じグループにするのか考慮されていないため、グループ化することによって必ずしも予測精度を向上できるとは言い難い。
That is, the power demand adjustment system described in
そこで、本発明は、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる情報分析装置、情報分析方法および情報分析プログラムを提供することを目的とする。 Therefore, the present invention provides a method for generating a desired prediction target even when each of the plurality of prediction targets has a different property from each other, when the desired prediction target is expressed by the sum of the plurality of prediction targets. It is an object of the present invention to provide an information analysis device, an information analysis method, and an information analysis program capable of realizing a grouping of prediction targets to improve the prediction accuracy of the information.
本発明による情報分析装置は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部とを備えたことを特徴とする。 An information analysis device according to the present invention includes a unit model generation unit that generates a learning model for each partial prediction target when the prediction target is expressed by a sum of a plurality of partial prediction targets, and a partial prediction target using the learning model. An estimation error calculation unit that calculates an estimation error along the time axis when the value of is estimated, and a time axis between the estimation error of one learning model and the estimation error of another learning model with the estimation error as an input. A set generation unit that generates a group set by grouping the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model into groups based on the similarity described above; A partial sum model generation unit that generates a learning model using the sum of the partial prediction targets to be calculated as the objective variable, and a prediction target from the prediction values of the group calculated using the learning model. Characterized in that a prediction target calculation unit for calculating a value.
本発明による情報分析システムは、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部と、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部とを備えたことを特徴とする。 An information analysis system according to the present invention, when a prediction target is represented by a sum of a plurality of partial prediction targets, a unit model generation unit that generates a learning model for each partial prediction target, and a partial prediction target using the learning model. An estimation error calculation unit that calculates an estimation error along the time axis when the value of is estimated, and a time axis between the estimation error of one learning model and the estimation error of another learning model with the estimation error as an input. Based on the above similarity, the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model are put into a group, so that the configuration of the first group is different from that of the first group. A set generation unit for generating a set and a set of the second group, respectively, and a group for each of the set of the first group and the set of the second group A partial sum model generation unit that generates a learning model using a sum of partial prediction targets included as an objective variable, and a first group set and a second group set, each of which is calculated using a learning model. A prediction target calculation unit that calculates a value of a prediction target from a prediction value of a group to be predicted, and a set of a prediction target value and a prediction target actual value for each of a first group set and a second group set. An evaluation unit that evaluates a set of groups based on the difference.
本発明による情報分析方法は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成し、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出することを特徴とする。 The information analysis method according to the present invention generates a learning model for each partial prediction target when the prediction target is expressed by a sum of a plurality of partial prediction targets, and estimates the value of the partial prediction target using the learning model. The estimation error of the case is calculated along the time axis, and the estimation error is used as an input, based on the similarity on the time axis between the estimation error of one learning model and the estimation error of the other learning model. A set of groups is generated by grouping a partial prediction target corresponding to a learning model and a partial prediction target corresponding to another learning model, and a learning model in which the sum of the partial prediction targets included in the group is used as an objective variable. The value of the prediction target is calculated from the predicted value of the group generated and calculated using the learning model.
本発明による他の情報分析方法は、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成し、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出し、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価することを特徴とする。 Another information analysis method according to the present invention is such that, when a prediction target is represented by a sum of a plurality of partial prediction targets, a learning model is generated for each partial prediction target, and the value of the partial prediction target is calculated using the learning model. The estimation error in the case of estimation is calculated along the time axis, and the estimation error is used as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model, By grouping a partial prediction target corresponding to one learning model and a partial prediction target corresponding to another learning model into a group, a set of a first group and a set of a second group having different group configurations from each other And a learning model in which the sum of the partial prediction targets included in the group is used as an objective variable for each of the first group set and the second group set. Generating, for each of the first group set and the second group set, a value to be predicted from the predicted value of the group calculated using the learning model, and calculating the value of the first group and For each set of the second group, the set of groups is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target.
本発明による情報分析プログラムは、コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成処理、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出処理を実行させることを特徴とする。 An information analysis program according to the present invention is configured such that, when a prediction target is represented by a sum of a plurality of partial prediction targets, a computer uses a unit model generation process for generating a learning model for each partial prediction target, Estimation error calculation processing for calculating the estimation error along the time axis when the value of the prediction target is estimated, and the time between the estimation error for one learning model and the estimation error for the other learning model with the estimation error as input. Set generation processing for generating a group set by grouping a partial prediction target corresponding to one learning model and a partial prediction target corresponding to another learning model into a group based on the similarity on the axis, included in the group Partial sum model generation processing for generating a learning model using the sum of the partial prediction targets to be calculated as the objective variable, and calculation using the learning model. Characterized in that to execute the prediction target calculation process for calculating the value of the predicted target from the predicted value of the group.
本発明による他の情報分析プログラムは、コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成処理、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、第1のグループの集合と第2のグループの集合のそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出処理、および、第1のグループの集合と第2のグループの集合のそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価処理を実行させることを特徴とする。 Another information analysis program according to the present invention uses a unit model generation process that generates a learning model for each partial prediction target when a prediction target is expressed by a sum of a plurality of partial prediction targets, and a learning model. Estimation error calculation processing for calculating the estimation error when estimating the value of the partial prediction target along the time axis, using the estimation error as an input, the estimation error for one learning model and the estimation error for the other learning model. By grouping the partial prediction targets corresponding to one learning model and the partial prediction targets corresponding to the other learning models into groups based on the similarity on the time axis of Generation processing for generating a group set of the first group and a set of the second group, respectively, that of the first group set and the second group set On the other hand, a partial sum model generation process of generating a learning model using the sum of the partial prediction targets included in the group as an objective variable, a learning process for each of the first group set and the second group set A prediction target calculation process of calculating a value of a prediction target from a prediction value of a group calculated using a model; and a prediction target value and a prediction target value for each of a first group set and a second group set. An evaluation process for evaluating a set of groups based on a difference from an actual value of a prediction target is performed.
本発明によれば、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できるという技術的効果を奏する。 According to the present invention, even when each of a plurality of prediction targets has different properties, if the desired prediction target is expressed by the sum of the plurality of prediction targets, the desired prediction target The technical effect that the grouping of the prediction object which can improve the prediction accuracy of this can be realized.
以下、本発明の実施形態を図面を参照して説明する。図1は、本発明による情報分析装置の一実施形態を示すブロック図である。なお、本実施形態の情報分析装置の構成については後述される。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of the information analyzer according to the present invention. The configuration of the information analyzer according to the present embodiment will be described later.
本発明では、ある時間における予測対象Yの値(予測結果)が、同じ時間における複数の予測対象y1,y2,…,ynの足し合わせにより構成されるものとする。すなわち、ある時刻における予測対象が、同じ時刻における複数の部分予測対象の和により表現される。具体的には、Y=y1+y2+…+ynである。In the present invention, the value of the prediction target Y at a certain time (prediction result), a plurality of candidate prediction y 1, y 2 at the same time, ..., and it shall consist of alignment sum of y n. That is, the prediction target at a certain time is represented by the sum of a plurality of partial prediction targets at the same time. Specifically, a Y = y 1 + y 2 + ... + y n.
なお、複数の予測対象y1,y2,…,ynの足し合わせにより所望の予測対象Yが構成されることから、以下の説明では、個々の予測対象y1,y2,…,ynのことを、部分予測対象と記す。したがって、ある時間における予測対象Yの値は、同じ時間における部分予測対象y1,y2,…,ynの総和で算出される。例えば、予測対象Yが、工場が製造する商品の需要総数(受注総数)とした場合、部分予測対象ynは、個々の店舗の商品需要数(受注数)である。Incidentally, a plurality of candidate prediction y 1, y 2, ..., since the desired prediction target Y is constituted by a combination adding the y n, in the following description, the individual prediction target y 1, y 2, ..., y Let n be a partial prediction target. Therefore, the value of the prediction target Y at a certain time, partial prediction target y 1, y 2 at the same time, ..., are calculated by the sum of y n. For example, the prediction target Y is, if the plant is demand total number of items which are manufactured (order total) partial prediction target y n is the trade demand number of individual stores (order number).
また、本発明では、部分予測対象を複数のグループ(Y1,Y2,…,YN)に纏め、グループごとに予測モデルの学習、予測対象の予測値や実績値の算出を行う。In the present invention, the partial prediction targets are grouped into a plurality of groups (Y 1 , Y 2 ,..., Y N ), and the learning of the prediction model and the calculation of the predicted value and the actual value of the prediction target are performed for each group.
以下、具体例を用いて、予測対象と部分予測対象との関係を説明する。以下、ある商品を製造して各店舗に納品する工場があると想定し、この工場の生産管理部門の立場に立って、過去の実績データに基づいて未来の商品需要(受注数)を予測するとする。 Hereinafter, the relationship between the prediction target and the partial prediction target will be described using a specific example. In the following, it is assumed that there is a factory that manufactures a certain product and delivers it to each store, and from the standpoint of the production management department of this factory, forecasting future product demand (number of orders) based on past performance data I do.
図2は、部分予測対象の候補の例を示す説明図である。図2に示す例では、自工場が図2に例示する200店舗(店舗コード:C−001〜C−200)へ商品を納品することを示す。また、図3は、実績データとして、日ごと及び店舗ごとの商品の売上数の例を示す説明図である。また、図3に例示する表には、前日の最高気温および最低気温が含まれる。以下の説明では、図3に例示するような実際に取得された過去データ(実績データ)のことを、評価用データと記すこともある。 FIG. 2 is an explanatory diagram illustrating an example of a partial prediction target candidate. In the example shown in FIG. 2, the own factory delivers goods to 200 stores (store codes: C-001 to C-200) illustrated in FIG. FIG. 3 is an explanatory diagram showing an example of the number of products sold for each day and for each store as performance data. The table illustrated in FIG. 3 includes the highest temperature and the lowest temperature of the previous day. In the following description, past data (actual data) actually acquired as illustrated in FIG. 3 may be referred to as evaluation data.
このような情報が存在する場合に翌日の商品の受注数を予測する状況を想定する。例えば、一般的な方法の場合、各日の各店舗の売上数の総数を目的変数に設定し、図3に例示する表に含まれるような最高気温、最低気温などを説明変数に設定して予測モデルを学習することが考えられる。 It is assumed that when such information exists, the number of orders for a product on the next day is predicted. For example, in the case of a general method, the total number of sales at each store on each day is set as an objective variable, and the highest temperature, the lowest temperature, and the like included in the table illustrated in FIG. 3 are set as explanatory variables. It is conceivable to learn a prediction model.
しかし、例えば200店舗の中に、他と著しく異なる性質を有する店舗(例えば、売上規模、発注の増減が大きい店舗など)が含まれている場合も存在する。このような異なる性質を有する店舗を一まとめにして学習を行っても、高い予測精度が得られない可能性が高い。そこで、このような複数の店舗を、同様の性質を有する店舗ごとに分類して予測を行うことが考えられる。 However, for example, there are cases where stores having characteristics significantly different from other stores (for example, stores whose sales scale and order increase / decrease are large) are included in, for example, 200 stores. Even if the stores having such different properties are collectively learned, it is highly likely that high prediction accuracy cannot be obtained. Therefore, it is conceivable to perform prediction by classifying such a plurality of stores for each store having similar properties.
しかし、対象とする商品の売上が、必ずしも図2に例示するような各店舗の所在地や売場面積、昨年売上高だけで分類できるとは限らない。例えば、同じ所在地の店舗であっても、ビルの中の店舗と路面店とでは売上の傾向が異なると考えられるし、同程度の売り場面積を有する店舗であっても、近隣の環境に応じて商品の需要傾向が異なることも考えられる。 However, the sales of the target product cannot always be categorized only by the location, the floor space of each store, and the sales last year as illustrated in FIG. For example, even if a store is located at the same location, it is considered that sales trends are different between a store in a building and a road surface store, and even if a store has the same sales floor area, It is also conceivable that demand trends for commodities are different.
そこで、以下の実施形態では、推定誤差の傾向が類似する店舗(部分予測対象)をグループ化して予測を行うことで、所望の予測対象の実績値に対する予測値の推定誤差を小さくする方法を説明する。以下、上述する具体例を適宜使用しながら、本発明の情報分析装置を説明する。 Therefore, in the following embodiment, a method for reducing the estimation error of the predicted value with respect to the actual value of the desired prediction target by grouping stores (partial prediction targets) having similar estimation error trends and performing prediction is described. I do. Hereinafter, the information analyzer of the present invention will be described using the above-described specific examples as appropriate.
図1に例示する情報分析装置100は、受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24と、記憶部30とを備えている。
The
記憶部30は、部分予測対象に関する情報を記憶する。記憶部30は、例えば、図2に例示する店舗のような、部分予測対象を記憶していてもよい。他にも、記憶部30は、図3に例示するような、部分予測対象に関する実績データを記憶していてもよい。
The
実績データは、後述する単位モデル生成部12および部分和モデル生成部16が学習モデルを生成する際のデータとして用いられる。他にも、実績データは、後述する評価部20が予測モデルを評価する際のデータとして用いられる。例えば、実績データのうち、一定の割合のデータを学習用データとして用い、残りのデータを評価用データとして用いてもよい。
The performance data is used as data when the unit
ただし、記憶部30が記憶するデータは、これらのデータに限定されない。記憶部30は、例えば、後述する単位モデル生成部12および部分和モデル生成部16が生成した学習モデルを記憶してもよい。記憶部30は、例えば、磁気ディスク装置により実現される。
However, the data stored in the
受付部10は、所望の予測対象の指定を受け付ける。また、受付部10は、所望の予測対象を構成する複数の部分予測対象の指定を受け付けてもよい。
The receiving
単位モデル生成部12は、部分予測対象単位に学習モデルを生成する。具体的には、単位モデル生成部12は、部分予測対象y1,y2,…,ynのそれぞれについて学習モデルを生成する。The unit
例えば、図2に例示する各店舗が部分予測対象である場合、単位モデル生成部12は、店舗ごとに学習モデルを生成する。予測対象に影響する要因の類似性を判断できるように、単位モデル生成部12は、説明変数の重みで予測対象を予測可能な学習モデル(例えば、線形重回帰モデル)を生成してもよい。ただし、単位モデル生成部12が生成する学習モデルは線形重回帰モデルに限られない。単位モデル生成部12は、任意の方法で学習モデルを生成すればよい。
For example, when each store illustrated in FIG. 2 is a partial prediction target, the unit
図4は、単位モデル生成部12が部分予測対象単位で生成した学習モデルの例を示す説明図である。図4に示す例では、店舗コード「C−001」で特定される店舗の商品の売上予測y001が、前日の最高気温(説明変数x1)、一週間前の売上(説明変数x2)、および、売り場面積(説明変数x3)と正の相関があることを示す。一方、図4に示す例では、店舗コード「C−200」で特定される店舗の商品の売上予測y200が、一週間前の売上(説明変数x2)、および、売り場面積(説明変数x3)と正の相関がある一方、週末(説明変数x4)と負の相関があることを示す。FIG. 4 is an explanatory diagram illustrating an example of a learning model generated by the unit
推定誤差算出部13は、学習モデルを用いて、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。具体的には、推定誤差算出部13は、単位モデル生成部12によって生成された学習モデルを用いて、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。
The estimation
なお、推定誤差算出部13は、後述する部分和モデル生成部16によって生成された学習モデルを用いて、同様に、部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。部分和モデル生成部16によって生成された学習モデルを用いる処理については後述される。
In addition, the estimation
図5は、推定誤差を算出する処理の例を示す説明図である。例えば、図3に例示する2017年の6月の実績データが評価用データとして用いられ、対応する学習モデルが図4に例示する予測式で表されているとする。 FIG. 5 is an explanatory diagram illustrating an example of a process of calculating an estimation error. For example, it is assumed that the performance data in June 2017 illustrated in FIG. 3 is used as evaluation data, and the corresponding learning model is represented by a prediction formula illustrated in FIG.
まず、推定誤差算出部13は、部分予測対象である店舗コード「C−001」で特定される店舗の売上の推定値を、図4に例示する予測式(y001=0.1x1+0.18x2+0.06x3+1.6)を用いて算出する。例えば、2017年6月2日の売上の推定値を算出するとする場合、店舗の売り場面積は120m2であり、前日の最高気温は26度である。また、一週間前の売上数が20であったとすると、売上の推定値はy^001=0.1×26+0.18×10+0.06×120+1.6=13.2と算出される。First, the estimation
そして、推定誤差算出部13は、2017年6月2日の売上の実績値である15と、推定値である13.2の誤差(推定誤差)を、15−13.2=1.8と算出する。推定誤差算出部13は、以下の日付についても同様に推定誤差を算出することで、時間軸に沿った(時系列の)推定誤差を算出する。また、推定誤差算出部13は、他の部分予測対象(店舗)についても、同様に時間軸に沿った推定誤差を算出する。
Then, the estimated
図6は、時間軸に沿って算出した推定誤差の例を示す説明図である。図6に示す例は、図3に例示するデータを用いて、店舗ごと及び日ごとに推定誤差を算出した結果を示す。また、図7は、時間軸に沿って算出した推定誤差をグラフ化した例を示す説明図である。図7に示す例は、図6に例示する時間軸に沿った推定誤差を、店舗ごとに折れ線グラフで表している。 FIG. 6 is an explanatory diagram illustrating an example of the estimation error calculated along the time axis. The example illustrated in FIG. 6 illustrates the result of calculating the estimation error for each store and each day using the data illustrated in FIG. FIG. 7 is an explanatory diagram showing an example in which the estimation error calculated along the time axis is graphed. In the example illustrated in FIG. 7, the estimation error along the time axis illustrated in FIG. 6 is represented by a line graph for each store.
なお、売上規模の差異に応じ、推定誤差算出部13は、各部分予測対象の推定誤差を標準化してもよい。具体的には、推定誤差算出部13は、各部分予測対象の推定誤差の平均および分散に基づいて推定誤差を標準化してもよい。このような標準化を行うことで、時間軸に沿った推定誤差の傾向を、同じ尺度で判断できる。
Note that the estimation
集合生成部14は、部分予測対象を複数のグループに纏めることにより、グループの集合を生成する。なお、集合生成部14は、後述する制御部24の制御に応じてグループの集合を生成する。
The
まず、集合生成部14は、推定誤差算出部13が算出した推定誤差を入力する。そして、集合生成部14は、入力された一の学習モデルについての推定誤差と、他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。
First, the
なお、集合生成部14は、後述する部分和モデル生成部16によって生成された学習モデルによる推定誤差の時間軸上における類似性に基づいて、同様に、グループの集合を生成する。なお、部分和モデル生成部16によって生成された学習モデルによる推定誤差を用いる処理については後述される。
In addition, the
集合生成部14が、推定誤差の時間軸上における類似性を判断する方法は任意である。集合生成部14は、例えば、時間軸方向の各区間の推定誤差の変化をベクトル(推定誤差ベクトル)で表し、比較する他の学習モデルによる推定誤差ベクトルとの内積の各区間における総和が、より大きいほど類似性が高いと判断してもよい。また、集合生成部14は、図7に例示するグラフの形状が類似しているほど、時間軸上における推定誤差がより類似すると判断してもよい。
The method by which the
また、集合生成部14が纏めるグループの数も任意である。図8は、部分予測対象をグループ化する処理の例を示す説明図である。集合生成部14は、推定誤差の類似性が高い学習モデルに対応する部分予測対象を順次グループ化し、グループ化された部分予測対象を除外しながらグループ化を繰り返してもよい。具体的には、集合生成部14は、図8(a)に例示するように、推定誤差の類似性が高い部分予測対象をグループ化したグループG1を生成し、その後、グループG1に含まれる部分予測対象を除いて、次に推定誤差の類似性が高い部分予測対象をグループ化したグループG2を生成してもよい。例えば、推定誤差の類似する学習モデルのペアをそれぞれ抽出してグループを生成する場合、図2に例示する200の部分予測対象から、100のグループの集合が生成される。
Further, the number of groups to be collected by the
また。集合生成部14は、推定誤差の類似性が高い学習モデルに対応する部分予測対象を順次グループ化し、グループ化された部分予測対象を除外せずにグループ化を繰り返してもよい。具体的には、集合生成部14は、図8(b)に例示するように、推定誤差の類似性が高い部分予測対象をグループ化したグループG1を生成し、その後、グループG1に含まれる部分予測対象も含めて、次に推定誤差の類似性が高い部分予測対象をグループ化したグループG3を生成してもよい。
Also. The
また、集合生成部14は、すでに生成されたグループの集合とは異なる構成のグループの集合を、別途生成してもよい。具体的には、集合生成部14は、グループの集合を構成するグループの数が、すでに生成されたグループの集合を構成するグループの数と変わるようにグループの集合を生成してもよい。例えば、図2に例示する200の部分予測対象が存在する場合、集合生成部14は、2つの部分予測対象を纏めた100のグループの集合を生成し、さらに、4つの部分予測対象を纏めた50のグループの集合を生成してもよい。
In addition, the
なお、集合生成部14が生成する各グループに含まれる部分予測対象の数は、同数であってもよく、異なっていてもよい。
Note that the number of partial prediction targets included in each group generated by the
図9は、グループの集合を生成する処理の例を示す説明図である。図7に例示する推定誤差が算出されている場合、例えば、店舗コード「C−001」で特定される店舗の推定誤差の傾向と、店舗コード「C−003」で特定される店舗の推定誤差の傾向とは、その推定誤差の傾向(変化度合)が類似すると言える。そこで、集合生成部14は、店舗コード「C−001」で特定される店舗と、店舗コード「C−003」で特定される店舗とをまとめて1つのグループを生成する。集合生成部14は、このグループ化を他の店舗についても繰り返し行う。
FIG. 9 is an explanatory diagram illustrating an example of a process of generating a group set. When the estimated error illustrated in FIG. 7 is calculated, for example, the tendency of the estimated error of the store identified by the store code “C-001” and the estimated error of the store identified by the store code “C-003” It can be said that the tendency (degree of change) of the estimation error is similar. Therefore, the
部分和モデル生成部16は、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。すなわち、部分和モデル生成部16は、グループ化された複数の部分予測対象のグループ(Y1,Y2,…,YN)ごとに学習モデルを生成する。なお、部分和モデル生成部16が学習モデルを生成する方法は、集合生成部14が学習モデルを生成する方法と同様である。The partial sum
例えば、図9に例示するように、店舗コード「C−001」で特定される店舗と、店舗コード「C−003」で特定される店舗とをまとめて1つのグループを生成したとする。この場合、部分和モデル生成部16は、この2つの店舗の商品の売上の和を目的変数とする学習モデルを生成する。
For example, as illustrated in FIG. 9, it is assumed that a store identified by a store code “C-001” and a store identified by a store code “C-003” are generated as one group. In this case, the partial sum
予測対象算出部18は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。具体的には、予測対象算出部18は、単位モデル生成部12によって生成された学習モデルを用いて算出されるグループの予測値を合計して予測対象の値を算出する。さらに、予測対象算出部18は、部分和モデル生成部16によって生成された学習モデルを用いて算出されるグループの予測値を合計して予測対象の値を算出する。
The prediction
評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいて、グループの集合を評価する。予測対象の実績値は、例えば、予め記憶部30に記憶されている。評価部20は、例えば、グループの集合の良さを評価するための評価関数を用いてもよい。
The
具体的には、評価部20は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。予測値と実測値の誤差が小さいほど、適切なグループ化ができていると言えるからである。この場合の評価関数は、例えば、以下に例示する式1で設計されていてもよい。評価関数Wは、値が小さいほど、よりよい評価を示す。式1に例示する予測対象Yの誤差とは、部分予測対象の和である全体の誤差である。
Specifically, the
評価関数W=β・(予測対象Yの誤差) (式1) Evaluation function W = β · (error of prediction target Y) (Equation 1)
また、評価部20は、上述する評価に加え、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。グループの数が少ないほど、生成されるモデルの数も少なくなるため、人間の解釈性を高めることができるからである。この場合の評価関数は、例えば、以下に例示する式2で設計されていてもよい。
Further, in addition to the above-described evaluation, the
評価関数W=α・モデル数+β・(予測対象Yの誤差) (式2) Evaluation function W = α · number of models + β · (error of prediction target Y) (Equation 2)
また、評価部20は、グループの集合を構成するグループの数の評価に代えて、各グループに対応する各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価してもよい。非ゼロ係数を有する説明変数の個数が少ないほど、人間の解釈性を高めることができるからである。
In addition, the
さらに、非ゼロ係数を有する説明変数の個数が少ないほど、モデルの複雑性を回避できる。モデルが複雑になるほど、そのモデルにうまく当てはまる評価データが見つかりやすいため、適切な評価ができないおそれがある。一方、モデルを単純化できるほど、上述するおそれを避けられるため、モデル評価時には精度が良いにもかかわらず、運用中に精度が悪くなるといった現象が起こることを抑制できる。この場合の評価関数は、例えば、以下に例示する式3で設計されていてもよい。
Further, the fewer the number of explanatory variables having non-zero coefficients, the more the complexity of the model can be avoided. The more complex the model, the easier it is to find evaluation data that fits well with the model, which may prevent proper evaluation. On the other hand, the more the model can be simplified, the more the above-mentioned fear can be avoided. Therefore, it is possible to suppress the occurrence of a phenomenon in which the accuracy is deteriorated during operation, even though the accuracy is high at the time of model evaluation. The evaluation function in this case may be designed by, for example,
評価関数W=α・(Σ各モデルの非ゼロ係数の数)+β・(予測対象Yの誤差)(式3) Evaluation function W = α · (Σthe number of non-zero coefficients of each model) + β · (error of prediction target Y) (Equation 3)
制御部24は、集合生成部14がグループの集合を生成する際の動作を制御する。具体的には、制御部24は、個々の部分予測対象を、予め定めた数のグループに纏めるように集合生成部14を制御する。図10は、グループの集合を生成する処理の例を示す説明図である。
The
例えば、図2に例示する200の部分予測対象が存在する場合、制御部24は、2つの部分予測対象を纏めた100のグループの集合を生成するよう、集合生成部14を制御してもよい(図10におけるステップS1)。
For example, when there are 200 partial prediction targets illustrated in FIG. 2, the
さらに、制御部24は、グループの集合を構成するグループの数が、すでに生成されたグループの集合を構成するグループの数と変わるように、集合生成部14を制御してもよい。このとき、制御部24は、個々の部分予測対象を対象としてグループ化するよう、集合生成部14を制御してもよいし、集合生成部14がすでに生成したグループをさらにグループに纏めることによりグループの集合を生成するよう制御してもよい。
Furthermore, the
集合生成部14がすでに生成したグループをさらにグループに纏める方法を、より具体的に説明する。まず、制御部24は、部分和モデル生成部16が生成した学習モデルについての推定誤差が算出されるように推定誤差算出部13を制御する。この制御に応じ、推定誤差算出部13は、部分和モデル生成部16が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。
A method of further grouping the groups already generated by the
さらに、制御部24は、集合生成部14を制御する際に、部分和モデル生成部16により生成された学習モデルについての推定誤差を集合生成部14に入力する。この制御に応じ、集合生成部14は、部分和モデル生成部16により生成された学習モデルについての推定誤差を入力として、グループの集合を生成する。
Further, when controlling the
例えば、集合生成部14が、すでに2つの部分予測対象を纏めた100のグループの集合を生成している場合、制御部24は、この100のグループをさらにグループに纏めることにより、例えば、50のグループの集合を生成するように制御してもよい(図10におけるステップS2)。また、制御部24は、初めの200の部分予測対象を対象として、4つの部分予測対象を纏めた50のグループの集合を生成するよう、集合生成部14を制御してもよい(図10におけるステップS3)。
For example, when the
このように、制御部24は、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部14を制御する。制御部24の制御により複数の構成のグループの集合が生成されると、部分和モデル生成部16は、それぞれのグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。そして、予測対象算出部18は、生成された学習モデルを用いて算出されるグループの予測値から予測対象の値を算出し、評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する。
As described above, the
出力部22は、評価部20の評価に応じてグループの集合を出力する。具体的には、出力部22は、より良い評価のグループの集合を出力する。このとき、出力部22は、グループの集合だけでなく、その集合を構成するグループごとに生成された学習モデルを出力してもよい。
The
受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24とは、プログラム(情報分析プログラム)に従って動作するコンピュータのプロセッサ(例えば、CPU(Central Processing Unit )、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array ))によって実現される。
A receiving
例えば、プログラムは、記憶部30に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、受付部10、単位モデル生成部12、推定誤差算出部13、集合生成部14、部分和モデル生成部16、予測対象算出部18、評価部20、出力部22および制御部24として動作してもよい。また、情報分析装置の機能がSaaS(Software as a Service )形式で提供されてもよい。
For example, the program is stored in the
受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14と、部分和モデル生成部16と、予測対象算出部18と、評価部20と、出力部22と、制御部24とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路(circuitry )、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。
A receiving
また、各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。 When some or all of the components of each device are realized by a plurality of information processing devices or circuits, the plurality of information processing devices or circuits may be centrally arranged, or may be distributedly arranged. May be done. For example, the information processing device, the circuit, and the like may be realized as a form in which each is connected via a communication network, such as a client and server system or a cloud computing system.
次に、本実施形態の情報分析装置の動作を説明する。図11は、本実施形態の情報分析装置の動作例を示すフローチャートである。 Next, the operation of the information analyzer of the present embodiment will be described. FIG. 11 is a flowchart illustrating an operation example of the information analysis device of the present embodiment.
単位モデル生成部12は、部分予測対象単位に学習モデルを生成する(ステップS11)。予測対象算出部18は、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する(ステップS12)。そして、評価部20は、算出された予測対象の値と予測対象の実績値との差分に基づいて、グループの集合を評価する(ステップS13)。ここでは、評価部20は、個々の部分予測対象について学習モデルを生成した場合について評価する。
The unit
制御部24は、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するか否か判断する(ステップS14)。グループの集合を生成すると判断した場合(ステップS14におけるYes)、制御部24は、推定誤差算出部13を制御することにより、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する(ステップS21)。そして、制御部24は、集合生成部14を制御することにより、部分予測対象を複数のグループに纏めてグループの集合を生成する(ステップS15)。具体的には、集合生成部14は、算出された推定誤差の時間軸上における類似性に基づいて部分予測対象をグループに纏めることにより、グループの集合を生成する。
The
部分和モデル生成部16は、生成されたグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する(ステップS16)。学習モデルが生成されると、予測対象算出部18が予測対象の値を算出し、評価部20がグループの集合を評価するステップS12およびステップS13の処理が繰り返される。
The partial sum
一方、ステップS14において、グループの集合を生成しないと判断した場合(ステップS14におけるNo)、出力部22は、最も評価の良いグループの集合を出力する(ステップS17)。
On the other hand, when it is determined in step S14 that a set of groups is not generated (No in step S14), the
以上のように、本実施形態では、単位モデル生成部12が、部分予測対象ごとに学習モデルを生成し、推定誤差算出部13が、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。また、集合生成部14が、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する。そして、部分和モデル生成部16が、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、予測対象算出部18が、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。
As described above, in the present embodiment, the unit
よって、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。 Therefore, even when each of the plurality of prediction targets has a property different from each other, if the desired prediction target is expressed by the sum of the plurality of prediction targets, the prediction accuracy of the desired prediction target is reduced. It is possible to realize a grouping of prediction targets that can be improved.
すなわち、本実施形態では、時間軸に対する推定誤差の傾向が類似する部分予測対象をグループ化して学習モデルが生成される。このように傾向の類似する部分予測対象をまとめることで、大数の法則により推定誤差が小さくなり、結果、予測精度をより向上させることが可能になる。 That is, in the present embodiment, a learning model is generated by grouping partial prediction targets having a similar tendency of the estimation error with respect to the time axis. By grouping partial prediction targets having similar tendencies in this way, the estimation error is reduced by the law of large numbers, and as a result, prediction accuracy can be further improved.
次に、上記実施形態の変形例を説明する。上記実施形態では、制御部24が異なる構成のグループの集合を生成するように集合生成部14を制御することで、生成されたグループをさらに纏めて順次グループ化する方法を説明した。
Next, a modified example of the above embodiment will be described. In the above-described embodiment, a method has been described in which the
一方、グループ化する粒度を変更して評価を行うことも効果的である。例えば、k−meansによるグルーピングを、kの値を変更しつつ何度も行うことが考えられる。また、学習処理には多くの時間がかかることが想定されるため、複数のサーバを並列に動作させて、評価を行うことも好ましい。 On the other hand, it is also effective to change the grouping granularity for evaluation. For example, grouping by k-means may be performed many times while changing the value of k. Further, since it is expected that the learning process will take a lot of time, it is preferable to perform the evaluation by operating a plurality of servers in parallel.
例えば、部分予測対象が200存在するとする。このとき、k=50のグルーピング処理とk=100のグルーピング処理とを、別のサーバが並列に実行し、それぞれのグループの集合に対して、学習処理、予測処理および評価処理を行ったうえで、最も評価の良いグループを出力してもよい。 For example, assume that there are 200 partial prediction targets. At this time, another server executes a grouping process of k = 50 and a grouping process of k = 100 in parallel, and performs a learning process, a prediction process, and an evaluation process on each set of groups. , The group with the highest evaluation may be output.
図12は、本発明による情報分析システムの構成例を示すブロック図である。図12に例示する情報分析システム200は、受付部10と、単位モデル生成部12と、推定誤差算出部13と、集合生成部14aと、部分和モデル生成部16aと、予測対象算出部18aと、評価部20aと、出力部22と、記憶部30とを備えている。受付部10、単位モデル生成部12、推定誤差算出部13、出力部22および記憶部30の構成は、情報分析装置100が備える構成と同様である。
FIG. 12 is a block diagram showing a configuration example of the information analysis system according to the present invention. The
本変形例の集合生成部14aも、集合生成部14と同様、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、部分予測対象を複数のグループに纏めることにより、グループの集合を生成する。具体的には、集合生成部14aは、推定誤差算出部13が算出した推定誤差を入力する。そして、集合生成部14aは、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する。なお、集合生成部14aがグループの集合を生成する方法は、情報分析装置100における集合生成部14がグループの集合を生成する方法と同様である。
Similarly to the
なお、図12に示す例では集合生成部14aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに集合生成部14aを備えていてもよい。また、集合生成部14aが生成するグループの集合の種類は、2種類に限定されず、3種類以上であってもよい。
Although only one set
部分和モデル生成部16aは、第1のグループの集合と第2のグループの集合のそれぞれに対して、そのグループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する。部分和モデル生成部16aが学習モデルを生成する方法は、情報分析装置100における部分和モデル生成部16が学習モデルを生成する方法と同様である。
The partial sum
なお、図12に示す例では部分和モデル生成部16aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに部分和モデル生成部16aを備えていてもよい。
In the example shown in FIG. 12, only one partial sum
予測対象算出部18aは、第1のグループの集合と第2のグループの集合とのそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する。予測対象算出部18aが予測対象の値を算出する方法は、情報分析装置100における予測対象算出部18が予測対象の値を算出する方法と同様である。
The prediction
なお、図12に示す例では予測対象算出部18aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに予測対象算出部18aを備えていてもよい。
In the example illustrated in FIG. 12, only one prediction
評価部20aは、第1のグループの集合と第2のグループの集合のそれぞれに対して、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する。評価部20aがグループの集合を評価する方法は、情報分析装置100における評価部20がグループの集合を評価する方法と同様である。
The
なお、図12に示す例では評価部20aを1つのみ示しているが、複数のサーバで処理が実行される場合、情報分析システム200は、サーバごとに評価部20aを備えていてもよい。
In the example shown in FIG. 12, only one
以上のように、本変形例では、集合生成部14aが、部分予測対象を複数のグループに纏めることにより、グループの集合の構成が互いに異なる複数のグループ(第1のグループの集合と第2のグループの集合)をそれぞれ生成する。そのため、上記実施形態の効果に加え、より適切に部分予測対象をグループ化できる。
As described above, in the present modification, the
次に、本発明の概要を説明する。図13は、本発明による情報分析装置の概要を示すブロック図である。本発明による情報分析装置80は、予測対象(例えば、予測対象Y)が、複数の部分予測対象(例えば、部分予測対象y1,y2,…,yn)の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部81(例えば、単位モデル生成部12)と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部82(例えば、推定誤差算出部13)と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部83(例えば、集合生成部14)と、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部84(例えば、部分和モデル生成部16)と、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部85(例えば、予測対象算出部18)とを備えている。Next, the outline of the present invention will be described. FIG. 13 is a block diagram showing an outline of an information analyzer according to the present invention. The information analyzer 80 according to the present invention, the prediction target (e.g., the prediction target Y) is a plurality of partial prediction target (e.g., partial prediction target y 1, y 2, ..., y n) in the case represented by the sum of A unit model generation unit 81 (for example, unit model generation unit 12) that generates a learning model for each partial prediction target, and an estimation error when a value of the partial prediction target is estimated using the learning model along a time axis. The estimation error calculating unit 82 (for example, the estimation error calculating unit 13) that calculates the estimation error and the similarity on the time axis between the estimation error of one learning model and the estimation error of the other learning model with the estimation error as an input. On the basis of the partial prediction target corresponding to one learning model and the partial prediction target corresponding to another learning model, the group generation unit 83 (e.g., For example, a set generation unit 14), a partial sum model generation unit 84 (for example, a partial sum model generation unit 16) that generates a learning model using a sum of partial prediction targets included in a group as an objective variable, and a learning model And a prediction target calculation unit 85 (for example, the prediction target calculation unit 18) that calculates the value of the prediction target from the prediction value of the group calculated by the calculation.
そのような構成により、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。 With such a configuration, even when each of the plurality of prediction targets has a different property from each other, when the desired prediction target is expressed by the sum of the plurality of prediction targets, the desired prediction target is expressed. Can be grouped such that the prediction accuracy of the prediction target is improved.
また、情報分析装置80は、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部(例えば、評価部20)と、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部83を制御する制御部(例えば、制御部24)とを備えていてもよい。そして、集合生成部83は、制御部の制御に応じてグループの集合を生成し、評価部は、生成された各グループの集合を評価してもよい。
Further, the
さらに、制御部は、部分和モデル生成部84が生成した学習モデルについての推定誤差が算出されるように推定誤差算出部82を制御してもよい。このとき、推定誤差算出部82は、部分和モデル生成部84が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する。また、制御部は、集合生成部83を制御する際に、部分和モデル生成部84が生成した学習モデルについての推定誤差を、集合生成部83に入力してもよい。このとき、集合生成部83は、部分和モデル生成部84が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する。そのような構成により、グループの集合を順次少なくしていくことが可能になる。
Further, the control unit may control the estimation
また、情報分析装置80は、評価部の評価に応じてグループの集合を出力する出力部(例えば、出力部22)を備えていてもよい。このとき、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数(例えば、上記式1に示す評価関数W)を用いてグループの集合を評価し、出力部は、評価がより良いグループの集合を出力してもよい。
Further, the
また、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数(例えば、上記式2に示す評価関数W)を用いてグループの集合を評価してもよい。
In addition, the evaluation unit performs better as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller, and the smaller the number of groups forming the group set, the better the evaluation. The set of groups may be evaluated using an evaluation function designed as described above (for example, the evaluation function W shown in
また、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、各グループに対応する各学習モデルについて、各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数(例えば、上記式3に示す評価関数W)を用いてグループの集合を評価してもよい。 Also, the evaluation unit is included in each learning model so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation, and for each learning model corresponding to each group. The set of groups may be evaluated using an evaluation function (e.g., the evaluation function W shown in Expression 3) designed so that the smaller the total number of explanatory variables having non-zero coefficients, the better the evaluation.
図14は、本発明による情報分析システムの概要を示すブロック図である。本発明による情報分析システム90は、予測対象(例えば、予測対象Y)が、複数の部分予測対象(例えば、部分予測対象y1,y2,…,yn)の和により表現される場合において、部分予測対象ごとに学習モデルを生成する単位モデル生成部91(例えば、単位モデル生成部12)と、学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部92(例えば、推定誤差算出部13)と、推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、一の学習モデルに対応する部分予測対象と他の学習モデルに対応する部分予測対象とをグループに纏めることにより、グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部93(例えば、集合生成部14a)と、第1のグループの集合と第2のグループの集合とのそれぞれに対して、グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部94(例えば、部分和モデル生成部16a)と、第1のグループの集合と第2のグループの集合のそれぞれに対して、学習モデルを用いて算出されるグループの予測値から予測対象の値を算出する予測対象算出部95(例えば、予測対象算出部18a)と、第1のグループの集合と第2のグループの集合とのそれぞれに対して、予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部96(例えば、評価部20a)とを備えている。FIG. 14 is a block diagram showing an outline of the information analysis system according to the present invention.
そのような構成によっても、複数の予測対象のそれぞれが互いに異なる性質を有している場合であっても、その複数の予測対象の和によって所望の予測対象が表現される場合に、所望の予測対象の予測精度を向上させるような予測対象のグループ化を実現できる。 According to such a configuration, even when each of the plurality of prediction targets has a different property from each other, the desired prediction target is represented by the sum of the plurality of prediction targets. It is possible to realize grouping of prediction targets that improves the prediction accuracy of the targets.
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。 Some or all of the above embodiments may be described as in the following supplementary notes, but are not limited thereto.
(付記1)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部とを備えたことを特徴とする情報分析装置。 (Supplementary Note 1) When the prediction target is represented by a sum of a plurality of partial prediction targets, a unit model generation unit that generates a learning model for each of the partial prediction targets, and a unit model generation unit that generates a learning model using the learning model. An estimation error calculation unit that calculates an estimation error in the case of estimating a value along a time axis, and a time axis of an estimation error for one learning model and an estimation error for another learning model, using the estimation error as an input. A set generation unit that generates a group set by grouping the partial prediction targets corresponding to the one learning model and the partial prediction targets corresponding to the other learning model based on the similarity above, A partial sum model generation unit that generates a learning model using a sum of partial prediction targets included in a group as an objective variable, and prediction of a group calculated using the learning model Information analysis apparatus is characterized in that a prediction target calculation unit for calculating a value of the prediction target from.
(付記2)算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価部と、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部を制御する制御部とを備え、集合生成部は、前記制御部の制御に応じてグループの集合を生成し、前記評価部は、生成された各グループの集合を評価する付記1記載の情報分析装置。
(Supplementary Note 2) An evaluation unit that evaluates a set of groups based on a difference between the calculated value of the prediction target and an actual value of the prediction target, and generates a set of groups having a configuration different from that of the already generated group. And a control unit that controls the set generation unit so that the set generation unit generates a set of groups according to the control of the control unit, and the evaluation unit evaluates the generated set of each group. The information analyzer according to
(付記3)制御部は、部分和モデル生成部が生成した学習モデルについての推定誤差が算出されるように前記推定誤差算出部を制御し、推定誤差算出部は、部分和モデル生成部が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、制御部は、集合生成部を制御する際に、部分和モデル生成部が生成した学習モデルについての推定誤差を、集合生成部に入力し、集合生成部は、部分和モデル生成部が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する付記2に記載の情報分析装置。
(Supplementary Note 3) The control unit controls the estimation error calculation unit so that an estimation error for the learning model generated by the partial sum model generation unit is calculated, and the estimation error calculation unit is configured by the partial sum model generation unit. The estimation error when estimating the value of the partial prediction target using the learned learning model is calculated along the time axis, and the control unit, when controlling the set generation unit, generates the learning model generated by the partial sum model generation unit. The information analysis device according to
(付記4)評価部の評価に応じてグループの集合を出力する出力部を備え、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記出力部は、前記評価がより良いグループの集合を出力する付記2または付記3記載の情報分析装置。
(Supplementary Note 4) An output unit that outputs a set of groups according to the evaluation of the evaluation unit is provided, and the evaluation unit performs better as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. The information analysis device according to
(付記5)評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、グループの集合を構成するグループの数が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する付記4記載の情報分析装置。
(Supplementary Note 5) The evaluation unit performs the evaluation such that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target is, the better the evaluation is, and the smaller the number of groups constituting the group set is, the better the evaluation is. The information analysis device according to
(付記6)評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように、且つ、各グループに対応する各学習モデルについて、当該各学習モデルに含まれる非ゼロ係数を有する説明変数の個数の総和が少ないほど良い評価となるように設計された評価関数を用いてグループの集合を評価する付記4記載の情報分析装置。
(Supplementary Note 6) The evaluation unit performs, for each learning model corresponding to each group, a better evaluation as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. 4. The information analysis device according to
(付記7)推定誤差算出部は、各部分予測対象の推定誤差を標準化し、集合生成部は、標準化された推定誤差を入力としてグループの集合を生成する付記1から付記6のうちのいずれか1つに記載の情報分析装置。 (Supplementary Note 7) The estimation error calculation unit standardizes the estimation errors of the respective partial prediction targets, and the set generation unit generates a group set by using the standardized estimation errors as an input. An information analyzer according to one of the above.
(付記8)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部と、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価部とを備えたことを特徴とする情報分析システム。 (Supplementary Note 8) In the case where the prediction target is represented by the sum of a plurality of partial prediction targets, a unit model generating unit that generates a learning model for each of the partial prediction targets, and An estimation error calculation unit that calculates an estimation error in the case of estimating a value along a time axis, and a time axis of an estimation error for one learning model and an estimation error for another learning model, using the estimation error as an input. On the basis of the above similarity, a partial prediction target corresponding to the one learning model and a partial prediction target corresponding to the other learning model are grouped into a group, so that the first group is different from the first group in the configuration of the group set. A set generation unit that respectively generates a set of groups of the first group and a set of second groups; and a pair of each of the set of the first group and the set of the second group. A partial sum model generation unit that generates a learning model using a sum of the partial prediction targets included in the group as an objective variable, and a set of the first group and a set of the second group. A prediction target calculation unit that calculates the value of the prediction target from a prediction value of the group calculated using the learning model, and a set of the first group and a set of the second group, An information analysis system, comprising: an evaluation unit that evaluates the set of groups based on a difference between the value of the prediction target and the actual value of the prediction target.
(付記9)評価部の評価に応じてグループの集合を出力する出力部を備え、評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記出力部は、前記評価がより良いグループの集合を出力する付記8記載の情報分析システム。
(Supplementary Note 9) An output unit that outputs a set of groups in accordance with the evaluation of the evaluation unit is provided. The evaluation unit performs better as the difference between the calculated value of the prediction target and the actual value of the prediction target is smaller. 9. The information analysis system according to
(付記10)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成し、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出することを特徴とする情報分析方法。 (Supplementary Note 10) When the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each of the partial prediction targets, and the value of the partial prediction target is estimated using the learning model. The estimation error is calculated along the time axis, and the estimation error is used as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. The group of partial prediction targets corresponding to the learning model and the partial prediction target corresponding to the other learning model are combined into a group to generate a set of groups, and the sum of the partial prediction targets included in the group is used as the target variable. An information analysis method, comprising: generating a learning model; and calculating a value of the prediction target from a predicted value of a group calculated using the learning model.
(付記11)すでに生成されたグループの集合とは異なる構成のグループの集合を1つ以上生成し、算出された予測対象の値と予測対象の実績値との差分に基づいて各グループの集合を評価する付記10記載の情報分析方法。
(Supplementary Note 11) One or more sets of groups having a configuration different from the set of groups already generated are generated, and each set of groups is determined based on the difference between the calculated value of the prediction target and the actual value of the prediction target. The information analysis method according to
(付記12)予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成し、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出し、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価することを特徴とする情報分析方法。 (Supplementary Note 12) When the prediction target is represented by the sum of a plurality of partial prediction targets, a learning model is generated for each of the partial prediction targets, and the value of the partial prediction target is estimated using the learning model. The estimation error is calculated along the time axis, and the estimation error is used as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for the other learning model. By grouping the partial prediction target corresponding to the learning model and the partial prediction target corresponding to the other learning model into a group, the first group and the second group are different from each other in the configuration of the group. And generating a sum of the partial prediction targets included in the group for each of the first group set and the second group set. Generating a learning model as an objective variable, and for each of the set of the first group and the set of the second group, the value of the prediction target from the predicted value of the group calculated using the learning model. Is calculated, and for each of the set of the first group and the set of the second group, the set of the groups is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target. An information analysis method, characterized in that:
(付記13)算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、前記評価がより良いグループの集合を出力する付記12記載の情報分析方法。
(Supplementary Note 13) A set of groups is evaluated using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation. 13. The information analysis method according to
(付記14)コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理を実行させるための情報分析プログラム。 (Supplementary Note 14) A unit model generation process of generating a learning model for each of the partial prediction targets when the prediction target is represented by a sum of a plurality of partial prediction targets in the computer, and performing the partial prediction using the learning model. Estimation error calculation processing for calculating an estimation error in the case of estimating a target value along a time axis, and using the estimation error as an input, a time between an estimation error for one learning model and an estimation error for another learning model. A set generation process of generating a group set by grouping partial prediction targets corresponding to the one learning model and partial prediction targets corresponding to the other learning model based on the similarity on the axis; A partial sum model generation process for generating a learning model using a sum of partial prediction targets included in a group as an objective variable, and using the learning model Information analysis program for the predicted value of the group is calculated to execute the prediction target calculation processing of calculating a value of the prediction target.
(付記15)コンピュータに、算出された予測対象の値と予測対象の実績値との差分に基づいてグループの集合を評価する評価処理、および、すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成処理を制御する制御処理を実行させ、集合生成処理で、前記制御処理による制御に応じてグループの集合を生成させ、前記評価処理で、生成された各グループの集合を評価させる付記14記載の情報分析プログラム。
(Supplementary Note 15) An evaluation process for evaluating a set of groups based on a difference between the calculated value of the prediction target and the actual value of the prediction target, and a group having a configuration different from that of the already generated group Control processing to control the set generation processing so as to generate a set of groups, in the set generation processing, to generate a set of groups according to the control by the control processing, and in the evaluation processing, for each group generated in the evaluation processing The information analysis program according to
(付記16)コンピュータに、予測対象が、複数の部分予測対象の和により表現される場合において、前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理、および、前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価処理を実行させるための情報分析プログラム。 (Supplementary Note 16) A unit model generation process of generating a learning model for each of the partial prediction targets when the prediction target is represented by a sum of a plurality of partial prediction targets in the computer, and performing the partial prediction using the learning model. Estimation error calculation processing for calculating an estimation error in the case of estimating a target value along a time axis, and using the estimation error as an input, a time between an estimation error for one learning model and an estimation error for another learning model. Based on the similarity on the axis, the partial prediction target corresponding to the one learning model and the partial prediction target corresponding to the other learning model are grouped into a group, so that the configurations of the groups are different from each other. A set generation process for respectively generating a set of one group and a set of second groups; and a process of generating the set of the first group and the set of the second group. For each of the cases, a partial sum model generation process of generating a learning model using a sum of the partial prediction targets included in the group as an objective variable, and a first group set and a second group set For each, a prediction target calculation process of calculating the value of the prediction target from the prediction value of the group calculated using the learning model, and a set of the first group and a set of the second group An information analysis program for executing an evaluation process for evaluating a set of the groups based on a difference between a value of the prediction target and an actual value of the prediction target.
(付記17)コンピュータに、評価処理での評価に応じてグループの集合を出力する出力処理を実行させ、評価処理で、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価させ、前記出力処理で、前記評価がより良いグループの集合を出力させる付記16記載の情報分析プログラム。
(Supplementary Note 17) The computer causes the computer to execute an output process of outputting a set of groups in accordance with the evaluation in the evaluation process. In the evaluation process, the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the smaller the difference. 17. The information analysis program according to
10 受付部
12 単位モデル生成部
13 推定誤差算出部
14,14a 集合生成部
16,16a 部分和モデル生成部
18,18a 予測対象算出部
20,20a 評価部
22 出力部
24 制御部
30 記憶部
100 情報分析装置
200 情報分析システム
Claims (12)
前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成部と、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部とを備えた
ことを特徴とする情報分析装置。When the prediction target is represented by the sum of a plurality of partial prediction targets,
A unit model generation unit that generates a learning model for each of the partial prediction targets,
An estimation error calculation unit that calculates an estimation error when estimating the value of the partial prediction target using the learning model along a time axis,
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other A set generation unit that generates a set of groups by grouping partial prediction targets corresponding to the learning model of
A partial sum model generation unit that generates a learning model using a sum of partial prediction targets included in the group as an objective variable,
A prediction target calculation unit configured to calculate the value of the prediction target from a prediction value of a group calculated using the learning model.
すでに生成されたグループの集合とは異なる構成のグループの集合を生成するように集合生成部を制御する制御部とを備え、
集合生成部は、前記制御部の制御に応じてグループの集合を生成し、
前記評価部は、生成された各グループの集合を評価する
請求項1記載の情報分析装置。An evaluation unit that evaluates a set of groups based on a difference between the calculated value of the prediction target and the actual value of the prediction target,
A control unit that controls a set generation unit to generate a set of groups having a different configuration from the set of groups already generated,
The set generation unit generates a set of groups according to the control of the control unit,
The information analysis device according to claim 1, wherein the evaluation unit evaluates the generated set of each group.
推定誤差算出部は、部分和モデル生成部が生成した学習モデルを用いて部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
制御部は、集合生成部を制御する際に、部分和モデル生成部が生成した学習モデルについての推定誤差を、集合生成部に入力し、
集合生成部は、部分和モデル生成部が生成した学習モデルについての推定誤差を入力としてグループの集合を生成する
請求項2に記載の情報分析装置。The control unit controls the estimation error calculation unit such that an estimation error for the learning model generated by the partial sum model generation unit is calculated,
The estimation error calculation unit calculates an estimation error when the value of the partial prediction target is estimated using the learning model generated by the partial sum model generation unit along the time axis,
The control unit, when controlling the set generation unit, inputs the estimation error about the learning model generated by the partial sum model generation unit to the set generation unit,
The information analysis device according to claim 2, wherein the set generation unit generates a set of groups by using an estimation error of the learning model generated by the partial sum model generation unit as an input.
評価部は、算出された予測対象の値と予測対象の実績値との差分が小さいほど良い評価となるように設計された評価関数を用いてグループの集合を評価し、
前記出力部は、前記評価がより良いグループの集合を出力する
請求項2または請求項3記載の情報分析装置。An output unit that outputs a set of groups according to the evaluation of the evaluation unit,
The evaluation unit evaluates the set of groups using an evaluation function designed so that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target, the better the evaluation,
The information analysis device according to claim 2, wherein the output unit outputs a set of groups having the better evaluation.
請求項4記載の情報分析装置。The evaluation unit is configured such that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target is, the better the evaluation is, and the smaller the number of groups constituting the group set is, the better the evaluation is. The information analysis device according to claim 4, wherein the set of groups is evaluated using the designed evaluation function.
請求項4記載の情報分析装置。The evaluation unit determines that the smaller the difference between the calculated value of the prediction target and the actual value of the prediction target is, the better the evaluation is, and for each learning model corresponding to each group, The information analysis device according to claim 4, wherein a set of groups is evaluated using an evaluation function designed to perform better as the total number of explanatory variables having zero coefficients is smaller.
集合生成部は、標準化された推定誤差を入力としてグループの集合を生成する
請求項1から請求項6のうちのいずれか1項に記載の情報分析装置。The estimation error calculation unit standardizes the estimation error of each partial prediction target,
The information analysis device according to any one of claims 1 to 6, wherein the set generation unit generates a set of groups by using the standardized estimation error as an input.
前記部分予測対象ごとに学習モデルを生成する単位モデル生成部と、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出部と、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出部と、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価部とを備えた
ことを特徴とする情報分析システム。When the prediction target is represented by the sum of a plurality of partial prediction targets,
A unit model generation unit that generates a learning model for each of the partial prediction targets,
An estimation error calculation unit that calculates an estimation error when estimating the value of the partial prediction target using the learning model along a time axis,
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other A set generation unit that generates a first group set and a second group set having different configurations from each other by grouping partial prediction targets corresponding to the learning models of
A partial sum model generation unit configured to generate, for each of the set of the first group and the set of the second group, a learning model using a sum of the partial prediction targets included in the group as an objective variable;
For each of the set of the first group and the set of the second group, a prediction target calculation unit that calculates the value of the prediction target from the predicted value of the group calculated using the learning model;
For each of the first group set and the second group set, an evaluation unit that evaluates the group set based on the difference between the value of the prediction target and the actual value of the prediction target. An information analysis system characterized by comprising:
前記部分予測対象ごとに学習モデルを生成し、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成し、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成し、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する
ことを特徴とする情報分析方法。When the prediction target is represented by the sum of a plurality of partial prediction targets,
Generating a learning model for each of the partial prediction targets,
Calculate along the time axis an estimation error when estimating the value of the partial prediction target using the learning model,
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other Generate a group set by grouping partial prediction targets corresponding to the learning model of
Generate a learning model using the sum of the partial prediction targets included in the group as an objective variable,
An information analysis method, wherein a value of the prediction target is calculated from a predicted value of a group calculated using the learning model.
前記部分予測対象ごとに学習モデルを生成し、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出し、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出し、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する
ことを特徴とする情報分析方法。When the prediction target is represented by the sum of a plurality of partial prediction targets,
Generating a learning model for each of the partial prediction targets,
Calculate along the time axis an estimation error when estimating the value of the partial prediction target using the learning model,
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other By grouping the partial prediction targets corresponding to the learning models of the above into a group, a first group set and a second group set having different configurations of the group sets are respectively generated,
For each of the set of the first group and the set of the second group, generate a learning model using a sum of the partial prediction targets included in the group as an objective variable,
For each of the set of the first group and the set of the second group, calculate the value of the prediction target from the predicted value of the group calculated using the learning model;
For each of the set of the first group and the set of the second group, the set of the groups is evaluated based on the difference between the value of the prediction target and the actual value of the prediction target. Information analysis method.
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることによりグループの集合を生成する集合生成処理、
前記グループに含まれる部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、および、
前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理
を実行させるための情報分析プログラム。On the computer,
When the prediction target is represented by the sum of a plurality of partial prediction targets,
A unit model generation process for generating a learning model for each of the partial prediction targets,
An estimation error calculation process of calculating an estimation error when estimating the value of the partial prediction target using the learning model along a time axis;
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other Set generation processing for generating a group set by grouping partial prediction targets corresponding to the learning model of
A partial sum model generation process of generating a learning model using a sum of partial prediction targets included in the group as an objective variable, and
An information analysis program for executing a prediction target calculation process of calculating a value of the prediction target from a prediction value of a group calculated using the learning model.
予測対象が、複数の部分予測対象の和により表現される場合において、
前記部分予測対象ごとに学習モデルを生成する単位モデル生成処理、
前記学習モデルを用いて前記部分予測対象の値を推定した場合の推定誤差を時間軸に沿って算出する推定誤差算出処理、
前記推定誤差を入力として、一の学習モデルについての推定誤差と他の学習モデルについての推定誤差との時間軸上における類似性に基づいて、前記一の学習モデルに対応する部分予測対象と前記他の学習モデルに対応する部分予測対象とをグループに纏めることにより、前記グループの集合の構成が互いに異なる第1のグループの集合と第2のグループの集合とをそれぞれ生成する集合生成処理、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記グループに含まれる前記部分予測対象の和を目的変数とする学習モデルを生成する部分和モデル生成処理、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記学習モデルを用いて算出されるグループの予測値から前記予測対象の値を算出する予測対象算出処理、および、
前記第1のグループの集合と前記第2のグループの集合のそれぞれに対して、前記予測対象の値と前記予測対象の実績値との差分に基づいて前記グループの集合を評価する評価処理
を実行させるための情報分析プログラム。On the computer,
When the prediction target is represented by the sum of a plurality of partial prediction targets,
A unit model generation process for generating a learning model for each of the partial prediction targets,
An estimation error calculation process of calculating an estimation error when estimating the value of the partial prediction target using the learning model along a time axis;
With the estimation error as an input, based on the similarity on the time axis between the estimation error for one learning model and the estimation error for another learning model, the partial prediction target corresponding to the one learning model and the other A set generation process of generating a first group set and a second group set having different configurations of the group sets by grouping partial prediction targets corresponding to the learning models of
A partial sum model generation process for generating, for each of the set of the first group and the set of the second group, a learning model using a sum of the partial prediction targets included in the group as an objective variable;
For each of the set of the first group and the set of the second group, a prediction target calculation process of calculating the value of the prediction target from the prediction value of the group calculated using the learning model; and
For each of the first group set and the second group set, an evaluation process of evaluating the group set based on a difference between the value of the prediction target and the actual value of the prediction target is executed. Information analysis program to let you.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2017/033107 WO2019053827A1 (en) | 2017-09-13 | 2017-09-13 | Information analysis device, information analysis method, and information analysis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019053827A1 true JPWO2019053827A1 (en) | 2020-04-09 |
JP6849084B2 JP6849084B2 (en) | 2021-03-24 |
Family
ID=65722603
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019541555A Active JP6849084B2 (en) | 2017-09-13 | 2017-09-13 | Information analyzer, information analysis method and information analysis program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6849084B2 (en) |
WO (1) | WO2019053827A1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10240799A (en) * | 1997-02-27 | 1998-09-11 | Nri & Ncc Co Ltd | Support device for new store opening evaluation |
JP2006085645A (en) * | 2004-09-17 | 2006-03-30 | Canon System Solutions Inc | Data predicting device and data predicting method, and program |
JP2013196037A (en) * | 2012-03-15 | 2013-09-30 | Hitachi Ltd | Demand prediction system and demand prediction method |
JP2017094097A (en) * | 2015-11-27 | 2017-06-01 | 株式会社東芝 | Medical image processing device, x-ray computer tomographic imaging device, and medical image processing method |
-
2017
- 2017-09-13 WO PCT/JP2017/033107 patent/WO2019053827A1/en active Application Filing
- 2017-09-13 JP JP2019541555A patent/JP6849084B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10240799A (en) * | 1997-02-27 | 1998-09-11 | Nri & Ncc Co Ltd | Support device for new store opening evaluation |
JP2006085645A (en) * | 2004-09-17 | 2006-03-30 | Canon System Solutions Inc | Data predicting device and data predicting method, and program |
JP2013196037A (en) * | 2012-03-15 | 2013-09-30 | Hitachi Ltd | Demand prediction system and demand prediction method |
JP2017094097A (en) * | 2015-11-27 | 2017-06-01 | 株式会社東芝 | Medical image processing device, x-ray computer tomographic imaging device, and medical image processing method |
Also Published As
Publication number | Publication date |
---|---|
JP6849084B2 (en) | 2021-03-24 |
WO2019053827A1 (en) | 2019-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Claveria et al. | Forecasting tourism demand to Catalonia: Neural networks vs. time series models | |
Dejonckheere et al. | Measuring and avoiding the bullwhip effect: A control theoretic approach | |
JP6992526B2 (en) | Demand forecasting program, demand forecasting method and demand forecasting device | |
WO2017037881A1 (en) | Online prediction system and method | |
JP2014157457A (en) | Prediction device and prediction method | |
WO2018079367A1 (en) | Commodity demand prediction system, commodity demand prediction method, and commodity demand prediction program | |
US10074142B1 (en) | Computational architecture and method for a time-varying control system | |
Poler et al. | Forecasting model selection through out-of-sample rolling horizon weighted errors | |
WO2018088277A1 (en) | Prediction model generation system, method, and program | |
JP5251217B2 (en) | Sales number prediction system, operation method of sales number prediction system, and sales number prediction program | |
WO2016205153A1 (en) | Incremental estimation for probabilistic forecaster | |
JP2021043477A (en) | Demand forecasting device, demand forecasting method, and program | |
JPWO2018061623A1 (en) | Evaluation apparatus and evaluation method | |
WO2019187289A1 (en) | Evaluation system, evaluation method, and program for evaluation | |
JP6828830B2 (en) | Evaluation system, evaluation method and evaluation program | |
JPWO2019053828A1 (en) | Information analysis device, information analysis method, and information analysis program | |
JPWO2019053827A1 (en) | Information analysis device, information analysis method, and information analysis program | |
WO2018088276A1 (en) | Prediction model generation system, method, and program | |
JP7212231B2 (en) | Information processing device, method and program | |
JP7480844B2 (en) | Demand forecasting device, demand forecasting method, and demand forecasting program | |
WO2023084781A1 (en) | Arrival quantity prediction model generation device, transaction quantity prediction device, arrival quantity prediction model generation method, transaction quantity prediction method, and arrival quantity prediction model generation program | |
US11586947B2 (en) | Visualization system, visualization method, and visualization program | |
JP6449578B2 (en) | Purchase forecast analysis system and program thereof | |
WO2023209983A1 (en) | Parameter generation device, system, method and program | |
WO2021079457A1 (en) | Optimization device, optimization method, and non-transitory computer-readable medium in which optimization program has been stored |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191204 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6849084 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |