JP2019101875A - Estimation device, estimation method, and program - Google Patents

Estimation device, estimation method, and program Download PDF

Info

Publication number
JP2019101875A
JP2019101875A JP2017233686A JP2017233686A JP2019101875A JP 2019101875 A JP2019101875 A JP 2019101875A JP 2017233686 A JP2017233686 A JP 2017233686A JP 2017233686 A JP2017233686 A JP 2017233686A JP 2019101875 A JP2019101875 A JP 2019101875A
Authority
JP
Japan
Prior art keywords
value
attribute
target time
estimation target
observed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017233686A
Other languages
Japanese (ja)
Other versions
JP6768627B2 (en
Inventor
雄貴 蔵内
Yuki Kurauchi
雄貴 蔵内
吉田 学
Manabu Yoshida
学 吉田
宏志 小西
Hiroshi Konishi
宏志 小西
瀬下 仁志
Hitoshi Seshimo
仁志 瀬下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017233686A priority Critical patent/JP6768627B2/en
Publication of JP2019101875A publication Critical patent/JP2019101875A/en
Application granted granted Critical
Publication of JP6768627B2 publication Critical patent/JP6768627B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

To enable accurate estimation of non-observation values in consideration of a correlation between attributes.SOLUTION: Based on an observed value and a sample value accepted by an input unit 100, for each attribute, a value for each attribute value related to a non-observed value for an estimation target time is initialized, and until a predefined convergence condition with respect to a cost representing a deviation from the sample value and a deviation from a correlation between the attributes is satisfied, a convergence determination unit 230 causes an updating unit 220 to, for each attribute, estimate a composition ratio for each attribute value for the estimation target time on the basis of a value, for each attribute value, related to a non-observed value for the estimation target time for another attribute and the correlation between the attributes, and repeat updating the value for each attribute value related to the non-observed value for the estimation target time on the basis of the estimated composition ratio for each attribute value for the estimation target time and the observed value.SELECTED DRAWING: Figure 1

Description

本発明は、推定装置、推定方法、およびプログラムに関し、特に、観測値から非観測値を推定する推定装置、推定方法、およびプログラムに関する。   The present invention relates to an estimation apparatus, an estimation method, and a program, and more particularly to an estimation apparatus, an estimation method, and a program for estimating non-observation values from observation values.

実世界において、1つのデータの中でも、(1)実際に観測される箇所(観測部)、(2)サンプルによる観測がされる箇所(標本部)、(3)観測が不可能な箇所(非観測部)が混在する状況が多く存在している。   In the real world, (1) a place to be observed actually (observation part), (2) a place to be observed by a sample (sample part), (3) a place to be impossible to observe (non-observation) There are many situations in which observation units are mixed.

例えば、図15に示すような契約型の商品を扱う事業(固定回線、携帯回線、動画配信、クレジットカード、保険、不動産、ソフトウェア、通信販売等)においては、自社ユーザに関する情報は、観測可能であるため観測部に属し、他社ユーザに関する情報は、他社ユーザの過去のデータを用いたサンプリング調査によって観測可能であるため標本部に属し、直近1ヶ月の他社ユーザは、調査に時間がかかることにより観測不可能であるため非観測部に属する。   For example, in a business dealing with contract type products as shown in FIG. 15 (fixed line, mobile line, moving picture distribution, credit card, insurance, real estate, software, mail order etc.), information about the company user can be observed. Because it belongs to the observation department, information on other companies 'users belongs to the sample section because it can be observed by sampling survey using the other company's users' past data. It belongs to the non-observation part because it is unobservable.

この場合、他社の情報をより早く得ることができれば、他社の施策に対して、より素早く正しい対策を取れるなど、事業におけるメリットがあると考えられる。例えば、他社の施策により奪われた自社ユーザ(移行者)の規模と属性(ユーザの年齢、契約期間等)、自社施策により移行できそうな規模と属性、他社の契約者の属性とその弱み等を分析することにより、素早く対策を取ることができるものと考えられる。   In this case, if it is possible to obtain information on other companies more quickly, it is considered that there are business advantages such as being able to quickly take the correct measures with respect to the measures of the other companies. For example, the size and attributes (user's age, contract period, etc.) of company users (migrators) deprived of by other companies 'policies, the size and attributes that can be migrated by their own policies, attributes of other companies' contractors, etc. It is thought that measures can be taken quickly by analyzing the

このような場合において、非観測部である現在の他社ユーザを推定する方法として、重回帰分析が行われていた(非特許文献1)。   In such a case, multiple regression analysis has been performed as a method of estimating the current competitor's user who is the non-observation part (Non-Patent Document 1).

“重回帰分析”、[online]、[平成29年11月27日検索]、インターネット(URL:https://ja.wikipedia.org/wiki/重回帰分析)“Multiple regression analysis”, [online], [search on November 27, 2017], Internet (URL: https://ja.wikipedia.org/wiki/multiple regression analysis)

しかし、従来の重回帰分析では、属性間の相関を考慮することができないため、非観測値に不整合が起き得る。例えば、年代が若い人が多いのに、契約期間が長い人も多い等が生じる、という問題があった。   However, in the conventional multiple regression analysis, since the correlation between attributes can not be considered, a mismatch may occur in unobserved values. For example, although there are many young people in the age group, there are also many cases in which the contract period is long.

本発明は、上記の課題を解決するためのものであり、属性間の相関を考慮して非観測値を精度よく推定することができる推定装置、推定方法、およびプログラムを提供することを目的とする。   The present invention is for solving the above-mentioned problems, and it is an object of the present invention to provide an estimation apparatus, estimation method, and program capable of accurately estimating non-observed values in consideration of correlation between attributes. Do.

本発明に係る推定装置は、推定対象時期の非観測値を、前記推定対象時期の観測値と、前記推定対象時期より前の時期のサンプリング調査により得られた標本値とに基づいて推定する推定装置であって、前記推定対象時期の非観測値に関する合算値を、前記観測値として受け付けると共に、前記推定対象時期より前の時期の、各属性についての前記非観測値に対応するデータに関する属性値毎の構成比、及び前記非観測値に対応するデータに関する属性間の相関を、前記標本値として受け付ける入力部と、前記入力部により受け付けた前記観測値及び前記標本値に基づいて、各属性についての、前記推定対象時期の非観測値に関する属性値毎の値を初期化する初期化部と、各属性について、他の属性についての前記推定対象時期の非観測値に関する属性値毎の値と、前記属性間の相関とに基づいて、前記推定対象時期の前記属性値毎の構成比を推定し、前記推定された前記推定対象時期の前記属性値毎の構成比と、前記観測値とに基づいて、前記推定対象時期の非観測値に関する属性値毎の値を更新する更新部と、前記標本値とのずれ、及び前記属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、前記更新部における処理を繰り返させる収束判定部と、を備えて構成される。   An estimation apparatus according to the present invention estimates an unobserved value of an estimation target time based on an observation value of the estimation target time and a sample value obtained by a sampling survey of a time before the estimation target time. It is an apparatus, While accepting the total value about the non-observation value of the above-mentioned presumed target time as the above-mentioned observation value, the attribute value about the data corresponding to the above-mentioned non-observed value about each attribute An input unit that receives, as the sample value, a correlation between attributes regarding data corresponding to the non-observed value and each component ratio, and each attribute based on the observed value and the sample value received by the input unit And an initialization unit that initializes a value for each attribute value related to the non-observed value of the estimation target time, and a non-observed value of the estimation target time for other attributes with respect to each attribute The composition ratio for each of the attribute values of the estimation target time is estimated based on the value for each attribute value to be generated and the correlation between the attributes, and the composition ratio for each of the attribute values of the estimation target time estimated And an update unit that updates a value for each attribute value related to the non-observed value of the estimation target time based on the observed value, a difference between the sample value and a difference between the attribute and the correlation between the attributes And a convergence determination unit that repeats the process in the updating unit until a predetermined convergence condition is satisfied.

また、本発明に係る推定方法は、推定対象時期の非観測値を、前記推定対象時期の観測値と、前記推定対象時期より前の時期のサンプリング調査により得られた標本値とに基づいて推定する推定方法であって、入力部が、前記推定対象時期の非観測値に関する合算値を、前記観測値として受け付けると共に、前記推定対象時期より前の時期の、各属性についての前記非観測値に対応するデータに関する属性値毎の構成比、及び前記非観測値に対応するデータに関する属性間の相関を、前記標本値として受け付けるステップと、初期化部が、前記入力部により受け付けた前記観測値及び前記標本値に基づいて、各属性についての、前記推定対象時期の非観測値に関する属性値毎の値を初期化するステップと、更新部が、各属性について、他の属性についての前記推定対象時期の非観測値に関する属性値毎の値と、前記属性間の相関とに基づいて、前記推定対象時期の前記属性値毎の構成比を推定し、前記推定された前記推定対象時期の前記属性値毎の構成比と、前記観測値とに基づいて、前記推定対象時期の非観測値に関する属性値毎の値を更新するステップと、収束判定部が、前記標本値とのずれ、及び前記属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、前記更新するステップにおける処理を繰り返させるステップと、を含む。   In the estimation method according to the present invention, the non-observed value of the estimation target time is estimated based on the observation value of the estimation target time and the sample value obtained by the sampling survey of the time before the estimation target time. The input unit receives, as the observed value, a summed value of unobserved values of the estimation target time, and the unobserved value of each attribute of the time before the estimation target time. Receiving, as the sample value, the correlation between the component ratio of each attribute value of the corresponding data and the attribute of the data corresponding to the non-observed value; and the observed value received by the input unit from the initialization unit Initializing a value for each attribute value related to the non-observed value of the estimation target time for each attribute based on the sample value; and an updating unit for each attribute The composition ratio for each attribute value of the estimation target time is estimated based on the value for each attribute value related to the non-observed value of the estimation target time for and the correlation between the attributes, and the estimated Updating the value for each attribute value related to the non-observed value of the estimation target time based on the component ratio for each attribute value of the target time and the observed value; and the convergence determination unit with the sample value Reiterating the process in the updating step until a predetermined convergence condition is satisfied in terms of cost representing the deviation and the correlation between the attributes.

本発明に係る推定装置、及び推定方法によれば、入力部が、推定対象時期の非観測値に関する合算値を、観測値として受け付けると共に、推定対象時期より前の時期の、各属性についての非観測値に対応するデータに関する属性値毎の構成比、及び非観測値に対応するデータに関する属性間の相関を、標本値として受け付け、初期化部が、入力部により受け付けた観測値及び標本値に基づいて、各属性についての、推定対象時期の非観測値に関する属性値毎の値を初期化する。   According to the estimation apparatus and estimation method of the present invention, the input unit receives the sum value of the non-observed values of the estimation target time as the observation value, and the non-observation for each attribute of the time before the estimation target time. The composition ratio for each attribute value of the data corresponding to the observed value and the correlation between the attributes of the data corresponding to the non-observed value are received as sample values, and the initialization unit receives the observed values and sample values received by the input unit. Based on the attribute, the value for each attribute value regarding the non-observed value of the estimation target time is initialized for each attribute.

そして、更新部が、各属性について、他の属性についての推定対象時期の非観測値に関する属性値毎の値と、属性間の相関とに基づいて、推定対象時期の属性値毎の構成比を推定し、推定された推定対象時期の属性値毎の構成比と、観測値とに基づいて、推定対象時期の非観測値に関する属性値毎の値を更新し、収束判定部が、標本値とのずれ、及び属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、更新部における処理を繰り返させる。   Then, the updating unit determines, for each attribute, the composition ratio for each attribute value of the estimation target time based on the value for each attribute value related to the non-observed value of the estimation target time for other attributes and the correlation between the attributes. The value for each attribute value related to the non-observed value of the estimation target time is updated based on the estimated value and the composition ratio for each attribute value of the estimated target time estimated, and the convergence determination unit The processing in the updating unit is repeated until a predetermined convergence condition is satisfied in terms of the cost representing the deviation of the correlation and the correlation between the attributes.

このように、入力部により受け付けた観測値及び標本値に基づいて、各属性についての、推定対象時期の非観測値に関する属性値毎の値を初期化し、標本値とのずれ、及び属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、各属性について、他の属性についての推定対象時期の非観測値に関する属性値毎の値と、属性間の相関とに基づいて、推定対象時期の属性値毎の構成比を推定し、推定された推定対象時期の属性値毎の構成比と、観測値とに基づいて、推定対象時期の非観測値に関する属性値毎の値を更新することを繰り返すことにより、属性間の相関を考慮して非観測値を精度よく推定することができる。   Thus, based on the observed value and the sample value received by the input unit, the value for each attribute value regarding the non-observed value of the estimation target time for each attribute is initialized, the deviation from the sample value, and between the attributes For each attribute, based on the value for each attribute value regarding the non-observed value of the estimation target time for the other attribute and the correlation between the attributes until the convergence condition defined in advance regarding the cost representing the difference from the correlation is satisfied. The composition ratio for each attribute value of the estimation target time is estimated, and the value for each attribute value related to the non-observation value for the estimation target time is estimated based on the composition ratio for each attribute value of the estimation target time and the observed value. By repeating updating, it is possible to accurately estimate the non-observed value in consideration of the correlation between the attributes.

また、本発明に係る推定装置は、前記更新部は、更に、各属性について更新した、前記推定対象時期の非観測値に関する属性値毎の値に基づいて、前記属性間の相関を更新することができる。   Further, in the estimation apparatus according to the present invention, the update unit further updates the correlation between the attributes based on the value for each attribute value related to the non-observed value of the estimation target time, updated for each attribute. Can.

本発明に係るプログラムは、上記の推定装置の各部として機能させるためのプログラムである。   A program according to the present invention is a program for functioning as each part of the above-mentioned estimation device.

本発明の推定装置、推定方法、およびプログラムによれば、属性間の相関を考慮して非観測値を精度よく推定することができるができる。   According to the estimation apparatus, estimation method, and program of the present invention, it is possible to accurately estimate non-observed values in consideration of the correlation between attributes.

本発明の実施の形態に係る推定装置の構成を示すブロック図である。It is a block diagram which shows the structure of the estimation apparatus which concerns on embodiment of this invention. 本発明の第1の実施の形態に係る初期化部におけるデータの一例を示す図である。It is a figure which shows an example of the data in the initialization part which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る更新部における処理の一例を示す図である。It is a figure which shows an example of the process in the update part which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る更新部における次の属性についての更新処理の一例を示す図である。It is a figure which shows an example of the update process about the next attribute in the update part which concerns on the 1st Embodiment of this invention. 本発明の第1の実施の形態に係る推定装置の推定処理ルーチンを示すフローチャートである。It is a flowchart which shows the estimation processing routine of the estimation apparatus which concerns on the 1st Embodiment of this invention. 本発明の第2の実施の形態に係る属性間の相関を更新する例を示すイメージ図である。It is an image figure showing an example which updates correlation between attributes concerning a 2nd embodiment of the present invention. 本発明の第2の実施の形態に係る推定装置の推定処理ルーチンを示すフローチャートである。It is a flowchart which shows the estimation processing routine of the estimation apparatus which concerns on the 2nd Embodiment of this invention. データの一例を示す図である。It is a figure which shows an example of data. コストにおける推定値と、観測値と、標本値との関係を表すイメージ図である。It is an image figure showing the relation between the estimated value in cost, observation, and sample value. 属性間の関係の一例を表すイメージ図である。It is an image figure showing an example of the relation between attributes. 推定対象時期における各属性(年代と契約期間)における属性値毎の各商品の購入数と年代と契約期間との相関を初期化するイメージ図である。It is an image figure which initializes the correlation with the number of purchasing of each product for each attribute value in each attribute (age and contract period) in estimation target time, and the contract period. 推定対象時期の年代の属性値毎の商品B1及びB2の購入数を更新する場合のイメージ図である。It is an image figure in the case of updating the number of purchases of goods B1 and B2 for every attribute value of the age of presumed object time. 本実施形態と一般的な重回帰分析との最適化可能な範囲の一例を示すイメージ図である。It is an image figure which shows an example of the range which can be optimized with this embodiment and general multiple regression analysis. 属性が3つの場合の例を示すイメージ図である。It is an image figure which shows the example in case an attribute is three. 契約型の商品を扱う事業の例を示すイメージ図である。It is an image figure showing an example of business which deals with contract type goods.

以下、本発明の実施の形態について図面を用いて説明する。   Hereinafter, embodiments of the present invention will be described using the drawings.

<本発明の実施の形態に係る推定装置の原理>
まず、本発明の実施形態の原理について説明する。本実施形態では、契約型の商品を扱う事業であるA社において、推定対象時期における、A社から同業他社であるB社及びC社へ移行した契約者の商品の購入者数を非観測値として推定する場合を例にして説明する。
<Principle of an estimation apparatus according to an embodiment of the present invention>
First, the principle of the embodiment of the present invention will be described. In this embodiment, in the company A, which is a business dealing with contract-type products, the number of purchasers of products of contractors who transferred from company A to company B and company C at the estimation target time is not observed. The case of estimation is described as an example.

推定対象時期の非観測値を、推定対象時期の観測値と、推定対象時期より前の時期のサンプリング調査により得られた標本値とに基づいて、一般的な重回帰分析により推定すると、年代(10代、20代等)や契約期間(1年未満、1年〜3年等)等における推定対象の非観測値(目的変数)の各属性(説明変数)について、属性間の相関を考慮することはできないため、非観測値に不整合が起き得る。例えば、年代が若い人が多いのに、契約期間が長い人も多い等が生じる。   The unobserved value of the estimation target time is estimated by general multiple regression analysis based on the observed value of the estimation target time and the sample value obtained by the sampling survey of the time before the estimation target time. Consider the correlation between attributes for each attribute (explanatory variable) of unobserved value (objective variable) to be estimated in 10's, 20's etc.) and contract period (less than 1 year, 1 year to 3 years etc.) Inconsistencies can occur in unobserved values, as it can not For example, although many people are young, many people have long contract terms.

本実施形態では、観測値は変更せず、観測誤差に応じて標本値を修正し、非観測値について推定を行う。その際、非観測値に関する合算値が観測できることと、標本値として得られる属性間の相関(年齢が若いと契約期間が短い等)を利用する。   In the present embodiment, the observation value is not changed, the sample value is corrected according to the observation error, and the non-observation value is estimated. At that time, the fact that the summed value related to the non-observed values can be observed, and the correlation between attributes obtained as sample values (eg, the contract period is short when the age is young) are used.

例えば、図8に示すようなデータがあるとする。図8中において、A社は自社ユーザに関するデータを保有しているので、自社ユーザに関する数値は観測可能である。すなわち、観測値は、自社商品(A1、A2)の契約数や、自社商品の解約数である。また、他社への契約の移行においても、他社(例えばB社)の商品(例えばB1)の契約数は不明であるが、B社への移行数の合算(B1及びB2の契約数の合計)については観測可能であるとする。   For example, it is assumed that there is data as shown in FIG. In FIG. 8, since company A holds data on its own users, numerical values on its own users are observable. That is, the observed values are the number of contracts of the company product (A1, A2) and the number of cancellations of the company product. In addition, even in the transition of contracts to other companies, the number of contracts of products (for example, B1) of other companies (for example, company B) is unknown, but the total number of transfers to company B (total number of contracts of B1 and B2) Is observable.

また、他社へ移行した契約者の他社商品の契約数や、他社間の状況は不明であるが、過去のデータについては、アンケート調査等のサンプル調査により得ることができる。すなわち、図8において、標本値は、前々月及び前月の他社商品の契約数(商品B1等)の構成比や、他社間の状況(B社からC社への移行数等)となる。   In addition, although the number of contracts of other companies' products by contractors who have shifted to other companies and the situation between other companies are unknown, past data can be obtained through sample surveys such as questionnaires. That is, in FIG. 8, the sample values become the composition ratio of the number of contracts of other companies' products (such as the product B1) in the previous month and the previous month, or the situation between other companies (the number of transitions from company B to company C, etc.).

また、直近の他社へ移行した契約者の他社商品の契約数は観測できない。すなわち、図8において、非観測値は、他社へ移行した契約者の当月の他社商品の契約数となる。   In addition, the number of contracts of other companies' products by contractors who have recently moved to another company can not be observed. That is, in FIG. 8, the unobserved value is the number of contracts of other companies' products for the current month of the contractor who has moved to another company.

本実施形態では、標本値から離れすぎないようにしながら、他の属性との関係性を保つ値をとるように、n番目の属性に関する非観測値の推定値aのコストを下記式(1)のように定義する。このコストを全ての属性について最小化するように、最適化を行う。 In this embodiment, while not too far from the sample value, to take a value to maintain the relationship with other attributes, the following formula cost estimates a n non observations about the n-th attribute (1 Define as). Optimization is performed to minimize this cost for all attributes.

ここで、C(a)は、n番目の属性に関する非観測値の推定値aのコストであり、wは予め定められた重みであり、an_sampleは、標本値から得られる、n番目の属性に関する非観測値であり、rmnはn番目の属性と、m番目の属性との相関を示す値である。 Here, C (a n) is a cost estimate a n non observations about the n-th attribute, w is a weight predetermined, a N_sample is obtained from sampled values, n th The r mn is a value indicating the correlation between the n-th attribute and the m-th attribute.

式(1)において、第1項では、推定値と標本値とのずれが大きくならないようにすることを意味する(図9)。   In the equation (1), the first term means that the deviation between the estimated value and the sample value is not increased (FIG. 9).

また、式(1)において、第2項は、属性間の相関が自然なものとなるようにする。例えば、図10のように、n番目の属性を年代、m番目の属性を契約期間とすると、n番目の属性における属性値毎の商品B1の購入数と、m番目の属性における属性値毎の商品B1の購入数、及びn番目の属性とm番目の属性との相関rmnから求めることができるn番目の属性における属性値毎の商品B1の購入数との差が小さくなるようにすることを意味する。この差が小さい場合、属性間の関係が自然なものであると判断することができるからである。 Also, in equation (1), the second term is such that the correlation between attributes is natural. For example, assuming that the n-th attribute is the age and the m-th attribute is the contract period as shown in FIG. 10, the number of purchases of the product B1 for each attribute value in the n-th attribute and the attribute value for the m-th attribute Make the difference between the number of purchases of the product B1 and the number of purchases of the product B1 for each attribute value in the n-th attribute that can be obtained from the correlation r mn between the n-th attribute and the m-th attribute be small. Means If this difference is small, it can be determined that the relationship between the attributes is natural.

そして、最適化した際に得られる推定値を、非観測値の推定値として出力する。   And the estimated value obtained at the time of optimization is output as an estimated value of a non-observation value.

具体的なコストの最小化手法としては、最急降下法、ニュートン法、動的計画法、MCMC法、ギブスサンプリング等複数存在する。ここで、最適化手法として、ギブスサンプリングを用いた例を、以下に示す。   As a specific cost minimization method, there are a plurality of methods such as steepest descent method, Newton method, dynamic programming method, MCMC method, Gibbs sampling and the like. Here, an example using Gibbs sampling as an optimization method is shown below.

<<ステップ1:初期化>>
まず、観測値及び標本値に基づいて、各属性についての、推定対象時期の非観測値に関する属性値毎の値を初期化する。
<< Step 1: Initialization >>
First, based on the observed value and the sample value, the value for each attribute value regarding the non-observed value of the estimation target time is initialized for each attribute.

図11は、属性値毎の各商品の購入数の合算値と、推定対象時期における各属性(年代と契約期間)における属性値毎の各商品の購入数を初期化し、年代と契約期間との相関を初期化するイメージ図である。   FIG. 11 shows the total value of the number of purchases of each product for each attribute value and the number of purchases of each product for each attribute value in each attribute (age and contract period) in the estimation target time, It is an image figure which initializes correlation.

図11の左部は、推定対象時期よりも前の期間のデータを、右部は推定対象時期のデータの初期値を表す。   The left part of FIG. 11 represents data of a period before the estimation target time, and the right part represents an initial value of data of the estimation target time.

左部の表は上から、年代の属性値(10代、20代等)毎の商品B1及びB2の構成比、契約期間の属性値(1年未満、3年未満等)毎の商品B1及びB2の構成比、及び年代と契約期間との属性値毎の構成比を表す。各構成比は、サンプリング調査により得られる標本値である。   From the top, the table on the left shows the composition ratio of the products B1 and B2 for each attribute value (10s, 20s, etc.) of the year, the product B1 for each attribute value (less than 1 year, 3 years, etc.) of the contract period The composition ratio of B2 and the composition ratio for each attribute value of the generation period and the contract period are shown. Each component ratio is a sample value obtained by sampling survey.

そして、推定対象時期の属性値毎の各商品の購入数の合算値は観測値であり既知であるから、当該推定対象時期の合算値と、得られた属性値毎の構成比とを用いて、推定対象時期の属性値毎の各商品の購入数を算出して、初期値とする。   Then, since the total value of the number of purchases of each item for each attribute value of the estimation target time is an observation value and is known, using the total value of the estimation target time and the component ratio for each obtained attribute value The number of purchases of each product for each attribute value of the estimation target time is calculated, and is set as an initial value.

また、推定対象時期の属性値毎の構成比は、推定対象時期よりも前の期間のデータをそのまま用いる。   Moreover, the composition ratio for every attribute value of estimation object time uses the data of the period before estimation object time as it is.

<<ステップ2:更新>>
次に、各属性について、他の属性についての推定対象時期の非観測値に関する属性値毎の値と、属性間の相関とに基づいて、当該属性の属性値毎の値を算出して、推定対象時期の属性値毎の構成比を推定し、推定された推定対象時期の属性値毎の構成比と、観測値である合算値とに基づいて、推定対象時期の非観測値に関する属性値毎の値を更新する。
<< Step 2: Update >>
Next, for each attribute, the value for each attribute value of the attribute is calculated based on the value for each attribute value related to the non-observed value of the estimation target time for the other attribute and the correlation between the attributes, and estimation The composition ratio for each attribute value of the target time is estimated, and each attribute value related to the non-observed value of the estimation target time is based on the composition ratio for each attribute value of the estimated target time estimated and the summation value as the observation value. Update the value of.

図12は、推定対象時期の年代の属性値毎の商品B1及びB2の購入数を更新する場合のイメージ図である。   FIG. 12 is an image diagram when the number of purchases of the products B1 and B2 is updated for each attribute value of the age of the estimation target time.

具体的には、まず、契約期間を固定した場合の、年代の属性値毎の商品B1及びB2の購入数の推定値を求める。すなわち、ステップ1で求めた他の属性である契約期間の属性値毎の初期値と、契約期間と年代との間の相関とから、年代の属性値毎の商品B1及びB2の購入数の推定値を算出する。なお、2回目以降に当該推定値を算出する場合、初期値ではなく、最後に算出した更新値を用いる。   Specifically, first, an estimated value of the number of purchases of the products B1 and B2 for each attribute value of the age when the contract period is fixed is obtained. That is, from the initial value for each attribute value of the contract period, which is another attribute obtained in step 1, and the correlation between the contract period and the age, the number of purchases of the products B1 and B2 for each attribute value of the age is estimated. Calculate the value. In addition, when calculating the said estimated value after the 2nd time, not the initial value but the update value calculated at the end is used.

次に、算出した年代の属性値毎の商品B1及びB2の購入数の推定値から、商品B1及びB2の購入数の年代の属性値毎の構成比を求め、商品B1及びB2の購入数の属性値毎の構成比の初期値と、求めた商品B1及びB2の購入数の年代の属性値毎の構成比と、加重平均した構成比を求める。例えば、構成比の初期値を2倍、求めた構成比を1倍して加算したものを、3で割って平均を取ったものを加重平均した構成比とする。   Next, from the estimated value of the number of purchases of the products B1 and B2 for each attribute value of the calculated age, the composition ratio for each attribute value of the number of purchases of the products B1 and B2 is determined. The weighted average composition ratio is determined as the initial value of the composition ratio for each attribute value, the composition ratio for each attribute value of the number of purchased products B1 and B2 and the age of the number of purchases. For example, a component ratio obtained by dividing the initial value of the component ratio by 2 and adding the determined component ratio by 1 and dividing it by 3 and taking an average is a weighted average component ratio.

そして、加重平均した構成比と、年代の属性値毎の商品B1及びB2の購入数の合算値とから、年代の属性値毎の商品B1及びB2の購入数を算出し、これを更新値とする。   Then, the number of purchases of the products B1 and B2 for each attribute value of the age is calculated from the weighted average composition ratio and the total value of the number of purchases of the products B1 and B2 for each attribute value of the age, and this is used as the updated value. Do.

この処理を、全ての属性について行い、各属性の属性値毎の商品B1及びB2の購入数を算出する。   This process is performed for all the attributes, and the number of purchased products B1 and B2 for each attribute value of each attribute is calculated.

<<ステップ3:コストの算出>>
次に、標本値とのずれ、及び属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、ステップ2の更新を繰り返す。
<< Step 3: Calculation of Cost >>
Next, the update of step 2 is repeated until a predetermined convergence condition is satisfied in terms of the cost representing the deviation from the sample value and the correlation between the attributes.

具体的には、まず、式(1)を用いて、コストを算出し、コストが収束したか否かを判定する。例えば、前回のコストとの変化量が閾値よりも小さい値になったか否かに基づいて判定すればよい。   Specifically, first, the cost is calculated using Expression (1), and it is determined whether the cost has converged. For example, the determination may be made based on whether the amount of change with the previous cost has become a value smaller than a threshold.

コストが収束していなければ、ステップ2の更新を行う。一方、収束していれば、各属性の属性値毎の商品B1及びB2の更新値を、推定値として出力する。   If the cost does not converge, update step 2. On the other hand, if it converges, the updated value of goods B1 and B2 for every attribute value of each attribute will be output as an estimated value.

このように、本実施形態では、一般的な重回帰分析では難しい、全体としての最適化により、精度が高く、整合性の高い推定結果を得ることができる。   As described above, in the present embodiment, it is possible to obtain an estimation result with high accuracy and high consistency by optimization as a whole which is difficult in general multiple regression analysis.

すなわち、一般的な重回帰分析では、最適化可能な範囲が狭く(例えば、図13において、破線で囲まれた範囲)、全体としての最適化をすることが難しいのに対し、本実施形態では、全体として最適化をすることができる。例えば、図13において、実線で囲まれた範囲が、本実施形態で最適化可能な範囲である。   That is, in the general multiple regression analysis, although the range which can be optimized is narrow (for example, the range surrounded by the broken line in FIG. 13), it is difficult to optimize as a whole in this embodiment. , Can be optimized as a whole. For example, in FIG. 13, the range enclosed by the solid line is the range that can be optimized in the present embodiment.

<本発明の第1の実施の形態に係る推定装置の構成>
図1を参照して、本発明の実施の形態に係る推定装置の構成について説明する。図1は、本発明の実施の形態に係る推定装置の構成を示すブロック図である。
<Configuration of Estimating Device According to First Embodiment of the Present Invention>
The configuration of the estimation apparatus according to the embodiment of the present invention will be described with reference to FIG. FIG. 1 is a block diagram showing a configuration of an estimation apparatus according to an embodiment of the present invention.

推定装置10は、CPUと、RAMと、後述する推定処理ルーチンを実行するためのプログラムを記憶したROMとを備えたコンピュータで構成され、機能的には次に示すように構成されている。   The estimation device 10 is configured by a computer including a CPU, a RAM, and a ROM storing a program for executing an estimation processing routine described later, and is functionally configured as follows.

図1に示すように、本実施形態に係る推定装置10は、入力部100と、演算部200と、出力部300とを備えて構成される。   As shown in FIG. 1, the estimation device 10 according to the present embodiment is configured to include an input unit 100, an arithmetic unit 200, and an output unit 300.

入力部100は、推定対象時期の非観測値に関する合算値を、観測値として受け付けると共に、推定対象時期より前の時期の、各属性についての非観測値に対応するデータに関する属性値毎の構成比、及び非観測値に対応するデータに関する属性間の相関を、標本値として受け付ける。   The input unit 100 receives, as an observed value, the summed value of the non-observed values of the estimation target time, and the composition ratio for each attribute value of data corresponding to the non-observed values of each attribute of the time earlier than the estimation target time. And the correlation between the attributes related to the data corresponding to the non-observed values are accepted as sample values.

具体的には、入力部100は、推定対象時期の非観測値である商品B1及びB2の購入数の合算値を、観測値として受け付ける。また、推定対象時期より前の時期の、年代及び契約期間の各々についての非観測値である商品B1及びB2の購入数に対応するデータに関する属性値毎の構成比、及び商品B1及びB2の購入数に対応するデータに関する年代及び契約期間の間の相関を、標本値として受け付ける。   Specifically, the input unit 100 receives, as an observation value, a total value of the number of purchases of the products B1 and B2 which is a non-observation value of the estimation target time. In addition, composition ratio for each attribute value regarding the data corresponding to the number of purchases of the products B1 and B2, which are non-observed values for each of the generation period and the contract period before the estimation target time, and purchase of the products B1 and B2. The correlation between the age and contract period for the data corresponding to the number is accepted as a sample value.

図2に、各データの具体例を表す。図2に示すように、例えば、推定対象時期の年代の属性値毎の商品B1及びB2の購入数の合算値は、それぞれ800、560、480である。また、推定対象時期の契約期間の属性値毎の商品B1及びB2の購入数の合算値は、それぞれ960、600、280である。   FIG. 2 shows a specific example of each data. As shown in FIG. 2, for example, the total value of the number of purchases of the products B1 and B2 for each attribute value of the age of the estimation target time is 800, 560, 480, respectively. Moreover, the total value of the number of purchases of the products B1 and B2 for each attribute value of the contract period of the estimation target time is 960, 600, 280, respectively.

また、図2に示すように、推定対象時期より前の時期の、年代についての非観測値である商品B1の購入数に対応するデータに関する属性値毎の構成比は、それぞれ70%、43%、20%であり、商品B2の購入数に対応するデータに関する属性値毎の構成比は、30%、57%、80%である。   Further, as shown in FIG. 2, the composition ratio for each attribute value regarding data corresponding to the number of purchases of the product B1 which is a non-observation value for the age before the estimation target time is 70% and 43%, respectively. , 20%, and the composition ratio for each attribute value regarding data corresponding to the number of purchases of the product B2 is 30%, 57%, 80%.

また、推定対象時期より前の時期の、契約期間についての非観測値である商品B1の購入数に対応するデータに関する属性値毎の構成比は、それぞれ56%、44%、29%であり、商品B2の購入数に対応するデータに関する属性値毎の構成比は、それぞれ44%、56%、71%である。   In addition, the composition ratio for each attribute value related to the data corresponding to the number of purchases of the product B1, which is the non-observation value for the contract period, prior to the estimation target time is 56%, 44%, and 29%, The composition ratio for each attribute value regarding the data corresponding to the number of purchases of the product B2 is 44%, 56%, and 71%, respectively.

また、商品B1及びB2の購入数に対応するデータに関する年代及び契約期間の間の相関は、年代及び契約期間の属性値の組み合わせ毎の構成比(54%等)によって表される。   Also, the correlation between the age and the contract period regarding the data corresponding to the number of purchases of the products B1 and B2 is represented by a composition ratio (54% or the like) for each combination of attribute values of the age and the contract period.

そして、入力部100は、受け付けた観測値及び標本値を、初期化部210に渡す。   Then, the input unit 100 passes the received observation value and sample value to the initialization unit 210.

演算部200は、推定対象時期の非観測値を、推定対象時期の観測値と、推定対象時期より前の時期のサンプリング調査により得られた標本値とに基づいて推定する。   The calculation unit 200 estimates the non-observed value of the estimation target time based on the observation value of the estimation target time and the sample value obtained by the sampling survey of the time prior to the estimation target time.

具体的には、演算部200は、初期化部210と、更新部220と、収束判定部230とを備える。   Specifically, the calculation unit 200 includes an initialization unit 210, an update unit 220, and a convergence determination unit 230.

初期化部210は、入力部により受け付けた観測値及び標本値に基づいて、各属性についての、推定対象時期の非観測値に関する属性値毎の値を初期化する。   The initialization unit 210 initializes a value for each attribute value related to the non-observed value of the estimation target time for each attribute based on the observed value and the sample value received by the input unit.

具体的には、初期化部210は、入力部100により受け付けた推定対象時期の年代及び契約期間の属性値毎の商品B1及びB2の購入数の合算値と、年代及び契約期間についての商品B1及びB2の購入数に対応するデータに関する属性値毎の構成比とに基づいて、各属性についての、推定対象時期の非観測値に関する属性値毎の値を算出し、これらを初期値とする。   Specifically, initialization unit 210 adds the total value of the number of purchases of products B1 and B2 for each of the attribute values of the estimation target period received by input unit 100 and the contract period, and the product B1 for the generation period and the contract period. And B2, based on the composition ratio of each attribute value of the data corresponding to the number of purchases, the value of each attribute value of the non-observed value of the estimation target time for each attribute is calculated, and these values are set as initial values.

例えば、図2において、推定対象時期の年代の属性値毎の商品B1及びB2の購入数の合算値800、560、480と、推定対象時期より前の時期の、年代についての非観測値である商品B1の購入数に対応するデータに関する属性値毎の構成比70%、43%、20%から、560、241、96を、推定対象時期の年代の属性値毎の商品B1の購入数の初期値とする。同様に、推定対象時期の年代の属性値毎の商品B2の購入数の初期値を、240、319、384とする。契約期間についても、同様に属性値毎の商品B1の購入数の初期値及び属性値毎の商品B2の購入数の初期値を求める。   For example, in FIG. 2, the sums 800, 560, and 480 of the number of purchases of the products B1 and B2 for each attribute value of the age of the estimation target time and non-observation values for the age of the time before the estimation target time. Composition ratio 70%, 43%, and 20% for each attribute value of data corresponding to the number of purchases of the product B1 to 560, 241, 96 from the initial number of purchases of the product B1 for each attribute value of the age of the estimation target time It will be a value. Similarly, initial values of the number of purchases of the product B2 for each attribute value of the age of the estimation target time are set to 240, 319, and 384. Similarly, for the contract period, an initial value of the number of purchases of the product B1 for each attribute value and an initial value of the number of purchases of the product B2 for each attribute value are obtained.

また、推定対象時期の属性値毎の構成比は、推定対象時期よりも前の期間のデータをそのまま用いる。   Moreover, the composition ratio for every attribute value of estimation object time uses the data of the period before estimation object time as it is.

そして、初期化部210は、観測値、標本値、及び初期値を、更新部220に渡す。   Then, the initialization unit 210 passes the observed value, the sample value, and the initial value to the updating unit 220.

更新部220は、各属性について、他の属性についての推定対象時期の非観測値に関する属性値毎の値と、属性間の相関とに基づいて、推定対象時期の属性値毎の構成比を推定し、推定された推定対象時期の属性値毎の構成比と、観測値とに基づいて、推定対象時期の非観測値に関する属性値毎の値を更新する。   For each attribute, the updating unit 220 estimates the composition ratio for each attribute value of the estimation target time based on the value for each attribute value related to the non-observed value of the estimation target time for other attributes and the correlation between the attributes. Then, based on the composition ratio for each attribute value of the estimated target time and the observed value, the value for each attribute value regarding the non-observed value of the estimated target time is updated.

具体的には、更新部220は、まず、契約期間を固定した場合の、年代の属性値毎の商品B1及びB2の購入数の推定値を求める。すなわち、初期化部210により得られた他の属性である契約期間の属性値毎の初期値と、年代及び契約期間の属性値の組み合わせ毎の構成比とから、年代の属性値毎の商品B1及びB2の購入数の推定値を算出する。なお、2回目以降に当該推定値を算出する場合、初期値ではなく、最後に算出した更新値を用いる。   Specifically, the updating unit 220 first obtains an estimated value of the number of purchases of the products B1 and B2 for each attribute value of the age when the contract period is fixed. That is, from the initial value for each attribute value of the contract period, which is another attribute obtained by the initialization unit 210, and the composition ratio for each combination of the attribute value of the year and the contract period, the product B1 for each attribute value of the age And estimate the number of purchases of B2. In addition, when calculating the said estimated value after the 2nd time, not the initial value but the update value calculated at the end is used.

図3は、本実施形態における更新部220の具体例である。更新部220は、例えば、推定対象時期の契約期間の属性値毎の商品B1の初期値538、264、81と、商品B1における年代及び契約期間の間の属性値毎の構成比(54%等)から、推定対象時期の年代の属性値毎の商品B1の購入数の推定値を算出する。同様に、更新部220は、これを他の商品(商品B2)についても行う。   FIG. 3 is a specific example of the updating unit 220 in the present embodiment. The updating unit 220, for example, the initial values 538, 264, 81 of the product B1 for each attribute value of the contract period of the estimation target time, and the composition ratio (54%, etc. for each attribute value between the age and the contract period in the product B1. From the above, the estimated value of the number of purchases of the product B1 for each attribute value of the age of the estimation target time is calculated. Similarly, the updating unit 220 performs this also for another product (product B2).

次に、更新部220は、年代の属性値毎の商品B1及びB2の購入数の推定値から、当該推定値の属性値毎の構成比(72%等)を求める。   Next, the updating unit 220 obtains a composition ratio (72% or the like) for each attribute value of the estimated value from the estimated value of the number of purchases of the products B1 and B2 for each attribute value of the age.

そして、更新部220は、初期値の属性値毎の構成比又は前回の加重平均した構成比と、推定値の属性値毎の構成比とを加重平均した構成比を求める。例えば、図3に示すように、初期値又は前回更新された構成比を2倍、推定値の構成比を1倍して加算したものを、3で割って平均を取ったものを加重平均した構成比とする。   Then, the updating unit 220 obtains a composition ratio obtained by weighted average of the composition ratio for each attribute value of the initial value or the composition ratio obtained by the previous weighted averaging and the composition ratio for each attribute value of the estimated value. For example, as shown in FIG. 3, weighted averages are obtained by dividing the initial value or the previously updated component ratio by 2 and adding the component ratio of the estimated value by 1 and dividing by 3 and taking the average. It is a composition ratio.

そして、加重平均した構成比を、年代の属性値毎の商品B1及びB2の購入数の合算値800、560、480に対して割戻すことにより、年代の属性値毎の商品B1及びB2の購入数を算出し、これを年代の属性値毎の更新値(565等)とする。   Then, by recounting the weighted average composition ratio with respect to the sum 800, 560, 480 of the number of purchases of the products B1 and B2 for each attribute value of the age, the purchase of the products B1 and B2 for each attribute value of the age Calculate the number, and use this as the updated value (565 etc.) for each attribute value of the age.

この処理を、全ての属性について行い、各属性の属性値毎の商品B1及びB2の購入数の更新値を算出する。   This process is performed on all the attributes, and the updated value of the number of purchases of the products B1 and B2 for each attribute value of each attribute is calculated.

ここで、次の属性について推定値を求める場合、更新部220は、すでに算出した他の属性の更新値を、初期値として用いる。例えば、図4に示すように、先に契約期間の属性値毎の更新値を求めた場合、次に年代の属性値毎の更新値を求める場合には、契約期間における初期値として、更新値を用いる。   Here, when obtaining an estimated value for the next attribute, the updating unit 220 uses, as an initial value, the updated value of another attribute already calculated. For example, as shown in FIG. 4, when the update value for each attribute value of the contract period is obtained first, and then the update value for each attribute value of the year is obtained, the update value is used as the initial value in the contract period. Use

そして、更新部220は、標本値と、初期値と、算出した全ての更新値とを収束判定部230に渡す。   Then, the update unit 220 passes the sample value, the initial value, and all the calculated update values to the convergence determination unit 230.

収束判定部230は、標本値とのずれ、及び属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、更新部220における処理を繰り返させる。   The convergence determination unit 230 repeats the process in the update unit 220 until a predetermined convergence condition is satisfied with respect to the cost representing the deviation from the sample value and the deviation from the correlation between the attributes.

具体的には、収束判定部230は、まず、式(1)を用いて、コストを算出し、コストが収束したか否かを判定する。   Specifically, the convergence determination unit 230 first calculates the cost using Equation (1), and determines whether the cost has converged.

コストが収束していなければ、収束判定部230は、更新部220に、更新処理を再度行わせる。一方、収束していれば、収束判定部230は、各属性の属性値毎の商品B1及びB2の更新値を、出力部300に渡す。   If the cost does not converge, the convergence determination unit 230 causes the updating unit 220 to perform the updating process again. On the other hand, if convergence has occurred, the convergence determination unit 230 passes the updated values of the products B1 and B2 for each attribute value of each attribute to the output unit 300.

出力部300は、各属性の属性値毎の更新値を、推定値として出力する。   The output unit 300 outputs the updated value for each attribute value of each attribute as an estimated value.

具体的には、出力部300は、各属性の属性値毎の商品B1及びB2の更新値を、推定値として出力する。   Specifically, the output unit 300 outputs, as estimated values, updated values of the products B1 and B2 for each attribute value of each attribute.

<本発明の第1の実施の形態に係る推定装置の作用>
図5は、本発明の実施の形態に係る推定処理ルーチンを示すフローチャートである。
<Operation of Estimation Device According to First Embodiment of the Present Invention>
FIG. 5 is a flowchart showing an estimation processing routine according to the embodiment of the present invention.

入力部100にデータが入力されると、推定装置10において、図5に示す推定処理ルーチンが実行される。   When data is input to the input unit 100, the estimation apparatus 10 executes an estimation processing routine shown in FIG.

まず、ステップS100において、入力部100は、推定対象時期の非観測値に関する合算値を、観測値として受け付けると共に、推定対象時期より前の時期の、各属性についての非観測値に対応するデータに関する属性値毎の構成比、及び非観測値に対応するデータに関する属性間の相関を、標本値として受け付ける。   First, in step S100, the input unit 100 receives, as an observed value, the summed value of the non-observed values of the estimation target time, and relates to data corresponding to the non-observed values of each attribute of the time before the estimation target time. The correlation between the composition ratio of each attribute value and the attributes of the data corresponding to the non-observed value is accepted as a sample value.

ステップS110において、初期化部210は、入力部により受け付けた観測値及び標本値に基づいて、各属性についての、推定対象時期の非観測値に関する属性値毎の値を初期化する。   In step S110, the initialization unit 210 initializes, for each attribute, a value for each attribute value related to the non-observation value of the estimation target time based on the observation value and the sample value received by the input unit.

ステップS120において、更新部220は、全ての属性のうち、1番目の属性を選択する。   In step S120, the updating unit 220 selects the first attribute of all the attributes.

ステップS130において、更新部220は、選択している属性について、他の属性についての推定対象時期の非観測値に関する属性値毎の値と、属性間の相関とに基づいて、推定対象時期の属性値毎の推定値を算出する。   In step S130, the updating unit 220 determines the attribute of the estimation target time based on the value for each attribute value related to the non-observed value of the estimation target time of the other attribute and the correlation between the attributes for the selected attribute. Calculate the estimated value for each value.

ステップS140において、更新部220は、選択している属性について、上記ステップS130により推定された推定対象時期の属性値毎の推定値から、推定対象時期の属性値毎の構成比を推定する。   In step S140, the updating unit 220 estimates, for the selected attribute, the component ratio for each attribute value of the estimation target time from the estimated value for each attribute value of the estimation target time estimated in step S130.

ステップS150において、更新部220は、選択している属性について、上記ステップS140により推定された推定対象時期の属性値毎の構成比と、観測値とに基づいて、推定対象時期の非観測値に関する属性値毎の値を更新する。   In step S150, the updating unit 220 relates to the non-observed value of the estimation target time based on the composition ratio for each attribute value of the estimation target time estimated in the step S140 and the observed value for the selected attribute. Update the value of each attribute value.

ステップS160において、更新部220は、全ての属性について、上記ステップS130〜S150の処理をしたか否かを判定する。   In step S160, the updating unit 220 determines whether or not the above-described steps S130 to S150 have been performed for all the attributes.

全ての属性について処理していない場合(ステップS160のNO)、ステップS170において、更新部220は、次の属性を選択して、ステップS130〜S150の処理を繰り返す。   When all the attributes have not been processed (NO in step S160), in step S170, the updating unit 220 selects the next attribute, and repeats the processing in steps S130 to S150.

一方、全ての属性について処理している場合(ステップS160のYES)、ステップS180において、収束判定部230は、標本値とのずれ、及び属性間の相関とのずれを表すコストを算出する。   On the other hand, when all the attributes have been processed (YES in step S160), in step S180, the convergence determination unit 230 calculates a cost representing the difference from the sample value and the difference between the attributes.

ステップS190において、収束判定部230は、コストが予め定められた収束条件を満たすか否かを判定する。   In step S190, the convergence determination unit 230 determines whether the cost satisfies a predetermined convergence condition.

コストが収束していない場合(ステップS190のNO)、ステップS120に戻り、ステップS120〜S180の処理を繰り返す。   If the cost has not converged (NO in step S190), the process returns to step S120, and the processes in steps S120 to S180 are repeated.

一方、コストが収束している場合(ステップS190のYES)、ステップS200において、出力部300は、各属性の属性値毎の更新値を、推定値として出力する。   On the other hand, when the cost has converged (YES in step S190), in step S200, the output unit 300 outputs an updated value for each attribute value of each attribute as an estimated value.

以上説明したように、本実施形態に係る推定装置10によれば、入力部により受け付けた観測値及び標本値に基づいて、各属性についての、推定対象時期の非観測値に関する属性値毎の値を初期化し、標本値とのずれ、及び属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、各属性について、他の属性についての推定対象時期の非観測値に関する属性値毎の値と、属性間の相関とに基づいて、推定対象時期の属性値毎の構成比を推定し、推定された推定対象時期の属性値毎の構成比と、観測値とに基づいて、推定対象時期の非観測値に関する属性値毎の値を更新することを繰り返すことにより、属性間の相関を考慮して非観測値を精度よく推定することができるができる。   As described above, according to the estimation apparatus 10 according to the present embodiment, the value for each attribute value related to the non-observed value of the estimation target time for each attribute based on the observed value and the sample value received by the input unit The attribute regarding the non-observed value of the estimation target time of the other attribute for each attribute until it meets the predetermined convergence condition regarding the cost representing the difference between the sample value and the correlation between the attribute and the attribute. Based on the value for each value and the correlation between attributes, the composition ratio for each attribute value of the estimation target time is estimated, and the composition ratio for each attribute value of the estimated estimation target time and the observed value By repeating updating the value for each attribute value regarding the non-observed value of the estimation target time, the non-observed value can be accurately estimated in consideration of the correlation between the attributes.

<本発明の第2の実施の形態に係る推定装置の構成>
本発明の第2の実施の形態に係る推定装置の構成について説明する。なお、第1の実施の形態に係る推定装置10と同様の構成については、同一の符号を付して詳細な説明は省略する。
<Configuration of Estimating Device According to Second Embodiment of the Present Invention>
The configuration of the estimation apparatus according to the second embodiment of the present invention will be described. About the same composition as estimating device 10 concerning a 1st embodiment, the same numerals are attached and detailed explanation is omitted.

更新部220は、更に、各属性について更新した、推定対象時期の非観測値に関する属性値毎の値に基づいて、属性間の相関を更新する。   The updating unit 220 further updates the correlation between the attributes based on the value for each attribute value related to the non-observed value of the estimation target time, which has been updated for each attribute.

図6は、本実施形態に係る属性間の相関を更新する例を示すイメージ図である。   FIG. 6 is an image diagram showing an example of updating the correlation between attributes according to the present embodiment.

具体的には、更新部220は、年代の属性値毎の商品B1及びB2の購入数の更新値を算出し(図3)、契約期間の属性値毎の商品B1及びB2の購入数の更新値を算出した後(図6上部)、年代及び契約期間についての更新値から、商品B1及びB2それぞれについて、年代と契約期間の間の相関として、属性値の組み合わせ毎の構成比を求める。   Specifically, the updating unit 220 calculates updated values of the number of purchases of the products B1 and B2 for each attribute value of the age (FIG. 3), and updates the number of purchases of the products B1 and B2 for each attribute value of the contract period. After the value is calculated (upper part of FIG. 6), the composition ratio of each combination of attribute values is determined as the correlation between the age and the contract period for each of the products B1 and B2 from the updated values of the age and the contract period.

そして、更新部220は、初期化部210により得られた属性値の組み合わせ毎の構成比、又は前回加重平均した構成比と、更新値に基づいて得られた属性値の組み合わせ毎の構成比との加重平均を取った構成比を算出する(図6下部)。   The updating unit 220 then calculates the component ratio for each combination of attribute values obtained by the initialization unit 210, or the previously weighted-averaged component ratio, and the component ratio for each combination of attribute values obtained based on the updated value. The composition ratio which took the weighted average of is calculated (FIG. 6 lower part).

更新部220は、加重平均した構成比を、年代と契約期間の間の相関を表す、属性値の組み合わせ毎の構成比として更新する。更新部220は、収束判定部230から更新処理命令を受けると、更新された属性値の組み合わせ毎の構成比を用いて、推定対象時期の非観測値に関する属性値毎の値を更新する。   The updating unit 220 updates the weighted-averaged composition ratio as a composition ratio for each combination of attribute values, which represents the correlation between the age and the contract period. When receiving the update processing instruction from the convergence determination unit 230, the update unit 220 updates the value of each attribute value related to the non-observed value of the estimation target time using the updated composition ratio of each combination of attribute values.

<本発明の第2の実施の形態に係る推定装置の作用>
図7は、本発明の実施の形態に係る推定処理ルーチンを示すフローチャートである。なお、第1の実施の形態に係る推定処理ルーチンと同様の処理については、同一の符号を付して詳細な説明は省略する。
<Operation of Estimation Device According to Second Embodiment of the Present Invention>
FIG. 7 is a flowchart showing an estimation processing routine according to the embodiment of the present invention. The same processing as that of the estimation processing routine according to the first embodiment is designated by the same reference numeral and the detailed description is omitted.

ステップS275において、更新部220は、各属性について更新した、推定対象時期の非観測値に関する属性値毎の値に基づいて、属性間の相関を更新する。   In step S275, the updating unit 220 updates the correlation between the attributes based on the value for each attribute value related to the non-observed value of the estimation target time, which has been updated for each attribute.

以上説明したように、本実施形態に係る推定装置10によれば、入力部により受け付けた観測値及び標本値に基づいて、各属性についての、推定対象時期の非観測値に関する属性値毎の値を初期化し、標本値とのずれ、及び属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、各属性について、他の属性についての推定対象時期の非観測値に関する属性値毎の値と、属性間の相関とに基づいて、推定対象時期の属性値毎の構成比を推定し、推定された推定対象時期の属性値毎の構成比と、観測値とに基づいて、推定対象時期の非観測値に関する属性値毎の値を更新し、更に、各属性について更新した、推定対象時期の非観測値に関する属性値毎の値に基づいて、属性間の相関を更新することを繰り返すことにより、属性間の相関を考慮して非観測値を精度よく推定することができる。   As described above, according to the estimation apparatus 10 according to the present embodiment, the value for each attribute value related to the non-observed value of the estimation target time for each attribute based on the observed value and the sample value received by the input unit The attribute regarding the non-observed value of the estimation target time of the other attribute for each attribute until it meets the predetermined convergence condition regarding the cost representing the difference between the sample value and the correlation between the attribute and the attribute. Based on the value for each value and the correlation between attributes, the composition ratio for each attribute value of the estimation target time is estimated, and the composition ratio for each attribute value of the estimated estimation target time and the observed value , Update the value for each attribute value related to the non-observed value of the estimation target time, and further update the correlation between the attributes based on the value for each attribute value related to the non-observed value of the estimation target time updated for each attribute. By repeating things The non-observed value in consideration of the correlation between attributes can be estimated accurately.

なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made without departing from the scope of the present invention.

上記の実施形態では、属性が2つの場合を例に説明したが、これに限定されるものでなく、属性が3以上の場合にも本発明を適用することができる。   In the above embodiment, although the case of two attributes has been described as an example, the present invention is not limited to this, and the present invention can be applied to the case of three or more attributes.

例えば、年代、契約期間、移行先という3つの属性の場合、更新部220は、年代の属性値毎の商品B1及びB2の購入数の推定値を求める際に、契約期間を固定した場合と、移行先を固定した場合とのそれぞれについて、年代の属性値毎の商品B1及びB2の購入数の推定値を求める(図14)。そして、更新部220は、初期値又は前回値と、契約期間を固定した場合と移行先を固定した場合とのそれぞれについて求めた推定値とを加重平均して、年代の属性値毎の商品B1及びB2の購入数の更新値を求める。そして、更新部220は、契約期間の属性値毎の商品B1及びB2の購入数の推定値、及び移行先の属性値毎の商品B1及びB2の購入数の推定値を求める際にも、同様の処理を行う。   For example, in the case of three attributes of age, contract period, and transition destination, the updating unit 220 fixes the contract period when obtaining the estimated value of the number of purchases of the products B1 and B2 for each attribute value of the age; For each of the cases where the transition destination is fixed, an estimated value of the number of purchases of the products B1 and B2 for each attribute value of the age is obtained (FIG. 14). Then, the updating unit 220 performs weighted average of the initial value or the previous value, and the estimated values obtained for each of the fixed contract period and the transition destination fixed, and the product B1 for each attribute value of the age. And the updated value of the number of purchases of and B2. The updating unit 220 similarly obtains the estimated value of the number of purchases of the products B1 and B2 for each attribute value of the contract period, and the estimated value of the number of purchases of the products B1 and B2 for each attribute value of the transition destination. Perform the processing of

また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。   Furthermore, although the present invention has been described as an embodiment in which the program is installed in advance, it is also possible to provide the program by storing the program in a computer readable recording medium.

10 推定装置
100 入力部
200 演算部
210 初期化部
220 更新部
230 収束判定部
300 出力部
DESCRIPTION OF REFERENCE NUMERALS 10 estimation apparatus 100 input unit 200 operation unit 210 initialization unit 220 update unit 230 convergence determination unit 300 output unit

Claims (4)

推定対象時期の非観測値を、前記推定対象時期の観測値と、前記推定対象時期より前の時期のサンプリング調査により得られた標本値とに基づいて推定する推定装置であって、
前記推定対象時期の非観測値に関する合算値を、前記観測値として受け付けると共に、前記推定対象時期より前の時期の、各属性についての前記非観測値に対応するデータに関する属性値毎の構成比、及び前記非観測値に対応するデータに関する属性間の相関を、前記標本値として受け付ける入力部と、
前記入力部により受け付けた前記観測値及び前記標本値に基づいて、各属性についての、前記推定対象時期の非観測値に関する属性値毎の値を初期化する初期化部と、
各属性について、他の属性についての前記推定対象時期の非観測値に関する属性値毎の値と、前記属性間の相関とに基づいて、前記推定対象時期の前記属性値毎の構成比を推定し、前記推定された前記推定対象時期の前記属性値毎の構成比と、前記観測値とに基づいて、前記推定対象時期の非観測値に関する属性値毎の値を更新する更新部と、
前記標本値とのずれ、及び前記属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、前記更新部における処理を繰り返させる収束判定部と、
を含む推定装置。
An estimation apparatus for estimating a non-observation value of an estimation target time based on an observation value of the estimation target time and a sample value obtained by sampling survey of a time before the estimation target time,
A combined value of non-observed values of the estimation target time is received as the observation value, and a composition ratio for each attribute value of data corresponding to the non-observed values for each attribute of the time before the estimation target time, And an input unit that receives, as the sample value, a correlation between attributes related to data corresponding to the non-observation value.
An initialization unit that initializes, for each attribute, a value for each attribute value related to the non-observed value of the estimation target time based on the observed value and the sample value received by the input unit;
For each attribute, the composition ratio for each of the attribute values of the estimation target time is estimated based on the value for each attribute value related to the non-observed value of the estimation target time for other attributes and the correlation between the attributes An updating unit that updates a value for each attribute value related to a non-observation value of the estimation target time based on a component ratio of each of the attribute values of the estimation target time estimated and the observation value;
A convergence determining unit that repeats the process in the updating unit until a predetermined convergence condition is satisfied with respect to the cost representing the deviation from the sample value and the deviation from the correlation between the attributes;
Estimator including.
前記更新部は、更に、各属性について更新した、前記推定対象時期の非観測値に関する属性値毎の値に基づいて、前記属性間の相関を更新する
請求項1記載の推定装置。
The estimation device according to claim 1, wherein the updating unit further updates the correlation between the attributes based on the value for each attribute value related to the non-observation value of the estimation target time, which is updated for each attribute.
推定対象時期の非観測値を、前記推定対象時期の観測値と、前記推定対象時期より前の時期のサンプリング調査により得られた標本値とに基づいて推定する推定方法であって、
入力部が、前記推定対象時期の非観測値に関する合算値を、前記観測値として受け付けると共に、前記推定対象時期より前の時期の、各属性についての前記非観測値に対応するデータに関する属性値毎の構成比、及び前記非観測値に対応するデータに関する属性間の相関を、前記標本値として受け付けるステップと、
初期化部が、前記入力部により受け付けた前記観測値及び前記標本値に基づいて、各属性についての、前記推定対象時期の非観測値に関する属性値毎の値を初期化するステップと、
更新部が、各属性について、他の属性についての前記推定対象時期の非観測値に関する属性値毎の値と、前記属性間の相関とに基づいて、前記推定対象時期の前記属性値毎の構成比を推定し、前記推定された前記推定対象時期の前記属性値毎の構成比と、前記観測値とに基づいて、前記推定対象時期の非観測値に関する属性値毎の値を更新するステップと、
収束判定部が、前記標本値とのずれ、及び前記属性間の相関とのずれを表すコストに関して予め定められた収束条件を満たすまで、前記更新するステップにおける処理を繰り返させるステップと、
を含む推定方法。
An estimation method for estimating a non-observation value of an estimation target time based on an observation value of the estimation target time and a sample value obtained by sampling survey of a time before the estimation target time,
The input unit receives, as the observed value, the summed value of the non-observed value of the estimation target time as the observed value, and at each attribute value of data corresponding to the non-observed value of each attribute of the time earlier than the estimation target time. Accepting, as the sample value, a correlation between a component ratio of the data and an attribute related to data corresponding to the non-observed value;
Initializing a value for each attribute value related to a non-observed value of the estimation target time for each attribute based on the observed value and the sample value received by the input unit;
The updating unit is configured for each attribute value of the estimation target time based on the value for each attribute value regarding the non-observed value of the estimation target time for the other attribute and the correlation between the attributes for each attribute. Estimating the ratio, and updating the value for each attribute value related to the non-observed value of the estimation target time based on the component ratio for each attribute value of the estimated estimation target time and the observed value; ,
Causing the convergence determination unit to repeat the processing in the updating step until the convergence condition defined in advance with respect to the cost representing the deviation from the sample value and the deviation from the correlation between the attributes is satisfied;
Estimation method including:
コンピュータを、請求項1又は2記載の推定装置の各部として機能させるためのプログラム。   The program for functioning a computer as each part of the estimation apparatus of Claim 1 or 2.
JP2017233686A 2017-12-05 2017-12-05 Estimator, estimation method, and program Active JP6768627B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017233686A JP6768627B2 (en) 2017-12-05 2017-12-05 Estimator, estimation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017233686A JP6768627B2 (en) 2017-12-05 2017-12-05 Estimator, estimation method, and program

Publications (2)

Publication Number Publication Date
JP2019101875A true JP2019101875A (en) 2019-06-24
JP6768627B2 JP6768627B2 (en) 2020-10-14

Family

ID=66973820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017233686A Active JP6768627B2 (en) 2017-12-05 2017-12-05 Estimator, estimation method, and program

Country Status (1)

Country Link
JP (1) JP6768627B2 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008071207A (en) * 2006-09-14 2008-03-27 Murata Mach Ltd Method and apparatus for estimating optimal value and program for optimal value estimation apparatus
JP2008107963A (en) * 2006-10-24 2008-05-08 Hitachi Ltd Method for estimating three-dimensional data, and program
JP2009238193A (en) * 2008-03-07 2009-10-15 Nec Corp Circulation prediction system, method and program, and influence degree estimation system, method and program
US20130035980A1 (en) * 2011-08-01 2013-02-07 Nextgen Innovation Labs, Llc Method for measuring market share for a communication service provider

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008071207A (en) * 2006-09-14 2008-03-27 Murata Mach Ltd Method and apparatus for estimating optimal value and program for optimal value estimation apparatus
JP2008107963A (en) * 2006-10-24 2008-05-08 Hitachi Ltd Method for estimating three-dimensional data, and program
JP2009238193A (en) * 2008-03-07 2009-10-15 Nec Corp Circulation prediction system, method and program, and influence degree estimation system, method and program
US20130035980A1 (en) * 2011-08-01 2013-02-07 Nextgen Innovation Labs, Llc Method for measuring market share for a communication service provider

Also Published As

Publication number Publication date
JP6768627B2 (en) 2020-10-14

Similar Documents

Publication Publication Date Title
Bowden et al. Assessing the suitability of summary data for two-sample Mendelian randomization analyses using MR-Egger regression: the role of the I 2 statistic
Breheny The group exponential lasso for bi-level variable selection
AU2013217027B2 (en) Analytics driven engagement
Yan et al. Model selection for Cox models with time-varying coefficients
TW202008264A (en) Method and apparatus for recommendation marketing via deep reinforcement learning
Van den Brakel et al. Dealing with small sample sizes, rotation group bias and discontinuities in a rotating panel design
CN110020877B (en) Click rate prediction method, click rate determination method and server
McGovern et al. On the assumption of bivariate normality in selection models: a copula approach applied to estimating HIV prevalence
JP2010122825A (en) Data estimating device, data estimating method, and data estimating program
JP2010211684A (en) Method, program and apparatus for processing data
Fang et al. Effective confidence interval estimation of fault-detection process of software reliability growth models
Inoue et al. Bivariate change-point modeling for software reliability assessment with uncertainty of testing-environment factor
Gelper et al. Multivariate out-of-sample tests for Granger causality
Brockhaus et al. Signal regression models for location, scale and shape with an application to stock returns
Elorrieta et al. A novel bivariate autoregressive model for predicting and forecasting irregularly observed time series
Cakmak et al. Solving Bayesian risk optimization via nested stochastic gradient estimation
CN104462093B (en) personal recommendation scheme
Benitez-Herrera et al. Cosmological parameter estimation from SN Ia data: a model-independent approach
Wahyuningrum et al. GSTARX-GLS Model for Spatio-Temporal Data Forecasting.
JP2019101875A (en) Estimation device, estimation method, and program
Shah et al. Issues of Using Function Point Analysis Method for Requirement Changes During Software Development Phase
US20180033031A1 (en) Evaluation estimation apparatus capable of estimating evaluation based on period shift correlation, method, and computer-readable storage medium
Mohammadi et al. Hierarchical evaluation of criteria and alternatives within BWM: A Monte Carlo approach
JP2015187773A (en) Data analysis device, data analysis program, and data analysis method
Schwartz et al. Modeling crowdsourcing platforms to enable workforce dimensioning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200820

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200923

R150 Certificate of patent or registration of utility model

Ref document number: 6768627

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150