JP2010108488A - Tabulation system, tabulation processor, information provider terminal, tabulation method and program - Google Patents
Tabulation system, tabulation processor, information provider terminal, tabulation method and program Download PDFInfo
- Publication number
- JP2010108488A JP2010108488A JP2009224212A JP2009224212A JP2010108488A JP 2010108488 A JP2010108488 A JP 2010108488A JP 2009224212 A JP2009224212 A JP 2009224212A JP 2009224212 A JP2009224212 A JP 2009224212A JP 2010108488 A JP2010108488 A JP 2010108488A
- Authority
- JP
- Japan
- Prior art keywords
- tabulation
- attribute
- unit
- transition probability
- generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 92
- 230000007704 transition Effects 0.000 claims abstract description 152
- 239000011159 matrix material Substances 0.000 claims abstract description 132
- 238000012423 maintenance Methods 0.000 claims abstract description 50
- 230000005540 biological transmission Effects 0.000 claims description 110
- 238000012545 processing Methods 0.000 claims description 97
- 230000002776 aggregation Effects 0.000 claims description 86
- 238000004220 aggregation Methods 0.000 claims description 86
- 238000004364 calculation method Methods 0.000 claims description 86
- 230000008569 process Effects 0.000 claims description 23
- 230000008859 change Effects 0.000 abstract description 10
- 238000004891 communication Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 14
- 238000010586 diagram Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Landscapes
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、集計システム、集計処理装置、情報提供者端末、集計方法およびプログラムに関する。 The present invention relates to an aggregation system, an aggregation processing device, an information provider terminal, an aggregation method, and a program.
近年、データベースにおける個々のデータ(例えば、情報提供者端末から取得したアンケート結果など)を統計的手法により秘匿しつつ(つまり、情報提供者端末の有効なデータを経由して抽出できないことを担保しつつ)、クロス集計結果のみを得る技術が考えられている(例えば、非特許文献1および2参照。)。
In recent years, it has been ensured that individual data in a database (for example, questionnaire results obtained from an information provider terminal, etc.) is concealed by a statistical method (that is, cannot be extracted via valid data of the information provider terminal). However, a technique for obtaining only the cross tabulation result is considered (for example, see
なお、以下に、「クロス集計」と、「単純集計」とについて説明しておく。 In the following, “cross tabulation” and “simple tabulation” will be described.
「単純集計」とは、テーブルに含まれている1つの属性に着目し、該着目した1つの属性のみに関してレコードを集計する集計法である。 “Simple tabulation” is a tabulation method that focuses on one attribute included in the table and tabulates records for only the one attribute focused on.
より具体的には、図10に示す集計結果が、単純集計を行ったときに得られた集計結果の一例である。図10に示した例では、「人数」の列の値が集計値である。 More specifically, the aggregation result shown in FIG. 10 is an example of the aggregation result obtained when simple aggregation is performed. In the example illustrated in FIG. 10, the value in the “number of people” column is the total value.
一方、「クロス集計」とは、テーブルに含まれている複数の属性に着目し、該着目した属性すべてに関して値が等しいようなレコードを集計する集計法である。 On the other hand, “cross tabulation” is a tabulation method that focuses on a plurality of attributes included in a table and tabulates records having the same value for all of the focused attributes.
より具体的には、図11に示す集計結果が、「クロス集計」を行ったときに得られた集計結果の一例である。図11に示した例では、「年代」と「性別」との2つの属性に着目して、「人数」の集計値を算出している。例えば、「10代」で「男性」であるレコードの数は「4」である。 More specifically, the tabulation result shown in FIG. 11 is an example of the tabulation result obtained when “cross tabulation” is performed. In the example illustrated in FIG. 11, the total value of “number of people” is calculated by paying attention to two attributes of “age” and “gender”. For example, the number of records “10” and “male” is “4”.
なお、以下では、複数の属性(例えば、「10代」と「男性」)に対する値を1つの値とみなしたものを「クロス値」という。 In the following description, a value regarding a plurality of attributes (for example, “teen” and “male”) regarded as one value is referred to as a “cross value”.
しかしながら、非特許文献1および2に開示された一般的な技術においては、個々のデータを秘匿しつつ真のクロス集計の推定値を算出する際、クロス値として指定する各属性が取り得る値が多い場合、これらの技術を適用して構成した集計処理装置がクロス集計結果を算出するために要する時間が非常に長くなってしまうという問題点がある。
However, in the general techniques disclosed in
また、非特許文献1および2に開示された一般的な技術においては、クロス値として指定する各属性が取り得る値が多い場合、これらの技術を適用して構成した集計処理装置がクロス集計結果を算出する際、当該算出のために集計処理装置が使用するメモリ使用量が数GB以上となってしまう場合もある。そのため、当該メモリ使用量が、該算出を行う集計処理装置が搭載しているメモリ量のうちでクロス集計結果の算出用に割当可能なメモリ量よりも多くなってしまった場合には、集計処理装置がクロス集計結果の算出を行うことをできなくなってしまうという問題点がある。
Further, in the general techniques disclosed in
本発明は、上述した課題を解決する集計システム、集計処理装置、情報提供者端末、集計方法およびプログラムを提供することを目的とする。 An object of this invention is to provide the total system, total processing apparatus, information provider terminal, total method, and program which solve the subject mentioned above.
上記課題を解決するために、本発明の集計システムは、入力を受付けたデータのうちから決定した送信データを送信する情報提供者端末と、該情報提供者端末から送信されてきた送信データを集計する集計処理装置とを具備する集計システムにおいて、前記集計処理装置は、前記データが属する属性に対してあらかじめ定められた維持確率と、前記属性とを前記情報提供者端末へ送信する情報送信部と、 In order to solve the above-mentioned problem, the tabulation system of the present invention tabulates an information provider terminal that transmits transmission data determined from data that has been accepted, and transmission data transmitted from the information provider terminal. In the aggregation system comprising the aggregation processing device, the aggregation processing device includes an information transmission unit that transmits a predetermined maintenance probability to the attribute to which the data belongs and the attribute to the information provider terminal. ,
で表される要素Apqをそれぞれ算出し、該算出した要素Apqを有する遷移確率行列を生成する要素算出部と、前記情報提供者端末から送信されてきた送信データを集計したクロス集計を生成する集計部と、前記集計部が生成したクロス集計と、前記要素算出部が生成した遷移確率行列とに基づいて、真のクロス集計の推定値である推定クロス集計を算出する推定部とを有し、前記情報提供者端末は、前記データを記憶する記憶部と、前記集計処理装置から維持確率と属性とが送信されてきた際、乱数を生成する確率変更部と、前記集計処理装置から送信されてきた維持確率および属性と、前記確率変更部が生成した乱数とに基づいて、前記記憶しているデータのうちから該集計処理装置へ送信する前記送信データを決定する送信データ決定部と、前記送信データ決定部が決定した送信データを前記集計処理装置へ送信するデータ送信部とを有することを特徴とする。 Each element A pq is calculated and an element calculation unit that generates a transition probability matrix having the calculated element A pq and a cross tabulation that totals transmission data transmitted from the information provider terminal are generated. And an estimation unit that calculates an estimated cross tabulation that is an estimated value of the true cross tabulation based on the cross tabulation generated by the tabulation unit and the transition probability matrix generated by the element calculation unit. The information provider terminal transmits a storage unit that stores the data, a probability changing unit that generates a random number when a maintenance probability and an attribute are transmitted from the aggregation processing device, and a transmission from the aggregation processing device. A transmission data determination unit that determines the transmission data to be transmitted to the aggregation processing device from the stored data based on the maintenance probability and attribute that have been generated and the random number generated by the probability change unit , And having a data transmitting unit for transmitting the transmission data to which the transmission data determination unit has determined to the aggregation processing device.
また、本発明の集計処理システムにおいては、前記要素算出部は、前記属性毎に前記要素Apqを算出し、該属性毎に算出した前記要素Apqをそれぞれ有する複数の属性別遷移確率行列を生成し、前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が生成した複数の属性別遷移確率行列とに基づいて、前記推定クロス推計を算出してもよい。 In the counting processing system of the present invention, said element calculation unit, the element A pq is calculated for each of the attributes, a plurality of demographic transition probability matrix with each said element A pq calculated for each the attribute The estimation unit may calculate the estimated cross estimate based on the cross tabulation generated by the tabulation unit and the plurality of attribute-specific transition probability matrices generated by the element calculation unit.
また、本発明の集計システムにおいては、前記要素算出部は、前記属性別遷移確率行列のそれぞれがメモリ上に展開されるときのサイズに基づき、それぞれが少なくとも1つの前記属性別遷移確率行列を含む複数の分割遷移確率行列を生成し、前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が生成した複数の分割遷移確率行列とに基づいて、前記推定クロス推計を算出してもよい。 In the tabulation system of the present invention, the element calculation unit includes at least one attribute-specific transition probability matrix based on a size when each of the attribute-specific transition probability matrices is expanded on a memory. A plurality of split transition probability matrices are generated, and the estimation unit calculates the estimated cross estimate based on the cross tabulation generated by the tabulation unit and the plurality of split transition probability matrices generated by the element calculation unit. May be.
また、本発明の集計システムにおいては、前記推定部は、前記集計部が生成したクロス集計に対して、該クロス集計が得られた場合の事後確率を求めるための条件である所定の事後確率算出条件を適用することにより、前記推定クロス集計を算出してもよい。 In the tabulation system of the present invention, the estimation unit calculates a predetermined posterior probability that is a condition for obtaining a posterior probability when the cross tabulation is obtained for the cross tabulation generated by the tabulation unit. The estimated cross tabulation may be calculated by applying a condition.
また、本発明の集計システムにおいては、前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が算出した遷移確率行列の逆行列とに基づいて、前記推定クロス集計を算出してもよい。 In the tabulation system of the present invention, the estimation unit calculates the estimated cross tabulation based on the cross tabulation generated by the tabulation unit and the inverse matrix of the transition probability matrix calculated by the element calculation unit. May be.
上記課題を解決するために、本発明の集計処理装置は、入力を受付けたデータのうちから決定した送信データを送信する情報提供者端末と接続されており、該情報提供者端末から送信されてきた送信データを集計する集計処理装置であって、前記データが属する属性に対してあらかじめ定められた維持確率と、前記属性とを前記情報提供者端末へ送信する情報送信部と、 In order to solve the above-described problem, the aggregation processing device of the present invention is connected to an information provider terminal that transmits transmission data determined from among the received data, and is transmitted from the information provider terminal. A totalization processing device that counts the transmitted data, a maintenance probability predetermined for the attribute to which the data belongs, and an information transmission unit that transmits the attribute to the information provider terminal;
で表される要素Apqをそれぞれ算出し、該算出した要素Apqを有する遷移確率行列を生成する要素算出部と、前記情報提供者端末から送信されてきた、前記維持確率と前記属性と該情報提供者端末が生成した乱数とに基づいて該情報提供者端末が決定した送信データを集計したクロス集計を生成する集計部と、前記集計部が生成したクロス集計と、前記要素算出部が生成した遷移確率行列とに基づいて、真のクロス集計の推定値である推定クロス集計を算出する推定部とを有する。 Calculated in represented elements A pq are respectively, the element calculation unit for generating a transition probability matrix having elements A pq of the calculated, transmitted from the information provider terminal, the attributes and the said maintaining probability Based on the random number generated by the information provider terminal, a totaling unit that generates a cross tabulation that totals transmission data determined by the information provider terminal, a cross tabulation generated by the tabulation unit, and the element calculation unit generated And an estimation unit that calculates an estimated cross tabulation that is an estimated value of the true cross tabulation based on the transition probability matrix.
また、本発明の集計処理装置においては、前記要素算出部は、前記属性毎に前記要素Apqを算出し、該属性毎に算出した前記要素Apqをそれぞれ有する複数の属性別遷移確率行列を生成し、前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が生成した複数の属性別遷移確率行列とに基づいて、前記推定クロス推計を算出してもよい。 Further, the aggregation processing apparatus of the present invention, said element calculation unit, the element A pq is calculated for each of the attributes, a plurality of demographic transition probability matrix with each said element A pq calculated for each the attribute The estimation unit may calculate the estimated cross estimate based on the cross tabulation generated by the tabulation unit and the plurality of attribute-specific transition probability matrices generated by the element calculation unit.
また、本発明の集計処理装置においては、前記要素算出部は、前記属性別遷移確率行列のそれぞれがメモリ上に展開されるときのサイズに基づき、それぞれが少なくとも1つの前記属性別遷移確率行列を含む複数の分割遷移確率行列を生成し、前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が生成した複数の分割遷移確率行列とに基づいて、前記推定クロス推計を算出してもよい。 In the tabulation processing apparatus of the present invention, the element calculation unit may determine at least one attribute-specific transition probability matrix based on a size when each of the attribute-specific transition probability matrices is expanded on a memory. A plurality of split transition probability matrices including, and the estimation unit calculates the estimated cross estimate based on the cross tabulation generated by the tabulation unit and the plurality of split transition probability matrices generated by the element calculation unit May be.
また、本発明の集計処理装置においては、前記推定部は、前記集計部が生成したクロス集計に対して、該クロス集計が得られた場合の事後確率を求めるための条件である所定の事後確率算出条件を適用することにより、前記推定クロス集計を算出してもよい。 In the tabulation processing apparatus of the present invention, the estimation unit is a predetermined posterior probability that is a condition for obtaining a posterior probability when the cross tabulation is obtained for the cross tabulation generated by the tabulation unit. The estimated cross tabulation may be calculated by applying a calculation condition.
また、本発明の集計処理装置においては、前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が算出した遷移確率行列の逆行列とに基づいて、前記推定クロス集計を算出してもよい。 In the tabulation processing apparatus of the present invention, the estimation unit calculates the estimated cross tabulation based on the cross tabulation generated by the tabulation unit and the inverse matrix of the transition probability matrix calculated by the element calculation unit. May be.
上記課題を解決するために、本発明の情報提供者端末は、集計処理装置と接続された情報提供者端末であって、当該情報提供者端末にて入力を受付けたデータを記憶する記憶部と、前記データが属する属性に対してあらかじめ定められた維持確率と、前記属性とが前記集計処理装置から送信されてきた際、乱数を生成する確率変更部と、前記集計処理装置から送信されてきた維持確率および属性と、前記確率変更部が生成した乱数とに基づいて、前記記憶しているデータのうちから該集計処理装置へ送信する前記送信データを決定する送信データ決定部と、前記送信データ決定部が決定した送信データを前記集計処理装置へ送信するデータ送信部とを有する。 In order to solve the above-described problem, an information provider terminal of the present invention is an information provider terminal connected to a totalization processing device, and a storage unit that stores data accepted by the information provider terminal; When the maintenance probability predetermined for the attribute to which the data belongs and the attribute are transmitted from the tabulation processing device, the probability changing unit that generates a random number and the tabulation processing device A transmission data determination unit for determining the transmission data to be transmitted to the aggregation processing device from the stored data based on a maintenance probability and an attribute and a random number generated by the probability change unit; and the transmission data And a data transmission unit that transmits the transmission data determined by the determination unit to the aggregation processing device.
上記課題を解決するために、本発明の集計方法は、入力を受付けたデータのうちから決定した送信データを送信する情報提供者端末と、該情報提供者端末から送信されてきた送信データを集計する集計処理装置とを具備する集計システムにおいて、該送信データを集計する集計方法であって、前記情報提供者端末が、前記データを記憶する記憶処理と、前記集計処理装置が、前記データが属する属性に対してあらかじめ定められた維持確率と、前記属性とを前記情報提供者端末へ送信する情報送信処理と、前記情報提供者端末が、前記集計処理装置から維持確率と属性とが送信されてきた際、乱数を生成する確率変更処理と、前記情報提供者端末が、前記集計処理装置から送信されてきた維持確率および属性と、前記生成した乱数とに基づいて、前記記憶しているデータのうちから該集計処理装置へ送信する前記送信データを決定する送信データ決定処理と、前記情報提供者端末が、前記決定した送信データを前記集計処理装置へ送信するデータ送信処理と、前記集計処理装置が、 In order to solve the above-described problems, the tabulation method of the present invention tabulates an information provider terminal that transmits transmission data determined from data that has been accepted, and transmission data transmitted from the information provider terminal. In the tabulation system comprising the tabulation processing device, the tabulation method for tabulating the transmission data, wherein the information provider terminal stores the data, and the tabulation processing device belongs to the data A maintenance probability predetermined for the attribute, an information transmission process for transmitting the attribute to the information provider terminal, and the information provider terminal has transmitted the maintenance probability and the attribute from the aggregation processing device. The probability changing process for generating a random number, the information provider terminal based on the maintenance probability and attribute transmitted from the tabulation processing apparatus, and the generated random number A transmission data determination process for determining the transmission data to be transmitted to the aggregation processing device from the stored data, and data for the information provider terminal to transmit the determined transmission data to the aggregation processing device Transmission processing and the totalization processing device,
で表される要素Apqをそれぞれ算出し、該算出した要素Apqを有する遷移確率行列を生成する要素算出処理と、前記集計処理装置が、前記情報提供者端末から送信されてきた送信データを集計したクロス集計を生成する集計処理と、前記集計処理装置が、前記生成したクロス集計と、前記生成した遷移確率行列とに基づいて、真のクロス集計の推定値である推定クロス集計を算出する推定処理とを有する。 In represented elements A pq is the calculated respectively, and the element calculation process of generating the transition probability matrix having elements A pq of the calculated, the aggregation processing device, the transmission data transmitted from the information provider terminal Based on the generated cross tabulation and the generated transition probability matrix, the tabulation processing for generating the tabulated cross tabulation and the tabulation processing device calculate an estimated cross tabulation that is an estimated value of the true cross tabulation. And an estimation process.
また、本発明の集計方法においては、前記要素算出処理は、前記集計処理装置が、前記属性毎に前記要素Apqを算出し、該属性毎に算出した前記要素Apqをそれぞれ有する複数の属性別遷移確率行列を生成する処理とし、前記推定処理は、前記集計処理装置が、前記生成したクロス集計と、前記生成した複数の属性別遷移確率行列とに基づいて、前記推定クロス推計を算出する処理としてもよい。 In the aggregation process of the present invention, said element calculation processing, the aggregation processing device calculates the element A pq for each of the attributes, the plurality of attributes each having the element A pq calculated for each the attribute In the estimation processing, the aggregation processing device calculates the estimated cross estimation based on the generated cross aggregation and the generated plurality of attribute-specific transition probability matrices. It is good also as processing.
また、本発明の集計方法においては、前記要素算出処理は、前記集計処理装置が、前記属性別遷移確率行列のそれぞれがメモリ上に展開されるときのサイズに基づき、それぞれが少なくとも1つの前記属性別遷移確率行列を含む複数の分割遷移確率行列を生成する処理とし、前記推定処理は、前記集計処理装置が、前記生成したクロス集計と、前記生成した複数の分割遷移確率行列とに基づいて、前記推定クロス推計を算出する処理としてもよい。 Further, in the tabulation method of the present invention, the element calculation processing is performed by the tabulation processing device based on a size when each of the attribute-specific transition probability matrices is expanded on a memory, and each of the attribute calculation processes is at least one attribute. A process of generating a plurality of split transition probability matrices including another transition probability matrix, and the estimation process is based on the generated cross tabulation and the generated plurality of split transition probability matrices. The estimated cross estimation may be calculated.
また、コンピュータに実行させるプログラムであって、入力を受付けたデータのうちから決定した送信データを送信する情報提供者端末と接続されている集計処理装置に、前記情報提供者端末にて入力を受付けたデータが属する属性に対してあらかじめ定められた維持確率と、前記属性とを前記情報提供者端末へ送信する情報送信手順と、 Also, a program to be executed by a computer, and accepting an input at the information provider terminal to an aggregation processing device connected to an information provider terminal that transmits transmission data determined from among the accepted data An information transmission procedure for transmitting a predetermined maintenance probability to the attribute to which the data belongs and the attribute to the information provider terminal;
で表される要素Apqをそれぞれ算出し、該算出した要素Apqを有する遷移確率行列を生成する要素算出手順と、前記情報提供者端末から送信されてきた、前記維持確率と前記属性と該情報提供者端末が生成した乱数とに基づいて該情報提供者端末が決定した送信データを集計したクロス集計を生成する集計手順と、前記生成したクロス集計と、前記生成した遷移確率行列とに基づいて、真のクロス集計の推定値である推定クロス集計を算出する推定手順とを実行させる。 The element calculation procedure for calculating the element A pq represented by the above and generating the transition probability matrix having the calculated element A pq , the maintenance probability, the attribute, and the attribute transmitted from the information provider terminal Based on a counting procedure for generating a cross tabulation in which transmission data determined by the information provider terminal is tabulated based on a random number generated by the information provider terminal, the generated cross tabulation, and the generated transition probability matrix Then, an estimation procedure for calculating an estimated cross tabulation that is an estimated value of the true cross tabulation is executed.
また、本発明のプログラムにおいては、前記要素算出手順は、前記属性毎に前記要素Apqを算出し、該属性毎に算出した前記要素Apqをそれぞれ有する複数の属性別遷移確率行列を生成する手順とし、前記推定手順は、前記生成したクロス集計と、前記生成した複数の属性別遷移確率行列とに基づいて、前記推定クロス推計を算出する手順としてもよい。 Further, in the program of the present invention, said element calculation procedure, the calculated element A pq, generates a plurality of demographic transition probability matrix with each said element A pq calculated for each the attribute for each of the attributes The estimation procedure may be a procedure for calculating the estimated cross estimate based on the generated cross tabulation and the generated plurality of attribute-specific transition probability matrices.
また、本発明のプログラムにおいては、前記要素算出手順は、前記属性別遷移確率行列のそれぞれがメモリ上に展開されるときのサイズに基づき、それぞれが少なくとも1つの前記属性別遷移確率行列を含む複数の分割遷移確率行列を生成する手順とし、前記推定手順は、前記生成したクロス集計と、前記生成した複数の分割遷移確率行列とに基づいて、前記推定クロス推計を算出する手順としてもよい。 In the program of the present invention, the element calculation procedure includes a plurality of attribute-specific transition probability matrices each including at least one attribute-specific transition probability matrix based on a size when each of the attribute-specific transition probability matrices is expanded on a memory. The divided transition probability matrix may be generated, and the estimation procedure may be a procedure for calculating the estimated cross estimate based on the generated cross tabulation and the plurality of generated divided transition probability matrices.
本発明によれば、個々のデータを秘匿しつつ真のクロス集計の推定値を算出する際、レコード全体に対する遷移確率行列の次数として、各属性が取り得る値の2進表現を用いた場合よりも値が小さな当該各属性の取り得る値の個数を用いて真のクロス集計の推定値を算出する。 According to the present invention, when calculating the estimated value of the true cross tabulation while concealing individual data, as a degree of the transition probability matrix for the entire record, a binary representation of values that each attribute can take is used. The estimated value of the true cross tabulation is calculated using the number of values that can be taken by each attribute with a small value.
このような構成としたため、クロス集計結果を算出するときに集計処理装置が使用するメモリ使用量を一般的な技術よりも小さくすることができる。 With such a configuration, the memory usage used by the totalization processing apparatus when calculating the cross tabulation result can be made smaller than that of a general technique.
さらに、メモリ使用量を抑えることにより、クロス値として指定する各属性が取り得る値が多い場合でも、集計処理のうちで最も計算量が多いレコード全体に対する遷移確率行列に対する演算を一般的な技術よりも短い時間で行うことが可能となる。 Furthermore, by reducing the amount of memory used, even when there are many possible values for each attribute specified as a cross value, the calculation for the transition probability matrix for the entire record with the largest amount of calculation in the aggregation process can be performed using general techniques. Can also be performed in a short time.
(実施形態1)
以下、本発明の実施形態1に従った集計システム(集計処理装置、情報提供者端末、集計方法およびプログラムを含む)を説明する。
(Embodiment 1)
Hereinafter, a counting system (including a counting processing device, an information provider terminal, a counting method, and a program) according to the first embodiment of the present invention will be described.
実施形態1の集計システムは、ある結果(データ)が得られた際に、当該結果を反映した下での事後確率を求めるための「所定の事後確率算出条件」を用いて、真のクロス集計xの推定値である「推定クロス集計」を算出する。 When a certain result (data) is obtained, the tabulation system according to the first embodiment uses a “predetermined posterior probability calculation condition” for obtaining a posterior probability under the reflection of the result. An “estimated cross tabulation” that is an estimated value of x is calculated.
なお、実施形態1は、「所定の事後確率算出条件」として、「ベイズの定理」を適用した例である。 The first embodiment is an example in which “Bayes's theorem” is applied as the “predetermined posterior probability calculation condition”.
まず、実施形態1の集計システムの構成について説明する。 First, the configuration of the aggregation system according to the first embodiment will be described.
図1に示すように、本集計システムは、集計処理装置1(以下、「集計装置1」という)と、情報提供者端末2−0〜2−(N−1)(以下、「端末2−0〜2−(N−1)」という)とを具備する。
As shown in FIG. 1, the totalization system includes a totalization processing apparatus 1 (hereinafter referred to as “
なお、以下では、端末2−0〜2−(N−1)の台数が「N」である場合を例に挙げて説明するが、端末2−0〜2−(N−1)の台数は1以上の自然数であればよい。 In the following, a case where the number of terminals 2-0 to 2- (N-1) is “N” will be described as an example, but the number of terminals 2-0 to 2- (N-1) is Any natural number greater than or equal to 1 is acceptable.
集計装置1は、n個の属性αaそれぞれ(例えば、「年代」、「性別」など)に対する以下の式1に示す要素Apqをp行q列の要素として有する遷移確率行列Aを構成するために、集計対象となるデータが属する属性αaそれぞれに対してあらかじめ定められた維持確率ρaと、当該属性αaとを、端末2−0〜2−(N−1)それぞれへ送信する。
なお、「維持確率ρa」とは、端末2−0〜2−(N−1)それぞれが属性αaを撹乱(つまり、確率的な変化)した後においても、属性αaが元の値を維持する確率のことを指す。 The “maintenance probability ρ a ” means that the attribute α a is the original value even after each of the terminals 2-0 to 2-(N−1) disturbs the attribute α a (that is, probabilistic change). Indicates the probability of maintaining
ここで、遷移確率行列Aの行の数pおよび列の数qは、以下の式2に示す値である。
Here, the number of rows p and the number of columns q of the transition probability matrix A are values shown in
また、式1に示したdp aおよびdq aそれぞれは、以下の式3および式4でそれぞれ定義される。
Further, each d p a and d q a as shown in
ここで、式3および式4にて示した「÷」は、整数の除算を示す演算記号である。また、式3および式4にて示した「%」は、剰余算を示す演算記号である。
Here, “÷” shown in
また、集計装置1は、レコード全体に対する遷移確率行列Aに含まれる式1に示したp行q列の要素Apqを算出する。
Further, the
ここで、各属性αaに対する「遷移確率行列Aa」とは、属性αa同士の間での変化の確率を行列形式で表現したものである。 Here, the “transition probability matrix A a ” for each attribute α a represents the probability of change between the attributes α a in a matrix format.
また、集計装置1は、端末2−0〜2−(N−1)それぞれから送信されてきた送信データT´(0)a〜T´(N−1)aを集計したクロス集計である「撹乱後のクロス集計y」を算出する。
The
ここで、送信データT´(0)a〜T´(N−1)aとは、端末2−0〜2−(N−1)が、維持確率ρaと属性αaと乱数とに基づいて決定した送信データT´(0)a〜T´(N−1)aのことを指す。 Here, the transmission data T ′ (0) a to T ′ (N−1) a means that the terminals 2-0 to 2- (N−1) are based on the maintenance probability ρ a , the attribute α a, and a random number. Transmission data T ′ (0) a to T ′ (N−1) a determined in this way.
そして、集計装置1は、算出した撹乱後のクロス集計yに基づいて、「真のクロス集計x」の推定値である推定クロス集計を算出する。
Then, the
端末2−0〜2−(N−1)それぞれは、端末2−0〜2−(N−1)それぞれに対応するレコードT(0)〜T(N−1)を記憶している。例えば、端末2−0は、レコードT(0)を記憶している。 Each of the terminals 2-0 to 2- (N-1) stores records T (0) to T (N-1) corresponding to the terminals 2-0 to 2- (N-1), respectively. For example, the terminal 2-0 stores the record T (0).
ここで、レコードT(0)〜T(N−1)それぞれは、各属性αaのデータT(0)a〜T(N−1)aを含んでいる。例えば、レコードT(0)であれば、属性αaのデータT(0)aを含んでいる。 Here, the record T (0) ~T (N- 1) each includes a respective data T (0) of the attribute α a a ~T (N-1 ) a. For example, if the record T (0), the data T (0) of the attribute alpha a contains a.
なお、ここでいう「データT(0)a〜T(N−1)a」とは、例えば、属性αaが「性別」である場合、該属性αaが取り得る値Vα0 〜 VαMa-1(「男性」および「女性」)のうちのいずれか1つの値(例えば、女性)である。 Herein, the term "data T (0) a ~T (N -1) a " is, for example, attribute alpha when a is "sex", the attribute alpha a possible value Vα 0 ~ Vα Ma −1 (“male” and “female”).
つまり、端末2−0〜2−(N−1)それぞれは、レコードT(0)〜T(N−1)それぞれを記憶することにより、データT(0)a〜T(N−1)aそれぞれを記憶している。 That is, each of the terminals 2-0 to 2- (N-1) stores data T (0) a to T (N-1) a by storing the records T (0) to T (N-1). I remember each one.
なお、属性αaの数は「n」個であり、集計装置1および端末2−0〜2−(N−1)それぞれは、当該属性αaの数nを記憶している。
Note that the number of the attribute α a is “n”, and the totaling
なお、各属性αaは、aの値が属性αaの数n未満である場合(a<n)、「Ma」個の値(Vα0 〜 VαMa-1)を取り得る。そして、集計装置1および端末2−0〜2−(N−1)それぞれは、各属性αaが取り得る値の数Maと、各属性αaが取り得る値Vα0 〜 VαMa-1を記憶している。
Each attribute α a can take “M a ” values (Vα 0 to Vα Ma-1 ) when the value of a is less than the number n of the attributes α a (a <n). The
端末2−0〜2−(N−1)は、集計装置1から送信されてきた維持確率ρaおよび属性αaを用いて、当該端末2−0〜2−(N−1)がそれぞれ記憶している該端末2−0〜2−(N−1)にて入力を受付けたデータT(0)a〜T(N−1)aを確率的に変化(「撹乱」)させる。
The terminals 2-0 to 2- (N-1) store the respective terminals 2-0 to 2- (N-1) using the maintenance probability ρ a and the attribute α a transmitted from the
ここで、データT(0)a〜T(N−1)aを確率的に変化させること(撹乱)とは、集計装置1から送信されてきた維持確率ρaと属性αaと、該送信の際に生成した乱数とに基づいて、記憶しているデータのうちから集計装置1へ送信する送信データT´(0)aを決定することを指す。
Here, changing the data T (0) a to T (N−1) a stochastically (disturbance) means that the maintenance probability ρ a and the attribute α a transmitted from the
そして、端末2−0〜2−(N−1)それぞれは、確率的に変化させたデータ(つまり、維持確率ρaと属性αaと乱数とに基づいて集計装置1への送信を決定した送信データ)を、集計装置1へ送信する。
Then, each of the terminals 2-0 to 2- (N-1) has determined transmission to the
つぎに、集計装置1が有する構成について詳細に説明する。
Next, the configuration of the
図2に示すように、集計装置1は、通信部11と、要素算出部12と、集計部13と、推定部14と、記憶部15とを有する。
As illustrated in FIG. 2, the
通信部11は、例えば、通信モジュールで構成され、端末2−0〜2−(N−1)それぞれと任意のデータを送受信する。
The
また、通信部11は、n個の各属性αaに対する遷移確率行列Aを構成するために、属性αaそれぞれに対してあらかじめ定められた維持確率ρaと当該属性αaとを、端末2−0〜2−(N−1)それぞれへ送信する「情報送信部」である。
Further, the
また、通信部11は、端末2−0〜2−(N−1)それぞれから送信されてきた、該端末2−0〜2−(N−1)それぞれが確率的に変化させた送信データT´(0)a〜T´(N−1)aそれぞれを受信する。
Further, the
要素算出部12は、n個の各属性αaのデータを有するレコード全体に対する遷移確率行列Aに含まれる式1に示したp行q列の要素Apqそれぞれを算出する。各要素Apqの算出により、要素算出部12は、遷移確率行列Aを生成する。
The
この説明例では、要素算出部12は、p行q列の要素Apqが後述する式5で表されるような正方行列の遷移確率行列Aを生成する。
In this explanatory example, the
集計部13は、情報提供者端末2−0〜2−(N−1)それぞれから送信されてきた、維持確率ρaと属性αaと乱数とに基づいて決定された送信データT´(0)a〜T´(N−1)aそれぞれを集計することにより、撹乱後のクロス集計yを算出する。
The
推定部14は、集計部13が算出した撹乱後のクロス集計yに基づいて、真のクロス集計xの推定値である「推定クロス集計xi+1」を算出する。なお、推定部14は、算出した推定クロス集計xi+1を、例えば、集計装置1と接続されている外部の表示装置(図示せず)などへ出力する。
Based on the post-disturbance cross tabulation y calculated by the
なお、実施形態1においては、推定部14は、要素算出部12が算出した遷移確率行列Aと、集計部13が算出した撹乱後のクロス集計y(変化後のクロス集計)に基づいて、「推定クロス集計xi+1」を算出する。
Note that in the first embodiment, the
また、当該推定クロス集計xi+1を算出する際、推定部14は、集計部13が算出した撹乱後のクロス集計y(変化後のクロス集計)が得られた場合の事後確率を求めるための所定の事後確率算出条件として、「ベイズの定理」を適用する。
Further, when calculating the estimated cross tabulation x i + 1 , the
記憶部15は、任意のデータを記憶する。
The
例えば、記憶部15は、対応情報ASを記憶している。
For example, the
図3に示すように、対応情報ASは、データが属する属性αaと、当該属性αaに対してあらかじめ定められた維持確率ρaとを対応付ける情報である。 As shown in FIG. 3, the correspondence information AS is information for associating the attribute α a to which the data belongs with a predetermined maintenance probability ρ a for the attribute α a .
また、記憶部15は、データが属する属性αaの数「n」を記憶している。
In addition, the
また、記憶部15は、属性αaそれぞれが取り得る値の数Maと、各属性αaが取り得る値Vα0 〜 VαMa-1を記憶している。図11に示した例においては、属性αaが「性別」である場合、その取り得る値は「男性」と「女性」とのいずれかである。
The
つぎに、端末2−0〜2−(N−1)が有する構成について説明する。なお、端末2−0〜2−(N−1)とは互いに同じ構成を有するため、以下では、端末2−0の構成を例に挙げて説明する。 Next, the configuration of the terminals 2-0 to 2- (N-1) will be described. Since terminals 2-0 to 2- (N-1) have the same configuration, the configuration of terminal 2-0 will be described below as an example.
図4に示すように、端末2−0は、通信部21−0と、確率変更部22−0と、送信データ決定部23−0と、記憶部24−0とを有する。 As illustrated in FIG. 4, the terminal 2-0 includes a communication unit 21-0, a probability change unit 22-0, a transmission data determination unit 23-0, and a storage unit 24-0.
通信部21−0は、例えば、通信モジュールで構成され、集計装置1と任意のデータを送受信する。
The communication unit 21-0 includes, for example, a communication module, and transmits / receives arbitrary data to / from the
通信部21−0は、集計装置1から送信されてきた、n個の属性αaそれぞれに対してあらかじめ定められた維持確率ρaと属性αaとを受信する。
The communication unit 21-0 receives the maintenance probability ρ a and the attribute α a that are determined in advance for each of the n attributes α a transmitted from the
また、通信部21−0は、送信データ決定部23−0が決定した送信データT´(0)aを集計装置1へ送信する「データ送信部」である。
The communication unit 21-0 is a “data transmission unit” that transmits the transmission data T ′ (0) a determined by the transmission data determination unit 23-0 to the
なお、端末2−1〜2−(N−1)それぞれは、送信データT´(1)a〜T´(N−1)aそれぞれを集計装置1へ送信する。
Each of the terminals 2-1 to 2- (N-1) transmits the transmission data T '(1) a to T' (N-1) a to the
確率変更部22−0は、集計装置1から送信されてきた維持確率ρaと属性αaとを用いて、記憶部24−0が記憶しているデータT(0)aを確率的に変化させる。
Probability changing unit 22-0, by using the and attributes alpha a a probability maintain that sent ρ from the
より具体的には、確率変更部22−0は、集計装置1から維持確率ρaと属性αaとが送信されてきた際、n個の属性αaそれぞれに対して、実数の値を有する「一様乱数ra(0≦ra≦1)」と、整数の値を有する「一様乱数za(0≦za≦Ma−1)」とを生成する。
More specifically, when the maintenance probability ρ a and the attribute α a are transmitted from the
続いて、確率変更部22−0は、属性αaごとにあらかじめ定められた維持確率ρaと、該属性αaに対して生成した一様乱数raとを比較する。 Then, the probability changing unit 22-0 compares the maintaining probability [rho a predetermined for each attribute alpha a, and a uniform random number r a raised against the attribute alpha a.
送信データ決定部23−0は、確率変更部22−0による比較の結果、一様乱数raの値が維持確率ρa以下である場合(ra≦ ρa)、該端末2−0の属性αaの正しいデータそのものであるデータT(0)aを、送信データT´(0)aとして決定する。 Transmission data determination unit 23-0, the comparison by the probability changing unit 22-0 result, if the value of the uniform random number r a is less maintenance probability ρ a (r a ≦ ρ a ), of the terminal 2-0 data T (0) a is the correct data itself attributes alpha a, determined as the transmission data T'(0) a.
また、送信データ決定部23−0は、確率変更部22−0による比較の結果、一様乱数raの値が維持確率ρaよりも大きい場合(ra> ρa)、記憶部24−0が記憶しているデータ決定情報DTに基づいて、属性αaが取り得る値Vα0 〜 VαMa-1のうちから確率変更部22−0が生成した整数値を有する一様乱数zaと同じ値を有する順番NBが付与された値(つまり、za番目に存在する値)を、該端末2−0の属性αaの送信データT´(0)aとして決定する。 The transmission data determination unit 23-0, the result of the comparison by the probability changing unit 22-0, when the value of the uniform random number r a is larger than the sustain probability ρ a (r a> ρ a ), the storage unit 24 Based on the data determination information DT stored in 0, the uniform random number z a having an integer value generated by the probability changing unit 22-0 from the values Vα 0 to Vα Ma-1 that the attribute α a can take A value to which the order NB having the same value is assigned (that is, a value existing in the z a th) is determined as transmission data T ′ (0) a of the attribute α a of the terminal 2-0.
例えば、図11に示した集計結果において、図5に示すように属性αaを「性別」として、該属性αaに属する要素のうちの「男性」に「0」番の順番NBを付与しておき、該属性αaに属する要素のうちの「女性」に「1」番の順番NBを付与しておく。この場合、確率変更部22−0が生成した一様乱数zaが「1」である際、送信データ決定部23−0は、該一様乱数zaと同じ値(1)の順番NBが付与された「女性」を送信データT´(0)aとして決定する。 For example, the counting result shown in FIG. 11, the attribute alpha a, as shown in FIG. 5 as "sex", to grant the order NB number "0" to "male" of the elements belonging to the attribute alpha a in advance, keep giving the "1" number of order NB to the "female" of the elements belonging to the attribute α a. In this case, when the uniform random number z a generated by the probability changing unit 22-0 is “1”, the transmission data determining unit 23-0 has an order NB of the same value (1) as the uniform random number z a. The given “female” is determined as transmission data T ′ (0) a .
さらに、送信データ決定部23−0は、集計装置1から送信されてきた維持確率ρaの値が「0」である場合、記憶部24−0が記憶しているデータ決定情報DTに基づいて、属性αaが取り得る値Vα0 〜 VαMa-1のうちから確率変更部22−0が生成した整数値を有する一様乱数zaと同じ値を有する順番NBが付与された値(つまり、za番目に存在する値)を、該端末2−0の属性αaの送信データT´(0)aとして決定する。
Furthermore, when the value of the maintenance probability ρ a transmitted from the
記憶部24−0は、任意のデータを記憶する。 The storage unit 24-0 stores arbitrary data.
例えば、記憶部24−0は、レコードT(0)と、属性データT(0)aとを記憶している。なお、当該レコードT(0)は、属性データT(0)aを含んでいる。 For example, the storage unit 24-0 stores a record T (0) and attribute data T (0) a . The record T (0) includes attribute data T (0) a .
また、記憶部24−0は、属性αaの数nを記憶している。 The storage unit 24-0 stores the number n of attributes alpha a.
さらに、記憶部24−0は、データ決定情報DTを記憶している。 Further, the storage unit 24-0 stores data determination information DT.
図6に示すように、データ決定情報DTは、n個の属性αaと、当該属性αaが取り得るMa個の値Vα0 〜 VαMa-1と、当該値Vα0 〜 VαMa-1それぞれに対して付与された順番NBとを対応付けて記憶している。なお、属性αaが取り得る値Vα0 〜 VαMa-1それぞれに順番NBを付与する順序は任意でよい。 As shown in FIG. 6, data determining information DT includes n attributes alpha a, and M a number of values Vα 0 ~ Vα Ma-1 to the attribute alpha a can assume, the value Vα 0 ~ Vα Ma- 1 is stored in association with the order NB assigned to each. Note that the order in which the order NB is assigned to each of the values Vα 0 to Vα Ma−1 that the attribute α a can take may be arbitrary.
つぎに、上述した構成を有する集計システムにおいて、集計装置1が端末2−0〜2−(N−1)から送信されてきた送信データT´(0)a〜T´(N−1)aそれぞれの撹乱後のクロス集計yを算出した場合、上述した一般的な技術よりも高速かつメモリ効率が高いことを、図7に示すフローチャートを参照して説明する。
Next, in the tabulation system having the above-described configuration, the
なお、端末2−0〜2−(N−1)とは互いに同じ動作を行うため、以下では、端末2−0の動作を例に挙げて説明する。 Since the terminals 2-0 to 2- (N-1) perform the same operation, the operation of the terminal 2-0 will be described below as an example.
図7に示すように、集計装置1は、それぞれの属性αaごとにあらかじめ定められた維持確率ρa(0≦ρa≦1)と属性αaとを、端末2−0〜2−(N−1)それぞれへ送信する(ステップS11)。
As shown in FIG. 7, the
集計装置1から送信されてきた維持確率ρaと属性αaとを受信した際、端末2−0の確率変更部22−0は、各属性αaに対して、実数の値を有する一様乱数ra(0≦ra≦1)と、整数の値を有する一様乱数za(0≦za≦Ma−1)とを生成する(ステップS12)。
When the maintenance probability ρ a and the attribute α a transmitted from the
続いて、確率変更部22−0は、集計装置1から送信されてきた属性αaごとにあらかじめ定められた維持確率ρaと、該属性αaそれぞれに対して生成した実数値を有する一様乱数raとを比較する(ステップS13)。
Then, the probability changing unit 22-0, and maintain the probability [rho a predetermined for each attribute alpha a, which has been transmitted from the
そして、端末2−0の送信データ決定部23−0は、当該比較の結果に応じて、集計装置1へ送信する送信データT´(0)aを決定する(ステップS14)。すると、通信部21−0は、送信データ決定部23−0が決定した送信データT´(0)aを集計装置1へ送信する。
Then, the transmission data determination unit 23-0 of the terminal 2-0 determines transmission data T ′ (0) a to be transmitted to the
なお、確率変更部22−0による比較の結果、一様乱数raの値が維持確率ρa以下である場合(ra≦ ρa)、送信データ決定部23−0は、ステップS14において、該端末2−0の属性αaの正しいデータそのものであるデータT(0)aを、送信データT´(0)aとして決定する。 As a result of comparison by the probability changing unit 22-0, when the value of the uniform random number r a is less maintenance probability ρ a (r a ≦ ρ a ), the transmission data determination unit 23-0 in step S14, data T (0) a is the correct data itself attributes alpha a of the terminal 2-0, is determined as transmission data T'(0) a.
また、確率変更部22−0による比較の結果、一様乱数raの値が維持確率ρaよりも大きい場合(ra> ρa)、送信データ決定部23−0は、ステップS14において、記憶部24−0が記憶しているデータ決定情報DTに基づいて、属性αaが取り得る値Vα0 〜 VαMa-1のうちからステップS12にて生成した一様乱数zaと同じ値を有する順番NBが付与された値(つまり、za番目に存在する値)を、該端末2−0の属性αaの送信データT´(0)aとして決定する。 As a result of comparison by the probability changing unit 22-0, when the value of the uniform random number r a is larger than the sustain probability ρ a (r a> ρ a ), the transmission data determination unit 23-0 in step S14, Based on the data determination information DT stored in the storage unit 24-0, the same value as the uniform random number z a generated in step S12 is selected from the values Vα 0 to Vα Ma-1 that the attribute α a can take. The value to which the order NB is given (that is, the value that exists in the z a th) is determined as the transmission data T ′ (0) a of the attribute α a of the terminal 2-0.
また、ステップS14において、送信データ決定部23−0は、集計装置1から送信されてきた維持確率ρaが「0」である場合にも、記憶部24−0が記憶しているデータ決定情報DTに基づいて、属性αaが有する値Vα0 〜 VαMa-1のうちでza番の順番が付与された値を、該端末2−0の属性αaの送信データT´(0)aとして決定する。
In step S14, the transmission data determination unit 23-0 also stores the data determination information stored in the storage unit 24-0 even when the maintenance probability ρ a transmitted from the
図6に示した例では、属性αaが性別である場合、該属性αaのうちの「男性」に0番の順番NBが付与されていて、該属性αaのうちの要素「女性」に1番の順番NBが付与されている。この場合、一様乱数zaの値が1であれば、送信データ決定部23−0は、当該一様乱数zaと同じ値の順番NB(1番)が付与された値(女性)を送信データT´(0)aとして決定する。 In the example shown in FIG. 6, if the attribute α a is gender, the order NB of No. 0 to "male" is has been granted one of the attribute α a, element of the attribute α a "female" Is assigned the first order NB. In this case, if the value of the uniform random number z a is 1, the transmission data determination unit 23-0 sets the value (female) to which the order NB (No. 1) of the same value as the uniform random number z a is assigned. transmitting data T'(0) is determined as a.
なお、維持確率ρaが小さくなるに伴って、送信データT´(0)aは一様にランダムな値に近づいていく。この場合、集計装置1が、端末2−0から送信されてきた送信データT´(0)aを用いて、該端末2−0が記憶している真のデータT(0)aを推定することは困難となる。
As the maintenance probability ρ a becomes smaller, the transmission data T ′ (0) a approaches a random value uniformly. In this case, the
なお、属性αaのk番目の値Vk aから当該属性αaのl番目の値Vl aへと変化する確率は、遷移確率行列Akl aとして表すことが可能である。この場合、各属性αaに対する遷移確率行列Aaは、各要素Aa klが以下の式5で表されるような行列であり、各属性に対する維持確率ρaと、各属性αaが取り得る値の数「Ma」とから算出できる。なお、式5におけるδklは、「クロネッカーのデルタ」である。
Incidentally, the probability of changing from k-th value V k a attribute alpha a to l-th value V l a of the attribute alpha a may be represented as a transition probability matrix A kl a. In this case, the transition probability matrix A a for each attribute α a is a matrix in which each element A a kl is expressed by the following
そのため、維持確率ρaが小さくなるに伴って、式1に示した遷移確率行列Aaの要素Apq(値が変化する確率)は、一様乱数における遷移確率の値「1/Ma」に単調に近づいていく。
Therefore, as the maintenance probability ρ a becomes smaller, the element A pq (the probability that the value changes) of the transition probability matrix A a shown in
さらに、維持確率ρa=0である場合、遷移確率行列Aaが有する要素Apqは、一様乱数における遷移確率の値そのものである。 Further, when the maintenance probability ρ a = 0, the element A pq included in the transition probability matrix A a is the transition probability value itself in a uniform random number.
例えば、属性αaが性別である場合、当該属性αaが取り得る値の数Maは「2」(男性と女性との2つ)であるから、当該属性αaの遷移確率は「1/2」である。 For example, if the attribute alpha a is gender, because the number M a of the attribute alpha a possible value is "2" (two males and females), the transition probabilities of the attribute alpha a, "1 / 2 ".
また、維持確率ρa=1である場合、遷移確率行列Aaが有する要素Apqは、真のデータT(0)a〜T(N−1)aそのものとなる。 When the maintenance probability ρ a = 1, the element A pq included in the transition probability matrix A a is the true data T (0) a to T (N−1) a itself.
端末2−0〜2−(N−1)それぞれから送信データT´(0)a〜送信データT´(N−1)aが送信されてきた場合、集計装置1の集計部13は、「撹乱後のクロス集計y」を算出するために、まず、以下の式6で表される次数の横ベクトルである「撹乱後のクロス集計y」を、遷移確率行列Aaが有する全要素Apqに対して「0」を設定することにより、全要素Apqを初期化する(ステップS15)。
If the terminal 2-0~2- (N-1) sent from each data T'(0) a ~ transmission data T'(N-1) a has been transmitted, totaling
続いて、集計部13は、端末2−0〜2−(N−1)それぞれから送信されてきた送信データT´(0)a〜T´(N−1)aについて、撹乱後のクロス集計yにおける以下の式7に示す順番が付与された要素に、1を加算していく(ステップS16)。なお、式7におけるIaは、送信データT´(0)a〜T´(N−1)aに付与されている順番NBを返すための関数である。
Subsequently, the totaling
該加算により、集計部13は、撹乱後のクロス集計yを算出する。
By the addition, the totaling
すると、要素算出部12は、レコード全体に対する遷移確率行列Aの生成手法に従って、以下の式8で表されるようなp行q列の要素Apqそれぞれを有する、式6に示した次数の正方行列である、レコード全体に対する遷移確率行列Aを生成する(ステップS17)。なお、集計装置1が生成した遷移確率行列Aの行の数pおよび列の数qは、式2に示した値である。
Then, in accordance with the method for generating the transition probability matrix A for the entire record, the
非特許文献2に開示された一般的な技術においては、遷移確率行列の次数は、以下の式9で表される。
In the general technique disclosed in
なお、式9に示した[log2Ma]は、log 2 Ma 以上の最小の整数を表す。 [Log 2 Ma] shown in Equation 9 represents a minimum integer equal to or greater than log 2 Ma.
一方、本発明の集計装置1においては、遷移確率行列Aの次数は式6に示した次数である。
On the other hand, in the
このように、本発明の集計装置1が撹乱後のクロス集計yの算出に用いる式6に示した次数と、一般的な技術にてクロス集計結果の算出に用いる式9に示した次数との間の差異により、集計装置1では、レコード全体に対する遷移確率行列Aに費やすメモリ使用量を、例えば、非特許文献2に開示されたような一般的な技術に比べて小さく抑えることができる。
As described above, the order shown in Expression 6 used by the
その後、推定部14は、要素算出部12が算出した「遷移確率行列A」と集計部13が算出した「撹乱後のクロス集計y」とを用いて推定クロス集計xi+1を算出し、該推定クロス集計xi+1を出力する(ステップS18)。なお、推定クロス集計xi+1とは、真のクロス集計xの推定値のことを指す。
Thereafter, the
ステップS18において、推定部14は、はじめ、i=0、x0=yを初期値として、式6に示した次数を有する横ベクトルとして表される(i+1)番目の「推定クロス集計xi+1」を、xi+1=xi・((y/(xiA))At)として算出していく。
In step S18, the
ここで、「・」は、ベクトルの内積を示す演算記号である。また、「/」は、ベクトルの成分ごとの除算を示す演算記号である。また、Atは、行列Aの転置行列を表す。 Here, “·” is an operation symbol indicating an inner product of vectors. “/” Is an operation symbol indicating division for each vector component. Also, A t represents a transposed matrix of the matrix A.
そして、推定部14は、ステップS18における推定クロス集計xi+1の算出を実行していて|xi+1−xi|L1 ≦εN となった場合、iに対する推定クロス集計xi+1を、真のクロス集計xの推定値として出力する。
Then, when the
ここで、|xi+1−xi|L1は、(xi+1−xi)のL1ノルムであり、行列の成分ごとの差の絶対値の総和を示す演算記号である。また、εはあらかじめ設定された実数である。 Here, | x i + 1 −x i | L1 is an L1 norm of (x i + 1 −x i ) and is an operation symbol indicating the sum of absolute values of differences for each component of the matrix. Ε is a preset real number.
なお、ステップS18に示した処理は、ある結果(例えば、撹乱後のクロス集計y)が得られた際に、当該結果を反映した下での事後確率を求めるための「ベイズの定理」に基づいている。 Note that the processing shown in step S18 is based on the “Bayesian theorem” for obtaining a posterior probability that reflects the result when a certain result (for example, cross tabulation y after disturbance) is obtained. ing.
ベイズの定理を用いた場合、あるレコードの撹乱後のクロス値Qがqであること(この例では、撹乱後のクロス集計y)が既知である場合に、該レコードの真のクロス値Pがpである事後確率Pr(P=p|Q=q)は、式6に示した値をMとして、真のクロス集計をxとした場合、以下の式10で表される。
When Bayes' theorem is used, if it is known that the cross value Q after disturbance of a record is q (in this example, the cross tabulation y after disturbance), the true cross value P of the record is The posterior probability Pr (P = p | Q = q), which is p, is expressed by the following
さらに、クロス値Qがqである事後確率Pr(Q=q)については、以下の式11が成立する。
Further, for the posterior probability Pr (Q = q) where the cross value Q is q, the following
そのため、式11に示した関係を用いると、真のクロス値Pがpである事後確率Pr(P=p)は、以下の式12で表すことができる。
Therefore, using the relationship shown in
ここで、式10に示した関係式と、式12に示した関係式とを用いると、真のクロス集計xpは、以下の式13で表すことができる。
Here, when the relational expression shown in
以上より、x=x・((y/(xA))At)という方程式を得ることができる。 From the above, the equation x = x · ((y / (xA)) A t ) can be obtained.
ステップS18において(i+1)番目の「推定クロス集計xi+1」を算出する際、集計装置1は、上述した方程式x=x・((y/(xA))At)を用いている。
When calculating the (i + 1) -th “estimated cross tabulation x i + 1 ” in step S18, the
なお、推定部14は、ステップS18においてレコード全体に対する遷移確率行列Aについての乗算を実行する。しかしながら、当該乗算を行うときの計算量は、該遷移確率行列Aが有する次数の2乗に比例して増大し、本発明の集計装置1が実行する演算のなかで最も多くの計算量を伴う演算である。しかしながら、当該集計装置1の要素算出部12は、レコード全体に対する遷移確率行列Aを算出し、例えば、非特許文献2に開示されたような一般的な技術よりも、属性αaが取り得る値の数Maに対して遷移確率行列Aが有する次数が非常に小さなものとなる。
In addition, the
そのため、集計装置1においては、真のクロス集計xの推定値である推定クロス集計xi+1の算出に要する時間が一般的な技術よりも非常に短くできるとともに、該推定クロス集計xi+1を算出するときに集計装置1が使用するメモリ使用量についても小さなものとできる。
(実施形態2)
つぎに、実施形態2の集計装置1について説明する。
Therefore, in the totaling
(Embodiment 2)
Next, the
実施形態2の集計装置1の構成および端末2−0〜2−(N−1)の構成それぞれは、実施形態1における集計装置1の構成および端末2−0〜2−(N−1)の構成と同じである。
The configuration of the
ただし、実施形態2の集計装置1は、個別に指定したクロス値に対する推定クロス集計を算出する点で、実施形態1の集計装置1と異なっている。なお、以下では、複数の属性に対する値を1つの値とみなした値であるクロス値として、ベクトルvを指定する場合を例に挙げて説明する。
However, the
以下に、上述した集計システムにおいて、実施形態2の集計装置1が推定クロス集計xi+1を算出する動作を、図8に示すフローチャートを参照して説明する。
In the following, the operation in which the
図8に示すように、まず、集計装置1は、複数の属性に対する値を1つの値とみなしたクロス値として、ベクトルvを指定する入力を、入力部(図示せず)により利用者から受付ける(ステップS21)。
As illustrated in FIG. 8, first, the
なお、当該ベクトルvに含まれている各成分vaは、推定クロス集計xi+1の算出を行う際の属性αaそれぞれに対する値(例えば、図4に示した「10代」と「男性」)の指定である。 Each component contained in the vector v v a is estimated crosstab x i + 1 Attribute alpha a value for each time of performing the calculation of (e.g., shown in FIG. 4 as "teens", "male )).
すると、集計装置1は、属性αaごと(例えば、「年代」や「性別」)にあらかじめ定められた維持確率ρa(0≦(a≦1)と属性αaとを、端末2−0〜2−(N−1)それぞれへ送信する(ステップS22)。
Then, the
集計装置1から維持確率ρaと属性αaとが送信されてきた場合、端末2−0の確率変更部22−0は、属性αaそれぞれに対して、実数の値を有する一様乱数ra(0≦ra≦1)と、整数の値を有する一様乱数za(0≦za≦Ma−1)とを生成する(ステップS23)。
When the maintenance probability ρ a and the attribute α a are transmitted from the
続いて、確率変更部22−0は、属性αaごと(例えば、「年代」や「性別」)に、集計装置1から送信されてきた維持確率ρaと、該属性αaに対して生成した実数値を有する一様乱数raとを比較する(ステップS24)。
Subsequently, the probability changing unit 22-0 generates, for each attribute α a (for example, “age” and “gender”), the maintenance probability ρ a transmitted from the
そして、送信データ決定部23−0は、確率変更部22−0による比較の結果に応じて、集計装置1へ送信する送信データT´(0)aを決定する(ステップS25)。
Then, the transmission data determination unit 23-0 determines transmission data T ′ (0) a to be transmitted to the
ステップS25において、送信データ決定部23−0は、比較の結果、一様乱数raの値が維持確率ρa以下である場合(ra≦ ρa)、当該端末2−0の属性αaの正しいデータそのものであるデータT(0)aを、送信データT´(0)aとして決定する。 In step S25, when the value of the uniform random number ra is equal to or less than the maintenance probability ρ a (r a ≦ ρ a ), the transmission data determination unit 23-0 determines the attribute α a of the terminal 2-0 as a result of the comparison. correct data itself a data T (0) a is a is determined as the transmission data T'(0) a.
また、ステップS25において、送信データ決定部23−0は、比較の結果、一様乱数raの値が維持確率ρaよりも大きい場合(ra> ρa)、または、維持確率ρaが「0」である場合、記憶部24−0が記憶しているデータ決定情報DTに基づいて、属性αaが取り得る値Vα0 〜 VαMa-1のうちからステップS23にて生成した一様乱数zaと同じ値を有する順番NBが付与された値(つまり、za番目に存在する値)を、該端末2−0の属性αaの送信データT´(0)aとして集計装置1へ送信する。
Further, in step S25, the transmission data determination unit 23-0, the result of the comparison, when the value of the uniform random number r a is larger than the sustain probability ρ a (r a> ρ a ), or, maintaining probability [rho a is In the case of “0”, based on the data determination information DT stored in the storage unit 24-0, the uniform value generated in step S23 from the values Vα 0 to Vα Ma−1 that the attribute α a can take. The
このとき、維持確率ρaが小さくなるに伴って送信データT´(0)aは一様にランダムな値に近づく。そのため、集計装置1が、端末2−0から送信されてきた送信データT´(0)aを用いて、該端末2−0が記憶している真のデータT(0)aを推定することは困難となる。
At this time, the transmission data T ′ (0) a uniformly approaches a random value as the maintenance probability ρ a decreases. Therefore, totaling
その後、通信部21−0は、ステップS25にて送信データ決定部23−0が決定した送信データT´(0)aを集計装置1へ送信する。
Thereafter, the communication unit 21-0 transmits the transmission data T ′ (0) a determined by the transmission data determination unit 23-0 in Step S25 to the
なお、端末2−1〜2−(N−1)それぞれも、それぞれの比較の結果に応じた送信データT´(1)a〜T´(N−1)aそれぞれを集計装置1へ送信する。
Each of the terminals 2-1 to 2- (N-1) also transmits transmission data T '(1) a to T' (N-1) a corresponding to the result of the comparison to the
端末2−0〜2−(N−1)から送信データT´(0)a〜T´(N−1)aが送信されてきた場合、集計装置1の集計部13は、「撹乱後のクロス集計y」を算出するための処理を実行する。
When the transmission data T ′ (0) a to T ′ (N−1) a are transmitted from the terminals 2-0 to 2- (N−1), the
集計部13は、まず、式6に示した次数の横ベクトルである撹乱後のクロス集計yを、遷移確率行列Aaが有する全要素に対して0を設定することにより、全要素を初期化する(ステップS26)。
Totaling
続いて、集計部13は、端末2−0〜2−(N−1)それぞれに対して、撹乱後のクロス集計yにおける式3に示した順番の要素に、「1」を加算していく(ステップS27)。該加算により、集計部13は、撹乱後のクロス集計yを算出する。
Subsequently, the totaling
さらに、集計装置1の推定部14は、各属性αaに対する遷移確率行列Aaの逆行列(Aa)-1を算出する(ステップS28)。
Furthermore, the
逆行列(Aa)-1を算出した場合、さらに、推定部14は、各属性αaに対する値としてベクトルvに含まれている成分vaを有するレコードの数、つまり、クロス値として指定されたベクトルvに対する以下の式14に示すクロス集計を算出して出力する(ステップS29)。
Inverse when calculating the (A a) -1, further, the
真のクロス集計xが与えられた場合、撹乱後のクロス集計yの期待値のベクトルE(Y)は、E(Y)=xAで表すことができる。そのため、|A|≠0である場合、E(YA-1)=E(Y)A-1=xが成立する。すなわち、yA-1は真のクロス集計xの近似であることが期待できる。 When a true cross tabulation x is given, an expected value vector E (Y) of the cross tabulation y after the disturbance can be expressed by E (Y) = xA. Therefore, when | A | ≠ 0, E (YA −1 ) = E (Y) A −1 = x is established. That is, yA −1 can be expected to be an approximation of the true cross tabulation x.
ここで、クロネッカー積を用いると、式1に示した各要素を有するようなレコード全体に対する遷移確率行列Aは、以下の式15で表すことが可能である。
Here, when the Kronecker product is used, the transition probability matrix A for the entire record having each element shown in
式15に示した関係を用いると、クロネッカー積の性質から、遷移確率行列Aの逆行列A-1は、以下の式16で表すことができる。
Using the relationship shown in
このことから、遷移確率行列Aと同様に、逆行列A-1が有する各成分は、以下の式17で表すことができる。
From this, similarly to the transition probability matrix A, each component of the inverse matrix A −1 can be expressed by the following
そのため、真のクロス集計xは、x=yA-1という関係に基づいて推定することが可能である。 Therefore, the true cross tabulation x can be estimated based on the relationship x = yA −1 .
また、逆行列A-1のp列目の各成分によって構成される縦ベクトルを縦ベクトルAp -1とした場合、(Ap -1)q = Apq -1が成立する。 Further, when a vertical vector constituted by each component of the p-th column of the inverse matrix A −1 is a vertical vector A p −1 , (A p −1 ) q = A pq −1 is established.
そのため、真のクロス集計xpは、逆行列A-1のp列目以外の成分を用いることなく、当該逆行列A-1のp列目の各成分を用いて、以下の式18として直接算出することが可能である。 Therefore, the true cross-tabulation x p, without using a component other than p-th column of the inverse matrix A -1, using the components of the p-th column of the inverse matrix A -1, directly as the following equation 18 It is possible to calculate.
ここで、pとして、クロス値であるベクトルvに対応する以下の式19に示す数を代入する。 Here, as p, a number shown in the following Expression 19 corresponding to the vector v which is a cross value is substituted.
すると、Ia(va)=dp aの関係が導出できる。そのため、真のクロス集計xpは、式14に示した値により算出することができる。
Then, I a (v a) = relationship of d p a can be derived. Therefore, the true cross tabulation x p can be calculated by the value shown in
実施形態2において推定部14が真のクロス集計xの推定値を算出する場合、推定クロス集計の算出に要する所要時間、および、該クロス集計を算出する際に使用するメモリ使用量ともに、遷移確率行列Aの次数に対して線形となる。
In the second embodiment, when the
なお、最終的には、各属性αaに対する値vaをそれぞれ有するようなレコードの数は、(i+1)番目の推定クロス集計xi+1における式19に示した順番が付与された要素が表している。 In the end, the number of records each having a value va for each attribute α a is determined by the element to which the order shown in Expression 19 in the (i + 1) th estimated cross tabulation x i + 1 is given. Represents.
以上説明したように、実施形態1及び実施形態2においては、レコード全体に対する遷移確率行列Aの次数として、各属性αaが取り得る値の数Maの2進表現よりも値が小さな各属性αaが取り得る値の個数Maを用いて、推定クロス集計を算出する。これにより、個々のデータを秘匿しつつ推定クロス集計を算出する際に、集計装置1が使用するメモリ使用量を抑えることができる。
As described above, in the first and second embodiments, each attribute having a smaller value than the binary representation of the number of values Ma that each attribute α a can take as the order of the transition probability matrix A for the entire record. The estimated cross tabulation is calculated using the number M a of values that α a can take. Thereby, when calculating the estimated cross tabulation while keeping individual data secret, the memory usage used by the
さらに、メモリ使用量を抑えることにより、推定クロス集計の集計処理中に最も多くの計算量を伴うボトルネックとなる、レコード全体に対する遷移確率行列Aに対する演算もより短い時間で行うことが可能となる。
(実施形態3)
上述した実施形態1において、レコード全体に対する遷移確率行列Aが有する次数Mは、例えば非特許文献2に開示されたような一般的な技術と比べ、属性αaが取り得る値の個数Maに対して非常に小さなものとすることができる。
Furthermore, by suppressing the memory usage, it is possible to perform the calculation for the transition probability matrix A for the entire record, which becomes a bottleneck with the largest amount of calculation during the estimation cross tabulation processing, in a shorter time. .
(Embodiment 3)
In the first embodiment described above, the order M of the transition probability matrix A for the entire record is, for example, the number of values M a that the attribute α a can take compared to the general technique disclosed in
そのため、推定クロス集計の算出に要する時間を、一般的な技術よりも非常に短くすることができる。また、それとともに、推定クロス集計を算出するときに集計装置1が使用するメモリ使用量も小さなものとすることができる。なお、以降、レコード全体に対する遷移確率行列Aを単に、遷移確率行列Aという。
Therefore, the time required for calculating the estimated cross tabulation can be much shorter than that of a general technique. At the same time, the amount of memory used by the
ここで、上述した式2に示したように、遷移確率行列Aの行の数p及び列の数qはM個となる。そのため、遷移確率行列Aは、M次の正方行列である。一般的に、M次の正方行列をメモリ上に展開するときのメモリ使用量は、「正方行列の要素のサイズ×M2」となる。また、遷移確率行列Aが有する次数Mは、上述した式6に示したように、属性αaの取り得る値の個数Maを用いて表される。
Here, as shown in
従って、属性αaの取り得る値の個数Maが多くなると、遷移確率行列Aをメモリ上に展開したときのメモリ使用量は、飛躍的に増加してしまう。 Therefore, when the number of values M a that the attribute α a can take increases, the amount of memory used when the transition probability matrix A is expanded on the memory increases dramatically.
そこで、本実施形態では、遷移確率行列Aを生成することなく、推定クロス集計を算出する場合について説明する。 Therefore, in the present embodiment, a case where the estimated cross tabulation is calculated without generating the transition probability matrix A will be described.
なお、本実施形態における集計システムの構成は、上述した実施形態1における構成と同様なので、ここでは、構成の説明は省略する。
In addition, since the structure of the totalization system in this embodiment is the same as the structure in
以下に、本実施形態において推定クロス集計を算出する場合の動作を説明する。 Hereinafter, an operation when calculating the estimated cross tabulation in the present embodiment will be described.
まず、遷移確率行列Aは、クロネッカー積を用いると、上述した式15で表すことが可能である。
First, the transition probability matrix A can be expressed by
そして、クロネッカー積を用いて表された遷移確率行列Aを分割したBjを設定する。以下の式20にBjを示す。なお、式20においてJは分割数であり、m-1=0とする。 Then, B j obtained by dividing the transition probability matrix A expressed using the Kronecker product is set. B j is shown in Equation 20 below. In Equation 20, J is the number of divisions, and m −1 = 0.
そして、上記の式20に示すようなBjをメモリ上に展開したとき、各Bjのサイズの総和が、予め決められ、推定クロス集計の算出用に割り当て可能なメモリサイズに収まるようにする。各Bjをメモリ上に展開したときのサイズの総和を以下の式21に示す。 Then, when B j as shown in the above equation 20 is expanded on the memory, the total sum of the sizes of each B j is determined in advance so that it falls within the memory size that can be allocated for calculation of the estimated cross tabulation. . The sum of the sizes when each B j is expanded on the memory is shown in Equation 21 below.
ここで、具体的な分割の方法としては、aの値が属性αaの数n未満である場合に(a<n)、Ba=Aaとする方法がある。以降、この方法のことを分割方法1という。つまり、分割方法1では、属性αa毎に複数の遷移確率行列を生成することとなる。以降、属性αa毎の複数の遷移確率行列のそれぞれを属性別遷移確率行列という。
Here, as a specific division method, there is a method of setting B a = A a when the value of a is less than the number n of the attributes α a (a <n). Hereinafter, this method is referred to as
分割方法1において要素算出部12は、要素Apqを属性毎に算出する。そして、要素算出部12は、属性毎に算出された要素Apqから、複数の属性別遷移確率行列を生成する。
In the
そして、推定部14は、要素算出部12が算出した複数の属性別遷移確率行列と、集計部13が算出した撹乱後のクロス集計yとに基づき、上述した実施形態1におけるステップS18と同様の処理を実行する。これにより、推定クロス集計が算出される。
And the
また、上述した分割方法1以外にも例えば、属性別遷移確率行列をメモリ上に展開したときのサイズに基づき、少なくとも1つの属性別遷移確率行列を含む遷移確率行列である分割遷移確率行列を複数生成する方法がある。以降、この方法のことを分割方法2という。
In addition to the
以下に、本実施形態の分割方法2において分割遷移確率行列を生成する場合の動作について説明する。なお、以下の説明においては、予め決められ、推定クロス集計の算出用に割り当て可能なメモリサイズをLと表記し、行列Xをメモリ上に展開したときのサイズをsizeXと表記する。
Hereinafter, an operation in the case of generating a division transition probability matrix in the
図9は、実施形態3の集計システムにおいて、分割遷移確率行列を生成するときの動作シーケンスを示す図である。 FIG. 9 is a diagram illustrating an operation sequence when a divided transition probability matrix is generated in the aggregation system according to the third embodiment.
まず、要素算出部12は、遷移確率行列Aと同じクロネッカー積で表される行列Bを定義する。そして、aの値が属性αaの数n未満である場合に(a<n)、行列Bを構成する各Bjの初期値を以下の式22に示すように設定する(ステップS31)。つまり、この段階では、各Bjは、上述した属性別遷移確率行列となる。
First, the
次に、要素算出部12は、以下の式23に示すように各Bjのサイズの総和Siを計算する(ステップS32)。なお、式23においてiは、0から始まる反復のカウンタである。
Next, the
次に、要素算出部12は、以下の式24に示す範囲において、以下の式25に示すような、2つのBjをクロネッカー積に置き換えた場合のサイズの増加量を算出する(ステップS33)。以降、2つのBjをクロネッカー積に置き換えた場合のサイズの増加量のことを単に増加量という。なお、ここでは、式24に示す範囲のjについて、式25に示すような計算が行われるため、複数の増加量が算出される。また、算出された複数の増加量のそれぞれは、クロネッカー積のそれぞれと対応付けられる。
Next, the
次に、要素算出部12は、算出された複数の増加量のうち、最も値の小さな増加量である最小増加量が、LとSiとの差よりも大きいかどうかを判定する(ステップS34)。
Next,
ステップS34における判定の結果、最小増加量がLとSiとの差よりも大きな場合、要素算出部12は、行列Bを構成する各Bjのそれぞれを分割遷移確率行列とする。
As a result of the determination in step S34, when the minimum increase amount is larger than the difference between L and S i , the
そして、要素算出部12は、分割遷移確率行列のそれぞれに含まれる属性別遷移確率行列の要素Apqを算出することにより、複数の分割遷移確率行列を生成する(ステップS35)。そして、処理が終了する。
Then, the
一方、ステップS34における判定の結果、最小増加量がLとSiとの差以下である場合には、要素算出部12は、当該最小増加量に対応するクロネッカー積を算出する(ステップS36)。
On the other hand, the result of determination in step S34, the minimum increment if less difference between L and S i, the
そして、要素算出部12は、以下の式26に示す範囲において、最小増加量が算出されたjの値に応じ、以下の式27に示すように、行列Bを各Bj'で構成される行列として再定義する(ステップS37)。
Then, the
そして、ステップS32の動作へ遷移し、要素算出部12は、反復のカウンタiを1つインクリメントするとともにj'をjとして、ステップS37において再定義された行列Bを構成する各Bjのサイズの総和を計算する。
Then, the process proceeds to the operation of step S32, and the
上述したステップS32〜S37の動作は、最小増加量がLとSiとの差よりも大きくなるまで繰り返される。最小増加量がLとSiとの差よりも大きくなると、上述したステップS35で説明したように、複数の分割遷移確率行列が生成される。 The operations in steps S32 to S37 described above are repeated until the minimum increase amount becomes larger than the difference between L and S i . The minimum increment is greater than the difference between the L and S i, as described in step S35 described above, a plurality of divided transition probability matrix is generated.
そして、推定部14は、要素算出部12にて生成された複数の分割遷移確率行列と、集計部13が算出した撹乱後のクロス集計yとに基づき、上述した実施形態1におけるステップS18と同様の処理を実行する。これにより、推定クロス集計が算出される。
And the
このように本実施形態の分割方法1においては、属性毎に要素Apqが算出され、その属性毎に算出された要素Apqをそれぞれ有する複数の属性別遷移確率行列が生成される。そして、クロス集計と、複数の属性別遷移確率行列とに基づいて、推定クロス推計が算出される。
As described above, in the
そのため、推定クロス集計を算出するときに集計装置1が使用するメモリ使用量を上述した実施形態1よりもさらに小さなものとすることができる。
Therefore, the amount of memory used by the
例えば、属性数を5とし、各属性の取り得る値の個数を10とした場合、Mは10となる。この場合、要素Apqのサイズを8B(バイト)とすると、1つの属性別遷移確率行列をメモリ上に展開したときのサイズは、8B×102=800Bとなる。そして、属性数が5であるため、全ての属性別遷移確率行列をメモリ上に展開したときのサイズは、4KB(800B×5)と非常に少なく済む。 For example, if the number of attributes is 5, and the number of values that each attribute can take is 10, M is 10. In this case, assuming that the size of the element A pq is 8B (bytes), the size when one attribute-specific transition probability matrix is expanded on the memory is 8B × 10 2 = 800B. Since the number of attributes is 5, the size when all the attribute-specific transition probability matrices are expanded on the memory is as small as 4 KB (800 B × 5).
なお、本実施形態の分割方法1を用いた場合、複数の属性別遷移確率行列に基づいて推定クロス集計が算出される。そのため、上述した実施形態1のステップS18における乗算の回数が実施形態1よりも増加する。しかし、例えば高速なメモリ上に遷移確率行列Aを展開しきれず、低速なメモリへのメモリ転送が発生する場合等と比較すると、乗算の回数が数倍程度増えても、本実施形態で示したように遷移確率行列Aを分割した方が処理速度は速くなる。
When the
また、本実施形態の分割方法2においては、属性別遷移確率行列のそれぞれがメモリ上に展開されるときのサイズに基づき、それぞれが少なくとも1つの属性別遷移確率行列を含む複数の分割遷移確率行列が生成される。そして、クロス集計と、複数の分割遷移確率行列とに基づいて、推定クロス推計が算出される。
Further, in the
つまり、分割方法2における遷移確率行列Aの分割数は、分割方法1における遷移確率行列Aの分割数よりも少ない。そのため、上述した実施形態1のステップS18における乗算の回数の増加を分割方法1よりも少なくすることができ、処理速度をさらに速くすることができる。
That is, the number of divisions of the transition probability matrix A in the
なお、本発明においては、集計処理装置1内の処理は上述の専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムを集計処理装置1にて読取可能な記録媒体に記録し、この記録媒体に記録されたプログラムを集計処理装置1に読み込ませ、実行するものであってもよい。集計処理装置1にて読取可能な記録媒体とは、フロッピーディスク(登録商標)、光磁気ディスク、DVD、CDなどの移設可能な記録媒体の他、集計処理装置1に内蔵されたHDD等を指す。この記録媒体に記録されたプログラムは、例えば、集計処理装置1が有する要素算出部12、集計部13および推定部14にて読み込まれ、要素算出部12、集計部13および推定部14の制御によって、上述したものと同様の処理が行われる。
In the present invention, the processing in the
ここで、集計処理装置1が有する要素算出部12、集計部13および推定部14は、プログラムが記録された記録媒体から読み込まれたプログラムを実行するコンピュータとして動作するものである。
Here, the
なお、上述したプログラムは、情報提供者端末2−0〜2−(N−1)についても、同様に適用可能である。 The above-described program can be similarly applied to the information provider terminals 2-0 to 2- (N-1).
以上、実施形態1〜3を参照して本発明を説明したが、本発明は上記実施形態1〜3に限定されるものではない。本発明の構成や詳細には、本発明の要旨を逸脱しない範囲で当業者が理解し得る各種の変形が可能である。 As mentioned above, although this invention was demonstrated with reference to Embodiment 1-3, this invention is not limited to the said Embodiment 1-3. Various modifications that can be understood by those skilled in the art can be made to the configuration and details of the present invention without departing from the gist of the present invention.
1 集計処理装置
11 通信部
12 要素算出部
13 集計部
14 推定部
15 記憶部
2−0〜2−(N−1) 情報提供者端末
21−0 通信部
22−0 確率変更部
23−0 送信データ決定部
24−0 記憶部
DESCRIPTION OF
Claims (17)
前記集計処理装置は、
前記データが属する属性に対してあらかじめ定められた維持確率と、前記属性とを前記情報提供者端末へ送信する情報送信部と、
前記情報提供者端末から送信されてきた送信データを集計したクロス集計を生成する集計部と、
前記集計部が生成したクロス集計と、前記要素算出部が生成した遷移確率行列とに基づいて、真のクロス集計の推定値である推定クロス集計を算出する推定部とを有し、
前記情報提供者端末は、
前記データを記憶する記憶部と、
前記集計処理装置から維持確率と属性とが送信されてきた際、乱数を生成する確率変更部と、
前記集計処理装置から送信されてきた維持確率および属性と、前記確率変更部が生成した乱数とに基づいて、前記記憶しているデータのうちから該集計処理装置へ送信する前記送信データを決定する送信データ決定部と、
前記送信データ決定部が決定した送信データを前記集計処理装置へ送信するデータ送信部とを有することを特徴とする集計システム。 In an aggregation system comprising an information provider terminal that transmits transmission data determined from data that has been accepted, and an aggregation processing device that aggregates transmission data transmitted from the information provider terminal,
The aggregation processing device
An information transmission unit for transmitting a maintenance probability predetermined for the attribute to which the data belongs and the attribute to the information provider terminal;
A counting unit that generates a cross tabulation that tabulates transmission data transmitted from the information provider terminal;
Based on the cross tabulation generated by the tabulation unit and the transition probability matrix generated by the element calculation unit, an estimation unit that calculates an estimated cross tabulation that is an estimated value of a true cross tabulation,
The information provider terminal is
A storage unit for storing the data;
When a maintenance probability and an attribute are transmitted from the aggregation processing device, a probability changing unit that generates a random number,
Based on the maintenance probability and attribute transmitted from the aggregation processing device and the random number generated by the probability changing unit, the transmission data to be transmitted to the aggregation processing device is determined from the stored data. A transmission data determination unit;
And a data transmission unit that transmits the transmission data determined by the transmission data determination unit to the aggregation processing device.
前記要素算出部は、前記属性毎に前記要素Apqを算出し、該属性毎に算出した前記要素Apqをそれぞれ有する複数の属性別遷移確率行列を生成し、
前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が生成した複数の属性別遷移確率行列とに基づいて、前記推定クロス推計を算出することを特徴とする集計システム。 The aggregation system according to claim 1,
Said element calculation unit, wherein the element A pq is calculated, to generate a plurality of demographic transition probability matrix with each said element A pq calculated for each the attribute for each of the attributes,
The estimation unit calculates the estimated cross estimate based on the cross tabulation generated by the tabulation unit and a plurality of attribute-specific transition probability matrices generated by the element calculation unit.
前記要素算出部は、前記属性別遷移確率行列のそれぞれがメモリ上に展開されるときのサイズに基づき、それぞれが少なくとも1つの前記属性別遷移確率行列を含む複数の分割遷移確率行列を生成し、
前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が生成した複数の分割遷移確率行列とに基づいて、前記推定クロス推計を算出することを特徴とする集計システム。 The aggregation system according to claim 2,
The element calculation unit generates a plurality of divided transition probability matrices each including at least one attribute-specific transition probability matrix based on a size when each of the attribute-specific transition probability matrices is expanded on a memory,
The estimation unit calculates the estimated cross estimate based on the cross tabulation generated by the tabulation unit and a plurality of divided transition probability matrices generated by the element calculation unit.
前記推定部は、前記集計部が生成したクロス集計に対して、該クロス集計が得られた場合の事後確率を求めるための条件である所定の事後確率算出条件を適用することにより、前記推定クロス集計を算出することを特徴とする集計システム。 In the aggregation system according to any one of claims 1 to 3,
The estimation unit applies a predetermined posterior probability calculation condition, which is a condition for obtaining a posterior probability when the cross tabulation is obtained, to the cross tabulation generated by the tabulation unit. A tally system characterized by calculating tally.
前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が算出した遷移確率行列の逆行列とに基づいて、前記推定クロス集計を算出することを特徴とする集計システム。 The aggregation system according to claim 1,
The estimation unit calculates the estimated cross tabulation based on the cross tabulation generated by the tabulation unit and the inverse matrix of the transition probability matrix calculated by the element calculation unit.
前記データが属する属性に対してあらかじめ定められた維持確率と、前記属性とを前記情報提供者端末へ送信する情報送信部と、
前記情報提供者端末から送信されてきた、前記維持確率と前記属性と該情報提供者端末が生成した乱数とに基づいて該情報提供者端末が決定した送信データを集計したクロス集計を生成する集計部と、
前記集計部が生成したクロス集計と、前記要素算出部が生成した遷移確率行列とに基づいて、真のクロス集計の推定値である推定クロス集計を算出する推定部とを有する集計処理装置。 It is connected to an information provider terminal that transmits transmission data determined from data that has been accepted, and is an aggregation processing device that aggregates transmission data transmitted from the information provider terminal,
An information transmission unit for transmitting a maintenance probability predetermined for the attribute to which the data belongs and the attribute to the information provider terminal;
Aggregation for generating a cross tabulation that tabulates transmission data determined by the information provider terminal based on the maintenance probability, the attribute, and a random number generated by the information provider terminal, transmitted from the information provider terminal And
An aggregation processing apparatus including: an estimation unit that calculates an estimated cross tabulation that is an estimated value of a true cross tabulation based on the cross tabulation generated by the tabulation unit and the transition probability matrix generated by the element calculation unit.
前記要素算出部は、前記属性毎に前記要素Apqを算出し、該属性毎に算出した前記要素Apqをそれぞれ有する複数の属性別遷移確率行列を生成し、
前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が生成した複数の属性別遷移確率行列とに基づいて、前記推定クロス推計を算出する集計処理装置。 The aggregation processing device according to claim 6,
Said element calculation unit, wherein the element A pq is calculated, to generate a plurality of demographic transition probability matrix with each said element A pq calculated for each the attribute for each of the attributes,
The estimation unit is a tabulation processing device that calculates the estimated cross estimate based on the cross tabulation generated by the tabulation unit and a plurality of attribute-specific transition probability matrices generated by the element calculation unit.
前記要素算出部は、前記属性別遷移確率行列のそれぞれがメモリ上に展開されるときのサイズに基づき、それぞれが少なくとも1つの前記属性別遷移確率行列を含む複数の分割遷移確率行列を生成し、
前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が生成した複数の分割遷移確率行列とに基づいて、前記推定クロス推計を算出する集計処理装置。 The aggregation processing device according to claim 7,
The element calculation unit generates a plurality of divided transition probability matrices each including at least one attribute-specific transition probability matrix based on a size when each of the attribute-specific transition probability matrices is expanded on a memory,
The estimation unit is a tabulation processing device that calculates the estimated cross estimate based on the cross tabulation generated by the tabulation unit and a plurality of divided transition probability matrices generated by the element calculation unit.
前記推定部は、前記集計部が生成したクロス集計に対して、該クロス集計が得られた場合の事後確率を求めるための条件である所定の事後確率算出条件を適用することにより、前記推定クロス集計を算出する集計処理装置。 In the aggregation processing device according to any one of claims 6 to 8,
The estimation unit applies a predetermined posterior probability calculation condition, which is a condition for obtaining a posterior probability when the cross tabulation is obtained, to the cross tabulation generated by the tabulation unit. A tally processing device that calculates tally.
前記推定部は、前記集計部が生成したクロス集計と、前記要素算出部が算出した遷移確率行列の逆行列とに基づいて、前記推定クロス集計を算出する集計処理装置。 The aggregation processing device according to claim 6,
The estimation unit calculates the estimated cross tabulation based on the cross tabulation generated by the tabulation unit and the inverse matrix of the transition probability matrix calculated by the element calculation unit.
当該情報提供者端末にて入力を受付けたデータを記憶する記憶部と、
前記データが属する属性に対してあらかじめ定められた維持確率と、前記属性とが前記集計処理装置から送信されてきた際、乱数を生成する確率変更部と、
前記集計処理装置から送信されてきた維持確率および属性と、前記確率変更部が生成した乱数とに基づいて、前記記憶しているデータのうちから該集計処理装置へ送信する前記送信データを決定する送信データ決定部と、
前記送信データ決定部が決定した送信データを前記集計処理装置へ送信するデータ送信部と、を有する情報提供者端末。 An information provider terminal connected to the aggregation processing device,
A storage unit for storing data received by the information provider terminal;
A probability changing unit for generating a random number when the maintenance probability predetermined for the attribute to which the data belongs and the attribute are transmitted from the aggregation processing device;
Based on the maintenance probability and attribute transmitted from the aggregation processing device and the random number generated by the probability changing unit, the transmission data to be transmitted to the aggregation processing device is determined from the stored data. A transmission data determination unit;
An information provider terminal comprising: a data transmission unit that transmits transmission data determined by the transmission data determination unit to the aggregation processing device.
前記情報提供者端末が、前記データを記憶する記憶処理と、
前記集計処理装置が、前記データが属する属性に対してあらかじめ定められた維持確率と、前記属性とを前記情報提供者端末へ送信する情報送信処理と、
前記情報提供者端末が、前記集計処理装置から維持確率と属性とが送信されてきた際、乱数を生成する確率変更処理と、
前記情報提供者端末が、前記集計処理装置から送信されてきた維持確率および属性と、前記生成した乱数とに基づいて、前記記憶しているデータのうちから該集計処理装置へ送信する前記送信データを決定する送信データ決定処理と、
前記情報提供者端末が、前記決定した送信データを前記集計処理装置へ送信するデータ送信処理と、
前記集計処理装置が、
前記集計処理装置が、前記情報提供者端末から送信されてきた送信データを集計したクロス集計を生成する集計処理と、
前記集計処理装置が、前記生成したクロス集計と、前記生成した遷移確率行列とに基づいて、真のクロス集計の推定値である推定クロス集計を算出する推定処理と、を有する集計方法。 In a totaling system comprising: an information provider terminal that transmits transmission data determined from data that has been accepted; and a totalization processing device that totals transmission data transmitted from the information provider terminal. Is a counting method for counting
A storage process in which the information provider terminal stores the data;
An information transmission process in which the aggregation processing device transmits a predetermined maintenance probability to the attribute to which the data belongs and the attribute to the information provider terminal;
When the information provider terminal transmits a maintenance probability and an attribute from the aggregation processing device, a probability changing process for generating a random number;
The transmission data that the information provider terminal transmits to the aggregation processing device from the stored data based on the maintenance probability and attribute transmitted from the aggregation processing device and the generated random number Transmission data determination processing to determine,
A data transmission process in which the information provider terminal transmits the determined transmission data to the aggregation processing device;
The aggregation processing device is
A tabulation process for generating a cross tabulation in which the tabulation processing device tabulates transmission data transmitted from the information provider terminal;
An aggregation method including: an estimation process in which the aggregation processing device calculates an estimated cross aggregation that is an estimated value of a true cross aggregation based on the generated cross aggregation and the generated transition probability matrix.
前記要素算出処理は、前記集計処理装置が、前記属性毎に前記要素Apqを算出し、該属性毎に算出した前記要素Apqをそれぞれ有する複数の属性別遷移確率行列を生成する処理であり、
前記推定処理は、前記集計処理装置が、前記生成したクロス集計と、前記生成した複数の属性別遷移確率行列とに基づいて、前記推定クロス推計を算出する処理である集計方法。 The tabulation method according to claim 12,
Said element calculation process, the aggregation processing device calculates the element A pq for each of the attributes, be a process of generating a plurality of demographic transition probability matrix with each said element A pq calculated for each the attribute ,
The estimation method is a tabulation method in which the tabulation processing device calculates the estimated cross estimate based on the generated cross tabulation and the generated plurality of attribute-specific transition probability matrices.
前記要素算出処理は、前記集計処理装置が、前記属性別遷移確率行列のそれぞれがメモリ上に展開されるときのサイズに基づき、それぞれが少なくとも1つの前記属性別遷移確率行列を含む複数の分割遷移確率行列を生成する処理であり、
前記推定処理は、前記集計処理装置が、前記生成したクロス集計と、前記生成した複数の分割遷移確率行列とに基づいて、前記推定クロス推計を算出する処理である集計方法。 The aggregation method according to claim 13,
In the element calculation process, the aggregation processing device has a plurality of divided transitions each including at least one attribute-specific transition probability matrix based on a size when each of the attribute-specific transition probability matrices is expanded on a memory. A process for generating a probability matrix,
The estimation method is a tabulation method in which the tabulation processing device calculates the estimated cross estimate based on the generated cross tabulation and the generated plurality of divided transition probability matrices.
前記情報提供者端末にて入力を受付けたデータが属する属性に対してあらかじめ定められた維持確率と、前記属性とを前記情報提供者端末へ送信する情報送信手順と、
前記情報提供者端末から送信されてきた、前記維持確率と前記属性と該情報提供者端末が生成した乱数とに基づいて該情報提供者端末が決定した送信データを集計したクロス集計を生成する集計手順と、
前記生成したクロス集計と、前記生成した遷移確率行列とに基づいて、真のクロス集計の推定値である推定クロス集計を算出する推定手順とを実行させるプログラム。 To the aggregation processing device connected to the information provider terminal that transmits the transmission data determined from the data that has received the input,
A maintenance probability predetermined for the attribute to which the data accepted by the information provider terminal belongs, and an information transmission procedure for transmitting the attribute to the information provider terminal;
Aggregation for generating a cross tabulation that tabulates transmission data determined by the information provider terminal based on the maintenance probability, the attribute, and a random number generated by the information provider terminal, transmitted from the information provider terminal Procedure and
A program for executing an estimation procedure for calculating an estimated cross tabulation that is an estimated value of a true cross tabulation based on the generated cross tabulation and the generated transition probability matrix.
前記要素算出手順は、前記属性毎に前記要素Apqを算出し、該属性毎に算出した前記要素Apqをそれぞれ有する複数の属性別遷移確率行列を生成する手順であり、
前記推定手順は、前記生成したクロス集計と、前記生成した複数の属性別遷移確率行列とに基づいて、前記推定クロス推計を算出する手順であるプログラム。 The program according to claim 15, wherein
Said element calculation procedure, the calculates the element A pq for each attribute, a procedure for generating a plurality of demographic transition probability matrix with each said element A pq calculated for each the attribute,
The estimation procedure is a program for calculating the estimated cross estimate based on the generated cross tabulation and the generated plurality of attribute-specific transition probability matrices.
前記要素算出手順は、前記属性別遷移確率行列のそれぞれがメモリ上に展開されるときのサイズに基づき、それぞれが少なくとも1つの前記属性別遷移確率行列を含む複数の分割遷移確率行列を生成する手順であり、
前記推定手順は、前記生成したクロス集計と、前記生成した複数の分割遷移確率行列とに基づいて、前記推定クロス推計を算出する手順であるプログラム。 The program according to claim 16, wherein
The element calculation procedure is a procedure of generating a plurality of divided transition probability matrices each including at least one attribute-specific transition probability matrix based on a size when each of the attribute-specific transition probability matrices is expanded on a memory. And
The estimation procedure is a program for calculating the estimated cross estimate based on the generated cross tabulation and the generated plurality of divided transition probability matrices.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009224212A JP5307678B2 (en) | 2008-10-03 | 2009-09-29 | Aggregation system, aggregation processing device, information provider terminal, aggregation method and program |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008258766 | 2008-10-03 | ||
JP2008258766 | 2008-10-03 | ||
JP2009224212A JP5307678B2 (en) | 2008-10-03 | 2009-09-29 | Aggregation system, aggregation processing device, information provider terminal, aggregation method and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010108488A true JP2010108488A (en) | 2010-05-13 |
JP5307678B2 JP5307678B2 (en) | 2013-10-02 |
Family
ID=42297816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009224212A Active JP5307678B2 (en) | 2008-10-03 | 2009-09-29 | Aggregation system, aggregation processing device, information provider terminal, aggregation method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5307678B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013080094A (en) * | 2011-10-04 | 2013-05-02 | Nippon Telegr & Teleph Corp <Ntt> | Data disturbance and restructuring system, data restructuring apparatus, data restructuring method, and data restructuring program |
JP2015230358A (en) * | 2014-06-04 | 2015-12-21 | 日本電信電話株式会社 | Derangement restructuring system, derangement device, restructuring device, derangement restructuring method, and program |
CN112119441A (en) * | 2018-05-17 | 2020-12-22 | 日本电信电话株式会社 | Secret cross accumulation system, secret calculation device, secret cross accumulation method, and program |
-
2009
- 2009-09-29 JP JP2009224212A patent/JP5307678B2/en active Active
Non-Patent Citations (2)
Title |
---|
CSNG200900269045; 高見澤 秀久: 'プライバシーを保護するカウント演算の多値属性分類への適用' 電子情報通信学会 第18回データ工学ワークショップ論文集 [online] DEWS2007 HIROSHIMA , 20070601, 電子情報通信学会データ工学専門委員会 * |
JPN6013020384; 高見澤 秀久: 'プライバシーを保護するカウント演算の多値属性分類への適用' 電子情報通信学会 第18回データ工学ワークショップ論文集 [online] DEWS2007 HIROSHIMA , 20070601, 電子情報通信学会データ工学専門委員会 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013080094A (en) * | 2011-10-04 | 2013-05-02 | Nippon Telegr & Teleph Corp <Ntt> | Data disturbance and restructuring system, data restructuring apparatus, data restructuring method, and data restructuring program |
JP2015230358A (en) * | 2014-06-04 | 2015-12-21 | 日本電信電話株式会社 | Derangement restructuring system, derangement device, restructuring device, derangement restructuring method, and program |
CN112119441A (en) * | 2018-05-17 | 2020-12-22 | 日本电信电话株式会社 | Secret cross accumulation system, secret calculation device, secret cross accumulation method, and program |
US20220292223A1 (en) * | 2018-05-17 | 2022-09-15 | Nippon Telegraph And Telephone Corporation | Secure cross tabulation system, secure computation apparatus, secure cross tabulation method, and program |
US11868510B2 (en) * | 2018-05-17 | 2024-01-09 | Nippon Telegraph And Telephone Corporation | Secure cross tabulation system, secure computation apparatus, secure cross tabulation method, and program |
CN112119441B (en) * | 2018-05-17 | 2024-03-22 | 日本电信电话株式会社 | Secret cross accumulation system, secret calculation device, secret cross accumulation method, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP5307678B2 (en) | 2013-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8301650B1 (en) | Bloom filter compaction | |
Zhang et al. | Model size reduction using frequency based double hashing for recommender systems | |
US20160307113A1 (en) | Large-scale batch active learning using locality sensitive hashing | |
US10664481B2 (en) | Computer system programmed to identify common subsequences in logs | |
KR101935765B1 (en) | Method and system for comparing documents based on different document-similarity calculation methods using adaptive weighting | |
Song et al. | Learning from data with heterogeneous noise using sgd | |
US8788499B2 (en) | System and method for finding top N pairs in a map-reduce setup | |
Christ et al. | Differential privacy and swapping: Examining de-identification’s impact on minority representation and privacy preservation in the US census | |
McMahan | A unified view of regularized dual averaging and mirror descent with implicit updates | |
CN113407987A (en) | Method and device for determining effective value of service data characteristic for protecting privacy | |
CN107885716A (en) | Text recognition method and device | |
CN111460165A (en) | Method, apparatus, and computer-readable storage medium for knowledge-graph link prediction | |
CN111125266A (en) | Data processing method, device, equipment and storage medium | |
Stummer et al. | On divergences of finite measures and their applicability in statistics and information theory | |
US20110268315A1 (en) | Scalable Media Fingerprint Extraction | |
JP5307678B2 (en) | Aggregation system, aggregation processing device, information provider terminal, aggregation method and program | |
JP6605746B2 (en) | Secret coupling system, secret coupling apparatus, secret coupling method, program | |
Alqallaf et al. | Robust inference in generalized linear models | |
JP6445415B2 (en) | Anonymization device, anonymization method, program | |
US20200175022A1 (en) | Data retrieval | |
McGree et al. | Robust designs for Poisson regression models | |
Magdy et al. | Privacy preserving search index for image databases based on SURF and order preserving encryption | |
WO2015114830A1 (en) | Computer and graph-data generation method | |
US8554696B2 (en) | Efficient computation of ontology affinity matrices | |
WO2022166676A1 (en) | Method and apparatus for estimating segmented word frequency in differential privacy protection data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20110617 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110909 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20130304 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130627 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5307678 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |