JP6158137B2 - 撹乱再構築システム、撹乱装置、再構築装置、撹乱再構築方法及びプログラム - Google Patents
撹乱再構築システム、撹乱装置、再構築装置、撹乱再構築方法及びプログラム Download PDFInfo
- Publication number
- JP6158137B2 JP6158137B2 JP2014115694A JP2014115694A JP6158137B2 JP 6158137 B2 JP6158137 B2 JP 6158137B2 JP 2014115694 A JP2014115694 A JP 2014115694A JP 2014115694 A JP2014115694 A JP 2014115694A JP 6158137 B2 JP6158137 B2 JP 6158137B2
- Authority
- JP
- Japan
- Prior art keywords
- disturbance
- attribute value
- matrix
- reconstruction
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
=(61,45,43,50)
数値化された一般のテーブルを表2に示す。
Ai=((1-ρi)/mi)U(mi)+ρiE(mi)
ここで、U(mi)はサイズがmi×miの要素がすべて1の行列であり、E(mi)はサイズがmi×miの単位行列であり、ρiはその要素をどの程度維持するかを表す定数である。ρiは維持確率と呼ばれる。
テーブルに予め定められている属性には相関関係がある場合がある。まず、この相関の具体例と一般の定義について説明する。例えば、北海道・東北、関東、北陸等の地方という属性と、北海道、青森、岩手、秋田等の都道府県という属性には、地方の要素を1つ定めた時に都道府県のとるべき要素の部分集合が定まるという相関がある。具体的には、属性“地方”の値域M地方と属性“都道府県”の値域M都道府県を、
M地方={北海道・東北,関東,北陸,…}
M都道府県={北海道,青森,岩手,秋田,…}
とする。このときに、2M都道府県をM都道府県の部分集合族として以下のような写像が定まる。
π:M地方→2M都道府県
北海道・東北→{北海道,青森,岩手,秋田,宮城,山形,福島},
関東→{茨城,栃木,群馬,埼玉,千葉,東京,神奈川},
…→{…}.
{(1,M2の元のブロック),(2,M2の元のブロック),…,(m1,M2の元のブロック)}
という形をしている。相関を考慮した場合には、
{(1,π2(1)の元のブロック),(2,π2(2)の元のブロック),…,(m1,π2(m1)の元のブロック)}
となる。なお、この際のクロス集計を表す長さは2番目の値域M2の部分集合π2(i(1))の位数の総和になり、
属性間に相関{π2,…,πn}がある場合に、撹乱の方法を以下のように変化させる。
属性間に相関がある場合の撹乱方法は、撹乱の際に生成した遷移確率行列
上記で定めた遷移確率行列
(ケース1)i1 (1)≠j1 (1)かつi2 (1)≠j2 (1)かつi1 (1)≠j2 (1)かつi2 (1)≠j1 (1)の場合
(ケース3)i1 (1)≠j1 (1)かつi2 (1)≠j2 (1)かつi1 (1)=j2 (1)かつi2 (1)=j1 (1)の場合
(ケース6)i1 (1)=j1 (1)かつi2 (1)=j2 (1)かつi1 (1)≠j2 (1)かつi2 (1)≠j1 (1)の場合
(ケース7)i1 (1)=j1 (1)かつi2 (1)=j2 (1)かつi1 (1)=j2 (1)かつi2 (1)=j1 (1)の場合
(ケース7.3)i1 (1)≠j1 (1)かつi2 (1)≠j2 (1)かつi1 (1)=j2 (1)かつi2 (1)=j1 (1)の場合
(ケース7.6)i1 (1)=j1 (1)かつi2 (1)=j2 (1)かつi1 (1)≠j2 (1)かつi2 (1)≠j1 (1)の場合
(ケース7.7)i1 (1)=j1 (1)かつi2 (1)=j2 (1)かつi1 (1)=j2 (1)かつi2 (1)=j1 (1)の場合
この発明の第一実施形態は、維持確率を入力として、属性間に相関のあるレコードを撹乱する撹乱装置と、撹乱されたレコードを用いたクロス集計から元のレコードに対するクロス集計の推定値を求める再構築装置とから構成される撹乱再構築システム及び方法である。
この発明の第二実施形態は、安全性指標を入力として、属性間に相関のあるレコードを撹乱する撹乱装置と、撹乱されたレコードを用いたクロス集計から元のレコードに対するクロス集計の推定値を求める再構築装置とから構成される撹乱再構築システム及び方法である。
この発明の撹乱再構築技術は、上記のように構成することにより、安全性の指標であるkの値と撹乱の指標であるρの値を、一方を一定にしたまま他方を向上することができる。つまり、以下のような効果が得られる。
1.一定の安全性指標kの値に対して、従来よりも高い維持確率ρ1,…,ρnが使用できる。
2.一定の維持確率ρ1,…,ρnの値に対して、従来よりも高い安全性指標kの値になり、安全性が向上する。
3.従来の場合、あり得ない値(例えば{10代前半,車の運転をする}といった内容のレコード)であってもクロス集計の中でカウントしていたが、この発明では相関を定めることによって予め先のようなレコードは外しているので、あり得ない値のクロス集計の値を取らなくて済む。よって、クロス集計を用いる際の省メモリ化につながる。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
2 再構築装置
9 通信網
10 入力部
11 維持確率計算部
12 撹乱部
14 出力部
20 入力部
22 行列生成部
24 ベイズ推定部
26 出力部
Claims (7)
- 撹乱装置と再構築装置を含む撹乱再構築システムであって、
上記撹乱装置は、
i=2,…,nについてa(i)=πi(a(1),…,a(i-1))を満たす相関π2,…,πnがあるレコード(a(1),…,a(n))を入力する入力部と、
上記属性値a(i)を撹乱する際に、j=1,…,i-1について、上記属性値a(j)を撹乱した撹乱済属性値a’(j)と上記属性値a(j)とが等しい場合には、πi(a'(1),…,a'(i-1))の中で予め定めた維持確率ρiで維持置換撹乱を行い、上記撹乱済属性値a’(j)と上記属性値a(j)とが等しくない場合には、πi(a’(1),…,a’(i-1))の元から一様ランダムに選択して、上記属性値a(i)に対する撹乱済属性値a’(i)を定める撹乱部と、
を含み、
上記再構築装置は、
撹乱済レコード{(a'(1),…,a'(n))}に対するクロス集計を入力する入力部と、
上記維持確率ρ1,…,ρnと上記相関π2,…,πnを用いて遷移確率行列を生成する行列生成部と、
上記遷移確率行列を用いて上記クロス集計をベイズ推定し上記レコード{(a(1),…,a(n))}に対するクロス集計の推定値を求めるベイズ推定部と、
を含む撹乱再構築システム。 - 請求項1又は2に記載の撹乱再構築システムであって、
上記撹乱装置は、
#Tはテーブルのレコード数であり、#M1は1番目の属性の値域の位数であり、δ0=1-ρ1であり、δ1=1+(#M1-1)ρ1であり、
- i=2,…,nについてa(i)=πi(a(1),…,a(i-1))を満たす相関π2,…,πnがあるレコード(a(1),…,a(n))を入力する入力部と、
上記属性値a(i)を撹乱する際に、j=1,…,i-1について、上記属性値a(j)を撹乱した撹乱済属性値a’(j)と上記属性値a(j)とが等しい場合には、πi(a'(1),…,a'(i-1))の中で予め定めた維持確率ρiで維持置換撹乱を行い、上記撹乱済属性値a’(j)と上記属性値a(j)とが等しくない場合には、πi(a’(1),…,a’(i-1))の元から一様ランダムに選択して、上記属性値a(i)に対する撹乱済属性値a’(i)を定める撹乱部と、
を含む撹乱装置。 - i=2,…,nについてa(i)=πi(a(1),…,a(i-1))を満たす相関π2,…,πnがあるレコード{(a(1),…,a(n))}を撹乱した撹乱済レコード{(a'(1),…,a'(n))}に対するクロス集計を入力する入力部と、
予め定めた維持確率ρ1,…,ρnと上記相関π2,…,πnを用いて遷移確率行列を生成する行列生成部と、
上記遷移確率行列を用いて上記クロス集計をベイズ推定し上記レコード{(a(1),…,a(n))}に対するクロス集計の推定値を求めるベイズ推定部と、
を含み、
上記撹乱済レコード{(a'(1),…,a'(n))}は、上記属性値a(i)を撹乱する際に、j=1,…,i-1について、上記属性値a(j)を撹乱した撹乱済属性値a’(j)と上記属性値a(j)とが等しい場合には、πi(a'(1),…,a'(i-1))の中で予め定めた維持確率ρiで維持置換撹乱を行い、上記撹乱済属性値a’(j)と上記属性値a(j)とが等しくない場合には、πi(a’(1),…,a’(i-1))の元から一様ランダムに選択して上記撹乱済属性値a’(i)を定めたものである
再構築装置。 - 入力部が、i=2,…,nについてa(i)=πi(a(1),…,a(i-1))を満たす相関π2,…,πnがあるレコード(a(1),…,a(n))を入力する入力ステップと、
撹乱部が、上記属性値a(i)を撹乱する際に、j=1,…,i-1について、上記属性値a(j)を撹乱した撹乱済属性値a’(j)と上記属性値a(j)とが等しい場合には、πi(a'(1),…,a'(i-1))の中で予め定めた維持確率ρiで維持置換撹乱を行い、上記撹乱済属性値a’(j)と上記属性値a(j)とが等しくない場合には、πi(a’(1),…,a’(i-1))の元から一様ランダムに選択して、上記属性値a(i)に対する撹乱済属性値a’(i)を定める撹乱ステップと、
行列生成部が、上記維持確率ρ1,…,ρnと上記相関π2,…,πnを用いて遷移確率行列を生成する行列生成ステップと、
ベイズ推定部が、上記遷移確率行列を用いて上記撹乱済レコード{(a'(1),…,a'(n))}に対するクロス集計をベイズ推定し上記レコード{(a(1),…,a(n))}に対するクロス集計の推定値を求めるベイズ推定ステップと、
を含む撹乱再構築方法。 - 請求項4に記載の撹乱装置もしくは請求項5に記載の再構築装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014115694A JP6158137B2 (ja) | 2014-06-04 | 2014-06-04 | 撹乱再構築システム、撹乱装置、再構築装置、撹乱再構築方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014115694A JP6158137B2 (ja) | 2014-06-04 | 2014-06-04 | 撹乱再構築システム、撹乱装置、再構築装置、撹乱再構築方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015230358A JP2015230358A (ja) | 2015-12-21 |
JP6158137B2 true JP6158137B2 (ja) | 2017-07-05 |
Family
ID=54887156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014115694A Active JP6158137B2 (ja) | 2014-06-04 | 2014-06-04 | 撹乱再構築システム、撹乱装置、再構築装置、撹乱再構築方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6158137B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6532829B2 (ja) * | 2016-01-15 | 2019-06-19 | 日本電信電話株式会社 | 撹乱データ再構築誤差推定装置、撹乱データ再構築誤差推定方法、プログラム |
WO2021070361A1 (ja) * | 2019-10-11 | 2021-04-15 | 日本電信電話株式会社 | 維持置換確率生成装置、維持置換撹乱装置、維持置換確率生成方法、維持置換撹乱方法、プログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5307678B2 (ja) * | 2008-10-03 | 2013-10-02 | 日本電信電話株式会社 | 集計システム、集計処理装置、情報提供者端末、集計方法およびプログラム |
JP5683425B2 (ja) * | 2011-10-04 | 2015-03-11 | 日本電信電話株式会社 | データ撹乱・再構築システム、データ再構築装置、データ再構築方法、データ再構築プログラム |
-
2014
- 2014-06-04 JP JP2014115694A patent/JP6158137B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015230358A (ja) | 2015-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ponomareva et al. | How to dp-fy ml: A practical guide to machine learning with differential privacy | |
Luedtke | A branch-and-cut decomposition algorithm for solving chance-constrained mathematical programs with finite support | |
Lam | High‐dimensional covariance matrix estimation | |
Petrović et al. | Accelerated double direction method for solving unconstrained optimization problems | |
Almutairi et al. | K-means clustering using homomorphic encryption and an updatable distance matrix: secure third party data clustering with limited data owner interaction | |
Babajee et al. | On a Novel Fourth‐Order Algorithm for Solving Systems of Nonlinear Equations | |
Roos | An improved version of Chubanov's method for solving a homogeneous feasibility problem | |
JP6310345B2 (ja) | プライバシー保護装置、プライバシー保護方法及びデータベース作成方法 | |
JP2022074880A (ja) | パラメータ最適化装置、方法及びシステム | |
Maleknejad et al. | Modified block pulse functions for numerical solution of stochastic Volterra integral equations | |
Xie et al. | A novel ensemble learning approach for corporate financial distress forecasting in fashion and textiles supply chains | |
JP6158137B2 (ja) | 撹乱再構築システム、撹乱装置、再構築装置、撹乱再構築方法及びプログラム | |
Suthaharan et al. | Supervised learning algorithms | |
Bagirov et al. | Robust piecewise linear l 1-regression via nonsmooth dc optimization | |
Mahdioui et al. | On a System of Generalized Mixed Equilibrium Problems Involving Variational‐Like Inequalities in Banach Spaces: Existence and Algorithmic Aspects | |
Shaham et al. | Holistic survey of privacy and fairness in machine learning | |
JP2011154554A (ja) | 欠損値予測装置、欠損値予測方法及び欠損値予測プログラム | |
US20210287573A1 (en) | Secret batch approximation system, secure computation device, secret batch approximation method, and program | |
US11841863B1 (en) | Generating relaxed synthetic data using adaptive projection | |
JP2018055057A (ja) | データ撹乱装置、方法及びプログラム | |
Subasi et al. | New bounds for the probability that at least k-out-of-n events occur with unimodal distributions | |
JP5651568B2 (ja) | データベース撹乱装置、システム、方法及びプログラム | |
Han | Variable step size Adams methods for BSDEs | |
Lu et al. | Privacy-preserving data integration and sharing in multi-party iot environments: An entity embedding perspective | |
McCullagh | An asymptotic approximation for the permanent of a doubly stochastic matrix |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160713 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170110 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170607 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6158137 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |