JP6532849B2 - データ撹乱装置、方法及びプログラム - Google Patents
データ撹乱装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6532849B2 JP6532849B2 JP2016194452A JP2016194452A JP6532849B2 JP 6532849 B2 JP6532849 B2 JP 6532849B2 JP 2016194452 A JP2016194452 A JP 2016194452A JP 2016194452 A JP2016194452 A JP 2016194452A JP 6532849 B2 JP6532849 B2 JP 6532849B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- disturbance
- data
- unit
- anonymity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
まず、記法の定義を行う。行列の要素、例えば行列Hのi行j列の要素を、hijと表すこととする。このように、2つの添字がある行列は、その行列の要素を意味する。属性数をMとする。属性として、カテゴリ属性及び数値属性の少なくとも一方を取り扱う。j番目の属性の取りうる値の集合をAjと表す。そして、全属性の集合をA=A1×…×AMとする。i番目のユーザのj番目の属性の値をxijと表し、i番目のユーザの全属性の値をベクトルxi=(xi1,…,xij,…,xiM)T∈Aと表し、全ユーザの全属性の値を表す行列Xを以下のように表す。
データベースの「撹乱」とは、元データに撹乱処理を施し、秘匿データベースを作成することである。
〔参考文献1〕五十嵐大, 千田浩司, 高橋克巳, "多値属性に適用可能な効率的プライバシー保護クロス集計", コンピュータセキュリティシンポジウム2008 論文集, 第2008 巻, pp. 497-502, oct 2008.
以下、この発明の実施形態について説明する。
行列分解部1は、行列Xを、行列Uと行列VTとに分解する(ステップS1)。行列Xは、各レコードの各属性の属性値を要素とする行列であり、撹乱の対象となるデータである。・を行列として、・Tは行列・の転置を表す。
撹乱部2は、行列Uに対して、Pk-匿名性を満たす撹乱処理を行うことにより行列U'を得る(ステップS2)。得られた行列U'は、Pk-匿名性を満たす。得られた行列U'は、演算部3に出力される。
演算部3は、行列U'と行列VTとの積を計算することにより行列Yを求める(ステップS3)。すなわち、演算部3は、撹乱済みのU'とVとの積U'VTにより、N×M行列Yを得る。求まった行列Yは、Pk-匿名性を満たしている。求まった行列Yが、撹乱されたデータとなる。
[[第一実施例]]
第一実施例は、Xが2値行列の場合の実施例を示す。ここで、2値行列とは、行列の要素が0又は1の行列のことである。図4に、第一実施例の処理の流れの概要を示す。
〔参考文献2〕Zhongyuan Zhang, Tao Li, Chris Ding, Xiangsun Zhang, "Binary matrix factorization with applications", In Seventh IEEE International Conference on Data Mining (ICDM 2007), pp.391-400. IEEE, 2007
〔参考文献3〕Siamak Ravanbakhsh, Barnabas Poczos, Russell Greiner, "Boolean matrix factorization and noisy completionvia message passing", In Proceedings of the 33nd International Conference on Machine Learning, pp.945-954, 2016
第二実施例は、Xが非負値な行列の場合の実施例である。Xは非負値かつ疎な行列であってもよい。図5に、第二実施例の処理の流れの概要を示す。
非負値な行列Xを非負値分解は、例えば参考文献4の手法で行うことができる(ステップS1)。
〔参考文献4〕Daniel D Lee, H Sebastian Seung, "Algorithms for non-negative matrix factorization", In Advances in neural information processing systems, pp. 556-562, 2001
データ撹乱装置における各処理をコンピュータによって実現する場合、データ撹乱装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、データ撹乱装置の処理がコンピュータ上で実現される。
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
Claims (5)
- ・Tを行列・の転置を表すとして、各レコードの各属性の属性値を要素とする行列Xを、行列Uと行列VTとに分解する行列分解部と、
上記行列Uに対して、Pk-匿名性を満たす撹乱処理を行うことにより行列U'を得る撹乱部と、
上記行列U'と上記行列VTとの積を計算することにより行列Yを求める演算部と、
を含むデータ撹乱装置。 - 請求項1のデータ撹乱装置であって、
上記行列Xが2値行列である場合には、上記撹乱部は、上記行列Uに対して維持置換撹乱によるPk-匿名性を満たす撹乱処理を行うことにより行列U'を得る、
データ撹乱装置。 - 請求項1のデータ撹乱装置であって、
上記行列Xが非負値な行列である場合には、上記行列Xの値が0でない要素に対応する要素の値が1であり上記行列Xの値が0である要素に対応する要素の値が0である行列をOとして、上記行列分解部は、上記行列Xを行列Uと行列VTとに非負値分解し、上記行列Oを行列Pと行列QTとに2値行列分解し、
上記撹乱部は、上記行列Uに対して有界ノイズ付与によるPk-匿名性を満たす撹乱処理を行うことにより行列U'を得て、上記行列Pに対して維持置換撹乱によるPk-匿名性を満たす撹乱処理を行うことにより行列P'を得て、
上記演算部は、上記行列U'と上記行列VTとの積を計算することにより行列X'を求め、上記行列P'と上記行列QTとの積を計算することにより行列O'を求め、上記行列X'を上記行列O'でマスクすることにより、行列Yを求める、
データ撹乱装置。 - 行列分解部が、・Tを行列・の転置を表すとして、各レコードの各属性の属性値を要素とする行列Xを、行列Uと行列VTとに分解する行列分解ステップと、
撹乱部が、上記行列Uに対して、Pk-匿名性を満たす撹乱処理を行うことにより行列U'を得る撹乱ステップと、
演算部が、上記行列U'と上記行列VTとの積を計算することにより行列Yを求める演算ステップと、
を含むデータ撹乱方法。 - 請求項1から3の何れかのデータ撹乱装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016194452A JP6532849B2 (ja) | 2016-09-30 | 2016-09-30 | データ撹乱装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016194452A JP6532849B2 (ja) | 2016-09-30 | 2016-09-30 | データ撹乱装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018055057A JP2018055057A (ja) | 2018-04-05 |
JP6532849B2 true JP6532849B2 (ja) | 2019-06-19 |
Family
ID=61836675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016194452A Active JP6532849B2 (ja) | 2016-09-30 | 2016-09-30 | データ撹乱装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6532849B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6978385B2 (ja) * | 2018-07-26 | 2021-12-08 | Kddi株式会社 | 匿名化装置、匿名化方法及び匿名化プログラム |
KR102055864B1 (ko) * | 2019-05-08 | 2019-12-13 | 서강대학교 산학협력단 | 차분 프라이버시를 적용한 시간 간격 데이터 공개 방법 |
WO2022079905A1 (ja) * | 2020-10-16 | 2022-04-21 | 日本電信電話株式会社 | データ集約装置、データ集約システム、データ集約方法、及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6807536B2 (en) * | 2000-11-16 | 2004-10-19 | Microsoft Corporation | Methods and systems for computing singular value decompositions of matrices and low rank approximations of matrices |
US7685232B2 (en) * | 2008-06-04 | 2010-03-23 | Samsung Electronics Co., Ltd. | Method for anonymous collaborative filtering using matrix factorization |
JP5758315B2 (ja) * | 2012-01-27 | 2015-08-05 | 日本電信電話株式会社 | 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法 |
-
2016
- 2016-09-30 JP JP2016194452A patent/JP6532849B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018055057A (ja) | 2018-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tropp | An introduction to matrix concentration inequalities | |
Argyriou et al. | Efficient first order methods for linear composite regularizers | |
Xu et al. | Jointly clustering rows and columns of binary matrices: Algorithms and trade-offs | |
Adamczak et al. | Circular law for random matrices with exchangeable entries | |
JP6532849B2 (ja) | データ撹乱装置、方法及びプログラム | |
Slavković et al. | Synthetic two-way contingency tables that preserve conditional frequencies | |
JP6310345B2 (ja) | プライバシー保護装置、プライバシー保護方法及びデータベース作成方法 | |
Giampouras et al. | Block-term tensor decomposition model selection and computation: The Bayesian way | |
Jungers et al. | Overlap-free words and spectra of matrices | |
Jana et al. | Support recovery with stochastic gates: Theory and application for linear models | |
Han et al. | Erasure recovery matrices for encoder protection | |
Probst | Denoising autoencoders for fast combinatorial black box optimization | |
Kang et al. | Polynomial constraints in causal Bayesian networks | |
JP6978385B2 (ja) | 匿名化装置、匿名化方法及び匿名化プログラム | |
Hewage et al. | Optimizing the trade-off between classification accuracy and data privacy in the area of data stream mining | |
CN112106045B (zh) | 信息处理装置、系统、信息处理方法以及计算机可读记录介质 | |
JP6486865B2 (ja) | データ撹乱装置、データ撹乱方法、データ撹乱プログラム | |
Hu | Kernel-based maximum correntropy criterion with gradient descent method. | |
Krebs | Non-parametric regression for spatially dependent data with wavelets | |
Vargas-Guzmán | Heavy tailed probability distributions for non-Gaussian simulations with higher-order cumulant parameters predicted from sample data | |
Cheriet et al. | Optimizing permutation-based problems with a discrete vine-copula as a model for EDA | |
Sheen et al. | Tensor Kernel Recovery for Discrete Spatio-Temporal Hawkes Processes | |
Hafner | Estimation of a multiplicative covariance structure in the large dimensional case | |
Aloafi et al. | An Overview of Composite Standard Elastic‐Net Distribution Based on Complex Wavelet Coefficients | |
Watson | A computational investigation of large gaps in contingency tables |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180903 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6532849 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |