JP2018055057A - データ撹乱装置、方法及びプログラム - Google Patents
データ撹乱装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2018055057A JP2018055057A JP2016194452A JP2016194452A JP2018055057A JP 2018055057 A JP2018055057 A JP 2018055057A JP 2016194452 A JP2016194452 A JP 2016194452A JP 2016194452 A JP2016194452 A JP 2016194452A JP 2018055057 A JP2018055057 A JP 2018055057A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- disturbance
- data
- unit
- decomposition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
まず、記法の定義を行う。行列の要素、例えば行列Hのi行j列の要素を、hijと表すこととする。このように、2つの添字がある行列は、その行列の要素を意味する。属性数をMとする。属性として、カテゴリ属性及び数値属性の少なくとも一方を取り扱う。j番目の属性の取りうる値の集合をAjと表す。そして、全属性の集合をA=A1×…×AMとする。i番目のユーザのj番目の属性の値をxijと表し、i番目のユーザの全属性の値をベクトルxi=(xi1,…,xij,…,xiM)T∈Aと表し、全ユーザの全属性の値を表す行列Xを以下のように表す。
データベースの「撹乱」とは、元データに撹乱処理を施し、秘匿データベースを作成することである。
〔参考文献1〕五十嵐大, 千田浩司, 高橋克巳, "多値属性に適用可能な効率的プライバシー保護クロス集計", コンピュータセキュリティシンポジウム2008 論文集, 第2008 巻, pp. 497-502, oct 2008.
以下、この発明の実施形態について説明する。
行列分解部1は、行列Xを、行列Uと行列VTとに分解する(ステップS1)。行列Xは、各レコードの各属性の属性値を要素とする行列であり、撹乱の対象となるデータである。・を行列として、・Tは行列・の転置を表す。
撹乱部2は、行列Uに対して、Pk-匿名性を満たす撹乱処理を行うことにより行列U'を得る(ステップS2)。得られた行列U'は、Pk-匿名性を満たす。得られた行列U'は、演算部3に出力される。
演算部3は、行列U'と行列VTとの積を計算することにより行列Yを求める(ステップS3)。すなわち、演算部3は、撹乱済みのU'とVとの積U'VTにより、N×M行列Yを得る。求まった行列Yは、Pk-匿名性を満たしている。求まった行列Yが、撹乱されたデータとなる。
[[第一実施例]]
第一実施例は、Xが2値行列の場合の実施例を示す。ここで、2値行列とは、行列の要素が0又は1の行列のことである。図4に、第一実施例の処理の流れの概要を示す。
〔参考文献2〕Zhongyuan Zhang, Tao Li, Chris Ding, Xiangsun Zhang, "Binary matrix factorization with applications", In Seventh IEEE International Conference on Data Mining (ICDM 2007), pp.391-400. IEEE, 2007
〔参考文献3〕Siamak Ravanbakhsh, Barnabas Poczos, Russell Greiner, "Boolean matrix factorization and noisy completionvia message passing", In Proceedings of the 33nd International Conference on Machine Learning, pp.945-954, 2016
第二実施例は、Xが非負値な行列の場合の実施例である。Xは非負値かつ疎な行列であってもよい。図5に、第二実施例の処理の流れの概要を示す。
非負値な行列Xを非負値分解は、例えば参考文献4の手法で行うことができる(ステップS1)。
〔参考文献4〕Daniel D Lee, H Sebastian Seung, "Algorithms for non-negative matrix factorization", In Advances in neural information processing systems, pp. 556-562, 2001
データ撹乱装置における各処理をコンピュータによって実現する場合、データ撹乱装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、データ撹乱装置の処理がコンピュータ上で実現される。
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
Claims (5)
- ・Tを行列・の転置を表すとして、各レコードの各属性の属性値を要素とする行列Xを、行列Uと行列VTとに分解する行列分解部と、
上記行列Uに対して、Pk-匿名性を満たす撹乱処理を行うことにより行列U'を得る撹乱部と、
上記行列U'と上記行列VTとの積を計算することにより行列Yを求める演算部と、
を含むデータ撹乱装置。 - 請求項1のデータ撹乱装置であって、
上記行列Xが2値行列である場合には、上記撹乱部は、上記行列Uに対して維持置換撹乱によるPk-匿名性を満たす撹乱処理を行うことにより行列U'を得る、
データ撹乱装置。 - 請求項1のデータ撹乱装置であって、
上記行列Xが非負値な行列である場合には、上記行列Xの値が0でない要素に対応する要素の値が1であり上記行列Xの値が0である要素に対応する要素の値が0である行列をOとして、上記行列分解部は、上記行列Xを行列Uと行列VTとに非負値分解し、上記行列Oを行列Pと行列QTとに2値行列分解し、
上記撹乱部は、上記行列Uに対して有界ノイズ付与によるPk-匿名性を満たす撹乱処理を行うことにより行列U'を得て、上記行列Pに対して維持置換撹乱によるPk-匿名性を満たす撹乱処理を行うことにより行列P'を得て、
上記演算部は、上記行列U'と上記行列VTとの積を計算することにより行列X'を求め、上記行列P'と上記行列QTとの積を計算することにより行列O'を求め、上記行列X'を上記行列O'でマスクすることにより、行列Yを求める、
データ撹乱装置。 - 行列分解部が、・Tを行列・の転置を表すとして、各レコードの各属性の属性値を要素とする行列Xを、行列Uと行列VTとに分解する行列分解ステップと、
撹乱部が、上記行列Uに対して、Pk-匿名性を満たす撹乱処理を行うことにより行列U'を得る撹乱ステップと、
演算部が、上記行列U'と上記行列VTとの積を計算することにより行列Yを求める演算ステップと、
を含むデータ撹乱方法。 - 請求項1から3の何れかのデータ撹乱装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016194452A JP6532849B2 (ja) | 2016-09-30 | 2016-09-30 | データ撹乱装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016194452A JP6532849B2 (ja) | 2016-09-30 | 2016-09-30 | データ撹乱装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018055057A true JP2018055057A (ja) | 2018-04-05 |
JP6532849B2 JP6532849B2 (ja) | 2019-06-19 |
Family
ID=61836675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016194452A Active JP6532849B2 (ja) | 2016-09-30 | 2016-09-30 | データ撹乱装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6532849B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102055864B1 (ko) * | 2019-05-08 | 2019-12-13 | 서강대학교 산학협력단 | 차분 프라이버시를 적용한 시간 간격 데이터 공개 방법 |
JP2020017101A (ja) * | 2018-07-26 | 2020-01-30 | Kddi株式会社 | 匿名化装置、匿名化方法及び匿名化プログラム |
WO2022079905A1 (ja) * | 2020-10-16 | 2022-04-21 | 日本電信電話株式会社 | データ集約装置、データ集約システム、データ集約方法、及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050086185A1 (en) * | 2000-11-16 | 2005-04-21 | Microsoft Corporation | Methods and systems for computing singluar valve decompositions of matrices and low rank approximations of matrices |
US20090307296A1 (en) * | 2008-06-04 | 2009-12-10 | Samsung Electronics Co., Ltd. | Method for anonymous collaborative filtering using matrix factorization |
JP2013156720A (ja) * | 2012-01-27 | 2013-08-15 | Nippon Telegr & Teleph Corp <Ntt> | 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法 |
-
2016
- 2016-09-30 JP JP2016194452A patent/JP6532849B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050086185A1 (en) * | 2000-11-16 | 2005-04-21 | Microsoft Corporation | Methods and systems for computing singluar valve decompositions of matrices and low rank approximations of matrices |
US20090307296A1 (en) * | 2008-06-04 | 2009-12-10 | Samsung Electronics Co., Ltd. | Method for anonymous collaborative filtering using matrix factorization |
JP2013156720A (ja) * | 2012-01-27 | 2013-08-15 | Nippon Telegr & Teleph Corp <Ntt> | 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法 |
Non-Patent Citations (2)
Title |
---|
亀岡 弘和: "非負値行列因子分解", 計測と制御, vol. 第51巻 第9号, JPN7017002820, 10 September 2012 (2012-09-10), JP, pages 835 - 844, ISSN: 0004033954 * |
長谷川 聡 ほか: "確率的k−匿名化における再構築の正確度に関する理論的解析", SCIS2016 [USB], vol. 2A3−2, JPN6019017234, 19 January 2016 (2016-01-19), JP, pages 1 - 7, ISSN: 0004033953 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020017101A (ja) * | 2018-07-26 | 2020-01-30 | Kddi株式会社 | 匿名化装置、匿名化方法及び匿名化プログラム |
KR102055864B1 (ko) * | 2019-05-08 | 2019-12-13 | 서강대학교 산학협력단 | 차분 프라이버시를 적용한 시간 간격 데이터 공개 방법 |
WO2022079905A1 (ja) * | 2020-10-16 | 2022-04-21 | 日本電信電話株式会社 | データ集約装置、データ集約システム、データ集約方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6532849B2 (ja) | 2019-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Charlin et al. | Dynamic poisson factorization | |
Ponomareva et al. | How to dp-fy ml: A practical guide to machine learning with differential privacy | |
Stafford | Crossed and nested mixed‐effects approaches for enhanced model development and removal of the ergodic assumption in empirical ground‐motion models | |
Fong et al. | Privacy preserving decision tree learning using unrealized data sets | |
US11106790B2 (en) | Dimensionality reduction of computer programs | |
Ahmed et al. | Defining big data and measuring its associated trends in the field of information and library management | |
US8862662B2 (en) | Determination of latent interactions in social networks | |
de Araujo et al. | Tensorcast: Forecasting with context using coupled tensors (best paper award) | |
Slavković et al. | Synthetic two-way contingency tables that preserve conditional frequencies | |
JP2018055057A (ja) | データ撹乱装置、方法及びプログラム | |
Fang et al. | Improved Bounded Matrix Completion for Large-Scale Recommender Systems. | |
Albarghouthi et al. | Quantifying program bias | |
Jungers et al. | Overlap-free words and spectra of matrices | |
Gunawan | Classification of privacy preserving data mining algorithms: a review | |
Javid et al. | Privacy preserving classification using 4-dimensional rotation transformation | |
Kiouach et al. | Stationary distribution and dynamic behaviour of a stochastic SIVR epidemic model with imperfect vaccine | |
Kang et al. | Polynomial constraints in causal Bayesian networks | |
Yadav et al. | Privacy preserving data mining with abridge time using vertical partition decision tree | |
Hewage et al. | Optimizing the trade-off between classification accuracy and data privacy in the area of data stream mining | |
JP7158175B2 (ja) | 情報処理装置、システム、情報処理方法及びプログラム | |
Chesneau et al. | Estimation of a cumulative distribution function under interval censoring “case 1” via warped wavelets | |
JP6532829B2 (ja) | 撹乱データ再構築誤差推定装置、撹乱データ再構築誤差推定方法、プログラム | |
JP6486865B2 (ja) | データ撹乱装置、データ撹乱方法、データ撹乱プログラム | |
Fraser et al. | The linear Lasso: A location model approach | |
JP6978385B2 (ja) | 匿名化装置、匿名化方法及び匿名化プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180903 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190521 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6532849 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |