JP2016081168A - 雑音発生装置、雑音発生方法及びプログラム - Google Patents
雑音発生装置、雑音発生方法及びプログラム Download PDFInfo
- Publication number
- JP2016081168A JP2016081168A JP2014209825A JP2014209825A JP2016081168A JP 2016081168 A JP2016081168 A JP 2016081168A JP 2014209825 A JP2014209825 A JP 2014209825A JP 2014209825 A JP2014209825 A JP 2014209825A JP 2016081168 A JP2016081168 A JP 2016081168A
- Authority
- JP
- Japan
- Prior art keywords
- data
- conversion
- perturbation
- analyzed
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
に関する。
発生させた雑音を印加して分析対象のデータを摂動させた場合であっても、当該データに十分な摂動を加えていないと、摂動後のデータから摂動前のデータを判読できてしまう場合があり、適切な秘匿性を確保することが必要とされている。
上記の問題を鑑みて、本願発明は、分析対象のデータの匿名性を確保しつつ、多変数の場合又は複数の成分の場合でも精度の高い分析結果を得ることができる雑音発生装置、雑音発生方法及びプログラムを提供する。
大量の個人データを分析することにより有益な情報を抽出しようとする場合、個人の行動履歴、購買履歴等、個人を特定する情報の漏えい対策が重要となる。
個人データにアクセスできる利用者を制限することで情報漏えいを防ぐアプローチもあるが、許可された利用者であれば個人データそのものにアクセスできるため、情報漏えいのリスクは残る。このリスクを低減する方法として、統計的な分析結果に影響を与えない範囲でデータにノイズを印加する方法がある。このアプローチによると、扱われるデータはノイズを印加したことにより匿名化されたデータであり、個人デー夕そのものが扱われることはないことから、データ漏えいのリスクを減らす効果が期待できる。
ただし、このようにノイズを印加する際に、多変数の分布に対して独立な分布のノイズを印加した場合には、元データに含まれている相関関係を表す相関係数の値が変わってしまう。要するに、多変数の各変数に対して独立にノイズを印加すると、元の各変数同士の相関関係が保存されず、相関関係について正確な解析結果を得ることができなかった。
そこで、以下に示す雑音発生装置は、分析対象のデータを構成する成分間の相関を低減する変換規則を決定する。雑音発生装置は、前記変換規則により分析対象の各データの成分間の相関を変換する。雑音発生装置は、前記変換後の各データに所定の摂動を加えるようにした。以下、雑音発生装置の一実施形態について説明する。
(雑音発生装置1の概要)
図1は、本実施形態に係る雑音発生装置1を示す構成図である。同図に示される雑音発生装置1は、原データ記憶部10、変換規則決定部20、摂動部30、及び、変換データ記憶部40を備える。
図2は、本実施形態に係る雑音発生装置1の分析対象のデータの一例を示す説明図である。この図に示されるように、分析対象のデータは、複数の成分によって構成されている。例えば、分析対象のデータはd個の成分によって構成されるデータを要素とする。ここで、分析対象のデータを纏めて、d次元のデータベクトルxk(kはn以下の自然数)として示す。なお、分析対象のデータ(データベクトルxk)の個数をn個(nは自然数)とする。ここで、分析対象のデータ(データベクトルxk)を纏めてデータ行列Xとする。このデータ行列Xは、n行として構成され、各行に対応するn個のデータベクトルxを要素に持つ。
変換規則決定部20は、共分散行列算出部21と変換行列算出部23とを備える。共分散行列算出部21は、分析対象のデータ行列Xの共分散行列Σを算出する。変換行列算出部23は、共分散行列算出部21により算出された共分散行列Σについて式(6)で定義される固有値問題を解くことによりd個の固有ベクトルaiを算出する。さらに、前記変換規則に従って、各行の要素として固有ベクトルaiを持つ変換行列Aを算出する。この変換行列Aは、dxd行列になる。
変換部31は、変換規則決定部20により決定された変換規則により分析対象の各データを変換する。本実施形態では、データ間の相関関係が低減されるような空間に変換する変換規則を用いることにより、各データの相関を変換規則に保存する。
乱数印加部33(摂動部)は、変換部31により変換された後の各データに所定の摂動を加える。各データにそれぞれ加える所定の摂動の量を決定する規則は、予め定められている。例えば、各データにそれぞれ加える所定の摂動の量は、分析対象のデータの秘匿性に応じて予め定められており、例えば、その量はPk−匿名性に応じて予め算定される。摂動の量の算定結果に応じて、乱数印加部33は、前記分析対象のデータの秘匿性を調整可能な分布特性(Laplace(ラプラス)分布)に従う摂動を付加した摂動データを生成する。
分布復元部35は、前記所定の摂動が付加されたデータの分布が前記所定の摂動を付加する前のデータの分布に近づくように、前記所定の摂動が付加されたデータを変換する。
逆変換部37は、変換規則決定部20により決定された変換規則に対応する逆変換処理をする。例えば、逆変換部37は、乱数印加部33(摂動部)によって摂動が加えられた後に分布復元部35により分布が復元されたデータに対して、前述の変換規則に対応する逆変換処理をする。
d次元のデータ行列Xが与えられたとき、分布確率がPdist(x)で与えられるLaplace分布に従ったノイズで摂動を与える操作をPk匿名化という。ここで、データ行列Xを、データベクトルxk(kはnまでの自然数)を要素とする式(1)のように定義する。なお、以下の説明において、ベクトルを示す「→」の記載を省略することがある。Laplace分布Pdist(x)は式(2)として表される指数分布を成すことが知られている。
例えば、データ行列Xの要素であるデータベクトルxについて、式(5)に示す演算式により分散共分散行列Σを計算する。
図3を参照して、雑音発生装置1における処理について説明する。同図は、本実施形態に係る雑音発生装置1における処理の手順を示すフローチャートである。
変換部31は、原データ記憶部10に記憶されている分析対象のデータに対して、変換規則に従った変換処理をする(ステップS31)。
乱数印加部33は、変換後のデータに摂動を印加する(ステップS33)。
分布復元部35は、摂動を印加した後のデータの分布を復元する(ステップS35)。
逆変換部37は、変換規則決定部20により決定された変換規則に対応する逆変換処理をして、逆変換処理後のデータを変換データ記憶部40に書き込んで記憶させる(ステップS37)。
(雑音発生装置1Aと1Bの概要)
図4は、本実施形態に係る雑音発生装置1Aと1Bを示す構成図である。前述の図1と同じ構成には、同じ符号を附す。以下、図1に示す雑音発生装置1との相違点を中心に雑音発生装置1Aと1Bについて説明する。
雑音発生装置1Aにおける変換規則決定部20Aは、原データである分析対象のデータの相関性に基づいた変換規則を算出し、分析対象のデータを構成する成分間の相関を低減する変換規則を決定する。変換規則決定部20Aは、変換規則の決定に係る構成を、変換規則決定部20(図1)の構成と同様にすることができる。変換規則決定部20Aは、決定した変換規則を摂動部30Aと、雑音発生装置1Bの摂動部30Bに供給する。
摂動データ記憶部50は、原データである分析対象のデータに所定の摂動を加えたデータを記憶させる。
摂動部30Aは、原データである分析対象のデータに所定の摂動を加える。摂動部30Aは、変換部31と乱数印加部33Aとを備える。乱数印加部33Aは、前述の乱数印加部33と同様の方法により、変換規則決定部20Aにより決定された変換規則により分析対象の各データの成分間の相関を変換し、変換した後のデータを、摂動データ記憶部50に記憶させる。
雑音発生装置1Bにおける摂動部30Bは、所定の摂動を加えた後のデータの分布を復元させて、分布を復元させた後に逆変換する。摂動部30Bは、上記の処理により、原データである分析対象のデータに所定の摂動を加えたデータを得る。
摂動部30Bは、分布復元部35Bと逆変換部37Bを備える。
分布復元部35Bは、変換データ記憶部40Bを参照して、記憶されているデータを読み出して、乱数印加部33により所定の摂動が付加されたデータを相関低減空間のデータに変換する。
逆変換部37Bは、変換規則決定部20Aにより決定された変換規則に対応する逆変換処理を、分布復元部35Bにより相関低減空間のデータに変換されたデータに対して実施する。逆変換部37Bは、上記の逆変換処理がなされたデータを変換データ記憶部40に記憶する。
図5と図6を参照して、雑音発生装置1Aと1Bにおける処理について説明する。
図5は、本実施形態に係る雑音発生装置1Aの処理の手順を示すフローチャートである。図6は、本実施形態に係る雑音発生装置1Bの処理の手順を示すフローチャートである。
変換部31は、原データ記憶部10に記憶されている分析対象のデータに対して、変換規則に従った変換処理をする(ステップS31)。
乱数印加部33は、変換後のデータに摂動を印加して、摂動を印加した後のデータを摂動データ記憶部50に記憶させる(ステップS33A)。
分布復元部35Bは、摂動データ記憶部50を参照して、雑音発生装置1Aにおいて摂動が印加された後のデータである摂動データ記憶部50に記憶されているデータを取得する。分布復元部35Bは、摂動が印加された後のデータの分布を復元する処理を実施する(ステップS35B)。
逆変換部37Bは、変換規則決定部20により決定された変換規則を変換規則決定部20の変換規則決定部20Aから取得する。逆変換部37Bは、変換規則決定部20Aから取得した変換規則に対応する逆変換処理をして、逆変換処理後のデータを変換データ記憶部40Bに書き込んで記憶させる(ステップS37B)。
なお、雑音発生装置1Aと1Bは、上記のステップS20からステップS33Aまでの処理と、ステップS35BからステップS37Bまでの処理とに分けて処理を行うことにより、分布の復元と逆変換をする前のデータを利用することが容易になる。このデータを逆変換するためには、変換規則決定部20により決定された変換規則に従って逆変換する必要があり、換言すれば、逆変換前のデータは、上記の変換規則を用いて暗号化されている状態にあるとみなすことができる。このように暗号化されたデータを配布時に利用することにより、データの秘匿性を確保しつつ、そのデータを配布することができる。
例えば、相関関係の抽出に主成分分析を使うのではなく、L1−PCA(PCA based on L1-norm maximization)を使っても良い。その場合、変換行列はNewton法などの方法を使って求めることができる。
Claims (9)
- 分析対象のデータを秘匿するためにデータに摂動を加える技術において、
分析対象のデータを構成する成分間の相関を低減する変換規則を決定する変換規則決定部と、
前記変換規則により分析対象の各データを変換する変換部と、
前記変換後の各データに所定の摂動を加える摂動部と、
を備えることを特徴とする雑音発生装置。 - 前記所定の摂動が付加されたデータの分布を復元する分布復元部と、
前記分布が復元された各データを前記変換規則に対応する逆変換処理する逆変換部と
を備えることを特徴とする請求項1に記載の雑音発生装置。 - 分析対象のデータを秘匿するためにデータに摂動を加える技術において、
所定の摂動が付加されたデータの分布を復元する分布復元部と、
分析対象のデータを構成する成分間の相関を低減する変換規則に対応する処理であって、前記変換規則に従って変換された後のデータに対する逆変換処理をする逆変換部と
を備えることを特徴とする雑音発生装置。 - 前記分布復元部は、
前記所定の摂動が付加されたデータの分布が前記所定の摂動を付加する前のデータの分布に近づくように、前記所定の摂動が付加されたデータを復元する
ことを特徴とする請求項2又は3に記載の雑音発生装置。 - 前記変換規則決定部は、
前記変換規則に従って、前記分析対象のデータを変換する変換行列を推定する
ことを特徴とする請求項1から4の何れか1項に記載の雑音発生装置。 - 前記摂動部は、
前記分析対象のデータの秘匿性を調整可能な分布特性に従う摂動を付加した摂動データを生成する
ことを特徴とする請求項1又は2に記載の雑音発生装置。 - 前記変換規則決定部は、
前記分析対象のデータに対する主成分分析の結果に従って、前記変換規則を決定する
ことを特徴とする請求項1又は2に記載の雑音発生装置。 - 分析対象のデータを秘匿するためにデータに摂動を加える雑音発生装置における雑音発生方法において、
分析対象データを構成する成分間の相関を低減する変換規則を決定するステップと、
変換規則により分析対象の各データを変換するステップと、
前記変換後の各データに所定の摂動を加えるステップと、
を含むことを特徴とする雑音発生方法。 - 分析対象のデータを秘匿するためにデータに摂動を加える雑音発生装置のコンピュータに、
分析対象データを構成する成分間の相関を低減する変換規則を決定するステップと、
変換規則により分析対象の各データを変換するステップと、
前記変換後の各データに所定の摂動を加えるステップと、
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014209825A JP6412767B2 (ja) | 2014-10-14 | 2014-10-14 | 雑音発生装置、雑音発生方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014209825A JP6412767B2 (ja) | 2014-10-14 | 2014-10-14 | 雑音発生装置、雑音発生方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016081168A true JP2016081168A (ja) | 2016-05-16 |
JP6412767B2 JP6412767B2 (ja) | 2018-10-24 |
Family
ID=55956262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014209825A Active JP6412767B2 (ja) | 2014-10-14 | 2014-10-14 | 雑音発生装置、雑音発生方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6412767B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019073913A1 (ja) * | 2017-10-13 | 2019-04-18 | 日本電信電話株式会社 | 擬似データ生成装置、その方法、及びプログラム |
US10831927B2 (en) | 2017-11-22 | 2020-11-10 | International Business Machines Corporation | Noise propagation-based data anonymization |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080205641A1 (en) * | 2007-02-26 | 2008-08-28 | International Business Machines Corporation | Preserving privacy of one-dimensional data streams using dynamic autocorrelation |
JP2010093424A (ja) * | 2008-10-06 | 2010-04-22 | Nippon Telegr & Teleph Corp <Ntt> | データ集計システム、撹乱装置、再構築装置、データ集計方法、撹乱プログラム、および再構築プログラム |
US20110064221A1 (en) * | 2009-09-11 | 2011-03-17 | Microsoft Corporation | Differential privacy preserving recommendation |
WO2012121025A1 (ja) * | 2011-03-04 | 2012-09-13 | 日本電気株式会社 | 乱数値特定装置、乱数値特定システム、および、乱数値特定方法 |
WO2012127572A1 (ja) * | 2011-03-18 | 2012-09-27 | 富士通株式会社 | 秘匿データ処理方法、プログラム及び装置 |
-
2014
- 2014-10-14 JP JP2014209825A patent/JP6412767B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080205641A1 (en) * | 2007-02-26 | 2008-08-28 | International Business Machines Corporation | Preserving privacy of one-dimensional data streams using dynamic autocorrelation |
JP2010093424A (ja) * | 2008-10-06 | 2010-04-22 | Nippon Telegr & Teleph Corp <Ntt> | データ集計システム、撹乱装置、再構築装置、データ集計方法、撹乱プログラム、および再構築プログラム |
US20110064221A1 (en) * | 2009-09-11 | 2011-03-17 | Microsoft Corporation | Differential privacy preserving recommendation |
WO2012121025A1 (ja) * | 2011-03-04 | 2012-09-13 | 日本電気株式会社 | 乱数値特定装置、乱数値特定システム、および、乱数値特定方法 |
WO2012127572A1 (ja) * | 2011-03-18 | 2012-09-27 | 富士通株式会社 | 秘匿データ処理方法、プログラム及び装置 |
Non-Patent Citations (1)
Title |
---|
青木 俊介: "摂動化を用いた多次元データに対するプライバシー保護データマイニング", 電子情報通信学会技術研究報告, vol. 114, no. 65, JPN6018018483, 22 May 2014 (2014-05-22), JP, pages 143 - 147, ISSN: 0003800450 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019073913A1 (ja) * | 2017-10-13 | 2019-04-18 | 日本電信電話株式会社 | 擬似データ生成装置、その方法、及びプログラム |
JPWO2019073913A1 (ja) * | 2017-10-13 | 2020-10-22 | 日本電信電話株式会社 | 擬似データ生成装置、その方法、及びプログラム |
US10831927B2 (en) | 2017-11-22 | 2020-11-10 | International Business Machines Corporation | Noise propagation-based data anonymization |
Also Published As
Publication number | Publication date |
---|---|
JP6412767B2 (ja) | 2018-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Woźniak | Bayesian vector autoregressions | |
Yan et al. | Model selection for Cox models with time-varying coefficients | |
Rudelson et al. | Errors-in-variables models with dependent measurements | |
Khalaf | A proposed ridge parameter to improve the least square estimator | |
Esmaeili et al. | A pseudo-spectral scheme for the approximate solution of a time-fractional diffusion equation | |
Gallagher et al. | On Weighted Portmanteau Tests for Time‐Series Goodness‐Of‐Fit | |
JP6412767B2 (ja) | 雑音発生装置、雑音発生方法及びプログラム | |
CN116438542A (zh) | 私有拆分客户端-服务器推断 | |
US20210303629A1 (en) | Clustering device, method and program | |
Chen et al. | A computational analysis for mean exit time under non-Gaussian Lévy noises | |
Frank et al. | Field dynamics inference for local and causal interactions | |
Ratkovic | Balancing within the margin: Causal effect estimation with support vector machines | |
EP3096308B1 (en) | Element replication device, element replication method, and program | |
D’Alessandro et al. | On the control of open quantum systems in the weak coupling limit | |
Kim et al. | Imputation for statistical inference with coarse data | |
Pokern et al. | Remarks on drift estimation for diffusion processes | |
Jin et al. | Optimization and testing in linear non‐Gaussian component analysis | |
Diaz-Emparanza | Numerical distribution functions for seasonal unit root tests | |
KR101135062B1 (ko) | 전력 분석 공격을 위한 신호 압축 장치 및 방법 | |
JP6486865B2 (ja) | データ撹乱装置、データ撹乱方法、データ撹乱プログラム | |
CN115461761A (zh) | 基于判定树的同态加密数据推理 | |
US20220318338A1 (en) | Secure conjugate gradient method computation system, secure computation apparatus, conjugate gradient method computation apparatus, secure conjugate gradient method computation method, conjugate gradient method computation method, and program | |
Su et al. | Improved Error Reduction and Hybrid Input Output Algorithms for Phase Retrieval by including a Sparse Dictionary Learning‐Based Inpainting Method | |
Usman et al. | A comparative study on the prediction performance methods of handling multicollineariy based on normal and uniform distributions | |
Aissaoui et al. | A second look at inference for bivariate Skellam distributions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180904 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181001 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6412767 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |