JP2016081168A - 雑音発生装置、雑音発生方法及びプログラム - Google Patents

雑音発生装置、雑音発生方法及びプログラム Download PDF

Info

Publication number
JP2016081168A
JP2016081168A JP2014209825A JP2014209825A JP2016081168A JP 2016081168 A JP2016081168 A JP 2016081168A JP 2014209825 A JP2014209825 A JP 2014209825A JP 2014209825 A JP2014209825 A JP 2014209825A JP 2016081168 A JP2016081168 A JP 2016081168A
Authority
JP
Japan
Prior art keywords
data
conversion
perturbation
analyzed
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014209825A
Other languages
English (en)
Other versions
JP6412767B2 (ja
Inventor
坂野 鋭
Hitoshi Sakano
鋭 坂野
正寿 西村
Masatoshi Nishimura
正寿 西村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Group Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2014209825A priority Critical patent/JP6412767B2/ja
Publication of JP2016081168A publication Critical patent/JP2016081168A/ja
Application granted granted Critical
Publication of JP6412767B2 publication Critical patent/JP6412767B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】分析対象データの分析精度を保証しつつ、データに摂動を加えることにより匿名性を確保できる。【解決手段】雑音発生装置は、分析対象のデータを秘匿するためにデータに摂動を加える技術において、分析対象のデータを構成する成分間の相関を低減する変換規則を決定する変換規則決定部と、前記変換規則により分析対象の各データを変換する変換部と、前記変換後の各データに所定の摂動を加える摂動部と、を備える。【選択図】図1

Description

本発明は、雑音発生装置、雑音発生方法及びプログラム
に関する。
分析対象のデータに摂動を加えることにより、当該分析対象のデータを加工して秘匿することがある。発生させた雑音によって、分析対象のデータに摂動を加える雑音発生装置の技術が知られている(例えば、特許文献1参照)。
発生させた雑音を印加して分析対象のデータを摂動させた場合であっても、当該データに十分な摂動を加えていないと、摂動後のデータから摂動前のデータを判読できてしまう場合があり、適切な秘匿性を確保することが必要とされている。
特開2013−83801号公報
しかしながら、特許文献1には、1成分のデータを対象にして、当該データのPk−匿名性を確保することが開示されているが、2成分以上のデータを対象にする構成も示唆についての記載もない。
上記の問題を鑑みて、本願発明は、分析対象のデータの匿名性を確保しつつ、多変数の場合又は複数の成分の場合でも精度の高い分析結果を得ることができる雑音発生装置、雑音発生方法及びプログラムを提供する。
[1]この発明は上述した課題を解決するためになされたものであり、本発明の第1の態様に係る雑音発生装置は、分析対象のデータを秘匿するためにデータに摂動を加える技術において、分析対象のデータを構成する成分間の相関を低減する変換規則を決定する変換規則決定部と、前記変換規則により分析対象の各データを変換する変換部と、前記変換後の各データに所定の摂動を加える摂動部と、を備えることを特徴とする。
[2]また、上記態様に係る雑音発生装置は、前記所定の摂動が付加されたデータの分布を復元する分布復元部と、前記分布が復元された各データを前記変換規則に対応する逆変換処理する逆変換部とを備えることを特徴とする。
[3]また、本発明の第2の態様に係る雑音発生装置は、分析対象のデータを秘匿するためにデータに摂動を加える技術において、所定の摂動が付加されたデータの分布を復元する分布復元部と、分析対象のデータを構成する成分間の相関を低減する変換規則に対応する処理であって、前記変換規則に従って変換された後のデータに対する逆変換処理をする逆変換部とを備えることを特徴とする。
[4]また、上記態様に係る雑音発生装置の前記分布復元部は、前記所定の摂動が付加されたデータの分布が前記所定の摂動を付加する前のデータの分布に近づくように、前記所定の摂動が付加されたデータを復元することを特徴とする。
[5]また、上記態様に係る雑音発生装置の前記変換規則決定部は、前記変換規則に従って、前記分析対象のデータを変換する変換行列を推定することを特徴とする。
[6]また、上記態様に係る雑音発生装置の前記摂動部は、前記分析対象のデータの秘匿性を調整可能な分布特性に従う摂動を付加した摂動データを生成することを特徴とする。
[7]また、上記態様に係る雑音発生装置の前記変換規則決定部は、前記分析対象のデータに対する主成分分析の結果に従って、前記変換規則を決定することを特徴とする。
[8]また、本発明の第3の態様に係る雑音発生方法は、分析対象のデータを秘匿するためにデータに摂動を加える雑音発生装置における雑音発生方法において、分析対象データを構成する成分間の相関を低減する変換規則を決定するステップと、変換規則により分析対象の各データを変換するステップと、前記変換後の各データに所定の摂動を加えるステップと、を含むことを特徴とする。
[9]また、本発明の第4の態様に係るプログラムは、分析対象のデータを秘匿するためにデータに摂動を加える雑音発生装置のコンピュータに、分析対象データを構成する成分間の相関を低減する変換規則を決定するステップと、変換規則により分析対象の各データを変換するステップと、前記変換後の各データに所定の摂動を加えるステップと、を実行させるためのプログラムである。
本発明によれば、分析対象のデータの匿名性を確保しつつ、多変数の場合又は複数の成分の場合でも精度の高い分析結果を得ることができる。
本発明の実施形態に係る雑音発生装置1を示す構成図である。 本実施形態に係る電子制御装置の構成を示す概略ブロック図である。 本実施形態に係る雑音発生装置1における処理の手順を示すフローチャートである。 第2の実施形態に係る雑音発生装置1Aと1Bを示す構成図である。 本実施形態に係る雑音発生装置1Aの処理の手順を示すフローチャートである。 本実施形態に係る雑音発生装置1Bの処理の手順を示すフローチャートである。
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
[本発明の概要]
大量の個人データを分析することにより有益な情報を抽出しようとする場合、個人の行動履歴、購買履歴等、個人を特定する情報の漏えい対策が重要となる。
個人データにアクセスできる利用者を制限することで情報漏えいを防ぐアプローチもあるが、許可された利用者であれば個人データそのものにアクセスできるため、情報漏えいのリスクは残る。このリスクを低減する方法として、統計的な分析結果に影響を与えない範囲でデータにノイズを印加する方法がある。このアプローチによると、扱われるデータはノイズを印加したことにより匿名化されたデータであり、個人デー夕そのものが扱われることはないことから、データ漏えいのリスクを減らす効果が期待できる。
ただし、このようにノイズを印加する際に、多変数の分布に対して独立な分布のノイズを印加した場合には、元データに含まれている相関関係を表す相関係数の値が変わってしまう。要するに、多変数の各変数に対して独立にノイズを印加すると、元の各変数同士の相関関係が保存されず、相関関係について正確な解析結果を得ることができなかった。
そこで、以下に示す雑音発生装置は、分析対象のデータを構成する成分間の相関を低減する変換規則を決定する。雑音発生装置は、前記変換規則により分析対象の各データの成分間の相関を変換する。雑音発生装置は、前記変換後の各データに所定の摂動を加えるようにした。以下、雑音発生装置の一実施形態について説明する。
[第1の実施形態]
(雑音発生装置1の概要)
図1は、本実施形態に係る雑音発生装置1を示す構成図である。同図に示される雑音発生装置1は、原データ記憶部10、変換規則決定部20、摂動部30、及び、変換データ記憶部40を備える。
原データ記憶部10は、原データである分析対象のデータを記憶する。
図2は、本実施形態に係る雑音発生装置1の分析対象のデータの一例を示す説明図である。この図に示されるように、分析対象のデータは、複数の成分によって構成されている。例えば、分析対象のデータはd個の成分によって構成されるデータを要素とする。ここで、分析対象のデータを纏めて、d次元のデータベクトルx(kはn以下の自然数)として示す。なお、分析対象のデータ(データベクトルx)の個数をn個(nは自然数)とする。ここで、分析対象のデータ(データベクトルx)を纏めてデータ行列Xとする。このデータ行列Xは、n行として構成され、各行に対応するn個のデータベクトルxを要素に持つ。
図1に戻り、変換データ記憶部40は、原データである分析対象のデータに所定の摂動を加えた後のデータを記憶する。
変換規則決定部20は、原データである分析対象のデータの相関性に基づいた変換規則を算出し、分析対象のデータを構成する成分間の相関を低減する変換規則を決定する。例えば、変換規則決定部20は、前記分析対象のデータに対する主成分分析の結果に従って、前記分析対象のデータを構成する成分間の相関を低減する変換規則を決定する。より具体的な一例として、変換規則決定部20がデータ行列Xの共分散行列の変軸行列(固有ベクトル)を軸とする場合を例示して、以下の説明を行う。
変換規則決定部20は、共分散行列算出部21と変換行列算出部23とを備える。共分散行列算出部21は、分析対象のデータ行列Xの共分散行列Σを算出する。変換行列算出部23は、共分散行列算出部21により算出された共分散行列Σについて式(6)で定義される固有値問題を解くことによりd個の固有ベクトルaを算出する。さらに、前記変換規則に従って、各行の要素として固有ベクトルaを持つ変換行列Aを算出する。この変換行列Aは、dxd行列になる。
摂動部30は、原データである分析対象のデータに所定の摂動を加える。摂動部30は、変換部31、乱数印加部33、分布復元部35、逆変換部37を備える。
変換部31は、変換規則決定部20により決定された変換規則により分析対象の各データを変換する。本実施形態では、データ間の相関関係が低減されるような空間に変換する変換規則を用いることにより、各データの相関を変換規則に保存する。
乱数印加部33(摂動部)は、変換部31により変換された後の各データに所定の摂動を加える。各データにそれぞれ加える所定の摂動の量を決定する規則は、予め定められている。例えば、各データにそれぞれ加える所定の摂動の量は、分析対象のデータの秘匿性に応じて予め定められており、例えば、その量はPk−匿名性に応じて予め算定される。摂動の量の算定結果に応じて、乱数印加部33は、前記分析対象のデータの秘匿性を調整可能な分布特性(Laplace(ラプラス)分布)に従う摂動を付加した摂動データを生成する。
分布復元部35は、前記所定の摂動が付加されたデータの分布が前記所定の摂動を付加する前のデータの分布に近づくように、前記所定の摂動が付加されたデータを変換する。
逆変換部37は、変換規則決定部20により決定された変換規則に対応する逆変換処理をする。例えば、逆変換部37は、乱数印加部33(摂動部)によって摂動が加えられた後に分布復元部35により分布が復元されたデータに対して、前述の変換規則に対応する逆変換処理をする。
(秘匿性を確保しつつ、元データに摂動を加える原理について)
d次元のデータ行列Xが与えられたとき、分布確率がPdist(x)で与えられるLaplace分布に従ったノイズで摂動を与える操作をPk匿名化という。ここで、データ行列Xを、データベクトルx(kはnまでの自然数)を要素とする式(1)のように定義する。なお、以下の説明において、ベクトルを示す「→」の記載を省略することがある。Laplace分布Pdist(x)は式(2)として表される指数分布を成すことが知られている。
Figure 2016081168
Figure 2016081168
上記の式(2)において、1変数の場合には、匿名性指標kとψの関係は厳密に与えられており、ψを用いることで匿名性指標であるkを制御することができる。その詳細は、参考文献(特開2013−83801号公報)を参照する。
ただし、多変数の場合又は複数の成分の場合には、変数の標本値の分布特性に依存することから、匿名性指標kとψの関係を厳密に与えることができない。例えば、式(3)に示す多変数Gauss分布PGの場合には、同式が交差項を持つ。
Figure 2016081168
一方、式(4)に示すLaplace分布の多変数版PLの場合には、同式が交差項を持たない。
Figure 2016081168
上記のような相関構造を持たない単峰性分布の分布特性に従って発生したノイズを印加して、データに摂動を与える場合、印加したノイズが、データが有している共分散構造を破壊してしまう。そのため、ノイズが印加された後のデータは、元のデータと異なる分布特性を示すという問題が生じる。
例えば、身長と体重は強い正の相関を持ち、身長が高いほど体重が重いという傾向が存在する。しかし、印加するLaplace分布に基づくノイズには、そのような傾向が無い。そのために、ノイズを多く印加すればするほど「身長が高いほど体重が重い」という正の相関が弱くなる。
そこで、上記の問題を回避するための方法として、データを構成する各要素の間の相関を低減した空間に射影することにより相関を低減(あるいは消去)したデータに対してPk匿名化を行う方法を例示する。データ間の相関を消去するために用いられる最も一般的な方法は主成分分析である。
例えば、データ行列Xの要素であるデータベクトルxについて、式(5)に示す演算式により分散共分散行列Σを計算する。
Figure 2016081168
上記の式(5)において、ベクトルμは、全てのデータベクトルxの平均値である。分散共分散行列Σの固有値問題の式(6)を解くことにより、式(7)に示す変換行列Aを得る。
Figure 2016081168
Figure 2016081168
変換行列Aを用いる式(8)により、データベクトルxをベクトルξに変換する。
Figure 2016081168
式(8)による変換により、相関関係を低減(あるいは消去)した変数のベクトルξを得る。ベクトルξ には、変数間の相関が低減されている(あるいは無い)ため、それぞれの変数を独立な1変数として扱うことができる。
このベクトルξを匿名化するためには、式(9)、(10)に示すように、それぞれの成分に対応したLaplace分布に基づくノイズを印加すればよい。
Figure 2016081168
Figure 2016081168
ノイズ印加後に得られたベクトルξdistは、その分布の状況が、元のデータの分布と異なるものとなっていることから、このままでは正確な解析が不可能である。そこで、ベクトルξdistの分布がノイズを印加する前の元のデータ分布と同様の分布に近づくように、ベクトルξdistの分布を復元させる。例えば、ベクトルξdistの分布の復元には、反復Bayes 復元法等の一般的な方法を用いることができる。復元されたデータをベクトルξと書く。
上記の式(10)に示すベクトルξdist やBayes復元により復元されたベクトルξは、データ間の相関を低減した空間に変換されているため、ベクトルξdistを構成する各データは意味を有さず、かつ、上記の処理により匿名化されており、元のデータに対比しても解釈することができない。そこで、上記の変換行列Aの逆行列A−1を用いる式(11)により、ベクトルxdistを作成して、ベクトルξやξdist、ξから各データ要素が意味を有するベクトルxの空間に戻し、これを匿名化した公開データとする。
Figure 2016081168
上記の式(11)に示すように、ベクトルxdistは、ノイズが印加されたベクトルから分布のみが復元されたベクトルξに基づいて生成されたデータになる。
(雑音発生装置1における処理の手順)
図3を参照して、雑音発生装置1における処理について説明する。同図は、本実施形態に係る雑音発生装置1における処理の手順を示すフローチャートである。
変換規則決定部20は、原データ記憶部10に記憶されている分析対象のデータの変換規則を決定する(ステップS20)。
変換部31は、原データ記憶部10に記憶されている分析対象のデータに対して、変換規則に従った変換処理をする(ステップS31)。
乱数印加部33は、変換後のデータに摂動を印加する(ステップS33)。
分布復元部35は、摂動を印加した後のデータの分布を復元する(ステップS35)。
逆変換部37は、変換規則決定部20により決定された変換規則に対応する逆変換処理をして、逆変換処理後のデータを変換データ記憶部40に書き込んで記憶させる(ステップS37)。
本実施形態に示したように、雑音発生装置1は、分析対象データに摂動を加えるが、分析精度の低下を抑えることができる。
[第2の実施形態]
(雑音発生装置1Aと1Bの概要)
図4は、本実施形態に係る雑音発生装置1Aと1Bを示す構成図である。前述の図1と同じ構成には、同じ符号を附す。以下、図1に示す雑音発生装置1との相違点を中心に雑音発生装置1Aと1Bについて説明する。
図4に示される雑音発生装置1Aは、原データ記憶部10、変換規則決定部20A、摂動部30A、及び、摂動データ記憶部50を備える。
雑音発生装置1Aにおける変換規則決定部20Aは、原データである分析対象のデータの相関性に基づいた変換規則を算出し、分析対象のデータを構成する成分間の相関を低減する変換規則を決定する。変換規則決定部20Aは、変換規則の決定に係る構成を、変換規則決定部20(図1)の構成と同様にすることができる。変換規則決定部20Aは、決定した変換規則を摂動部30Aと、雑音発生装置1Bの摂動部30Bに供給する。
摂動データ記憶部50は、原データである分析対象のデータに所定の摂動を加えたデータを記憶させる。
摂動部30Aは、原データである分析対象のデータに所定の摂動を加える。摂動部30Aは、変換部31と乱数印加部33Aとを備える。乱数印加部33Aは、前述の乱数印加部33と同様の方法により、変換規則決定部20Aにより決定された変換規則により分析対象の各データの成分間の相関を変換し、変換した後のデータを、摂動データ記憶部50に記憶させる。
同図に示される雑音発生装置1Bは、摂動部30B、及び、変換データ記憶部40を備える。
雑音発生装置1Bにおける摂動部30Bは、所定の摂動を加えた後のデータの分布を復元させて、分布を復元させた後に逆変換する。摂動部30Bは、上記の処理により、原データである分析対象のデータに所定の摂動を加えたデータを得る。
摂動部30Bは、分布復元部35Bと逆変換部37Bを備える。
分布復元部35Bは、変換データ記憶部40Bを参照して、記憶されているデータを読み出して、乱数印加部33により所定の摂動が付加されたデータを相関低減空間のデータに変換する。
逆変換部37Bは、変換規則決定部20Aにより決定された変換規則に対応する逆変換処理を、分布復元部35Bにより相関低減空間のデータに変換されたデータに対して実施する。逆変換部37Bは、上記の逆変換処理がなされたデータを変換データ記憶部40に記憶する。
(雑音発生装置1Aと1Bにおける処理の手順)
図5と図6を参照して、雑音発生装置1Aと1Bにおける処理について説明する。
図5は、本実施形態に係る雑音発生装置1Aの処理の手順を示すフローチャートである。図6は、本実施形態に係る雑音発生装置1Bの処理の手順を示すフローチャートである。
まず、図5に示されるように、雑音発生装置1Aは、分析対象のデータに所定の摂動を印加する以下の処理をする。変換規則決定部20は、原データ記憶部10に記憶されている分析対象のデータの変換規則を決定する(ステップS20)。
変換部31は、原データ記憶部10に記憶されている分析対象のデータに対して、変換規則に従った変換処理をする(ステップS31)。
乱数印加部33は、変換後のデータに摂動を印加して、摂動を印加した後のデータを摂動データ記憶部50に記憶させる(ステップS33A)。
次に、図6に示されるように、雑音発生装置1Bは、雑音発生装置1Aによって分析対象のデータに所定の摂動を印加された後のデータに対して以下の処理をする。
分布復元部35Bは、摂動データ記憶部50を参照して、雑音発生装置1Aにおいて摂動が印加された後のデータである摂動データ記憶部50に記憶されているデータを取得する。分布復元部35Bは、摂動が印加された後のデータの分布を復元する処理を実施する(ステップS35B)。
逆変換部37Bは、変換規則決定部20により決定された変換規則を変換規則決定部20の変換規則決定部20Aから取得する。逆変換部37Bは、変換規則決定部20Aから取得した変換規則に対応する逆変換処理をして、逆変換処理後のデータを変換データ記憶部40Bに書き込んで記憶させる(ステップS37B)。
本実施形態に示したように、雑音発生装置1Aと1Bは、分析対象データを、データを構成する成分間の相関を低減した空間に変換した後に摂動を加えることにより、匿名性を確保しつつ分析精度の低下を抑えることができる。
なお、雑音発生装置1Aと1Bは、上記のステップS20からステップS33Aまでの処理と、ステップS35BからステップS37Bまでの処理とに分けて処理を行うことにより、分布の復元と逆変換をする前のデータを利用することが容易になる。このデータを逆変換するためには、変換規則決定部20により決定された変換規則に従って逆変換する必要があり、換言すれば、逆変換前のデータは、上記の変換規則を用いて暗号化されている状態にあるとみなすことができる。このように暗号化されたデータを配布時に利用することにより、データの秘匿性を確保しつつ、そのデータを配布することができる。
なお、雑音発生装置1Aと1Bは、上記のステップS20からステップS33Aまでの処理と、ステップS35BからステップS37Bまでの処理とに分けて処理を行うことにより、分布の復元と逆変換をする前のデータを利用することが容易になる。このデータを逆変換するためには、変換規則決定部20により決定された変換規則に従って逆変換する必要があり、換言すれば、逆変換前のデータは、上記の変換規則を用いて暗号化されている状態にあるとみなすことができる。このように暗号化されたデータを配布時に利用することにより、データの秘匿性を確保しつつ、そのデータを配布することができる。
また、本発明の実施形態は、上述の例に限るものではなく、本発明の範囲内で様々な形態をとることができる。
例えば、相関関係の抽出に主成分分析を使うのではなく、L1−PCA(PCA based on L1-norm maximization)を使っても良い。その場合、変換行列はNewton法などの方法を使って求めることができる。
また、乱数印加部33は、摂動対象データを変換規則決定部20から直接受けるのではなく、変換規則決定部20と同様に記憶部からデータを取得することとしても良い。
また、乱数印加部33は、1つのデータ毎に逐次、当該データの摂動を行う処理を行うものとして説明したが、変換規則決定部20により決定された変換規則に従って、データ群に含まれる全データを纏めて変換し、変換された全データにノイズを印加し、ノイズを印加された全データを纏めて逆変換する、という手順に従って処理するようにしてもよい。
また、雑音発生装置1Aは、変換規則とする変換行列Aを出力することとしているが、変換行列Aを出力せずに摂動後のデータ群から求められる変換行列を、変換行列Aの代わりに用いるようにしてもよい。変数間の相関関係を低減する空間に変換した後、他の変数から独立な(他の変数に影響を与えない)性質を持つ摂動を加える場合、摂動前/後でデータ群の共分散行列から求められる変換行列は近似している。そのため、摂動後のデータ群の共分散行列から求められる変換行列を、摂動前のデータ群の共分散行列から求められる変換行列Aの代わりに用いることができる。
また、原データには、一部の要素のデータが無く、データ群における特異点になる。このような特異点は、上記の摂動を付加する前に、データが無い要素についてデータを補完するようにするとよい。例えば、一部の要素のデータが無い場合とは、問いに対する回答が無い場合、複数の測定項目のうち特定の測定項目の測定を省略した場合などがある。このような場合、相関に従って導かれる標準値や平均値などを充当して、データを補完してもよい。
なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりメッセージの表示制御を行ってもよい。ここで、「記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行する」とは、コンピュータシステムにプログラムをインストールすることを含む。ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。このように、プログラムを記憶した記録媒体は、CD−ROM等の非一過性の記録媒体であってもよい。また、記録媒体には、当該プログラムを配信するために配信サーバからアクセス可能な内部または外部に設けられた記録媒体も含まれる。配信サーバの記録媒体に記憶されるプログラムのコードは、雑音発生装置1(1A,1B)で実行可能な形式のプログラムのコードと異なるものでもよい。すなわち、配信サーバからダウンロードされて雑音発生装置1(1A、1B)で実行可能な形でインストールができるものであれば、配信サーバで記憶される形式は問わない。なお、プログラムを複数に分割し、それぞれ異なるタイミングでダウンロードした後に雑音発生装置1(1A,1B)で合体される構成や、分割されたプログラムのそれぞれを配信する配信サーバが異なっていてもよい。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
また、上述した機能の一部または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。上述した各機能は個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
1、1A、1B 雑音発生装置、10 原データ記憶部、20 変換規則決定部、30 摂動部、31 変換部、33 乱数印加部、35 分布復元部、37 逆変換部、40 変換データ記憶部

Claims (9)

  1. 分析対象のデータを秘匿するためにデータに摂動を加える技術において、
    分析対象のデータを構成する成分間の相関を低減する変換規則を決定する変換規則決定部と、
    前記変換規則により分析対象の各データを変換する変換部と、
    前記変換後の各データに所定の摂動を加える摂動部と、
    を備えることを特徴とする雑音発生装置。
  2. 前記所定の摂動が付加されたデータの分布を復元する分布復元部と、
    前記分布が復元された各データを前記変換規則に対応する逆変換処理する逆変換部と
    を備えることを特徴とする請求項1に記載の雑音発生装置。
  3. 分析対象のデータを秘匿するためにデータに摂動を加える技術において、
    所定の摂動が付加されたデータの分布を復元する分布復元部と、
    分析対象のデータを構成する成分間の相関を低減する変換規則に対応する処理であって、前記変換規則に従って変換された後のデータに対する逆変換処理をする逆変換部と
    を備えることを特徴とする雑音発生装置。
  4. 前記分布復元部は、
    前記所定の摂動が付加されたデータの分布が前記所定の摂動を付加する前のデータの分布に近づくように、前記所定の摂動が付加されたデータを復元する
    ことを特徴とする請求項2又は3に記載の雑音発生装置。
  5. 前記変換規則決定部は、
    前記変換規則に従って、前記分析対象のデータを変換する変換行列を推定する
    ことを特徴とする請求項1から4の何れか1項に記載の雑音発生装置。
  6. 前記摂動部は、
    前記分析対象のデータの秘匿性を調整可能な分布特性に従う摂動を付加した摂動データを生成する
    ことを特徴とする請求項1又は2に記載の雑音発生装置。
  7. 前記変換規則決定部は、
    前記分析対象のデータに対する主成分分析の結果に従って、前記変換規則を決定する
    ことを特徴とする請求項1又は2に記載の雑音発生装置。
  8. 分析対象のデータを秘匿するためにデータに摂動を加える雑音発生装置における雑音発生方法において、
    分析対象データを構成する成分間の相関を低減する変換規則を決定するステップと、
    変換規則により分析対象の各データを変換するステップと、
    前記変換後の各データに所定の摂動を加えるステップと、
    を含むことを特徴とする雑音発生方法。
  9. 分析対象のデータを秘匿するためにデータに摂動を加える雑音発生装置のコンピュータに、
    分析対象データを構成する成分間の相関を低減する変換規則を決定するステップと、
    変換規則により分析対象の各データを変換するステップと、
    前記変換後の各データに所定の摂動を加えるステップと、
    を実行させるためのプログラム。
JP2014209825A 2014-10-14 2014-10-14 雑音発生装置、雑音発生方法及びプログラム Active JP6412767B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014209825A JP6412767B2 (ja) 2014-10-14 2014-10-14 雑音発生装置、雑音発生方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014209825A JP6412767B2 (ja) 2014-10-14 2014-10-14 雑音発生装置、雑音発生方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016081168A true JP2016081168A (ja) 2016-05-16
JP6412767B2 JP6412767B2 (ja) 2018-10-24

Family

ID=55956262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014209825A Active JP6412767B2 (ja) 2014-10-14 2014-10-14 雑音発生装置、雑音発生方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6412767B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019073913A1 (ja) * 2017-10-13 2019-04-18 日本電信電話株式会社 擬似データ生成装置、その方法、及びプログラム
US10831927B2 (en) 2017-11-22 2020-11-10 International Business Machines Corporation Noise propagation-based data anonymization

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080205641A1 (en) * 2007-02-26 2008-08-28 International Business Machines Corporation Preserving privacy of one-dimensional data streams using dynamic autocorrelation
JP2010093424A (ja) * 2008-10-06 2010-04-22 Nippon Telegr & Teleph Corp <Ntt> データ集計システム、撹乱装置、再構築装置、データ集計方法、撹乱プログラム、および再構築プログラム
US20110064221A1 (en) * 2009-09-11 2011-03-17 Microsoft Corporation Differential privacy preserving recommendation
WO2012121025A1 (ja) * 2011-03-04 2012-09-13 日本電気株式会社 乱数値特定装置、乱数値特定システム、および、乱数値特定方法
WO2012127572A1 (ja) * 2011-03-18 2012-09-27 富士通株式会社 秘匿データ処理方法、プログラム及び装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080205641A1 (en) * 2007-02-26 2008-08-28 International Business Machines Corporation Preserving privacy of one-dimensional data streams using dynamic autocorrelation
JP2010093424A (ja) * 2008-10-06 2010-04-22 Nippon Telegr & Teleph Corp <Ntt> データ集計システム、撹乱装置、再構築装置、データ集計方法、撹乱プログラム、および再構築プログラム
US20110064221A1 (en) * 2009-09-11 2011-03-17 Microsoft Corporation Differential privacy preserving recommendation
WO2012121025A1 (ja) * 2011-03-04 2012-09-13 日本電気株式会社 乱数値特定装置、乱数値特定システム、および、乱数値特定方法
WO2012127572A1 (ja) * 2011-03-18 2012-09-27 富士通株式会社 秘匿データ処理方法、プログラム及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
青木 俊介: "摂動化を用いた多次元データに対するプライバシー保護データマイニング", 電子情報通信学会技術研究報告, vol. 114, no. 65, JPN6018018483, 22 May 2014 (2014-05-22), JP, pages 143 - 147, ISSN: 0003800450 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019073913A1 (ja) * 2017-10-13 2019-04-18 日本電信電話株式会社 擬似データ生成装置、その方法、及びプログラム
JPWO2019073913A1 (ja) * 2017-10-13 2020-10-22 日本電信電話株式会社 擬似データ生成装置、その方法、及びプログラム
US10831927B2 (en) 2017-11-22 2020-11-10 International Business Machines Corporation Noise propagation-based data anonymization

Also Published As

Publication number Publication date
JP6412767B2 (ja) 2018-10-24

Similar Documents

Publication Publication Date Title
Woźniak Bayesian vector autoregressions
Yan et al. Model selection for Cox models with time-varying coefficients
Rudelson et al. Errors-in-variables models with dependent measurements
Khalaf A proposed ridge parameter to improve the least square estimator
Esmaeili et al. A pseudo-spectral scheme for the approximate solution of a time-fractional diffusion equation
Gallagher et al. On Weighted Portmanteau Tests for Time‐Series Goodness‐Of‐Fit
JP6412767B2 (ja) 雑音発生装置、雑音発生方法及びプログラム
CN116438542A (zh) 私有拆分客户端-服务器推断
US20210303629A1 (en) Clustering device, method and program
Chen et al. A computational analysis for mean exit time under non-Gaussian Lévy noises
Frank et al. Field dynamics inference for local and causal interactions
Ratkovic Balancing within the margin: Causal effect estimation with support vector machines
EP3096308B1 (en) Element replication device, element replication method, and program
D’Alessandro et al. On the control of open quantum systems in the weak coupling limit
Kim et al. Imputation for statistical inference with coarse data
Pokern et al. Remarks on drift estimation for diffusion processes
Jin et al. Optimization and testing in linear non‐Gaussian component analysis
Diaz-Emparanza Numerical distribution functions for seasonal unit root tests
KR101135062B1 (ko) 전력 분석 공격을 위한 신호 압축 장치 및 방법
JP6486865B2 (ja) データ撹乱装置、データ撹乱方法、データ撹乱プログラム
CN115461761A (zh) 基于判定树的同态加密数据推理
US20220318338A1 (en) Secure conjugate gradient method computation system, secure computation apparatus, conjugate gradient method computation apparatus, secure conjugate gradient method computation method, conjugate gradient method computation method, and program
Su et al. Improved Error Reduction and Hybrid Input Output Algorithms for Phase Retrieval by including a Sparse Dictionary Learning‐Based Inpainting Method
Usman et al. A comparative study on the prediction performance methods of handling multicollineariy based on normal and uniform distributions
Aissaoui et al. A second look at inference for bivariate Skellam distributions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181001

R150 Certificate of patent or registration of utility model

Ref document number: 6412767

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350