JP6486865B2 - データ撹乱装置、データ撹乱方法、データ撹乱プログラム - Google Patents

データ撹乱装置、データ撹乱方法、データ撹乱プログラム Download PDF

Info

Publication number
JP6486865B2
JP6486865B2 JP2016106001A JP2016106001A JP6486865B2 JP 6486865 B2 JP6486865 B2 JP 6486865B2 JP 2016106001 A JP2016106001 A JP 2016106001A JP 2016106001 A JP2016106001 A JP 2016106001A JP 6486865 B2 JP6486865 B2 JP 6486865B2
Authority
JP
Japan
Prior art keywords
data
matrix
disturbance
normalized
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016106001A
Other languages
English (en)
Other versions
JP2017212669A (ja
Inventor
長谷川 聡
聡 長谷川
彰伍 正木
彰伍 正木
亮 菊池
亮 菊池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016106001A priority Critical patent/JP6486865B2/ja
Publication of JP2017212669A publication Critical patent/JP2017212669A/ja
Application granted granted Critical
Publication of JP6486865B2 publication Critical patent/JP6486865B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)

Description

本発明は、統計値をできるだけ維持しながらデータベースにおける個別データを確率的手法により秘匿化するデータ撹乱装置、データ撹乱方法、データ撹乱プログラムに関する。
データベースにおける個別データを確率的手法により秘匿化(「撹乱」と呼ぶ)しつつ、撹乱したデータから統計値を推定(「再構築」と呼ぶ)する技術として、非特許文献1〜4の技術がある。これら非特許文献の撹乱処理では、カテゴリなデータに対しては一定の確率で値をランダムに書き換え、数値のデータに対してはある確率分布に従うランダムなノイズを加算することで、撹乱処理を行っている(非特許文献1,2)。再構築処理では、様々な統計分析を可能とするため、元データの生成規則を表す確率密度関数の推定を行っている(非特許文献4)。また、非特許文献5には、元データが正規分布に従うことを前提に、統計的特徴を損なう恐れを低減する技術が示されている。なお、非特許文献6は、本発明の中で使用する独立成分分析に関する従来技術を示している文献である。
五十嵐大, 長谷川聡, 納竜也, 菊池亮, 千田浩司,"数値属性に適用可能な, ランダム化によりk-匿名性を保証するプライバシー保護クロス集計",コンピュータセキュリティシンポジウム2012 論文集, 第2012 巻, pp.639-646, oct 2012. 五十嵐大, 千田浩司, 高橋克巳,"k-匿名性の確率的指標への拡張とその適用例",コンピュータセキュリティシンポジウム2009 論文集, 第2009 巻, pp. 1-6, oct 2009. Rakesh Agrawal, Ramakrishnan Srikant, and Dilys Thomas, "Privacy preserving olap", In Proceedings of the 2005 ACM SIGMOD international conference on Management of data, pp.251-262, ACM, 2005. 五十嵐大, 千田浩司, 高橋克巳,"多値属性に適用可能な効率的プライバシー保護クロス集計",コンピュータセキュリティシンポジウム2008論文集, 第2008巻, pp.497-502, oct 2008. 坂野鋭,"相関関係を保存する確率的摂動匿名化法",Technical Report 2, (株)NTT データ技術開発本部, dec 2015. Aapo Hyvarinen and Erkki Oja, "Independent component analysis: algorithms and applications", Neural networks, Vol.13, No.4, pp.411-430, 2000.
しかしながら、従来技術は、撹乱処理の際、属性が増えるにつれ撹乱に要するノイズの量が増える問題があり、再構築によって得られる統計値の誤差が増える問題があった。特に、データの統計的特徴を考慮せずノイズを加えると、統計的特徴を著しく損なう恐れもあった。非特許文献5は、この課題を解決するための1つの手法であるが、正規分布を前提としているので、特定の場合のみしか適用できないという課題がある。
本発明は、できるだけデータの統計的特徴を維持できるようにデータを撹乱するデータ撹乱装置、データ撹乱方法、データ撹乱プログラムを提供することを目的とする。
Xを数値で表現される2つ以上の属性で構成された個別データを2つ以上有する元データとする。本発明のデータ撹乱装置は、データ正規化部、データ白色化部、独立成分分析部、ノイズ付与部、正規化撹乱データ生成部、撹乱データ生成部を備える。データ正規化部は、元データXの各属性を線形変換によって正規化し、正規化元データX’を得る。データ白色化部は、正規化元データX’の共分散行列Sの固有値を対角成分に持つ対角行列Λと対角行列Λに対応する固有ベクトルからなる行列Uを求め、正規化元データX’を白色化した行列Bを求める。独立成分分析部は、行列Bを独立成分分析することによって、属性間が独立である行列Cと正規直交行列Wを求める。ノイズ付与部は、行列Cの要素ごとに、行列Cの列ごとに対応付けされた分布で乱数を生成し、乱数を用いて要素を撹乱させて、撹乱行列C’を求める。正規化撹乱データ生成部は、撹乱行列C’、正規直交行列W、対角行列Λ、行列Uを用いて正規化された撹乱データである正規化撹乱データY’を求める。撹乱データ生成部は、正規化撹乱データY’に対してデータ正規化部が行った線形変換の逆変換を行って撹乱データYを求める。
本発明のデータ撹乱装置によれば、データの属性間が統計的に独立になるように変換した上で撹乱させているので、データが正規分布であることを仮定する必要がなく、かつ属性間のより複雑な関係(例えば、非線形な関係など)や高次統計量(例えば、歪度、尖度)も保持できる。
本発明のデータ撹乱装置の機能構成例を示す図。 実施例1と変形例2のデータ撹乱方法の処理フローを示す図。 変形例1のデータ撹乱方法の処理フローを示す図。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
図1に本発明のデータ撹乱装置の機能構成例を示す。図2に実施例1のデータ撹乱方法の処理フローを示す。まず、Nを元データが有する個別データの数であって2以上の整数、Mを個別データを構成する数値で表現される属性の数であって2以上の数とする。元データXは、N行M列の行列とする。なお、以下ではN行M列をN×Mのように表現する。元データXの行は個別データを示しており、列は同じ属性のデータが並んでいる。jを1以上M以下の整数、φを後述する行列Cのj番目の列に対応付けされた分布のパラメータ、Tを行列の転地を示す記号とする。データ撹乱装置100は、データ正規化部110、データ白色化部120、独立成分分析部130、ノイズ付与部140、正規化撹乱データ生成部150、撹乱データ生成部160、記録部190を備える。記録部190にはあらかじめ、元データXが記録されている。
データ正規化部110は、元データXの各属性を線形変換によって正規化し、正規化元データX’を得る(S110)。この処理では、属性ごとに、平均0、標準偏差1となるように線形変換する。なお、線形変換なので、逆変換が存在する。また、正規化元データX’もN×Mの行列である。
データ白色化部120は、正規化元データX’の共分散行列Sの固有値のすべてを対角成分として持つ対角行列Λと対角行列Λに対応する固有ベクトルからなる行列Uを求め、正規化元データX’を白色化した行列Bを求める(S120)。つまり、共分散行列S、対角行列Λ、行列Uには、
S=UΛU
の関係が成り立つ。S、U、ΛはM×Mの行列である。なお、対角行列Λは、値の大きい固有値から順番に並べた構成とすればよい。そして、行列Bを
B=X’UΛ−1/2
のように求めればよい。なお、「Λ−1/2」は対角行列Λの対角要素の平方根を取った行列の逆行列である。行列BはN×Mの行列となる。
独立成分分析部130は、行列Bを独立成分分析することによって、属性間が統計的に独立である行列Cと正規直交行列Wを求める(S130)。独立成分分析には従来技術を用いればよく、例えば非特許文献6の“6 The FastICA Algorithm”に示された方法を利用すればよい。例えば、
Figure 0006486865
のように示される式の最適化問題を解くことで、独立成分分析を行い、行列Cと正規直交行列Wを求めればよい。ただし、WW=I、Iは単位行列、ξは最適化の処理で利用するパラメータであって処理の過程で決めるパラメータ、Hは行列Cの独立性を表す指標であり、例えば行列Cのエントロピーを表す関数である。‖‖はフロベニウスノルムを示す記号である。行列Cは行列Bと同じでN×Mの行列であり、正規直交行列WはN×Nの行列である。
ノイズ付与部140は、行列Cの要素ごとに、行列Cの列ごとに対応付けされた分布で乱数を生成し、乱数を用いて要素を撹乱させて、撹乱行列C’を求める(S140)。行列Cの列ごとに対応付けされた分布としては、パラメータφによって決まる有界ラプラス分布を用いればよい。なお、元データを撹乱する処理において有界ラプラス分布を用いる例は非特許文献1に示されている。乱数を用いた要素の撹乱では、要素の値に乱数を加算すればよい。行列C’はN×Mの行列である。
パラメータφは、あらかじめ定めておいてもよいし、データ撹乱装置100がパラメータ生成部170も備え、ノイズ付与部140の処理(ステップS140)の前までにパラメータφ,…,φを生成(S170)してもよい。パラメータ生成部170が、
Figure 0006486865
が成り立つようにパラメータφ,…,φを決めることで、Pk−匿名性(撹乱後のテーブルのある人のレコードを1/k以上に確信することができない)を満たすことができる。つまり、上記の式を満たすようにパラメータφ,…,φを決めれば、撹乱後の個別データを1/k以上に確信することができなくなる。ここで、a<bであり、行列Cのj番目の列の要素が取り得る値域はa以上b以下である。aとbは、行列Cのj番目の列の要素の最小値と最大値としてもよいし、行列Cのj番目の列の要素が取り得る値の最小値と最大値としてもよい。撹乱処理を行う前から個別データの数N、行列Cのj番目の列の要素の値域、値kが分かっている(または決められる)のであれば、パラメータφはあらかじめ定めておいてもよい。いずれかが分からない(または決められない)場合は、パラメータ生成部170も備えればよい。
なお、値域がa以上b以下である属性Aの属性値νがν’に変わる条件付き確率密度は、有界ラプラス分布のパラメータφにより、
Figure 0006486865
となる。ノイズ付与部140は、行列Cのj番目の列の要素に対して、このような分布となる乱数を生成して、撹乱する。γ(ν)はラプラス分布を有界にしたことによって生じた、有界ラプラス分布を調整するための関数である。パラメータφ,…,φは公開してもよい。
正規化撹乱データ生成部150は、撹乱行列C’、正規直交行列W、対角行列Λ、行列Uを用いて正規化された撹乱データである正規化撹乱データY’を求める(S150)。より具体的には、
Y’=WC’Λ1/2
のように正規化撹乱データY’を求めればよい。ここで、「Λ1/2」は対角行列Λの対角要素の平方根を取った行列である。なお、正規化撹乱データY’はN×Mの行列となる。
撹乱データ生成部160は、正規化撹乱データY’に対してデータ正規化部110が行った線形変換の逆変換を行って撹乱データYを求める(S160)。撹乱データYはN×Mの行列であり、元データXの属性値を統計的な特性を従来よりも維持しながら、Pk−匿名性を満たすように撹乱された行列である。
データ撹乱装置100によれば、データの属性間が統計的に独立になるように変換した上で撹乱させているので、データが正規分布であることを仮定する必要がなく、かつ属性間のより複雑な関係(例えば、非線形な関係など) や高次統計量(例えば、歪度、尖度)も保持できる。
[変形例1]
変形例1のデータ撹乱装置の構成例は図1、データ撹乱方法の処理フローは図3に示す。実施例1では、データ白色化部120は、正規化元データX’の共分散行列Sの固有値のすべてを対角成分として持つ対角行列Λと対角行列Λに対応する固有ベクトルからなる行列Uを求め、正規化元データX’を白色化した行列Bを求めた(S120)。変形例1では、データ撹乱装置100はデータ白色化部120の代わりにデータ白色化部122を備え、パラメータ生成部170と固有値数決定部180も備える。また、LをM以下の整数とする。
データ白色化部122、パラメータ生成部170、固有値数決定部180は、あらかじめ定めた方法で値Lを決める。そして、正規化元データX’の共分散行列Sの固有値の大きい方のL個を対角成分として持つ対角行列Λと対角行列Λに対応する固有ベクトルからなる行列Uを求め、白色化した行列Bを求める(S180)。対角行列ΛはL×Lの行列、行列UはM×Lの行列となる。行列Bは、
B=X’UΛ−1/2
のように求めるので、行列BはN×Lの行列となる。同様に行列CもN×Lの行列となる。
次に「あらかじめ定めた方法」の具体例を説明する。まず、データ白色化部122は、正規化元データX’の共分散行列Sの固有値λ,…,λを求める。パラメータ生成部170、固有値数決定部180は、あらかじめ定めた範囲のすべてのLについて以下の処理を行う。あらかじめ定めた範囲のすべてのLとは、後述する誤差の合計E(L)が最小になる可能性のある範囲とすればよく、L=Mを含めてもよい。パラメータ生成部170は、L個のパラメータφ,…,φを生成する。固有値数決定部180は、値の大きさがL+1番目からM番目までの固有値の二乗の和に基づく元データの要素あたりの誤差e(L)と、L個の有界ラプラス分布の分散の合計に基づく元データの要素あたりの誤差e(L)の合計E(L)を求める。誤差e(L)は、
Figure 0006486865
のように求めればよい。ここで、λ,…,λは共分散行列Sの固有値であって、λのiの値が小さいほど大きな値となる順番に並んでいるとする。なお、L=Mのときは誤差e(L)=0である。また、誤差e(L)は、
Figure 0006486865
のように求めればよい。誤差の合計E(L)は、
E(L)=e(L)+e(L)
である。
固有値数決定部180は、Lを誤差の合計E(L)が最小となるLに決めればよい。そして、決まったLを用いて、データ白色化部122は、正規化元データX’の共分散行列Sの固有値の大きい方のL個を対角成分として持つ対角行列Λと対角行列Λに対応する固有ベクトルからなる行列Uを求め、正規化元データX’を白色化した行列Bを、
B=X’UΛ−1/2
のように求める。
独立成分分析部130、ノイズ付与部140、正規化撹乱データ生成部150、撹乱データ生成部160の処理は実施例1と同じであるが、変形例1では対角行列ΛはL×Lの行列、行列UはM×Lの行列、行列Cと撹乱行列C’はN×Lの行列、正規化撹乱データY’と撹乱データYはN×Mの行列である。
変形例1のデータ撹乱装置によれば、値の小さい固有値を処理に含めないことによる誤差と値の小さい固有値を処理に含めるために増加するノイズ付与による誤差とを考慮して、処理に含める固有値の数を決めている。したがって、実施例1の効果に加え、統計的な特性をさらに維持しやすい。
[変形例2]
変形例1のデータ撹乱装置では、Lを決める「あらかじめ定めた方法」として誤差の合計E(L)が最小となるLを探す処理を実行した。しかし、元データXのそれぞれの属性の特性がある程度分かっている場合、Lの数をあらかじめ定めておくことも可能である。このようにすれば、E(L)が最小となるLを選択できないかもしれないが、図3のステップS180の処理が不要になり、かつ、少なくともすべての固有値を処理に用いる実施例1よりは統計的な特性を維持できる。そこで、変形例2のデータ撹乱装置では、「あらかじめ定めた方法」として、事前に誤差の合計E(L)が最小になると予測されるLを決めておく。
変形例2のデータ撹乱装置の機能構成も図1に示す。データ撹乱方法の処理フローは図2と同じである。変形例2のデータ撹乱装置では、Lをあらかじめ定め記録部190に記録しておき、固有値数決定部180は備えない。また、データ白色化部120の代わりにデータ白色化部122を備え、データ白色化部122は、正規化元データX’の共分散行列Sの固有値の中の値の大きいL個を対角成分として持つ対角行列Λと対角行列Λに対応する固有ベクトルからなる行列Uを求め、正規化元データX’を白色化した行列Bを求める(S122)。
その他の処理は実施例1と同じであり、元データX、正規化元データX’、正規化撹乱データY’、撹乱データYはN×Mの行列である。ただし、実施例1とは、対角行列ΛがL×Lの行列、行列UがM×Lの行列、行列Cと撹乱行列C’がN×Lの行列である点は異なる。
変形例2のデータ撹乱装置によれば、値の小さい固有値を処理に含めないことによる誤差と値の小さい固有値を処理に含めるために増加するノイズ付与による誤差とを考慮して、処理に含める固有値の数を決める。したがって、実施例1の効果に加え、統計的な特性をさらに維持しやすい。また、変形例1の方が統計的な特性を維持しやすいが、計算量は変形例2の方が少なくできる。
[プログラム、記録媒体]
上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
100 データ撹乱装置 110 データ正規化部
120,122 データ白色化部 130 独立成分分析部
140 ノイズ付与部 150 正規化撹乱データ生成部
160 撹乱データ生成部 170 パラメータ生成部
180 固有値数決定部 190 記録部

Claims (8)

  1. Xを数値で表現される2つ以上の属性で構成された個別データを2つ以上有する元データとし、
    前記元データXの各属性を線形変換によって正規化し、正規化元データX’を得るデータ正規化部と、
    前記正規化元データX’の共分散行列Sの固有値を対角成分に持つ対角行列Λと対角行列Λに対応する固有ベクトルからなる行列Uを求め、前記正規化元データX’を白色化した行列Bを求めるデータ白色化部と、
    前記行列Bを独立成分分析することによって、属性間が独立である行列Cと正規直交行列Wを求める独立成分分析部と、
    行列Cの要素ごとに、行列Cの列ごとに対応付けされた分布で乱数を生成し、乱数を用いて要素を撹乱させて、撹乱行列C’を求めるノイズ付与部と、
    前記撹乱行列C’、前記正規直交行列W、前記対角行列Λ、前記行列Uを用いて正規化された撹乱データである正規化撹乱データY’を求める正規化撹乱データ生成部と、
    前記正規化撹乱データY’に対して前記線形変換の逆変換を行って撹乱データYを求める撹乱データ生成部と
    を備えたデータ撹乱装置。
  2. 請求項1記載のデータ撹乱装置であって、
    Mを前記個別データを構成する属性の数であって2以上の整数、jを1以上M以下の整数、φを行列Cのj番目の列に対応付けされた分布のパラメータ、Tを行列の転地を示す記号とし、
    前記行列Bは、B=X’UΛ−1/2 であり、
    前記行列Cの列ごとに対応付けされた分布は、前記パラメータφによって決まる有界ラプラス分布であり、
    前記正規化撹乱データY’は、Y’=WC’Λ1/2 である
    ことを特徴とするデータ撹乱装置。
  3. 請求項2記載のデータ撹乱装置であって、
    LをM以下の整数とし、
    前記対角行列Λは、あらかじめ定めた方法で決まったL個の値の大きい固有値からなるL×Lの対角行列である
    ことを特徴とするデータ撹乱装置。
  4. 請求項3記載のデータ撹乱装置であって、
    さらに、固有値数決定部も備え、
    前記固有値数決定部は、前記あらかじめ定めた方法として、前記Lを、
    値の大きさがL+1番目からM番目までの固有値の二乗の和に基づく元データの要素あたりの誤差と、L個の有界ラプラス分布の分散の合計に基づく元データの要素あたりの誤差の合計が小さくなるように決める
    ことを特徴とするデータ撹乱装置。
  5. データ正規化部、データ白色化部、独立成分分析部、ノイズ付与部、正規化撹乱データ生成部、撹乱データ生成部を備えるデータ撹乱装置によって実行されるデータ撹乱方法であって、
    Xを数値で表現される2つ以上の属性で構成された個別データを2つ以上有する元データとし、
    前記データ正規化部が、前記元データXの各属性を線形変換によって正規化し、正規化元データX’を得るデータ正規化ステップと、
    前記データ白色化部が、前記正規化元データX’の共分散行列Sの固有値を対角成分に持つ対角行列Λと対角行列Λに対応する固有ベクトルからなる行列Uを求め、前記正規化元データX’を白色化した行列Bを求めるデータ白色化ステップと、
    前記独立成分分析部が、前記行列Bを独立成分分析することによって、属性間が独立である行列Cと正規直交行列Wを求める独立成分分析ステップと、
    前記ノイズ付与部が、行列Cの要素ごとに、行列Cの列ごとに対応付けされた分布で乱数を生成し、乱数を用いて要素を撹乱させて、撹乱行列C’を求めるノイズ付与ステップと、
    前記正規化撹乱データ生成部が、前記撹乱行列C’、前記正規直交行列W、前記対角行列Λ、前記行列Uを用いて正規化された撹乱データである正規化撹乱データY’を求める正規化撹乱データ生成ステップと、
    前記撹乱データ生成部が、前記正規化撹乱データY’に対して前記線形変換の逆変換を行って撹乱データYを求める撹乱データ生成ステップと
    を実行するデータ撹乱方法。
  6. 請求項5記載のデータ撹乱方法であって、
    Mを前記個別データを構成する属性の数であって2以上の整数、jを1以上M以下の整数、φを行列Cのj番目の列に対応付けされた分布のパラメータ、Tを行列の転地を示す記号とし、
    前記行列Bは、B=X’UΛ−1/2 であり、
    前記行列Cの列ごとに対応付けされた分布は、前記パラメータφによって決まる有界ラプラス分布であり、
    前記正規化撹乱データY’は、Y’=WC’Λ1/2 である
    ことを特徴とするデータ撹乱方法。
  7. 請求項6記載のデータ撹乱方法であって、
    LをM以下の整数とし、
    対角行列Λは、あらかじめ定めた方法で決まったL個の値の大きい固有値からなるL×Lの対角行列である
    ことを特徴とするデータ撹乱方法。
  8. 請求項1から4のいずれかに記載のデータ撹乱装置としてコンピュータを機能させるデータ撹乱プログラム。
JP2016106001A 2016-05-27 2016-05-27 データ撹乱装置、データ撹乱方法、データ撹乱プログラム Active JP6486865B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016106001A JP6486865B2 (ja) 2016-05-27 2016-05-27 データ撹乱装置、データ撹乱方法、データ撹乱プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016106001A JP6486865B2 (ja) 2016-05-27 2016-05-27 データ撹乱装置、データ撹乱方法、データ撹乱プログラム

Publications (2)

Publication Number Publication Date
JP2017212669A JP2017212669A (ja) 2017-11-30
JP6486865B2 true JP6486865B2 (ja) 2019-03-20

Family

ID=60474864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016106001A Active JP6486865B2 (ja) 2016-05-27 2016-05-27 データ撹乱装置、データ撹乱方法、データ撹乱プログラム

Country Status (1)

Country Link
JP (1) JP6486865B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7509227B2 (ja) 2020-10-16 2024-07-02 日本電信電話株式会社 データ集約装置、データ集約システム、データ集約方法、及びプログラム

Also Published As

Publication number Publication date
JP2017212669A (ja) 2017-11-30

Similar Documents

Publication Publication Date Title
Yates et al. Cross validation for model selection: a review with examples from ecology
Carley et al. Response surface methodology
Gutman et al. Estimation of causal effects of binary treatments in unconfounded studies
Lam High‐dimensional covariance matrix estimation
CN109726758A (zh) 一种基于差分隐私的数据融合发布算法
Park et al. Model selection and diagnostics for joint modeling of survival and longitudinal data with crossing hazard rate functions
Gallagher et al. On Weighted Portmanteau Tests for Time‐Series Goodness‐Of‐Fit
Stein et al. What about interpolation? a radial basis function approach to classifier prediction modeling in xcsf
Li Linear operator‐based statistical analysis: A useful paradigm for big data
JP2016018379A (ja) プライバシー保護装置、方法及びプログラム
JP6445415B2 (ja) 匿名化装置、匿名化方法、プログラム
JP6486865B2 (ja) データ撹乱装置、データ撹乱方法、データ撹乱プログラム
Bienvenüe et al. Likelihood inference for multivariate extreme value distributions whose spectral vectors have known conditional distributions
KR20200122195A (ko) 비정형 트랜잭션 비식별 데이터의 품질 측정 방법 및 장치
JP2020140423A (ja) クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
WO2019073913A1 (ja) 擬似データ生成装置、その方法、及びプログラム
JP6532849B2 (ja) データ撹乱装置、方法及びプログラム
JP6412767B2 (ja) 雑音発生装置、雑音発生方法及びプログラム
JP6549076B2 (ja) 匿名化テーブル生成装置、匿名化テーブル生成方法、プログラム
Hewage et al. Optimizing the trade-off between classification accuracy and data privacy in the area of data stream mining
Zhu et al. A hybrid model for nonlinear regression with missing data using quasilinear kernel
JP6021178B2 (ja) ノイズ加算装置、ノイズ加算方法、およびプログラム
JP6532829B2 (ja) 撹乱データ再構築誤差推定装置、撹乱データ再構築誤差推定方法、プログラム
Kenett et al. Experimental Learning: Generate high information quality by comparing alternative experimental designs.
Zhang et al. Partially linear additive models with unknown link functions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180628

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190220

R150 Certificate of patent or registration of utility model

Ref document number: 6486865

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150