JP5875536B2 - 匿名化装置、匿名化方法、プログラム - Google Patents
匿名化装置、匿名化方法、プログラム Download PDFInfo
- Publication number
- JP5875536B2 JP5875536B2 JP2013007816A JP2013007816A JP5875536B2 JP 5875536 B2 JP5875536 B2 JP 5875536B2 JP 2013007816 A JP2013007816 A JP 2013007816A JP 2013007816 A JP2013007816 A JP 2013007816A JP 5875536 B2 JP5875536 B2 JP 5875536B2
- Authority
- JP
- Japan
- Prior art keywords
- anonymization
- attribute
- value
- transition
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
#τ(v)≧kのとき、
図1を参照して本発明の匿名化の対象について説明する。図1は本発明において匿名化の対象となるテーブルの例を示す図である。図1に示すように、本発明において匿名化に用いられるテーブルは、各行が一個人のデータを表し(これをレコードrと呼ぶ)、各列には各属性(例えば年齢、年収等)の値が入力されているものとする。本発明が満足するPk−匿名性というプライバシー保護指標は、プライバシーの保護度合をkというパラメータ(以下、匿名化パラメータと呼ぶ)で決めている。そのため、匿名化処理では最初にこの匿名化パラメータkが与えられるものとする。
以下、図7、図8を参照して、実施例1の一部を変形した変形例1の匿名化装置10について説明する。図7は本変形例の匿名化装置10の構成を示すブロック図である。図8は本変形例の匿名化装置10の動作を示すフローチャートである。
実施例1と同様に、テーブルの各行を一個人のデータを表すレコードr、テーブルの各列を各属性の値とし、テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとする。また、Vを属性の組み合わせの集合、すなわちΠは直積を表すとしたとき、V=Πa∈ASVaであり、その要素をvとする。同様に、匿名化テーブルのある属性a∈ASがとりうる値の集合をV′a、その具体的な値をv′aとし、V′を匿名化テーブルの属性の組み合わせの集合とし、匿名化される前の元テーブルをτ、匿名化テーブルをτ′とする。
実施例1と同様に、テーブルの属性の集合をAS、レコードの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとする。匿名化される前の元テーブルをτ、匿名化テーブルをτ′と書く。テーブルはレコードと属性値を結ぶ写像であり、例えばレコード1の属性値がAであれば、τ(1)=Aと表される。ここで、演算記号#τ(*)を
#τ(v)≧kのとき、
以下、図12、図13を参照して、実施例2の一部を変形した変形例2の匿名化装置20について説明する。図12は本変形例の匿名化装置20の構成を示すブロック図である。図13は本変形例の匿名化装置20の動作を示すフローチャートである。なお、本変形例では、実施例2に示された<前提条件>を引き続き用いる。
#τ(v)≧kのとき、
#τ(v)≧kのとき、
匿名化装置1の方式は、データ依存型維持置換撹乱方式と呼ぶべき性質を有している。匿名化装置1の方式では、テーブル全体の分布があまり保たれないが、その中の属性間の関係は保たれる。従って匿名化装置1の方式は、分析者が一つの大きな匿名化テーブルを取得し、その中の部分的な属性を使って分析する場合に有効な方式である。
Claims (7)
- テーブルの各行を一個人のデータを表すレコードr、テーブルの各列を各属性の値とし、テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとし、匿名化される前の元テーブルをτ、匿名化テーブルをτ′とし、演算記号#τ(*)を
と定義し、#τ(v)を、テーブルτにおいて属性vであるレコードの数とし、
匿名化パラメータk、元テーブルτからk個未満の属性値と対応するレコード番号の集合RL (k)と、k個未満の属性値の集合VL (k)を計算し、|RL (k)|≧kならば、⊥(reject)を出力する集合計算部と、
匿名化パラメータkと集合RL (k)から、
を満たすようなパラメータρ,c∈[0,1]を計算するパラメータ計算部と、
パラメータρ,cを用いて、遷移確率行列Aを
#τ(v)≧kのとき、
#τ(v)<kのとき、
として計算する行列計算部と、
テーブルの各属性の値を遷移確率行列を用いて遷移させるテーブル遷移部とを含み、
遷移とは、テーブルのあるレコードの属性aの値がvであったとき、遷移確率行列に基づいて定まる確率でv′に値を変更することを示す
匿名化装置。 - テーブルの各行を一個人のデータを表すレコードr、テーブルの各列を各属性の値とし、テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとし、匿名化される前の元テーブルをτ、匿名化テーブルをτ′とし、演算記号#τ(*)を
と定義し、#τ(v)を、テーブルτにおいて属性vであるレコードの数とし、
匿名化パラメータk、元テーブルτからk個未満の属性値と対応するレコード番号の集合RL (k)と、k個未満の属性値の集合VL (k)を計算し、|RL (k)|≧kならば、⊥(reject)を出力する集合計算部と、
匿名化パラメータkと集合RL (k)から、
を満たすような関数f∈[0,1],α∈[0,1],β∈[0,1]を計算する関数計算部と、
関数f,α,βを用いて、|V|×|V′|行列Aを
#τ(v)≧kのとき、
#τ(v)<kのとき、任意の[0,1]に含まれる値、ただし
を満たすように計算する行列計算部と、
テーブルの各属性の値を遷移確率行列を用いて遷移させるテーブル遷移部とを含み、
遷移とは、テーブルのあるレコードの属性aの値がvであったとき、遷移確率行列に基づいて定まる確率でv′に値を変更することを示す
匿名化装置。 - 請求項1に記載の匿名化装置であって、
α,βをパラメータρ∈[0,1]を用いて、
α=1+(1−ρ)/|V|,β=(1−ρ)/|V|とする
匿名化装置。 - 匿名化装置が実行する匿名化方法であって、
テーブルの各行を一個人のデータを表すレコードr、テーブルの各列を各属性の値とし、テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとし、匿名化される前の元テーブルをτ、匿名化テーブルをτ′とし、演算記号#τ(*)を
と定義し、#τ(v)を、テーブルτのうち属性値がvであるレコードの数とし、
前記匿名化装置は、
匿名化パラメータk、元テーブルτからk個未満の属性値と対応するレコード番号の集合RL (k)と、k個未満の属性値の集合VL (k)を計算し、|RL (k)|≧kならば、⊥(reject)を出力する集合計算ステップと、
匿名化パラメータkと集合RL (k)から、
を満たすようなパラメータρ,c∈[0,1]を計算するパラメータ計算ステップと、
パラメータρ,cを用いて、遷移確率行列Aを
#τ(v)≧kのとき、
#τ(v)<kのとき、
として計算する行列計算ステップと、
テーブルの各属性の値を遷移確率行列を用いて遷移させるテーブル遷移ステップとを実行し、
遷移とは、テーブルのあるレコードの属性aの値がvであったとき、遷移確率行列に基づいて定まる確率でv′に値を変更することを示す
匿名化方法。 - 匿名化装置が実行する匿名化方法であって、
テーブルの各行を一個人のデータを表すレコードr、テーブルの各列を各属性の値とし、テーブルの属性の集合をAS、レコードrの集合をRとし、ある属性a∈ASが取り得る値の集合をVa、その具体的な値をvaとし、匿名化される前の元テーブルをτ、匿名化テーブルをτ′とし、演算記号#τ(*)を
と定義し、#τ(v)を、テーブルτのうち属性値がvであるレコードの数とし、
前記匿名化装置は、
匿名化パラメータk、元テーブルτからk個未満の属性値と対応するレコード番号の集合RL (k)と、k個未満の属性値の集合VL (k)を計算し、|RL (k)|≧kならば、⊥(reject)を出力する集合計算ステップと、
匿名化パラメータkと集合RL (k)から、
を満たすような関数f∈[0,1],α∈[0,1],β∈[0,1]を計算する関数計算ステップと、
関数f,α,βを用いて、|V|×|V′|行列Aを
#τ(v)≧kのとき、
#τ(v)<kのとき、任意の[0,1]に含まれる値、ただし
を満たすように計算する行列計算ステップと、
テーブルの各属性の値を遷移確率行列を用いて遷移させるテーブル遷移ステップとを実行し、
遷移とは、テーブルのあるレコードの属性aの値がvであったとき、遷移確率行列に基づいて定まる確率でv′に値を変更することを示す
匿名化方法。 - 請求項5に記載の匿名化方法であって、
α,βをパラメータρ∈[0,1]を用いて、
α=1+(1−ρ)/|V|,β=(1−ρ)/|V|とする
匿名化方法。 - 請求項4から6の何れかに記載された匿名化方法の各ステップをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013007816A JP5875536B2 (ja) | 2013-01-18 | 2013-01-18 | 匿名化装置、匿名化方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013007816A JP5875536B2 (ja) | 2013-01-18 | 2013-01-18 | 匿名化装置、匿名化方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014137587A JP2014137587A (ja) | 2014-07-28 |
JP5875536B2 true JP5875536B2 (ja) | 2016-03-02 |
Family
ID=51415086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013007816A Active JP5875536B2 (ja) | 2013-01-18 | 2013-01-18 | 匿名化装置、匿名化方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5875536B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11163895B2 (en) | 2016-12-19 | 2021-11-02 | Mitsubishi Electric Corporation | Concealment device, data analysis device, and computer readable medium |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7724782B2 (en) * | 2007-03-20 | 2010-05-25 | George Mason Intellectual Properties, Inc. | Interval centroid based watermark |
JP5475608B2 (ja) * | 2010-10-01 | 2014-04-16 | 日本電信電話株式会社 | 撹乱システム、撹乱装置、撹乱方法及びプログラム |
-
2013
- 2013-01-18 JP JP2013007816A patent/JP5875536B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014137587A (ja) | 2014-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ficek et al. | Differential privacy in health research: A scoping review | |
Gassebner et al. | When to expect a coup d’état? An extreme bounds analysis of coup determinants | |
US9892278B2 (en) | Focused personal identifying information redaction | |
US10176340B2 (en) | Abstracted graphs from social relationship graph | |
Ghavami | Big data management: Data governance principles for big data analytics | |
JP2023542632A (ja) | 文書内の機密データの保護 | |
US11487901B2 (en) | Anonymizing relational and textual data | |
US20190318811A1 (en) | Augmenting datasets using de-identified data | |
US20220019689A1 (en) | Privacy Preserving Server-Side Personalized Content Selection | |
US10892042B2 (en) | Augmenting datasets using de-identified data and selected authorized records | |
US11093646B2 (en) | Augmenting datasets with selected de-identified data records | |
Pita et al. | A Spark-based Workflow for Probabilistic Record Linkage of Healthcare Data. | |
Sisodia et al. | Fast prediction of web user browsing behaviours using most interesting patterns | |
JP2013200659A (ja) | 属性選択装置、情報匿名化装置、属性選択方法、情報匿名化方法、属性選択プログラム、及び情報匿名化プログラム | |
Bender et al. | Privacy and confidentiality | |
WO2014006851A1 (ja) | 匿名化装置、匿名化システム、匿名化方法、及び、プログラム記録媒体 | |
Fotache et al. | Framework for the Assessment of Data Masking Performance Penalties in SQL Database Servers. Case Study: Oracle | |
US9959154B2 (en) | Identifying defunct nodes in data processing systems | |
Kaisler et al. | Big data issues and challenges | |
US10380157B2 (en) | Ranking proximity of data sources with authoritative entities in social networks | |
JP5875536B2 (ja) | 匿名化装置、匿名化方法、プログラム | |
JP5875535B2 (ja) | 匿名化装置、匿名化方法、プログラム | |
US9286349B2 (en) | Dynamic search system | |
Jones et al. | Sequential autoencoders for feature engineering and pretraining in major depressive disorder risk prediction | |
Ritchie et al. | Confidentiality and linked data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150213 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151110 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5875536 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |