JP2011170632A - 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム - Google Patents
公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム Download PDFInfo
- Publication number
- JP2011170632A JP2011170632A JP2010033945A JP2010033945A JP2011170632A JP 2011170632 A JP2011170632 A JP 2011170632A JP 2010033945 A JP2010033945 A JP 2010033945A JP 2010033945 A JP2010033945 A JP 2010033945A JP 2011170632 A JP2011170632 A JP 2011170632A
- Authority
- JP
- Japan
- Prior art keywords
- data
- flow rate
- anonymity
- groups
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000008569 process Effects 0.000 claims abstract description 56
- 238000012545 processing Methods 0.000 claims description 114
- 238000011156 evaluation Methods 0.000 claims description 66
- 238000003672 processing method Methods 0.000 claims description 34
- 238000005259 measurement Methods 0.000 description 11
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 208000008589 Obesity Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Landscapes
- Storage Device Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】オリジナルデータに対して、k−匿名化処理を行い、そのk−匿名化処理で得られた各グループ間のデータの移動を流量として測定し、すべてのグループで測定した流量が可能な限り近い値となるように、匿名性の範囲を拡張する。
【選択図】図6
Description
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
まず、図1を用いて、本発明の前提となるk−匿名性を満足する公開情報の生成について説明する。k−匿名性を満足する公開情報の生成する公開情報のプライバシー保護装置は、図1に示すように、分類部1と、設定部2と、算出部3と、加工方法選択部4と、加工部5とから構成されている。
評価ポイント=(属性値の数)*(重み付けポイント)
ここで、(属性値の数)とは、その属性が持つ属性値の種類の数を表す。加工処理によって、この評価ポイントの減少が最小になる属性を加工処理を行う属性として選択する。
ボトムアップ処理は、ボトムアップ処理により匿名データを生成する処理であり以下の手順で行う。まず、その属性について同一データを集めてソート及びグループ化を行う。そして、各属性の属性値の数を算出する。その後、評価ポイントを算出しておく。次に、ユーザの入力した優先順位情報とk−匿名性判定からのフィードバック結果を基に、一般化を行う属性およびグループを選択する。その際には、一般化による評価ポイントの減少分を算出する。そして、選択したグループの一般化を行い、実施結果(データセット全体)をk−匿名性判定に入力する。
図2を用いて、加工処理前のデータについて、説明する。
図2は、加工処理前のデータとして医療情報を例示したものであり、本例では、データの属性として、「名前」、「年齢」、「性別」、「出身地」、「人種」、「位置情報」、「病名」等が例示されている。
図4は、本発明の概念を模式的に示している。
つまり、上記において説明したように、匿名性を施すデータに対して、k−匿名化の処理を行うことにより、いくつかのグループが形成される。これを図4に示すように、例えば、グループA、グループB、グループCのように分割する。このとき、例えば、位置情報のように頻繁にデータの更新が行われる要素が存在すると、あるグループの1人のユーザが別の場所に移動するだけでk-匿名性を満たさなくなり、データの再構築が必要となる。
上記の事項を踏まえつつ、図5から図7を用いて、本発明の第1の実施形態に係る公開情報のプライバシー保護装置について説明する。
本実施形態に係る公開情報のプライバシー保護装置は、図5に示すように、(k+n)−匿名性データ作成部10と、ボトムアップ処理部20と、(k+n)−匿名性判定部30と、流量測定部40と、匿名性データセット出力部50と、更新処理部60とから構成されている。
図6を用いて、本実施形態に係る公開情報のプライバシー保護装置の処理について説明する。
図7を用いて、ボトムアップ処理について説明する。
本発明の第2の実施形態について、図8から図10を用いて、説明する。
なお、本実施形態は、第1の実施形態において、データ加工のための処理としてボトムアップ処理を用いていた点をトップダウン処理に置き換えたものであり、その他の事項は、同一であることから、特に、トップダウン処理の詳細について説明する。
図10を用いて、トップダウン処理について説明する。
まず、各属性について同一データを集めてソート処理およびグループ化処理を行う(ステップS401)。次に、各属性の属性値の数を算出する(ステップS402)。
2;設定部
3;算出部
4;加工方法選択部
5;加工部
10;(k+n)−匿名性データ作成部
20;ボトムアップ処理部
30;(k+n)−匿名性判定部
40;流量測定部
50;匿名性データセット出力部
60;更新処理部
70;トップダウン処理部
Claims (12)
- データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置であって、
オリジナルデータに対して、k−匿名化処理を行う匿名化処理手段と、
該k−匿名化処理で得られた各グループ間のデータの移動を流量として測定する流量測定手段と、
すべてのグループで前記測定した流量が可能な限り近い値となるように、前記匿名性の範囲を拡張するデータ変更手段と、
を備えたことを特徴とする公開情報のプライバシー保護装置。 - 前記流量測定手段は、各グループについて、新たにグループに加わったレコード数V1とグループから離脱したレコード数V2とを単位時間で除して、流量v1、v2を求めることを特徴とする請求項1に記載の公開情報のプライバシー保護装置。
- 前記データ変更手段は、セキュリティ条件より定まる匿名性の範囲よりも広い範囲で匿名性の範囲を拡張することを特徴とする請求項1に記載の公開情報のプライバシー保護装置。
- データ変更手段は、前記流量が可能な限り近い値となるように、グループを結合して、前記匿名性の範囲を拡張することを特徴とする請求項1に記載の公開情報のプライバシー保護装置。
- データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置であって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う流量判定手段と、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成するデータ生成手段と、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの減少分が最小となるようなデータの加工方法によりデータを加工して、各グループの一般化を行うデータ加工手段と、
(k+n)−匿名性の判定を行う判定手段と、
を備え、
前記(k+n)−匿名性を満たし、かつ、すべてのグループにおける前記流量が可能な限り近い値となるようにnの値を拡張することを特徴とする公開情報のプライバシー保護装置。 - データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置であって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う流量判定手段と、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成するデータ生成手段と、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの増加分が最大となるようなデータの加工方法によりデータを加工して、各グループの一般化を行うデータ加工手段と、
(k+n)−匿名性の判定を行う判定手段と、
を備え、
前記(k+n)−匿名性を満たし、かつ、すべてのグループにおける前記流量が可能な限り近い値となるようにnの値を拡張することを特徴とする公開情報のプライバシー保護装置。 - 前記算出した評価ポイントの減少分が最小となるようなデータの加工方法が、ボトムアップ処理を用いて、データの加工方法であることを特徴とする請求項5に記載の公開情報のプライバシー保護装置。
- 前記算出した評価ポイントの増加分が最大となるようなデータの加工方法が、トップダウン処理を用いて、データの加工方法であることを特徴とする請求項6に記載の公開情報のプライバシー保護装置。
- データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う第1のステップと、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成する第2のステップと、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの減少分が最小となるようなデータの加工方法によりデータを加工して、各グループの一般化を行う第3のステップと、
(k+n)−匿名性の判定を行う第4のステップと、
各グループ間のデータの移動について流量判定を行う第5のステップと、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、nをインクリメントして、(k+n)−匿名性データ(nは0以上の正の整数)を生成し、前記第3のステップから第5のステップをすべてのグループにおける前記流量が可能な限り近い値となるまで実行する第6のステップと、
匿名データセットを出力する第7のステップと、
データの更新要求があったときに、更新処理を行い、匿名データを出力する第8のステップと、
を備えたことを特徴とする公開情報のプライバシー保護方法。 - データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う第1のステップと、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成する第2のステップと、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの増加分が最大となるようなデータの加工方法によりデータを加工して、各グループの一般化を行う第3のステップと、
(k+n)−匿名性の判定を行う第4のステップと、
各グループ間のデータの移動について流量判定を行う第5のステップと、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、nをインクリメントして、(k+n)−匿名性データ(nは0以上の正の整数)を生成し、前記第3のステップから第5のステップをすべてのグループにおける前記流量が可能な限り近い値となるまで実行する第6のステップと、
匿名データセットを出力する第7のステップと、
データの更新要求があったときに、更新処理を行い、匿名データを出力する第8のステップと、
を備えたことを特徴とする公開情報のプライバシー保護方法。 - データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う第1のステップと、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成する第2のステップと、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの減少分が最小となるようなデータの加工方法によりデータを加工して、各グループの一般化を行う第3のステップと、
(k+n)−匿名性の判定を行う第4のステップと、
各グループ間のデータの移動について流量判定を行う第5のステップと、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、nをインクリメントして、(k+n)−匿名性データ(nは0以上の正の整数)を生成し、前記第3のステップから第5のステップをすべてのグループにおける前記流量が可能な限り近い値となるまで実行する第6のステップと、
匿名データセットを出力する第7のステップと、
データの更新要求があったときに、更新処理を行い、匿名データを出力する第8のステップと、
をコンピュータに実行させるためのプログラム。 - データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う第1のステップと、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成する第2のステップと、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの増加分が最大となるようなデータの加工方法によりデータを加工して、各グループの一般化を行う第3のステップと、
(k+n)−匿名性の判定を行う第4のステップと、
各グループ間のデータの移動について流量判定を行う第5のステップと、
前記各グループ間の該流量のばらつきが規定範囲よりも大きい場合に、nをインクリメントして、(k+n)−匿名性データ(nは0以上の正の整数)を生成し、前記第3のステップから第5のステップをすべてのグループにおける前記流量が可能な限り近い値となるまで実行する第6のステップと、
匿名データセットを出力する第7のステップと、
データの更新要求があったときに、更新処理を行い、匿名データを出力する第8のステップと、
をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010033945A JP5416614B2 (ja) | 2010-02-18 | 2010-02-18 | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010033945A JP5416614B2 (ja) | 2010-02-18 | 2010-02-18 | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011170632A true JP2011170632A (ja) | 2011-09-01 |
JP5416614B2 JP5416614B2 (ja) | 2014-02-12 |
Family
ID=44684689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010033945A Active JP5416614B2 (ja) | 2010-02-18 | 2010-02-18 | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5416614B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013031997A1 (ja) * | 2011-09-02 | 2013-03-07 | 日本電気株式会社 | 匿名化装置、及び、匿名化方法 |
WO2014061275A1 (ja) | 2012-10-18 | 2014-04-24 | 日本電気株式会社 | 情報処理装置及び情報処理方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020188649A1 (ja) | 2019-03-15 | 2020-09-24 | 三菱電機株式会社 | 増幅回路 |
-
2010
- 2010-02-18 JP JP2010033945A patent/JP5416614B2/ja active Active
Non-Patent Citations (8)
Title |
---|
CSNG200501070004; 貴戸 秀年: '移動軌跡データベースにおける位置匿名性' 情報処理学会研究報告 Vol.2004 No.107 , 20041105, 19〜24, 社団法人情報処理学会 * |
CSNG200800995005; 佐藤 浩史: '位置情報サービスにおけるプライバシ保護の為のコンテクスト情報の希釈化' 電子情報通信学会技術研究報告 Vol.108 No.289 , 20081106, 37〜41, 社団法人電子情報通信学会 * |
CSNG200900524060; 繁富 利恵: 'プローブカーデータを用いたプライバシ保護に関する解析' マルチメディア,分散,協調とモバイル(DICOMO2009)シンポジウム論文集 情報処理学会シンポジ , 20090708, 488〜495, 社団法人情報処理学会 * |
CSNG201000073031; 山口(繁富) 利恵: '移動履歴を保持する際のk-匿名性の考え方' コンピュータセキュリティシンポジウム2009 論文集 [第二分冊] , 20091019, 社団法人情報処理学会 * |
JPN6013040296; 繁富 利恵: 'プローブカーデータを用いたプライバシ保護に関する解析' マルチメディア,分散,協調とモバイル(DICOMO2009)シンポジウム論文集 情報処理学会シンポジ , 20090708, 488〜495, 社団法人情報処理学会 * |
JPN6013040299; 山口(繁富) 利恵: '移動履歴を保持する際のk-匿名性の考え方' コンピュータセキュリティシンポジウム2009 論文集 [第二分冊] , 20091019, 社団法人情報処理学会 * |
JPN6013040300; 貴戸 秀年: '移動軌跡データベースにおける位置匿名性' 情報処理学会研究報告 Vol.2004 No.107 , 20041105, 19〜24, 社団法人情報処理学会 * |
JPN6013040301; 佐藤 浩史: '位置情報サービスにおけるプライバシ保護の為のコンテクスト情報の希釈化' 電子情報通信学会技術研究報告 Vol.108 No.289 , 20081106, 37〜41, 社団法人電子情報通信学会 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013031997A1 (ja) * | 2011-09-02 | 2013-03-07 | 日本電気株式会社 | 匿名化装置、及び、匿名化方法 |
JPWO2013031997A1 (ja) * | 2011-09-02 | 2015-03-23 | 日本電気株式会社 | 匿名化装置、及び、匿名化方法 |
WO2014061275A1 (ja) | 2012-10-18 | 2014-04-24 | 日本電気株式会社 | 情報処理装置及び情報処理方法 |
US9607174B2 (en) | 2012-10-18 | 2017-03-28 | Nec Corporation | Information processing device, information processing method and storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP5416614B2 (ja) | 2014-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5611852B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
JP5511532B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
JP5525864B2 (ja) | プライバシー情報評価サーバ、データ管理方法およびプログラム | |
JP6015658B2 (ja) | 匿名化装置、及び、匿名化方法 | |
CN109983467B (zh) | 用于匿名化数据集的系统和方法 | |
JP5452187B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
WO2017181866A1 (en) | Making graph pattern queries bounded in big graphs | |
JP2015114871A (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
US9262499B2 (en) | Context-based graphical database | |
WO2023138419A1 (zh) | 模型的训练 | |
CN109426732A (zh) | 一种数据处理方法及装置 | |
JP6310345B2 (ja) | プライバシー保護装置、プライバシー保護方法及びデータベース作成方法 | |
CN109214193B (zh) | 数据加密、机器学习模型训练方法、装置以及电子设备 | |
CN105760361B (zh) | 一种语言模型建立方法及装置 | |
JP5626964B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
JP5416614B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
WO2023081032A1 (en) | Query-based database redaction | |
Ahsaan et al. | Big data analytics: challenges and technologies | |
CN115934161A (zh) | 一种代码变更的影响分析方法、装置以及设备 | |
JP2019204246A (ja) | 学習データ作成方法及び学習データ作成装置 | |
JP6301767B2 (ja) | パーソナル情報匿名化装置 | |
JP5366786B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
JP5839460B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
CN116051118B (zh) | 行为时序模型的分析方法及装置 | |
WO2020230043A1 (en) | Feature vector feasibilty estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130813 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5416614 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |