JP5416614B2 - 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム - Google Patents
公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム Download PDFInfo
- Publication number
- JP5416614B2 JP5416614B2 JP2010033945A JP2010033945A JP5416614B2 JP 5416614 B2 JP5416614 B2 JP 5416614B2 JP 2010033945 A JP2010033945 A JP 2010033945A JP 2010033945 A JP2010033945 A JP 2010033945A JP 5416614 B2 JP5416614 B2 JP 5416614B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- flow rate
- anonymity
- processing
- groups
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 74
- 238000012545 processing Methods 0.000 claims description 111
- 238000011156 evaluation Methods 0.000 claims description 66
- 238000003672 processing method Methods 0.000 claims description 34
- 230000008569 process Effects 0.000 description 53
- 238000005259 measurement Methods 0.000 description 11
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 208000008589 Obesity Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- LFYJSSARVMHQJB-QIXNEVBVSA-N bakuchiol Chemical compound CC(C)=CCC[C@@](C)(C=C)\C=C\C1=CC=C(O)C=C1 LFYJSSARVMHQJB-QIXNEVBVSA-N 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Landscapes
- Storage Device Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
まず、図1を用いて、本発明の前提となるk−匿名性を満足する公開情報の生成について説明する。k−匿名性を満足する公開情報の生成する公開情報のプライバシー保護装置は、図1に示すように、分類部1と、設定部2と、算出部3と、加工方法選択部4と、加工部5とから構成されている。
評価ポイント=(属性値の数)*(重み付けポイント)
ここで、(属性値の数)とは、その属性が持つ属性値の種類の数を表す。加工処理によって、この評価ポイントの減少が最小になる属性を加工処理を行う属性として選択する。
ボトムアップ処理は、ボトムアップ処理により匿名データを生成する処理であり以下の手順で行う。まず、その属性について同一データを集めてソート及びグループ化を行う。そして、各属性の属性値の数を算出する。その後、評価ポイントを算出しておく。次に、ユーザの入力した優先順位情報とk−匿名性判定からのフィードバック結果を基に、一般化を行う属性およびグループを選択する。その際には、一般化による評価ポイントの減少分を算出する。そして、選択したグループの一般化を行い、実施結果(データセット全体)をk−匿名性判定に入力する。
図2を用いて、加工処理前のデータについて、説明する。
図2は、加工処理前のデータとして医療情報を例示したものであり、本例では、データの属性として、「名前」、「年齢」、「性別」、「出身地」、「人種」、「位置情報」、「病名」等が例示されている。
図4は、本発明の概念を模式的に示している。
つまり、上記において説明したように、匿名性を施すデータに対して、k−匿名化の処理を行うことにより、いくつかのグループが形成される。これを図4に示すように、例えば、グループA、グループB、グループCのように分割する。このとき、例えば、位置情報のように頻繁にデータの更新が行われる要素が存在すると、あるグループの1人のユーザが別の場所に移動するだけでk-匿名性を満たさなくなり、データの再構築が必要となる。
上記の事項を踏まえつつ、図5から図7を用いて、本発明の第1の実施形態に係る公開情報のプライバシー保護装置について説明する。
本実施形態に係る公開情報のプライバシー保護装置は、図5に示すように、(k+n)−匿名性データ作成部10と、ボトムアップ処理部20と、(k+n)−匿名性判定部30と、流量測定部40と、匿名性データセット出力部50と、更新処理部60とから構成されている。
図6を用いて、本実施形態に係る公開情報のプライバシー保護装置の処理について説明する。
図7を用いて、ボトムアップ処理について説明する。
本発明の第2の実施形態について、図8から図10を用いて、説明する。
なお、本実施形態は、第1の実施形態において、データ加工のための処理としてボトムアップ処理を用いていた点をトップダウン処理に置き換えたものであり、その他の事項は、同一であることから、特に、トップダウン処理の詳細について説明する。
図10を用いて、トップダウン処理について説明する。
まず、各属性について同一データを集めてソート処理およびグループ化処理を行う(ステップS401)。次に、各属性の属性値の数を算出する(ステップS402)。
2;設定部
3;算出部
4;加工方法選択部
5;加工部
10;(k+n)−匿名性データ作成部
20;ボトムアップ処理部
30;(k+n)−匿名性判定部
40;流量測定部
50;匿名性データセット出力部
60;更新処理部
70;トップダウン処理部
Claims (8)
- データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置であって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う流量判定手段と、
前記流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成するデータ生成手段と、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの減少分が最小となるようなデータの加工方法によりデータを加工して、各グループの一般化を行うデータ加工手段と、
(k+n)−匿名性の判定を行う判定手段と、
を備え、
前記(k+n)−匿名性を満たし、かつ、すべてのグループにおける流量が可能な限り近い値となるようにnの値を拡張することを特徴とする公開情報のプライバシー保護装置。 - データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置であって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う流量判定手段と、
前記流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成するデータ生成手段と、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの増加分が最大となるようなデータの加工方法によりデータを加工して、各グループの一般化を行うデータ加工手段と、
(k+n)−匿名性の判定を行う判定手段と、
を備え、
前記(k+n)−匿名性を満たし、かつ、すべてのグループにおける流量が可能な限り近い値となるようにnの値を拡張することを特徴とする公開情報のプライバシー保護装置。 - 前記算出した評価ポイントの減少分が最小となるようなデータの加工方法が、ボトムアップ処理を用いて、データの加工方法であることを特徴とする請求項1に記載の公開情報のプライバシー保護装置。
- 前記算出した評価ポイントの増加分が最大となるようなデータの加工方法が、トップダウン処理を用いて、データの加工方法であることを特徴とする請求項2に記載の公開情報のプライバシー保護装置。
- データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う第1のステップと、
前記第1のステップにおいて流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成する第2のステップと、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの減少分が最小となるようなデータの加工方法によりデータを加工して、各グループの一般化を行う第3のステップと、
(k+n)−匿名性の判定を行う第4のステップと、
各グループ間のデータの移動について流量判定を行う第5のステップと、
前記第5のステップにおいて流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、nをインクリメントして、(k+n)−匿名性データ(nは0以上の正の整数)を生成し、前記第3のステップから第5のステップをすべてのグループにおける流量が可能な限り近い値となるまで実行する第6のステップと、
匿名データセットを出力する第7のステップと、
データの更新要求があったときに、更新処理を行い、匿名データを出力する第8のステップと、
を備えたことを特徴とする公開情報のプライバシー保護方法。 - データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う第1のステップと、
前記第1のステップにおいて流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成する第2のステップと、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの増加分が最大となるようなデータの加工方法によりデータを加工して、各グループの一般化を行う第3のステップと、
(k+n)−匿名性の判定を行う第4のステップと、
各グループ間のデータの移動について流量判定を行う第5のステップと、
前記第5のステップにおいて流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、nをインクリメントして、(k+n)−匿名性データ(nは0以上の正の整数)を生成し、前記第3のステップから第5のステップをすべてのグループにおける流量が可能な限り近い値となるまで実行する第6のステップと、
匿名データセットを出力する第7のステップと、
データの更新要求があったときに、更新処理を行い、匿名データを出力する第8のステップと、
を備えたことを特徴とする公開情報のプライバシー保護方法。 - データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う第1のステップと、
前記第1のステップにおいて流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成する第2のステップと、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの減少分が最小となるようなデータの加工方法によりデータを加工して、各グループの一般化を行う第3のステップと、
(k+n)−匿名性の判定を行う第4のステップと、
各グループ間のデータの移動について流量判定を行う第5のステップと、
前記第5のステップにおいて流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、nをインクリメントして、(k+n)−匿名性データ(nは0以上の正の整数)を生成し、前記第3のステップから第5のステップをすべてのグループにおける流量が可能な限り近い値となるまで実行する第6のステップと、
匿名データセットを出力する第7のステップと、
データの更新要求があったときに、更新処理を行い、匿名データを出力する第8のステップと、
をコンピュータに実行させるためのプログラム。 - データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、
k−匿名化処理で得られた各グループ間のデータの移動について流量判定を行う第1のステップと、
前記第1のステップにおいて流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、(k+n)−匿名性データ(nは0以上の正の整数)を生成する第2のステップと、
各属性の属性値に基づいて、各データの評価ポイントを算出し、該算出した評価ポイントの増加分が最大となるようなデータの加工方法によりデータを加工して、各グループの一般化を行う第3のステップと、
(k+n)−匿名性の判定を行う第4のステップと、
各グループ間のデータの移動について流量判定を行う第5のステップと、
前記第5のステップにおいて流量判定された各グループ間の流量のばらつきが規定範囲よりも大きい場合に、nをインクリメントして、(k+n)−匿名性データ(nは0以上の正の整数)を生成し、前記第3のステップから第5のステップをすべてのグループにおける流量が可能な限り近い値となるまで実行する第6のステップと、
匿名データセットを出力する第7のステップと、
データの更新要求があったときに、更新処理を行い、匿名データを出力する第8のステップと、
をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010033945A JP5416614B2 (ja) | 2010-02-18 | 2010-02-18 | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010033945A JP5416614B2 (ja) | 2010-02-18 | 2010-02-18 | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011170632A JP2011170632A (ja) | 2011-09-01 |
JP5416614B2 true JP5416614B2 (ja) | 2014-02-12 |
Family
ID=44684689
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010033945A Active JP5416614B2 (ja) | 2010-02-18 | 2010-02-18 | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5416614B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7224387B2 (ja) | 2019-03-15 | 2023-02-17 | 三菱電機株式会社 | 増幅回路 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013031997A1 (ja) * | 2011-09-02 | 2013-03-07 | 日本電気株式会社 | 匿名化装置、及び、匿名化方法 |
JPWO2014061275A1 (ja) | 2012-10-18 | 2016-09-05 | 日本電気株式会社 | 情報処理装置及び情報処理方法 |
-
2010
- 2010-02-18 JP JP2010033945A patent/JP5416614B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7224387B2 (ja) | 2019-03-15 | 2023-02-17 | 三菱電機株式会社 | 増幅回路 |
Also Published As
Publication number | Publication date |
---|---|
JP2011170632A (ja) | 2011-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10586074B2 (en) | Smart de-identification using date jittering | |
US10789363B1 (en) | Identifying and protecting against computer security threats while preserving privacy of individual client devices using condensed local differential privacy (CLDP) | |
JP5611852B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
JP5511532B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
JP6015658B2 (ja) | 匿名化装置、及び、匿名化方法 | |
JP5525864B2 (ja) | プライバシー情報評価サーバ、データ管理方法およびプログラム | |
TW202029079A (zh) | 異常群體識別方法及裝置 | |
CN109983467B (zh) | 用于匿名化数据集的系统和方法 | |
JP2015114871A (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
JP2011113285A (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
CN109426732A (zh) | 一种数据处理方法及装置 | |
JP6310345B2 (ja) | プライバシー保護装置、プライバシー保護方法及びデータベース作成方法 | |
CN105760361B (zh) | 一种语言模型建立方法及装置 | |
JP5626964B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
CN114429222A (zh) | 一种模型的训练方法、装置及设备 | |
JP5416614B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
Ahsaan et al. | Big data analytics: challenges and technologies | |
JP5366786B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
JP5839460B2 (ja) | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム | |
CN116051118B (zh) | 行为时序模型的分析方法及装置 | |
WO2023081032A1 (en) | Query-based database redaction | |
CN115545943A (zh) | 一种图谱的处理方法、装置及设备 | |
US20180129822A1 (en) | Pattern-less private data detection on data sets | |
Chien | Multiple deletion diagnostics in beta regression models | |
CN103106283B (zh) | 去重处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130806 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130813 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5416614 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |