JP2011113285A - 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム - Google Patents

公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム Download PDF

Info

Publication number
JP2011113285A
JP2011113285A JP2009268863A JP2009268863A JP2011113285A JP 2011113285 A JP2011113285 A JP 2011113285A JP 2009268863 A JP2009268863 A JP 2009268863A JP 2009268863 A JP2009268863 A JP 2009268863A JP 2011113285 A JP2011113285 A JP 2011113285A
Authority
JP
Japan
Prior art keywords
data
processing
information
public information
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009268863A
Other languages
English (en)
Other versions
JP5452187B2 (ja
Inventor
Shinsaku Kiyomoto
晋作 清本
Toshiaki Tanaka
俊昭 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2009268863A priority Critical patent/JP5452187B2/ja
Publication of JP2011113285A publication Critical patent/JP2011113285A/ja
Application granted granted Critical
Publication of JP5452187B2 publication Critical patent/JP5452187B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】データの加工時に各データに対して優先順位を設定し、関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持する。
【解決手段】公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定し、設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。そして、算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択し、選択された加工方法でデータの加工を行う。
【選択図】図5

Description

本発明は、医療情報などの公開情報に対するプライバシー保護装置、公開情報のプライバシー保護方法およびプログラムに関する。
従来より、多くのデータに基づいて、統計処理を行って、例えば、特定の病気にかかりやすい年代、性別、地域、人種といった情報を広く公開して、その傾向分析を行い、その対策に用いる場合がある。
ところが、データを公開する場合には、そのデータの所有者が特定されないように、プライバシーを慎重に保護する必要があるため、データの変形処理を行う必要がある。そのため、今までにも、プライバシーを保護するためのデータの変形処理に関する技術が多く開示されている(例えば、非特許文献1参照。)。
B.Fung and K.Wang and P.Yu, "Top−down specialization for information and privacy preservation"Proc of ICDE 2005 pp.205−216
しかしながら、これまでの手法においては、最適k−匿名性を満たすためにすべてのデータを平等に扱っていたが、データ利用者が求める情報が欠落してしまうという問題点があった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、データの加工時に各データに対して優先順位を設定し、関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持する公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラムを提供することを目的とする。
発明者は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
(1)本発明は、データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置であって、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する設定手段(例えば、図1の設定部2に相当)と、該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する算出手段(例えば、図1の算出部3に相当)と、該算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択する加工方法選択手段(例えば、図1の加工方法選択部4に相当)と、該選択された加工方法でデータの加工を行うデータ加工手段(例えば、図1の加工部5に相当)と、を備えたことを特徴とする公開情報のプライバシー保護装置を提案している。
この発明によれば、設定手段は、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する。算出手段は、設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。加工方法選択手段は、算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択する。データ加工手段は、選択された加工方法でデータの加工を行う。したがって、データの加工時に各データに対して優先順位を設定し、ボトムアップ処理を適用した関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止する。
(2)本発明は、(1)の公開情報のプライバシー保護装置について、前記加工方法選択手段が、ボトムアップ処理を用いて、データの加工方法を選択することを特徴とする公開情報のプライバシー保護装置を提案している。
この発明によれば、加工方法選択手段が、ボトムアップ処理を用いて、データの加工方法を選択する。つまり、ボトムアップ処理においては、各属性について同一データを集めてソート処理及びグループ化処理を行い、各属性の属性値の数を算出し、評価ポイントを算出する。そして、設定された優先順位情報(重み付け)とk−匿名性判定からに基づいて、加工処理を行う属性およびグループを選択し、加工処理による評価ポイントの減少分を算出して、選択したグループにおいて加工処理を行い、データセット全体の処理結果に基づいて、k−匿名性の判定を行うため、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止する。
(3)本発明は、(1)の公開情報のプライバシー保護装置について、前記データ加工手段は、前記設定手段において設定された優先順位(重み付け)が最も低いものからk−匿名性を満足するまで加工を行うことを特徴とする公開情報のプライバシー保護装置を提案している。
この発明によれば、データ加工手段は、設定手段において設定された優先順位(重み付け)が最も低いものからk−匿名性を満足するまで加工を行う。これにより、直接的には、ユーザとの関連性の低い複数の情報を組み合わせることによりユーザを特定することも防止することにより、データ利用者が求める情報を可能な限り保持することができる。
(4)本発明は、(1)の公開情報のプライバシー保護装置について、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)、削除すべき情報に分類する分類手段(例えば、図1の分類部1に相当)を備えたことを特徴とする公開情報のプライバシー保護装置を提案している。
この発明によれば、分類手段は、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)、削除すべき情報に分類する。したがって、ユーザを特定できるような情報を排除するとともに、情報の関連性を低くして、複数の情報を組み合わせることによりユーザを特定することも防止できる。
(5)本発明は、(4)の公開情報のプライバシー保護装置について、前記重要情報(Sensitive Information)は、加工の対象とはならず、前記削除すべき情報は、加工の際に、自動的に削除されることを特徴とする公開情報のプライバシー保護装置を提案している。
この発明によれば、重要情報(Sensitive Information)は、加工の対象とはならず、前記削除すべき情報は、加工の際に、自動的に削除される。これにより、ユーザを直接的に特定できる情報を排除してプライバシーを保護するとともに、重要な情報を公開することができる。
(6)本発明は、(1)の公開情報のプライバシー保護装置について、前記算出手段は、各属性が持つ属性値の種類の数に前記設定手段において設定された優先順位(重み付け)を乗じて前記評価ポイントを算出することを特徴とする公開情報のプライバシー保護装置を提案している。
この発明によれば、算出手段は、各属性が持つ属性値の種類の数に前記設定手段において設定された優先順位(重み付け)を乗じて前記評価ポイントを算出する。したがって、属性値の種類の数が多く、優先順位(重み付け)が高いものほど、元の情報が保持される確率が高くなる。
(7)本発明は、データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置であって、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する設定手段と、該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する算出手段と、該算出した評価ポイントの増加分が最大となるようなデータの加工方法を選択する加工方法選択手段と、該選択された加工方法でデータの加工を行うデータ加工手段と、を備えたことを特徴とする公開情報のプライバシー保護装置を提案している。
この発明によれば、設定手段は、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する。算出手段は、設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。加工方法選択手段は、算出した評価ポイントの増加分が最大となるようなデータの加工方法を選択する。データ加工手段は、選択された加工方法でデータの加工を行う。したがって、データの加工時に各データに対して優先順位を設定し、トップダウン処理を適用した関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止する。
(8)本発明は、データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する第1のステップ(例えば、図5のステップS201に相当)と、該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する第2のステップ(例えば、図5のステップS202に相当)と、該算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択する第3のステップ(例えば、図5のステップS203に相当)と、該選択された加工方法でデータの加工を行う第4のステップ(例えば、図5のステップS204に相当)と、を備えたことを特徴とする公開情報のプライバシー保護方法を提案している。
この発明によれば、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定し、設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。そして、算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択し、選択された加工方法でデータの加工を行う。したがって、データの加工時に各データに対して優先順位を設定し、関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止する。
(9)本発明は、データの加工を行うための方法を選択するボトムアップ処理方法であって、各属性について同一データを集めてソート処理及びグループ化処理を行う第1のステップ(例えば、図4のステップS101に相当)と、各属性の属性値の数を算出する第2のステップ(例えば、図4のステップS102に相当)と、評価ポイントを算出する第3のステップ(例えば、図4のステップS103に相当)と、設定された優先順位情報(重み付け)とk−匿名性判定からに基づいて、加工処理を行う属性およびグループを選択し、加工処理による評価ポイントの減少分を算出する第4のステップ(例えば、図4のステップS104に相当)と、選択したグループにおいて加工処理を行い、データセット全体の処理結果に基づいて、k−匿名性の判定を行う第5のステップ(例えば、図4のステップS105に相当)と、を備えたことを特徴とするボトムアップ処理方法を提案している。
この発明によれば、各属性について同一データを集めてソート処理及びグループ化処理を行い、各属性の属性値の数を算出し、評価ポイントを算出する。そして、設定された優先順位情報(重み付け)とk−匿名性判定からに基づいて、加工処理を行う属性およびグループを選択し、加工処理による評価ポイントの減少分を算出して、選択したグループにおいて加工処理を行い、データセット全体の処理結果に基づいて、k−匿名性の判定を行う。したがって、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止する。
(10)本発明は、データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する第1のステップと、該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する第2のステップと、該算出した評価ポイントの増加分が最大となるようなデータの加工方法を選択する第3のステップと、該選択された加工方法でデータの加工を行う第4のステップと、を備えたことを特徴とする公開情報のプライバシー保護方法を提案している。
この発明によれば、設定手段は、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する。算出手段は、設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。加工方法選択手段は、算出した評価ポイントの増加分が最大となるようなデータの加工方法を選択する。データ加工手段は、選択された加工方法でデータの加工を行う。したがって、データの加工時に各データに対して優先順位を設定し、トップダウン処理を適用した関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止する。
(11)本発明は、データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する第1のステップ(例えば、図5のステップS201に相当)と、該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する第2のステップ(例えば、図5のステップS202に相当)と、該算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択する第3のステップ(例えば、図5のステップS203に相当)と、該選択された加工方法でデータの加工を行う第4のステップ(例えば、図5のステップS204に相当)と、をコンピュータに実行させるためのプログラムを提案している。
この発明によれば、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定し、設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。そして、算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択し、選択された加工方法でデータの加工を行う。したがって、データの加工時に各データに対して優先順位を設定し、関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止する。
(12)本発明は、データの加工を行うための方法を選択するボトムアップ処理方法をコンピュータに実行させるためのプログラムであって、各属性について同一データを集めてソート処理及びグループ化処理を行う第1のステップ(例えば、図4のステップS101に相当)と、各属性の属性値の数を算出する第2のステップ(例えば、図4のステップS102に相当)と、評価ポイントを算出する第3のステップ(例えば、図4のステップS103に相当)と、設定された優先順位情報(重み付け)とk−匿名性判定からに基づいて、加工処理を行う属性およびグループを選択し、加工処理による評価ポイントの減少分を算出する第4のステップ(例えば、図4のステップS104に相当)と、選択したグループにおいて加工処理を行い、データセット全体の処理結果に基づいて、k−匿名性の判定を行う第5のステップ(例えば、図4のステップS105に相当)と、をコンピュータに実行させるためのプログラムを提案している。
この発明によれば、各属性について同一データを集めてソート処理及びグループ化処理を行い、各属性の属性値の数を算出し、評価ポイントを算出する。そして、設定された優先順位情報(重み付け)とk−匿名性判定からに基づいて、加工処理を行う属性およびグループを選択し、加工処理による評価ポイントの減少分を算出して、選択したグループにおいて加工処理を行い、データセット全体の処理結果に基づいて、k−匿名性の判定を行う。したがって、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止する。
(13)本発明は、データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する第1のステップと、該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する第2のステップと、該算出した評価ポイントの増加分が最大となるようなデータの加工方法を選択する第3のステップと、該選択された加工方法でデータの加工を行う第4のステップと、をコンピュータに実行させるためのプログラムを提案している。
この発明によれば、設定手段は、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する。算出手段は、設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。加工方法選択手段は、算出した評価ポイントの増加分が最大となるようなデータの加工方法を選択する。データ加工手段は、選択された加工方法でデータの加工を行う。したがって、データの加工時に各データに対して優先順位を設定し、トップダウン処理を適用した関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止する。
本発明によれば、データの加工時に各データに対して優先順位を設定し、関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持することができるという効果がある。
本実施形態に係る公開情報のプライバシー保護装置の構成図である。 本実施形態に係る加工処理前のデータを例示した図である。 本実施形態に係るボトムアップ処理を示したイメージ図である。 本実施形態に係る公開情報のプライバシー保護装置の処理フローである。 本実施形態に係るボトムアップ処理の処理フローである。
以下、本発明の実施形態について、図面を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<公開情報のプライバシー保護装置の構成>
図1を用いて、本実施形態に係る公開情報のプライバシー保護装置の構成について説明する。本実施形態に係る公開情報のプライバシー保護装置は、図1に示すように、分類部1と、設定部2と、算出部3と、加工方法選択部4と、加工部5とから構成されている。
分類部1は、元データをそのデータの各属性に応じて、重要情報(Sensitive Information)、準識別子(Quasi−Identifier)、削除すべき情報に分類する。なお、実際には、GUI(Graphical User Interface)等を用いて、コンピュータ上のグラフィックス表示をマウスなどでポインティングすることにより、利用者が分類を行う。なお、重要情報(Sensitive Information)に指定された属性の変更は行われない。また、削除すべき情報に指定された情報は加工処理の際に自動的に削除される。これにより、ユーザを直接的に特定できる情報を排除してプライバシーを保護するとともに、重要な情報を公開することができる。
設定部2は、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する。具体的には、各属性の重み付けは、利用者の入力により行われる。重み付けは、属性の優先順位を表わし、利用者が最も重視する属性を最上位とする。また、加工処理においては、 優先順位が最下位の属性から順に加工処理を行い、 k−匿名性を満たした段階で終了する。従って、最上位の属性ほど元の情報が保持される確率が高くなる。また、これにより、直接的には、ユーザとの関連性の低い複数の情報を組み合わせることによりユーザを特定することも防止することにより、データ利用者が求める情報を可能な限り保持することができる。利用者は、 GUI(Graphical User Interface)等を利用して各属性に対して優先順位を入力する。利用者は、各優先順位に対して、 重み付けポイント(数値)を設定する。この値は、加工処理を行う属性を選択する際に使用する。
算出部3は、設定部2において設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する。具体的には、評価ポイントは、以下の数式を用いて、算出される。
評価ポイント=(属性値の数)*(重み付けポイント)
ここで、(属性値の数)とは、その属性が持つ属性値の種類の数を表す。加工処理によって、この評価ポイントの減少が最小になる属性を加工処理を行う属性として選択する。
加工方法選択部4は、算出部3が算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択する。なお、加工方法選択部4は、ボトムアップ処理を用いている。ボトムアップ処理の詳細については、後述する。ただし、本実施形態においては、ボトムアップ処理を用いた例について説明するが、これに限らず、先行技術文献に記載されているトップダウン処理を用いてもよい。加工部5は、加工方法選択部4において選択された加工方法でデータの加工を行う。
<加工処理前のデータ>
図2を用いて、加工処理前のデータについて、説明する。
図2は、加工処理前のデータとして医療情報を例示したものであり、本例では、データの属性として、「名前」、「年齢」、「性別」、「出身地」、「人種」、「病名」等が例示されている。
本例では、女性である25歳のAが東京出身の日本人であって、肥満症という病気を持っており、男性である37歳のBが北海道出身の日本人であって、糖尿病という病気を持っており、男性である55歳のCが沖縄出身の日本人であって、高血圧症という病気を持っていることが示されている。
このうち、「名前」という属性は、個人を直接的に特定できるものであるため、「削除すべき情報」に分類される。また、「病名」という属性は、プライバシー情報であるため、「重要情報(Sensitive Information)」に分類される。さらに、「年齢」、「性別」、「出身地」、「人種」という属性は、直接的に個人を特定できる情報ではないため、「準識別子(Quasi−Identifier)」に分類され、利用者の利用目的に応じて、重み付けが行われる。
<ボトムアップ処理>
図3は、ボトムアップ処理を示したイメージ図である。この図に示すように、ボトムアップ処理は、始点から終点に至るボトムアップにより匿名データを生成する処理である。このボトムアップ処理について、図3および図4を用いて、詳細に説明する。
まず、図3に示すように、始点と終点および最適k−匿名性を満たす領域を設定し、各属性について同一データを集めてソート処理及びグループ化処理を行う(ステップS101)。次に、各属性の属性値の数を算出して、これを図3のようにプロットする(ステップS102)。
次に、評価ポイントを算出する(ステップS103)。そして、設定された優先順位情報(重み付け)とk−匿名性判定からに基づいて、加工処理を行う属性およびグループを選択し、始点から順にボトムアップし、直近の階層において複数に分岐する要素について加工処理による評価ポイントの減少分を算出する(ステップS104)。
図3を用いて具体的に説明すると、始点に対して、「A」および「B」の分岐があり、それぞれに対して、加工処理による評価ポイントの減少分を算出する。そして、加工処理による評価ポイントの減少分が最少となるものを選択する。図3の例では、これを「B」とする。「B」には、同様に、「C」、「D」、「E」の分岐があり、それぞれに対して、加工処理による評価ポイントの減少分を算出する。そして、加工処理による評価ポイントの減少分が最少となるものを選択する。図3の例では、これを「D」とする。「D」には、同様に、「F」、「G」、「H」の分岐があり、それぞれに対して、加工処理による評価ポイントの減少分を算出する。そして、加工処理による評価ポイントの減少分が最少となるものを選択する。図3の例では、これを「G」とする。「G」には、同様に、「I」、「J」、「K」の分岐があり、それぞれに対して、加工処理による評価ポイントの減少分を算出する。そして、加工処理による評価ポイントの減少分が最少となるものを選択する。図3の例では、これを「J」とする。このような処理を最適k−匿名性に至るまで実行する。
つまり、上記のように、選択したグループにおいて加工処理を行い、データセット全体の処理結果に基づいて、k−匿名性の判定を行う(ステップS105)。k−匿名性の判定では、 入力されたデータセットがk−匿名性を満たすかどうか判定し、満たす場合はデータを匿名データセット出力に受け渡す。満たさない場合、満たさなかったグループをフィードバック情報として、ステップS101に戻す。したがって、ボトムアップ処理においては、データ利用者が求める情報を可能な限り保持するとともに、データの欠落を防止することができる。
なお、トップダウン処理は、上記において説明したボトムアップ処理とは、反対の処理であって、図3に示した場合では、終点から始点に至るボトムアップにより匿名データを生成する処理である。つまり、ボトムアップ処理では、各属性に属するデータが予めいくつかのデータのかたまりとして規定されているために、上記に示した評価ポイントは、減少し、その減少分が最小のものを選択するが、トップダウン処理では、各属性に属するデータをまずひとつのかたまりとして扱い、順次、これを細分化して処理を行うため、評価ポイントは増加し、その増加分が最大のものを選択する。このような差異は、あるものの、結果としては、トップダウン処理を用いた場合においても、上記のボトムアップ処理を用いた場合と同様の効果が得られる。
<公開情報のプライバシー保護装置の処理>
図5を用いて、公開情報のプライバシー保護装置の処理について説明する。
まず、公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する(ステップS102)。設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する(ステップS102)。
そして、算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択し(ステップS103)、その選択された加工方法でデータの加工を行う(ステップS104)。
したがって、本実施形態によれば、データの加工時に各データに対して優先順位を設定し、関数を用いて変形したデータを評価することで、データ利用者が求める情報を可能な限り保持することができる。
なお、公開情報のプライバシー保護装置をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを公開情報のプライバシー保護装置に読み込ませ、実行することによって本発明の認証システムを実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されても良い。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。更に、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
1;分類部
2;設定部
3;算出部
4;加工方法選択部
5;加工部

Claims (13)

  1. データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置であって、
    公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する設定手段と、
    該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する算出手段と、
    該算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択する加工方法選択手段と、
    該選択された加工方法でデータの加工を行うデータ加工手段と、
    を備えたことを特徴とする公開情報のプライバシー保護装置。
  2. 前記加工方法選択手段が、ボトムアップ処理を用いて、データの加工方法を選択することを特徴とする請求項1に記載の公開情報のプライバシー保護装置。
  3. 前記データ加工手段は、前記設定手段において設定された優先順位(重み付け)が最も低いものからk−匿名性を満足するまで加工を行うことを特徴とする請求項1に記載の公開情報のプライバシー保護装置。
  4. データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)、削除すべき情報に分類する分類手段を備えたことを特徴とする請求項1に記載の公開情報のプライバシー保護装置。
  5. 前記重要情報(Sensitive Information)は、加工の対象とはならず、前記削除すべき情報は、加工の際に、自動的に削除されることを特徴とする請求項4に記載の公開情報のプライバシー保護装置。
  6. 前記算出手段は、各属性が持つ属性値の種類の数に前記設定手段において設定された優先順位(重み付け)を乗じて前記評価ポイントを算出することを特徴とする請求項1に記載の公開情報のプライバシー保護装置。
  7. データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置であって、
    公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する設定手段と、
    該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する算出手段と、
    該算出した評価ポイントの増加分が最大となるようなデータの加工方法を選択する加工方法選択手段と、
    該選択された加工方法でデータの加工を行うデータ加工手段と、
    を備えたことを特徴とする公開情報のプライバシー保護装置。
  8. データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、
    公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する第1のステップと、
    該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する第2のステップと、
    該算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択する第3のステップと、
    該選択された加工方法でデータの加工を行う第4のステップと、
    を備えたことを特徴とする公開情報のプライバシー保護方法。
  9. データの加工を行うための方法を選択するボトムアップ処理方法であって、
    各属性について同一データを集めてソート処理及びグループ化処理を行う第1のステップと、
    各属性の属性値の数を算出する第2のステップと、
    評価ポイントを算出する第3のステップと、
    設定された優先順位情報(重み付け)とk−匿名性判定からに基づいて、加工処理を行う属性およびグループを選択し、加工処理による評価ポイントの減少分を算出する第4のステップと、
    選択したグループにおいて加工処理を行い、データセット全体の処理結果に基づいて、k−匿名性の判定を行う第5のステップと、
    を備えたことを特徴とするボトムアップ処理方法。
  10. データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、
    公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する第1のステップと、
    該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する第2のステップと、
    該算出した評価ポイントの増加分が最大となるようなデータの加工方法を選択する第3のステップと、
    該選択された加工方法でデータの加工を行う第4のステップと、
    を備えたことを特徴とする公開情報のプライバシー保護方法。
  11. データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、
    公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する第1のステップと、
    該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する第2のステップと、
    該算出した評価ポイントの減少分が最小となるようなデータの加工方法を選択する第3のステップと、
    該選択された加工方法でデータの加工を行う第4のステップと、
    をコンピュータに実行させるためのプログラム。
  12. データの加工を行うための方法を選択するボトムアップ処理方法をコンピュータに実行させるためのプログラムであって、
    各属性について同一データを集めてソート処理及びグループ化処理を行う第1のステップと、
    各属性の属性値の数を算出する第2のステップと、
    評価ポイントを算出する第3のステップと、
    設定された優先順位情報(重み付け)とk−匿名性判定からに基づいて、加工処理を行う属性およびグループを選択し、加工処理による評価ポイントの減少分を算出する第4のステップと、
    選択したグループにおいて加工処理を行い、データセット全体の処理結果に基づいて、k−匿名性の判定を行う第5のステップと、
    をコンピュータに実行させるためのプログラム。
  13. データを加工して、公開する情報に対するプライバシーを保護するための公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、
    公開情報を利用する利用者の要求条件を考慮して、データの各属性ごとに優先順位(重み付け)を設定する第1のステップと、
    該設定された優先順位(重み付け)に基づいて、各データの評価ポイントを算出する第2のステップと、
    該算出した評価ポイントの増加分が最大となるようなデータの加工方法を選択する第3のステップと、
    該選択された加工方法でデータの加工を行う第4のステップと、
    をコンピュータに実行させるためのプログラム。
JP2009268863A 2009-11-26 2009-11-26 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム Active JP5452187B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009268863A JP5452187B2 (ja) 2009-11-26 2009-11-26 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009268863A JP5452187B2 (ja) 2009-11-26 2009-11-26 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2011113285A true JP2011113285A (ja) 2011-06-09
JP5452187B2 JP5452187B2 (ja) 2014-03-26

Family

ID=44235575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009268863A Active JP5452187B2 (ja) 2009-11-26 2009-11-26 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5452187B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013161428A (ja) * 2012-02-08 2013-08-19 Hitachi Ltd 個人情報匿名化装置および方法
WO2016002086A1 (ja) * 2014-07-04 2016-01-07 株式会社日立製作所 匿名化データ提供装置及び方法
WO2016021039A1 (ja) * 2014-08-08 2016-02-11 株式会社 日立製作所 k-匿名化処理システム及びk-匿名化処理方法
WO2016035448A1 (ja) * 2014-09-03 2016-03-10 ソニー株式会社 情報処理方法、プログラム、及び情報処理装置
KR101798378B1 (ko) * 2016-06-30 2017-11-16 주식회사 파수닷컴 유전 알고리즘에 기초한 개인정보의 비식별화 방법 및 장치
KR101798377B1 (ko) * 2016-06-30 2017-11-16 주식회사 파수닷컴 개인정보의 비식별화 방법 및 장치
WO2018004236A1 (ko) * 2016-06-30 2018-01-04 주식회사 파수닷컴 개인정보의 비식별화 방법 및 장치
KR20180060390A (ko) * 2016-11-29 2018-06-07 주식회사 파수닷컴 목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219635A (ja) * 2006-02-14 2007-08-30 Nippon Telegr & Teleph Corp <Ntt> 情報秘匿方法および個人情報管理運用装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219635A (ja) * 2006-02-14 2007-08-30 Nippon Telegr & Teleph Corp <Ntt> 情報秘匿方法および個人情報管理運用装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200701229025; 村本  俊祐  Shunsuke  MURAMOTO: 'データを極小歪曲しk-匿名性を保持したデータに変換するプライバシー保護アルゴリズム  A Privacy Protec' 日本データベース学会Letters  Vol.6  No.1  DBSJ Letters 第6巻, 20070629, 日本データベース学会  The Database Society of Japa *
JPN6013043030; 村本  俊祐  Shunsuke  MURAMOTO: 'データを極小歪曲しk-匿名性を保持したデータに変換するプライバシー保護アルゴリズム  A Privacy Protec' 日本データベース学会Letters  Vol.6  No.1  DBSJ Letters 第6巻, 20070629, 日本データベース学会  The Database Society of Japa *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013161428A (ja) * 2012-02-08 2013-08-19 Hitachi Ltd 個人情報匿名化装置および方法
WO2016002086A1 (ja) * 2014-07-04 2016-01-07 株式会社日立製作所 匿名化データ提供装置及び方法
JPWO2016002086A1 (ja) * 2014-07-04 2017-04-27 株式会社日立製作所 匿名化データ提供装置及び方法
WO2016021039A1 (ja) * 2014-08-08 2016-02-11 株式会社 日立製作所 k-匿名化処理システム及びk-匿名化処理方法
WO2016035448A1 (ja) * 2014-09-03 2016-03-10 ソニー株式会社 情報処理方法、プログラム、及び情報処理装置
KR101798378B1 (ko) * 2016-06-30 2017-11-16 주식회사 파수닷컴 유전 알고리즘에 기초한 개인정보의 비식별화 방법 및 장치
KR101798377B1 (ko) * 2016-06-30 2017-11-16 주식회사 파수닷컴 개인정보의 비식별화 방법 및 장치
WO2018004236A1 (ko) * 2016-06-30 2018-01-04 주식회사 파수닷컴 개인정보의 비식별화 방법 및 장치
CN109564616A (zh) * 2016-06-30 2019-04-02 飞索科技有限公司 个人信息去标识化方法及装置
US11354436B2 (en) 2016-06-30 2022-06-07 Fasoo.Com Co., Ltd. Method and apparatus for de-identification of personal information
KR20180060390A (ko) * 2016-11-29 2018-06-07 주식회사 파수닷컴 목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치
KR101973949B1 (ko) 2016-11-29 2019-04-30 주식회사 파수닷컴 목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치

Also Published As

Publication number Publication date
JP5452187B2 (ja) 2014-03-26

Similar Documents

Publication Publication Date Title
JP5452187B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP5511532B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP5611852B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP5525864B2 (ja) プライバシー情報評価サーバ、データ管理方法およびプログラム
US10474827B2 (en) Application recommendation method and application recommendation apparatus
JP6015658B2 (ja) 匿名化装置、及び、匿名化方法
JP5626964B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP6689283B2 (ja) 装置指紋をインターネット装置に割り当てるための方法及び機器
WO2012154348A1 (en) Generation of topic-based language models for an app search engine
US20200175426A1 (en) Data-based prediction results using decision forests
Jung et al. Malware classification using byte sequence information
US9747385B2 (en) Compression of cascading style sheet files
JP5366786B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
CN112926090B (zh) 基于差分隐私的业务分析方法及装置
US9785724B2 (en) Secondary queue for index process
JP5839460B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
US20160335249A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
US10530889B2 (en) Identifying member profiles containing disallowed content in an online social network
US9934300B2 (en) Optimal analytic workflow
JP5416614B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
US10885550B1 (en) Goods/service recommendation with data security
JP2023526809A (ja) 入力データに対して第1のニューラルネットワークを安全に使用するための方法及び第2のニューラルネットワークのパラメータを学習するための方法
JP5706805B2 (ja) 匿名データ生成装置、匿名データの生成方法およびプログラム
Kuznetsov et al. Image steganalysis using deep learning models
CN114691152B (zh) 推荐数据资源服务应用程序接口的方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130903

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131227

R150 Certificate of patent or registration of utility model

Ref document number: 5452187

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150