JP5839460B2 - 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム - Google Patents

公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム Download PDF

Info

Publication number
JP5839460B2
JP5839460B2 JP2011221532A JP2011221532A JP5839460B2 JP 5839460 B2 JP5839460 B2 JP 5839460B2 JP 2011221532 A JP2011221532 A JP 2011221532A JP 2011221532 A JP2011221532 A JP 2011221532A JP 5839460 B2 JP5839460 B2 JP 5839460B2
Authority
JP
Japan
Prior art keywords
group
attribute
quasi
identifier
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011221532A
Other languages
English (en)
Other versions
JP2013084027A (ja
Inventor
清本 晋作
晋作 清本
和英 福島
和英 福島
三宅 優
優 三宅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2011221532A priority Critical patent/JP5839460B2/ja
Publication of JP2013084027A publication Critical patent/JP2013084027A/ja
Application granted granted Critical
Publication of JP5839460B2 publication Critical patent/JP5839460B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)

Description

本発明は、医療情報などの公開情報に対するプライバシー保護装置、公開情報のプライバシー保護方法およびプログラムに関する。
従来より、多くのデータに基づいて、統計処理を行って、例えば、特定の病気にかかりやすい年代、性別、地域、人種といった情報を広く公開して、その傾向分析を行い、その対策に用いる場合がある。
ところが、データを公開する場合において、データの所有者のプライバシーを保護するため、データの変形を行う必要がある。これまでの手法においては、擬ID情報に対して最適k−匿名性を満たすための匿名化手法を提案していた(例えば、非特許文献1参照。)。
B.Fung and K.Wang and P.Yu,"Top−down specialization for information and privacy preservation"Proc of ICDE 2005 pp.205−216
しかしながら、重要情報と呼ばれる擬ID情報の属性情報についても、複数の重要情報の属性値の組合せからデータ所有者を特定できる可能性があるという問題点があった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、重要情報に対する匿名化を行う公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラムを提供することを目的とする。
発明者は、上記の課題を解決するために、以下の事項を提案している。なお、理解を容易にするために、本発明の実施形態に対応する符号を付して説明するが、これに限定されるものではない。
(1)本発明は、ユーザからのデータを公開する場合の公開情報のプライバシー保護装置であって、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する分類手段と、前記重要情報の属性値を匿名化する匿名化手段と、を備え、前記匿名化手段が、前記分類手段が、区分した表に対して、前記準識別子の属性を匿名化する初期処理手段と、該初期処理後の表から2つの前記重要情報を1組としたすべてのペアを抽出するペア抽出手段と、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出するグループ抽出手段と、該グループ抽出手段が抽出したグループにおいて、前記ペア抽出手段が抽出したペア以外の残りの前記重要情報属性値からなる表を作成する表作成手段と、を備え、該作成した表がk個以上の属性値の組み合わせをもつ場合に、すべてのグループについて条件を満たすように、前記ペア抽出手段、グループ抽出手段および表作成手段の処理を行い、変形した表を出力することを特徴とする公開情報のプライバシー保護装置を提案している。
(2)本発明は、ユーザからのデータを公開する場合の公開情報のプライバシー保護装置であって、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する分類手段と、前記重要情報の属性値を匿名化する匿名化手段と、を備え、前記匿名化手段が、前記分類手段が、区分した表に対して、前記準識別子の属性を匿名化する初期処理手段と、該初期処理後の表から2つの前記重要情報を1組としたすべてのペアを抽出するペア抽出手段と、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出するグループ抽出手段と、該グループ抽出手段が抽出したグループにおいて、前記ペア抽出手段が抽出したペア以外の残りの前記重要情報属性値からなる表を作成する表作成手段と、を備え、該作成した表がk個未満の属性値の組み合わせをもつ場合に、他のグループから前記レコードを1つ取り、最大l個の属性を削除または任意の属性値に置き換え、当該グループに所属するレコード数を数え、属性値がk個以上になるまでこの処理を繰り返し、すべてのグループについて条件を満たしたときに、変形した表を出力することを特徴とする公開情報のプライバシー保護装置を提案している。
(3)本発明は、分類手段と、初期化処理手段と、ペア抽出手段と、グループ抽出手段と、表作成手段と、条件判定手段と、を備えた公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、前記分類手段が、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する第1のステップと、前記初期化処理手段が、区分した表に対して、前記準識別子の属性を匿名化する第2のステップと、前記ペア抽出手段が、該第2のステップ後の表から2つの前記重要情報を1組としたすべてのペアを抽出する第3のステップと、前記グループ抽出手段が、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する第4のステップと、前記表作成手段は、該第4のステップにおいて抽出したグループにおいて、前記第3のステップで抽出したペア以外の残りの前記重要情報属性値からなる表を作成する第5のステップと、前記条件判定手段は、該作成した表がk個以上の属性値の組み合わせをもつ場合に、すべてのグループについて条件を満たすように、前記第3のステップ、第4のステップおよび第5のステップの処理を行い、変形した表を出力する第6のステップと、を備えたことを特徴とする公開情報のプライバシー保護方法を提案している。
(4)本発明は、分類手段と、初期化処理手段と、ペア抽出手段と、グループ抽出手段と、表作成手段と、条件判定手段と、を備えた公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、前記分類手段が、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する第1のステップと、前記初期化処理手段が、区分した表に対して、前記準識別子の属性を匿名化する第2のステップと、前記ペア抽出手段が、該第2のステップ後の表から2つの前記重要情報を1組としたすべてのペアを抽出する第3のステップと、前記グループ抽出手段が、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する第4のステップと、前記表作成手段が、該第4のステップにおいて抽出したグループにおいて、前記第3のステップで抽出したペア以外の残りの前記重要情報属性値からなる表を作成する第5のステップと、前記条件判定手段は、該作成した表がk個未満の属性値の組み合わせをもつ場合に、他のグループから前記レコードを1つ取り、最大l個の属性を削除または任意の属性値に置き換え、当該グループに所属するレコード数を数え、属性値がk個以上になるまでこの処理を繰り返し、すべてのグループについて条件を満たしたときに、変形した表を出力する第6のステップと、を備えたことを特徴とする公開情報のプライバシー保護方法を提案している。
(5)本発明は、分類手段と、初期化処理手段と、ペア抽出手段と、グループ抽出手段と、表作成手段と、条件判定手段と、を備えた公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、前記分類手段が、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する第1のステップと、前記初期化処理手段が、区分した表に対して、前記準識別子の属性を匿名化する第2のステップと、前記ペア抽出手段が、該第2のステップ後の表から2つの前記重要情報を1組としたすべてのペアを抽出する第3のステップと、前記グループ抽出手段が、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する第4のステップと、前記表作成手段が、該第4のステップにおいて抽出したグループにおいて、前記第3のステップで抽出したペア以外の残りの前記重要情報属性値からなる表を作成する第5のステップと、前記条件判定手段は、k個以上の属性値の組み合わせをもつ場合に、すべてのグループについて条件を満たすように、前記第3のステップ、第4のステップおよび第5のステップの処理を行い、変形した表を出力する第6のステップと、をコンピュータに実行させるためのプログラムを提案している。
(6)本発明は、分類手段と、初期化処理手段と、ペア抽出手段と、グループ抽出手段と、表作成手段と、条件判定手段と、を備えた公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、前記分類手段が、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する第1のステップと、前記初期化処理手段が、区分した表に対して、前記準識別子の属性を匿名化する第2のステップと、前記ペア抽出手段が、該第2のステップ後の表から2つの前記重要情報を1組としたすべてのペアを抽出する第3のステップと、前記グループ抽出手段が、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する第4のステップと、前記表作成手段が、該第4のステップにおいて抽出したグループにおいて、前記第3のステップで抽出したペア以外の残りの前記重要情報属性値からなる表を作成する第5のステップと、前記条件判定手段は、該作成した表がk個未満の属性値の組み合わせをもつ場合に、他のグループから前記レコードを1つ取り、最大l個の属性を削除または任意の属性値に置き換え、当該グループに所属するレコード数を数え、属性値がk個以上になるまでこの処理を繰り返し、すべてのグループについて条件を満たしたときに、変形した表を出力する第6のステップと、をコンピュータに実行させるためのプログラムを提案している。
本発明によれば、利用者の要求条件を考慮した公開データの作成が可能となるという効果がある。また、従来よりも最適化されたデータを得ることができるという効果がある。
本発明に係る公開情報のプライバシー保護装置の構成図である。 本発明の第1の実施形態に係る匿名化部の構成を示した図である。 本発明の第1の実施形態に係る初期化処理後のデータを例示した図である。 本発明の第1の実施形態に係る匿名化部の処理を例示した図である。 本発明の第1の実施形態に係る匿名化部の処理を例示した図である。 本発明の第1の実施形態に係る匿名化部の処理を例示した図である。 本発明の第1の実施形態に係るプライバシー保護装置の処理を示した図である。 本発明の第2の実施形態に係る匿名化部の構成を示した図である。 本発明の第2の実施形態に係る初期化処理後のデータを例示した図である。 本発明の第2の実施形態に係る匿名化部の処理を例示した図である。 本発明の第2の実施形態に係る匿名化部の処理を例示した図である。 本発明の第2の実施形態に係る匿名化部の処理を例示した図である。 本発明の第2の実施形態に係るプライバシー保護装置の処理を示した図である。
<第1の実施形態>
以下、本発明の第1の実施形態について、図1から図7を用いて、詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<公開情報のプライバシー保護装置の構成>
図1を用いて、本実施形態に係る公開情報のプライバシー保護装置の構成について説明する。本実施形態に係る公開情報のプライバシー保護装置は、図1に示すように、分類部100と、匿名化部200と、設定部300とから構成されている。
分類部100は、入力された元データ(オリジナルデータ)をそのデータの各属性に応じて、重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に分類する。なお、実際には、GUI(Graphical User Interface)等を用いて、コンピュータ上のグラフィックス表示をマウスなどでポインティングすることにより、利用者が分類を行う。なお、重要情報(Sensitive Information)に指定された属性の変更は行われない。
匿名化部200は、重要情報の属性値を匿名化する。具体的には、重要情報のある属性値を消去あるいは任意の属性値に置き換えることにより、属性値の匿名化を行う。したがって、属性情報の粒度を下げることなく、効率的に重要情報の匿名化を行うことができる。設定部300は、攻撃者がl個の重要情報の組み合わせに基づいて、もとの重要情報を類推できる能力を有する場合に、l個の重要情報の組み合わせ数kを設定する。
<匿名化部の構成>
図2を用いて、本実施形態に係る匿名化部200の構成について説明する。本実施形態に係る匿名化部200は、図2に示すように、初期処理部210と、ペア抽出部220と、グループ抽出部230と、表作成部240と、条件判定部250とから構成されている。
初期処理部210は、分類部100が、区分した表に対して、準識別子の属性を匿名化する。ペア抽出部220は、初期処理後の表から2つの重要情報を1組としたすべてのペアを抽出する。グループ抽出部230は、抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する。
表作成部240は、グループ抽出部230が抽出したグループにおいて、ペア抽出部220が抽出したペア以外の残りの重要情報属性値からなる表を作成する。条件判定部250は、作成した表がk個以上の属性値の組み合わせをもつ場合に、すべてのグループについて条件を満たすように、ペア抽出部220、グループ抽出部230および表作成部240の処理を行う。また、図示しない出力部は、変形した表を出力する。
<匿名化部の処理>
図3から図6を用いて、匿名化部の処理について、具体例を提示して、説明する。
図3は、初期化処理後のデータを例示したものである。本例によれば、「準識別子(Quasi−Identifier)」として、「Birth」、「Zip」、「Nationality」が示され、「重要情報(Sensitive Information)」として、「Problem」、「Weight」、「Commute」が示されている。なお、本表のうち、「*」は、データの一般化を意味する。
本発明は、重要情報を匿名化するものであり、ペア抽出部220は、上記3つの重要情報を2つ1組のペアとする。つまり、図4は、「Problem」と「Weight」と(図中、(a))をペアにした場合を、図5は、「Problem」と「Commute」と(図中、(a))をペアにした場合を、図6は、「Weight」と「Commute」と(図中、(a))をペアにした場合を示している。
グループ抽出部230は、抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する。つまり、図4の例では、「Problem」について、同じ属性値「Chest Pain」(図中、(A))、「Hypertension」(図中、(B))、「Obesity」(図中、(C))を有するレコード(属性値の列)をグループとして抽出する。図5の例では、「Problem」について、同じ属性値「Chest Pain」(図中、(A))、「Hypertension」(図中、(B))、「Obesity」(図中、(C))を有するレコード(属性値の列)をグループとして抽出する。また、図6の例では、「Weight」について、同じ属性値「Heavy」(図中、(A))、「Medium」(図中、(B))、「Slim」(図中、(C))を有するレコード(属性値の列)をグループとして抽出する。
表作成部240は、グループ抽出部230が抽出したグループにおいて、ペア抽出部220が抽出したペア以外の残りの重要情報属性値からなる表を作成する。つまり、図4、図5、図6の例では、それぞれ(b)の表を作成する。
条件判定部250は、作成した表がk個以上の属性値の組み合わせをもつ場合に、すべてのグループについて条件を満たすように、ペア抽出部220、グループ抽出部230および表作成部240の処理を行う。本例では、k=2とすると、図4の場合、「Commute」には、各グループごとに、「Car」、「Walk」、「Train」の3つの属性値があり、図5の場合には、「Weight」には、各グループごとに、「Heavy」、「Slim」、「Medium」の3つの属性値がある。つまり、本例では、k=2の設定に対して、各グループごとに3つの属性値があるため、条件を満たしている。
<公開情報のプライバシー保護装置の処理>
図7を用いて、公開情報のプライバシー保護装置の処理について説明する。
まず、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類し(ステップS101)、区分した表に対して、準識別子の属性を匿名化する(ステップS102)。
第2のステップ後の表から2つの重要情報を1組としたすべてのペアを抽出し(ステップS103)、抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する(ステップS104)。
第4のステップで抽出したグループにおいて、第3のステップで抽出したペア以外の残りの重要情報属性値からなる表を作成し(ステップS105)、作成した表がk個以上の属性値の組み合わせをもつ場合に、すべてのグループについて条件を満たすように、第3のステップ、第4のステップおよび第5のステップの処理を行い、変形した表を出力する(ステップS106)。
したがって、本実施形態によれば、すべてのグループが条件を満たすように、処理を行うことから、確実に安全性を担保することができる。
<第2の実施形態>
図8から図13を用いて、本発明の第2の実施形態について説明する。
<匿名化部の構成>
図8を用いて、本実施形態に係る匿名化部200の構成について説明する。本実施形態に係る匿名化部200は、図8に示すように、初期処理部210と、ペア抽出部220と、グループ抽出部230と、表作成部240と、条件判定部251と、レコード数処理部260とから構成されている。なお、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有することから、その詳細な説明は、省略する。
レコード数処理部260は、表作成部240が、作成した表が、k個未満の属性値の組合せをもつ場合に、他のグループからレコードを1つ取り、最大l個の属性を削除または任意の属性値に置き換え、当該グループに所属するレコード数を数え、属性値がk個以上になるまでこの処理を繰り返す。条件判定部251は、すべてのグループについて条件を満たしているか否かを判定する。そして、すべてのグループが条件を満たしたときに、図示しない出力部が、変形した表を出力する。
<匿名化部の処理>
図9から図12を用いて、匿名化部の処理について、具体例を提示して、説明する。
図9は、初期化処理後のデータを例示したものである。本例によれば、「準識別子(Quasi−Identifier)」として、「Birth」、「Zip」、「Nationality」が示され、「重要情報(Sensitive Information)」として、「Problem」、「Weight」、「Commute」が示されている。なお、本表のうち、「*」は、データの一般化を意味する。
レコード数処理部260は、表作成部240が、作成した表が、k個未満の属性値の組合せをもつ場合に、他のグループからレコードを1つ取り、最大l個の属性を削除または任意の属性値に置き換え、当該グループに所属するレコード数を数え、属性値がk個以上になるまでこの処理を繰り返す。本例では、k=2とすると、まず、図10において、重要情報の2段目の列における属性値「Chest Pain」および「Slim」を「*」として一般化することにより、重要情報「Problem」の属性値が「Chest Pain」であるときに、すべてのペアの組み合わせにおいて、属性値の数が3となり、条件を満たす。
また、図11において、重要情報の2段目の列における属性値「Chest Pain」と「Slim」および4段目の列における属性値「Hypertension」と「Heavy」を「*」として一般化することにより、重要情報「Problem」の属性値が「Obesity」であるときに、すべてのペアの組み合わせにおいて、属性値の数が3となり、条件を満たす。
しかしながら、図11の状態では、重要情報「Problem」の属性値が「Hypertension」であるときには、条件を満たさない。そこで、図12に示すように、さらに、重要情報の6段目の列における属性値「Chest Pain」と「Medium」とを「*」として一般化することにより、重要情報「Problem」の属性値が「Hypertension」であるときに、すべてのペアの組み合わせにおいて、属性値の数が3となり、条件を満たすようにする。なお、このままでは、重要情報「Commute」が全く一般化されないため、重要情報「Commute」の5列目の属性値「Train」を「*」として一般化する。
<公開情報のプライバシー保護装置の処理>
図13を用いて、公開情報のプライバシー保護装置の処理について説明する。
まず、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類し(ステップS201)、区分した表に対して、準識別子の属性を匿名化する(ステップS202)。
第2のステップ後の表から2つの重要情報を1組としたすべてのペアを抽出し(ステップS203)、抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する(ステップS204)。
第4のステップで抽出したグループにおいて、第3のステップで抽出したペア以外の残りの重要情報属性値からなる表を作成し(ステップS205)、作成した表が、k個未満の属性値の組合せをもつ場合に、他のグループからレコードを1つ取り、最大l個の属性を削除または任意の属性値に置き換え、当該グループに所属するレコード数を数え、属性値がk個以上になるまでこの処理を繰り返し、すべてのグループについて条件を満たしたときに、変形した表を出力する(ステップS206)。
以上、説明したように、本実施形態によれば、利用者の要求条件を考慮した公開データの作成が可能となる。また、従来よりも最適化されたデータを得ることができる。
なお、公開情報のプライバシー保護装置をコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたプログラムを公開情報のプライバシー保護装置に読み込ませ、実行することによって本発明の公開情報のプライバシー保護装置を実現することができる。ここでいうコンピュータシステムとは、OSや周辺装置等のハードウェアを含む。
また、「コンピュータシステム」は、WWW(World Wide Web)システムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されても良い。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。更に、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。

Claims (6)

  1. ユーザからのデータを公開する場合の公開情報のプライバシー保護装置であって、
    データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する分類手段と、
    前記重要情報の属性値を匿名化する匿名化手段と、
    を備え、
    前記匿名化手段が、
    前記分類手段が、区分した表に対して、前記準識別子の属性を匿名化する初期処理手段と、
    該初期処理後の表から2つの前記重要情報を1組としたすべてのペアを抽出するペア抽出手段と、
    該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出するグループ抽出手段と、
    該グループ抽出手段が抽出したグループにおいて、前記ペア抽出手段が抽出したペア以外の残りの前記重要情報属性値からなる表を作成する表作成手段と、
    を備え、
    該作成した表がk個以上の属性値の組み合わせをもつ場合に、すべてのグループについて条件を満たすように、前記ペア抽出手段、グループ抽出手段および表作成手段の処理を行い、変形した表を出力することを特徴とする公開情報のプライバシー保護装置。
  2. ユーザからのデータを公開する場合の公開情報のプライバシー保護装置であって、
    データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する分類手段と、
    前記重要情報の属性値を匿名化する匿名化手段と、
    を備え、
    前記匿名化手段が、
    前記分類手段が、区分した表に対して、前記準識別子の属性を匿名化する初期処理手段と、
    該初期処理後の表から2つの前記重要情報を1組としたすべてのペアを抽出するペア抽出手段と、
    該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出するグループ抽出手段と、
    該グループ抽出手段が抽出したグループにおいて、前記ペア抽出手段が抽出したペア以外の残りの前記重要情報属性値からなる表を作成する表作成手段と、
    を備え、
    該作成した表がk個未満の属性値の組み合わせをもつ場合に、他のグループから前記レコードを1つ取り、最大l個の属性を削除または任意の属性値に置き換え、当該グループに所属するレコード数を数え、属性値がk個以上になるまでこの処理を繰り返し、すべてのグループについて条件を満たしたときに、変形した表を出力することを特徴とする公開情報のプライバシー保護装置。
  3. 分類手段と、初期化処理手段と、ペア抽出手段と、グループ抽出手段と、表作成手段と、条件判定手段と、を備えた公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、
    前記分類手段が、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する第1のステップと、
    前記初期化処理手段が、区分した表に対して、前記準識別子の属性を匿名化する第2のステップと、
    前記ペア抽出手段が、該第2のステップ後の表から2つの前記重要情報を1組としたすべてのペアを抽出する第3のステップと、
    前記グループ抽出手段が、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する第4のステップと、
    前記表作成手段は、該第4のステップにおいて抽出したグループにおいて、前記第3のステップで抽出したペア以外の残りの前記重要情報属性値からなる表を作成する第5のステップと、
    前記条件判定手段は、該作成した表がk個以上の属性値の組み合わせをもつ場合に、すべてのグループについて条件を満たすように、前記第3のステップ、第4のステップおよび第5のステップの処理を行い、変形した表を出力する第6のステップと、
    を備えたことを特徴とする公開情報のプライバシー保護方法。
  4. 分類手段と、初期化処理手段と、ペア抽出手段と、グループ抽出手段と、表作成手段と、条件判定手段と、を備えた公開情報のプライバシー保護装置における公開情報のプライバシー保護方法であって、
    前記分類手段が、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する第1のステップと、
    前記初期化処理手段が、区分した表に対して、前記準識別子の属性を匿名化する第2のステップと、
    前記ペア抽出手段が、該第2のステップ後の表から2つの前記重要情報を1組としたすべてのペアを抽出する第3のステップと、
    前記グループ抽出手段が、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する第4のステップと、
    前記表作成手段が、該第4のステップにおいて抽出したグループにおいて、前記第3のステップで抽出したペア以外の残りの前記重要情報属性値からなる表を作成する第5のステップと、
    前記条件判定手段は、該作成した表がk個未満の属性値の組み合わせをもつ場合に、他のグループから前記レコードを1つ取り、最大l個の属性を削除または任意の属性値に置き換え、当該グループに所属するレコード数を数え、属性値がk個以上になるまでこの処理を繰り返し、すべてのグループについて条件を満たしたときに、変形した表を出力する第6のステップと、
    を備えたことを特徴とする公開情報のプライバシー保護方法。
  5. 分類手段と、初期化処理手段と、ペア抽出手段と、グループ抽出手段と、表作成手段と、条件判定手段と、を備えた公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、
    前記分類手段が、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する第1のステップと、
    前記初期化処理手段が、区分した表に対して、前記準識別子の属性を匿名化する第2のステップと、
    前記ペア抽出手段が、該第2のステップ後の表から2つの前記重要情報を1組としたすべてのペアを抽出する第3のステップと、
    前記グループ抽出手段が、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する第4のステップと、
    前記表作成手段が、該第4のステップにおいて抽出したグループにおいて、前記第3のステップで抽出したペア以外の残りの前記重要情報属性値からなる表を作成する第5のステップと、
    前記条件判定手段は、k個以上の属性値の組み合わせをもつ場合に、すべてのグループについて条件を満たすように、前記第3のステップ、第4のステップおよび第5のステップの処理を行い、変形した表を出力する第6のステップと、
    をコンピュータに実行させるためのプログラム。
  6. 分類手段と、初期化処理手段と、ペア抽出手段と、グループ抽出手段と、表作成手段と、条件判定手段と、を備えた公開情報のプライバシー保護装置における公開情報のプライバシー保護方法をコンピュータに実行させるためのプログラムであって、
    前記分類手段が、データの各属性を重要情報(Sensitive Information)、準識別子(Quasi−Identifier)に区分して表に分類する第1のステップと、
    前記初期化処理手段が、区分した表に対して、前記準識別子の属性を匿名化する第2のステップと、
    前記ペア抽出手段が、該第2のステップ後の表から2つの前記重要情報を1組としたすべてのペアを抽出する第3のステップと、
    前記グループ抽出手段が、該抽出したそれぞれのペアに対して、同じ属性値を持つレコードをグループとして抽出する第4のステップと、
    前記表作成手段が、該第4のステップにおいて抽出したグループにおいて、前記第3のステップで抽出したペア以外の残りの前記重要情報属性値からなる表を作成する第5のステップと、
    前記条件判定手段は、該作成した表がk個未満の属性値の組み合わせをもつ場合に、他のグループから前記レコードを1つ取り、最大l個の属性を削除または任意の属性値に置き換え、当該グループに所属するレコード数を数え、属性値がk個以上になるまでこの処理を繰り返し、すべてのグループについて条件を満たしたときに、変形した表を出力する第6のステップと、
    をコンピュータに実行させるためのプログラム。
JP2011221532A 2011-10-06 2011-10-06 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム Expired - Fee Related JP5839460B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011221532A JP5839460B2 (ja) 2011-10-06 2011-10-06 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011221532A JP5839460B2 (ja) 2011-10-06 2011-10-06 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2013084027A JP2013084027A (ja) 2013-05-09
JP5839460B2 true JP5839460B2 (ja) 2016-01-06

Family

ID=48529181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011221532A Expired - Fee Related JP5839460B2 (ja) 2011-10-06 2011-10-06 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5839460B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138927B (zh) * 2015-08-12 2018-05-01 中国联合网络通信集团有限公司 隐私数据保护方法及装置
US9858426B2 (en) * 2015-11-03 2018-01-02 Palo Alto Research Center Incorporated Computer-implemented system and method for automatically identifying attributes for anonymization
JP7154884B2 (ja) * 2018-08-28 2022-10-18 株式会社Ye Digital 情報秘匿化方法、情報秘匿化プログラム、情報秘匿化装置および情報提供システム
JP7219726B2 (ja) * 2020-01-09 2023-02-08 Kddi株式会社 リスク評価装置、リスク評価方法及びリスク評価プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8112422B2 (en) * 2008-10-27 2012-02-07 At&T Intellectual Property I, L.P. Computer systems, methods and computer program products for data anonymization for aggregate query answering
JP5757241B2 (ja) * 2009-10-09 2015-07-29 日本電気株式会社 情報管理装置、そのデータ処理方法、およびコンピュータプログラム
JP5525864B2 (ja) * 2010-03-01 2014-06-18 Kddi株式会社 プライバシー情報評価サーバ、データ管理方法およびプログラム

Also Published As

Publication number Publication date
JP2013084027A (ja) 2013-05-09

Similar Documents

Publication Publication Date Title
US11748517B2 (en) Smart de-identification using date jittering
US9230132B2 (en) Anonymization for data having a relational part and sequential part
US11449674B2 (en) Utility-preserving text de-identification with privacy guarantees
WO2020043610A1 (en) De-identification of protected information
JP5525864B2 (ja) プライバシー情報評価サーバ、データ管理方法およびプログラム
JP5511532B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
Pika et al. Towards privacy-preserving process mining in healthcare
JP5452187B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP5839460B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP2012159982A (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
US11093640B2 (en) Augmenting datasets with selected de-identified data records
El Ouazzani et al. A classification of non-cryptographic anonymization techniques ensuring privacy in big data
US9148410B2 (en) Recording medium storing data processing program, data processing apparatus and data processing system
Kieseberg et al. Protecting anonymity in data-driven biomedical science
JP2015114871A (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP5626964B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
KR101973949B1 (ko) 목적에 따라 비식별화된 데이터를 최적화하는 방법 및 장치
WO2014030302A1 (ja) 匿名化を実行する情報処理装置及び匿名化処理方法
Gkoulalas-Divanis et al. Toward smarter healthcare: Anonymizing medical data to support research studies
JP5366786B2 (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
Chen et al. Architecture and building the medical image anonymization service: cloud, big data and automation
Verma et al. DF 2.0: Designing an automated, privacy preserving, and efficient digital forensic framework
US20230127625A1 (en) Anonymization system and method
JP2011170632A (ja) 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム
JP5706805B2 (ja) 匿名データ生成装置、匿名データの生成方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140731

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151105

R150 Certificate of patent or registration of utility model

Ref document number: 5839460

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees