JP2015130022A - 匿名化パラメータ選択装置、方法及びプログラム - Google Patents

匿名化パラメータ選択装置、方法及びプログラム Download PDF

Info

Publication number
JP2015130022A
JP2015130022A JP2014000768A JP2014000768A JP2015130022A JP 2015130022 A JP2015130022 A JP 2015130022A JP 2014000768 A JP2014000768 A JP 2014000768A JP 2014000768 A JP2014000768 A JP 2014000768A JP 2015130022 A JP2015130022 A JP 2015130022A
Authority
JP
Japan
Prior art keywords
model
parameter
risk
profit
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014000768A
Other languages
English (en)
Other versions
JP6161545B2 (ja
Inventor
清本 晋作
Shinsaku Kiyomoto
晋作 清本
三宅 優
Masaru Miyake
優 三宅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2014000768A priority Critical patent/JP6161545B2/ja
Publication of JP2015130022A publication Critical patent/JP2015130022A/ja
Application granted granted Critical
Publication of JP6161545B2 publication Critical patent/JP6161545B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

【課題】データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkを選択することができる匿名化パラメータ選択装置、方法及びプログラムを提供すること。【解決手段】匿名化パラメータ選択装置10は、選択したユーザ分布モデルと情報量モデルとに基づいて、同意したユーザの割合と情報量とによって利用者が得る利益と、パラメータkとの関係を表わす利益モデルを生成し、ユーザが特定されるリスクとパラメータkとの関係を表わすリスクモデルを選択し、生成した利益モデルと、選択したリスクモデルとに基づいて、利益とリスクとの関係を表わす利益−リスクモデルを生成し、生成した利益−リスクモデルにおいて、利得が最大となるパラメータkを選択する。【選択図】図5

Description

本発明は、匿名化パラメータ選択装置、方法及びプログラムに関する。
従来より、データを統計処理することによって、データの有効活用が図られている。例えば、特定の病気にかかりやすい年代、性別、地域、人種といった情報を含む大量のデータが広く公開され、統計処理されて、その傾向分析や予防対策に用いられている。
このようなデータを公開する場合には、プライバシーを慎重に保護する必要があるため、そのデータの所有者が特定されないように、データの変形処理を行う必要がある。そのため、今までにも、プライバシーを保護するためのデータの変形処理に関する技術が多く開示されている。例えば、データの一部を一般化やあいまい化することにより、データを組み合わせても個人が特定されないようにする技術(例えば、k‐匿名化処理等)が開示されている(例えば、非特許文献1参照)。
Latanya Sweeney, k−anonymity: a model for protecting privacy, International Journal of Uncertainty, Fuzziness and Knowledge−Based Systems, Volume 10 Issue 5, October 2002, Pages 557 − 570.
しかしながら、k−匿名化の際のパラメータkの値は、プライバシー要件によって事前に設定されており、データの利用者の利益や、データが利用されることによって個人が特定されるリスクを考慮して、パラメータkを選択することはできなかった。
そこで、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkを選択することができる装置が求められている。
本発明は、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkを選択することができる匿名化パラメータ選択装置、方法及びプログラムを提供することを目的とする。
本技術は、最適なパラメータkを導出する手法であって、本手法は、ユーザ分布モデルと情報量モデルとを選択することにより、利益モデルを構築し、リスクモデルの選択を行い、利益モデル、リスクモデルから、利益−リスクモデルを構築し、そのモデルにおいて利得が最大となるパラメータkを選択することによって、最適なパラメータkを得る手法である。
また、本手法は、ユーザ分布モデルとして正規分布を用いる。
また、本手法は、情報量モデルとしてシャノンエントロピーを用いる。
また、本手法は、リスクモデルにおいてストックオプションプライシングモデルを用いる。
具体的には、以下のような解決手段を提供する。
(1) データを利用する利用者の利益と、前記データが利用されることによって特定される可能性のあるユーザのリスクとに基づいて、前記データの匿名化を表わすパラメータkを選択する匿名化パラメータ選択装置であって、前記データが利用されることに同意する前記ユーザの割合の分布であって前記パラメータkに対する分布を表わすユーザ分布モデルを選択するユーザ分布モデル選択手段と、前記データの情報量と前記パラメータkとの関係を表わす情報量モデルを選択する情報量モデル選択手段と、前記ユーザ分布モデル選択手段によって選択された前記ユーザ分布モデルと、前記情報量モデル選択手段によって選択された前記情報量モデルとに基づいて、同意した前記ユーザの割合と前記情報量とによって前記利用者が得る利益と、前記パラメータkとの関係を表わす利益モデルを生成する利益モデル生成手段と、前記ユーザが特定されるリスクと前記パラメータkとの関係を表わすリスクモデルを選択するリスクモデル選択手段と、前記利益モデル生成手段によって生成された前記利益モデルと、前記リスクモデル選択手段によって選択された前記リスクモデルとに基づいて、前記利益と前記リスクとの関係を表わす利益−リスクモデルを生成する利益−リスクモデル生成手段と、前記利益−リスクモデル生成手段によって生成された前記利益−リスクモデルにおいて、利得が最大となるパラメータkを選択するパラメータ選択手段と、を備える匿名化パラメータ選択装置。
(1)の構成によれば、匿名化パラメータ選択装置は、ユーザ分布モデルと情報量モデルとを選択し、選択したユーザ分布モデルと情報量モデルとに基づいて、同意したユーザの割合と情報量とによって利用者が得る利益とパラメータkとの関係を表わす利益モデルを生成する。次に、匿名化パラメータ選択装置は、ユーザが特定されるリスクとパラメータkとの関係を表わすリスクモデルを選択し、生成した利益モデルと、選択したリスクモデルとに基づいて、利益とリスクとの関係を表わす利益−リスクモデルを生成し、生成した利益−リスクモデルにおいて、利得が最大となるパラメータkを選択する。
すなわち、(1)に係る匿名化パラメータ選択装置は、選択したユーザ分布モデル及び情報量モデルに基づいて利益モデルを生成し、生成した利益モデルと選択したリスクモデルとに基づいて生成した利益−リスクモデルにおいて、利得が最大となるパラメータkを選択する。
したがって、(1)に係る匿名化パラメータ選択装置は、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkを選択することができる。
(2) 前記ユーザ分布モデル選択手段は、前記ユーザ分布モデルとして正規分布を選択する(1)に記載の匿名化パラメータ選択装置。
したがって、(2)に係る匿名化パラメータ選択装置は、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkを精度よく選択することができる。
(3) 前記情報量モデル選択手段は、前記情報量モデルとしてシャノンエントロピーを選択する(1)又は(2)に記載の匿名化パラメータ選択装置。
したがって、(3)に係る匿名化パラメータ選択装置は、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkをより精度よく選択することができる。
(4) 前記リスクモデル選択手段は、前記リスクモデルとしてストックオプションプライシングモデルを選択する(1)から(3)のいずれかに記載の匿名化パラメータ選択装置。
したがって、(4)に係る匿名化パラメータ選択装置は、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkをさらにより精度よく選択することができる。
(5) 前記パラメータkを選択するためのモデルを記憶するモデル記憶手段と、前記パラメータkを選択するための条件を受け付ける条件受付手段と、をさらに備え、ユーザ分布モデル選択手段は、前記条件受付手段によって受け付けられた条件及び前記モデル記憶手段に基づいて、前記ユーザ分布モデルを選択し、前記情報量モデル選択手段は、前記条件受付手段によって受け付けられた条件及び前記モデル記憶手段に基づいて、前記情報量モデルを選択し、前記リスクモデル選択手段は、前記条件受付手段によって受け付けられた条件及び前記モデル記憶手段に基づいて、前記リスクモデルを選択する、(1)から(4)のいずれかに記載の匿名化パラメータ選択装置。
したがって、(5)に係る匿名化パラメータ選択装置は、記憶するモデルの中から条件に応じて選択したモデルに基づいて、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkをさらにより精度よく選択することができる。
(6) (1)に記載の匿名化パラメータ選択装置が実行する方法であって、前記ユーザ分布モデル選択手段が、前記データが利用されることに同意する前記ユーザの割合の分布であって前記パラメータkに対する分布を表わすユーザ分布モデルを選択するユーザ分布モデル選択ステップと、前記情報量モデル選択手段が、前記データの情報量と前記パラメータkとの関係を表わす情報量モデルを選択する情報量モデル選択ステップと、前記利益モデル生成手段が、前記ユーザ分布モデル選択ステップによって選択された前記ユーザ分布モデルと、前記情報量モデル選択ステップによって選択された前記情報量モデルとに基づいて、同意した前記ユーザの割合と前記情報量とによって前記利用者が得る利益と、前記パラメータkとの関係を表わす利益モデルを生成する利益モデル生成ステップと、前記リスクモデル選択手段が、前記ユーザが特定されるリスクと前記パラメータkとの関係を表わすリスクモデルを選択するリスクモデル選択ステップと、前記利益−リスクモデル生成手段が、前記利益モデル生成ステップによって生成された前記利益モデルと、前記リスクモデル選択ステップによって選択された前記リスクモデルとに基づいて、前記利益と前記リスクとの関係を表わす利益−リスクモデルを生成する利益−リスクモデル生成ステップと、前記パラメータ選択手段が、前記利益−リスクモデル生成ステップによって生成された前記利益−リスクモデルにおいて、利得が最大となるパラメータkを選択するパラメータ選択ステップと、を備える方法。
したがって、(6)に係る方法は、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkを選択することができる。
(7) コンピュータに、(6)に記載の方法の各ステップを実行させるためのプログラム。
したがって、(7)に係るプログラムは、コンピュータに、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkを選択させることができる。
本発明によれば、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkを選択することができる。すなわち、本発明によれば、k−匿名化の際に最適なパラメータkを選択することが可能となり、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの相反する関係において、データの利用における利益を最大化することができるようなパラメータkを選択し、提供することができる。
その結果、データをk−匿名化する装置は、本発明によるパラメータkを用いて、利用者の利益と、ユーザのリスクとの相反する関係において、データの利用者の利益が最大になるようにk−匿名化を施したデータを作成することができる。
本発明の一実施形態に係る匿名化パラメータ選択装置が生成する利益モデルの一例を示す図である。 本発明の一実施形態に係る匿名化パラメータ選択装置が選択するリスクモデルの一例を示す図である。 本発明の一実施形態に係る匿名化パラメータ選択装置が生成する利益−リスクモデルの一例を示す図である。 本発明の一実施形態に係る匿名化パラメータ選択装置が生成した利益−リスクモデルの一例において、パラメータkを一定にした場合の開示時間との関係の一例を示す図である。 本発明の一実施形態に係る匿名化パラメータ選択装置の構成を示す図である。 本発明の一実施形態に係る匿名化パラメータ選択装置が記憶するモデル記憶手段の例を示す図である。 本発明の一実施形態に係る匿名化パラメータ選択装置の処理を示すフローチャートである。 本発明の一実施形態に係る匿名化パラメータ選択装置が選択したパラメータkに基づいて、データにk−匿名化処理が行われた例を示す図である。
以下、本発明の実施形態について、図を参照しながら説明する。図1から4は、本発明の一実施形態に係る匿名化パラメータ選択装置10がパラメータkを選択する手法を、説明するための図である。図1は、利益モデルの一例を示す図であり、図2は、リスクモデルの一例を示す図であり、図3は、利益−リスクモデルの一例を示す図であり、図4は、利益−リスクモデルの一例において、パラメータkを一定にした場合の開示時間との関係の一例を示す図である。図1から図3において、曲線101は、データの開示時間が90である場合を示し、曲線102は、データの開示時間が60である場合を示し、曲線103は、データの開示時間が30である場合を示し、曲線104は、データの開示時間が10である場合を示している。また、図4において、曲線201は、パラメータkが100である場合を示し、曲線202は、パラメータkが50である場合を示し、曲線203は、パラメータkが20である場合を示し、曲線204は、パラメータkが10である場合を示している。
匿名化パラメータ選択装置10は、以下の手順を実行して最適なパラメータkを導出する。まず、ユーザの分布をモデル化する。これは、ユーザによってデータを出してもよいと考えるパラメータk値が異なるという仮定のもと、あるパラメータkを定めた場合のデータ提供に同意するユーザの割合を導出するものである。このとき、各ユーザは、あるパラメータk以上であれば同意する。パラメータkに対して、そのパラメータkが最適だと思うユーザの分布を選択する。例えば、正規分布でモデル化するとしたとき、データ提供が期待できるユーザの数は以下のようになる。
Figure 2015130022
ここで、Nはデータの件数(すなわち、ユーザの総人数)であり、k’はパラメータkの平均値、σは標準偏差である。
次に情報量のモデルを選択する。例えば、シャノンエントロピーに従うと仮定したとき、1つの情報の価値は、以下のように表わされる。すなわち、パラメータkが小さい方が1つの情報の価値が高い。
Figure 2015130022
ここで、αは、選択されたモデルや、後述するβとの比により決められる定数である。匿名化パラメータ選択装置10は、別途、αを入力する。
匿名化パラメータ選択装置10は、上記2つのモデルから、以下の式で与えられる利益モデルを生成する。これはデータの開示時間t(データの開示からの経過時間)とパラメータkによって決定される関数である。具体例として次式の形で表わされる。
Figure 2015130022
すなわち、一般形で表わすと次のようになる。
Figure 2015130022
ここで、γは、選択されたモデルにより決められる定数である。例えば、γが大きいと、データの開示時間に伴って利益の増加率は減少する。匿名化パラメータ選択装置10は、別途、γを入力する。数3をグラフで表わすと、図1で示されるグラフのような形になる。
次にリスクモデルを選択する。リスクとは、データを提供した場合に、そのデータから個人が特定(再識別化)されるリスクを指す。例えば、市場価格の変動による損失のリスクをモデル化したストックオプションプライシングモデルを選択すると、リスクは、以下のように表わされる。
Figure 2015130022
ここで、βは、選択されたモデルにより決められる定数であり、データの種類やデータを利用するサービスの種類によって、αとの比によって決められるとしてもよい。例えば、メディカルデータのようにユーザが特定されるとリスクが高い場合、αを小さく、βを大きくすることが考えられる。匿名化パラメータ選択装置10は、別途、βを入力する。
また、パラメータkは変わらないとした場合に、開示時間と共にリスクがuずつ増大することをnuで表わしている。すなわち、数4の式は、開示時間と共に解析が進むことによって、ユーザが特定されるリスクが高まることを表わしている。数4の式をグラフで表わすと、図2で示されるグラフのような形になる。
なお、Q(n)は、次式で表わされる。
Figure 2015130022
また、logit−1(x)は、次式で表わされる。
Figure 2015130022
最後に、利益モデルとリスクモデルの両方を考慮した利益−リスクモデルは、具体例として次式の形で表わされる。
Figure 2015130022
すなわち、一般形で表わすと次のようになる。
Figure 2015130022
このモデルは、利益/リスクで定量化を試みたものである。匿名化パラメータ選択装置10は、このモデルを使って最適なパラメータk値を導出する。例えば、上記式から導出される値は、図3に示されるようなグラフになるため、グラフの値が最大となるパラメータkを選択することで、最適なパラメータkを導出することができる。
なお、パラメータkを固定した場合の時刻tについても最適値が存在する。グラフで表すと、図4で示すようなグラフになる。
匿名化パラメータ選択装置10は、最適なパラメータkを出力して終了する。例えば、プライバシー保護装置(図示せず)は、匿名化パラメータ選択装置10によって出力されたパラメータkの値を用いてデータを加工し、データにk−匿名化処理を施す。
図5は、本発明の一実施形態に係る匿名化パラメータ選択装置10の構成を示す図である。匿名化パラメータ選択装置10は、条件受付手段11と、ユーザ分布モデル選択手段12と、情報量モデル選択手段13と、利益モデル生成手段14と、リスクモデル選択手段15と、利益−リスクモデル生成手段16と、パラメータ選択手段17と、モデル記憶手段31とを備え、データを利用する利用者の利益と、データが利用(例えば、公表等)されることによって特定される可能性のあるユーザのリスクとにおける、データの匿名化を表わすパラメータkを選択する。各手段ごとに説明する。
ここで、ユーザは、例えば、ホームページを閲覧する個人を含む。利用者は、例えば、ユーザにサービスを提供する事業者等を含む。データは、例えば、インターネット上のウェブサイトの閲覧履歴、電子商取引サイトにおける購買決済履歴、携帯端末の位置情報等の、ライフログのデータを含む。
k‐匿名化は、行動履歴の一部を一般化やあいまい化することにより、組み合わせることで個人を推定できる可能性のある情報(準識別子と呼ぶ。)の組み合わせ(準識別子群)と同じ準識別子群を少なくともk個以上存在する状態を作り出す処理を含む。
モデル記憶手段31は、パラメータkを選択するためのモデルを記憶する。後述する図6に示すように、モデル記憶手段31は、モデル化する対象である対象モデルに対応付けて具体的なモデルである具体的モデルを記憶している。
条件受付手段11は、パラメータkを選択するための条件を受け付ける。具体的には、条件受付手段11は、ユーザ分布モデル、情報量モデル及びリスクモデルを選択するための条件や、モデルによって決定される値(例えば、上述のα、β、γ)を受け付ける。
ユーザ分布モデル選択手段12は、データが利用されることに同意するユーザの割合の分布であってパラメータkに対する分布を表わすユーザ分布モデルを選択する。具体的には、ユーザ分布モデル選択手段12は、条件受付手段11によって受け付けられた条件及びモデル記憶手段31に基づいて、ユーザ分布モデルを選択する。ユーザ分布モデル選択手段12は、ユーザ分布モデルとして正規分布を選択するとしてもよい。
情報量モデル選択手段13は、データの情報量とパラメータkとの関係を表わす情報量モデルを選択する。具体的には、情報量モデル選択手段13は、条件受付手段11によって受け付けられた条件及びモデル記憶手段31に基づいて、情報量モデルを選択する。データの情報量は、データが開示されて利用されることによって有用となる情報量であって、パラメータkの値が大きい程、多くなり、パラメータkの値が小さい程、少なくなる。
情報量モデル選択手段13は、情報量モデルとしてシャノンエントロピーを選択するとしてもよい。
利益モデル生成手段14は、ユーザ分布モデル選択手段12によって選択されたユーザ分布モデルと、情報量モデル選択手段13によって選択された情報量モデルとに基づいて、同意したユーザの割合と情報量とによって利用者が得る利益と、パラメータkとの関係を表わす利益モデルを生成する。具体的には、利益モデル生成手段14は、上述の数4の式で表わされるような利益モデルを生成する。この場合の利益モデルは、データの開示の時間ごとの、利用者が得る利益とパラメータkとの関係として、図1のように表わされる。
リスクモデル選択手段15は、ユーザが特定されるリスクとパラメータkとの関係を表わすリスクモデルを選択する。具体的には、リスクモデル選択手段15は、条件受付手段11によって受け付けられた条件及びモデル記憶手段31に基づいて、リスクモデルを選択する。リスクモデル選択手段15は、リスクモデルとしてストックオプションプライシングモデルを選択するとしてもよい。ストックオプションプライシングモデルは、市場価格の変動による損失のリスクのモデルであって時間の経過と共に不確実性が増大するモデルであり、データの開示時間によってリスクが高まるリスクモデルにも適用可能である。
この場合、リスクモデル選択手段15は、上述の数4の式で表わされるようなリスクモデルを生成する。このリスクモデルは、図2のように表わされる。
利益−リスクモデル生成手段16は、利益モデル生成手段14によって生成された利益モデルと、リスクモデル選択手段15によって選択されたリスクモデルとに基づいて、利益とリスクとの関係を表わす利益−リスクモデルを生成する。具体的には、利益−リスクモデル生成手段16は、上述の数9の式で表わされるような利益−リスクモデルを生成する。この利益−リスクモデルは、データの開示の時間ごとの、定量化された利益/リスクとパラメータkとの関係として、例えば、図3のように表わされる。
また、利益−リスクモデルは、パラメータkごとの、定量化された利益/リスクとデータの開示時間との関係として、例えば、図4のように表わされる。
パラメータ選択手段17は、利益−リスクモデル生成手段16によって生成された利益−リスクモデルにおいて、利得が最大となるパラメータkを選択する。具体的には、パラメータ選択手段17は、例えば、図3において、データの開示時間(例えば、所定の値として設定されていてもよいし、パラメータkを選択する際に入力されてもよい。)により利益−リスクモデルのグラフを選択し、選択したグラフの最大値を算出し、算出した最大値に対応するパラメータkを最適なパラメータkとして選択する。
また、パラメータ選択手段17は、例えば、図4において、パラメータkごとの利益−リスクモデルのグラフにより、データの開示時間(例えば、所定の値として設定されていてもよいし、パラメータkを選択する際に入力されてもよい。)における、最大の利益/リスクをもたらすパラメータk(例えば、開示時間=100における最大の利益/リスクをもたらすパラメータkは、パラメータk=50であり、開示時間=400における最大の利益/リスクをもたらすパラメータkは、パラメータk=20)を選択するとしてもよい。
図6は、本発明の一実施形態に係る匿名化パラメータ選択装置10が記憶するモデル記憶手段31の例を示す図である。図6が示すように、モデル記憶手段31は、対象モデル(ユーザ分布モデル、情報量モデル、リスクモデル)に対応付けて、それぞれの具体的モデルを記憶する。具体的モデルは、条件受付手段11によって受け付けられた条件によって、選択される。
図7は、本発明の一実施形態に係る匿名化パラメータ選択装置10の処理を示すフローチャートである。匿名化パラメータ選択装置10は、コンピュータ及びその周辺装置が備えるハードウェア並びに該ハードウェアを制御するソフトウェアによって構成され、以下の処理は、制御部(例えば、匿名化パラメータ選択装置10のCPU)が所定のソフトウェアに従い実行する処理である。
ステップS101において、CPU(条件受付手段11)は、条件を受け付ける。より具体的には、CPUは、ユーザ分布モデル、情報量モデル及びリスクモデルを選択するための条件や、モデルによって決定される値(例えば、上述のα、β、γ)を受け付ける。
ステップS102において、CPU(ユーザ分布モデル選択手段12)は、ユーザ分布モデルを選択する。より具体的には、CPUは、ステップS101において受け付けた条件及びモデル記憶手段31に基づいて、ユーザ分布モデル(例えば、正規分布)を選択する。
ステップS103において、CPU(情報量モデル選択手段13)は、情報量モデルを選択する。より具体的には、CPUは、ステップS101において受け付けた条件及びモデル記憶手段31に基づいて、情報量モデル(例えば、シャノンエントロピー)を選択する。
ステップS104において、CPU(利益モデル生成手段14)は、利益モデルを生成する。より具体的には、CPUは、上述の数4の式で表わされるような利益モデルを生成する。
ステップS105において、CPU(リスクモデル選択手段15)は、リスクモデルを選択する。より具体的には、CPUは、ステップS101において受け付けた条件及びモデル記憶手段31に基づいて、リスクモデル(例えば、ストックオプションプライシングモデル)を選択する。
ステップS106において、CPU(利益−リスクモデル生成手段16)は、利益−リスクモデルを生成する。より具体的には、CPUは、上述の数9の式で表わされるような利益−リスクモデルを生成する。
ステップS107において、CPU(パラメータ選択手段17)は、パラメータkを選択する。より具体的には、CPUは、所定の値として設定されているデータの開示時間により利益−リスクモデルのグラフを選択し、選択したグラフの最大値を算出し、算出した最大値に対応するパラメータkを最適なパラメータkとして選択する。
ステップS108において、CPU(パラメータ選択手段17)は、選択したパラメータkを出力する。より具体的には、CPUは、パラメータkに基づいてデータを加工する装置に、選択したパラメータkを送信する。
図8は、本発明の一実施形態に係る匿名化パラメータ選択装置10が選択したパラメータkに基づいて、データにk−匿名化処理が行われた例を示す図である。
図8(1)は、データ処理装置(例えば、プライバシー保護装置)によって、データにk−匿名化処理が行われる前の例である。
図8(2)は、匿名化パラメータ選択装置10によって選択されたパラメータkの値を用いて、データ処理装置(例えば、プライバシー保護装置)によって、データにk−匿名化処理が行われた後の例である。図8(2)は、k−匿名化処理によって、データの準識別子がk個以上存在する状態に加工されていることを、示している。
本実施形態によれば、匿名化パラメータ選択装置10は、パラメータkを選択するための条件を受け付け、受け付けた条件及びモデル記憶手段31に基づいて、データが利用されることに同意するユーザの割合の分布であってパラメータkに対する分布を表わすユーザ分布モデルを選択し、受け付けた条件及びモデル記憶手段31に基づいて、データの情報量とパラメータkとの関係を表わす情報量モデルを選択し、選択したユーザ分布モデルと、選択した情報量モデルとに基づいて、同意したユーザの割合と情報量とによって利用者が得る利益と、パラメータkとの関係を表わす利益モデルを生成する。次に、匿名化パラメータ選択装置10は、受け付けた条件及びモデル記憶手段31に基づいて、ユーザが特定されるリスクとパラメータkとの関係を表わすリスクモデルを選択し、生成した利益モデルと、選択したリスクモデルとに基づいて、利益とリスクとの関係を表わす利益−リスクモデルを生成し、生成した利益−リスクモデルにおいて、利得が最大となるパラメータkを選択する。さらに、匿名化パラメータ選択装置10は、ユーザ分布モデルとして正規分布を選択し、情報量モデルとしてシャノンエントロピーを選択し、リスクモデルとしてストックオプションプライシングモデルを選択する。
したがって、匿名化パラメータ選択装置10は、データの利用者の利益と、そのデータが利用されることによって特定される可能性のあるユーザのリスクとの関係における最適なパラメータkを選択することができる。
その結果、匿名化パラメータ選択装置10は、データをk−匿名化する装置に、利用者の利益と、ユーザのリスクとの相反する関係において、データの利用者の利益が最大になるようなパラメータkを提供することができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限るものではない。また、本発明の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本発明の実施形態に記載されたものに限定されるものではない。
10 匿名化パラメータ選択装置
11 条件受付手段
12 ユーザ分布モデル選択手段
13 情報量モデル選択手段
14 利益モデル生成手段
15 リスクモデル選択手段
16 利益−リスクモデル生成手段
17 パラメータ選択手段
31 モデル記憶手段

Claims (7)

  1. データを利用する利用者の利益と、前記データが利用されることによって特定される可能性のあるユーザのリスクとに基づいて、前記データの匿名化を表わすパラメータkを選択する匿名化パラメータ選択装置であって、
    前記データが利用されることに同意する前記ユーザの割合の分布であって前記パラメータkに対する分布を表わすユーザ分布モデルを選択するユーザ分布モデル選択手段と、
    前記データの情報量と前記パラメータkとの関係を表わす情報量モデルを選択する情報量モデル選択手段と、
    前記ユーザ分布モデル選択手段によって選択された前記ユーザ分布モデルと、前記情報量モデル選択手段によって選択された前記情報量モデルとに基づいて、同意した前記ユーザの割合と前記情報量とによって前記利用者が得る利益と、前記パラメータkとの関係を表わす利益モデルを生成する利益モデル生成手段と、
    前記ユーザが特定されるリスクと前記パラメータkとの関係を表わすリスクモデルを選択するリスクモデル選択手段と、
    前記利益モデル生成手段によって生成された前記利益モデルと、前記リスクモデル選択手段によって選択された前記リスクモデルとに基づいて、前記利益と前記リスクとの関係を表わす利益−リスクモデルを生成する利益−リスクモデル生成手段と、
    前記利益−リスクモデル生成手段によって生成された前記利益−リスクモデルにおいて、利得が最大となるパラメータkを選択するパラメータ選択手段と、
    を備える匿名化パラメータ選択装置。
  2. 前記ユーザ分布モデル選択手段は、前記ユーザ分布モデルとして正規分布を選択する請求項1に記載の匿名化パラメータ選択装置。
  3. 前記情報量モデル選択手段は、前記情報量モデルとしてシャノンエントロピーを選択する請求項1又は2に記載の匿名化パラメータ選択装置。
  4. 前記リスクモデル選択手段は、前記リスクモデルとしてストックオプションプライシングモデルを選択する請求項1から3のいずれか一項に記載の匿名化パラメータ選択装置。
  5. 前記パラメータkを選択するためのモデルを記憶するモデル記憶手段と、
    前記パラメータkを選択するための条件を受け付ける条件受付手段と、をさらに備え、
    ユーザ分布モデル選択手段は、前記条件受付手段によって受け付けられた条件及び前記モデル記憶手段に基づいて、前記ユーザ分布モデルを選択し、
    前記情報量モデル選択手段は、前記条件受付手段によって受け付けられた条件及び前記モデル記憶手段に基づいて、前記情報量モデルを選択し、
    前記リスクモデル選択手段は、前記条件受付手段によって受け付けられた条件及び前記モデル記憶手段に基づいて、前記リスクモデルを選択する、
    請求項1から4のいずれか一項に記載の匿名化パラメータ選択装置。
  6. 請求項1に記載の匿名化パラメータ選択装置が実行する方法であって、
    前記ユーザ分布モデル選択手段が、前記データが利用されることに同意する前記ユーザの割合の分布であって前記パラメータkに対する分布を表わすユーザ分布モデルを選択するユーザ分布モデル選択ステップと、
    前記情報量モデル選択手段が、前記データの情報量と前記パラメータkとの関係を表わす情報量モデルを選択する情報量モデル選択ステップと、
    前記利益モデル生成手段が、前記ユーザ分布モデル選択ステップによって選択された前記ユーザ分布モデルと、前記情報量モデル選択ステップによって選択された前記情報量モデルとに基づいて、同意した前記ユーザの割合と前記情報量とによって前記利用者が得る利益と、前記パラメータkとの関係を表わす利益モデルを生成する利益モデル生成ステップと、
    前記リスクモデル選択手段が、前記ユーザが特定されるリスクと前記パラメータkとの関係を表わすリスクモデルを選択するリスクモデル選択ステップと、
    前記利益−リスクモデル生成手段が、前記利益モデル生成ステップによって生成された前記利益モデルと、前記リスクモデル選択ステップによって選択された前記リスクモデルとに基づいて、前記利益と前記リスクとの関係を表わす利益−リスクモデルを生成する利益−リスクモデル生成ステップと、
    前記パラメータ選択手段が、前記利益−リスクモデル生成ステップによって生成された前記利益−リスクモデルにおいて、利得が最大となるパラメータkを選択するパラメータ選択ステップと、
    を備える方法。
  7. コンピュータに、請求項6に記載の方法の各ステップを実行させるためのプログラム。
JP2014000768A 2014-01-07 2014-01-07 匿名化パラメータ選択装置、方法及びプログラム Active JP6161545B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014000768A JP6161545B2 (ja) 2014-01-07 2014-01-07 匿名化パラメータ選択装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014000768A JP6161545B2 (ja) 2014-01-07 2014-01-07 匿名化パラメータ選択装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2015130022A true JP2015130022A (ja) 2015-07-16
JP6161545B2 JP6161545B2 (ja) 2017-07-12

Family

ID=53760710

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014000768A Active JP6161545B2 (ja) 2014-01-07 2014-01-07 匿名化パラメータ選択装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6161545B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200121105A (ko) * 2019-04-15 2020-10-23 주식회사 파수 비식별화 과정의 중간 결과 데이터 분석 방법, 장치, 컴퓨터 프로그램 및 그 기록 매체
WO2024079802A1 (ja) * 2022-10-11 2024-04-18 日本電信電話株式会社 評価装置、評価方法、および、評価プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185311A (ja) * 2004-12-28 2006-07-13 Nec Corp 文書匿名化装置、文書管理装置、文書匿名化方法及び文書匿名化プログラム
WO2013027782A1 (ja) * 2011-08-25 2013-02-28 日本電気株式会社 匿名化装置、匿名化方法、及びそのためのプログラムを記録した記録媒体
JP2013190838A (ja) * 2012-03-12 2013-09-26 Nippon Telegraph & Telephone West Corp 情報匿名化システム、情報損失判定方法、及び情報損失判定プログラム
US20140351946A1 (en) * 2013-05-22 2014-11-27 Hitachi, Ltd. Privacy protection-type data providing system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185311A (ja) * 2004-12-28 2006-07-13 Nec Corp 文書匿名化装置、文書管理装置、文書匿名化方法及び文書匿名化プログラム
WO2013027782A1 (ja) * 2011-08-25 2013-02-28 日本電気株式会社 匿名化装置、匿名化方法、及びそのためのプログラムを記録した記録媒体
JP2013190838A (ja) * 2012-03-12 2013-09-26 Nippon Telegraph & Telephone West Corp 情報匿名化システム、情報損失判定方法、及び情報損失判定プログラム
US20140351946A1 (en) * 2013-05-22 2014-11-27 Hitachi, Ltd. Privacy protection-type data providing system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200121105A (ko) * 2019-04-15 2020-10-23 주식회사 파수 비식별화 과정의 중간 결과 데이터 분석 방법, 장치, 컴퓨터 프로그램 및 그 기록 매체
KR102248993B1 (ko) 2019-04-15 2021-05-07 주식회사 파수 비식별화 과정의 중간 결과 데이터 분석 방법, 장치, 컴퓨터 프로그램 및 그 기록 매체
US11816245B2 (en) 2019-04-15 2023-11-14 Fasoo Co., Ltd. Method for analysis on interim result data of de-identification procedure, apparatus for the same, computer program for the same, and recording medium storing computer program thereof
WO2024079802A1 (ja) * 2022-10-11 2024-04-18 日本電信電話株式会社 評価装置、評価方法、および、評価プログラム

Also Published As

Publication number Publication date
JP6161545B2 (ja) 2017-07-12

Similar Documents

Publication Publication Date Title
JP6800147B2 (ja) サービス作業のセキュリティを検証するための方法、デバイス、端末およびサーバ
US9015081B2 (en) Predicting escalation events during information searching and browsing
Bimpikis et al. Designing dynamic contests
WO2013073377A1 (ja) 情報拡散規模予測装置、情報拡散規模予測方法、および情報拡散規模予測プログラム
JP2018073349A (ja) 情報解析装置、情報解析方法、および情報解析プログラム
JP2018045649A (ja) 判定装置、判定方法および判定プログラム
Sculpher Clinical trials provide essential evidence, but rarely offer a vehicle for cost-effectiveness analysis
JP6161545B2 (ja) 匿名化パラメータ選択装置、方法及びプログラム
Chiarella et al. Pricing American options written on two underlying assets
US11574272B2 (en) Systems and methods for maximizing employee return on investment
Simonato Johnson binomial trees
Ni et al. Lifetime quality of life and cost consequences of delays in endovascular treatment for acute ischaemic stroke: a cost-effectiveness analysis from a Singapore healthcare perspective
Sculpher ISPOR’s initiative on US value assessment frameworks: seeking a role for health economics
Okagbue et al. Datasets on the statistical properties of the first 3000 squared positive integers
CN105528379B (zh) 一种资源的推荐方法和装置
Yan et al. Generalization of the time-to-event continual reassessment method to bivariate outcomes
JP2016139277A (ja) 知的財産格付けシステムおよびプログラム
Ogbechie-Godec et al. Skin in the game: Existing and upcoming physician payment models in dermatology
KR101722445B1 (ko) 상품 구매 패턴에 기초한 상품 구매자 예상 지원 장치 및 방법
JP6541521B2 (ja) 生成装置、生成方法、生成プログラム、決定装置、決定方法、及び決定プログラム
CN107851290B (zh) 历史管理方法
JP7086661B2 (ja) 情報処理システム、情報処理方法、およびプログラム
JP6998489B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
KR102417376B1 (ko) 국내에 거주하는 외국인들을 위한 온라인 플랫폼을 운용하는 서버
JP6845994B2 (ja) 情報処理装置、情報処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170613

R150 Certificate of patent or registration of utility model

Ref document number: 6161545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150