JP6375107B2 - 匿名化装置、匿名化方法、及び匿名化プログラム - Google Patents
匿名化装置、匿名化方法、及び匿名化プログラム Download PDFInfo
- Publication number
- JP6375107B2 JP6375107B2 JP2013213535A JP2013213535A JP6375107B2 JP 6375107 B2 JP6375107 B2 JP 6375107B2 JP 2013213535 A JP2013213535 A JP 2013213535A JP 2013213535 A JP2013213535 A JP 2013213535A JP 6375107 B2 JP6375107 B2 JP 6375107B2
- Authority
- JP
- Japan
- Prior art keywords
- items
- appearance rate
- candidate data
- data
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
複数となるように年齢の項目を17歳以上22歳未満のように区切ると、同一グループに成年と未成年が混在したり、高校生と社会人が混在したりすることになり、マーケティング的な価値が極めて少なくなってしまう。この場合、操作者が年齢の項目の区切りを指定し、他の項目を抽象化することで匿名性を満たすようにする。
個人と対応付けられた複数の項目を含む対象データを取得するデータ取得部と、
前記対象データ中の項目の値である語を抽象化した語に替えて抽象化候補データを生成する抽象化部と、
前記抽象化候補データを構成する複数の語の最小出現率を求め、各語の最小出現率を乗じた値に基づいて前記抽象化候補データを抽出する候補抽出部と、
前記抽出された抽象化候補データの項目の値の組み合わせが、前記対象データの一個人に限定されないことを条件として検定する検定部と、
を備える。
前記抽象化候補データに含まれる語の価値を取得し、前記抽象化候補データに含まれる語の価値に基づいて当該抽象化候補データの価値を求める価値判定部を備え、
前記候補抽出部が、前記抽象化候補データの価値と、前記最小出現率を乗じた値とに基
づいて前記抽象化候補データの優先度を決定しても良い。
個人と対応付けられた複数の項目を含む対象データを取得するステップと、
前記対象データ中の項目の値である語を抽象化した語に替えて抽象化候補データを生成するステップと、
前記抽象化候補データを構成する複数の語の最小出現率を求め、各語の最小出現率を乗じた値に基づいて前記抽象化候補データを抽出するステップと、
前記抽出された抽象化候補データの項目の値の組み合わせが、前記対象データの一個人に限定されないことを条件として検定するステップと、
をコンピュータが実行する。
態の構成は例示であり、本発明は実施の形態の構成に限定されない。
図1は、匿名化処理の説明図、図2は、多様化処理の説明図である。
図1(A)は、姓、年齢、性別の項目を含む会員情報から姓の項目を削除した例を示す。図1(A)に示すように年齢が記載されている会員情報に16歳の女性が一人だけであると、16歳の女性が、この会員であることが分かった時点で、その人を特定できる。即ち、16歳・女性という属性を持つ人が一人だけであると、他の情報と照らし合わせることで、個人を特定できる可能性がある。
は、生年月日を学業の区分に抽象化した場合を示し、この場合の価値の合計が1500円、最小出現数kが30、最小出現率k%が6%であった。パターン3は、生年月日を年齢に抽象化した場合を示し、この場合の価値の合計が1000円、最小出現数kが100、最小出現率k%が20%であった。
リ分析部18、ワード価値計算部19、候補抽出部44、データ出力部40を備えている。
44、データ出力部40の機能を提供する。
ータを授受する。例えば、記憶装置4は、ドライブ装置からインストールされる情報処理プログラム等を記憶する。また、記憶装置4は、プログラムを読み出し、メモリ2に引き渡す。本実施形態では、記憶装置4が前述の検定用DB41や検索情報蓄積DB42、候補テーブル45を格納している。
定しておき、この必須項目以外の項目を省略した候補パターンを作成しても良い。また、一つの項目を抽象化の程度が異なる複数のワードに抽象化して複数の候補としても良い。
、これに限らず、抽象化候補データ中で最小の出現率や、所定の項目の出現率を用いても良い。
本発明は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
2 メモリ
3 通信制御部
4 記憶装置
5 入出力インタフェース
10 匿名化装置
11 抽象化部
12 価値判定部
13 検定部
14 選択部
15 データ登録部
16 データ取得部
17 価値データ取得部
18 ワードカテゴリ分析部
19 ワード価値計算部
20 検索エンジン
21 データ出力部
22 歳以上
40 データ出力部
44 候補抽出部
45 候補テーブル
Claims (6)
- 個人と対応付けられた複数の項目を含む対象データを取得するデータ取得部と、
前記対象データ中の項目の値である語を抽象化した語に替えて抽象化候補データを生成する抽象化部と、
前記抽象化候補データを構成する前記項目毎に前記対象データの総件数に対する前記抽象化した語の出現数の割合である出現率の最小値として最小出現率を求め、前記項目の数nを異ならせた複数の組み合わせについて、各項目における前記抽象化した語の最小出現率を平均した平均出現率、各項目の中で最も小さい最小出現率、又は、所定項目の最小出現率を代表出現率Sとして求め、下記式1から前記抽象化候補データの匿名化が可能と推定される前記対象データの推定件数Mを求め、前記項目の組み合わせのうち、前記推定件数Mが前記対象データの総件数を超えない前記項目の数nの最大値を前記項目の数の限界数とし、当該限界数以下の項目を含む前記抽象化候補データを抽出する候補抽出部と、
前記抽出された抽象化候補データの項目の値の組み合わせが、前記対象データの一個人に限定されないことを条件として検定する検定部と、
を備える匿名化装置。
M=(K/S)n・・・式1
但し、
M:匿名化が可能と推定される前記対象データの推定件数
K:匿名性を満たす基準として設定された前記抽象化候補データにおける前記抽象化された語の最小の出現数
S:前記代表出現率
n:前記抽象化候補データ中の前記項目の数 - 前記候補抽出部が、前記最小出現率を乗じた値に基づいて前記抽象化候補データの優先度を決定し、当該優先度に基づいて前記抽象化候補データを抽出する請求項1に記載の匿名化装置。
- 前記候補抽出部が、前記最小出現率を乗じた値を閾値と比較し、前記最小出現率を乗じた値が閾値以上である前記抽象化候補データを抽出する請求項1又は2に記載の匿名化装置。
- 前記抽象化候補データに含まれる前記抽象化した語の価値を取得し、前記抽象化候補データに含まれる前記抽象化した語の価値に基づいて当該抽象化候補データの価値を求める価値判定部を備え、
前記候補抽出部が、前記抽象化候補データの価値と、前記最小出現率を乗じた値とに基づいて抽象化候補データの優先度を決定する請求項2に記載の匿名化装置。 - 個人と対応付けられた複数の項目を含む対象データを取得するステップと、
前記対象データ中の項目の値である語を抽象化した語に替えて抽象化候補データを生成するステップと、
前記抽象化候補データを構成する前記項目毎に前記対象データの総件数に対する前記抽象化した語の出現数の割合である出現率の最小値として最小出現率を求め、前記項目の数nを異ならせた複数の組み合わせについて、各項目における前記抽象化した語の最小出現率を平均した平均出現率、各項目の中で最も小さい最小出現率、又は、所定項目の最小出現率を代表出現率Sとして求め、下記式1から前記抽象化候補データの匿名化が可能と推定される前記対象データの推定件数Mを求め、前記項目の組み合わせのうち、前記推定件数Mが前記対象データの総件数を超えない前記項目の数nの最大値を前記項目の数の限界数とし、当該限界数以下の項目を含む前記抽象化候補データを抽出するステップと、
前記抽出された抽象化候補データの項目の値の組み合わせが、前記対象データの一個人に限定されないことを条件として検定するステップと、
をコンピュータが実行する匿名化方法。
M=(K/S)n・・・式1
但し、
M:匿名化が可能と推定される前記対象データの推定件数
K:匿名性を満たす基準として設定された前記抽象化候補データにおける前記抽象化された語の最小の出現数
S:前記代表出現率
n:前記抽象化候補データ中の前記項目の数 - 個人と対応付けられた複数の項目を含む対象データを取得するステップと、
前記対象データ中の項目の値である語を抽象化した語に替えて抽象化候補データを生成するステップと、
前記抽象化候補データを構成する前記項目毎に前記対象データの総件数に対する前記抽象化した語の出現数の割合である出現率の最小値として最小出現率を求め、前記項目の数nを異ならせた複数の組み合わせについて、各項目における前記抽象化した語の最小出現率を平均した平均出現率、各項目の中で最も小さい最小出現率、又は、所定項目の最小出現率を代表出現率Sとして求め、下記式1から前記抽象化候補データの匿名化が可能と推定される前記対象データの推定件数Mを求め、前記項目の組み合わせのうち、前記推定件数Mが前記対象データの総件数を超えない前記項目の数nの最大値を前記項目の数の限界数とし、当該限界数以下の項目を含む前記抽象化候補データを抽出するステップと、
前記抽出された抽象化候補データの項目の値の組み合わせが、前記対象データの一個人に限定されないことを条件として検定するステップと、
をコンピュータに実行させるための匿名化プログラム。
M=(K/S)n・・・式1
但し、
M:匿名化が可能と推定される前記対象データの推定件数
K:匿名性を満たす基準として設定された前記抽象化候補データにおける前記抽象化された語の最小の出現数
S:前記代表出現率
n:前記抽象化候補データ中の前記項目の数
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013213535A JP6375107B2 (ja) | 2013-10-11 | 2013-10-11 | 匿名化装置、匿名化方法、及び匿名化プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013213535A JP6375107B2 (ja) | 2013-10-11 | 2013-10-11 | 匿名化装置、匿名化方法、及び匿名化プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015076035A JP2015076035A (ja) | 2015-04-20 |
JP6375107B2 true JP6375107B2 (ja) | 2018-08-15 |
Family
ID=53000813
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013213535A Active JP6375107B2 (ja) | 2013-10-11 | 2013-10-11 | 匿名化装置、匿名化方法、及び匿名化プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6375107B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7100563B2 (ja) * | 2018-11-08 | 2022-07-13 | 株式会社日立製作所 | 匿名化システムおよび匿名化方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3866210B2 (ja) * | 2003-03-20 | 2007-01-10 | 株式会社エヌ・ティ・ティ・データ | 個人特定防止装置、個人特定防止方法、および、プログラム |
US8544104B2 (en) * | 2010-05-10 | 2013-09-24 | International Business Machines Corporation | Enforcement of data privacy to maintain obfuscation of certain data |
JP5626733B2 (ja) * | 2011-10-04 | 2014-11-19 | 株式会社日立製作所 | 個人情報匿名化装置及び方法 |
JP5782637B2 (ja) * | 2012-03-23 | 2015-09-24 | 西日本電信電話株式会社 | 属性選択装置、情報匿名化装置、属性選択方法、情報匿名化方法、属性選択プログラム、及び情報匿名化プログラム |
-
2013
- 2013-10-11 JP JP2013213535A patent/JP6375107B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015076035A (ja) | 2015-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Discovering different kinds of smartphone users through their application usage behaviors | |
US9760735B2 (en) | Anonymous information exchange | |
EP2793162A1 (en) | Anonymization device, anonymization method, and computer program | |
Çavdar et al. | Airline customer lifetime value estimation using data analytics supported by social network information | |
CN110334356A (zh) | 文章质量的确定方法、文章筛选方法、以及相应的装置 | |
JP6214150B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP2017126215A (ja) | 情報選択装置、情報選択方法および情報選択プログラム | |
JP6663005B2 (ja) | インターネットコンテンツ提供サーバ及びその方法が具現化されたコンピュータで判読できる記録媒体 | |
JP2018081550A (ja) | 営業活動支援装置、営業活動支援方法および営業活動支援プログラム | |
JP6104674B2 (ja) | 匿名情報配信システム、匿名情報配信方法及び匿名情報配信プログラム | |
JP6917348B2 (ja) | 提供装置、提供方法、及び提供プログラム | |
JP6169444B2 (ja) | 匿名化システム | |
JP6375107B2 (ja) | 匿名化装置、匿名化方法、及び匿名化プログラム | |
WO2014050837A1 (ja) | 判定装置、判定方法、及びコンピュータ読み取り可能な記録媒体 | |
JP7278100B2 (ja) | 投稿評価システム及び方法 | |
JP6789755B2 (ja) | 抽出装置、抽出方法および抽出プログラム | |
JP2020095561A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
Sinha et al. | Modeling time to open of emails with a latent state for user engagement level | |
JP2015125646A (ja) | 匿名化システム | |
JP6339403B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
CN111382343B (zh) | 一种标签体系生成方法及装置 | |
JP5860116B2 (ja) | 減少係数算出装置、それを用いた匿名処理装置、方法及びプログラム | |
JP2017004260A (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP6313944B2 (ja) | 匿名化システム、匿名化方法及び匿名化プログラム | |
Horváth et al. | The Impact of Influencers on Consumers’ Purchasing Decisions When Shopping Online |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160921 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170919 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180403 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180723 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6375107 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |