CN103279499A - 个性化信息检索中用户隐私保护方法 - Google Patents

个性化信息检索中用户隐私保护方法 Download PDF

Info

Publication number
CN103279499A
CN103279499A CN2013101673998A CN201310167399A CN103279499A CN 103279499 A CN103279499 A CN 103279499A CN 2013101673998 A CN2013101673998 A CN 2013101673998A CN 201310167399 A CN201310167399 A CN 201310167399A CN 103279499 A CN103279499 A CN 103279499A
Authority
CN
China
Prior art keywords
user
information retrieval
privacy
privacy protection
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101673998A
Other languages
English (en)
Other versions
CN103279499B (zh
Inventor
康海燕
苑晓姣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Information Science and Technology University
Original Assignee
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University filed Critical Beijing Information Science and Technology University
Priority to CN201310167399.8A priority Critical patent/CN103279499B/zh
Publication of CN103279499A publication Critical patent/CN103279499A/zh
Application granted granted Critical
Publication of CN103279499B publication Critical patent/CN103279499B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

个性化信息检索中用户隐私保护方法是基于差分隐私的用户兴趣模型匿名化方法。目的是解决用户隐私保护和提升个性化信息检索性能之间矛盾。该方法针对隐匿用户兴趣模型中的标示符后的匿名化,即去掉其中的标示符(如用户ID、姓名、身份证号、SSN等)后,主要利用差分隐私的相关技术对用户兴趣模型中准标示符的匿名化。即对用户的准标示符进行泛化并添加Laplace噪音满足差分隐私保护要求,最大化统计数据库中的查询精度,同时最小化识别个体及属性的概率;该方法可广泛应用于个性化检索、推荐等服务系统。该发明所属信息、计算机技术领域。

Description

个性化信息检索中用户隐私保护方法
技术领域
该发明所属信息、计算机技术领域。 
背景技术
实现个性化信息检索,需要跟踪和学习用户的兴趣和行为,生成用户兴趣模型,根据用户兴趣过滤信息以达到准确提供给用户所需信息的目的。然而,个性化检索面临一个重要问题:用户隐私泄露。如何在保证用户隐私的前提下,提高用户兴趣模型在个性化信息检索中的共享是一个值得认真研究的问题。 
发明内容
为了克服现有隐私保护技术的不足,提出了基于差分隐私非交互机制的用户兴趣模型匿名化方法。解决了用户隐私保护和提升个性化信息检索性能之间的矛盾。 
该发明解决其技术问题所采用的技术方案是:针对隐匿用户兴趣模型中的标示符后的匿名化,即去掉其中的标示符(如用户ID、姓名、身份证号、SSN等)后,利用差分隐私的相关技术对用户兴趣模型中准标示符(如年龄、性别、邮编等)的匿名化。 
技术方案所依据的科学原理:数据发布中隐私保护的差分隐私技术。差分隐私是一种新的数据隐私保护方法,可假定攻击(入侵)者具有任意背景知识,该保护方法可保证在一个数据集中删除和增加一条记录不影响任何计算结果(如查询),最关键的是即使攻击(入侵)者知道了除了某一个记录之外的所有记录的敏感信息,该记录的敏感信息仍然无法预测。本发明的有益效果是,在保证用户隐私安全的前提下,能够保持或提升个性化服务性能。 
附图说明
下面结合附图和实例对本发明进一步说明。 
图1是用户兴趣模型准标示属性泛化的示意图。 
图1中,数据泛化是通过将相对低层次的值(如属性age的数值)用高层的概念(如青年,中年和老年)替换来汇总数据。在示例学习中我们将泛化的规则看作一棵树,如图1所示。文献中多称为分类树(Hierarchy tree)。每个属性的泛化规则不一样,它们都独立对应一棵分类树,一般分类树是事先人为规定好的。 
具体实施方式
个性化信息检索中用户隐私保护方法,具体步骤如下: 
(1)隐匿用户模型中的标示符,设置合理的隐私预算参数ε初值。 
(2)采用自上而下的方法,概率性的泛化准标示符,可将数据集划分成一些等价组。 
(3)添加Lap(2/ε)噪音到每一组数据中。 
(4)将满足差分隐私的数据集进行发布。 
(5)完成个性化信息检索中用户隐私保护方法。 
个性化信息检索中用户隐私保护方法的详细描述如下: 
注: 
ε-差分隐私:给定两个数据集D和D′,D和D′之间至多相差一条记录,给定一个隐私算法A,Range(A)为A的取值范围,若算法A在数据集D和D′上任意输出结果
Figure BSA00000890607200031
满足下列不等式,则A满足ε-差分隐私,也就是说,D和D′上输出结果的概率分布最大比率至多为eε。 
Figure BSA00000890607200032
其中,概率Pr[·]由算法A的随机性所控制,也表示隐私被披露的风险;ε为隐私预算(隐私预算代价参数),表示隐私保护程度,ε越小隐私保护程度越高。算法A可以表示交互式的查询方法,或者是非交互式的发布方法。 
差分隐私的相关实现技术 
(1)拉普拉斯(Laplace)机制。对于任何函数f:
Figure BSA00000890607200033
隐私算法A,A提供ε-差分隐私 
A(D)=f(D)+Laplace(GSQ/ε)  ② 
其中,GS是全局敏感度:对于任意的相邻数据库D1和D2,查询Q的敏感度是D1和D2查询结果的最大不同, 
GSQ=max‖Q(D1)-Q(D2)‖1  ③ 
(2)指数机制:基本思想是从一个私有分布中抽样来回答非数值查询。关键是如何设计函数q(D,r),r表示从输出域
Figure BSA00000890607200034
中所选择的输出项。对于数据集D,给定一个效用函数q:(D×R)→R, 
A ( D , q ) = { returnrwithprobability ∝ exp ( ϵq ( D , r ) 2 Δq ) }    ④ 
机制A满足ε-差分隐私。其中,q的灵敏度是 Δq = max ∀ r , D 1 , D 2 | | q ( D 1 , r ) - q ( D 2 , r ) | | 1
标示符:可以显式表明个体身份的属性,如姓名、身份证号码(PID)、社会安全号码(SSN)和手机号码,能准确确认个体的信息。 
准标识符,能够潜在确认个体属性的集合,如性别、年龄和邮政编码等的组合。 

Claims (5)

1.个性化信息检索中用户隐私保护方法是基于差分隐私非交互机制的用户兴趣模型匿名化方法。其特征是:引入差分隐私技术。针对用户兴趣模型中准标示符的匿名化。即对用户的准标示符进行泛化并添加Laplace噪音满足差分隐私保护要求,最大化统计数据库中的查询精度,同时最小化识别个体及属性的概率,解决了用户的隐私保护和提升个性化信息检索性能之间矛盾。
2.根据权利要求1所述的个性化信息检索中用户隐私保护方法,其特征是:引入差分隐私技术。针对用户的准标示符进行泛化,可将数据集划分成一些等价组。
3.根据权利要求1所述的个性化信息检索中用户隐私保护方法,其特征是:添加Laplace噪音满足差分隐私保护要求。
4.根据权利要求1所述的个性化信息检索中用户隐私保护方法,其特征是:基于差分隐私非交互机制的用户兴趣模型匿名化方法。
5.根据权利要求1所述的个性化信息检索中用户隐私保护方法,其特征是:最大化统计数据库中的查询精度,同时最小化识别个体及属性的概率,解决了用户的隐私保护和提升个性化信息检索性能之间矛盾。
CN201310167399.8A 2013-05-09 2013-05-09 个性化信息检索中用户隐私保护方法 Active CN103279499B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310167399.8A CN103279499B (zh) 2013-05-09 2013-05-09 个性化信息检索中用户隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310167399.8A CN103279499B (zh) 2013-05-09 2013-05-09 个性化信息检索中用户隐私保护方法

Publications (2)

Publication Number Publication Date
CN103279499A true CN103279499A (zh) 2013-09-04
CN103279499B CN103279499B (zh) 2016-11-09

Family

ID=49062019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310167399.8A Active CN103279499B (zh) 2013-05-09 2013-05-09 个性化信息检索中用户隐私保护方法

Country Status (1)

Country Link
CN (1) CN103279499B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103632109A (zh) * 2013-11-07 2014-03-12 汪风珍 身份证隐私保护与挂失系统
CN104050267A (zh) * 2014-06-23 2014-09-17 中国科学院软件研究所 基于关联规则满足用户隐私保护的个性化推荐方法及系统
CN104133903A (zh) * 2014-08-04 2014-11-05 华中科技大学 一种基于隐私保护的数据索引方法
CN104216994A (zh) * 2014-09-10 2014-12-17 华中科技大学 一种列联表数据发布的隐私保护方法
CN104462285A (zh) * 2014-11-28 2015-03-25 广东工业大学 一种移动服务查询系统的隐私保护方法
CN104598448A (zh) * 2013-10-30 2015-05-06 镇江睿泰信息科技有限公司 一种个性化信息推荐系统
CN105095447A (zh) * 2015-07-24 2015-11-25 武汉大学 一种分布式w-事件型差分隐私无限流数据发布方法
CN105574438A (zh) * 2016-01-07 2016-05-11 中国联合网络通信集团有限公司 用户隐私保护方法及系统
CN106096445A (zh) * 2016-06-12 2016-11-09 徐州医科大学 基于抽样泛化路径的K‑Anonymity数据处理方法
CN106549762A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种数据加密方法和装置
CN104135362B (zh) * 2014-07-21 2017-06-16 南京大学 一种基于差分隐私发布的数据的可用性计算方法
CN107302521A (zh) * 2017-05-23 2017-10-27 全球能源互联网研究院 一种用户隐私数据的发送方法和接收方法
CN107368752A (zh) * 2017-07-25 2017-11-21 北京工商大学 一种基于生成式对抗网络的深度差分隐私保护方法
CN108256000A (zh) * 2017-12-29 2018-07-06 武汉大学 一种基于局部聚类的个性化差分隐私推荐方法
CN108537055A (zh) * 2018-03-06 2018-09-14 南京邮电大学 一种数据查询隐私保护的隐私预算分配和数据发布方法及其系统
CN109918939A (zh) * 2019-01-25 2019-06-21 东华大学 基于hmm的用户查询风险评估和隐私保护方法
CN110033774A (zh) * 2017-12-07 2019-07-19 交互数字Ce专利控股公司 用于隐私保护型语音交互的设备和方法
CN111556437A (zh) * 2020-05-12 2020-08-18 重庆邮电大学 一种基于差分隐私的个性化位置隐私保护方法
CN112307028A (zh) * 2020-10-31 2021-02-02 海南大学 跨数据信息知识模态的面向本质计算的差分内容推荐方法
CN112765659A (zh) * 2021-01-20 2021-05-07 丁同梅 针对大数据云服务的数据泄露防护方法及大数据服务器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339563A (zh) * 2008-08-15 2009-01-07 北京航空航天大学 面向奇异发现推荐的兴趣模型更新方法
JP4522430B2 (ja) * 2007-05-14 2010-08-11 株式会社エヌ・ティ・ティ・ドコモ リコメンド装置及びリコメンド方法
CN102163230A (zh) * 2011-04-13 2011-08-24 浙江大学 实现定制隐私保护的个性化信息检索系统的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4522430B2 (ja) * 2007-05-14 2010-08-11 株式会社エヌ・ティ・ティ・ドコモ リコメンド装置及びリコメンド方法
CN101339563A (zh) * 2008-08-15 2009-01-07 北京航空航天大学 面向奇异发现推荐的兴趣模型更新方法
CN102163230A (zh) * 2011-04-13 2011-08-24 浙江大学 实现定制隐私保护的个性化信息检索系统的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
吴泓润 等: "一种带频繁项过滤机制的隐私保护新方法", 《计算机应用研究》 *
李杨 等: "差分隐私保护k-means聚类方法研究", 《计算机科学》 *
李杨 等: "差分隐私保护研究综述", 《计算机应用研究》 *
李清华 等: "个性化搜索中用户兴趣模型匿名化研究", 《西安交通大学学报》 *

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598448A (zh) * 2013-10-30 2015-05-06 镇江睿泰信息科技有限公司 一种个性化信息推荐系统
CN103632109A (zh) * 2013-11-07 2014-03-12 汪风珍 身份证隐私保护与挂失系统
CN103632109B (zh) * 2013-11-07 2016-08-03 汪风珍 身份证隐私保护与挂失系统
CN104050267A (zh) * 2014-06-23 2014-09-17 中国科学院软件研究所 基于关联规则满足用户隐私保护的个性化推荐方法及系统
CN104050267B (zh) * 2014-06-23 2017-10-03 中国科学院软件研究所 基于关联规则满足用户隐私保护的个性化推荐方法及系统
CN104135362B (zh) * 2014-07-21 2017-06-16 南京大学 一种基于差分隐私发布的数据的可用性计算方法
CN104133903B (zh) * 2014-08-04 2017-05-17 华中科技大学 一种基于隐私保护的数据索引方法
CN104133903A (zh) * 2014-08-04 2014-11-05 华中科技大学 一种基于隐私保护的数据索引方法
CN104216994A (zh) * 2014-09-10 2014-12-17 华中科技大学 一种列联表数据发布的隐私保护方法
CN104216994B (zh) * 2014-09-10 2017-06-20 华中科技大学 一种列联表数据发布的隐私保护方法
CN104462285A (zh) * 2014-11-28 2015-03-25 广东工业大学 一种移动服务查询系统的隐私保护方法
CN104462285B (zh) * 2014-11-28 2017-10-10 广东工业大学 一种移动服务查询系统的隐私保护方法
CN105095447A (zh) * 2015-07-24 2015-11-25 武汉大学 一种分布式w-事件型差分隐私无限流数据发布方法
CN105095447B (zh) * 2015-07-24 2018-02-09 武汉大学 一种分布式w‑事件型差分隐私无限流数据发布方法
CN106549762A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种数据加密方法和装置
CN106549762B (zh) * 2015-09-22 2019-08-09 阿里巴巴集团控股有限公司 一种数据加密方法和装置
CN105574438A (zh) * 2016-01-07 2016-05-11 中国联合网络通信集团有限公司 用户隐私保护方法及系统
CN105574438B (zh) * 2016-01-07 2018-10-30 中国联合网络通信集团有限公司 用户隐私保护方法及系统
CN106096445A (zh) * 2016-06-12 2016-11-09 徐州医科大学 基于抽样泛化路径的K‑Anonymity数据处理方法
CN107302521A (zh) * 2017-05-23 2017-10-27 全球能源互联网研究院 一种用户隐私数据的发送方法和接收方法
CN107302521B (zh) * 2017-05-23 2021-03-23 全球能源互联网研究院有限公司 一种用户隐私数据的发送方法和接收方法
CN107368752A (zh) * 2017-07-25 2017-11-21 北京工商大学 一种基于生成式对抗网络的深度差分隐私保护方法
CN107368752B (zh) * 2017-07-25 2019-06-28 北京工商大学 一种基于生成式对抗网络的深度差分隐私保护方法
CN110033774A (zh) * 2017-12-07 2019-07-19 交互数字Ce专利控股公司 用于隐私保护型语音交互的设备和方法
CN108256000A (zh) * 2017-12-29 2018-07-06 武汉大学 一种基于局部聚类的个性化差分隐私推荐方法
CN108256000B (zh) * 2017-12-29 2021-06-15 武汉大学 一种基于局部聚类的个性化差分隐私推荐方法
CN108537055A (zh) * 2018-03-06 2018-09-14 南京邮电大学 一种数据查询隐私保护的隐私预算分配和数据发布方法及其系统
CN109918939A (zh) * 2019-01-25 2019-06-21 东华大学 基于hmm的用户查询风险评估和隐私保护方法
CN109918939B (zh) * 2019-01-25 2023-08-11 东华大学 基于hmm的用户查询风险评估和隐私保护方法
CN111556437B (zh) * 2020-05-12 2021-11-16 重庆邮电大学 一种基于差分隐私的个性化位置隐私保护方法
CN111556437A (zh) * 2020-05-12 2020-08-18 重庆邮电大学 一种基于差分隐私的个性化位置隐私保护方法
CN112307028A (zh) * 2020-10-31 2021-02-02 海南大学 跨数据信息知识模态的面向本质计算的差分内容推荐方法
CN112307028B (zh) * 2020-10-31 2021-11-12 海南大学 跨数据信息知识模态的面向本质计算的差分内容推荐方法
WO2022088674A1 (zh) * 2020-10-31 2022-05-05 海南大学 跨数据信息知识模态的面向本质计算的差分内容推荐方法
CN112765659B (zh) * 2021-01-20 2021-09-21 曙光星云信息技术(北京)有限公司 针对大数据云服务的数据泄露防护方法及大数据服务器
CN112765659A (zh) * 2021-01-20 2021-05-07 丁同梅 针对大数据云服务的数据泄露防护方法及大数据服务器

Also Published As

Publication number Publication date
CN103279499B (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
CN103279499A (zh) 个性化信息检索中用户隐私保护方法
CN110069943B (zh) 一种基于聚类匿名化与差分隐私保护的数据处理方法及系统
CN101964034A (zh) 一种模式信息损失最小化的序列类数据隐私保护方法
CN101510204B (zh) 一种基于目标条件关联规则数据库异常查询监测方法
CN106650487A (zh) 基于多维敏感数据发布的多部图隐私保护方法
CN108959958A (zh) 一种关联大数据的隐私保护方法及系统
CN114092729A (zh) 基于聚类匿名化与差分隐私保护的异构用电数据发布方法
Xiong et al. Frequent itemsets mining with differential privacy over large-scale data
Khan et al. Development of national health data warehouse Bangladesh: Privacy issues and a practical solution
Elabd et al. L–diversity-based semantic anonymaztion for data publishing
Usha et al. Sensitive attribute based non-homogeneous anonymization for privacy preserving data mining
Gkountouna et al. km-Anonymity for continuous data using dynamic hierarchies
Abuwardih et al. Privacy preserving data mining on published data in healthcare: A survey
CN110008748A (zh) 数据动态更新隐私保护方法及语义贴近度计算方法
Dubli et al. Secure Techniques of Data Anonymization for Privacy Preservation.
Mahesh A New Method for Preserving Privacy in Data Publishing Against Attribute and Identity Disclosure Risk
Chen et al. Privacy protection method for vehicle trajectory based on VLPR data
De Capitani di Vimercati et al. Privacy in data publishing
Krishna et al. A New Approach To Maintain Privacy And Accuracy In Classification Data Mining
Dai et al. Grid Anonymous Trajectory Privacy Protection Algorithm Based on Differential Privacy
Alphonsa et al. Methodology of privacy preserving data publishing by data slicing
Miao Coded Social Control: China's Normalization of Biometric Surveillance in the Post COVID-19 Era
Lee et al. Detecting method on illegal use using PCA under HER environment
Jia et al. Personalized sensitive attribute anonymity based on P-sensitive K anonymity
Jiang et al. Quantifying fine-grained privacy risk and representativeness in medical data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant