CN103279499A - 个性化信息检索中用户隐私保护方法 - Google Patents
个性化信息检索中用户隐私保护方法 Download PDFInfo
- Publication number
- CN103279499A CN103279499A CN2013101673998A CN201310167399A CN103279499A CN 103279499 A CN103279499 A CN 103279499A CN 2013101673998 A CN2013101673998 A CN 2013101673998A CN 201310167399 A CN201310167399 A CN 201310167399A CN 103279499 A CN103279499 A CN 103279499A
- Authority
- CN
- China
- Prior art keywords
- user
- information retrieval
- privacy
- privacy protection
- difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Abstract
个性化信息检索中用户隐私保护方法是基于差分隐私的用户兴趣模型匿名化方法。目的是解决用户隐私保护和提升个性化信息检索性能之间矛盾。该方法针对隐匿用户兴趣模型中的标示符后的匿名化,即去掉其中的标示符(如用户ID、姓名、身份证号、SSN等)后,主要利用差分隐私的相关技术对用户兴趣模型中准标示符的匿名化。即对用户的准标示符进行泛化并添加Laplace噪音满足差分隐私保护要求,最大化统计数据库中的查询精度,同时最小化识别个体及属性的概率;该方法可广泛应用于个性化检索、推荐等服务系统。该发明所属信息、计算机技术领域。
Description
技术领域
该发明所属信息、计算机技术领域。
背景技术
实现个性化信息检索,需要跟踪和学习用户的兴趣和行为,生成用户兴趣模型,根据用户兴趣过滤信息以达到准确提供给用户所需信息的目的。然而,个性化检索面临一个重要问题:用户隐私泄露。如何在保证用户隐私的前提下,提高用户兴趣模型在个性化信息检索中的共享是一个值得认真研究的问题。
发明内容
为了克服现有隐私保护技术的不足,提出了基于差分隐私非交互机制的用户兴趣模型匿名化方法。解决了用户隐私保护和提升个性化信息检索性能之间的矛盾。
该发明解决其技术问题所采用的技术方案是:针对隐匿用户兴趣模型中的标示符后的匿名化,即去掉其中的标示符(如用户ID、姓名、身份证号、SSN等)后,利用差分隐私的相关技术对用户兴趣模型中准标示符(如年龄、性别、邮编等)的匿名化。
技术方案所依据的科学原理:数据发布中隐私保护的差分隐私技术。差分隐私是一种新的数据隐私保护方法,可假定攻击(入侵)者具有任意背景知识,该保护方法可保证在一个数据集中删除和增加一条记录不影响任何计算结果(如查询),最关键的是即使攻击(入侵)者知道了除了某一个记录之外的所有记录的敏感信息,该记录的敏感信息仍然无法预测。本发明的有益效果是,在保证用户隐私安全的前提下,能够保持或提升个性化服务性能。
附图说明
下面结合附图和实例对本发明进一步说明。
图1是用户兴趣模型准标示属性泛化的示意图。
图1中,数据泛化是通过将相对低层次的值(如属性age的数值)用高层的概念(如青年,中年和老年)替换来汇总数据。在示例学习中我们将泛化的规则看作一棵树,如图1所示。文献中多称为分类树(Hierarchy tree)。每个属性的泛化规则不一样,它们都独立对应一棵分类树,一般分类树是事先人为规定好的。
具体实施方式
个性化信息检索中用户隐私保护方法,具体步骤如下:
(1)隐匿用户模型中的标示符,设置合理的隐私预算参数ε初值。
(2)采用自上而下的方法,概率性的泛化准标示符,可将数据集划分成一些等价组。
(3)添加Lap(2/ε)噪音到每一组数据中。
(4)将满足差分隐私的数据集进行发布。
(5)完成个性化信息检索中用户隐私保护方法。
个性化信息检索中用户隐私保护方法的详细描述如下:
注:
ε-差分隐私:给定两个数据集D和D′,D和D′之间至多相差一条记录,给定一个隐私算法A,Range(A)为A的取值范围,若算法A在数据集D和D′上任意输出结果满足下列不等式,则A满足ε-差分隐私,也就是说,D和D′上输出结果的概率分布最大比率至多为eε。
其中,概率Pr[·]由算法A的随机性所控制,也表示隐私被披露的风险;ε为隐私预算(隐私预算代价参数),表示隐私保护程度,ε越小隐私保护程度越高。算法A可以表示交互式的查询方法,或者是非交互式的发布方法。
差分隐私的相关实现技术
A(D)=f(D)+Laplace(GSQ/ε) ②
其中,GS是全局敏感度:对于任意的相邻数据库D1和D2,查询Q的敏感度是D1和D2查询结果的最大不同,
GSQ=max‖Q(D1)-Q(D2)‖1 ③
机制A满足ε-差分隐私。其中,q的灵敏度是
标示符:可以显式表明个体身份的属性,如姓名、身份证号码(PID)、社会安全号码(SSN)和手机号码,能准确确认个体的信息。
准标识符,能够潜在确认个体属性的集合,如性别、年龄和邮政编码等的组合。
Claims (5)
1.个性化信息检索中用户隐私保护方法是基于差分隐私非交互机制的用户兴趣模型匿名化方法。其特征是:引入差分隐私技术。针对用户兴趣模型中准标示符的匿名化。即对用户的准标示符进行泛化并添加Laplace噪音满足差分隐私保护要求,最大化统计数据库中的查询精度,同时最小化识别个体及属性的概率,解决了用户的隐私保护和提升个性化信息检索性能之间矛盾。
2.根据权利要求1所述的个性化信息检索中用户隐私保护方法,其特征是:引入差分隐私技术。针对用户的准标示符进行泛化,可将数据集划分成一些等价组。
3.根据权利要求1所述的个性化信息检索中用户隐私保护方法,其特征是:添加Laplace噪音满足差分隐私保护要求。
4.根据权利要求1所述的个性化信息检索中用户隐私保护方法,其特征是:基于差分隐私非交互机制的用户兴趣模型匿名化方法。
5.根据权利要求1所述的个性化信息检索中用户隐私保护方法,其特征是:最大化统计数据库中的查询精度,同时最小化识别个体及属性的概率,解决了用户的隐私保护和提升个性化信息检索性能之间矛盾。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310167399.8A CN103279499B (zh) | 2013-05-09 | 2013-05-09 | 个性化信息检索中用户隐私保护方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310167399.8A CN103279499B (zh) | 2013-05-09 | 2013-05-09 | 个性化信息检索中用户隐私保护方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103279499A true CN103279499A (zh) | 2013-09-04 |
CN103279499B CN103279499B (zh) | 2016-11-09 |
Family
ID=49062019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310167399.8A Active CN103279499B (zh) | 2013-05-09 | 2013-05-09 | 个性化信息检索中用户隐私保护方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103279499B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103632109A (zh) * | 2013-11-07 | 2014-03-12 | 汪风珍 | 身份证隐私保护与挂失系统 |
CN104050267A (zh) * | 2014-06-23 | 2014-09-17 | 中国科学院软件研究所 | 基于关联规则满足用户隐私保护的个性化推荐方法及系统 |
CN104133903A (zh) * | 2014-08-04 | 2014-11-05 | 华中科技大学 | 一种基于隐私保护的数据索引方法 |
CN104216994A (zh) * | 2014-09-10 | 2014-12-17 | 华中科技大学 | 一种列联表数据发布的隐私保护方法 |
CN104462285A (zh) * | 2014-11-28 | 2015-03-25 | 广东工业大学 | 一种移动服务查询系统的隐私保护方法 |
CN104598448A (zh) * | 2013-10-30 | 2015-05-06 | 镇江睿泰信息科技有限公司 | 一种个性化信息推荐系统 |
CN105095447A (zh) * | 2015-07-24 | 2015-11-25 | 武汉大学 | 一种分布式w-事件型差分隐私无限流数据发布方法 |
CN105574438A (zh) * | 2016-01-07 | 2016-05-11 | 中国联合网络通信集团有限公司 | 用户隐私保护方法及系统 |
CN106096445A (zh) * | 2016-06-12 | 2016-11-09 | 徐州医科大学 | 基于抽样泛化路径的K‑Anonymity数据处理方法 |
CN106549762A (zh) * | 2015-09-22 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 一种数据加密方法和装置 |
CN104135362B (zh) * | 2014-07-21 | 2017-06-16 | 南京大学 | 一种基于差分隐私发布的数据的可用性计算方法 |
CN107302521A (zh) * | 2017-05-23 | 2017-10-27 | 全球能源互联网研究院 | 一种用户隐私数据的发送方法和接收方法 |
CN107368752A (zh) * | 2017-07-25 | 2017-11-21 | 北京工商大学 | 一种基于生成式对抗网络的深度差分隐私保护方法 |
CN108256000A (zh) * | 2017-12-29 | 2018-07-06 | 武汉大学 | 一种基于局部聚类的个性化差分隐私推荐方法 |
CN108537055A (zh) * | 2018-03-06 | 2018-09-14 | 南京邮电大学 | 一种数据查询隐私保护的隐私预算分配和数据发布方法及其系统 |
CN109918939A (zh) * | 2019-01-25 | 2019-06-21 | 东华大学 | 基于hmm的用户查询风险评估和隐私保护方法 |
CN110033774A (zh) * | 2017-12-07 | 2019-07-19 | 交互数字Ce专利控股公司 | 用于隐私保护型语音交互的设备和方法 |
CN111556437A (zh) * | 2020-05-12 | 2020-08-18 | 重庆邮电大学 | 一种基于差分隐私的个性化位置隐私保护方法 |
CN112307028A (zh) * | 2020-10-31 | 2021-02-02 | 海南大学 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
CN112765659A (zh) * | 2021-01-20 | 2021-05-07 | 丁同梅 | 针对大数据云服务的数据泄露防护方法及大数据服务器 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101339563A (zh) * | 2008-08-15 | 2009-01-07 | 北京航空航天大学 | 面向奇异发现推荐的兴趣模型更新方法 |
JP4522430B2 (ja) * | 2007-05-14 | 2010-08-11 | 株式会社エヌ・ティ・ティ・ドコモ | リコメンド装置及びリコメンド方法 |
CN102163230A (zh) * | 2011-04-13 | 2011-08-24 | 浙江大学 | 实现定制隐私保护的个性化信息检索系统的方法 |
-
2013
- 2013-05-09 CN CN201310167399.8A patent/CN103279499B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4522430B2 (ja) * | 2007-05-14 | 2010-08-11 | 株式会社エヌ・ティ・ティ・ドコモ | リコメンド装置及びリコメンド方法 |
CN101339563A (zh) * | 2008-08-15 | 2009-01-07 | 北京航空航天大学 | 面向奇异发现推荐的兴趣模型更新方法 |
CN102163230A (zh) * | 2011-04-13 | 2011-08-24 | 浙江大学 | 实现定制隐私保护的个性化信息检索系统的方法 |
Non-Patent Citations (4)
Title |
---|
吴泓润 等: "一种带频繁项过滤机制的隐私保护新方法", 《计算机应用研究》 * |
李杨 等: "差分隐私保护k-means聚类方法研究", 《计算机科学》 * |
李杨 等: "差分隐私保护研究综述", 《计算机应用研究》 * |
李清华 等: "个性化搜索中用户兴趣模型匿名化研究", 《西安交通大学学报》 * |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598448A (zh) * | 2013-10-30 | 2015-05-06 | 镇江睿泰信息科技有限公司 | 一种个性化信息推荐系统 |
CN103632109A (zh) * | 2013-11-07 | 2014-03-12 | 汪风珍 | 身份证隐私保护与挂失系统 |
CN103632109B (zh) * | 2013-11-07 | 2016-08-03 | 汪风珍 | 身份证隐私保护与挂失系统 |
CN104050267A (zh) * | 2014-06-23 | 2014-09-17 | 中国科学院软件研究所 | 基于关联规则满足用户隐私保护的个性化推荐方法及系统 |
CN104050267B (zh) * | 2014-06-23 | 2017-10-03 | 中国科学院软件研究所 | 基于关联规则满足用户隐私保护的个性化推荐方法及系统 |
CN104135362B (zh) * | 2014-07-21 | 2017-06-16 | 南京大学 | 一种基于差分隐私发布的数据的可用性计算方法 |
CN104133903B (zh) * | 2014-08-04 | 2017-05-17 | 华中科技大学 | 一种基于隐私保护的数据索引方法 |
CN104133903A (zh) * | 2014-08-04 | 2014-11-05 | 华中科技大学 | 一种基于隐私保护的数据索引方法 |
CN104216994A (zh) * | 2014-09-10 | 2014-12-17 | 华中科技大学 | 一种列联表数据发布的隐私保护方法 |
CN104216994B (zh) * | 2014-09-10 | 2017-06-20 | 华中科技大学 | 一种列联表数据发布的隐私保护方法 |
CN104462285A (zh) * | 2014-11-28 | 2015-03-25 | 广东工业大学 | 一种移动服务查询系统的隐私保护方法 |
CN104462285B (zh) * | 2014-11-28 | 2017-10-10 | 广东工业大学 | 一种移动服务查询系统的隐私保护方法 |
CN105095447A (zh) * | 2015-07-24 | 2015-11-25 | 武汉大学 | 一种分布式w-事件型差分隐私无限流数据发布方法 |
CN105095447B (zh) * | 2015-07-24 | 2018-02-09 | 武汉大学 | 一种分布式w‑事件型差分隐私无限流数据发布方法 |
CN106549762A (zh) * | 2015-09-22 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 一种数据加密方法和装置 |
CN106549762B (zh) * | 2015-09-22 | 2019-08-09 | 阿里巴巴集团控股有限公司 | 一种数据加密方法和装置 |
CN105574438A (zh) * | 2016-01-07 | 2016-05-11 | 中国联合网络通信集团有限公司 | 用户隐私保护方法及系统 |
CN105574438B (zh) * | 2016-01-07 | 2018-10-30 | 中国联合网络通信集团有限公司 | 用户隐私保护方法及系统 |
CN106096445A (zh) * | 2016-06-12 | 2016-11-09 | 徐州医科大学 | 基于抽样泛化路径的K‑Anonymity数据处理方法 |
CN107302521A (zh) * | 2017-05-23 | 2017-10-27 | 全球能源互联网研究院 | 一种用户隐私数据的发送方法和接收方法 |
CN107302521B (zh) * | 2017-05-23 | 2021-03-23 | 全球能源互联网研究院有限公司 | 一种用户隐私数据的发送方法和接收方法 |
CN107368752A (zh) * | 2017-07-25 | 2017-11-21 | 北京工商大学 | 一种基于生成式对抗网络的深度差分隐私保护方法 |
CN107368752B (zh) * | 2017-07-25 | 2019-06-28 | 北京工商大学 | 一种基于生成式对抗网络的深度差分隐私保护方法 |
CN110033774A (zh) * | 2017-12-07 | 2019-07-19 | 交互数字Ce专利控股公司 | 用于隐私保护型语音交互的设备和方法 |
CN108256000A (zh) * | 2017-12-29 | 2018-07-06 | 武汉大学 | 一种基于局部聚类的个性化差分隐私推荐方法 |
CN108256000B (zh) * | 2017-12-29 | 2021-06-15 | 武汉大学 | 一种基于局部聚类的个性化差分隐私推荐方法 |
CN108537055A (zh) * | 2018-03-06 | 2018-09-14 | 南京邮电大学 | 一种数据查询隐私保护的隐私预算分配和数据发布方法及其系统 |
CN109918939A (zh) * | 2019-01-25 | 2019-06-21 | 东华大学 | 基于hmm的用户查询风险评估和隐私保护方法 |
CN109918939B (zh) * | 2019-01-25 | 2023-08-11 | 东华大学 | 基于hmm的用户查询风险评估和隐私保护方法 |
CN111556437B (zh) * | 2020-05-12 | 2021-11-16 | 重庆邮电大学 | 一种基于差分隐私的个性化位置隐私保护方法 |
CN111556437A (zh) * | 2020-05-12 | 2020-08-18 | 重庆邮电大学 | 一种基于差分隐私的个性化位置隐私保护方法 |
CN112307028A (zh) * | 2020-10-31 | 2021-02-02 | 海南大学 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
CN112307028B (zh) * | 2020-10-31 | 2021-11-12 | 海南大学 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
WO2022088674A1 (zh) * | 2020-10-31 | 2022-05-05 | 海南大学 | 跨数据信息知识模态的面向本质计算的差分内容推荐方法 |
CN112765659B (zh) * | 2021-01-20 | 2021-09-21 | 曙光星云信息技术(北京)有限公司 | 针对大数据云服务的数据泄露防护方法及大数据服务器 |
CN112765659A (zh) * | 2021-01-20 | 2021-05-07 | 丁同梅 | 针对大数据云服务的数据泄露防护方法及大数据服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN103279499B (zh) | 2016-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103279499A (zh) | 个性化信息检索中用户隐私保护方法 | |
CN110069943B (zh) | 一种基于聚类匿名化与差分隐私保护的数据处理方法及系统 | |
CN101964034A (zh) | 一种模式信息损失最小化的序列类数据隐私保护方法 | |
CN101510204B (zh) | 一种基于目标条件关联规则数据库异常查询监测方法 | |
CN106650487A (zh) | 基于多维敏感数据发布的多部图隐私保护方法 | |
CN108959958A (zh) | 一种关联大数据的隐私保护方法及系统 | |
CN114092729A (zh) | 基于聚类匿名化与差分隐私保护的异构用电数据发布方法 | |
Xiong et al. | Frequent itemsets mining with differential privacy over large-scale data | |
Khan et al. | Development of national health data warehouse Bangladesh: Privacy issues and a practical solution | |
Elabd et al. | L–diversity-based semantic anonymaztion for data publishing | |
Usha et al. | Sensitive attribute based non-homogeneous anonymization for privacy preserving data mining | |
Gkountouna et al. | km-Anonymity for continuous data using dynamic hierarchies | |
Abuwardih et al. | Privacy preserving data mining on published data in healthcare: A survey | |
CN110008748A (zh) | 数据动态更新隐私保护方法及语义贴近度计算方法 | |
Dubli et al. | Secure Techniques of Data Anonymization for Privacy Preservation. | |
Mahesh | A New Method for Preserving Privacy in Data Publishing Against Attribute and Identity Disclosure Risk | |
Chen et al. | Privacy protection method for vehicle trajectory based on VLPR data | |
De Capitani di Vimercati et al. | Privacy in data publishing | |
Krishna et al. | A New Approach To Maintain Privacy And Accuracy In Classification Data Mining | |
Dai et al. | Grid Anonymous Trajectory Privacy Protection Algorithm Based on Differential Privacy | |
Alphonsa et al. | Methodology of privacy preserving data publishing by data slicing | |
Miao | Coded Social Control: China's Normalization of Biometric Surveillance in the Post COVID-19 Era | |
Lee et al. | Detecting method on illegal use using PCA under HER environment | |
Jia et al. | Personalized sensitive attribute anonymity based on P-sensitive K anonymity | |
Jiang et al. | Quantifying fine-grained privacy risk and representativeness in medical data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |