CN102622544A - 个性化服务中用户兴趣模型匿名化方法 - Google Patents

个性化服务中用户兴趣模型匿名化方法 Download PDF

Info

Publication number
CN102622544A
CN102622544A CN2012100472855A CN201210047285A CN102622544A CN 102622544 A CN102622544 A CN 102622544A CN 2012100472855 A CN2012100472855 A CN 2012100472855A CN 201210047285 A CN201210047285 A CN 201210047285A CN 102622544 A CN102622544 A CN 102622544A
Authority
CN
China
Prior art keywords
user
interest model
link
personalized service
user interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100472855A
Other languages
English (en)
Inventor
康海燕
熊莉
李清华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Information Science and Technology University
Original Assignee
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University filed Critical Beijing Information Science and Technology University
Priority to CN2012100472855A priority Critical patent/CN102622544A/zh
Publication of CN102622544A publication Critical patent/CN102622544A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

个性化服务中用户兴趣模型匿名化方法是基于p-link隐私保护的用户兴趣模型匿名化方法。目的是解决用户隐私保护和提升个性化服务性能之间矛盾。该方法引入p-link隐私概念,p是对于隐私保护的度量。当用户组中的用户与组中任意关键词联系起来的概率不超过p时,用户组被认为是满足p-link,即攻击者根据背景知识链接确定某一用户的概率不超过p;要满足p-link隐私约束,需要对用户兴趣模型基于语义的扩增处理;根据用户兴趣模型之间的相似性,将相似的用户兴趣模型组合,形成等价用户组兴趣模型。提升个性化服务性能通过共享用户组兴趣模型实现,该方法可广泛应用于个性化检索、推荐等服务系统。该发明所属信息、计算机技术领域。

Description

个性化服务中用户兴趣模型匿名化方法
技术领域
该发明所属信息、计算机技术领域。 
背景技术
实现个性化服务,需要跟踪和学习用户的兴趣和行为,生成用户兴趣模型,根据用户兴趣过滤信息以达到准确提供给用户所需信息的目的。然而,个性化检索面临一个重要问题:用户隐私安全。如何在保证用户隐私的前提下,提高用户兴趣模型在个性化服务中的共享是一个值得认真研究的问题。 
发明内容
为了克服现有隐私保护技术的不足,提出了基于p-link隐私保护的用户兴趣模型匿名化方法。解决了用户隐私保护和提升个性化服务性能之间的矛盾。 
该发明解决其技术问题所采用的技术方案是:隐匿用户模型中的标示符,引入p-link隐私概念,p是对于隐私保护的度量。当用户组中的用户与组中任意关键词联系起来的概率不超过p时,这个用户组被认为是满足p-link。即攻击者根据背景知识链接确定某一用户的概率不超过p;要满足p-link隐私的约束,需要对用户兴趣模型基于语义的扩增处理;根据用户兴趣模型之间的相似性,将相似的用户兴趣模型组合,形成基于p-link隐私保护等价用户组兴趣模型,再形成一个特殊用户兴趣作为组中所有用户兴趣的代表,应用在个性化服务之中,它被称为组质心(CUP)。 
技术方案所依据的科学原理:(1)数据发布中隐私保护的k-匿名模型方法。k-匿名模型是通过对准标示符进行泛化、抑制等操作,使一个发布表中的一条记录r至少有k-1条记录与r在准标志符上的投影值相等,这样使得攻击者链接确定某一记录的概率降低为1/k。与k-匿名方法不同的是:用户兴趣模型的匿名化是聚类,根据相似性聚类得到等价用户组兴趣模型的兴趣条目,而k-匿名是对将要发布的数据通过泛化生成等价组。另外,k-匿名中的等价组要求至少包含k条记录,而等价组兴趣模型不需要限制用户的个数,而是需要满足p-link。(2)基于语义的扩增和聚类。用户兴趣模型扩增揭示了用户兴趣之间的相近语义,这使得集合分类更加可行和有效,同时为提升个性化服务性能奠定了基础。 
本发明的有益效果是,在保证用户隐私安全的前提下,能够保持或提升个性化服务性能。 
附图说明
下面结合附图和实例对本发明进一步说明。 
图1是用户兴趣模型扩增示意图。 
图1中,包括用户兴趣模型扩增处理的几种情况。在语言学中,上位词是指语义范围包括了其他词的词。同义词集的上位词是包括了根同义词集和所有它的上位词的同义词集列表。a1,a2可以代表scarlet(朱红),vermilion(丹红),carmine(洋红),crimson(深红);b1,b2分别代表aqua(浅绿),emerald(翠绿);A代表red(红);B代表green(绿);All代表color(颜色);A是的a1,a2上位词;B是b1,b2的上位词;同样,All是A,B的上位词。 
具体实施方式
个性化服务中用户兴趣模型匿名化方法,具体步骤如下: 
(1)隐匿用户模型中的标示符,设置合理p-link初值。 
(2)当p-link隐私条件不满足时,需要扩增处理,直到满足条件。扩增的第一步是同义词集的扩增,将用户资料中的所有单独的关键词扩增为同义词集。扩增的第二步是上位词集扩增,将用户资料中同义词集的所有上位词集以原同义词集相同的权重加入到用户兴趣模型中。 
(3)根据用户兴趣模型之间的相似性,将相似性较大的用户兴趣模型组合,形成等价用户组兴趣模型。即在满足p-link隐私条件下,如何进行自动聚类→分组,尽可能p值小。 
(4)分组后,计算各组的p值,取均值或最高值;计算组质心用户兴趣(CUP)。 
(5)完成个性化服务中用户兴趣模型匿名化。 
个性化服务中用户兴趣模型匿名化方法的算法描述: 
/* 
 User类:用户类,用户id、兴趣条目集合、所属等价用户组ID号。 
Interestltem类:兴趣条目类,兴趣关键词以及权值。 
EquivalenceUserGroup类:等价用户组类,存放等价用户组的兴趣条目,以及所包含的用户集合。 
Anonymization类:进行兴趣模型匿名化的主类。 
设定p-link初始值。 
*/ 
Figure BSA00000676256000031

Claims (5)

1.个性化服务中用户兴趣模型匿名化方法是基于p-link隐私保护的用户兴趣模型匿名化方法。其特征是:引入p-link隐私概念,p是对于隐私保护的度量。即攻击者根据背景知识链接确定某一用户的概率不超过p;满足p-link隐私约束,需要对用户兴趣模型基于语义的扩增处理;根据用户兴趣模型之间的相似性,将相似的用户兴趣模型组合,形成基于p-link隐私保护等价用户组兴趣模型。提升个性化服务性能通过共享用户组兴趣模型实现,解决了用户的隐私保护和提升个性化服务性能之间矛盾。
2.根据权利要求1所述的个性化服务中用户兴趣模型匿名化方法,其特征是:引入p-link隐私概念,p是对于隐私保护的度量。即攻击者根据背景知识链接确定某一用户的概率不超过p。
3.根据权利要求1所述的个性化服务中用户兴趣模型匿名化方法,其特征是:满足p-link隐私约束,需要对用户兴趣模型基于语义的扩增处理。
4.根据权利要求1所述的个性化服务中用户兴趣模型匿名化方法,其特征是:根据用户兴趣模型之间的相似性,将相似的用户兴趣模型组合,形成基于p-link隐私保护等价用户组兴趣模型,再形成一个特殊用户兴趣作为组中所有用户兴趣的代表,应用在个性化服务之中,它被称为组质心(CUP)。
5.根据权利要求1所述的个性化服务中用户兴趣模型匿名化方法,其特征是:提升个性化服务性能通过共享用户组兴趣模型实现,解决了用户的隐私保护和提升个性化服务性能之间矛盾。
CN2012100472855A 2012-02-28 2012-02-28 个性化服务中用户兴趣模型匿名化方法 Pending CN102622544A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100472855A CN102622544A (zh) 2012-02-28 2012-02-28 个性化服务中用户兴趣模型匿名化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100472855A CN102622544A (zh) 2012-02-28 2012-02-28 个性化服务中用户兴趣模型匿名化方法

Publications (1)

Publication Number Publication Date
CN102622544A true CN102622544A (zh) 2012-08-01

Family

ID=46562459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100472855A Pending CN102622544A (zh) 2012-02-28 2012-02-28 个性化服务中用户兴趣模型匿名化方法

Country Status (1)

Country Link
CN (1) CN102622544A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361123A (zh) * 2014-12-03 2015-02-18 中国科学技术大学 一种个人行为数据匿名化方法及系统
WO2016180182A1 (zh) * 2015-10-30 2016-11-17 中兴通讯股份有限公司 业务套餐的推荐方法和装置
WO2021077860A1 (zh) * 2019-10-25 2021-04-29 华为技术有限公司 基于用户隐私数据的推荐方法及其装置、介质和系统
CN114625973A (zh) * 2022-05-12 2022-06-14 深圳市宏博信息科技有限公司 一种匿名信息跨域推荐方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHU YUN等: "《Proceedings of the 19th international conference on World wide web》", 30 April 2010 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104361123A (zh) * 2014-12-03 2015-02-18 中国科学技术大学 一种个人行为数据匿名化方法及系统
CN104361123B (zh) * 2014-12-03 2017-11-03 中国科学技术大学 一种个人行为数据匿名化方法及系统
WO2016180182A1 (zh) * 2015-10-30 2016-11-17 中兴通讯股份有限公司 业务套餐的推荐方法和装置
CN106658434A (zh) * 2015-10-30 2017-05-10 中兴通讯股份有限公司 业务套餐的推荐方法和装置
WO2021077860A1 (zh) * 2019-10-25 2021-04-29 华为技术有限公司 基于用户隐私数据的推荐方法及其装置、介质和系统
CN114625973A (zh) * 2022-05-12 2022-06-14 深圳市宏博信息科技有限公司 一种匿名信息跨域推荐方法、装置、电子设备及存储介质
CN114625973B (zh) * 2022-05-12 2022-08-23 深圳创源互动科技有限公司 一种匿名信息跨域推荐方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Lindgren Movement mobilization in the age of hashtag activism: Examining the challenge of noise, hate, and disengagement in the# MeToo campaign
Rauchfleisch et al. The German far-right on YouTube: An analysis of user overlap and user comments
CN103678613B (zh) 一种计算影响力数据的方法与装置
CN106133727A (zh) 通过知识库促进的用户兴趣
Navarro-Arribas et al. Information fusion in data privacy: A survey
Beyerlein et al. Biographical availability
Jiang Managing the micro-self: The governmentality of real name registration policy in Chinese microblogosphere
Svensson The rise and fall of investigative journalism in China: digital opportunities and political challenges
Gillespie Human rights as a larger loyalty: The evolution of religious freedom in Vietnam
Harrelson-Stephens et al. You say you want a revolution: The Arab Spring, norm diffusion, and the human rights regime
CN106650487A (zh) 基于多维敏感数据发布的多部图隐私保护方法
CN103714086A (zh) 用于生成非关系数据库的模式的方法和设备
CN102622544A (zh) 个性化服务中用户兴趣模型匿名化方法
CN102521420A (zh) 基于偏好模型的社会化过滤方法
Doerr et al. Big health data research and group harm: the scope of IRB review
Bosman et al. 101 Innovations in Scholarly Communication: How researchers are getting to grip with the myriad of new tools.
Levin Hate Crimes
van Kirk et al. Hate Crimes and Hate Crime Law
Hu et al. Psychology and behavior mechanism of micro-blog information spreading
Yao et al. Topic-based rank search with verifiable social data outsourcing
Monti The new populism and fake news on the Internet: how populism along with Internet new media is transforming the Fourth Estate
CN104580234B (zh) 一种社交网络中行为特征的保护方法
CN107169044A (zh) 一种城市人才资源综合管理方法
Alsarkal et al. Linking virtual and real-world identities
Wagner‐Menghin Binomial test

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120801