CN102622544A - 个性化服务中用户兴趣模型匿名化方法 - Google Patents
个性化服务中用户兴趣模型匿名化方法 Download PDFInfo
- Publication number
- CN102622544A CN102622544A CN2012100472855A CN201210047285A CN102622544A CN 102622544 A CN102622544 A CN 102622544A CN 2012100472855 A CN2012100472855 A CN 2012100472855A CN 201210047285 A CN201210047285 A CN 201210047285A CN 102622544 A CN102622544 A CN 102622544A
- Authority
- CN
- China
- Prior art keywords
- user
- interest model
- link
- personalized service
- user interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
个性化服务中用户兴趣模型匿名化方法是基于p-link隐私保护的用户兴趣模型匿名化方法。目的是解决用户隐私保护和提升个性化服务性能之间矛盾。该方法引入p-link隐私概念,p是对于隐私保护的度量。当用户组中的用户与组中任意关键词联系起来的概率不超过p时,用户组被认为是满足p-link,即攻击者根据背景知识链接确定某一用户的概率不超过p;要满足p-link隐私约束,需要对用户兴趣模型基于语义的扩增处理;根据用户兴趣模型之间的相似性,将相似的用户兴趣模型组合,形成等价用户组兴趣模型。提升个性化服务性能通过共享用户组兴趣模型实现,该方法可广泛应用于个性化检索、推荐等服务系统。该发明所属信息、计算机技术领域。
Description
技术领域
该发明所属信息、计算机技术领域。
背景技术
实现个性化服务,需要跟踪和学习用户的兴趣和行为,生成用户兴趣模型,根据用户兴趣过滤信息以达到准确提供给用户所需信息的目的。然而,个性化检索面临一个重要问题:用户隐私安全。如何在保证用户隐私的前提下,提高用户兴趣模型在个性化服务中的共享是一个值得认真研究的问题。
发明内容
为了克服现有隐私保护技术的不足,提出了基于p-link隐私保护的用户兴趣模型匿名化方法。解决了用户隐私保护和提升个性化服务性能之间的矛盾。
该发明解决其技术问题所采用的技术方案是:隐匿用户模型中的标示符,引入p-link隐私概念,p是对于隐私保护的度量。当用户组中的用户与组中任意关键词联系起来的概率不超过p时,这个用户组被认为是满足p-link。即攻击者根据背景知识链接确定某一用户的概率不超过p;要满足p-link隐私的约束,需要对用户兴趣模型基于语义的扩增处理;根据用户兴趣模型之间的相似性,将相似的用户兴趣模型组合,形成基于p-link隐私保护等价用户组兴趣模型,再形成一个特殊用户兴趣作为组中所有用户兴趣的代表,应用在个性化服务之中,它被称为组质心(CUP)。
技术方案所依据的科学原理:(1)数据发布中隐私保护的k-匿名模型方法。k-匿名模型是通过对准标示符进行泛化、抑制等操作,使一个发布表中的一条记录r至少有k-1条记录与r在准标志符上的投影值相等,这样使得攻击者链接确定某一记录的概率降低为1/k。与k-匿名方法不同的是:用户兴趣模型的匿名化是聚类,根据相似性聚类得到等价用户组兴趣模型的兴趣条目,而k-匿名是对将要发布的数据通过泛化生成等价组。另外,k-匿名中的等价组要求至少包含k条记录,而等价组兴趣模型不需要限制用户的个数,而是需要满足p-link。(2)基于语义的扩增和聚类。用户兴趣模型扩增揭示了用户兴趣之间的相近语义,这使得集合分类更加可行和有效,同时为提升个性化服务性能奠定了基础。
本发明的有益效果是,在保证用户隐私安全的前提下,能够保持或提升个性化服务性能。
附图说明
下面结合附图和实例对本发明进一步说明。
图1是用户兴趣模型扩增示意图。
图1中,包括用户兴趣模型扩增处理的几种情况。在语言学中,上位词是指语义范围包括了其他词的词。同义词集的上位词是包括了根同义词集和所有它的上位词的同义词集列表。a1,a2可以代表scarlet(朱红),vermilion(丹红),carmine(洋红),crimson(深红);b1,b2分别代表aqua(浅绿),emerald(翠绿);A代表red(红);B代表green(绿);All代表color(颜色);A是的a1,a2上位词;B是b1,b2的上位词;同样,All是A,B的上位词。
具体实施方式
个性化服务中用户兴趣模型匿名化方法,具体步骤如下:
(1)隐匿用户模型中的标示符,设置合理p-link初值。
(2)当p-link隐私条件不满足时,需要扩增处理,直到满足条件。扩增的第一步是同义词集的扩增,将用户资料中的所有单独的关键词扩增为同义词集。扩增的第二步是上位词集扩增,将用户资料中同义词集的所有上位词集以原同义词集相同的权重加入到用户兴趣模型中。
(3)根据用户兴趣模型之间的相似性,将相似性较大的用户兴趣模型组合,形成等价用户组兴趣模型。即在满足p-link隐私条件下,如何进行自动聚类→分组,尽可能p值小。
(4)分组后,计算各组的p值,取均值或最高值;计算组质心用户兴趣(CUP)。
(5)完成个性化服务中用户兴趣模型匿名化。
个性化服务中用户兴趣模型匿名化方法的算法描述:
/*
User类:用户类,用户id、兴趣条目集合、所属等价用户组ID号。
Interestltem类:兴趣条目类,兴趣关键词以及权值。
EquivalenceUserGroup类:等价用户组类,存放等价用户组的兴趣条目,以及所包含的用户集合。
Anonymization类:进行兴趣模型匿名化的主类。
设定p-link初始值。
*/
Claims (5)
1.个性化服务中用户兴趣模型匿名化方法是基于p-link隐私保护的用户兴趣模型匿名化方法。其特征是:引入p-link隐私概念,p是对于隐私保护的度量。即攻击者根据背景知识链接确定某一用户的概率不超过p;满足p-link隐私约束,需要对用户兴趣模型基于语义的扩增处理;根据用户兴趣模型之间的相似性,将相似的用户兴趣模型组合,形成基于p-link隐私保护等价用户组兴趣模型。提升个性化服务性能通过共享用户组兴趣模型实现,解决了用户的隐私保护和提升个性化服务性能之间矛盾。
2.根据权利要求1所述的个性化服务中用户兴趣模型匿名化方法,其特征是:引入p-link隐私概念,p是对于隐私保护的度量。即攻击者根据背景知识链接确定某一用户的概率不超过p。
3.根据权利要求1所述的个性化服务中用户兴趣模型匿名化方法,其特征是:满足p-link隐私约束,需要对用户兴趣模型基于语义的扩增处理。
4.根据权利要求1所述的个性化服务中用户兴趣模型匿名化方法,其特征是:根据用户兴趣模型之间的相似性,将相似的用户兴趣模型组合,形成基于p-link隐私保护等价用户组兴趣模型,再形成一个特殊用户兴趣作为组中所有用户兴趣的代表,应用在个性化服务之中,它被称为组质心(CUP)。
5.根据权利要求1所述的个性化服务中用户兴趣模型匿名化方法,其特征是:提升个性化服务性能通过共享用户组兴趣模型实现,解决了用户的隐私保护和提升个性化服务性能之间矛盾。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100472855A CN102622544A (zh) | 2012-02-28 | 2012-02-28 | 个性化服务中用户兴趣模型匿名化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100472855A CN102622544A (zh) | 2012-02-28 | 2012-02-28 | 个性化服务中用户兴趣模型匿名化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102622544A true CN102622544A (zh) | 2012-08-01 |
Family
ID=46562459
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012100472855A Pending CN102622544A (zh) | 2012-02-28 | 2012-02-28 | 个性化服务中用户兴趣模型匿名化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102622544A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104361123A (zh) * | 2014-12-03 | 2015-02-18 | 中国科学技术大学 | 一种个人行为数据匿名化方法及系统 |
WO2016180182A1 (zh) * | 2015-10-30 | 2016-11-17 | 中兴通讯股份有限公司 | 业务套餐的推荐方法和装置 |
WO2021077860A1 (zh) * | 2019-10-25 | 2021-04-29 | 华为技术有限公司 | 基于用户隐私数据的推荐方法及其装置、介质和系统 |
CN114625973A (zh) * | 2022-05-12 | 2022-06-14 | 深圳市宏博信息科技有限公司 | 一种匿名信息跨域推荐方法、装置、电子设备及存储介质 |
-
2012
- 2012-02-28 CN CN2012100472855A patent/CN102622544A/zh active Pending
Non-Patent Citations (1)
Title |
---|
ZHU YUN等: "《Proceedings of the 19th international conference on World wide web》", 30 April 2010 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104361123A (zh) * | 2014-12-03 | 2015-02-18 | 中国科学技术大学 | 一种个人行为数据匿名化方法及系统 |
CN104361123B (zh) * | 2014-12-03 | 2017-11-03 | 中国科学技术大学 | 一种个人行为数据匿名化方法及系统 |
WO2016180182A1 (zh) * | 2015-10-30 | 2016-11-17 | 中兴通讯股份有限公司 | 业务套餐的推荐方法和装置 |
CN106658434A (zh) * | 2015-10-30 | 2017-05-10 | 中兴通讯股份有限公司 | 业务套餐的推荐方法和装置 |
WO2021077860A1 (zh) * | 2019-10-25 | 2021-04-29 | 华为技术有限公司 | 基于用户隐私数据的推荐方法及其装置、介质和系统 |
CN114625973A (zh) * | 2022-05-12 | 2022-06-14 | 深圳市宏博信息科技有限公司 | 一种匿名信息跨域推荐方法、装置、电子设备及存储介质 |
CN114625973B (zh) * | 2022-05-12 | 2022-08-23 | 深圳创源互动科技有限公司 | 一种匿名信息跨域推荐方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lindgren | Movement mobilization in the age of hashtag activism: Examining the challenge of noise, hate, and disengagement in the# MeToo campaign | |
Rauchfleisch et al. | The German far-right on YouTube: An analysis of user overlap and user comments | |
CN103678613B (zh) | 一种计算影响力数据的方法与装置 | |
CN106133727A (zh) | 通过知识库促进的用户兴趣 | |
Navarro-Arribas et al. | Information fusion in data privacy: A survey | |
Beyerlein et al. | Biographical availability | |
Jiang | Managing the micro-self: The governmentality of real name registration policy in Chinese microblogosphere | |
Svensson | The rise and fall of investigative journalism in China: digital opportunities and political challenges | |
Gillespie | Human rights as a larger loyalty: The evolution of religious freedom in Vietnam | |
Harrelson-Stephens et al. | You say you want a revolution: The Arab Spring, norm diffusion, and the human rights regime | |
CN106650487A (zh) | 基于多维敏感数据发布的多部图隐私保护方法 | |
CN103714086A (zh) | 用于生成非关系数据库的模式的方法和设备 | |
CN102622544A (zh) | 个性化服务中用户兴趣模型匿名化方法 | |
CN102521420A (zh) | 基于偏好模型的社会化过滤方法 | |
Doerr et al. | Big health data research and group harm: the scope of IRB review | |
Bosman et al. | 101 Innovations in Scholarly Communication: How researchers are getting to grip with the myriad of new tools. | |
Levin | Hate Crimes | |
van Kirk et al. | Hate Crimes and Hate Crime Law | |
Hu et al. | Psychology and behavior mechanism of micro-blog information spreading | |
Yao et al. | Topic-based rank search with verifiable social data outsourcing | |
Monti | The new populism and fake news on the Internet: how populism along with Internet new media is transforming the Fourth Estate | |
CN104580234B (zh) | 一种社交网络中行为特征的保护方法 | |
CN107169044A (zh) | 一种城市人才资源综合管理方法 | |
Alsarkal et al. | Linking virtual and real-world identities | |
Wagner‐Menghin | Binomial test |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120801 |