CN102662975A - 一种混合双向聚类好友推荐方法 - Google Patents

一种混合双向聚类好友推荐方法 Download PDF

Info

Publication number
CN102662975A
CN102662975A CN2012100637542A CN201210063754A CN102662975A CN 102662975 A CN102662975 A CN 102662975A CN 2012100637542 A CN2012100637542 A CN 2012100637542A CN 201210063754 A CN201210063754 A CN 201210063754A CN 102662975 A CN102662975 A CN 102662975A
Authority
CN
China
Prior art keywords
user
recommendation
clustering
users
popular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100637542A
Other languages
English (en)
Inventor
卜佳俊
陈纯
王北斗
陈孝峰
郑淼
王灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2012100637542A priority Critical patent/CN102662975A/zh
Publication of CN102662975A publication Critical patent/CN102662975A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于用户行为和个人属性的混合双向聚类好友推荐方法。本方法基于用户的交友选择行为与用户属性,计算用户择友偏好。依据用户择友偏好对全体用户进行聚类,并计算得出每个用户对其它用户的喜爱程度。之后,基于每对用户间的双向喜好的大小,对用户进行排序。同时通过保证推荐双向性、在排序公式增加随机扰动、针对推荐效果差用户二次处理的方法,使最终推荐机会分布更为均匀。本方法的优点在于:综合利用用户属性与用户行为信息,增强推荐结果的准确性;考虑用户交友推荐过程中双向性和公平性问题,从而取得更好的推荐效果。本方法可以应用到具有双向性需求的社交网络、婚恋交友推荐系统、社会化问答系统等应用场景。

Description

一种混合双向聚类好友推荐方法
技术领域
本发明涉及社交网络中的好友推荐领域,特别是解决基于用户与用户推荐中的双向性、公平性问题。 
背景技术
推荐问题一直是机器学习领域内的经典问题,而随着社交网络、微博客等新兴互联网服务的兴起,基于用户与用户的推荐,成为推荐领域研究的新趋势。传统的推荐方法主要包括基于内容的推荐、基于协同过滤的推荐和两者混合的推荐方法。在用户与用户的推荐中,有很多的推荐任务存在明显的双向性需求,即需要推荐与被推荐双方需要对彼此都感兴趣,才能够进行成功的推荐。双向性的需求,使得对每对推荐对象,方法必须计算用户配对双向的喜好程度,并考虑双向喜好进行排序。 
公平性指使得推荐机会尽可能平衡的分配给全体符合条件的用户,既不出单一用户被过度推荐的情况,又不出现新用户或者合格的老用户推荐次数过少的情况。在传统的推荐系统中,往往允许出现热门的推荐对象:在基于内容推荐中,条件较好的用户往往出现在大部分用户推荐列表的前排位置;而在基于协同过滤的推荐算法中,越受欢迎的用户,往往出现在越多人的推荐列表中。这样的推荐结果,导致推荐机会被集中在一群高质量、受欢迎的用户上,导致了推荐系统不公平现象的产生。 
专利方法,首先控制推荐的双向性,要求推荐双方彼此都感兴趣,方可进行推荐,从而避免了受欢迎用户被推荐给过多用户的现象出现。同时通过二次筛选的方法,将活跃用户的权重提升,重新分配推荐机会,保证最终推荐结果的公平性。 
发明内容
本发明要解决现有好友推荐方法所存在的双向性差、公平性差的缺点,提供一种解决基于用户与用户的推荐中双向性、公平性等问题的混合聚类双向推荐方法。 
本发明解决其技术问题所采用的技术方案如下: 
1)提取用户的择偶偏好特征,包括如下步骤: 
a)将一个用户x的用户资料,归一化后表示为Ux,找到用户x曾经发信(或其它社交网络交互)的对象,用户集合Mx; 
b)利用用户集合Mx的属性的分布,计算得到用户x的择偶偏好Px; 
2)聚类得到品味相近的用户:分别针对男性和女性用户,利用K-means聚类算法,将具有相近择偶偏好的用户聚类到一起,形成用户聚类c; 
3)计算用户双向性喜好: 
a)在计算得到品味相近用户的聚类c后,基于c中用户的发信对象,计算集合c的候选用户集Sc,并计算出Sc中用户u的受欢迎程度Popularu; 
b)对每一对用户u,v,计算两者间双向喜好值; 
4)针对任意用户u计算u与其所在聚类c的候选用户集合Sc中每一个用户v的匹配度得分,并依据得分的高低对用户v进行排序,并按照事先预定的阈值,将得分最高的前N个用户v推荐给用户u,作为用户u的推荐列表; 
5)保证推荐的公平性: 
对第一次的推荐结果进行二次处理,用活跃的推荐次数少的用户,替代被推荐次数过多的用户; 
附图说明
图1是本发明的方法流程图。 
具体实施方式
本发明实施的具体步骤如下: 
1、提取用户的择友偏好特征,包括如下步骤: 
1)将一个用户x的用户资料,归一化后表示为Ux,找到用户x曾经发信的对象,用户集合Mx
2)用户集合Mx的属性的分布,计算得到用户x的择偶偏好Px。 
2、聚类得到品味相近的用户:针对全体用户,利用K-means等聚类算法,将一群具有相近择友偏好的用户,聚类到一起,形成用户聚类c。 
3、计算用户双向性喜好: 
1)在计算得到品味相近用户的聚类c后,基于c中用户的发信对象,计算集合c的候选用户集Sc。 
2)并根据Sc中用户收信数量的多少,计算出Sc中用户u的受欢迎程度Popularu。 
3)对任意c中的用户v定义,Popularv→u为用户v对用户u的感兴趣程度,其值等同于Popularu,同理可以计算出用户u对用户v的感兴趣程度Popularu→v。 
4)用户u,v间的双向喜好由Popularu→v与Popularv→u的加权加和得到。 
4、按评分排序得到推荐列表: 
1)按照用户显示的推荐要求,筛选掉不相符的推荐候选对象,筛除已经交流过的用户和被列入黑名单的用户。 
2)Score(x,u)=Popularu→x+α×Popularx→u+Random(1) 
按照评分公式1计算出每对用户的得分,其中Popularu→x代表用户u 对用户x的感兴趣程度,Popularx→u代表用户x对用户u的感兴趣程度,α为调节双向性因素的常数权重系数。公式中前两项代表了用户间的双向喜好,Random为一随机数的扰动值,目的在于为了避免推荐结果的过度集中,保证推荐的公平性。 
3)与用户u配对得分越高的用户出现在推荐列表的越前端。按照阈值N,筛选前N个用户组成推荐列表。 
5、保证推荐结果的公平性: 
1)在得到第一次的推荐结果后,提取所有展示次数小于α的用户,将用户分成展示次数小于α的用户,UDisplay_little,与展示次数大于α的活跃用户UDisplay_alot。 
2)对UDisplay_little用户进行筛选,根据设定阈值,只保留活跃程度大于阈值的用户。 
3)为每一个来自UDisplay_alot中的活跃用户x,计算出一个与之属性最为相似的非活跃用户集合WX。 
4)第二次计算推荐候选集SC,聚类中受到推荐次数数量较多的对象x,替换成与之属性最为相似的非活跃用户集合WX的用户。按照之前的算法流程,得到新的推荐结果,新的推荐结果将全是之前推荐次数较少的用户。 
5)将这些用户,按照一定的比例插入到之前的推荐结果里,取代推荐次数过多的用户。 
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。 

Claims (5)

1.一种基于用户行为和用户个人属性的混合双向聚类推荐方法,其特征在于:
1)提取用户的择偶偏好特征,包括如下步骤:
a)将一个用户x的用户资料,归一化后表示为Ux,找到用户x曾经发信等交互行为的对象,用户集合Mx
b)利用用户集合Mx的属性的分布,计算得到用户x的择偶偏好Px
2)聚类得到品味相近的用户:分别针对男性和女性用户,利用K-means聚类算法,将具有相近择偶偏好的用户聚类到一起,形成用户聚类c;
3)计算用户双向性喜好:
a)在计算得到品味相近用户的聚类c后,基于c中用户的发信(或其它社交网络交互行为)的目标对象,计算集合c的候选用户集Sc,并计算出Sc中用户u的受欢迎程度Popularu
b)对每一对用户u,v,计算两者间双向喜好值;
4)针对任意用户u计算u与其所在聚类c的候选用户集合Sc中每一个用户v的匹配度得分,并依据得分的高低对用户v进行排序,并按照事先预定的阈值,将得分最高的前N个用户v推荐给用户u,作为用户u的推荐列表;
5)保证推荐的公平性:
对第一次的推荐结果进行二次处理,将被推荐次数过多的用户的部分推荐位置,用与之个人属性相似,交友行为活跃但获得推荐次数少的用户替代。
2.根据权利要求1所述的基于用户行为和用户个人属性的混合双向聚类推荐方法,其特征在于:步骤(1)中提取用户择友偏好并进行聚类的过程包括统 计用户交友中的发信交互对象,计算用户发信对象的个人属性分布,并将之定义为用户的择友偏好。之后利用K-Means算法(K-means算法是一种应用广泛的典型基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大),基于用户的择友偏好向量,以余弦相似度作为度量方式,对用户进行聚类。
3.根据权利要求1所述的一种基于用户行为和用户个人属性的混合双向聚类推荐方法,其特征在于:步骤(2)中的用户u对其它用户的喜好Popularu→v等同于用户u所在集合c对用户v的喜爱程度,等同于集合c中有多少用户对用户v感兴趣。集合c中用户的推荐候选用户集合SC定义为集合c中用户发信对象的集合。
4.根据权利要求1所述的一种基于用户行为和用户个人属性的混合双向聚类推荐方法,其特征在于:步骤(4)中的两用户间匹配度得分由如下公式计算:
Score(x,u)=Popularu→x+α×Popularx→u+Random
其中Popularu→x代表用户u对用户x的感兴趣程度,Popularx→u代表用户x对用户u的感兴趣程度,α为调节双向性因素的常数权重系数。公式中前两项代表了用户间的双向喜好,Random为一随机数的扰动值,目的在于为了避免推荐结果的过度集中,保证推荐的公平性。
5.根据权利要求1所述的一种基于用户行为和用户个人属性的混合双向聚类推荐方法,其特征在于:步骤(5)中的公平性,是指推荐结果的均匀性,即不会出现热门用户被过度推荐,冷门用户得不到推荐机会的情况。公平性主要基于推荐结果的双向性限制和为推荐排序增添随机扰动和推荐结果的二次处理来实现。 
CN2012100637542A 2012-03-12 2012-03-12 一种混合双向聚类好友推荐方法 Pending CN102662975A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100637542A CN102662975A (zh) 2012-03-12 2012-03-12 一种混合双向聚类好友推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100637542A CN102662975A (zh) 2012-03-12 2012-03-12 一种混合双向聚类好友推荐方法

Publications (1)

Publication Number Publication Date
CN102662975A true CN102662975A (zh) 2012-09-12

Family

ID=46772466

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100637542A Pending CN102662975A (zh) 2012-03-12 2012-03-12 一种混合双向聚类好友推荐方法

Country Status (1)

Country Link
CN (1) CN102662975A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077247A (zh) * 2013-01-17 2013-05-01 清华大学 一种社交网络中的朋友关系传递树的建立方法
CN103237018A (zh) * 2013-03-29 2013-08-07 东莞宇龙通信科技有限公司 一种客户端匹配方法、服务器及通信系统
CN103593381A (zh) * 2013-08-06 2014-02-19 北京爱真心信息科技有限公司 一种互联网婚恋交友推荐平台及方法
CN103984775A (zh) * 2014-06-05 2014-08-13 网易(杭州)网络有限公司 一种推荐好友的方法和设备
CN104794656A (zh) * 2014-01-16 2015-07-22 朱开一 一种应用于社交网络的推荐方法和推荐系统
CN104903847A (zh) * 2012-11-09 2015-09-09 巧生活公司 受信任的社交网络
WO2015184998A1 (en) * 2014-06-05 2015-12-10 Tencent Technology (Shenzhen) Company Limited Method and apparatus for reducing load peaks in user group matching process
CN105468598A (zh) * 2014-08-18 2016-04-06 大连民族学院 好友推荐方法及装置
CN105989056A (zh) * 2015-02-06 2016-10-05 北京中搜网络技术股份有限公司 一种汉语新闻推荐系统
CN106161575A (zh) * 2015-04-28 2016-11-23 腾讯科技(深圳)有限公司 用户匹配方法及装置
CN107123057A (zh) * 2017-03-22 2017-09-01 阿里巴巴集团控股有限公司 用户推荐方法及装置
CN107222562A (zh) * 2017-07-03 2017-09-29 深圳市乐唯科技开发有限公司 一种基于互联网用户特征的用户智能推荐系统
CN107451287A (zh) * 2017-08-14 2017-12-08 佛山科学技术学院 一种基于双向匹配的推荐方法
CN107562917A (zh) * 2017-09-12 2018-01-09 广州酷狗计算机科技有限公司 用户推荐方法及装置
CN108052591A (zh) * 2017-12-11 2018-05-18 广东欧珀移动通信有限公司 信息推荐方法、装置、移动终端及计算机可读存储介质
CN108549729A (zh) * 2018-05-21 2018-09-18 辽宁师范大学 基于覆盖约简的个性化用户协同过滤推荐方法
WO2018195691A1 (en) * 2017-04-24 2018-11-01 Microsoft Technology Licensing, Llc New connection recommendations based on data attributes
CN108733770A (zh) * 2018-04-23 2018-11-02 佛山科学技术学院 一种校园手机软件系统
CN109325883A (zh) * 2017-07-31 2019-02-12 深圳市珍爱网信息技术有限公司 一种双向匹配的推荐方法及装置
CN109829101A (zh) * 2018-12-24 2019-05-31 深圳市珍爱捷云信息技术有限公司 交友匹配方法、装置、计算机设备及可读存储介质
CN110209938A (zh) * 2019-05-31 2019-09-06 河南大学 一种基于服务多粒度属性的潜在用户推荐方法
CN110719280A (zh) * 2019-10-09 2020-01-21 吴仁超 基于大数据的用户隐私保护的推荐系统及方法
CN111159578A (zh) * 2019-12-31 2020-05-15 第四范式(北京)技术有限公司 一种推荐对象的方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685458A (zh) * 2008-09-27 2010-03-31 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN101916286A (zh) * 2010-08-23 2010-12-15 宇龙计算机通信科技(深圳)有限公司 一种信息推荐方法及系统
CN102227695A (zh) * 2008-12-02 2011-10-26 索尼公司 基于学习的用户偏好的视听用户接口
CN102316130A (zh) * 2010-06-29 2012-01-11 百度在线网络技术(北京)有限公司 一种基于用户的行为判断其与好友的亲疏度的方法与设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685458A (zh) * 2008-09-27 2010-03-31 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN102227695A (zh) * 2008-12-02 2011-10-26 索尼公司 基于学习的用户偏好的视听用户接口
CN102316130A (zh) * 2010-06-29 2012-01-11 百度在线网络技术(北京)有限公司 一种基于用户的行为判断其与好友的亲疏度的方法与设备
CN101916286A (zh) * 2010-08-23 2010-12-15 宇龙计算机通信科技(深圳)有限公司 一种信息推荐方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
成桂兰等: "基于混合聚类的个性化推荐算法", 《武汉理工大学学报·信息与管理工程版》 *

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104903847A (zh) * 2012-11-09 2015-09-09 巧生活公司 受信任的社交网络
CN103077247B (zh) * 2013-01-17 2016-05-25 清华大学 一种社交网络中的朋友关系传递树的建立方法
CN103077247A (zh) * 2013-01-17 2013-05-01 清华大学 一种社交网络中的朋友关系传递树的建立方法
CN103237018A (zh) * 2013-03-29 2013-08-07 东莞宇龙通信科技有限公司 一种客户端匹配方法、服务器及通信系统
CN103593381A (zh) * 2013-08-06 2014-02-19 北京爱真心信息科技有限公司 一种互联网婚恋交友推荐平台及方法
CN104794656A (zh) * 2014-01-16 2015-07-22 朱开一 一种应用于社交网络的推荐方法和推荐系统
WO2015106657A1 (zh) * 2014-01-16 2015-07-23 上海资本加管理软件有限公司 一种应用于社交网络的推荐方法和推荐系统
CN110162717A (zh) * 2014-06-05 2019-08-23 网易(杭州)网络有限公司 一种推荐好友的方法和设备
WO2015184998A1 (en) * 2014-06-05 2015-12-10 Tencent Technology (Shenzhen) Company Limited Method and apparatus for reducing load peaks in user group matching process
CN103984775A (zh) * 2014-06-05 2014-08-13 网易(杭州)网络有限公司 一种推荐好友的方法和设备
CN110162717B (zh) * 2014-06-05 2022-11-01 网易(杭州)网络有限公司 一种推荐好友的方法和设备
CN105468598A (zh) * 2014-08-18 2016-04-06 大连民族学院 好友推荐方法及装置
CN105468598B (zh) * 2014-08-18 2020-05-08 大连民族学院 好友推荐方法及装置
CN105989056A (zh) * 2015-02-06 2016-10-05 北京中搜网络技术股份有限公司 一种汉语新闻推荐系统
CN105989056B (zh) * 2015-02-06 2019-05-24 北京中搜云商网络技术有限公司 一种汉语新闻推荐系统
CN106161575A (zh) * 2015-04-28 2016-11-23 腾讯科技(深圳)有限公司 用户匹配方法及装置
CN107123057A (zh) * 2017-03-22 2017-09-01 阿里巴巴集团控股有限公司 用户推荐方法及装置
WO2018195691A1 (en) * 2017-04-24 2018-11-01 Microsoft Technology Licensing, Llc New connection recommendations based on data attributes
US10521482B2 (en) 2017-04-24 2019-12-31 Microsoft Technology Licensing, Llc Finding members with similar data attributes of a user for recommending new social connections
CN107222562A (zh) * 2017-07-03 2017-09-29 深圳市乐唯科技开发有限公司 一种基于互联网用户特征的用户智能推荐系统
CN109325883A (zh) * 2017-07-31 2019-02-12 深圳市珍爱网信息技术有限公司 一种双向匹配的推荐方法及装置
CN107451287A (zh) * 2017-08-14 2017-12-08 佛山科学技术学院 一种基于双向匹配的推荐方法
CN107562917A (zh) * 2017-09-12 2018-01-09 广州酷狗计算机科技有限公司 用户推荐方法及装置
CN107562917B (zh) * 2017-09-12 2021-04-06 广州酷狗计算机科技有限公司 用户推荐方法及装置
CN108052591A (zh) * 2017-12-11 2018-05-18 广东欧珀移动通信有限公司 信息推荐方法、装置、移动终端及计算机可读存储介质
CN108733770A (zh) * 2018-04-23 2018-11-02 佛山科学技术学院 一种校园手机软件系统
CN108549729B (zh) * 2018-05-21 2021-06-11 辽宁师范大学 基于覆盖约简的个性化用户协同过滤推荐方法
CN108549729A (zh) * 2018-05-21 2018-09-18 辽宁师范大学 基于覆盖约简的个性化用户协同过滤推荐方法
CN109829101A (zh) * 2018-12-24 2019-05-31 深圳市珍爱捷云信息技术有限公司 交友匹配方法、装置、计算机设备及可读存储介质
CN110209938A (zh) * 2019-05-31 2019-09-06 河南大学 一种基于服务多粒度属性的潜在用户推荐方法
CN110209938B (zh) * 2019-05-31 2022-10-25 河南大学 一种基于服务多粒度属性的潜在用户推荐方法
CN110719280A (zh) * 2019-10-09 2020-01-21 吴仁超 基于大数据的用户隐私保护的推荐系统及方法
CN110719280B (zh) * 2019-10-09 2020-11-10 黄华 基于大数据的用户隐私保护的推荐系统及方法
CN111159578A (zh) * 2019-12-31 2020-05-15 第四范式(北京)技术有限公司 一种推荐对象的方法和系统
CN111159578B (zh) * 2019-12-31 2023-10-13 第四范式(北京)技术有限公司 一种推荐对象的方法和系统

Similar Documents

Publication Publication Date Title
CN102662975A (zh) 一种混合双向聚类好友推荐方法
Shayo Social identity and economic policy
Paalgard Flemmen et al. Class and status: On the misconstrual of the conceptual distinction and a neo‐Bourdieusian alternative
CN104834695B (zh) 基于用户兴趣度和地理位置的活动推荐方法
CN108763314A (zh) 一种兴趣推荐方法、装置、服务器及存储介质
CN103488714B (zh) 一种基于社交网络的图书推荐方法和系统
Means et al. Communities of place and communities of interest? An exploration of their changing role in later life
CN107526850A (zh) 基于多重个性化特征混合架构的社交网络好友推荐方法
Noesjirwan et al. Variations in perception of clothing as a function of dress form and viewers' social community
Pjero et al. Social media and consumer behavior–How does it works in albania reality
Iordache et al. Exploring the usage of social networking websites: perceptions and opinions of Romanian university students
CN108241619A (zh) 一种基于用户多兴趣的推荐方法
CN103366009A (zh) 一种基于自适应聚类的图书推荐方法
Hartmann et al. The relationship between gratifications from social networking site use and adolescents’ brand interactions
Caso et al. Users Ranking in Online Social Networks to Support POIs Selection in Small Groups.
Wang et al. How does tolerance affect urban innovative capacities in China?
Masmoudi et al. The macro-economic determinants of export competitiveness of the Tunisian economy in a context of liberalization and crisis
Moore et al. The mitigating effects of acculturation on consumer behavior
Haegeli et al. How mountain snowmobilers adjust their riding preferences in response to avalanche hazard information available at different stages of backcountry trips
CN109413481B (zh) 一种弹幕信息的归类处理方法及装置
Kanai Contextual effects of bridging social capital on subjective well-being
Metge 212. Marriage in Modern Maori Society
Nessi et al. Racial and class distinctions online: the case of the Mexican European diaspora on social networking sites
Allan et al. Money and relationship difficulties
Mishra et al. A Comparative Study on Social Media Utilization Pattern by Farmers of Different Age Groups

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120912