CN102467542A - 获取用户相似度的方法、装置及用户推荐方法、系统 - Google Patents

获取用户相似度的方法、装置及用户推荐方法、系统 Download PDF

Info

Publication number
CN102467542A
CN102467542A CN2010105438705A CN201010543870A CN102467542A CN 102467542 A CN102467542 A CN 102467542A CN 2010105438705 A CN2010105438705 A CN 2010105438705A CN 201010543870 A CN201010543870 A CN 201010543870A CN 102467542 A CN102467542 A CN 102467542A
Authority
CN
China
Prior art keywords
user
similarity
relation
similar users
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105438705A
Other languages
English (en)
Other versions
CN102467542B (zh
Inventor
文勖
王锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201010543870.5A priority Critical patent/CN102467542B/zh
Publication of CN102467542A publication Critical patent/CN102467542A/zh
Application granted granted Critical
Publication of CN102467542B publication Critical patent/CN102467542B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种获取用户相似度的方法、装置及用户推荐方法、系统,本发明根据收听(follow)关系确定用户间的相似度,保证了相似用户与请求的用户的高相似度,提高了查找相似用户的准确度。本发明用户推荐方法中推荐的用户与请求用户的相似度,是通过用户的follow关系获得的,保证了相似用户与请求的用户的高相似度,因此,提高了用户推荐系统中推荐相似用户的准确性。

Description

获取用户相似度的方法、装置及用户推荐方法、系统
技术领域
本发明涉及计算机领域,尤指一种获取用户相似度的方法、装置及用户推荐方法、系统。
背景技术
目前,用户与用户的相似度主要是根据用户的资料计算得出的,现有相似度的计算方法完全依赖于用户资料。但是,一方面,用户资料很难反映一个人的全部特征,而另一方面,如果用户资料填写不完整,那么,相似度的计算是不理想的,也降低了用户推荐系统中相似用户推荐的满意度。
发明内容
有鉴于此,本发明实施例提供一种获取用户相似度的方法及装置,能够更准确的查找相似用户。
本发明还提供一种用户推荐方法及系统,能够提高推荐相似用户的准确性。
本发明的技术方案是这样实现的:
一种获取用户相似度的方法,包括:分析用户的反向收听关系;根据所述反向收听关系确定用户间的相似度。
所述分析用户的反向收听关系,包括:
采用向量
Figure BSA00000345921500011
表示用户X的反向收听关系,其中i=1,2...n,n为所述用户所在系统中除该用户之外的用户个数,Qi为所述用户所在系统中除该用户之外的用户i;如果Qi已经收听所述用户X,则Qi=1,否则Qi=0。
所述根据收听关系确定用户间的相似度包括:
按照公式计算用户间的相似度,其中,
i、j分别表示用户i和用户j,sim(i,j)表示用户i和用户j的相似度,表示用户i的反向收听关系,表示用户j的反向收听关系。
一种获取用户相似度的装置,至少包括分析模块、获取模块以及存储模块,其中,
分析模块,用于分析用户的收听关系,并将得到的收听关系中的反向收听关系输出给获取模块;
获取模块,用于根据用户的反向收听关系,确定用户间的相似度,按照相似度从高到低的顺序,选出与该用户相似度较高的预设数目个相似用户,并存储在存储模块中;
存储模块,用于存储用户的相似用户信息。
还包括收听关系存储模块,用于存储分析模块分析出的正向收听关系和反向收听关系;此时,
分析模块,还用于将分析出的收听关系中的正向收听关系和反向收听关系输出给收听关系存储模块。
所述存储模块,还用于为存储的各相似用户分别设置权值。
一种用户推荐方法,包括:
获取用户的正向收听关系;
确定正向收听关系中记录的该用户收听的各用户的相似用户,所述相似用户是根据反向收听关系确定的用户间的相似度确定的;
从确定出的相似用户中选出推荐给该用户的推荐用户。
该方法还包括:获取所述相似用户的相似度的权值。
所述选出推荐给该用户的推荐用户包括:
按照所述各相似用户的相似度从高到低的顺序,选择相似度较大的预设数量的相似用户作为推荐用户。
所述选出推荐给该用户的推荐用户包括:按照预先设置的策略选择预设数量的相似用户作为推荐用户。
一种用户推荐系统,包括请求单元、获取用户相似度的装置,以及推荐单元,其中,
请求单元,用于向获取用户相似度的装置发起第一请求,以请求获取用户的正向收听关系;将获得的发起请求的用户的正向收听关系发送给推荐单元;
获取用户相似度的装置,用于接收来自请求单元的第一请求,向请求单元输出发起请求的用户的正向收听关系;接收来自推荐单元的第二请求,向推荐单元输出发起请求的用户收听的用户的相似用户;
推荐单元,用于根据发起请求的用户的正向收听关系,获取发起请求的用户收听的用户,并向获取用户相似度的装置发起第二请求,用于请求该发起请求的用户收听的用户的相似用户;从获得的所有相似用户中选出预设数量的推荐给发起请求用户的推荐用户。
所述获取用户相似度的装置,在收到第二请求时,还用于向所述推荐单元输出相似用户的权值;此时,
所述推荐单元,具体用于从获得的所有相似用户中,按照相似度从高到低,选出预设数量的推荐给发起请求用户的推荐用户。
从上述本发明提供的技术方案可以看出,本发明根据follow关系确定用户间的相似度,保证了相似用户与请求的用户的高相似度,提高了查找相似用户的准确度。本发明用户推荐方法中推荐的用户与请求用户的相似度,是通过用户的follow关系获得的,保证了相似用户与请求用户的高相似度,因此,提高了用户推荐系统中推荐相似用户的准确性。
附图说明
图1为本发明获取用户相似度的方法的流程图;
图2为本发明获取用户相似度的装置的组成结构示意图;
图3为本发明用户推荐方法的流程图;
图4为本发明用户推荐系统的组成结构示意图;
图5为本发明用户推荐方法的实施例的实现过程示意图。
具体实施方式
图1为本发明获取用户相似度的方法的流程图,如图1所示,包括:
步骤100:分析用户的收听(follow)关系。
follow关系包括正向follow关系和反向follow关系,对于某用户如用户X,正向follow关系记录的是用户X收听的用户如用户A1、用户A2、......用户An;反向follow关系记录的是收听用户X的用户如用户B1、用户B2、......用户Bm,也就是用户X被用户B1、用户B2、......用户Bm收听。
本步骤中,对用户的follow关系的分析指对反向follow关系的分析,包括:假设用户X所在系统共有n个用户(除用户X本身),用户X的反向follow关系可以表示为向量
Figure BSA00000345921500041
其中i=1,2...n,如果Qi已经收听用户X,则Qi=1,否则Qi=0。
步骤101:根据follow关系确定用户间的相似度。本步骤根据公式(1)计算用户间的相似度:
Figure BSA00000345921500042
公式(1)中,i、j分别表示用户i和用户j,
Figure BSA00000345921500043
表示用户i的反向follow关系,
Figure BSA00000345921500044
表示用户j的反向follow关系。假设
Figure BSA00000345921500045
Figure BSA00000345921500046
那么, sim ( i , j ) = V → i · V → j V → i · V → i · V → j · V → j = ( 0 × 1 + 1 × 1 + 1 × 1 ) ( 0 × 0 + 1 × 1 + 1 × 1 ) · ( 1 × 1 + 1 × 1 + 1 × 1 ) ≈ 0.82 .
对于每个用户来讲,可以按照相似度从高到低的顺序,为该用户保存预设数目个相似用户,如10个。具体数目可以根据不同系统的需要设置。
本发明方法,通过用户的follow关系获得用户相似度,从用户对信息的关注程度进行考虑,更好地体现了用户的相似度,得到了比较理想的用户的相似度,为后续用户推荐系统中相似用户的推荐提供了保障。
针对本发明获取用户相似度的方法,还提供一种获取用户相似度的装置,如图2所示,至少包括分析模块、获取模块以及存储模块,其中,
分析模块,用于分析用户的follow关系,并将得到的follow关系中的反向follow关系输出给获取模块;
获取模块,用于根据用户的反向follow关系,确定用户间的相似度,并按照相似度从高到低的顺序,选出与该用户相似度较高的预设数目个相似用户,并存储在存储模块中。
存储模块,用于存储用户的相似用户信息,比如可以是用户的标识,还可以进一步存储该用户与其相似用户的相似度等。
本发明获取用户相似度的装置还包括follow关系存储模块,用于存储分析模块分析出的正向follow关系和反向follow关系。此时,
分析模块,还用于将分析出的follow中的正向follow关系和反向follow关系输出给follow关系存储模块。
图3为本发明用户推荐方法的流程图,如图3所示,包括以下步骤:
步骤300:获取用户的正向follow关系。
从本发明获取用户相似度的装置中的follow关系存储模块可以获得用户的正向follow关系,也就是获得了该用户收听的用户的信息。
步骤301:确定正向follow关系中记录的该用户收听的各用户的相似用户。
从本发明存储的用户的相似用户信息,可以对应获得该用户收听的用户的相似用户。所述相似用户是根据反向收听关系确定的用户间的相似度来确定的,具体如图1所示的方法,这里不再详述。
进一步地,在本发明获取用户相似度的装置的存储模块存储相似用户信息时,还用于为这些相似用户设置权值,具体实现属于本领域技术人员惯用技术手段,这里不再赘述。这样,本步骤中,还同时获得该用户的相似用户的权值。
步骤302:从确定出的所有相似用户中选出推荐给该用户的推荐用户。
本步骤中,可以按照预先设置的策略选择预设数量的相似用户作为推荐用户,比如按照各相似用户的相似度从高到低,选择相似度较大的预设数量的相似用户作为推荐用户,比如10个。具体数目可以根据不同系统的需要设置。
本发明用户推荐方法中推荐的用户与请求用户的相似度,是通过用户的follow关系获得的,保证了相似用户与请求的用户的高相似度,因此,提高了用户推荐系统中相似用户推荐的满意度。
图4为本发明用户推荐系统的组成结构示意图,如图4所示,包括请求单元、获取用户相似度的装置,以及推荐单元,其中,
请求单元,用于向获取用户相似度的装置发起第一请求,以请求获取用户的正向follow关系;将获得的发起请求的用户的正向follow关系发送给推荐单元。
获取用户相似度的装置,用于接收来自请求单元的第一请求,向请求单元输出发起请求的用户的正向follow关系;接收来自推荐单元的第二请求,向推荐单元输出发起请求的用户收听的用户的相似用户。
推荐单元,用于根据发起请求的用户的正向follow关系,获取发起请求的用户收听的用户,并向获取用户相似度的装置发起第二请求,用于请求该发起请求的用户收听的用户的相似用户;从获得的所有相似用户中选出预设数量的推荐给发起请求用户的推荐用户。
获取用户相似度的装置,在收到第二请求时,还用于向推荐单元输出相似用户的权值;此时,推荐单元,具体用于从获得的所有相似用户中,按照相似度从高到低,选出预设数量的推荐给发起请求用户的推荐用户。
需要说明的是,本发明获取用户相似度的装置中,存储模块,和/或follow关系存储模块也可以作为独立的数据库设置在该装置之外,这种实现形式属于本领域技术人员的惯用技术手段,并不用于限定本发明的保护范围。
图5为本发明用户推荐方法的实施例的实现过程示意图,结合图3和图4,具体过程包括:
1、请求单元如系统前台,请求查询用户X的follow历史记录,即用户Xfollow的用户,也就是用户X的正向follow关系;
2、用户follow数据库返回用户X的正向follow关系历史记录,假设用户X已经follow的用户为用户A1...用户An;本实施例中,follow关系存储模块采用用户follow数据库来实现;
3、请求单元将获得的用户列表即用户A1...用户An上报给推荐单元;
4、推荐单元通过用户相似度数据库,分别查询与用户A1...用户An最相似的10个用户;
5、用户相似度数据库向推荐单元返回分别与用户A1...用户An最相似的10个用户,以及各相似用户的权值;
6、推荐单元对(10*n)个用户的相似度进行合并处理,比如将与同一用户相似的相似度相加,并选相似度大的前10个用户,比如用户B1...用户B10返回给请求单元,这10个用户即为推荐给用户X的推荐用户。
本发明提供的方法,同样适用于基于好友关系的相似度的获取,以及利用钙相似度进行的相似用户的推荐,具体实现,参考本发明提供的具体实现方法,这里不再赘述。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种获取用户相似度的方法,其特征在于,包括:分析用户的反向收听关系;根据所述反向收听关系确定用户间的相似度。
2.根据权利要求1所述的方法,其特征在于,所述分析用户的反向收听关系,包括:
采用向量
Figure FSA00000345921400011
表示用户X的反向收听关系,其中i=1,2...n,n为所述用户所在系统中除该用户之外的用户个数,Qi为所述用户所在系统中除该用户之外的用户i;如果Qi已经收听所述用户X,则Qi=1,否则Qi=0。
3.根据权利要求2所述的方法,其特征在于,所述根据收听关系确定用户间的相似度包括:
按照公式
Figure FSA00000345921400013
计算用户间的相似度,其中,
i、j分别表示用户i和用户j,sim(i,j)表示用户i和用户j的相似度,
Figure FSA00000345921400014
表示用户i的反向收听关系,
Figure FSA00000345921400015
表示用户j的反向收听关系。
4.一种获取用户相似度的装置,其特征在于,至少包括分析模块、获取模块以及存储模块,其中,
分析模块,用于分析用户的收听关系,并将得到的收听关系中的反向收听关系输出给获取模块;
获取模块,用于根据用户的反向收听关系,确定用户间的相似度,按照相似度从高到低的顺序,选出与该用户相似度较高的预设数目个相似用户,并存储在存储模块中;
存储模块,用于存储用户的相似用户信息。
5.根据权利要求4所述的装置,其特征在于,还包括收听关系存储模块,用于存储分析模块分析出的正向收听关系和反向收听关系;此时,
分析模块,还用于将分析出的收听关系中的正向收听关系和反向收听关系输出给收听关系存储模块。
6.根据权利要求4所述的装置,其特征在于,所述存储模块,还用于为存储的各相似用户分别设置权值。
7.一种用户推荐方法,其特征在于,包括:
获取用户的正向收听关系;
确定正向收听关系中记录的该用户收听的各用户的相似用户,所述相似用户是根据反向收听关系确定的用户间的相似度确定的;
从确定出的相似用户中选出推荐给该用户的推荐用户。
8.根据权利要求7所述的用户推荐方法,其特征在于,该方法还包括:获取所述相似用户的相似度的权值。
9.根据权利要求8所述的用户推荐方法,其特征在于,所述选出推荐给该用户的推荐用户包括:
按照所述各相似用户的相似度从高到低的顺序,选择相似度较大的预设数量的相似用户作为推荐用户。
10.根据权利要求7所述的用户推荐方法,其特征在于,所述选出推荐给该用户的推荐用户包括:按照预先设置的策略选择预设数量的相似用户作为推荐用户。
11.一种用户推荐系统,其特征在于,包括请求单元、获取用户相似度的装置,以及推荐单元,其中,
请求单元,用于向获取用户相似度的装置发起第一请求,以请求获取用户的正向收听关系;将获得的发起请求的用户的正向收听关系发送给推荐单元;
获取用户相似度的装置,用于接收来自请求单元的第一请求,向请求单元输出发起请求的用户的正向收听关系;接收来自推荐单元的第二请求,向推荐单元输出发起请求的用户收听的用户的相似用户;
推荐单元,用于根据发起请求的用户的正向收听关系,获取发起请求的用户收听的用户,并向获取用户相似度的装置发起第二请求,用于请求该发起请求的用户收听的用户的相似用户;从获得的所有相似用户中选出预设数量的推荐给发起请求用户的推荐用户。
12.根据权利要求11所述的用户推荐系统,其特征在于,
所述获取用户相似度的装置,在收到第二请求时,还用于向所述推荐单元输出相似用户的权值;此时,
所述推荐单元,具体用于从获得的所有相似用户中,按照相似度从高到低,选出预设数量的推荐给发起请求用户的推荐用户。
CN201010543870.5A 2010-11-11 2010-11-11 获取用户相似度的方法、装置及用户推荐方法、系统 Active CN102467542B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010543870.5A CN102467542B (zh) 2010-11-11 2010-11-11 获取用户相似度的方法、装置及用户推荐方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010543870.5A CN102467542B (zh) 2010-11-11 2010-11-11 获取用户相似度的方法、装置及用户推荐方法、系统

Publications (2)

Publication Number Publication Date
CN102467542A true CN102467542A (zh) 2012-05-23
CN102467542B CN102467542B (zh) 2016-06-15

Family

ID=46071185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010543870.5A Active CN102467542B (zh) 2010-11-11 2010-11-11 获取用户相似度的方法、装置及用户推荐方法、系统

Country Status (1)

Country Link
CN (1) CN102467542B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930457A (zh) * 2012-10-24 2013-02-13 深圳市万凯达科技有限公司 一种基于面部图像特征实现应用推荐的方法和系统
CN103853781A (zh) * 2012-12-05 2014-06-11 腾讯科技(北京)有限公司 一种基于社交的用户组设置方法和装置
CN104317959A (zh) * 2014-11-10 2015-01-28 北京字节跳动网络技术有限公司 基于社交平台的数据挖掘方法及装置
CN104750759A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 热点用户发现的方法及其装置
CN104756147A (zh) * 2012-10-24 2015-07-01 脸谱公司 用于基于价值模型确定pymk的使用和内容的方法和系统
CN107577782A (zh) * 2017-09-14 2018-01-12 国家计算机网络与信息安全管理中心 一种基于异质数据的人物相似度刻画方法
CN107943864A (zh) * 2017-11-10 2018-04-20 阿基米德(上海)传媒有限公司 一种多媒体内容媒体下安全可控的智能推荐系统
CN108066990A (zh) * 2016-11-18 2018-05-25 腾讯科技(深圳)有限公司 一种从候选用户列表中选择用户的方法、装置及服务器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1967533A (zh) * 2006-07-17 2007-05-23 北京航空航天大学 采用元推荐引擎的门户个性化推荐服务方法和系统
CN101753573A (zh) * 2009-12-25 2010-06-23 山东大学 一种基于协同过滤的rss信息推荐方法
WO2010084629A1 (ja) * 2009-01-21 2010-07-29 国立大学法人東京大学 推薦システム、推薦方法、推薦プログラム及び情報記憶媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1967533A (zh) * 2006-07-17 2007-05-23 北京航空航天大学 采用元推荐引擎的门户个性化推荐服务方法和系统
WO2010084629A1 (ja) * 2009-01-21 2010-07-29 国立大学法人東京大学 推薦システム、推薦方法、推薦プログラム及び情報記憶媒体
CN101753573A (zh) * 2009-12-25 2010-06-23 山东大学 一种基于协同过滤的rss信息推荐方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10587705B2 (en) 2012-10-24 2020-03-10 Facebook, Inc. Methods and systems for determining use and content of PYMK based on value model
CN102930457A (zh) * 2012-10-24 2013-02-13 深圳市万凯达科技有限公司 一种基于面部图像特征实现应用推荐的方法和系统
CN104756147A (zh) * 2012-10-24 2015-07-01 脸谱公司 用于基于价值模型确定pymk的使用和内容的方法和系统
CN103853781B (zh) * 2012-12-05 2018-09-18 腾讯科技(北京)有限公司 一种基于社交的用户组设置方法和装置
CN103853781A (zh) * 2012-12-05 2014-06-11 腾讯科技(北京)有限公司 一种基于社交的用户组设置方法和装置
CN104750759A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 热点用户发现的方法及其装置
US10282381B2 (en) 2013-12-31 2019-05-07 Huawei Technologies Co., Ltd. Method and apparatus for discovering closely related user
CN104317959B (zh) * 2014-11-10 2018-07-17 北京字节跳动网络技术有限公司 基于社交平台的数据挖掘方法及装置
US10360230B2 (en) 2014-11-10 2019-07-23 Beijing Bytedance Network Technology Co., Ltd. Method and device for social platform-based data mining
CN104317959A (zh) * 2014-11-10 2015-01-28 北京字节跳动网络技术有限公司 基于社交平台的数据挖掘方法及装置
CN108066990A (zh) * 2016-11-18 2018-05-25 腾讯科技(深圳)有限公司 一种从候选用户列表中选择用户的方法、装置及服务器
CN108066990B (zh) * 2016-11-18 2021-01-22 腾讯科技(深圳)有限公司 一种从候选用户列表中选择用户的方法、装置及服务器
CN107577782A (zh) * 2017-09-14 2018-01-12 国家计算机网络与信息安全管理中心 一种基于异质数据的人物相似度刻画方法
CN107943864A (zh) * 2017-11-10 2018-04-20 阿基米德(上海)传媒有限公司 一种多媒体内容媒体下安全可控的智能推荐系统

Also Published As

Publication number Publication date
CN102467542B (zh) 2016-06-15

Similar Documents

Publication Publication Date Title
CN102467542A (zh) 获取用户相似度的方法、装置及用户推荐方法、系统
CN104123398B (zh) 一种信息推送方法及装置
CN105045818B (zh) 一种图片的推荐方法、装置和系统
CN105760360B (zh) 一种地址纠正方法和装置
CN102222078B (zh) 实时信息推送方法及设备
CN108541315A (zh) 语音激活数据分组的数据结构池化
CN103970861B (zh) 信息呈现方法和设备
EP3163466B1 (en) Trajectory data inquiry method and apparatus
CN101730008A (zh) 用于消息生成的方法、系统和装置
WO2015154438A1 (zh) 定位方法及装置
CN104572889A (zh) 一种搜索词推荐方法、装置和系统
CN103647800A (zh) 推荐应用资源的方法及系统
CN104036018A (zh) 视频获取方法和装置
CN102263799A (zh) 一种sns网络中好友推荐系统和方法
CN106649404A (zh) 一种会话场景数据库的创建方法及装置
CN103365928A (zh) 一种信息推荐方法及装置
CN109033075A (zh) 意图匹配的方法、装置、存储介质和终端设备
CN106649410A (zh) 一种获取聊天回复内容的方法及装置
CN105354318A (zh) 一种文件查找方法及装置
CN110633404A (zh) 应用程序消息推送的方法、装置、存储介质和终端设备
CN104657477A (zh) 社交推荐方法和装置
CN102663111A (zh) 一种信息获取方法和设备
CN103699589A (zh) 一种信息推送方法及装置
US9760933B1 (en) Interactive shopping advisor for refinancing product queries
CN106250516A (zh) 同义词在大数据搜索中的应用方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant