CN107545065B - 一种用户兴趣校准方法、系统及个性化推荐系统 - Google Patents

一种用户兴趣校准方法、系统及个性化推荐系统 Download PDF

Info

Publication number
CN107545065B
CN107545065B CN201710804510.8A CN201710804510A CN107545065B CN 107545065 B CN107545065 B CN 107545065B CN 201710804510 A CN201710804510 A CN 201710804510A CN 107545065 B CN107545065 B CN 107545065B
Authority
CN
China
Prior art keywords
initial weight
interest set
interest
term
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710804510.8A
Other languages
English (en)
Other versions
CN107545065A (zh
Inventor
王志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201710804510.8A priority Critical patent/CN107545065B/zh
Publication of CN107545065A publication Critical patent/CN107545065A/zh
Application granted granted Critical
Publication of CN107545065B publication Critical patent/CN107545065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种用户兴趣校准方法、系统及个性化推荐系统,其中,所述用户兴趣校准方法为与登录ID绑定的第一兴趣集合分配第一初始权重,并为与设备ID绑定的第二兴趣集合分配第二初始权重,并利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合,从而实现综合所述第一兴趣集合和第二兴趣集合获得推送内容的目的,降低了用户登录ID共享和具有多个设备等情况对推送内容与用户真实兴趣匹配度的影响,提高了个性化推荐系统推荐内容与用户真实兴趣的匹配度。

Description

一种用户兴趣校准方法、系统及个性化推荐系统
技术领域
本申请涉及个性化推荐技术领域,更具体地说,涉及一种用户兴趣校准方法、系统及个性化推荐系统。
背景技术
个性化推荐是指根据用户对于信息的访问行为生成推荐内容并向用户进行推送的功能,这一功能可以帮助用户在海量的信息中更加容易地找到感兴趣的信息。
在现有技术中,个性化推荐系统的个性化推荐功能通常是通过采集用户与登录ID绑定或与设备ID绑定的访问行为,并根据采集的访问行为作为训练样本进行训练后生成的。
但是不论是基于采集与登录ID绑定的访问行为生成的个性化推荐系统还是基于采集与设备ID绑定的访问行为都可能存在推荐内容与真实的用户兴趣存在不匹配的问题,这是由于可能会存在登录ID共享和同一用户具有多台设备的情况,这些情况都会导致上述问题。
发明内容
为解决上述技术问题,本发明提供了一种用户兴趣校准方法、系统及个性化推荐系统,以实现提高个性化推荐系统推荐内容与用户真实兴趣的匹配度的目的。
为实现上述技术目的,本发明实施例提供了如下技术方案:
一种用户兴趣校准方法,包括:
获取第一兴趣集合和第二兴趣集合,其中,所述第一兴趣集合与登录ID绑定,所述第二兴趣集合与设备ID绑定;
获取第一初始权重和第二初始权重,所述第一初始权重为所述第一兴趣集合的初始权重,所述第二初始权重为所述第二兴趣集合的初始权重;
利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合。
可选的,所述利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合包括:
将所述第一初始权重、第二初始权重、第一兴趣集合和第二兴趣集合代入第一预设公式中,计算获得所述校准兴趣集合;
所述第一预设公式为:P=ω1×(U∩V)+ω2×(U∪V-U∩V),其中,P表示所述校准兴趣集合,ω1表示所述第一初始权重,ω2表示所述第二初始权重,U表示所述第一兴趣集合,V表示所述第二兴趣集合。
可选的,所述获取第一兴趣集合和第二兴趣集合包括:
收集与登录ID绑定的用户访问行为,放入第一访问行为集合中;
根据所述第一访问行为集合按第一预设周期更新第一长期兴趣集合;
根据所述第一访问行为集合按第二预设周期更新第一短期兴趣集合,所述第二预设周期小于所述第一预设周期;
根据所述第一长期兴趣集合和第一短期兴趣集合生成所述第一兴趣集合;
收集与设备ID绑定的用户访问行为,放入第二访问行为集合中;
根据所述第二访问行为集合按第三预设周期更新第二长期兴趣集合;
根据所述第二访问行为集合按第四预设周期更新第二短期兴趣集合,所述第四预设周期小于所述第三预设周期;
根据所述第二长期兴趣集合和第二短期兴趣集合生成所述第二兴趣集合。
可选的,所述根据所述第一长期兴趣集合和第一短期兴趣集合生成所述第一兴趣集合包括:
为所述第一长期兴趣集合分配第三初始权重和第一衰减系数;
为所述第一短期兴趣集合分配第四初始权重和第二衰减系数;
将所述第一长期兴趣集合、第一短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入第二预设公式中,计算获得所述第一兴趣集合;
所述第二预设公式为:U=ω3×U1×F14×U2×F2,其中,U1表示所述第一长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,U2表示所述第一短期兴趣集合。
可选的,所述根据所述第二长期兴趣集合和第二短期兴趣集合生成所述第二兴趣集合包括:
为所述第二长期兴趣集合分配第三初始权重和第一衰减系数;
为所述第二短期兴趣集合分配第四初始权重和第二衰减系数;
将所述第二长期兴趣集合、第二短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入所述第三预设公式中,计算获得所述第二兴趣集合;
所述第三预设公式为:V=ω3×V1×F14×V2×F2,其中,V1表示所述第二长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,V2表示所述第二短期兴趣结合。
可选的,所述第一衰减系数根据第四预设公式确定,所述第二衰减系数根据第五预设公式确定;
其中,所述第四预设公式为:
Figure GDA0003077596660000031
所述第五预设公式为:
Figure GDA0003077596660000032
其中,0<e<1,Time_diff表示当前时间与兴趣子集合生成时间的差值,step1表示第一预设步长,step2表示第二预设步长。
可选的,所述利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合之后还包括:
统计用户对所述校准兴趣集合的访问行为作为修正训练样本;
根据所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重。
一种用户兴趣校准系统,包括:
集合获取模块,用于获取第一兴趣集合和第二兴趣集合,其中,所述第一兴趣集合与登录ID绑定,所述第二兴趣集合与设备ID绑定;
权重获取模块,用于获取第一初始权重和第二初始权重,所述第一初始权重为所述第一兴趣集合的初始权重,所述第二初始权重为所述第二兴趣集合的初始权重;
校准模块,用于利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合。
可选的,所述校准模块利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合具体用于,将所述第一初始权重、第二初始权重、第一兴趣集合和第二兴趣集合代入第一预设公式中,计算获得所述校准兴趣集合;
所述第一预设公式为:P=ω1×(U∩V)+ω2×(U∪V-U∩V),其中,P表示所述校准兴趣集合,ω1表示所述第一初始权重,ω2表示所述第二初始权重,U表示所述第一兴趣集合,V表示所述第二兴趣集合。
可选的,所述集合获取模块包括:
第一集合获取单元,用于收集与登录ID绑定的用户访问行为,放入第一访问行为集合中;
第一集合更新单元,用于根据所述第一访问行为集合按第一预设周期更新第一长期兴趣集合;
第二集合更新单元,用于根据所述第一访问行为集合按第二预设周期更新第一短期兴趣集合,所述第二预设周期小于所述第一预设周期;
第一集合生成单元,用于根据所述第一长期兴趣集合和第一短期兴趣集合生成所述第一兴趣集合;
第二集合获取单元,用于收集与设备ID绑定的用户访问行为,放入第二访问行为集合中;
第三集合更新单元,用于根据所述第二访问行为集合按第三预设周期更新第二长期兴趣集合;
第四集合更新单元,用于根据所述第二访问行为集合按第四预设周期更新第二短期兴趣集合,所述第四预设周期小于所述第三预设周期;
第二集合生成单元,用于根据所述第二长期兴趣集合和第二短期兴趣集合生成所述第二兴趣集合。
可选的,所述第一集合生成单元包括:
第一分配子单元,用于为所述第一长期兴趣集合分配第三初始权重和第一衰减系数;
第二分配子单元,用于为所述第一短期兴趣集合分配第四初始权重和第二衰减系数;
第一计算子单元,用于将所述第一长期兴趣集合、第一短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入第二预设公式中,计算获得所述第一兴趣集合;
所述第二预设公式为:U=ω3×U1×F14×U2×F2,其中,U1表示所述第一长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,U2表示所述第一短期兴趣集合。
可选的,所述第二集合生成单元包括:
第三分配子单元,用于为所述第二长期兴趣集合分配第三初始权重和第一衰减系数;
第四分配子单元,用于为所述第二短期兴趣集合分配第四初始权重和第二衰减系数;
第二计算子单元,用于将所述第二长期兴趣集合、第二短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入所述第三预设公式中,计算获得所述第二兴趣集合;
所述第三预设公式为:V=ω3×V1×F14×V2×F2,其中,V1表示所述第二长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,V2表示所述第二短期兴趣结合。
可选的,所述第一衰减系数根据第四预设公式确定,所述第二衰减系数根据第五预设公式确定;
其中,所述第四预设公式为:
Figure GDA0003077596660000051
所述第五预设公式为:
Figure GDA0003077596660000052
其中,0<e<1,Time_diff表示当前时间与兴趣子集合生成时间的差值,step1表示第一预设步长,step2表示第二预设步长。
可选的,还包括:
统计模块,用于统计用户对所述校准兴趣集合的访问行为作为修正训练样本;
权重修正模块,用于根据所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重。
一种个性化推荐系统,包括上述任一项所述的用户兴趣校准系统。
从上述技术方案可以看出,本发明实施例提供了一种用户兴趣校准方法、系统及个性化推荐系统,其中,所述用户兴趣校准方法为与登录ID绑定的第一兴趣集合分配第一初始权重,并为与设备ID绑定的第二兴趣集合分配第二初始权重,并利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合,从而实现综合所述第一兴趣集合和第二兴趣集合获得推送内容的目的,降低了用户登录ID共享和具有多个设备等情况对推送内容与用户真实兴趣匹配度的影响,提高了个性化推荐系统推荐内容与用户真实兴趣的匹配度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请的一个实施例提供的一种用户兴趣校准方法的流程示意图;
图2为本申请的另一个实施例提供的一种用户兴趣校准方法的流程示意图;
图3为本申请的又一个实施例提供的一种用户兴趣校准方法的流程示意图;
图4为本申请的再一个实施例提供的一种用户兴趣校准方法的流程示意图;
图5为本申请的一个优选实施例提供的一种用户兴趣校准方法的流程示意图;
图6为本申请的另一个优选实施例提供的一种用户兴趣校准方法的流程示意图;
图7为本申请的一个实施例提供的一种用户兴趣校准系统的结构示意图;
图8为本申请的另一个实施例提供的一种用户兴趣校准系统的结构示意图;
图9为本申请的又一个实施例提供的一种用户兴趣校准系统的结构示意图;
图10为本申请的再一个实施例提供的一种用户兴趣校准系统的结构示意图;
图11为本申请的一个优选实施例提供的一种用户兴趣校准系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例提供了一种用户兴趣校准方法,如图1所示,包括:
S101:获取第一兴趣集合和第二兴趣集合,其中,所述第一兴趣集合与登录ID绑定,所述第二兴趣集合与设备ID绑定;
S102:获取第一初始权重和第二初始权重,所述第一初始权重为所述第一兴趣集合的初始权重,所述第二初始权重为所述第二兴趣集合的初始权重;
S103:利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合。
需要说明的是,所述第一兴趣集合是指根据与登录ID绑定的用户访问行为生成的推送内容集合,所述第二兴趣集合是指根据与设备ID绑定的用户访问行为生成的推送内容集合。更具体地说,以第一兴趣集合为例,当用户以某一登录ID登录后进行的访问行为都作为所述第一兴趣集合的生成依据。例如,当用户在使用“张三”这一登录ID登录后,在访问《XX的名义》这一电视剧后,《XX的名义》这一标签就会作为第一兴趣集合的生成依据,在第一兴趣集合中会相应的增加与《XX的名义》相关或相似的推送内容。同样的,当用户在某一设备上进行的访问行为都会作为所述第二兴趣集合的生成依据。所述设备ID可以是设备的序列号,还可以是设备的标识码。本申请对所述设备ID的具体种类并不做限定,具体视实际情况而定。
还需要说明的是,所述用户兴趣校准方法为与登录ID绑定的第一兴趣集合分配第一初始权重,并为与设备ID绑定的第二兴趣集合分配第二初始权重,并利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合,从而实现综合所述第一兴趣集合和第二兴趣集合获得推送内容的目的,降低了由于用户登录ID共享和具有多个设备等情况对推送内容与用户真实兴趣匹配度的影响,提高了个性化推荐系统推荐内容与用户真实兴趣的匹配度。
在上述实施例的基础上,在本申请的一个实施例中,如图2所示,所述利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合包括:
S1031:将所述第一初始权重、第二初始权重、第一兴趣集合和第二兴趣集合代入第一预设公式中,计算获得所述校准兴趣集合;
所述第一预设公式为:P=ω1×(U∩V)+ω2×(U∪V-U∩V),其中,P表示所述校准兴趣集合,ω1表示所述第一初始权重,ω2表示所述第二初始权重,U表示所述第一兴趣集合,V表示所述第二兴趣集合。
需要说明的是,在所述第一预设公式中,∩表示交集,∪表示并集,所述第一预设公式为所述第一兴趣集合和第二兴趣集合的交集和费交集分别分配了第一初始权重和第二初始权重进行加权计算,从而实现综合所述第一兴趣集合和第二兴趣集合获得推送内容的目的。
所述第一初始权重和第二初始权重的设置原则优选为所述第一初始权重大于第二初始权重,因为我们更加关注所述第一兴趣集合和第二兴趣集合的交集,这部分内容更可能是贴近用户真实兴趣的内容。当然,在本申请的其他实施例中,所述第一初始权重和第二初始权重还可以是相等的,本申请对所述第一初始权重和第二初始权重的具体大小关系并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的另一个实施例中,如图3所示,所述获取第一兴趣集合和第二兴趣集合包括:
S1011:收集与登录ID绑定的用户访问行为,放入第一访问行为集合中;
S1012:根据所述第一访问行为集合按第一预设周期更新第一长期兴趣集合;
S1013:根据所述第一访问行为集合按第二预设周期更新第一短期兴趣集合,所述第二预设周期小于所述第一预设周期;
S1014:根据所述第一长期兴趣集合和第一短期兴趣集合生成所述第一兴趣集合;
S1015:收集与设备ID绑定的用户访问行为,放入第二访问行为集合中;
S1016:根据所述第二访问行为集合按第三预设周期更新第二长期兴趣集合;
S1017:根据所述第二访问行为集合按第四预设周期更新第二短期兴趣集合,所述第四预设周期小于所述第三预设周期;
S1018:根据所述第二长期兴趣集合和第二短期兴趣集合生成所述第二兴趣集合。
需要说明的是,长期兴趣是指基于较长周期更新的兴趣集合确定的代表用户兴趣的推荐内容;短期兴趣是指基于较短周期(一般远小于长期兴趣集合的更新周期)更新的兴趣集合确定的代表用户兴趣的推荐内容;例如,当每天的0点,长期兴趣会根据每天更新的兴趣集合进行内容更新;而每隔5秒钟,短期兴趣会根据每5秒钟更新的兴趣集合进行内容更新。那么相应的,作为长期兴趣更新的兴趣集合我们称之为长期兴趣集合,作为短期兴趣更新的兴趣集合我们称之为短期兴趣集合。
在本实施例中,所述第一长期兴趣集合可以定义为与登录ID绑定的长期兴趣集合,所述第一短期兴趣集合可以定义为与登录ID绑定的短期兴趣集合;相似的,所述第二长期兴趣集合可以定义为与设备ID绑定的长期兴趣集合,所述第二短期兴趣集合可以定义为与设备ID绑定的短期兴趣集合。其中,长期兴趣集合根据访问行为集合按第一预设周期进行更新,短期兴趣集合按第二预设周期进行更新,由于第一预设周期大于所述第二预设周期,因此我们将以较长周期进行更新的兴趣集合称为长期兴趣集合,将以较短周期进行更新的兴趣集合称为短期兴趣集合。所述第一预设周期可以是24小时,还可以是12小时或18小时等,所述第二预设周期一般设置为远小于第一预设周期的值,例如几秒或几毫秒等,以做到实时更新的目的;同样的,所述第三预设周期可以是24小时,还可以是12小时或18小时等,所述第四预设周期一般设置为远小于第一预设周期的值,例如几秒或几毫秒等。本申请对所述第一预设周期、第二预设周期、第三预设周期和第四预设周期的具体取值和关系并不做限定,具体视实际情况而定。
另外,所述短期兴趣集合实时更新是指在访问行为集合中增加内容时,即根据增加内容后的访问行为集合对所述短期兴趣集合进行更新,以所述第一短期兴趣集合为例,当所述第一访问行为集合中增加了《XX的名义》这一电视剧的访问行为后,所述第一短期兴趣集合中即根据更新后的第一访问行为集合重新生成,例如可能会在第一短期兴趣集合中增加与《XX的名义》相关或相似的推送内容。而如果在用户访问《XX的名义》这一电视剧之前,所述第一访问行为集合为空时,则在所述第一访问行为集合更新后,所述第一短期兴趣集合中则很大可能会增加与《XX的名义》相关或相似的推送内容。同样的,所述第二短期兴趣集合的更新策略与所述第一短期兴趣集合的更新策略类似,本申请在此不做赘述。
在上述实施例的基础上,在本申请的又一个实施例中,如图4所示,所述根据所述第一长期兴趣集合和第一短期兴趣集合生成所述第一兴趣集合包括:
S10141:为所述第一长期兴趣集合分配第三初始权重和第一衰减系数;
S10142:为所述第一短期兴趣集合分配第四初始权重和第二衰减系数;
S10143:将所述第一长期兴趣集合、第一短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入第二预设公式中,计算获得所述第一兴趣集合;
所述第二预设公式为:U=ω3×U1×F14×U2×F2,其中,U1表示所述第一长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,U2表示所述第一短期兴趣集合。
需要说明的是,所述第一衰减系数和第二衰减系数均为与时间相关的常数,当所述第一长期兴趣集合的生成时间距离当前时间越长,所述第一衰减系数越大,同样的,当所述第一短期兴趣集合的生成时间距离当前时间越长,所述第二衰减系数越大。
还需要说明的是,所述第三初始权重和第四初始权重的设置原则可以是所述第三初始权重小于第四初始权重,这样可以将用户历史最近的访问行为对于最终获得的校准兴趣集合的贡献放大,以所述校准兴趣集合更加贴近用户历史最近的访问行为。但在本申请的其他实施例中,所述第三初始权重也可以等于或大于第四初始权重,本申请对所述第三初始权重和第四初始权重的具体取值和相对关系并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的再一个实施例中,如图5所示,所述根据所述第二长期兴趣集合和第二短期兴趣集合生成所述第二兴趣集合包括:
S10181:为所述第二长期兴趣集合分配第三初始权重和第一衰减系数;
S10182:为所述第二短期兴趣集合分配第四初始权重和第二衰减系数;
S10183:将所述第二长期兴趣集合、第二短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入所述第三预设公式中,计算获得所述第二兴趣集合;
所述第三预设公式为:V=ω3×V1×F14×V2×F2,其中,V1表示所述第二长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,V2表示所述第二短期兴趣结合。
同样的,所述第三初始权重和第四初始权重的设置原则可以是所述第三初始权重小于第四初始权重,这样可以将用户历史最近的访问行为对于最终获得的校准兴趣集合的贡献放大,以所述校准兴趣集合更加贴近用户历史最近的访问行为。但在本申请的其他实施例中,所述第三初始权重也可以等于或大于第四初始权重,本申请对所述第三初始权重和第四初始权重的具体取值和相对关系并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的一个优选实施例中,所述第一衰减系数根据第四预设公式确定,所述第二衰减系数根据第五预设公式确定;
其中,所述第四预设公式为:
Figure GDA0003077596660000111
所述第五预设公式为:
Figure GDA0003077596660000112
其中,0<e<1,Time_diff表示当前时间与兴趣子集合生成时间的差值,step1表示第一预设步长,step2表示第二预设步长。
需要说明的是,由于所述第三预设公式用于确定所述长期兴趣集合的时间衰减系数,那么其中所述第一预设步长的量级一般以天为单位,可以是1天、1.5天或2天等;而所述第五预设公式用于确定所述短期兴趣集合的时间衰减系数,则其中所述第二预设步长的量级一般以分钟为单位,可以是1分钟、2分钟或5分钟等。本申请对所述第一预设步长和第二预设步长的具体取值并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的另一个优选实施例中,如图6所示,所述利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合之后还包括:
S104:统计用户对所述校准兴趣集合的访问行为作为修正训练样本;
S105:根据所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重。
需要说明的是,所述修正训练样本中包括正样本和负样本,其中,正样本为用户对于所述校准兴趣集合的推送内容的点击、喜好或点赞等行为;负样本为用户对于所述校准兴趣集合的推送内容的未点击、讨厌或删除等行为。所述根据所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重的原则为根据所述修正训练样本中的正样本和负样本的数量对所述第一初始权重、第二初始权重、第三初始权重和第四初始权重进行修正,例如,当用户对所述长期兴趣集合中的推送内容点击量较多时,即所述长期兴趣集合中的正样本数量较多时,则可以适当增加所述第三初始权重的值,以使所述长期兴趣集合中推送内容更多的出现在所述校准兴趣集合中;同样的,当用户对所述短期兴趣集合中的推送内容点击量较多时,则可以适当增加所述第四初始权重的值,以使所述短期兴趣集合中的推送内容更多的出现在所述校准兴趣集合中;
当用户对所述第一兴趣集合中的推送内容点击量较多时,即所述第一兴趣集合中的正样本数量较多时,则可以适当增加所述第一初始权重的值,以使所述第一兴趣集合中的推送内容更多的出现在所述校准兴趣集合中;同样的,当用户对所述第二兴趣集合中的推送内容点击量较多时,则可以适当增加所述第二初始权重的值,以使所述第二兴趣集合中的推送内容更多的出现在所述校准兴趣集合中。
在本实施例中,利用所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重可以进一步的增加推送的校准兴趣集合与用户真实兴趣的匹配度。
相应的,本申请实施例还提供了一种用户兴趣校准系统,如图7所示,包括:
集合获取模块100,用于获取第一兴趣集合和第二兴趣集合,其中,所述第一兴趣集合与登录ID绑定,所述第二兴趣集合与设备ID绑定;
权重获取模块200,用于获取第一初始权重和第二初始权重,所述第一初始权重为所述第一兴趣集合的初始权重,所述第二初始权重为所述第二兴趣集合的初始权重;
校准模块300,用于利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合。
需要说明的是,所述第一兴趣集合是指根据与登录ID绑定的用户访问行为生成的推送内容集合,所述第二兴趣集合是指根据与设备ID绑定的用户访问行为生成的推送内容集合。更具体地说,以第一兴趣集合为例,当用户以某一登录ID登录后进行的访问行为都作为所述第一兴趣集合的生成依据。例如,当用户在使用“张三”这一登录ID登录后,在访问《XX的名义》这一电视剧后,《XX的名义》这一标签就会作为第一兴趣集合的生成依据,在第一兴趣集合中会相应的增加与《XX的名义》相关或相似的推送内容。同样的,当用户在某一设备上进行的访问行为都会作为所述第二兴趣集合的生成依据。所述设备ID可以是设备的序列号,还可以是设备的标识码。本申请对所述设备ID的具体种类并不做限定,具体视实际情况而定。
还需要说明的是,所述用户兴趣校准系统为与登录ID绑定的第一兴趣集合分配第一初始权重,并为与设备ID绑定的第二兴趣集合分配第二初始权重,并利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合,从而实现综合所述第一兴趣集合和第二兴趣集合获得推送内容的目的,降低了由于用户登录ID共享和具有多个设备等情况对推送内容与用户真实兴趣匹配度的影响,提高了个性化推荐系统推荐内容与用户真实兴趣的匹配度。
在上述实施例的基础上,在本申请的一个实施例中,所述校准模块300利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合具体用于,将所述第一初始权重、第二初始权重、第一兴趣集合和第二兴趣集合代入第一预设公式中,计算获得所述校准兴趣集合;
所述第一预设公式为:P=ω1×(U∩V)+ω2×(U∪V-U∩V),其中,P表示所述校准兴趣集合,ω1表示所述第一初始权重,ω2表示所述第二初始权重,U表示所述第一兴趣集合,V表示所述第二兴趣集合。
需要说明的是,在所述第一预设公式中,∩表示交集,∪表示并集,所述第一预设公式为所述第一兴趣集合和第二兴趣集合的交集和费交集分别分配了第一初始权重和第二初始权重进行加权计算,从而实现综合所述第一兴趣集合和第二兴趣集合获得推送内容的目的。
所述第一初始权重和第二初始权重的设置原则优选为所述第一初始权重大于第二初始权重,因为我们更加关注所述第一兴趣集合和第二兴趣集合的交集,这部分内容更可能是贴近用户真实兴趣的内容。当然,在本申请的其他实施例中,所述第一初始权重和第二初始权重还可以是相等的,本申请对所述第一初始权重和第二初始权重的具体大小关系并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的另一个实施例中,如图8所示,所述集合获取模块100包括:
第一集合获取单元110,用于收集与登录ID绑定的用户访问行为,放入第一访问行为集合中;
第一集合更新单元120,用于根据所述第一访问行为集合按第一预设周期更新第一长期兴趣集合;
第二集合更新单元130,用于根据所述第一访问行为集合按第二预设周期更新第一短期兴趣集合,所述第二预设周期小于所述第一预设周期;
第一集合生成单元140,用于根据所述第一长期兴趣集合和第一短期兴趣集合生成所述第一兴趣集合;
第二集合获取单元150,用于收集与设备ID绑定的用户访问行为,放入第二访问行为集合中;
第三集合更新单元160,用于根据所述第二访问行为集合按第三预设周期更新第二长期兴趣集合;
第四集合更新单元170,用于根据所述第二访问行为集合按第四预设周期更新第二短期兴趣集合,所述第四预设周期小于所述第三预设周期;
第二集合生成单元180,用于根据所述第二长期兴趣集合和第二短期兴趣集合生成所述第二兴趣集合。
需要说明的是,长期兴趣是指基于较长周期更新的兴趣集合确定的代表用户兴趣的推荐内容;短期兴趣是指基于较短周期(一般远小于长期兴趣集合的更新周期)更新的兴趣集合确定的代表用户兴趣的推荐内容;例如,当每天的0点,长期兴趣会根据每天更新的兴趣集合进行内容更新;而每隔5秒钟,短期兴趣会根据每5秒钟更新的兴趣集合进行内容更新。那么相应的,作为长期兴趣更新的兴趣集合我们称之为长期兴趣集合,作为短期兴趣更新的兴趣集合我们称之为短期兴趣集合。
在本实施例中,所述第一长期兴趣集合可以定义为与登录ID绑定的长期兴趣集合,所述第一短期兴趣集合可以定义为与登录ID绑定的短期兴趣集合;相似的,所述第二长期兴趣集合可以定义为与设备ID绑定的长期兴趣集合,所述第二短期兴趣集合可以定义为与设备ID绑定的短期兴趣集合。其中,长期兴趣集合根据访问行为集合按第一预设周期进行更新,短期兴趣集合按第二预设周期进行更新,由于第一预设周期大于所述第二预设周期,因此我们将以较长周期进行更新的兴趣集合称为长期兴趣集合,将以较短周期进行更新的兴趣集合称为短期兴趣集合。所述第一预设周期可以是24小时,还可以是12小时或18小时等,所述第二预设周期一般设置为远小于第一预设周期的值,例如几秒或几毫秒等,以做到实时更新的目的;同样的,所述第三预设周期可以是24小时,还可以是12小时或18小时等,所述第四预设周期一般设置为远小于第一预设周期的值,例如几秒或几毫秒等。本申请对所述第一预设周期、第二预设周期、第三预设周期和第四预设周期的具体取值和关系并不做限定,具体视实际情况而定。
另外,所述短期兴趣集合实时更新是指在访问行为集合中增加内容时,即根据增加内容后的访问行为集合对所述短期兴趣集合进行更新,以所述第一短期兴趣集合为例,当所述第一访问行为集合中增加了《XX的名义》这一电视剧的访问行为后,所述第一短期兴趣集合中即根据更新后的第一访问行为集合重新生成,例如可能会在第一短期兴趣集合中增加与《XX的名义》相关或相似的推送内容。而如果在用户访问《XX的名义》这一电视剧之前,所述第一访问行为集合为空时,则在所述第一访问行为集合更新后,所述第一短期兴趣集合中则很大可能会增加与《XX的名义》相关或相似的推送内容。同样的,所述第二短期兴趣集合的更新策略与所述第一短期兴趣集合的更新策略类似,本申请在此不做赘述。
在上述实施例的基础上,在本申请的又一个实施例中,如图9所示,所述第一集合生成单元140包括:
第一分配子单元141,用于为所述第一长期兴趣集合分配第三初始权重和第一衰减系数;
第二分配子单元142,用于为所述第一短期兴趣集合分配第四初始权重和第二衰减系数;
第一计算子单元143,用于将所述第一长期兴趣集合、第一短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入第二预设公式中,计算获得所述第一兴趣集合;
所述第二预设公式为:U=ω3×U1×F14×U2×F2,其中,U1表示所述第一长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,U2表示所述第一短期兴趣集合。
需要说明的是,所述第一衰减系数和第二衰减系数均为与时间相关的常数,当所述第一长期兴趣集合的生成时间距离当前时间越长,所述第一衰减系数越大,同样的,当所述第一短期兴趣集合的生成时间距离当前时间越长,所述第二衰减系数越大。
还需要说明的是,所述第三初始权重和第四初始权重的设置原则可以是所述第三初始权重小于第四初始权重,这样可以将用户历史最近的访问行为对于最终获得的校准兴趣集合的贡献放大,以所述校准兴趣集合更加贴近用户历史最近的访问行为。但在本申请的其他实施例中,所述第三初始权重也可以等于或大于第四初始权重,本申请对所述第三初始权重和第四初始权重的具体取值和相对关系并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的再一个实施例中,如图10所示,所述第二集合生成单元180包括:
第三分配子单元181,用于为所述第二长期兴趣集合分配第三初始权重和第一衰减系数;
第四分配子单元182,用于为所述第二短期兴趣集合分配第四初始权重和第二衰减系数;
第二计算子单元183,用于将所述第二长期兴趣集合、第二短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入所述第三预设公式中,计算获得所述第二兴趣集合;
所述第三预设公式为:V=ω3×V1×F14×V2×F2,其中,V1表示所述第二长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,V2表示所述第二短期兴趣结合。
同样的,所述第三初始权重和第四初始权重的设置原则可以是所述第三初始权重小于第四初始权重,这样可以将用户历史最近的访问行为对于最终获得的校准兴趣集合的贡献放大,以所述校准兴趣集合更加贴近用户历史最近的访问行为。但在本申请的其他实施例中,所述第三初始权重也可以等于或大于第四初始权重,本申请对所述第三初始权重和第四初始权重的具体取值和相对关系并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的一个优选实施例中,所述第一衰减系数根据第四预设公式确定,所述第二衰减系数根据第五预设公式确定;
其中,所述第四预设公式为:
Figure GDA0003077596660000171
所述第五预设公式为:
Figure GDA0003077596660000172
其中,0<e<1,Time_diff表示当前时间与兴趣子集合生成时间的差值,step1表示第一预设步长,step2表示第二预设步长。
需要说明的是,由于所述第三预设公式用于确定所述长期兴趣集合的时间衰减系数,那么其中所述第一预设步长的量级一般以天为单位,可以是1天、1.5天或2天等;而所述第五预设公式用于确定所述短期兴趣集合的时间衰减系数,则其中所述第二预设步长的量级一般以分钟为单位,可以是1分钟、2分钟或5分钟等。本申请对所述第一预设步长和第二预设步长的具体取值并不做限定,具体视实际情况而定。
在上述实施例的基础上,在本申请的另一个优选实施例中,如图11所示,所述用户兴趣校准系统还包括:
统计模块400,用于统计用户对所述校准兴趣集合的访问行为作为修正训练样本;
权重修正模块500,用于根据所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重。
需要说明的是,所述修正训练样本中包括正样本和负样本,其中,正样本为用户对于所述校准兴趣集合的推送内容的点击、喜好或点赞等行为;负样本为用户对于所述校准兴趣集合的推送内容的未点击、讨厌或删除等行为。所述根据所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重的原则为根据所述修正训练样本中的正样本和负样本的数量对所述第一初始权重、第二初始权重、第三初始权重和第四初始权重进行修正,例如,当用户对所述长期兴趣集合中的推送内容点击量较多时,即所述长期兴趣集合中的正样本数量较多时,则可以适当增加所述第三初始权重的值,以使所述长期兴趣集合中推送内容更多的出现在所述校准兴趣集合中;同样的,当用户对所述短期兴趣集合中的推送内容点击量较多时,则可以适当增加所述第四初始权重的值,以使所述短期兴趣集合中的推送内容更多的出现在所述校准兴趣集合中;
当用户对所述第一兴趣集合中的推送内容点击量较多时,即所述第一兴趣集合中的正样本数量较多时,则可以适当增加所述第一初始权重的值,以使所述第一兴趣集合中的推送内容更多的出现在所述校准兴趣集合中;同样的,当用户对所述第二兴趣集合中的推送内容点击量较多时,则可以适当增加所述第二初始权重的值,以使所述第二兴趣集合中的推送内容更多的出现在所述校准兴趣集合中。
在本实施例中,利用所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重可以进一步的增加推送的校准兴趣集合与用户真实兴趣的匹配度。
相应的,本申请实施例还提供了一种个性化推荐系统,包括上述任一实施例所述的用户兴趣校准系统。
综上所述,本申请实施例提供了一种用户兴趣校准方法、系统及个性化推荐系统,其中,所述用户兴趣校准方法为与登录ID绑定的第一兴趣集合分配第一初始权重,并为与设备ID绑定的第二兴趣集合分配第二初始权重,并利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合,从而实现综合所述第一兴趣集合和第二兴趣集合获得推送内容的目的,降低了用户登录ID共享和具有多个设备等情况对推送内容与用户真实兴趣匹配度的影响,提高了个性化推荐系统推荐内容与用户真实兴趣的匹配度。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (15)

1.一种用户兴趣校准方法,其特征在于,包括:
获取第一兴趣集合和第二兴趣集合,其中,所述第一兴趣集合是指根据与登录ID绑定的用户访问行为生成的推送内容集合,所述第二兴趣集合是指根据与设备ID绑定的用户访问行为生成的推送内容集合;
获取第一初始权重和第二初始权重,所述第一初始权重为所述第一兴趣集合的初始权重,所述第二初始权重为所述第二兴趣集合的初始权重;
利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合。
2.根据权利要求1所述的方法,其特征在于,所述利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合包括:
将所述第一初始权重、第二初始权重、第一兴趣集合和第二兴趣集合代入第一预设公式中,计算获得所述校准兴趣集合;
所述第一预设公式为:P=ω1×(U∩V)+ω2×(U∪V-U∩V),其中,P表示所述校准兴趣集合,ω1表示所述第一初始权重,ω2表示所述第二初始权重,U表示所述第一兴趣集合,V表示所述第二兴趣集合。
3.根据权利要求2所述的方法,其特征在于,所述获取第一兴趣集合和第二兴趣集合包括:
收集与登录ID绑定的用户访问行为,放入第一访问行为集合中;
根据所述第一访问行为集合按第一预设周期更新第一长期兴趣集合;
根据所述第一访问行为集合按第二预设周期更新第一短期兴趣集合,所述第二预设周期小于所述第一预设周期;
根据所述第一长期兴趣集合和第一短期兴趣集合生成所述第一兴趣集合;
收集与设备ID绑定的用户访问行为,放入第二访问行为集合中;
根据所述第二访问行为集合按第三预设周期更新第二长期兴趣集合;
根据所述第二访问行为集合按第四预设周期更新第二短期兴趣集合,所述第四预设周期小于所述第三预设周期;
根据所述第二长期兴趣集合和第二短期兴趣集合生成所述第二兴趣集合。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一长期兴趣集合和第一短期兴趣集合生成所述第一兴趣集合包括:
为所述第一长期兴趣集合分配第三初始权重和第一衰减系数;
为所述第一短期兴趣集合分配第四初始权重和第二衰减系数;
将所述第一长期兴趣集合、第一短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入第二预设公式中,计算获得所述第一兴趣集合;
所述第二预设公式为:U=ω3×U1×F14×U2×F2,其中,U1表示所述第一长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,U2表示所述第一短期兴趣集合。
5.根据权利要求3所述的方法,其特征在于,所述根据所述第二长期兴趣集合和第二短期兴趣集合生成所述第二兴趣集合包括:
为所述第二长期兴趣集合分配第三初始权重和第一衰减系数;
为所述第二短期兴趣集合分配第四初始权重和第二衰减系数;
将所述第二长期兴趣集合、第二短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入第三预设公式中,计算获得所述第二兴趣集合;
所述第三预设公式为:V=ω3×V1×F14×V2×F2,其中,V1表示所述第二长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,V2表示所述第二短期兴趣集 合。
6.根据权利要求4所述的方法,其特征在于,所述第一衰减系数根据第四预设公式确定,所述第二衰减系数根据第五预设公式确定;
其中,所述第四预设公式为:
Figure FDA0003077596650000021
所述第五预设公式为:
Figure FDA0003077596650000022
其中,0<e<1,Time_diff表示当前时间与兴趣子集合生成时间的差值,step1表示第一预设步长,step2表示第二预设步长。
7.根据权利要求4所述的方法,其特征在于,所述利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合之后还包括:
统计用户对所述校准兴趣集合的访问行为作为修正训练样本;
根据所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重。
8.一种用户兴趣校准系统,其特征在于,包括:
集合获取模块,用于获取第一兴趣集合和第二兴趣集合,其中,所述第一兴趣集合是指根据与登录ID绑定的用户访问行为生成的推送内容集合,所述第二兴趣集合是指根据与设备ID绑定的用户访问行为生成的推送内容集合;
权重获取模块,用于获取第一初始权重和第二初始权重,所述第一初始权重为所述第一兴趣集合的初始权重,所述第二初始权重为所述第二兴趣集合的初始权重;
校准模块,用于利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合。
9.根据权利要求8所述的系统,其特征在于,所述校准模块利用所述第一初始权重和第二初始权重对所述第一兴趣集合和第二兴趣集合进行加权平均,获得校准兴趣集合具体用于,将所述第一初始权重、第二初始权重、第一兴趣集合和第二兴趣集合代入第一预设公式中,计算获得所述校准兴趣集合;
所述第一预设公式为:P=ω1×(U∩V)+ω2×(U∪V-U∩V),其中,P表示所述校准兴趣集合,ω1表示所述第一初始权重,ω2表示所述第二初始权重,U表示所述第一兴趣集合,V表示所述第二兴趣集合。
10.根据权利要求9所述的系统,其特征在于,所述集合获取模块包括:
第一集合获取单元,用于收集与登录ID绑定的用户访问行为,放入第一访问行为集合中;
第一集合更新单元,用于根据所述第一访问行为集合按第一预设周期更新第一长期兴趣集合;
第二集合更新单元,用于根据所述第一访问行为集合按第二预设周期更新第一短期兴趣集合,所述第二预设周期小于所述第一预设周期;
第一集合生成单元,用于根据所述第一长期兴趣集合和第一短期兴趣集合生成所述第一兴趣集合;
第二集合获取单元,用于收集与设备ID绑定的用户访问行为,放入第二访问行为集合中;
第三集合更新单元,用于根据所述第二访问行为集合按第三预设周期更新第二长期兴趣集合;
第四集合更新单元,用于根据所述第二访问行为集合按第四预设周期更新第二短期兴趣集合,所述第四预设周期小于所述第三预设周期;
第二集合生成单元,用于根据所述第二长期兴趣集合和第二短期兴趣集合生成所述第二兴趣集合。
11.根据权利要求10所述的系统,其特征在于,所述第一集合生成单元包括:
第一分配子单元,用于为所述第一长期兴趣集合分配第三初始权重和第一衰减系数;
第二分配子单元,用于为所述第一短期兴趣集合分配第四初始权重和第二衰减系数;
第一计算子单元,用于将所述第一长期兴趣集合、第一短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入第二预设公式中,计算获得所述第一兴趣集合;
所述第二预设公式为:U=ω3×U1×F14×U2×F2,其中,U1表示所述第一长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,U2表示所述第一短期兴趣集合。
12.根据权利要求10所述的系统,其特征在于,所述第二集合生成单元包括:
第三分配子单元,用于为所述第二长期兴趣集合分配第三初始权重和第一衰减系数;
第四分配子单元,用于为所述第二短期兴趣集合分配第四初始权重和第二衰减系数;
第二计算子单元,用于将所述第二长期兴趣集合、第二短期兴趣集合、第一衰减系数、第二衰减系数、第三初始权重和第四初始权重代入第三预设公式中,计算获得所述第二兴趣集合;
所述第三预设公式为:V=ω3×V1×F14×V2×F2,其中,V1表示所述第二长期兴趣集合,ω3表示所述第三初始权重,F1表示所述第一衰减系数,ω4表示所述第四初始权重,F2表示所述第二衰减系数,V2表示所述第二短期兴趣集 合。
13.根据权利要求11所述的系统,其特征在于,所述第一衰减系数根据第四预设公式确定,所述第二衰减系数根据第五预设公式确定;
其中,所述第四预设公式为:
Figure FDA0003077596650000051
所述第五预设公式为:
Figure FDA0003077596650000052
其中,0<e<1,Time_diff表示当前时间与兴趣子集合生成时间的差值,step1表示第一预设步长,step2表示第二预设步长。
14.根据权利要求11所述的系统,其特征在于,还包括:
统计模块,用于统计用户对所述校准兴趣集合的访问行为作为修正训练样本;
权重修正模块,用于根据所述修正训练样本修正所述第一初始权重、第二初始权重、第三初始权重和第四初始权重。
15.一种个性化推荐系统,其特征在于,包括权利要求8-14任一项所述的用户兴趣校准系统。
CN201710804510.8A 2017-09-08 2017-09-08 一种用户兴趣校准方法、系统及个性化推荐系统 Active CN107545065B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710804510.8A CN107545065B (zh) 2017-09-08 2017-09-08 一种用户兴趣校准方法、系统及个性化推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710804510.8A CN107545065B (zh) 2017-09-08 2017-09-08 一种用户兴趣校准方法、系统及个性化推荐系统

Publications (2)

Publication Number Publication Date
CN107545065A CN107545065A (zh) 2018-01-05
CN107545065B true CN107545065B (zh) 2021-08-13

Family

ID=60958782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710804510.8A Active CN107545065B (zh) 2017-09-08 2017-09-08 一种用户兴趣校准方法、系统及个性化推荐系统

Country Status (1)

Country Link
CN (1) CN107545065B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532472B (zh) * 2019-08-28 2022-09-27 百度在线网络技术(北京)有限公司 内容同步推荐方法、装置、电子设备和存储介质
CN111310033B (zh) * 2020-01-23 2023-05-30 山西大学 基于用户兴趣漂移的推荐方法及推荐装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104735158A (zh) * 2015-03-31 2015-06-24 北京奇艺世纪科技有限公司 一种用户行为数据的分类存储方法及装置
CN105007184A (zh) * 2015-07-22 2015-10-28 胡东雁 用户行为习惯的获取方法
CN106503014A (zh) * 2015-09-08 2017-03-15 腾讯科技(深圳)有限公司 一种实时信息的推荐方法、装置和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013116894A1 (en) * 2012-02-06 2013-08-15 Cohen Kevin Frank System and method for location based customer relationship management
US10475075B2 (en) * 2013-03-15 2019-11-12 Marchex, Inc. Correlated consumer telephone numbers and user identifiers for advertising retargeting
US20140279821A1 (en) * 2013-03-15 2014-09-18 Xperscore, Inc. System and method for tracking knowledge and expertise
CN104602042B (zh) * 2014-12-31 2017-11-03 合一网络技术(北京)有限公司 基于用户行为的标签设置方法
CN104834674B (zh) * 2015-03-31 2018-11-02 北京奇艺世纪科技有限公司 收集用户行为数据、信息推荐方法及装置
CN104991917B (zh) * 2015-06-23 2018-05-01 上海斐讯数据通信技术有限公司 广告个性化推送系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104735158A (zh) * 2015-03-31 2015-06-24 北京奇艺世纪科技有限公司 一种用户行为数据的分类存储方法及装置
CN105007184A (zh) * 2015-07-22 2015-10-28 胡东雁 用户行为习惯的获取方法
CN106503014A (zh) * 2015-09-08 2017-03-15 腾讯科技(深圳)有限公司 一种实时信息的推荐方法、装置和系统

Also Published As

Publication number Publication date
CN107545065A (zh) 2018-01-05

Similar Documents

Publication Publication Date Title
CN107729542B (zh) 一种信息评分方法及装置和存储介质
AU2010314292C1 (en) Method and system for adapting a session timeout period
EP1955230A1 (en) System and method for communicating environmentally-based medical advice
CN103544212A (zh) 一种内容推荐方法及系统
US10007954B2 (en) Managing an initial post on a website
US20110113009A1 (en) Outlier data point detection
CN107545065B (zh) 一种用户兴趣校准方法、系统及个性化推荐系统
CN109359217B (zh) 一种用户兴趣度计算方法、服务器及可读存储介质
KR20180072793A (ko) 푸시 정보 대략 선택 정렬 방법, 디바이스 및 컴퓨터 저장 매체
AU2015215881A1 (en) Predictive model generator
CN111191124A (zh) 确定兴趣标签权重的方法、装置、存储介质及电子设备
CN115827788A (zh) 一种数据迁移方法、装置、电子设备及可读存储介质
CN108989383B (zh) 数据处理方法和客户端
CN105022753B (zh) 一种数据存储方法及系统
CN112650940A (zh) 应用程序的推荐方法、装置、计算机设备及存储介质
CN108416426B (zh) 数据处理方法、装置及计算机可读存储介质
CN112259239B (zh) 一种参数处理方法、装置、电子设备及存储介质
US20140304583A1 (en) Systems and Methods for Creating Web Pages Based on User Modification of Rich Internet Application Content
CN114004623A (zh) 机器学习方法及系统
CN104778094A (zh) 一种融合数据纠错方法及装置
CN114579419A (zh) 一种数据处理方法及装置、存储介质
CN105335494B (zh) 用户数据导入方法及系统
CN107203551B (zh) 一种数据处理方法及装置
CN112446740B (zh) 一种广告数据曲线生成方法、系统、电子设备及存储介质
CN114090854B (zh) 基于信息熵的标签权重智能更新方法、系统及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant