CN108133036A - 一种用户兴趣点的权重值确定方法、装置及电子设备 - Google Patents

一种用户兴趣点的权重值确定方法、装置及电子设备 Download PDF

Info

Publication number
CN108133036A
CN108133036A CN201810019600.0A CN201810019600A CN108133036A CN 108133036 A CN108133036 A CN 108133036A CN 201810019600 A CN201810019600 A CN 201810019600A CN 108133036 A CN108133036 A CN 108133036A
Authority
CN
China
Prior art keywords
user
time
interest point
user interest
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810019600.0A
Other languages
English (en)
Inventor
李雪
宋华
查强
王志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810019600.0A priority Critical patent/CN108133036A/zh
Publication of CN108133036A publication Critical patent/CN108133036A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种用户兴趣点的权重值确定方法、装置及电子设备,所述方法包括:当需要确定当前时间用户兴趣点的权重值时,获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间;获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的;基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1;按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。应用本发明实施例,能够提高用户兴趣点的权重值确定的准确性。

Description

一种用户兴趣点的权重值确定方法、装置及电子设备
技术领域
本发明涉及数据处理技术领域,特别是涉及一种用户兴趣点的权重值确定方法、装置及电子设备。
背景技术
随着互联网的发展,信息的数量越来越大,用户可以选择的面也越来越广,个性化推荐就是从海量内容中,精选出用户喜欢的内容,推荐给该用户,产生高收益展示。
在这个过程中,生成用户画像是重要的一环,其是通过分析用户行为,为用户的兴趣点打上标签和所属的主题,以及各标签和各主题对应的权重值,以此来反应用户对不同的内容的喜好程度。其中,标签和主题都表征了用户行为对应的内容,即用户对该内容有兴趣、偏好、需求等等,权重值表征了用户的兴趣、偏好指数。而在生成用户画像的过程中,用户兴趣点的权重值确定的越准确,用户画像的构建就越精准,个性化推荐的效率也就越高。
在现有的用户兴趣点的权重值确定方法中,当需要确定当前时间用户兴趣点的权重值时,先获取最近一次对用户兴趣点发生用户兴趣行为的行为时间,然后计算当前时间与行为时间的时间差,再根据当前时间与行为时间的时间差确定用户兴趣点所衰减的权重值,时间差越大,所衰减的权重值越多,从而用户兴趣点的权重值就越小。
然而,发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
对于一个瞬间热度的事件,如某某明星离婚事件,用户集中关注了两天之后,就不再继续关注了,表明该事件不再是用户感兴趣的事件了,而根据现有的用户兴趣点的权重值确定方法,该事件的权重值减小的过慢。或者对于用户在固定周期内关注的兴趣点,例如用户在每周五都会观看同一档综艺节目,表明用户对该兴趣点会持续关注,而根据现有的用户兴趣点的权重值确定方法,该兴趣点的权重值的减小的过快,这些都导致所确定的用户兴趣点的权重值不够准确,从而导致用户画像无法准确的表示用户的兴趣喜好。
发明内容
本发明实施例的目的在于提供一种用户兴趣点的权重值确定方法、装置及电子设备,以提高用户兴趣点的权重值确定的准确性,从而使得用户画像能够准确的表示用户的兴趣喜好。具体技术方案如下:
第一方面,本发明实施例公开了一种用户兴趣点的权重值确定方法,所述方法包括:
当需要确定当前时间用户兴趣点的权重值时,获取最近一次针对所述用户兴趣点发生用户兴趣行为的行为时间;
获取截止所述当前时间所述用户兴趣点的时间窗口数量,其中,所述时间窗口数量为针对所述用户兴趣点发生有用户兴趣行为的时间窗口的数量,所述时间窗口为按照预设规则划分得到的;
基于所述行为时间与所述当前时间的时间差,以及所述时间窗口数量,确定所述用户兴趣点的衰减系数值,所述衰减系数值随着所述时间差的增大而减小,随着所述时间窗口数量的增大而增大,所述衰减系数值小于1;
按照所述衰减系数值,确定针对所述当前时间的所述用户兴趣点的权重值。
可选的,所述基于所述行为时间与所述当前时间的时间差,以及所述时间窗口数量,确定所述用户兴趣点的衰减系数值,包括:
采用如下公式确定所述用户兴趣点的衰减系数值:
其中,v为所述用户兴趣点的衰减系数值,Δt为所述行为时间与所述当前时间的时间差,N为所述时间窗口数量,θ为预设的时间衰减调节因子。
可选的,所述按照所述衰减系数值,确定针对所述当前时间的所述用户兴趣点的权重值,包括:
确定针对所述当前时间的所述用户兴趣点的权重值为最近一次针对所述用户兴趣点发生用户兴趣行为后更新的权重值与所述衰减系数值的乘积。
可选的,所述按照所述衰减系数值,确定针对所述当前时间的所述用户兴趣点的权重值,包括:
采用如下公式确定针对所述当前时间的所述用户兴趣点的权重值:
其中,u表示用户编号,f表示所述用户兴趣点,s(u,f)为针对所述当前时间的用户u的所述用户兴趣点f的权重值,M表示用户兴趣行为的行为类型的数量,ωi表示第i种行为类型对应的权重值,nij表示第j个所述时间窗口中发生第i种行为类型的用户兴趣行为的次数。
可选的,所述方法还包括:
当针对所述用户兴趣点首次发生用户兴趣行为时,确定所述用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值;或者
当针对所述用户兴趣点首次发生用户兴趣行为时,确定所述用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值与预设加强系数的乘积,所述预设加强系数大于1。
可选的,所述时间窗口为按照预设时间周期划分的。
可选的,所述用户兴趣点为用户兴趣标签,或者,用户兴趣主题。
第二方面,本发明实施例公开了一种用户兴趣点的权重值确定装置,所述装置包括:
时间获取模块,用于当需要确定当前时间用户兴趣点的权重值时,获取最近一次针对所述用户兴趣点发生用户兴趣行为的行为时间;
数量获取模块,用于获取截止所述当前时间所述用户兴趣点的时间窗口数量,其中,所述时间窗口数量为针对所述用户兴趣点发生有用户兴趣行为的时间窗口的数量,所述时间窗口为按照预设规则划分得到的;
衰减系数确定模块,用于基于所述行为时间与所述当前时间的时间差,以及所述时间窗口数量,确定所述用户兴趣点的衰减系数值,所述衰减系数值随着所述时间差的增大而减小,随着所述时间窗口数量的增大而增大,所述衰减系数值小于1;
权重值确定模块,用于按照所述衰减系数值,确定针对所述当前时间的所述用户兴趣点的权重值。
可选的,所述衰减系数确定模块,具体用于采用如下公式确定所述用户兴趣点的衰减系数值:
其中,v为所述用户兴趣点的衰减系数值,Δt为所述行为时间与所述当前时间的时间差,N为所述时间窗口数量,θ为预设的时间衰减调节因子。
可选的,所述权重值确定模块,具体用于确定针对所述当前时间的所述用户兴趣点的权重值为最近一次针对所述用户兴趣点发生用户兴趣行为后更新的权重值与所述衰减系数值的乘积。
可选的,所述权重值确定模块,具体还用于采用如下公式确定针对所述当前时间的所述用户兴趣点的权重值:
其中,u表示用户编号,f表示所述用户兴趣点,s(u,f)为针对所述当前时间的用户u的所述用户兴趣点f的权重值,M表示用户兴趣行为的行为类型的数量,ωi表示第i种行为类型对应的权重值,nij表示第j个所述时间窗口中发生第i种行为类型的用户兴趣行为的次数。
可选的,所述权重值确定模块,还用于当针对所述用户兴趣点首次发生用户兴趣行为时,确定所述用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值;或者当针对所述用户兴趣点首次发生用户兴趣行为时,确定所述用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值与预设加强系数的乘积,所述预设加强系数大于1。
可选的,所述时间窗口为按照预设时间周期划分的。
可选的,所述用户兴趣点为用户兴趣标签,或者,用户兴趣主题。
第三方面,本发明实施例公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现上述第一方面所述的一种用户兴趣点的权重值确定方法。
第四方面,本发明实施例公开了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的一种用户兴趣点的权重值确定方法。
第五方面,本发明实施例公开了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的一种用户兴趣点的权重值确定方法。
本发明实施例提供的一种用户兴趣点的权重值确定方法、装置及电子设备,当需要确定当前时间用户兴趣点的权重值时,先获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间;然后获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的;基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1;最后按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。这样,在确定用户兴趣点的权重值时同时考虑了时间差和发生有用户兴趣行为的时间窗口的数量,提高了用户兴趣点的权重值确定的准确性,从而使得用户画像能够准确的表示用户的兴趣喜好。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种用户兴趣点的权重值确定方法的一种流程示意图;
图2为本发明实施例提供的一种用户兴趣点的权重值的变化示意图;
图3为本发明实施例提供的一种用户兴趣点的权重值确定方法的另一种流程示意图;
图4为本发明实施例提供的一种用户兴趣点的权重值确定装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
在生成用户画像时,由于用户兴趣点的权重值会随着时间而发生变化,但是,在现有的用户兴趣点的权重值确定方法中,只考虑时间因素来确定用户兴趣点的权重值,即用户兴趣点的权重值是随着时间变化,权重值不断的衰减。而对于用户多次关注的某一个兴趣点或者用户关注了一次后续不再关注的兴趣点来说,该方法所确定的权重值不够准确,例如对于用户兴趣点A,属于一个瞬间热度事件,用户集中两天关注了很多,但后面没有加强,所以该兴趣点的权重值应该衰减比较快,又例如对于兴趣点B,用户会每周或者每个月都会关注一次,反复的加强这种兴趣,则应该降低其衰减速度。基于此,本发明实施例提供的一种用户兴趣点的权重值确定方法,具体方案如下:
参见图1,图1为本发明实施例提供的一种用户兴趣点的权重值确定方法的一种流程示意图,包括如下步骤:
S101,当需要确定当前时间用户兴趣点的权重值时,获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间。
具体的,在用户画像中,对用户兴趣点每发生一次用户兴趣行为时,将每一次行为时间都记录在用户画像中,同时可以更新该用户兴趣点的权重值,更新后的权重值都是随着时间的推移不断衰减的。由于更新后的权重值的衰减是从更新该用户兴趣点的权重值时对该用户兴趣点发生用户兴趣行为的行为时间开始的,因此,当需要确定当前时间用户兴趣点的权重值时,需要先获取最近一次针对该用户兴趣点发生用户兴趣行为的行为时间。这里,用户兴趣行为可以是观看、搜索、收藏、订阅、点击、展示等。
S102,获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的。
具体的,可以先获取截止当前时间用户兴趣点所有时间窗口,该时间窗口是预先按照预设划分规则划分得到的,然后所有时间窗口中针对用户兴趣点发生有用户兴趣行为的时间窗口的数量。这里,时间窗口可以按照预设时间周期划分得到,也可以不按照预设时间周期划分得到,时间窗口的具体确定结果根据实际需求划分得到,例如,视频网站考虑到用户每天晚上8:00-12:00看视频的概率比较大,可以将每天晚上8:00-12:00作为一个时间窗口,又例如,购物网站可以将每天除休息时间以外的剩余时间作为一个时间窗口,以及对于每周只播放一期的综艺节目可以以一周为时间周期划分得到时间窗口等。
S103,基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1。
具体的,由于在用户兴趣点的权重值衰减的过程中,用户还会对该兴趣点发生用户兴趣行为,对于用户频繁对该兴趣点发生用户兴趣行为,表明用户比较关注该兴趣点,因此在考虑行为时间与当前时间的时间差之外,还需考虑发生用户兴趣行为的次数,发生用户兴趣行为的次数越多,衰减系数值就越大,用户兴趣点的权重值衰减的就越慢,即时间窗口数量越多,衰减系数值就越大。
S104,按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。
具体的,用户兴趣点的权重值是通过上述步骤所确定的用户兴趣点的衰减系数值不断衰减的,当前时间的用户兴趣点的权重值与衰减系数值相关,衰减系数值越大,当前时间的用户兴趣点的权重值越大,反之衰减系数值越小,当前时间的用户兴趣点的权重值也就越小。这里,在用户画像中用户兴趣点的权重值是随着时间的流逝不断衰减的,相比现有技术在确定用户兴趣点的权重值时只考虑行为时间与当前时间的时间差,本方案同时考虑行为时间与当前时间的时间差、以及针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,来确定针对当前时间的用户兴趣点的权重值,提高了用户兴趣点的权重值确定的准确性。
由此可见,本发明实施例提供的一种用户兴趣点的权重值确定方法,当需要确定当前时间用户兴趣点的权重值时,先获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间;然后获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的;基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1;最后按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。这样,在确定用户兴趣点的权重值时同时考虑了时间差和发生有用户兴趣行为的时间窗口的数量,提高了用户兴趣点的权重值确定的准确性,从而使得用户画像能够准确的表示用户的兴趣喜好。
在本发明实施例中,时间窗口可以为按照预设时间周期划分的。
具体的,可以根据时间应用场景及需求按照预设时间周期划分时间窗口,例如,某个综艺节目是每周播放一次,那么可以以一周为一个时间周期,将每周作为一个时间窗口,又例如,某个电视剧是每天播放两集,那么可以以一天为一个时间周期,将每天作为一个时间窗口等。
在本发明实施例中,基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,具体可以为:
采用如下公式确定用户兴趣点的衰减系数值:
其中,v为用户兴趣点的衰减系数值,Δt为行为时间与当前时间的时间差,N为时间窗口数量,θ为预设的时间衰减调节因子。这里,θ的取值可以为0.2,Δt越大,v越大,即时间差越大,衰减系数值越大,在Δt不变的情况下,N越大,v越小,即时间差一定,时间窗口数量越多,衰减系数值越小。这里,需要说明的是,本发明公式中的*表示“乘以”。
如图2所示,x表示天数,y表示用户兴趣点的权重值,N1为1,N2为3,N3为7,N4为15,N5为30,当Δt都为100天时,时间窗口数量越多,衰减系数值越小,用户兴趣点的权重值衰减的越慢,从而用户兴趣点的权重值越大。
在本发明实施例中,按照衰减系数值,确定针对当前时间的用户兴趣点的权重值,具体可以为:
确定针对当前时间的用户兴趣点的权重值为最近一次针对用户兴趣点发生用户兴趣行为后更新的权重值与衰减系数值的乘积。
具体的,当对用户画像中的用户兴趣点每发生一次用户兴趣行为时,可以更新该用户兴趣点的权重值,得到更新后的权重值为发生用户兴趣行为时的权重值,该权重值随着时间不断的衰减,当需要确定针对当前时间的用户兴趣点的权重值时,将,当前时间之前最近一次针对用户兴趣点发生用户兴趣行为后更新的权重值与衰减系数值相乘,将乘积的结果作为当前时间的用户兴趣点的权重值。
在本发明实施例中,按照衰减系数值,确定针对当前时间的用户兴趣点的权重值,具体还可以为:
采用如下公式确定针对当前时间的用户兴趣点的权重值:
其中,u表示用户编号,f表示用户兴趣点,s(u,f)为针对当前时间的用户u的用户兴趣点f的权重值,M表示用户兴趣行为的行为类型的数量,ωi表示第i种行为类型对应的权重值,nij表示第j个时间窗口中发生第i种行为类型的用户兴趣行为的次数。这里,由于衰减系数值小于1,因此,衰减系数值v越大,用户兴趣点的权重值越小,反之,衰减系数值v越小,用户兴趣点的权重值越大。
上述按照衰减系数值,确定针对当前时间的用户兴趣点的权重值,举例来说,如表1所示。
表1
由表1可知,对XX电视剧发生有用户兴趣行为的时间窗口的数量为3个,即N=3,用户兴趣行为的行为类型的数量为4,即M=4,假设第1种行为类型为观看,第2种行为类型为收藏,第3种行为类型为搜索,第4种行为类型为订阅,那么第1个时间窗口中发生第1种行为类型的用户兴趣行为的次数为1,第1个时间窗口中发生第2种行为类型的用户兴趣行为的次数为1,第2个时间窗口中发生第1种行为类型的用户兴趣行为的次数为1,第2个时间窗口中发生第3种行为类型的用户兴趣行为的次数为1,第2个时间窗口中发生第4种行为类型的用户兴趣行为的次数为1,第4个时间窗口中发生第1种行为类型的用户兴趣行为的次数为4,第4个时间窗口中发生第3种行为类型的用户兴趣行为的次数为1。
另外,预先设定观看行为的权重值ω1为8,收藏行为的权重值ω2为10,搜索行为ω3的权重值为5,订阅行为的权重值ω4为15,假设以天为预设时间周期,每天为一个时间窗口,并假设第4个时间窗口中最后一次用户兴趣行为为最近一次针对用户兴趣点发生用户兴趣行为的行为时间为12月1日,现在需要确定当前时间(12月9日)该XX电视剧的权重值,则先计算当前时间与最近一次针对用户兴趣点发生用户兴趣行为的行为时间的时间差Δt=8天,当获取到Δt和N之后,可以根据上述确定用户兴趣点的衰减系数值的公式计算出衰减系数值v,而当v、M、ωi和nij之后,可以将这些参数代入上述确定针对当前时间的用户兴趣点的权重值的公式中,从而得到当前时间的用户兴趣点的权重值。
在发明实施例中,当针对用户兴趣点首次发生用户兴趣行为时,如图3所示,该用户兴趣点的权重值确定方法还可以包括如下步骤:
S301,确定用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值。
具体的,当针对用户兴趣点首次发生用户兴趣行为之前,该用户兴趣点还没有构建在用户画像中,而当针对用户兴趣点首次发生用户兴趣行为时,该用户兴趣点就开始存在对应的初始权重值,该初始权重值为该用户兴趣行为的行为类型对应的权重值,在得到该兴趣点的初始权重值之后,将该用户兴趣点以及该用户兴趣点的初始权重值存储到用户画像上。这里,该用户兴趣行为的行为类型对应的权重值是通过预先对每种用户兴趣行为的行为类型设置了对应的权重值,例如观看的权重值为10,收藏的权重值为15,搜索的权重值为8等。
或者
S302,确定用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值与预设加强系数的乘积,预设加强系数大于1。
具体的,当针对用户兴趣点首次发生用户兴趣行为时,先获取该用户兴趣行为的行为类型对应的权重值,然后将该用户兴趣行为的行为类型对应的权重值与预设加强系数相乘,并将相乘得到的乘积作为用户兴趣点的初始权重值,这里,预设加强系数大于1,因此,所确定的用户兴趣点的初始权重值比该用户兴趣行为的行为类型对应的权重值要大,这样,在确定用户兴趣点的初始权重值时,能够使得用户兴趣点能够快速的反馈到用户画像上。
在本发明实施例中,用户兴趣点为用户兴趣标签,或者,用户兴趣主题。
这里,用户兴趣标签和用户兴趣主题都表征了用户行为对应的内容,即用户对该内容有兴趣、偏好、需求等等,例如,用户兴趣点为某某某综艺节目,则用户兴趣标签可以为某某某,用户兴趣主题可以为综艺。
参见图4,图4为本发明实施例提供的一种用户兴趣点的权重值确定装置的结构示意图,包括如下模块:
时间获取模块401,用于当需要确定当前时间用户兴趣点的权重值时,获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间;
数量获取模块402,用于获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的;
衰减系数确定模块403,用于基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1;
权重值确定模块404,用于按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。
由此可见,发明实施例提供的一种用户兴趣点的权重值确定装置,当需要确定当前时间用户兴趣点的权重值时,先通过时间获取模块获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间;然后通过数量获取模块获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的;再次,衰减系数确定模块基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1;最后,权重值确定模块按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。这样,在确定用户兴趣点的权重值时同时考虑了时间差和发生有用户兴趣行为的时间窗口的数量,提高了用户兴趣点的权重值确定的准确性,从而使得用户画像能够准确的表示用户的兴趣喜好。
进一步的,衰减系数确定模块403,具体用于采用如下公式确定用户兴趣点的衰减系数值:
其中,v为用户兴趣点的衰减系数值,Δt为行为时间与当前时间的时间差,N为时间窗口数量,θ为预设的时间衰减调节因子。
进一步的,权重值确定模块404,具体用于确定针对当前时间的用户兴趣点的权重值为最近一次针对用户兴趣点发生用户兴趣行为后更新的权重值与衰减系数值的乘积。
进一步的,权重值确定模块404,具体还用于采用如下公式确定针对当前时间的用户兴趣点的权重值:
其中,u表示用户编号,f表示用户兴趣点,s(u,f)为针对当前时间的用户u的用户兴趣点f的权重值,M表示用户兴趣行为的行为类型的数量,ωi表示第i种行为类型对应的权重值,nij表示第j个时间窗口中发生第i种行为类型的用户兴趣行为的次数。
进一步的,权重值确定模块404,还用于当针对用户兴趣点首次发生用户兴趣行为时,确定用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值;或者当针对用户兴趣点首次发生用户兴趣行为时,确定用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值与预设加强系数的乘积,预设加强系数大于1。
进一步的,时间窗口为按照预设时间周期划分的。
进一步的,用户兴趣点为用户兴趣标签,或者,用户兴趣主题。
本发明实施例还提供了一种电子设备,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现如下步骤:
当需要确定当前时间用户兴趣点的权重值时,获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间;
获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的;
基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1;
按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由此可见,本发明提供的电子设备,当需要确定当前时间用户兴趣点的权重值时,先获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间;然后获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的;基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1;最后按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。这样,在确定用户兴趣点的权重值时同时考虑了时间差和发生有用户兴趣行为的时间窗口的数量,提高了用户兴趣点的权重值确定的准确性,从而使得用户画像能够准确的表示用户的兴趣喜好。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的一种用户兴趣点的权重值确定方法。
由此可见,本发明提供的计算机可读存储介质,当需要确定当前时间用户兴趣点的权重值时,先获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间;然后获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的;基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1;最后按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。这样,在确定用户兴趣点的权重值时同时考虑了时间差和发生有用户兴趣行为的时间窗口的数量,提高了用户兴趣点的权重值确定的准确性,从而使得用户画像能够准确的表示用户的兴趣喜好。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的一种用户兴趣点的权重值确定方法。
由此可见,本发明提供的计算机程序产品,当需要确定当前时间用户兴趣点的权重值时,先获取最近一次针对用户兴趣点发生用户兴趣行为的行为时间;然后获取截止当前时间用户兴趣点的时间窗口数量,其中,时间窗口数量为针对用户兴趣点发生有用户兴趣行为的时间窗口的数量,时间窗口为按照预设规则划分得到的;基于行为时间与当前时间的时间差,以及时间窗口数量,确定用户兴趣点的衰减系数值,衰减系数值随着时间差的增大而减小,随着时间窗口数量的增大而增大,衰减系数值小于1;最后按照衰减系数值,确定针对当前时间的用户兴趣点的权重值。这样,在确定用户兴趣点的权重值时同时考虑了时间差和发生有用户兴趣行为的时间窗口的数量,提高了用户兴趣点的权重值确定的准确性,从而使得用户画像能够准确的表示用户的兴趣喜好。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (15)

1.一种用户兴趣点的权重值确定方法,其特征在于,所述方法包括:
当需要确定当前时间用户兴趣点的权重值时,获取最近一次针对所述用户兴趣点发生用户兴趣行为的行为时间;
获取截止所述当前时间所述用户兴趣点的时间窗口数量,其中,所述时间窗口数量为针对所述用户兴趣点发生有用户兴趣行为的时间窗口的数量,所述时间窗口为按照预设规则划分得到的;
基于所述行为时间与所述当前时间的时间差,以及所述时间窗口数量,确定所述用户兴趣点的衰减系数值,所述衰减系数值随着所述时间差的增大而减小,随着所述时间窗口数量的增大而增大,所述衰减系数值小于1;
按照所述衰减系数值,确定针对所述当前时间的所述用户兴趣点的权重值。
2.根据权利要求1所述的方法,其特征在于,所述基于所述行为时间与所述当前时间的时间差,以及所述时间窗口数量,确定所述用户兴趣点的衰减系数值,包括:
采用如下公式确定所述用户兴趣点的衰减系数值:
其中,v为所述用户兴趣点的衰减系数值,Δt为所述行为时间与所述当前时间的时间差,N为所述时间窗口数量,θ为预设的时间衰减调节因子。
3.根据权利要求2所述的方法,其特征在于,所述按照所述衰减系数值,确定针对所述当前时间的所述用户兴趣点的权重值,包括:
确定针对所述当前时间的所述用户兴趣点的权重值为最近一次针对所述用户兴趣点发生用户兴趣行为后更新的权重值与所述衰减系数值的乘积。
4.根据权利要求2所述的方法,其特征在于,所述按照所述衰减系数值,确定针对所述当前时间的所述用户兴趣点的权重值,包括:
采用如下公式确定针对所述当前时间的所述用户兴趣点的权重值:
其中,u表示用户编号,f表示所述用户兴趣点,s(u,f)为针对所述当前时间的用户u的所述用户兴趣点f的权重值,M表示用户兴趣行为的行为类型的数量,ωi表示第i种行为类型对应的权重值,nij表示第j个所述时间窗口中发生第i种行为类型的用户兴趣行为的次数。
5.根据权利要求1-4任一所述的方法,其特征在于,所述方法还包括:
当针对所述用户兴趣点首次发生用户兴趣行为时,确定所述用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值;或者
当针对所述用户兴趣点首次发生用户兴趣行为时,确定所述用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值与预设加强系数的乘积,所述预设加强系数大于1。
6.根据权利要求1-4任一所述的方法,其特征在于,所述时间窗口为按照预设时间周期划分的。
7.根据权利要求1-4任一所述的方法,其特征在于,所述用户兴趣点为用户兴趣标签,或者,用户兴趣主题。
8.一种用户兴趣点的权重值确定装置,其特征在于,所述装置包括:
时间获取模块,用于当需要确定当前时间用户兴趣点的权重值时,获取最近一次针对所述用户兴趣点发生用户兴趣行为的行为时间;
数量获取模块,用于获取截止所述当前时间所述用户兴趣点的时间窗口数量,其中,所述时间窗口数量为针对所述用户兴趣点发生有用户兴趣行为的时间窗口的数量,所述时间窗口为按照预设规则划分得到的;
衰减系数确定模块,用于基于所述行为时间与所述当前时间的时间差,以及所述时间窗口数量,确定所述用户兴趣点的衰减系数值,所述衰减系数值随着所述时间差的增大而减小,随着所述时间窗口数量的增大而增大,所述衰减系数值小于1;
权重值确定模块,用于按照所述衰减系数值,确定针对所述当前时间的所述用户兴趣点的权重值。
9.根据权利要求8所述的装置,其特征在于,所述衰减系数确定模块,具体用于采用如下公式确定所述用户兴趣点的衰减系数值:
其中,v为所述用户兴趣点的衰减系数值,Δt为所述行为时间与所述当前时间的时间差,N为所述时间窗口数量,θ为预设的时间衰减调节因子。
10.根据权利要求9所述的装置,其特征在于,所述权重值确定模块,具体用于确定针对所述当前时间的所述用户兴趣点的权重值为最近一次针对所述用户兴趣点发生用户兴趣行为后更新的权重值与所述衰减系数值的乘积。
11.根据权利要求9所述的装置,其特征在于,所述权重值确定模块,具体还用于采用如下公式确定针对所述当前时间的所述用户兴趣点的权重值:
其中,u表示用户编号,f表示所述用户兴趣点,s(u,f)为针对所述当前时间的用户u的所述用户兴趣点f的权重值,M表示用户兴趣行为的行为类型的数量,ωi表示第i种行为类型对应的权重值,nij表示第j个所述时间窗口中发生第i种行为类型的用户兴趣行为的次数。
12.根据权利要求8-11任一所述的装置,其特征在于,所述权重值确定模块,还用于当针对所述用户兴趣点首次发生用户兴趣行为时,确定所述用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值;或者,当针对所述用户兴趣点首次发生用户兴趣行为时,确定所述用户兴趣点的初始权重值为首次发生的该用户兴趣行为的行为类型对应的权重值与预设加强系数的乘积,所述预设加强系数大于1。
13.根据权利要求8-11任一所述的装置,其特征在于,所述时间窗口为按照预设时间周期划分的。
14.根据权利要求8-11任一所述的装置,其特征在于,所述用户兴趣点为用户兴趣标签,或者,用户兴趣主题。
15.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
CN201810019600.0A 2018-01-09 2018-01-09 一种用户兴趣点的权重值确定方法、装置及电子设备 Pending CN108133036A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810019600.0A CN108133036A (zh) 2018-01-09 2018-01-09 一种用户兴趣点的权重值确定方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810019600.0A CN108133036A (zh) 2018-01-09 2018-01-09 一种用户兴趣点的权重值确定方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN108133036A true CN108133036A (zh) 2018-06-08

Family

ID=62400374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810019600.0A Pending CN108133036A (zh) 2018-01-09 2018-01-09 一种用户兴趣点的权重值确定方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108133036A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376294A (zh) * 2018-08-22 2019-02-22 中国平安人寿保险股份有限公司 用户兴趣点权重确定方法及装置、存储介质和电子设备
CN109635070A (zh) * 2019-01-18 2019-04-16 上海图趣信息科技有限公司 一种基于行动轨迹构建用户兴趣画像的方法及其数据更新方法
CN110737822A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 用户兴趣挖掘方法、装置、设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101069424A (zh) * 2004-11-30 2007-11-07 皇家飞利浦电子股份有限公司 一种估计用户对一个节目的兴趣度的方法和装置
CN104102648A (zh) * 2013-04-07 2014-10-15 腾讯科技(深圳)有限公司 基于用户行为数据的兴趣推荐方法及装置
CN104933134A (zh) * 2015-06-12 2015-09-23 海信集团有限公司 一种用户特征的分析方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101069424A (zh) * 2004-11-30 2007-11-07 皇家飞利浦电子股份有限公司 一种估计用户对一个节目的兴趣度的方法和装置
CN104102648A (zh) * 2013-04-07 2014-10-15 腾讯科技(深圳)有限公司 基于用户行为数据的兴趣推荐方法及装置
CN104933134A (zh) * 2015-06-12 2015-09-23 海信集团有限公司 一种用户特征的分析方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110737822A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 用户兴趣挖掘方法、装置、设备和存储介质
CN109376294A (zh) * 2018-08-22 2019-02-22 中国平安人寿保险股份有限公司 用户兴趣点权重确定方法及装置、存储介质和电子设备
CN109635070A (zh) * 2019-01-18 2019-04-16 上海图趣信息科技有限公司 一种基于行动轨迹构建用户兴趣画像的方法及其数据更新方法
CN109635070B (zh) * 2019-01-18 2020-11-17 上海迹寻科技有限公司 一种基于行动轨迹构建用户兴趣画像的方法及其数据更新方法

Similar Documents

Publication Publication Date Title
US10405016B2 (en) Recommending media items based on take rate signals
US20230400954A1 (en) Evaluation of interactions with a user interface
US10437842B2 (en) Social static ranking for search
US10599313B2 (en) System for high volume data analytic integration and channel-independent advertisement generation
US9681168B2 (en) Recommending a composite channel
CN104281962B (zh) 用于在线系统中的广告和内容的统一市场
US8533202B2 (en) Entropy-based mixing and personalization
CN108133036A (zh) 一种用户兴趣点的权重值确定方法、装置及电子设备
CN109274987A (zh) 一种视频集合排序方法、服务器及可读存储介质
JP2004362019A (ja) 情報推薦装置、情報推薦方法、情報推薦プログラム及び記録媒体
CN104991935B (zh) 一种网站关注度的处理方法和装置
CN109348260A (zh) 一种直播间推荐方法、装置、设备及介质
CN111666486B (zh) 热度值获取方法及装置
CN107341172B (zh) 视频收益计算建模装置与方法及视频推荐装置与方法
JP5366140B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN110020129B (zh) 点击率校正方法、预估方法、装置、计算设备及存储介质
CN109740047A (zh) 样本推荐方法、装置、计算机可读存储介质和电子设备
CN113129067B (zh) 信息筛选方法、装置、设备、存储介质及计算机程序产品
CN113609176B (zh) 一种信息生成方法、装置、设备及存储介质
US20150370803A1 (en) Automatic positioning of elements in a computer-based document
US7953640B2 (en) Method and system for determining a value of a portion of content
CN116342222A (zh) 一种产品推荐方法、装置、电子设备及可读存储介质
CN105260417A (zh) 一种用于确定目标推广对象的推广配额信息的方法与设备
CN117290592A (zh) 个性化特征确定、内容推荐方法、装置、设备及存储介质
CN110019976A (zh) 一种数据集群优化方向的确定方法、质量评估方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180608