多媒体资源推荐排序方法及装置
技术领域
本发明涉及多媒体领域,尤其涉及一种多媒体资源推荐排序方法及装置。
背景技术
多媒体资源推荐效果受到很多环节的影响。其中,排序环节决定了哪些候选内容可能会成为最终多媒体资源推荐信息而展示给用户。在现有的多媒体资源推荐过程中,可以对预设周期内增加的用户请求多媒体资源信息进行整理,得到模型更新所需要的训练数据,然后通过对训练数据进行训练得到更新的特征集合和权重值。
现有技术中,由于数据量级和计算资源的限制,很难一次性对较长预设周期内增加的用户请求多媒体资源信息进行处理。因此,排序阶段中仅能根据较短预设周期内更新的特征集合进行计算并排序。采用上述排序方法,某些多媒体资源对应的候选内容的特征值可能是历史计算得到的,由于更新后的特征集合不包含相关特征(也可能是特征覆盖不全或者没有交集),使得所计算的排序结果存在一定的偏差,从而降低了推荐效果。
发明内容
技术问题
有鉴于此,本发明要解决的技术问题是,如何向用户提供高质量的多媒体资源推荐信息。
解决方案
为了解决上述技术问题,根据本发明的一实施例,提供了一种多媒体资源推荐排序方法,包括:
根据预设周期内所产生的请求点击反馈数据,获取所述预设周期内的各多媒体资源特征对应的第一权重值;
将各多媒体资源特征对应的第一权重值与从历史多媒体资源特征数据中获取的各多媒体资源特征对应的第二权重值进行融合,得到各多媒体资源特征对应的第三权重值;
根据各多媒体资源特征对应的第三权重值,对各待推荐多媒体资源进行排序。
对于上述方法,在一种可能的实现方式中,据预设周期内所产生的请求点击反馈数据,获取所述预设周期内的各多媒体资源特征对应的第一权重值,包括:
根据所述预设周期内所产生的请求点击反馈数据,获取所述预设周期内的多媒体资源特征数据;
按照预设训练模型对所述预设周期内的多媒体资源特征数据进行训练,得到所述预设周期内的各多媒体资源特征对应的第一权重值。
对于上述方法,在一种可能的实现方式中,将各多媒体资源特征对应的第一权重值与从历史多媒体资源特征数据中获取的各多媒体资源特征对应的第二权重值进行融合,得到各多媒体资源特征对应的第三权重值,包括:
将所述预设周期内的各多媒体资源特征与全局多媒体资源特征集合内的各多媒体资源特征进行匹配,获取所述预设周期内的各多媒体资源特征对应的全局标识;
将具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,按照预设融合模型进行融合,得到各所述多媒体资源特征对应的第三权重值。
对于上述方法,在一种可能的实现方式中,将具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,按照预设融合模型进行融合,得到各所述多媒体资源特征对应的第三权重值,包括:
采用下式1来融合具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,得到所述多媒体资源对应的第三权重值,
wi=(1-α)×wi"+α×w'i 式1
其中,i为所述多媒体资源特征对应的全局标识,w'i为第i个多媒体资源特征对应的第一权重值,wi"为第i个多媒体资源特征对应的第二权重值,wi为第i个多媒体资源特征对应的第三权重值,α为融合系数,α∈[0,1]。
对于上述方法,在一种可能的实现方式中,根据各多媒体资源特征对应的第三权重值,对各待推荐多媒体资源进行排序,包括:
分别获取各所述待推荐多媒体资源对应的各多媒体资源特征;
根据各所述待推荐多媒体资源对应的各多媒体资源特征对应的特征值及第三权重值,获取各所述待推荐多媒体资源对应的点击概率;
根据各所述待推荐多媒体资源对应的点击概率,对所述各待推荐多媒体资源进行排序。
对于上述方法,在一种可能的实现方式中,还包括:
在得到各多媒体资源特征对应的第三权重值之后,将历史多媒体资源特征数据中的各多媒体资源特征对应的第一权重值更新为具有相同全局标识的各多媒体资源特征对应的第三权重值。
为了解决上述技术问题,根据本发明的另一实施例,提供了一种多媒体资源推荐排序装置,包括:
处理模块,用于根据预设周期内所产生的请求点击反馈数据,获取所述预设周期内的各多媒体资源特征对应的第一权重值;
融合模块,与所述处理模块连接,用于将各多媒体资源特征对应的第一权重值与从历史多媒体资源特征数据中获取的各多媒体资源特征对应的第二权重值进行融合,得到各多媒体资源特征对应的第三权重值;
排序模块,与所述融合模块连接,用于根据各多媒体资源特征对应的第三权重值,对各待推荐多媒体资源进行排序。
对于上述装置,在一种可能的实现方式中,所述处理模块,包括:
处理单元,用于根据所述预设周期内所产生的请求点击反馈数据,获取所述预设周期内的多媒体资源特征数据;
训练单元,与所述处理单元连接,用于按照预设训练模型对所述预设周期内的多媒体资源特征数据进行训练,得到所述预设周期内的各多媒体资源特征对应的第一权重值。
对于上述装置,在一种可能的实现方式中,所述融合模块,包括:
识别单元,用于将所述预设周期内的各多媒体资源特征与全局多媒体资源特征集合内的各多媒体资源特征进行匹配,获取所述预设周期内的各多媒体资源特征对应的全局标识;
融合单元,与所述识别单元连接,用于将具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,按照预设融合模型进行融合,得到各所述多媒体资源特征对应的第三权重值。
对于上述装置,在一种可能的实现方式中,所述融合单元,具体用于
采用下式1来融合具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,得到所述多媒体资源对应的第三权重值,
wi=(1-α)×wi"+α×w'i 式1
其中,i为所述多媒体资源特征对应的全局标识,w'i为第i个多媒体资源特征对应的第一权重值,wi"为第i个多媒体资源特征对应的第二权重值,wi为第i个多媒体资源特征对应的第三权重值,α为融合系数,α∈[0,1]。
对于上述装置,在一种可能的实现方式中,所述排序模块,包括:
获取单元,用于分别获取各所述待推荐多媒体资源对应的各多媒体资源特征;
计算单元,与所述获取单元连接,用于根据各所述待推荐多媒体资源对应的各多媒体资源特征对应的特征值及第三权重值,获取各所述待推荐多媒体资源对应的点击概率;
排序单元,与所述计算单元连接,用于根据各所述待推荐多媒体资源对应的点击概率,对所述各待推荐多媒体资源进行排序。
对于上述装置,在一种可能的实现方式中,还包括:
替换模块,用于在得到各多媒体资源特征对应的第三权重值之后,将历史多媒体资源特征数据中的各多媒体资源特征对应的第一权重值更新为具有相同全局标识的各多媒体资源特征对应的第三权重值。
有益效果
本发明实施例的多媒体资源推荐排序方法,通过请求点击反馈数据和历史多媒体资源特征数据,获取各多媒体资源特征对应的权重值。本发明实施例的多媒体资源推荐排序方法,可以不丢失各多媒体资源特征,使得各多媒体资源特征均具有对应的特征值。此外,还使得各多媒体资源特征的权重值融合入历史权重值,提高排序结果的准确性,向用户提供高质量的多媒体资源推荐信息。
根据下面参考附图对示例性实施例的详细说明,本发明的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面,并且用于解释本发明的原理。
图1示出根据本发明一实施例的多媒体资源推荐排序方法的流程图;
图2示出根据本发明一实施例的多媒体资源推荐排序方法的另一流程图;
图3示出根据本发明一实施例的多媒体资源推荐排序方法的另一流程图;
图4示出根据本发明一实施例的多媒体资源推荐排序方法的另一流程图;
图5示出根据本发明一实施例的多媒体资源推荐排序方法的另一流程图;
图6示出根据本发明一实施例的多媒体资源推荐排序方法的另一流程图;
图7示出根据本发明一实施例的多媒体资源推荐排序装置的结构框图;
图8示出根据本发明一实施例的多媒体资源推荐排序装置的另一结构框图;
图9示出根据本发明一实施例的多媒体资源推荐排序装置的另一结构框图;
图10示出根据本发明一实施例的多媒体资源推荐排序装置的另一结构框图;
图11示出根据本发明一实施例的多媒体资源推荐排序装置的另一结构框图;
图12示出根据本发明一实施例的多媒体资源推荐排序设备的结构框图。
具体实施方式
以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本发明的主旨。
实施例1
图1示出根据本发明一实施例的多媒体资源推荐排序方法的流程图。如图1示,该多媒体资源推荐排序方法,主要包括:
步骤101、根据预设周期内所产生的请求点击反馈数据,获取所述预设周期内的各多媒体资源特征对应的第一权重值;
步骤102、将各多媒体资源特征对应的第一权重值与从历史多媒体资源特征数据中获取的各多媒体资源特征对应的第二权重值进行融合,得到各多媒体资源特征对应的第三权重值;
步骤103、根据各多媒体资源特征对应的第三权重值,对各待推荐多媒体资源进行排序。
本实施例的请求点击反馈数据是衡量多媒体资源热度非常重要的参数。在搜索应用中,可以指多媒体资源的点击次数与搜索总次数的比值;在视频推荐中,可以指多媒体资源的点击次数与推荐展示总次数的比值。本实施例中不限制请求点击反馈数据的具体定义。其中,多媒体资源(Multimedia),可以包括文本、声音、视频和图像等多种媒体形式。多媒体资源特征可以指能够标识多媒体资源的特征参数,其可以是连续型或离散型数值,还可以是非数值型。
以视频为例,视频特征可以包括:视频频道、清晰度、上映时间、观看次数和评分等。具体而言,视频频道可以表示该视频的频道分类,例如电影频道、电视剧频道、综艺频道等。清晰度可以表示视频的清晰程度,例如高清、标清、普清等。上映时间可以表示该视频上映时间的长短,上映时间较短的视频可能拥有较高的热度。观看次数可以表示视频被观看的次数,观看次数越多说明该视频认可度越高。评分可以表示通过用户对视频好评或差评得到的分数。其中,举例而言,评分可以是连续型数值,取值范围可以是[0,1];观看次数可以是离散型数值,例如[2000次、2045次];视频频道可以是非数值型特征,例如电影频道或电视剧频道。
需要说明的是,本领域技术人员应能理解,上述的视频特征可以通过视频库中的视频进行提取。具体而言,从不同的分析角度,一个视频可能具有多个不同的视频特征,例如,《琅琊榜》属于古装剧、大陆剧和电视剧,上映时间为2015年,观看次数43.5亿,评分8.1分等。本领域技术人员可以根据实际需要分析确定需要提取的视频特征,在此不做限定。
举例而言,本实施例的多媒体资源特征对应的权重值可以在排序阶段依据不同的多媒体资源特征值计算出用户对应可能点击的概率,从而影响排序。具体地,将多媒体资源特征对应的权重值与待推荐多媒体资源具体包含的特征值进行运算,能够最终得到多媒体资源对应的点击概率(被点击的可能性),从而决定最终的推荐多媒体资源及排序。因此,在推荐过程中,运算后的点击概率越高,表示该多媒体资源被点击的概率越高,会被优先推荐。一般来说,多媒体资源对应的点击概率取值介于0到1之间。
应当注意的是,对于初始多媒体资源特征,可以预先赋予一个权重值。在拥有一定搜索量和点击量的基础上,请求点击反馈数据可以用来计算各多媒体资源特征对应的权重值。本实施例的历史多媒体资源特征数据,可以指根据历史请求点击反馈数据计算得到的多媒体资源特征数据。具体地,多媒体资源特征数据可以包括多媒体资源对应的多媒体资源特征和特征值,以及多媒体资源特征对应的权重值。其中,多媒体资源特征可以在预定时间段内相对固定,例如,每30日统计多媒体资源对应的多媒体资源特征。静态特征对应的特征值可以保持不变,例如《琅琊榜》属于电视剧频道。动态特征特征值可以随时间变化发生改变,例如《琅琊榜》的评分从8.1变为8.3。多媒体资源特征对应的权重值可以通过训练得到,并可以与多媒体资源特征对应的历史权重值进行融合。
在一种可能的实现方式中,如图2所示,根据预设周期内所产生的请求点击反馈数据,获取所述预设周期内的各多媒体资源特征对应的第一权重值(步骤101),可以包括:
步骤201、根据所述预设周期内所产生的请求点击反馈数据,获取所述预设周期内的多媒体资源特征数据;
步骤202、按照预设训练模型对所述预设周期内的多媒体资源特征数据进行训练,得到所述预设周期内的各多媒体资源特征对应的第一权重值。
表1:
视频名称 |
请求量 |
点击量 |
视频特征(频道) |
A |
10 |
3 |
大陆剧 |
B |
9 |
2 |
日韩剧 |
C |
5 |
2 |
大陆剧 |
D |
7 |
1 |
欧美剧 |
以视频为例,假设获取2016年6月27日内所产生的请求点击反馈数据如上表1所示。根据表1:视频A为大陆剧,点击量3次,请求量10次;视频B为日韩剧,点击量2次,请求量9次;视频C为大陆剧,点击量2次,请求量5次;视频D为欧美剧,点击量1次,请求量7次。
综上所述,得到2016年6月27日内的多媒体资源特征数据:大陆剧,点击量5次,请求量15次;日韩剧,点击量2次,请求量9次;欧美剧,点击量1次,请求量7次。进一步地,通过模型训练,得到2016年6月27日内的各多媒体资源特征对应的第一权重值:大陆剧对应的第一权重值为0.33,日韩剧对应的第一权重值为0.22,欧美剧对应的第一权重值为0.15。
需要说明的是,本领域技术人员应能理解,现有技术中有各种训练模型均可以实现对预设周期内的多媒体资源特征数据进行训练,从而得到视频特征对应的第一权重值,例如通过逻辑回归算法,在此不做限定。
此外,为了便于对预设周期内的多媒体资源特征数据进行训练,可以在训练前,对所涉及的多媒体资源特征进行一次编码,可以理解成模型内序号。
在一种可能的实现方式中,如图3所示,将各多媒体资源特征对应的第一权重值与从历史多媒体资源特征数据中获取的各多媒体资源特征对应的第二权重值进行融合,得到各多媒体资源特征对应的第三权重值(步骤102),可以包括:
步骤301、将所述预设周期内的各多媒体资源特征与全局多媒体资源特征集合内的各多媒体资源特征进行匹配,获取所述预设周期内的各多媒体资源特征对应的全局标识;
步骤302、将具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,按照预设融合模型进行融合,得到各所述多媒体资源特征对应的第三权重值。
在一种可能的实现方式中,将具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,按照预设融合模型进行融合,得到各所述多媒体资源特征对应的第三权重值(步骤302),可以包括:
采用下式1来融合具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,得到所述多媒体资源对应的第三权重值,
wi=(1-α)×wi"+α×w'i 式1
其中,i为所述多媒体资源特征对应的全局标识,w'i为第i个多媒体资源特征对应的第一权重值,wi"为第i个多媒体资源特征对应的第二权重值,wi为第i个多媒体资源特征对应的第三权重值,α为融合系数,α∈[0,1]。
本实施例的全局多媒体资源特征集合,可以指通过多媒体资源库包含的各多媒体资源提取的全部多媒体资源特征所形成的集合。由于预设周期内的多媒体资源特征数据并不一定能够覆盖到所有的多媒体资源特征,例如,可能出现特征覆盖不全或者没有交集的情况。因此,实际参加训练的多媒体资源特征要少于全局多媒体资源特征集合包含的多媒体资源特征。
以视频为例,根据视频库中包含的视频,可以通过例如特征工程进行处理,提取各视频包含的视频特征,得到视频特征名称和其可能的取值范围。针对所有的视频特征名称进行编码,使得每一个视频特征名称均具有一个唯一且固定的全局标识例如全局序号。视频特征名称和全局标识一一对应,能够保证每一个视频特征不丢失。此外,对视频特征进行全局编码,在具体模型训练时可以根据实际特征集合进行局部编码,这样可以使得模型的训练与排序过程独立开。
举例而言,全局视频特征集合包括{大陆剧、港台剧、日韩剧、东南亚剧、欧美剧},编码后得到视频特征名称对应的全局标识{1-大陆剧、2-港台剧、3-日韩剧、4-东南亚剧、5-欧美剧}。获取2016年6月27日内的各视频特征{大陆剧、日韩剧、欧美剧},将其与全局视频特征集合进行匹配,得到2016年6月27日内的各视频特征对应的全局标识{1-大陆剧、3-日韩剧、5-欧美剧}。
进一步地,2016年6月27日内的各多媒体资源特征对应的第一权重值:1-大陆剧对应的第一权重值为0.33,3-日韩剧对应的第一权重值为0.22,5-欧美剧对应的第一权重值为0.15。根据2016年6月27日以前的历史多媒体资源特征数据,获取1-大陆剧对应的第二权重值为0.4,3-日韩剧对应的第二权重值为0.18,5-欧美剧对应的第二权重值为0.21。
需要说明的是,本实施例并不限制融合系数α的取值方式,优选为大于0.5的数值。融合系数α选取大于0.5的数值,可以使得在计算获取的各视频特征对应的第三权重时,给予新的权重值(第一权重值)以较高的比例。其中,根据式1可以得知,第一权重值和第二两个权重值融合时对应的系数之和为1。假设α=0.65,同时,w1'=0.33,w'3=0.22,w'5=0.15;w1"=0.4,w3"=0.18,w5"=0.21,计算得到w1=0.35,w3=0.21,w5=0.17。
应当注意的是,对于每个类别视频特征的更新,例如视频频道和评分,可以选择相同的融合系数α,也可以根据实际推荐需求或特征属性选择不同的融合系数α,在此不做限定。
此外,若某一视频特征的第一权重值不存在,或者第二权重值不存在,上述式1计算均有效。当一个视频特征对应的第三权重值很小时(例如1E-10),可能考虑将该视频特征对应的第三权重值进行丢弃。
在一种可能的实现方式中,如图4所示,根据各多媒体资源特征对应的第三权重值,对各待推荐多媒体资源进行排序(步骤103),可以包括:
步骤401、分别获取各所述待推荐多媒体资源对应的各多媒体资源特征;
步骤402、根据各所述待推荐多媒体资源对应的各多媒体资源特征对应的特征值和第三权重值,获取各所述待推荐多媒体资源对应的点击概率;
步骤403、根据各所述待推荐多媒体资源对应的点击概率,对所述各待推荐多媒体资源进行排序。
其中,多媒体资源可以包括多个多媒体资源特征,每个多媒体资源特征都有对应的特征值和权重值。具体地,多媒体资源对应的特征值可以通过特征工程处理得到,多媒体资源对应的权重值可以通过模型训练得到。根据各待推荐多媒体资源对应的各多媒体资源特征对应的特征值和第三权重值,可以得到各待推荐多媒体资源对应的点击概率。
例如,待推荐多媒体资源对应的多媒体资源特征为X1、X2、…、Xi、…XI(i为下标,其取值范围为1~I的整数;I为该待推荐多媒体资源对应的多媒体资源特征的个数)。其中,特征X1对应的特征值为x11,第三权重值为x12;特征X2对应的特征值为x21,第三权重值为x22;依此类推,特征Xi对应的特征值为xi1,第三权重值为xi2。那么,该待推荐多媒体资源对应的点击概率为:
需要说明的是,特征值的原始取值可以是数值型或非数值型,经过特征工程的处理,从而得到便于模型计算的量化的最终取值。为了便于理解,简单举例如下:
针对视频评分(数值特征连续型),可以将其映射到[0,1]之间;针对开始播放小时(数值特征离散型),可以将其映射为24个特征,例如视频是在20点被观看,则对应20点特征取值为1;针对视频频道(非数值特征),如果所有频道取值有20种,则每种对应一个特征,例如,视频属于第一频道,则对应频道特征取值为1。最后,在计算点击概率时,通过特征对应的特征值与权重值相乘,再将相乘得到的结果相加求和后,对求和得到的结果进行Sigmod映射,得到介于[0,1]之间的点击概率。其中,Sigmod公式为S(x)=1/(1+e-x),x即为求和得到的结果。
本实施例的多媒体资源推荐排序方法,既可以实现离线阶段排序也可以实现在线阶段排序,在此不做限定。离线排序是指,将推荐列表离线批量计算并整理好。在线排序是指,离线分别整理好待推荐多媒体资源对应的多媒体资源特征和特征值,以及融合后多媒体资源特征对应的权重值,然后在线环节实时计算待推荐多媒体资源对应的点击概率,并据此对各待推荐多媒体资源进行排序。此外,本实施例不限制对各待推荐多媒体资源的排序方式。
作为本发明实施例的一个示例,可以选择一个多媒体资源特征进行第一轮排序;在第一轮排序结束后,存在具有同一多媒体资源特征的多个多媒体资源的情况下,再选择另一个多媒体资源特征进行第二轮排序。循环往复,最终得到各待推荐多媒体资源的排序结果。上述排序方法主要适用于待推荐多媒体资源对应的多媒体资源特征对应的特征值相等的情况。
以视频为例,各待推荐视频包括视频A、B、C和D。此时,按照视频分类对视频A、B、C、D进行第一轮排序。其中,视频A和视频C属于大陆剧(权重值0.35),排序在第一位;视频B属于日韩剧(权重值0.22),排序在第二位;视频D属于欧美剧(权重值0.17),排序在第三位。进一步地,可以按照视评分对视频A、C进行第二轮排序。其中,视频A评分9.3(权重值0.45),排序
在第一位,视频C评分8.0(权重值0.4),排序在第二位。综上,视频排序结果为A-C-B-D。如果向用户展现3个视频,则为视频A、C、B。
作为本发明实施例的另一个示例,可以针对每个多媒体资源选择多个对应的多媒体资源特征,求得各多媒体资源特征对应的点击概率,并根据点击概率对各待推荐多媒体资源进行排序。
以视频为例,各待推荐视频包括视频A、B、C和D。按照视频分类和评分两个视频特征对视频A、B、C、D进行排序。其中,视频A属于大陆剧(权重值0.35),评分9.3(权重值0.45);视频B属于日韩剧(权重值0.22),评分7.0(权重值0.35);视频C属于大陆剧(权重值0.35),评分8.0(权重值0.4);视频D属于欧美剧(权重值0.17),评分9.5(权重值0.45)。因此,将各视频的视频分类对应的第三权重值和评分对应的第三权重值相加,得到各视频对应的点击概率。具体地,视频A的点击概率为0.8;视频B的点击概率为0.57;视频C的点击概率为0.75;视频D的点击概率为0.62。综上,视频排序结果为A-C-D-B。如果向用户展现3个视频,则为视频A、C、D。
需要说明的是,本领域技术人员应能理解,在对待推荐多媒体资源进行排序的过程中,可以进行一轮排序,也可以进行多轮排序,在此不作限制。此外,也可以在一轮排序预测后,根据其他信息再对推荐内容做调整,例如相关性调整等。
在一种可能的实现方式中,如图5、图6所示,还包括:
步骤104、在得到各多媒体资源特征对应的第三权重值之后,将历史多媒体资源特征数据中的各多媒体资源特征对应的第一权重值更新为具有相同全局标识的各多媒体资源特征对应的第三权重值。
本实施例的预设周期可以被视为多媒体资源特征进行更新的时间间隔。以视频为例,视频特征可能存在静态特征和动态特征两种形式。其中,静态特征可以指确定后一般不会改变的视频特征,例如视频频道、视频时长、上映时间等。动态特征可以指随着用户播放或操作会发生改变的视频特征,例如观看次数、评分等。此外,对于不同类别的视频特征,可以选择不同的更新时间段,例如对于变化较慢的特征,可以选择较长的更新时间段,例如按天进行更新;对于变化较快的特征,可以选择较短的更新时间段,例如按小时进行更新,或实时更新。
本发明实施例的多媒体资源推荐排序方法,通过请求点击反馈数据和历史多媒体资源特征数据,获取各多媒体资源特征对应的权重值。本发明实施例的多媒体资源推荐排序方法,可以不丢失各多媒体资源特征,使得各多媒体资源特征均具有对应的特征值。此外,还使得各多媒体资源特征的权重值融合入历史权重值,提高排序结果的准确性,向用户提供高质量的多媒体资源推荐信息。
实施例2
图7示出根据本发明一实施例的多媒体资源推荐排序装置的结构框图。如图7所示,该多媒体资源推荐排序装置,主要包括:处理模块11,用于根据预设周期内所产生的请求点击反馈数据,获取所述预设周期内的各多媒体资源特征对应的第一权重值。融合模块13,与所述处理模块11连接,用于将各多媒体资源特征对应的第一权重值与从历史多媒体资源特征数据中获取的各多媒体资源特征对应的第二权重值进行融合,得到各多媒体资源特征对应的第三权重值。排序模块15,与所述融合模块13连接,用于根据各多媒体资源特征对应的第三权重值,对各待推荐多媒体资源进行排序。具体原理和示例可以参见实施例1以及图1的相关描述。
在一种可能的实现方式中,如图8所示,所述处理模块11,包括:处理单元111,用于根据所述预设周期内所产生的请求点击反馈数据,获取所述预设周期内的多媒体资源特征数据。训练单元113,与所述处理单元111连接,用于按照预设训练模型对所述预设周期内的多媒体资源特征数据进行训练,得到所述预设周期内的各多媒体资源特征对应的第一权重值。具体原理和示例可以参见实施例1以及图2的相关描述。
在一种可能的实现方式中,如图9所示,所述融合模块13,包括:识别单元131,用于将所述预设周期内的各多媒体资源特征与全局多媒体资源特征集合内的各多媒体资源特征进行匹配,获取所述预设周期内的各多媒体资源特征对应的全局标识。融合单元133,与所述识别单元131连接,用于将具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,按照预设融合模型进行融合,得到各所述多媒体资源特征对应的第三权重值。具体原理和示例可以参见实施例1以及图3的相关描述。
在一种可能的实现方式中,所述融合单元133,具体用于采用下式1来融合具有相同全局标识的多媒体资源特征对应的第一权重值和第二权重值,得到所述多媒体资源对应的第三权重值,
wi=(1-α)×wi"+α×w'i 式1
其中,i为所述多媒体资源特征对应的全局标识,w'i为第i个多媒体资源特征对应的第一权重值,wi"为第i个多媒体资源特征对应的第二权重值,wi为第i个多媒体资源特征对应的第三权重值,α为融合系数,α∈[0,1]。具体原理和示例可以参见实施例1的相关描述。
在一种可能的实现方式中,如图10所示,所述排序模块15,包括:获取单元151,用于分别获取各所述待推荐多媒体资源对应的各多媒体资源特征。计算单元153,与所述获取单元151连接,用于根据各所述待推荐多媒体资源对应的各多媒体资源特征对应的特征值及第三权重值,获取各所述待推荐多媒体资源对应的点击概率。排序单元155,与所述计算单元153连接,用于根据各所述待推荐多媒体资源对应的点击概率,对所述各待推荐多媒体资源进行排序。具体原理和示例可以参见实施例1以及图4的相关描述。
在一种可能的实现方式中,如图11所述,还包括:替换模块17,用于在得到各多媒体资源特征对应的第三权重值之后,将历史多媒体资源特征数据中的各多媒体资源特征对应的第一权重值更新为具有相同全局标识的各多媒体资源特征对应的第三权重值。具体原理和示例可以参见实施例1以及图5、图6的相关描述。
本发明实施例的多媒体资源推荐排序装置,通过请求点击反馈数据和历史多媒体资源特征数据,获取各多媒体资源特征对应的权重值。本发明实施例的多媒体资源推荐排序装置,可以不丢失各多媒体资源特征,使得各多媒体资源特征均具有对应的特征值。此外,还使得各多媒体资源特征的权重值融合入历史权重值,提高排序结果的准确性,向用户提供高质量的多媒体资源推荐信息。
实施例3
图12示出根据本发明一实施例的多媒体资源推荐排序设备的结构框图。所述多媒体资源推荐排序设备1100可以是具备计算能力的主机服务器、个人计算机PC、或者可携带的便携式计算机或终端等。本发明具体实施例并不对计算节点的具体实现做限定。
所述多媒体资源推荐排序设备1100包括处理器(processor)1110、通信接口(Communications Interface)1120、存储器(memory)1130和总线1140。其中,处理器1110、通信接口1120、以及存储器1130通过总线1140完成相互间的通信。
通信接口1120用于与网络设备通信,其中网络设备包括例如虚拟机管理中心、共享存储等。
处理器1110用于执行程序。处理器1110可能是一个中央处理器CPU,或者是专用集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器1130用于存放文件。存储器1130可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1130也可以是存储器阵列。存储器1130还可能被分块,并且所述块可按一定的规则组合成虚拟卷。
在一种可能的实施方式中,上述程序可为包括计算机操作指令的程序代码。该程序具体可用于:实现上述实施例1中的各步骤。
本领域普通技术人员可以意识到,本文所描述的实施例中的各示例性单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件形式来实现,取决于技术方案的特定应用和设计约束条件。专业技术人员可以针对特定的应用选择不同的方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
如果以计算机软件的形式来实现所述功能并作为独立的产品销售或使用时,则在一定程度上可认为本发明的技术方案的全部或部分(例如对现有技术做出贡献的部分)是以计算机软件产品的形式体现的。该计算机软件产品通常存储在计算机可读取的非易失性存储介质中,包括若干指令用以使得计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各实施例方法的全部或部分步骤。而前述的存储介质包括U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。