CN111294650A - 视频推荐方法、装置、设备及计算机存储介质 - Google Patents
视频推荐方法、装置、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN111294650A CN111294650A CN201811506425.4A CN201811506425A CN111294650A CN 111294650 A CN111294650 A CN 111294650A CN 201811506425 A CN201811506425 A CN 201811506425A CN 111294650 A CN111294650 A CN 111294650A
- Authority
- CN
- China
- Prior art keywords
- video
- user
- scoring
- matrix
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 239000011159 matrix material Substances 0.000 claims abstract description 90
- 238000012549 training Methods 0.000 claims abstract description 46
- 239000013598 vector Substances 0.000 claims description 62
- 238000012795 verification Methods 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 description 28
- 230000008569 process Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44204—Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明公开了一种视频推荐方法、装置、设备及计算机存储介质。其中,视频推荐方法包括:获取预定周期内的多个用户的用户播放数据;根据用户播放数据确定每个用户播放每个视频内容的播放时长,并根据播放时长生成用户‑视频评分矩阵;根据用户‑视频评分矩阵训练视频评分模型;利用视频评分模型为多个用户推荐视频内容。根据本发明实施例,能够利用根据每个用户播放每个视频内容的播放时长生成的用户‑视频评分矩阵训练得到的视频评分模型,为多个用户推荐视频内容,提高视频推荐结果的准确性。
Description
技术领域
本发明属于视频推荐技术领域,尤其涉及一种视频推荐方法、装置、设备及计算机存储介质。
背景技术
随着互联网电视OTT业务的发展,互联网电视的视频内容数量正在呈爆发式增长。这些海量的视频内容在满足了用户需求的同时,也使用户寻找所感兴趣的视频内容更加困难。
传统的视频推荐方法大多为“千人一面”的热门推荐方式,这种热门推荐方式在目前海量视频内容的环境下已经无法满足用户的需求,因此,“千人千面”的个性化视频推荐随之诞生。
在现有的个性化视频推荐方法中,目前最主流的方法是基于视频内容的协同过滤推荐方法,具体为:首先采用近邻模型计算各个视频内容之间的相似性,然后根据用户的历史观看行为和视频内容之间的相似性进行推荐,从而为用户推荐与之前观看的视频内容相似的视频内容。
虽然,这种个性化视频推荐方法在一定程度上可以根据每个用户的兴趣为其进行视频内容的推荐,但是,依然具有不足之处:由于在实际应用中,用户和视频内容的数量都为海量,因此,利用一个用户对观看过的视频内容的评分形成的用户-评分矩阵必然为稀疏矩阵,数据稀疏会导致对视频内容之间的相似度计算较为困难,进而使得根据视频内容之间的相似度计算出的预测评分与实际评分偏差较大,造成推荐结果的准确性较低。
发明内容
本发明实施例提供一种视频推荐方法、装置、设备及计算机存储介质,能够利用根据每个用户播放每个视频内容的播放时长生成的用户-视频评分矩阵训练得到的视频评分模型,为多个用户推荐视频内容,提高视频推荐结果的准确性。
一方面,本发明实施例提供一种视频推荐方法,包括:
获取预定周期内的多个用户的用户播放数据;
根据所述用户播放数据确定每个用户播放每个视频内容的播放时长,并根据所述播放时长生成用户-视频评分矩阵;
根据所述用户-视频评分矩阵训练视频评分模型;
利用所述视频评分模型为所述多个用户推荐视频内容。
进一步地,所述用户播放数据包括用户标识、视频标识、播放开始时间和播放结束时间。
进一步地,根据所述用户-视频评分矩阵训练视频评分模型包括:
对所述用户-视频评分矩阵进行标准化处理,获得用户-标准评分矩阵;
根据所述用户-标准评分矩阵,确定多个用户-评分向量矩阵;
根据所述多个用户-评分向量矩阵训练所述视频评分模型。
进一步地,所述视频评分模型的建立方法为:
根据所述用户-评分向量矩阵和潜因子向量,确定权值矩阵;
利用SVD将所述权值矩阵分解为多个奇异向量矩阵,并将所述多个奇异向量矩阵作为所述视频评分模型。
进一步地,根据所述用户-视频评分矩阵训练视频评分模型包括:
设置所述视频评分模型的超参数的参数值;
选取所述多个用户-评分向量矩阵中的训练数据;
根据所述训练数据,训练所述视频评分模型。
进一步地,根据所述用户-视频评分矩阵训练视频评分模型还包括:
选取所述多个用户-评分向量矩阵中的验证数据;
根据所述验证数据,验证训练后的所述视频评分模型;如果验证结果符合验证条件,则确定建模完成;如果验证结果不符合验证条件,则修改所述超参数的参数值,并根据所述训练数据,重新训练所述视频评分模型。
进一步地,利用所述视频评分模型为所述多个用户推荐视频内容包括:
利用所述视频评分模型,获得包含每个用户对每个视频内容的预测评分的用户-预测评分矩阵;
根据所述用户-预测评分矩阵,为所述多个用户匹配待推荐的视频内容。
另一方面,本发明实施例提供了一种视频推荐装置,所述装置包括:
数据获取单元,被配置为获取预定周期内的多个用户的用户播放数据;
数据处理单元,被配置为根据所述用户播放数据确定每个用户播放每个视频内容的播放时长,并根据所述播放时长生成用户-视频评分矩阵;
模型训练单元,被配置为根据所述用户-视频评分矩阵训练视频评分模型;
视频推荐单元,被配置为利用所述视频评分模型为所述多个用户推荐视频内容。
再一方面,本发明实施例提供了一种视频推荐设备,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如上所述的视频推荐方法。
再一方面,本发明实施例提供了一种计算机存储介质,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上所述的视频推荐方法。
本发明实施例的视频推荐方法、装置、设备及计算机存储介质,能够根据预定周期内获取的用户播放数据确定用户-视频评分矩阵,然后根据用户-视频评分矩阵训练基于神经网络的视频评分模型,以对海量数据进行分析获得密度较高的密集矩阵,并利用视频评分模型为多个用户推荐视频内容,从而获得准确性较高的视频推荐结果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的视频推荐方法的流程示意图;
图2是图1所示的视频推荐方法的步骤S130的一个示例的流程示意图;
图3是本发明实施例中视频评分模型的建立方法的流程示意图;
图4是本发明实施例中建立的RBM模型的结构示意图;
图5是图1所示的视频推荐方法的步骤S130的另一个示例的流程示意图;
图6是图1所示的视频推荐方法的步骤S130的再一个示例的流程示意图;
图7是图1所示的视频推荐方法的步骤S140的一个示例的流程示意图;
图8是本发明一个实施例提供的视频推荐装置的结构示意图;
图9是本发明实施例提供的视频推荐设备的硬件结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了解决现有技术问题,本发明实施例提供了一种视频推荐方法、装置、设备及计算机存储介质。下面首先对本发明实施例所提供的视频推荐方法进行介绍。
图1示出了本发明一个实施例提供的视频推荐方法的流程示意图。如图1所示,该视频推荐方法包括:
S110、获取预定周期内的多个用户的用户播放数据;
S120、根据用户播放数据确定每个用户播放每个视频内容的播放时长,并根据播放时长生成用户-视频评分矩阵;
S130、根据用户-视频评分矩阵训练视频评分模型;
S140、利用视频评分模型为多个用户推荐视频内容。
本发明实施例能够根据预定周期内获取的用户播放数据确定用户-视频评分矩阵,然后根据用户-视频评分矩阵训练基于神经网络的视频评分模型,以对海量数据进行分析获得密度较高的密集矩阵,并利用视频评分模型为多个用户推荐视频内容,从而获得准确性较高的视频推荐结果。
在本发明实施例的步骤S110中,用户播放数据可以包括用户标识、视频标识、播放开始时间和播放结束时间。其中,用户标识可以为用户ID,视频标识可以为视频ID。
具体地,可以使用互联网电视盒子的软探针对用户行为进行采集,从而进行用户播放数据的采集。在采集过程中,互联网盒子的软探针需要对以下用户行为进行埋点:
a.视频播放开始的时间,包括对应的视频ID、用户ID;
b.视频播放停止的时间,包括对应的视频ID、用户ID。
在本发明实施例中,为了尽可能增加视频评分模型的准确性,预定周期一般设置为1-2个完整的运营周期,即1-2周的时间。
在本发明实施例的步骤S120中,根据用户播放数据确定每个用户播放每个视频内容的播放时长的具体方法为:根据用户ID和视频ID,将同一个用户对同一个视频内容的多次用户播放数据合并,即将同一个用户对同一个视频内容的多个视频播放开始的时间和视频播放停止的时间合并,获取同一个用户对同一个视频内容的实际观看时长。
在本发明实施例的步骤S120中,根据播放时长生成用户-视频评分矩阵的具体方法为:使用内容库的数据或爬虫获取各个视频内容的总时长,然后将用户观看过的视频内容的实际观看时长除以该视频内容的总时长,既可以得到该用户对该视频内容的视频评分,根据每个用户对每个视频内容的视频评分,可以得到用户-视频评分矩阵。用户-视频评分矩阵可以记为X,其中,用户数量可以记为N,视频内容数量可以记为M,则X是一个N×M的矩阵。
图2示出了图1所示的视频推荐方法的步骤S130的一个示例的流程示意图。如图2所示,步骤S130、根据用户-视频评分矩阵训练视频评分模型的一个示例的具体方法可以包括:
S210、对用户-视频评分矩阵进行标准化处理,获得用户-标准评分矩阵;
S220、根据用户-标准评分矩阵,确定多个用户-评分向量矩阵;
S230、根据多个用户-评分向量矩阵训练视频评分模型。
在本发明实施例步骤S131中,对用户-视频评分矩阵进行标准化处理,获得用户-标准评分矩阵的具体方法为,利用下述的标准化公式:
其中,xrating为每个用户对每个视频内容的标准化评分,Max为所有视频评分中的最大值,Min为所有视频评分中的最小值,ceil()为向上取整函数。
根据标准化公式,既可以首先将每个用户对每个视频内容的视频评分做归一化处理,然后乘以5,再作向上取整,最终得到标准化评分xrating。使所有的视频评分都转换成为了1~5的整数作为标准化评分。
在本发明实施例步骤S132中,可以将每个用户对多个视频内容的标准化评分提取出来,并将标准化评分转化为评分向量。具体地,可以设置评分向量具有五个分量,根据标准化评分,将对应的分量设置为1,其余的分量设置为0。例如,标准化评分为1,则评分向量可以为(1,0,0,0,0),标准化评分为3,则评分向量可以为(0,0,1,0,0),标准化评分为5,则评分向量可以为(0,0,0,0,1)。当获取了一个用户对全部播放过的视频内容的评分向量后,既将这些评分向量按列堆叠成该用户对多个视频内容的用户-评分向量。如果该用户播放过的视频内容的数量为m,则用户-评分向量V为一个5×m的矩阵。
图3示出了本发明实施例中视频评分模型的建立方法的流程示意图。如图3所示,视频评分模型的建立方法可以为:
S310、根据用户-评分向量矩阵和潜因子向量,确定权值矩阵;
S320、利用SVD将权值矩阵分解为多个奇异向量矩阵,并将多个奇异向量矩阵作为视频评分模型。
首先,可以设定用户潜因子数量为F。然后构建图4所示的RBM模型。在图4中,可见层中包括全部的视频内容,其中被一个用户播放过的M个视频内容的评分向量,构成了可见层的m个评分神经元,其中,每个评分神经元的每个方框即为一个分量,填充颜色的方框对应的分量为1,无填充颜色的方框对应的分量为0。未播放的视频内容对应的可见层神经元不构成评分神经元。隐藏层由F个用户潜因子二分值神经元构成,其中,填充颜色的用户潜因子二分值神经元为激活状态,无填充颜色的用户潜因子二分值神经元为未激活状态。用户未评分的可见层神经元与隐藏层无连接,评分神经元与隐藏层中的用户潜因子二分值神经元相互连接,评分神经元与用户潜因子二分值神经元的连线即构成了权值矩阵W。当时,表示该用户对第i个视频内容的标准化评分为k。用户潜因子二分值神经元对应的潜因子向量记为h。当hj=1时,表示该用户的第j个用户潜因子二分值神经元为激活状态。
然后,假设RBM模型在给定隐藏层的前提下可见层满足多项式分布,同时在给定可见层的前提下隐藏层满足伯努利分布。可以得知:
由上述的条件概率可以求出V的边缘分布函数:
其中,E为能量函数,当系统的能量值达到最小的时候,这时处于收敛状态或者说最稳定的状态,其表达式是:
作为一个学习型算法,需要通过迭代求得模型的权值项W。因此,使用梯度上升法更新权值项W,对上述的边缘分布的对数似然函数求偏导:
由于上述的model项无法在低于指数时间内求出,因此,采用对比散度法来近似求解,更新权值项W的公式更改如下:
由于视频内容的数量非常多,导致W是一个非常庞大的权值矩阵,大量的模型参数会导致严重的过拟合现象。因此,可以结合奇异值分解(Singular Value Decomposition,SVD)的思想,通过SVD的降维优势来减少该模型的大量参数。将权值矩阵W映射到两个低维的奇异向量矩阵A和B:
这样就将M×F的大规模矩阵分解为两个M×C和C×F的小规模矩阵,其中C远小于M且C远小于F。
此时W的更新公式就转变为A和B的更新公式:
在本发明实施例中,在多个用户-评分向量矩阵中选取一部分用户-评分向量矩阵作为训练数据,另一部分作为验证数据,因此,多个用户-评分向量矩阵构成的数据集可以被分割为训练集和验证集。
具体地,如果用户播放数据对应的用户不足5万,则将多个用户-评分向量矩阵按照8:2的比例随机分配为训练数据和验证数据;如果用户播放数据对应的用户超过5万,则抽取其中1万个用户-评分向量矩阵作为验证数据,其余作为训练数据。
图5示出了图1所示的视频推荐方法的步骤S130的另一个示例的流程示意图。如图5所示,步骤S130、根据用户-视频评分矩阵训练视频评分模型包括:
S410、设置视频评分模型的超参数的参数值;
S420、选取多个用户-评分向量矩阵中的训练数据;
S430、根据训练数据,训练视频评分模型。
在本发明实施例中,可以设定各项超参数的参数值,并且初始化需要训练的参数,将训练数据喂进上述的奇异向量矩阵A和B的模型,进行循环迭代,直至模型收敛。
在本发明实施例中,可以使用对比散度法CD-1算法进行视频评分模型迭代,以根据训练数据训练视频评分模型:
1、选取多个用户-评分向量矩阵中的训练数据中的一个用户的5×m的用户-评分向量矩阵,记为V,作为视频评分模型的单次样本输入,然后循环进行步骤2-步骤5,直到训练数据中的用户遍历完毕。
2、遍历所有用户潜因子二分值神经元(隐藏层)。
对于所有j=1,2,...,F,计算p(hj=1|V),计算公式如下:
然后,从条件分布p(hj=1|V)中抽取hj∈{0,1}。
经过此步骤,可以计算得出隐藏层用户潜因子向量h。
其中V为步骤1中的用户-评分向量矩阵,A和B为待训练的奇异向量矩阵,bj为步骤3中的待训练隐藏层偏置项,hj为用户的第j个用户潜因子二分值神经元。
3、遍历所有评分神经元(可见层)。
经过此步骤,可以计算得出用户-评分重构矩阵V*。
4、再次遍历所有用户潜因子二分值神经元(隐藏层)。
经过此步骤,可以计算得出隐藏层用户潜因子重构向量h*。
5、更新各个训练参数。
在遍历所有评分神经元和用户潜因子二分值神经元后,对于所有i=1,2,...,m,k=1,2,3,4,5,j=1,2,...,F,c=1,2,...,C,可以更新公式如下:
其中,V为用户-评分向量矩阵,V*为V的重构,即用户-评分重构矩阵,A和B为待训练的奇异向量矩阵,bj为待训练隐藏层偏置项,为待训练可见层偏置项,ε为学习率,hj为用户的第j个用户潜因子二分值神经元,为用户的第j个用户潜因子的重构神经元,为用户对第i个视频内容的标准化评分为k的评分神经元,为用户对第i个视频内容的评分为k的重构评分神经元,vj为V的第j个分量,vc为V的第c个分量,为V*的第j个分量,为V*的第c个分量。
图6示出了图1所示的视频推荐方法的步骤S130的再一个示例的流程示意图。如图6所示,步骤S130、根据所述用户-视频评分矩阵训练视频评分模型还包括:
S440、选取多个用户-评分向量矩阵中的验证数据;
S450、根据验证数据,验证训练后的视频评分模型;如果验证结果符合验证条件,则确定建模完成;如果验证结果不符合验证条件,则修改超参数的参数值,并根据训练数据,重新训练视频评分模型。
在本发明实施例中,可以使用验证数据对训练后的视频评分模型的效果进行验证。如果验证结果符合验证条件,则确定建模完成;如果验证结果不符合验证条件,则修改超参数的参数值,并根据训练数据,重新训练视频评分模型。
首先,选取多个用户-评分向量矩阵中的验证数据中的一个用户的5×m的用户-评分向量矩阵,记为V,作为视频评分模型的验证样本输入。
基于验证样本经过上述的利用训练数据训练视频评分模型的步骤2和步骤3的计算,可以得到用户-评分重构矩阵V*。此时的V*已经补全了V中的所有未播放的视频内容的视频评分,这些视频评分即为视频评分模型所做出的预测。
当遍历验证数据中的所有用户的用户-评分向量矩阵,并得到验证数据中的所有用户的用户-评分重构矩阵V*组成的预测评分矩阵X*后,使用均方根误差RMSE将验证数据的所有用户-评分向量矩阵V构成的实际评分矩阵X与预测评分矩阵X*做对比,公式如下:
其中,Pu,m表示预测评分矩阵X*中用户u对视频m做出的预测评分,ru,m表示实际评分矩阵X中用户u对视频m做出的实际评分,n为评分数量。RMSE值越小,表示视频评分模型预测的准确性越高。
在本发明实施例中。当RMSE符合预设的方差阈值时,可以确定验证结果符合验证条件,当RMSE不符合预设的方差阈值时,可以确定验证结果不符合验证条件。
图7示出了图1所示的视频推荐方法的步骤S140的一个示例的流程示意图。如图7所示,步骤S140、利用视频评分模型为多个用户推荐视频内容包括:
S141、利用视频评分模型,获得包含每个用户对每个视频内容的预测评分的用户-预测评分矩阵;
S142、根据用户-预测评分矩阵,为多个用户匹配待推荐的视频内容。
当确定建模完成后,既可以将全部的用户-评分向量矩阵输入视频评分模型,并输出每个用户对应的用户-评分重构矩阵,预测该用户对所有未播放的视频内容的视频评分,基于这些预测评分对视频内容进行优先级排序,既可以根据优先级排序选择预设数量的视频内容作为为该用户匹配的待推荐的视频内容。
综上所述,本发明实施例结合了SVD和RBM模型来进行协同过滤推荐,将RBM模型的中的权值矩阵W映射到两个低维的奇异向量矩阵A和B,这两个奇异向量矩阵通常为密集矩阵,因此,得到的视频评分模型解决了数据稀疏性的问题,提升了推荐效果。另外,本发明实施例的RBM模型可以看做是一种基于神经网络的用户潜因子模型,可以挖掘出视频评分背后所隐含的更深层次的信息,从而比传统的基于视频内容的协同过滤模型能够预测出更准确的视频评分,进一步提升了推荐结果的准确性。
图8示出了本发明一个实施例提供的视频推荐装置的结构示意图。如图8所示,该视频推荐装置包括:
数据获取单元510,被配置为获取预定周期内的多个用户的用户播放数据;
数据处理单元520,被配置为根据用户播放数据确定每个用户播放每个视频内容的播放时长,并根据播放时长生成用户-视频评分矩阵;
模型训练单元530,被配置为根据用户-视频评分矩阵训练视频评分模型;
视频推荐单元540,被配置为利用视频评分模型为多个用户推荐视频内容。
本发明实施例的数据获取单元510获取预定周期内的多个用户的用户播放数据,数据处理单元520能够根据预定周期内获取的用户播放数据确定用户-视频评分矩阵,然后模型训练单元530能够根据用户-视频评分矩阵训练基于神经网络的视频评分模型,以对海量数据进行分析获得密度较高的密集矩阵,从而通过视频推荐单元540利用视频评分模型为多个用户推荐视频内容,获得准确性较高的视频推荐结果。
图9示出了本发明实施例提供的视频推荐设备的硬件结构示意图。
在视频推荐设备可以包括处理器601以及存储有计算机程序指令的存储器602。
具体地,上述处理器601可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器602可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器602可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器602可在综合网关容灾设备的内部或外部。在特定实施例中,存储器602是非易失性固态存储器。在特定实施例中,存储器602包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器601通过读取并执行存储器602中存储的计算机程序指令,以实现上述实施例中的任意一种视频推荐方法。
在一个示例中,视频推荐设备还可包括通信接口603和总线610。其中,如图9所示,处理器601、存储器602、通信接口603通过总线610连接并完成相互间的通信。
通信接口603,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线610包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线610可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该视频推荐设备可以执行本发明实施例中的视频推荐方法,从而实现结合附图描述的视频推荐方法和装置。
另外,结合上述实施例中的视频推荐方法,本发明实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种视频推荐方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种视频推荐方法,包括:
获取预定周期内的多个用户的用户播放数据;
根据所述用户播放数据确定每个用户播放每个视频内容的播放时长,并根据所述播放时长生成用户-视频评分矩阵;
根据所述用户-视频评分矩阵训练视频评分模型;
利用所述视频评分模型为所述多个用户推荐视频内容。
2.根据权利要求1所述的视频推荐方法,其中,所述用户播放数据包括用户标识、视频标识、播放开始时间和播放结束时间。
3.根据权利要求1所述的视频推荐方法,其中,根据所述用户-视频评分矩阵训练视频评分模型包括:
对所述用户-视频评分矩阵进行标准化处理,获得用户-标准评分矩阵;
根据所述用户-标准评分矩阵,确定多个用户-评分向量矩阵;
根据所述多个用户-评分向量矩阵训练所述视频评分模型。
4.根据权利要求3所述的视频推荐方法,其中,所述视频评分模型的建立方法为:
根据所述用户-评分向量矩阵和潜因子向量,确定权值矩阵;
利用SVD将所述权值矩阵分解为多个奇异向量矩阵,并将所述多个奇异向量矩阵作为所述视频评分模型。
5.根据权利要求3所述的视频推荐方法,其中,根据所述用户-视频评分矩阵训练视频评分模型包括:
设置所述视频评分模型的超参数的参数值;
选取所述多个用户-评分向量矩阵中的训练数据;
根据所述训练数据,训练所述视频评分模型。
6.根据权利要求5所述的视频推荐方法,其中,根据所述用户-视频评分矩阵训练视频评分模型还包括:
选取所述多个用户-评分向量矩阵中的验证数据;
根据所述验证数据,验证训练后的所述视频评分模型;如果验证结果符合验证条件,则确定建模完成;如果验证结果不符合验证条件,则修改所述超参数的参数值,并根据所述训练数据,重新训练所述视频评分模型。
7.根据权利要求1所述的视频推荐方法,其中,利用所述视频评分模型为所述多个用户推荐视频内容包括:
利用所述视频评分模型,获得包含每个用户对每个视频内容的预测评分的用户-预测评分矩阵;
根据所述用户-预测评分矩阵,为所述多个用户匹配待推荐的视频内容。
8.一种视频推荐装置,其特征在于,所述装置包括:
数据获取单元,被配置为获取预定周期内的多个用户的用户播放数据;
数据处理单元,被配置为根据所述用户播放数据确定每个用户播放每个视频内容的播放时长,并根据所述播放时长生成用户-视频评分矩阵;
模型训练单元,被配置为根据所述用户-视频评分矩阵训练视频评分模型;
视频推荐单元,被配置为利用所述视频评分模型为所述多个用户推荐视频内容。
9.一种视频推荐设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的视频推荐方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的视频推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811506425.4A CN111294650A (zh) | 2018-12-10 | 2018-12-10 | 视频推荐方法、装置、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811506425.4A CN111294650A (zh) | 2018-12-10 | 2018-12-10 | 视频推荐方法、装置、设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111294650A true CN111294650A (zh) | 2020-06-16 |
Family
ID=71028889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811506425.4A Pending CN111294650A (zh) | 2018-12-10 | 2018-12-10 | 视频推荐方法、装置、设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111294650A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113111217A (zh) * | 2021-04-22 | 2021-07-13 | 北京达佳互联信息技术有限公司 | 播放时长预测模型的训练方法、视频推荐方法及装置 |
CN113496422A (zh) * | 2021-09-07 | 2021-10-12 | 济宁景泽信息科技有限公司 | 一种基于区块链的推广资源分配方法及大数据信息云平台 |
CN114513700A (zh) * | 2020-11-16 | 2022-05-17 | 中国移动通信集团有限公司 | 一种推荐视频的方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104156472A (zh) * | 2014-08-25 | 2014-11-19 | 四达时代通讯网络技术有限公司 | 一种视频推荐方法及系统 |
CN105302873A (zh) * | 2015-10-08 | 2016-02-03 | 北京航空航天大学 | 一种基于条件受限波尔兹曼机的协同过滤优化方法 |
US20160034460A1 (en) * | 2014-07-29 | 2016-02-04 | TCL Research America Inc. | Method and system for ranking media contents |
-
2018
- 2018-12-10 CN CN201811506425.4A patent/CN111294650A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160034460A1 (en) * | 2014-07-29 | 2016-02-04 | TCL Research America Inc. | Method and system for ranking media contents |
CN104156472A (zh) * | 2014-08-25 | 2014-11-19 | 四达时代通讯网络技术有限公司 | 一种视频推荐方法及系统 |
CN105302873A (zh) * | 2015-10-08 | 2016-02-03 | 北京航空航天大学 | 一种基于条件受限波尔兹曼机的协同过滤优化方法 |
Non-Patent Citations (2)
Title |
---|
RUSLAN SALAKHUTDINOV等: "Restricted Boltzmann Machines for Collaborative Filtering", 《APPEARING IN PROCEEDINGS OF THE 24TH INTERNATIONAL CONFERENCE ON MACHINE LEARNING》 * |
博客园: "机器学习:验证数据集与交叉验证", 《HTTPS://WWW.CNBLOGS.COM/VOLCAO/P/9291831.HTML》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114513700A (zh) * | 2020-11-16 | 2022-05-17 | 中国移动通信集团有限公司 | 一种推荐视频的方法、装置、设备及存储介质 |
CN113111217A (zh) * | 2021-04-22 | 2021-07-13 | 北京达佳互联信息技术有限公司 | 播放时长预测模型的训练方法、视频推荐方法及装置 |
CN113111217B (zh) * | 2021-04-22 | 2024-02-27 | 北京达佳互联信息技术有限公司 | 播放时长预测模型的训练方法、视频推荐方法及装置 |
CN113496422A (zh) * | 2021-09-07 | 2021-10-12 | 济宁景泽信息科技有限公司 | 一种基于区块链的推广资源分配方法及大数据信息云平台 |
CN113496422B (zh) * | 2021-09-07 | 2021-12-03 | 济宁景泽信息科技有限公司 | 一种基于区块链的推广资源分配方法及大数据信息云平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111368210B (zh) | 基于人工智能的信息推荐方法、装置以及电子设备 | |
CN111460130B (zh) | 信息推荐方法、装置、设备和可读存储介质 | |
Rendle | Scaling factorization machines to relational data | |
Wang et al. | Data mining of mass storage based on cloud computing | |
CN111859166B (zh) | 一种基于改进的图卷积神经网络的物品评分预测方法 | |
Beigi et al. | Exploiting emotional information for trust/distrust prediction | |
KR20210040248A (ko) | 물질의 생성 구조-특성 역 계산 공동 설계 | |
CN111294650A (zh) | 视频推荐方法、装置、设备及计算机存储介质 | |
Peebles et al. | Learning to learn with generative models of neural network checkpoints | |
Doan et al. | Adversarial factorization autoencoder for look-alike modeling | |
Creswell et al. | Denoising adversarial autoencoders: classifying skin lesions using limited labelled training data | |
Aravkin et al. | Dynamic matrix factorization with social influence | |
CN113868466A (zh) | 视频推荐的方法、装置、设备和存储介质 | |
Biswal et al. | Music recommender system using restricted Boltzmann machine with implicit feedback | |
Mao et al. | Feature selection for FM-based context-aware recommendation systems | |
CN114936723B (zh) | 一种基于数据增强的社交网络用户属性预测方法及系统 | |
Zhang et al. | Impute vs. ignore: Missing values for prediction | |
Ragain et al. | Improving pairwise comparison models using empirical bayes shrinkage | |
CN111935259B (zh) | 目标帐号集合的确定方法和装置、存储介质及电子设备 | |
CN115114462A (zh) | 模型训练方法、装置、多媒体推荐方法、设备及存储介质 | |
Pálovics et al. | RecSys Challenge 2014: an ensemble of binary classifiers and matrix factorization | |
CN115937556A (zh) | 对象识别方法、装置、设备和存储介质 | |
Chae et al. | Adversarial training of deep autoencoders towards recommendation tasks | |
CN110302540B (zh) | 基于ga-svm的游戏防沉迷判定系统及方法 | |
Xin | Deep learning-based implicit feedback recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200616 |
|
RJ01 | Rejection of invention patent application after publication |