CN104156472B - 一种视频推荐方法及系统 - Google Patents
一种视频推荐方法及系统 Download PDFInfo
- Publication number
- CN104156472B CN104156472B CN201410421741.7A CN201410421741A CN104156472B CN 104156472 B CN104156472 B CN 104156472B CN 201410421741 A CN201410421741 A CN 201410421741A CN 104156472 B CN104156472 B CN 104156472B
- Authority
- CN
- China
- Prior art keywords
- video
- user
- dimension
- duration
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
- H04N21/25891—Management of end-user data being end-user preferences
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Graphics (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种视频推荐方法及系统,根据视频的时长、用户观看所述视频的时长计算所述用户对所述视频的初始评分;根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分;根据所述用户最近一次收看所述视频的时刻与当前时刻的差值,计算所述用户对所述视频的最终评分。上述方法综合考虑了视频自身播放时长、用户收视次数和时间间隔因素对用户兴趣度的影响,提高了最终的推荐质量。
Description
技术领域
本发明涉及个性化推荐技术领域,尤其涉及一种视频推荐方法及系统。
背景技术
推荐系统是通过建立用户与项目(如:视频、音频、商品等)之间的二元关系,通过历史信息或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐的系统。
在现有各大型推荐系统中,协同过滤推荐(Collaborative FilteringRecommendation)是目前最热的个性化推荐技术。协同过滤推荐系统是通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求的系统。协同过滤推荐系统主要分为基于用户的协同过滤推荐(User-Based)和基于项目的协同过滤推荐(Item-Based),视频推荐就是基于项目的协同过滤推荐的一种形式。
在协同过滤推荐系统中,用户对项目的评分是决定用户兴趣度的一个重要指标,影响后续的推荐质量。而现实中只有少量的用户愿意积极主动对项目进行评分,并且评分也不一定真正代表用户的真实喜好,因此计算用户隐式评分是很多推荐系统采取的一种方法。但是,在视频推荐时,传统的隐式评分方法并没有综合考虑视频自身播放时长、用户收视次数和时间间隔因素对用户兴趣度的影响,严重影响了最终的推荐质量。
发明内容
有鉴于此,本发明提供了一种视频推荐方法及系统,以克服现有技术中由于传统的隐式评分方法并没有综合考虑视频自身播放时长、用户收视次数和时间间隔因素对用户兴趣度的影响,严重影响了最终的推荐质量的问题。
为实现上述目的,本发明提供如下技术方案:
一种视频推荐方法,所述方法包括:
获取视频的时长、用户观看所述视频的时长以及所述用户最近一次收看所述视频的时刻;
根据所述视频的时长、所述用户观看所述视频的时长计算所述用户对所述视频的初始评分;
根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分;
根据所述用户最近一次收看所述视频的时刻与当前时刻的差值,计算所述用户对所述视频的最终评分。
优选的,所述根据所述视频的时长、所述用户观看所述视频的时长计算所述用户对所述视频的初始评分,具体包括:
将所述用户观看所述视频的时长除以所述视频的时长的商,作为所述用户对所述视频的初始评分。
优选的,所述计算所述用户对所述视频的最终评分,具体包括:
根据公式计算所述用户对所述视频的最终评分;
其中,Rui表示所述最终评分,Gui表示所述标准化评分,ζ表示时间差衰减系数,tui表示所述当前时间;t'ui表示所述用户最近一次收看所述视频的时刻。
优选的,多个用户对所述视频的最终评分构成评分矩阵,所述方法还包括:
获取所述用户的社交信息;
根据所述用户的社交信息获取社交信任度矩阵并建立社交正态分布因子分解算法;
根据社交正态分布因子分解方法将维度为第一维度的所述评分矩阵分解为维度为第二维度的第一子矩阵以及维度为第三维度的第二子矩阵,其中,所述第一维度大于所述第二维度并且大于所述第三维度;
将所述第一子矩阵与所述第二子矩阵相乘生成最终评分矩阵。
优选的,还包括:
确定另外的视频与所述视频的相似度;
根据所述相似度建立相似度矩阵。
优选的,还包括:
根据所述最终评分矩阵以及所述相似度矩阵计算推荐结果。
优选的,所述确定另外的视频与所述视频的相似度,具体包括:
获取所述另外的视频的第一视频标签的第一个数;
获取所述视频的第二视频标签的第二个数;
确定所述第一视频标签中与所述第二视频标签中相同的标签的第三个数;
将所述第三个数除以所述第一个数与所述第二个数之和,得到所述相似度。
优选的,所述确定另外的视频与所述视频的相似度,具体包括:
获取所述另外的视频的第一视频观看用户的第四个数;
获取所述视频的第二视频观看用户的第五个数;
确定所述第一视频观看用户中与所述第二视频观看用户中相同的观看用户的第六个数;
将所述第六个数除以所述第四个数与所述第五个数之和,得到所述相似度。
一种视频推荐子系统,所述系统包括:
获取单元,用于获取视频的时长、用户观看所述视频的时长以及所述用户最近一次收看所述视频的时刻;
初始评分计算单元,用于根据所述视频的时长、所述用户观看所述视频的时长计算所述用户对所述视频的初始评分;
标准化评分计算单元,用于根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分;
最终评分计算单元,用于根据所述用户最近一次收看所述视频的时刻与当前时刻的差值,计算所述用户对所述视频的最终评分。
优选的,所述初始评分计算单元,具体用于:
将所述用户观看所述视频的时长除以所述视频的时长的商,作为所述用户对所述视频的初始评分。
优选的,所述最终评分计算单元,具体用于:
根据公式计算所述用户对所述视频的最终评分;
其中,Rui表示所述最终评分,Gui表示所述标准化评分,ζ表示时间差衰减系数,tui表示所述当前时间;t'ui表示所述用户最近一次收看所述视频的时刻。
优选的,多个用户对所述视频的最终评分构成评分矩阵,所述子系统还包括:
最终评分矩阵生成单元,具体用于获取所述用户的社交信息;根据所述用户的社交信息获取社交信任度矩阵并建立社交正态分布因子分解算法;根据社交正态分布因子分解方法将维度为第一维度的所述评分矩阵分解为维度为第二维度的第一子矩阵以及维度为第三维度的第二子矩阵,其中,所述第一维度大于所述第二维度并且大于所述第三维度;将所述第一子矩阵与所述第二子矩阵相乘生成最终评分矩阵。
优选的,还包括:
相似度矩阵建立单元,具体用于确定另外的视频与所述视频的相似度;根据所述相似度建立相似度矩阵。
优选的,还包括:
推荐结果计算单元,用于根据所述最终评分矩阵以及所述相似度矩阵计算推荐结果。
优选的,所述相似度矩阵建立单元,具体用于:
获取所述另外的视频的第一视频标签的第一个数;
获取所述视频的第二视频标签的第二个数;
确定所述第一视频标签中与所述第二视频标签中相同的标签的第三个数;
将所述第三个数除以所述第一个数与所述第二个数之和,得到所述相似度。
优选的,所述相似度矩阵建立单元,具体用于:
获取所述另外的视频的第一视频观看用户的第四个数;
获取所述视频的第二视频观看用户的第五个数;
确定所述第一视频观看用户中与所述第二视频观看用户中相同的观看用户的第六个数;
将所述第六个数除以所述第四个数与所述第五个数之和,得到所述相似度。
一种视频推荐系统,包括上面所述的视频推荐子系统。
经由上述的技术方案可知,与现有技术相比,本发明公开了一种视频推荐方法及系统,根据视频的时长、用户观看所述视频的时长计算所述用户对所述视频的初始评分;根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分;根据所述用户最近一次收看所述视频的时刻与当前时刻的差值,计算所述用户对所述视频的最终评分。上述方法综合考虑了视频自身播放时长、用户收视次数和时间间隔因素对用户兴趣度的影响,提高了最终的推荐质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明公开的一种视频推荐方法实施例1示意图;
图2为示例一公开的一种社交关系有向图;
图3为示例一公开的一种社交信任度矩阵示意图;
图4为示例一公开的一种社交正态分布因子分解方法的模型示意图;
图5为本发明公开的一种视频推荐子系统实施例1示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本发明的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
由背景技术可知,现有技术中由于传统的隐式评分方法并没有综合考虑视频自身播放时长、用户收视次数和时间间隔因素对用户兴趣度的影响,严重影响了最终的推荐质量。
为此,本发明公开了一种视频推荐方法及系统,根据视频的时长、用户观看所述视频的时长计算所述用户对所述视频的初始评分;根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分;根据所述用户最近一次收看所述视频的时刻与当前时刻的差值,计算所述用户对所述视频的最终评分。上述方法综合考虑了视频自身播放时长、用户收视次数和时间间隔因素对用户兴趣度的影响,提高了最终的推荐质量。
下面将通过以下实施例进行详细说明。
请参阅附图1,为本发明公开的一种视频推荐方法实施例1的示意图,该方法具体包括如下步骤:
S101:获取视频的时长、用户观看所述视频的时长以及所述用户最近一次收看所述视频的时刻。
在选定的时间段内,遍历当前视频推荐系统中的所有用户,采集用户的收视行为数据,具体包括用户观看过的视频对应的视频的时长、用户观看所述视频的时长以及所述用户最近一次收看所述视频的时刻。
S102:根据所述视频的时长、所述用户观看所述视频的时长计算所述用户对所述视频的初始评分。
具体的,某一用户对某一视频的初始评分可以通过如下公式(1)计算得到:
其中,rui表示用户u收看视频i的初始评分,nui表示用户u收看视频i的总次数,duki表示用户u第k次收看视频i的时长,Ti表示视频i的时长。
S103:根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分。
其中“最小-最大标准化”的计算公式如下:
其中:min(x)和max(x)分别指某一输入变量所有数据中的最小值和最大值,x0是初始值。
在本方案中我们定义M表示用户个数,N表示视频个数,将M个用户对视频i的初始评分构成向量则运用公式(2)有:
其中Gui为用户u对视频i的标准化后的评分;表示初始评分中的最大值,表示初始评分中的最小值。
S104:根据所述用户最近一次收看所述视频的时刻与当前时刻的差值,计算所述用户对所述视频的最终评分。
基于以上计算的标准化评分后,还需要考虑时间间隔因素对用户兴趣度的影响,我们根据退化时长差,可由如下公式(4)计算用户最终的隐式评分:
其中:tui表示用户u当前收看视频i的时刻;t'ui表示用户u上一次收看视频i的时刻;
ζ表示时间差衰减系数,Rui表示用户u随着时间的衰减对视频i的最终隐式评分。
当退化时长差为0时,最终评分与初始评分相等。
本发明公开了一种视频推荐方法,根据视频的时长、用户观看所述视频的时长计算所述用户对所述视频的初始评分;根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分;根据所述用户最近一次收看所述视频的时刻与当前时刻的差值,计算所述用户对所述视频的最终评分。上述方法综合考虑了视频自身播放时长、用户收视次数和时间间隔因素对用户兴趣度的影响,提高了最终的推荐质量。
在上述方法的基础上,本发明还公开了如下特征:
获取所述用户的社交信息;
根据所述用户的社交信息获取社交信任度矩阵并建立社交正态分布因子分解算法;
根据社交正态分布因子分解方法将维度为第一维度的所述评分矩阵分解为维度为第二维度的第一子矩阵以及维度为第三维度的第二子矩阵,其中,所述评分矩阵由多个用户对所述视频的最终评分构成,所述第一维度大于所述第二维度并且大于所述第三维度;
将所述第一子矩阵与所述第二子矩阵相乘生成最终评分矩阵。
具体的,本发明通过以下示例一对该特征进行详细说明。
示例一
协同过滤推荐系统中,正态分布因子分解方法假定用户个数为M,视频个数为N,并进一步假设给定用户u和视频i的潜在因子随机向量Qu和Pi后,用户u对视频i的最终隐式评分Rui是个随机变量,其满足均值为方差为的正态分布,其中且F<<N。同时,正态分布因子分解方法假设潜在因子向量P满足均值为0,方差为的正态分布,潜在因子向量Q满足均值为0,方差为的正态分布,并且潜在因子向量P和Q相互独立。
但实际情况下,一个评分系统有些固有属性和用户及视频无关,而用户有些属性也和视频无关,视频属性也与用户无关,因此,本方案提出社交正态分布因子分解方法,在社交正态分布因子分解方法之上加入用户和视频偏置项,消除这些无关属性的影响,具体如下所示:
其中:
μ表示训练集中所有用户-视频评分记录的全局平均值;
bu表示用户偏置项。这一项表示了用户的评分习惯中和视频没有关系的那些因素。比如有些用户比较苛刻,对什么东西都要求比较高,那么他的评分就比较低,而有些用户比较宽容,对什么东西都觉得不错,那么他的评分就会偏高;此处,bu实际上计算的是用户u对它评过的所有视频评分的平均值;其计算方法为:
bi表示视频偏置项,这一项表示了视频接受的评分中和用户没有什么关系的因素。比如有些视频本身的质量就很高,因此获得的评分相对比较高,而有些视频本身质量很差,因此获得的评分相对会比较低。此处,bi实际上计算的是视频i所获得的评分的平均值,其计算结果为
因此,加入偏置项后,Rui满足均值为方差为的正态分布。
另一方面,假设给定用户u与其社交关系潜在因子随机向量Zv后,用户u对用户v的社交信任度Suv是个随机变量,其满足均值为方差为的正态分布,其中且F<<N,Suv∈(0,1],η为全局平均社交信任度。同时,社交正态分布因子分解方法假设社交关系向量Z满足均值为0,方差为的正态分布。
图2给出了6个用户的社交关系有向图,其中有社交关系的用户之间有边相连,边上的数字表示用户与用户之间的信任度Suv。图3显示的是6个用户的社交信任度矩阵。潜在因子向量P、潜在因子向量Q和社交关系潜在因子向量Z相互独立,如图4所示。
综上,社交正态分布因子分解方法的模型假设写成数学形式如下所示:
其中Pif、Quf和Zvf是三个参数,可以通过求极大似然函数求出。其详细推导过程如下:
对公式(11)求自然对数如下所示:
接下来可以计算出SocialBiasPMF的误差损失函数,如公式(13)所示:
其中:||.||F为二范数。为了防止损失函数学习过拟合现象,需要加入惩罚因子项。
要最小化公式(13)的误差损失函数,需要使用随机梯度下降法进行优化,该方法首先通过求参数的偏导数,找到最速下降方向,然后通过迭代法不断地优化参数。接下来将对随机梯度下降法优化损失函数进行详细说明。
公式(13)损失函数有五个参数Quf、Pif、Zvf、bu和bi,最快下降法需要首先对他们分别求偏导数,可以得到:
然后根据随机梯度下降法,需要将参数沿着最快下降方向向前推进,因此可以得到如下递推公式:
其中:
αi:学习率,一般在0.001左右(i=1,2)
F:分类数目
λ:正则化参数,一般在0.01左右
社交正态分布因子分解方法结合用户的社交信息,引入社交信任度矩阵,对最终评分矩阵进行分解,降低了存储的难度。本方案最后需要将降维后的矩阵P、Q代入公式(5),计算最终评分矩阵。
通过上述示例,可以看出基于社交网络的推荐系统,可以更好地将用户潜在的需求转化为实际效益,实现精准推荐。当拥有充足的用户偏好信息和社交信息时,能够大大的提升协同过滤推荐系统的推荐精度和质量,但随着信息量的不断增加,协同过滤也面临着矩阵稀疏性的问题。为了在协同过滤推荐系统中融入用户的社交信息,实现对稀疏矩阵进行分解,本方案提出社交正态分布因子分解方法解决该问题。
另外,在上述特征的基础上,本发明还公开了如下特征:
确定另外的视频与所述视频的相似度;
根据所述相似度建立相似度矩阵。
所述确定另外的视频与所述视频的相似度,具体包括:
获取所述另外的视频的第一视频标签的第一个数;
获取所述视频的第二视频标签的第二个数;
确定所述第一视频标签中与所述第二视频标签中相同的标签的第三个数;
将所述第三个数除以所述第一个数与所述第二个数之和,得到所述相似度。
或者,所述确定另外的视频与所述视频的相似度,具体包括:
获取所述另外的视频的第一视频观看用户的第四个数;
获取所述视频的第二视频观看用户的第五个数;
确定所述第一视频观看用户中与所述第二视频观看用户中相同的观看用户的第六个数;
将所述第六个数除以所述第四个数与所述第五个数之和,得到所述相似度。
具体的,结合示例一,可以通过示例二对上述特征进行说明。
示例二
协同过滤推荐算法中采用的相似度算法有很多种,如余弦相似度算法、皮尔逊相似度算法和欧几里得相似度算法等。优选地,本方案采取皮尔逊相似度算法计算视频-视频之间的相似度,其计算公式如下所示:
在视频推荐系统中,我们还可以利用视频标签信息和用户观看视频历史记录信息来求两个视频之间的属性相似度,改进传统的皮尔逊相似度算法,进一步提升推荐系统的准确度。
协同过滤推荐算法中,可以利用视频标签数据集来求两个视频之间的属性相似度。可以认为如果两个视频具有相同的标签,那么这两个视频之间是具有一定的属性相似度,相同标签越多则它们具有更高的属性相似度。
假定集合A表示vedio1的标签集合,集合B表示vedio2的标签集合,则在推荐系统中两个视频的属性相似度可以用为如下公式(25)表示:
即两个视频的属性相似度可以用两个视频的共同标签个数除以两者标签个数之和。
协同过滤推荐算法中,可以认为如果两个视频具有相同的观看用户,那么这两个视频之间是具有一定的属性相似度,相同观看用户越多它们则具有更高的属性相似度。
假定用集合C表示观看过vedio1的用户,集合D表示观看过vedio2的用户,则利用用户观看视频的历史记录,两个视频属性的相似度可以表示为:
最终,我们可以综合传统的皮尔逊相似度计算出来的视频-视频相似度和根据标签信息及用户收视纪录计算的属性相似度计算视频-视频相似度,改进的视频-视频相似度算法计算公式为:
其中:γ分别表示改进先相似度惩罚系数。
基于上述所有特征,最后可以根据所述最终频分矩阵以及所述相似度矩阵计算推荐结果,对此,可以有多种实现方式,本实施例给出一个具体示例,但不限于该示例,其他可以实现该方案的示例也在本申请保护范围内。
示例三:Top-N推荐实现方法
优选地,可以通过如下公式计算用户u最终的视频推荐得分:
其中:SRu为推荐系统最终计算出来的用户u对每个视频的推荐得分向量,Sim(x,y)为根据视频标签和收看历史信息改进后的视频-视频相似度矩阵,Ru为经过社交正态分布因子分解方法矩阵分解后用户u对每个视频的评分向量,
最终得到的向量SRu可以按照推荐得分从高到低排序,将排在Top-N的视频推荐给用户u,产生Top-N视频推荐列表。优选地,在实际的视频推荐系统中,需要综合考虑各个算法输出的结果和实际情况,并将其重要性按照排序算法给出合理的推荐。
在上述示例三的基础上,本发明还公开了一种Top-N推荐效果评估方法,具体如下:
Top-N推荐指系统最终提供给用户一个推荐列表,一般Top-N推荐度量指标是通过指标PR度量,其中:
其中Precision为准确率,其计算公式为:
Recall指召回率,其计算公式为:
对于算法效果的评估,一般将数据集按照一定的比例分成两个部分——训练集和测试集,其中训练集用来训练出算法模型,获得算法中的系统参数;测试集用来验证该推荐算法的准确性。公式(30)和公式(31)中R(u)指根据用户u在训练集上的行为计算出来的推荐列表,T(u)指用户u在测试集上的行为列表。推荐系统每一次改进算法或者选用新的算法,都需要计算度量指标PR值,将较大PR值对应的算法放入ZEUS分布式调度子系统中。
需要说明的是,ZEUS分布式调度子系统是视频推荐系统的子系统,该子系统能够存储并执行上述实施例中所述的视频推荐算法。
上述部分仅描述了方法,对应上述方法,本申请还公开了一种视频推荐子系统,具体通过以下实施例描述。
请参阅附图5,为本发明公开的一种视频推荐子系统实施例1示意图,该系统具体包括:
获取单元11,用于获取视频的时长、用户观看所述视频的时长以及所述用户最近一次收看所述视频的时刻;
初始评分计算单元12,用于根据所述视频的时长、所述用户观看所述视频的时长计算所述用户对所述视频的初始评分;
标准化评分计算单元13,用于根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分;
最终评分计算单元14,用于根据所述用户最近一次收看所述视频的时刻与当前时刻的差值,计算所述用户对所述视频的最终评分。
所述初始评分计算单元,具体用于:
将所述用户观看所述视频的时长除以所述视频的时长的商,作为所述用户对所述视频的初始评分。
所述最终评分计算单元,具体用于:
根据公式计算所述用户对所述视频的最终评分;
其中,Rui表示所述最终评分,Gui表示所述标准化评分,ζ表示时间差衰减系数,tui表示所述当前时间;t'ui表示所述用户最近一次收看所述视频的时刻。
更优的,多个用户对所述视频的最终评分构成评分矩阵,所述系统还包括:
最终评分矩阵生成单元,具体用于获取所述用户的社交信息;根据所述用户的社交信息获取社交信任度矩阵并建立社交正态分布因子分解算法;根据社交正态分布因子分解方法将维度为第一维度的所述评分矩阵分解为维度为第二维度的第一子矩阵以及维度为第三维度的第二子矩阵,其中,所述第一维度大于所述第二维度并且大于所述第三维度;将所述第一子矩阵与所述第二子矩阵相乘生成最终评分矩阵。
进一步的,上述系统还包括:
相似度矩阵建立单元,具体用于确定另外的视频与所述视频的相似度;根据所述相似度建立相似度矩阵。
所述相似度矩阵建立单元,具体用于:
获取所述另外的视频的第一视频标签的第一个数;
获取所述视频的第二视频标签的第二个数;
确定所述第一视频标签中与所述第二视频标签中相同的标签的第三个数;
将所述第三个数除以所述第一个数与所述第二个数之和,得到所述相似度。
或者,所述相似度矩阵建立单元,具体用于:
获取所述另外的视频的第一视频观看用户的第四个数;
获取所述视频的第二视频观看用户的第五个数;
确定所述第一视频观看用户中与所述第二视频观看用户中相同的观看用户的第六个数;
将所述第六个数除以所述第四个数与所述第五个数之和,得到所述相似度。
更进一步的,上述系统还包括:
推荐结果计算单元,用于根据所述最终评分矩阵以及所述相似度矩阵计算推荐结果。
需要说明的是,上述各个单元的功能实现已在方法实施例部分进行详细说明,具体请参见方法实施例的相关描述,本实施例不再赘述。
基于上述视频推荐子系统,本发明还公开了一种视频推荐系统,具体包括上述实施例中所述的视频推荐子系统。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
综上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照上述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对上述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (13)
1.一种视频推荐方法,其特征在于,所述方法包括:
获取视频的时长、用户观看所述视频的时长以及所述用户最近一次收看所述视频的时刻;
根据所述视频的时长、所述用户观看所述视频的时长计算所述用户对所述视频的初始评分,具体包括:将所述用户观看所述视频的时长除以所述视频的时长的商,作为所述用户对所述视频的初始评分;
根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分;
根据所述用户最近一次收看所述视频的时刻与当前时刻的差值以及所述标准化评分,计算所述用户对所述视频的最终评分;
多个用户对所述视频的最终评分构成评分矩阵,所述方法还包括:
获取所述用户的社交信息;
根据所述用户的社交信息获取社交信任度矩阵并建立社交正态分布因子分解方法,其中,利用极大似然函数求取视频的潜在因子向量P、用户的潜在因子向量Q和社交关系潜在因子向量Z;采用随机梯度下降法对所述视频的潜在因子向量P、用户的潜在因子向量Q和社交关系潜在因子向量Z进行优化;
根据社交正态分布因子分解方法将维度为第一维度的所述评分矩阵分解为维度为第二维度的第一子矩阵以及维度为第三维度的第二子矩阵,其中,所述第一维度大于所述第二维度并且大于所述第三维度;
将所述第一子矩阵与所述第二子矩阵相乘生成最终评分矩阵。
2.根据权利要求1所述的方法,其特征在于,所述计算所述用户对所述视频的最终评分,具体包括:
根据公式计算所述用户对所述视频的最终评分;
其中,Rui表示所述最终评分,Gui表示所述标准化评分,ζ表示时间差衰减系数,tui表示所述当前时间;t'ui表示所述用户最近一次收看所述视频的时刻。
3.根据权利要求2所述的方法,其特征在于,还包括:
确定另外的视频与所述视频的相似度;
根据所述相似度建立相似度矩阵。
4.根据权利要求3所述的方法,其特征在于,还包括:
根据所述最终评分矩阵以及所述相似度矩阵计算推荐结果。
5.根据权利要求3所述的方法,其特征在于,所述确定另外的视频与所述视频的相似度,具体包括:
获取所述另外的视频的第一视频标签的第一个数;
获取所述视频的第二视频标签的第二个数;
确定所述第一视频标签中与所述第二视频标签中相同的标签的第三个数;
将所述第三个数除以所述第一个数与所述第二个数之和,得到所述相似度。
6.根据权利要求3所述的方法,其特征在于,所述确定另外的视频与所述视频的相似度,具体包括:
获取所述另外的视频的第一视频观看用户的第四个数;
获取所述视频的第二视频观看用户的第五个数;
确定所述第一视频观看用户中与所述第二视频观看用户中相同的观看用户的第六个数;
将所述第六个数除以所述第四个数与所述第五个数之和,得到所述相似度。
7.一种视频推荐子系统,其特征在于,所述系统包括:
获取单元,用于获取视频的时长、用户观看所述视频的时长以及所述用户最近一次收看所述视频的时刻;
初始评分计算单元,用于根据所述视频的时长、所述用户观看所述视频的时长计算所述用户对所述视频的初始评分,具体用于:将所述用户观看所述视频的时长除以所述视频的时长的商,作为所述用户对所述视频的初始评分;
标准化评分计算单元,用于根据最小最大标准化的方式对所述初始评分进行标准化,得到所述用户对所述视频的标准化评分;
最终评分计算单元,用于根据所述用户最近一次收看所述视频的时刻与当前时刻的差值以及所述标准化评分,计算所述用户对所述视频的最终评分;
多个用户对所述视频的最终评分构成评分矩阵,所述子系统还包括:
最终评分矩阵生成单元,具体用于获取所述用户的社交信息;根据所述用户的社交信息获取社交信任度矩阵并建立社交正态分布因子分解方法,其中,利用极大似然函数求取视频的潜在因子向量P、用户的潜在因子向量Q和社交关系潜在因子向量Z;采用随机梯度下降法对所述视频的潜在因子向量P、用户的潜在因子向量Q和社交关系潜在因子向量Z进行优化;根据社交正态分布因子分解方法将维度为第一维度的所述评分矩阵分解为维度为第二维度的第一子矩阵以及维度为第三维度的第二子矩阵,其中,所述第一维度大于所述第二维度并且大于所述第三维度;将所述第一子矩阵与所述第二子矩阵相乘生成最终评分矩阵。
8.根据权利要求7所述的子系统,其特征在于,所述最终评分计算单元,具体用于:
根据公式计算所述用户对所述视频的最终评分;
其中,Rui表示所述最终评分,Gui表示所述标准化评分,ζ表示时间差衰减系数,tui表示所述当前时间;t'ui表示所述用户最近一次收看所述视频的时刻。
9.根据权利要求8所述的子系统,其特征在于,还包括:
相似度矩阵建立单元,具体用于确定另外的视频与所述视频的相似度;根据所述相似度建立相似度矩阵。
10.根据权利要求9所述的子系统,其特征在于,还包括:
推荐结果计算单元,用于根据所述最终评分矩阵以及所述相似度矩阵计算推荐结果。
11.根据权利要求9所述的子系统,其特征在于,所述相似度矩阵建立单元,具体用于:
获取所述另外的视频的第一视频标签的第一个数;
获取所述视频的第二视频标签的第二个数;
确定所述第一视频标签中与所述第二视频标签中相同的标签的第三个数;
将所述第三个数除以所述第一个数与所述第二个数之和,得到所述相似度。
12.根据权利要求9所述的子系统,其特征在于,所述相似度矩阵建立单元,具体用于:
获取所述另外的视频的第一视频观看用户的第四个数;
获取所述视频的第二视频观看用户的第五个数;
确定所述第一视频观看用户中与所述第二视频观看用户中相同的观看用户的第六个数;
将所述第六个数除以所述第四个数与所述第五个数之和,得到所述相似度。
13.一种视频推荐系统,其特征在于,包括权利要求7-12任意一项所述的视频推荐子系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410421741.7A CN104156472B (zh) | 2014-08-25 | 2014-08-25 | 一种视频推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410421741.7A CN104156472B (zh) | 2014-08-25 | 2014-08-25 | 一种视频推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104156472A CN104156472A (zh) | 2014-11-19 |
CN104156472B true CN104156472B (zh) | 2018-05-08 |
Family
ID=51881970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410421741.7A Active CN104156472B (zh) | 2014-08-25 | 2014-08-25 | 一种视频推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104156472B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109547814A (zh) * | 2018-12-13 | 2019-03-29 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、服务器及存储介质 |
CN110659389A (zh) * | 2019-09-05 | 2020-01-07 | 北京字节跳动网络技术有限公司 | 排序方法、装置、电子设备和计算机可读存储介质 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106331778B (zh) | 2015-07-06 | 2020-08-14 | 腾讯科技(深圳)有限公司 | 视频推荐方法和装置 |
CN105338408B (zh) * | 2015-12-02 | 2018-11-13 | 南京理工大学 | 基于时间因子的视频推荐方法 |
CN105427050A (zh) * | 2015-12-02 | 2016-03-23 | 常州大学 | 一种基于信任度模型的食品质量评估方法 |
CN105630742B (zh) * | 2015-12-28 | 2019-05-07 | 广州酷狗计算机科技有限公司 | 特征向量计算方法及装置 |
CN105653683B (zh) * | 2015-12-30 | 2020-10-16 | 东软集团股份有限公司 | 一种个性化推荐方法及装置 |
CN106407241A (zh) * | 2016-03-21 | 2017-02-15 | 传线网络科技(上海)有限公司 | 视频推荐方法及系统 |
CN105868372B (zh) * | 2016-03-31 | 2019-11-05 | 广州酷狗计算机科技有限公司 | 标签分配方法及装置 |
CN106777069B (zh) * | 2016-12-12 | 2020-04-17 | 浙江工商大学 | 基于矩阵因子分解的个性化推荐方法及推荐系统 |
CN106951462B (zh) * | 2017-02-27 | 2021-06-25 | 四川大学 | 一种基于Time-Trust相似度的电影推荐方法 |
CN107515909B (zh) * | 2017-08-11 | 2020-05-19 | 深圳市云网拜特科技有限公司 | 一种视频推荐方法及系统 |
CN107832778B (zh) * | 2017-10-13 | 2021-07-13 | 中国舰船研究设计中心 | 一种基于空间综合相似度的相同目标识别方法 |
CN108153863B (zh) * | 2017-12-25 | 2021-12-17 | 北京奇艺世纪科技有限公司 | 一种视频信息的表示方法及装置 |
CN108495150B (zh) * | 2018-01-24 | 2020-09-15 | 北京奇艺世纪科技有限公司 | 一种视频点击满意度的确定方法及装置 |
CN108243357A (zh) * | 2018-01-25 | 2018-07-03 | 北京搜狐新媒体信息技术有限公司 | 一种视频推荐方法及装置 |
CN108614856B (zh) * | 2018-03-21 | 2021-01-05 | 北京奇艺世纪科技有限公司 | 一种视频排序校准方法和装置 |
CN110555157B (zh) * | 2018-03-27 | 2023-04-07 | 阿里巴巴(中国)有限公司 | 内容推荐方法、内容推荐装置和电子设备 |
CN110555135B (zh) * | 2018-03-27 | 2023-04-07 | 阿里巴巴(中国)有限公司 | 内容推荐方法、内容推荐装置和电子设备 |
CN110555131B (zh) * | 2018-03-27 | 2023-04-07 | 阿里巴巴(中国)有限公司 | 内容推荐方法、内容推荐装置和电子设备 |
CN109040795B (zh) * | 2018-07-31 | 2023-12-19 | 周向红 | 一种视频推荐方法及系统 |
CN111294650A (zh) * | 2018-12-10 | 2020-06-16 | 中国移动通信集团福建有限公司 | 视频推荐方法、装置、设备及计算机存储介质 |
CN109640176B (zh) * | 2018-12-18 | 2021-01-22 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109800328B (zh) * | 2019-01-08 | 2021-08-20 | 青岛聚看云科技有限公司 | 视频推荐方法、其装置、信息处理设备及存储介质 |
CN110059256B (zh) * | 2019-04-26 | 2023-11-07 | 北京沃东天骏信息技术有限公司 | 用于展示信息的系统、方法及装置 |
CN110493649B (zh) * | 2019-09-12 | 2021-08-20 | 重庆市群众艺术馆 | 基于群众满意度的文化馆数字资源加工方法 |
CN110825910B (zh) * | 2019-10-15 | 2023-10-13 | 平安科技(深圳)有限公司 | 基于大数据的视频课程推荐方法及相关装置 |
CN110996177B (zh) * | 2019-11-27 | 2022-04-22 | 北京爱奇艺智慧娱乐科技有限公司 | 面向点播影院的视频推荐方法、装置及设备 |
CN113139083A (zh) * | 2020-01-19 | 2021-07-20 | Tcl集团股份有限公司 | 一种视频推荐方法、装置、终端设备及存储介质 |
CN111400615B (zh) * | 2020-03-19 | 2023-03-24 | 腾讯科技(深圳)有限公司 | 一种资源推荐方法、装置、设备及存储介质 |
CN112468852B (zh) * | 2020-11-24 | 2022-10-14 | 深圳市易平方网络科技有限公司 | 媒资推荐方法、装置、系统及计算机可读存储介质 |
CN114758483B (zh) * | 2022-04-14 | 2023-03-21 | 江苏国电南自海吉科技有限公司 | 一种基于余弦相似性的电力设备动态智能预警方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102957950A (zh) * | 2012-07-23 | 2013-03-06 | 华东师范大学 | 一种用于视频推荐的用户隐式评分方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8063295B2 (en) * | 2002-10-03 | 2011-11-22 | Polyphonic Human Media Interface, S.L. | Method and system for video and film recommendation |
CN101320370B (zh) * | 2008-05-16 | 2011-06-01 | 苏州普达新信息技术有限公司 | 基于查询接口连接图的深层网页数据源分类管理方法 |
US20110320380A1 (en) * | 2010-06-23 | 2011-12-29 | Microsoft Corporation | Video content recommendations |
CN102263992A (zh) * | 2011-08-08 | 2011-11-30 | 上海文广互动电视有限公司 | 基于用户收视记录的节目推荐度估计方法 |
CN103020161B (zh) * | 2012-11-26 | 2015-12-09 | 北京奇虎科技有限公司 | 在线视频推荐方法和推荐系统及处理系统 |
CN103399858B (zh) * | 2013-07-01 | 2016-08-10 | 吉林大学 | 基于信任的社会化协同过滤推荐方法 |
CN103888852B (zh) * | 2014-03-24 | 2017-05-31 | 清华大学 | 用于社交电视的视频推荐方法和装置 |
CN103886487B (zh) * | 2014-03-28 | 2016-01-27 | 焦点科技股份有限公司 | 基于分布式的b2b平台的个性化推荐方法与系统 |
-
2014
- 2014-08-25 CN CN201410421741.7A patent/CN104156472B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102957950A (zh) * | 2012-07-23 | 2013-03-06 | 华东师范大学 | 一种用于视频推荐的用户隐式评分方法 |
Non-Patent Citations (2)
Title |
---|
"基于Hadoop 平台协同过滤推荐算法";杨志文 等;《计算机系统应用》;20131231;第22卷(第7期);第425-426页 * |
"融合信任传播和矩阵分解的协同推荐算法";于洪涛 等;《燕山大学学报》;20130931;第35卷(第5期);第2.1、2.2、4.2部分 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109547814A (zh) * | 2018-12-13 | 2019-03-29 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、服务器及存储介质 |
CN109547814B (zh) * | 2018-12-13 | 2021-07-16 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、服务器及存储介质 |
CN110659389A (zh) * | 2019-09-05 | 2020-01-07 | 北京字节跳动网络技术有限公司 | 排序方法、装置、电子设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104156472A (zh) | 2014-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104156472B (zh) | 一种视频推荐方法及系统 | |
US9348898B2 (en) | Recommendation system with dual collaborative filter usage matrix | |
Remmer | The rise of Leftist–Populist Governance in Latin America: the roots of electoral change | |
Goeree et al. | A model of noisy introspection | |
US20090287687A1 (en) | System and method for recommending venues and events of interest to a user | |
Selke et al. | Pushing the boundaries of crowd-enabled databases with query-driven schema expansion | |
CN110413888B (zh) | 一种书籍推荐方法及装置 | |
CN106503028A (zh) | 推荐方法和系统 | |
Rimmer | Listening to the monkey: Class, youth and the formation of a musical habitus | |
CN106126549A (zh) | 一种基于概率矩阵分解的社区信任推荐方法及其系统 | |
CN103678518A (zh) | 一种推荐列表调整方法和装置 | |
CN106874355A (zh) | 同时融入社交关系和用户相似度的协同过滤方法 | |
CN108260008A (zh) | 一种视频推荐方法、装置及电子设备 | |
CN106886559A (zh) | 同时融入好友特征和相似用户特征的协同过滤方法 | |
CN110083764A (zh) | 一种协同过滤算法冷启动问题的解决方法 | |
CN108648058A (zh) | 产品排序方法及装置,电子设备、存储介质 | |
Li et al. | A distance model of intuitionistic fuzzy cross entropy to solve preference problem on alternatives | |
Max Wei | The similarity network of motion pictures | |
CN111143704A (zh) | 一种融合用户影响关系的在线社区好友推荐方法及系统 | |
US20160086086A1 (en) | Multi-media content-recommender system that learns how to elicit user preferences | |
CN109190040A (zh) | 基于协同演化的个性化推荐方法及装置 | |
CN107665202B (zh) | 一种构建兴趣模型的方法、装置及电子设备 | |
KR20140080773A (ko) | 다중 의사 결정 문제 해결을 위한 구간 회색수 및 엔트로피 기반 해법 연산 방법 | |
CN118134630A (zh) | 信用风险等级评估方法、装置及电子设备 | |
CN104462597B (zh) | 一种综合用户正负性评分和评分偏好因子的协同过滤方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20160105 Address after: 100085, No. 3, No. 002, Section 1, building No. 3, 3rd floor, information industry base, Beijing, Haidian District Applicant after: Star Software Technology Co.,Ltd. Address before: 100085, No. three, No. 305, Section 1, building No. 3, 3rd floor, information industry base, Beijing, Haidian District Applicant before: STAR TIMES COMMUNICATION NETWORK TECHNOLOGY CO., LTD. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |