CN109729395B - 视频质量评估方法、装置、存储介质和计算机设备 - Google Patents
视频质量评估方法、装置、存储介质和计算机设备 Download PDFInfo
- Publication number
- CN109729395B CN109729395B CN201811533825.4A CN201811533825A CN109729395B CN 109729395 B CN109729395 B CN 109729395B CN 201811533825 A CN201811533825 A CN 201811533825A CN 109729395 B CN109729395 B CN 109729395B
- Authority
- CN
- China
- Prior art keywords
- video
- user
- behavior data
- preference
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 17
- 238000001303 quality assessment method Methods 0.000 claims description 23
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 218
- 230000015654 memory Effects 0.000 description 14
- 238000013398 bayesian method Methods 0.000 description 6
- 230000007547 defect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000005291 magnetic effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011451 sequencing strategy Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008092 positive effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
本申请提供一种视频质量评估方法、装置、存储介质和计算机设备,所述的方法包括:获取各个用户对待评估的视频的行为数据,以及各个用户的偏好标签;检测各个用户的偏好标签与所述待评估的视频的标签是否存在交集;若存在交集,将用户的行为数据判定为有效行为数据;根据筛选出的有效行为数据,计算所述待评估的视频的质量分数。本申请实施例能够得到更稳定的视频质量分数,从而有效挖掘出真正的优质视频。
Description
技术领域
本申请涉及视频处理技术领域,具体而言,本申请涉及一种视频质量评估方法、装置、存储介质和计算机设备。
背景技术
视频推荐系统是在大数据分析和人工智能技术的基础上,通过研究用户的行为数据,进行个性化计算,从而给用户提供高质量的视频内容,解决信息过载的问题。以短视频推荐系统为例,短视频推荐系统中短视频的更新速度非常快,快速有效的评估视频质量在视频召回和排序推荐中起到关键作用。
传统的视频质量评估方法基于用户播放、点赞、分享、评论、曝光等行为数据得到视频的全局质量分,在视频召回和精品库建设中取得不错的效果。但是该种方法得到的视频质量分数不稳定,优质视频的质量分数会随着曝光的增加趋于变小,因此无法有效挖掘出真正的优质视频。
发明内容
本申请针对现有方式的缺点,提出一种视频质量评估方法、装置、存储介质和计算机设备,以得到更稳定的视频质量分数,从而有效挖掘出真正的优质视频。
本申请的实施例根据第一个方面,提供了一种视频质量评估方法,包括:
获取各个用户对待评估的视频的行为数据,以及各个用户的偏好标签;
检测各个用户的偏好标签与所述待评估的视频的标签是否存在交集;
若存在交集,将用户的行为数据判定为有效行为数据;
根据筛选出的有效行为数据,计算所述待评估的视频的质量分数。
在一个实施例中,所述根据筛选出的有效行为数据,计算所述待评估的视频的质量分数,之后,还包括:
获取目标用户的偏好标签以及所述目标用户对偏好标签的偏好度;
从各个视频的标签中筛选出与所述目标用户的偏好标签匹配的标签;
根据筛选出的标签下的各个视频的质量分数以及所述目标用户对偏好标签的偏好度,获得待推荐的视频;
将所述待推荐的视频推荐给所述目标用户。
在一个实施例中,所述根据筛选出的标签下的各个视频的质量分数以及所述目标用户对偏好标签的偏好度,获得待推荐的视频,之前,还包括:
按照质量分数对每个标签下的各个视频分别进行排序,分别保留质量分数最高的预设数目的视频作为每个标签下的各个视频。
在一个实施例中,所述用户的偏好标签通过以下方式获取:
根据用户对各个视频的历史行为数据,获得用户对应的各个视频的标签以及对各个视频的标签的偏好度;
按照用户对各个视频的标签的偏好度,对用户对应的各个视频的标签进行排序,获取偏好度最高的设定数目的标签作为用户的偏好标签。
在一个实施例中,所述历史行为数据包括正向行为数据和负向行为数据;
用户对各个视频的标签的偏好度通过以下方式获得:
从各个视频的标签中选取一个标签;
获取用户对选取的标签的正向行为数据和负向行为数据;
根据预设的正向行为数据对应的权重以及负向行为数据对应的权重,分别获得正向行为分数以及负向行为分数;
根据所述正向行为分数和所述负向行为分数,获得用户对选取的标签的偏好度;
从各个视频的标签中选取另一个标签,返回获取用户对选取的标签的正向行为数据和负向行为数据的步骤,直至所有的标签均被选取。
在一个实施例中,所述用户对选取的标签的偏好度通过以下方式获得:
其中,i表示选取的第i个标签,w(i)表示用户对第i个标签的偏好度,j表示用户对第i个标签的第j个正向行为,pos表示正向行为分数,k表示用户对第i个标签的第k个负向行为,neg表示负向行为分数,decay表示预设的时间衰减系数,a和b表示先验平滑项。
在一个实施例中,所述有效行为数据包括正向有效行为数据和负向有效行为数据;
所述根据筛选出的有效行为数据,计算所述待评估的视频的质量分数,包括:
根据预设的正向有效行为数据对应的权重以及负向有效行为数据对应的权重,分别获得正向有效行为分数以及负向有效行为分数;
根据所述正向有效行为分数和所述负向有效行为分数,获得待评估的视频的质量分数。
本申请的实施例根据第二个方面,还提供了一种视频质量评估装置,包括:
数据获取模块,用于获取各个用户对待评估的视频的行为数据,以及各个用户的偏好标签;
检测模块,用于检测各个用户的偏好标签与所述待评估的视频的标签是否存在交集;
有效行为数据筛选模块,用于在存在交集时,将用户的行为数据判定为有效行为数据;
质量评估模块,用于根据筛选出的有效行为数据,计算所述待评估的视频的质量分数。
本申请的实施例根据第三个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的视频质量评估方法。
本申请的实施例根据第四个方面,还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的视频质量评估方法。
上述的视频质量评估方法、装置、存储介质和计算机设备,通过视频的标签和用户的偏好标签对用户的行为数据进行筛选,获得对视频的标签有偏好的用户的行为数据(即有效行为数据),仅根据对视频的标签有偏好的用户的行为数据计算视频的质量分数,相较于传统技术中根据用户的所有行为数据计算视频的质量分数的方式,本申请降低了排序策略的影响,能够得到更稳定的视频质量分数,进而根据得到的视频质量分数有效挖掘出真正的优质视频。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一个实施例的视频质量评估方法的流程示意图;
图2为本申请一个实施例的用户的偏好标签获取方法的流程示意图;
图3为本申请一个实施例的用户对各个视频的标签的偏好度获得方法的流程示意图;
图4为本申请一个实施例的视频的质量分数计算方法的流程示意图;
图5为本申请另一个实施例的视频质量评估方法的流程示意图;
图6为本申请一个实施例的视频质量评估装置的结构示意图;
图7为本申请一个实施例的计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
有必要先对本申请的应用场景及其实现原理进行如下的先导性说明。
应用场景:
本申请为一个独立的召回方案,可以应用到大部分视频推荐系统中。例如将本申请的方案应用在短视频应用中,可以挖掘出真正的优质短视频,促进用户画像建设及视频精品库建设,提高用户的留存率。
实现原理:
用户的播放、点赞、分享、评论等行为数据能够反映视频质量,传统技术中评估视频质量的方法是基于用户行为数据的全局贝叶斯方法,即对不同行为给予不同权重并根据时间进行衰减,然后将正向行为分数和负向行为分数相比得到视频质量分数。另外,实际应用中为了防止行为数据过少导致统计不准的问题,正向行为分数和负向行为分数还需要各自增加一个先验分数作为平滑项。
但是,本申请的申请人经过研究发现,传统技术中通过全局贝叶斯方法计算视频质量分数的方法存在以下两个缺陷:一、全局贝叶斯方法把所有对该视频的行为数据都包含进去,这样得到的分数受实际排序策略影响较大,如果恰好把该视频曝光给喜欢该类型视频的用户,那么计算得到的视频质量分数偏高,相反,如果将该视频曝光给不喜欢该类型视频的用户,那么得到的视频质量分数偏低,因此,全局贝叶斯方法在实际应用中往往比较波动,高质量的视频在推荐初期分数较高,随着推荐的进行,曝光的人数越来越多,增加了曝光给不喜欢该类型用户的概率,质量分数变低,因此得到的质量分数不稳定;二、全局贝叶斯方法在进行视频推荐时采用的是单独排序方案,存在视频推荐品类单一和召回与用户兴趣无关视频的风险。
因此,针对上述两种缺陷,本申请从两个大的方面对全局贝叶斯方法进行改进:第一个改进是在进行视频质量分数计算的时候,考虑了用户画像信息,利用视频的标签和用户画像信息,只计算对该标签有偏好的用户的行为数据,从而降低排序策略的影响,生成分数更稳定的视频质量分数,通过该种方式,一方面保留了全局质量分数召回精品视频的优点,另一方面可以挖掘出潜在的用户喜欢的局部优质视频,促进了用户画像建设及视频精品库建设;第二个改进是利用视频标签信息,不同标签各自保存一个独立排序序列,与贝叶斯方法全局排序不同,它的好处是在召回策略中同时考虑了质量分数和用户对标签的偏好度,相对于全局贝叶斯方法单独排序的缺陷,该方式的优点是在实际推荐中可以展现更多样的视频,方便排序算法进行个性化推荐,即确保推荐的视频是与用户兴趣有关的视频。
为了更好的理解本申请,下面对本申请的具体实施方式进行详细描述。
如图1所示,在一个实施例中,一种视频质量评估方法,包括:
S11、获取各个用户对待评估的视频的行为数据,以及各个用户的偏好标签。
待评估的视频可以是短视频、长视频等等。行为数据指的是用户对视频产生行为所生成的数据,例如,一个用户对一个视频进行播放操作,就会产生一个播放的行为数据,又例如,一个用户通过搜索将某一个视频进行曝光,就会产生一个曝光的行为数据。
可选的,行为数据可划分为正向行为数据和负向行为数据。正向行为数据指的是视频曝光且用户对该视频进行进一步的行为,例如,正向行为数据包括播放、点击、评论、分享、点赞等行为数据。负向行为数据指的是视频仅曝光,用户针对该视频没有进行进一步的行为,负向行为数据里面的曝光一般指的是有效曝光。搜索视频时在搜索页面中所有的视频全部被记录曝光一次,那些在页面中显示出来的视频的曝光指的即是有效曝光,那些在页面中没有显示出来的视频的曝光指的是无效曝光。
偏好标签指的是用户感兴趣的视频的标签。例如,用户感兴趣的视频的标签为A、B和C,则该用户的偏好标签包括A、B和C。可选的,一个用户的偏好标签可以采用向量等方式进行存储。
在需要计算一个视频的质量分数时,获取对该视频产生行为的各个用户的行为数据,以及对该视频产生行为的各个用户的偏好标签。
S12、检测各个用户的偏好标签与所述待评估的视频的标签是否存在交集。
交集指的是用户的偏好标签和待评估的视频的标签存在相同的标签,相同的标签的个数可以是一个,也可以是多个。为了得到更为稳定的视频质量分数,需要对用户的行为数据进行筛选,只计算对视频的标签有偏好的用户的行为数据,因此,需要先检测用户的偏好标签和待评估的标签是否存在交集。
可选的,如果视频的标签是用0或者1值表示的权重,即可以明确确定该视频的标签属于何种类型,例如,一个视频的标签标注为动物,则可以将该视频的标签直接与各个用户的偏好标签进行匹配,检测是否存在交集;如果视频的标签是有概率表示的权重,即无法明确确定该视频的标签属于何种类型,例如某个视频的标签标注为(少年概率是0.8,青年的概率是0.2),则可以按概率排序后取概率最大的前k个标签作为视频的有效标签,再检测是否存在交集。
S13、若存在交集,将用户的行为数据判定为有效行为数据。
当用户u的偏好标签与视频v的标签有交集时,用户u对视频v的行为称作有效行为,相应的数据为有效行为数据,该有效行为数据被保留用于后续的计算。如果一个行为对a(u,v)是有效行为,u称为v的有效行为用户,v称为u的有效视频。当用户u的偏好标签与视频v的标签没有交集时,用户u对视频v的行为称作无效行为,相应的数据为无效行为数据,该无效行为数据被过滤。
S14、根据筛选出的有效行为数据,计算所述待评估的视频的质量分数。
视频的质量分数用于衡量视频质量的优劣程度,质量分数越高,则对应的视频越优质,推荐给用户的可能性也就越高,反之,质量分数越低,则对应的视频越低劣,推荐给用户的可能性也就越低。从对待评估的视频产生行为的所有用户的行为数据中筛选出有效行为数据之后,仅根据筛选出的有效行为数据计算该视频的质量分数。
上述实施例仅根据对视频的标签有偏好的用户的行为数据计算视频的质量分数,相较于传统技术中根据用户的所有行为数据计算视频的质量分数的方式,降低了排序策略的影响,可以客观的刻画视频质量,得到更稳定的视频质量分数,进而根据得到的视频质量分数能够挖掘用户喜欢的局部优质视频,促进用户画像和精品库建设。
如图2所示,在一个实施例中,用户的偏好标签通过以下方式获取:
S111、根据用户对各个视频的历史行为数据,获得用户对应的各个视频的标签以及对各个视频的标签的偏好度。
本实施例根据用户的历史行为数据从标签维度计算用户画像。当计算一个用户的偏好标签时,获取用户对多个视频的历史行为数据。历史行为数据指的是该用户对多个视频产生行为所生成的数据。例如,该用户对视频A进行了点赞,则该用户对视频A产生了点赞的历史行为数据,该用户对视频B进行评论,则该用户对视频B产生了评论的历史行为数据,该用户对视频C进行了有效曝光,则该用户对视频C产生了曝光的历史行为数据,则用户的历史行为数据包括:对视频A点赞的历史行为数据、对视频B评论的历史行为数据以及对视频C曝光的历史行为数据。
用户对哪些视频产生了历史行为数据,则用户对应的视频的标签就为这些视频的标签。以上述视频A、视频B和视频C为例,用户对应的各个视频的标签为视频A的标签、视频B的标签和视频C的标签。用户对标签的偏好度用于表征用户对该标签的感兴趣程度。可选的,用户对应的各个标签以及对各个标签的偏好度可以以向量的形式表示,如{(t1,w1),(t2,w2),...,(ti,wi),...,(tn,wn)},其中t表示标签,w是该用户对相应标签的偏好度。
如图3所示,在一个实施例中,所述历史行为数据包括正向行为数据和负向行为数据,正向行为数据和负向行为数据的概念如上所述;用户对各个视频的标签的偏好度通过以下方式获得:
S111a、从各个视频的标签中选取一个标签。
选取标签的方式有很多种,例如,从各个标签中随机选取一个标签,或者按照设置的选取规则从各个标签中选取一个标签。
S111b、获取用户对选取的标签的正向行为数据和负向行为数据。
用户对该标签下的各个视频产生过哪些行为数据,统称为用户对该标签的行为数据,将收集的所有行为数据划分为正向行为数据和负向行为数据。
S111c、根据预设的正向行为数据对应的权重以及负向行为数据对应的权重,分别获得正向行为分数以及负向行为分数。
预先对不同的行为给予不同的权重。例如,正向行为数据对应一个权重,负向行为数据对应一个权重,进一步的,还可以对正向行为数据和/负向行为数据中不同的行为分别设置不同的权重,以正向行为数据包括点赞、分享和评论的行为数据为例,将点赞的行为数据设置为权重A,将分享的行为数据设置为权重B,将评论的行为数据设置为权重C。可以直接以权重表征对应的行为分数,例如,一个正向行为数据的权重为3,则该正向行为分数为3。
S111d、根据所述正向行为分数和所述负向行为分数,获得用户对选取的标签的偏好度。
根据正向行为分数和负向行为分数计算用户对该标签的偏好度。为了更为准确地表征用户对一个标签的感兴趣程度,在一个实施例中,所述用户对选取的标签的偏好度通过以下方式获得:
其中,i表示选取的第i个标签,w(i)表示用户对第i个标签的偏好度,j表示用户对第i个标签的第j个正向行为,pos表示正向行为分数,k表示用户对第i个标签的第k个负向行为,neg表示负向行为分数,decay表示预设的时间衰减系数,a和b表示先验平滑项,∑(posj*decayj)表示分别计算第j个正向行为的正向行为分数与对应的时间衰减系数的乘积,然后将得到的所有乘积相加,1≤j≤用户对该标签的总的正向行为个数,∑(negk*decayk)表示分别计算第k个负向行为的负向行为分数与对应的时间衰减系数的乘积,然后将得到的所有乘积相加,1≤k≤用户对该标签的总的负向行为个数。
需要说明的是,本申请并不限制于上述计算偏好度的方式,例如还可以将上述公式中的a和b删除,采用修正后的公式计算对标签的偏好度。
S111e、从各个视频的标签中选取另一个标签,返回获取用户对选取的标签的正向行为数据和负向行为数据的步骤,直至所有的标签均被选取。
计算出用户对选取的标签的偏好度之后,从各个标签中选取另一个标签,按照上述的步骤进行偏好度的计算,直至计算出该用户对对应的所有标签的偏好度。
S112、按照用户对各个视频的标签的偏好度,对用户对应的各个视频的标签进行排序,获取偏好度最高的设定数目的标签作为用户的偏好标签。
按用户对标签的偏好度w排序,取偏好度最高的前k个标签作为用户的偏好标签。还可以将偏好度w大于设定值的标签作为用户的偏好标签。
对每一个用户均执行上述操作,计算出各个用户的偏好标签,以用于后续视频质量分数的计算。
由于本申请只根据有效行为数据计算视频的质量分数,因此,如图4所示,在一个实施例中,所述有效行为数据包括正向有效行为数据和负向有效行为数据;所述根据筛选出的有效行为数据,计算所述待评估的视频的质量分数,包括:
S141、根据预设的正向有效行为数据对应的权重以及负向有效行为数据对应的权重,分别获得正向有效行为分数以及负向有效行为分数。
正向有效行为数据指的是筛选出来的有效行为数据中的那些点赞、分享等等产生实际行为的数据,负向有效行为数据指的是筛选出来的有效行为数据中的有效曝光的数据。一个正向行为数据为正向有效行为数据,预先为该正向行为数据设置的权重即为该正向有效行为数据的权重,一个负向行为数据为负向有效行为数据,预先为该负向行为数据设置的权重即为该负向有效行为的权重。可以直接以权重表征对应的行为分数,例如,一个正向有效行为数据的权重为3,则该正向有效行为分数为3。
S142、根据所述正向有效行为分数和所述负向有效行为分数,获得待评估的视频的质量分数。
根据正向有效行为分数和负向有效行为分数计算视频的质量分数。在一个实施例中,对于每一个视频v,通过下述公式计算视频的质量分数:
其中,v表示第v个视频,w(v)表示第v个视频的质量分数,l表示对第v个视频的第l个正向有效行为,pos表示正向有效行为分数,m表示对第v个视频的第m个负向有效行为,neg表示负向有效行为分数,decay表示预设的时间衰减系数,a和b表示先验平滑项,∑(posl*decayl)表示分别计算第l个正向有效行为的正向有效行为分数与对应的时间衰减系数的乘积,然后将得到的所有乘积相加,1≤l≤总的正向有效行为个数,∑(negm*decaym表示分别计算第m个负向有效行为的负向有效行为分数与对应的时间衰减系数的乘积,然后将得到的所有乘积相加,1≤m≤总的负向有效行为个数。
需要说明的是,本申请并不限制于上述计算视频的质量分数的方式,例如还可以将上述公式中的a和b删除,采用修正后的公式计算视频的质量分数。
传统技术中的视频推荐方式存在推荐视频品类单一和召回与用户兴趣无关视频的风险,因此,针对该缺陷,如图5所示,在一个实施例中,所述根据筛选出的有效行为数据,计算所述待评估的视频的质量分数,之后,还包括:
S15、获取目标用户的偏好标签以及所述目标用户对偏好标签的偏好度。
需要向目标用户推荐视频时,获取该目标用户的偏好标签以及对偏好标签的偏好度,例如,目标用户的偏好标签和偏好度为{(t1,w1),(t2,w2),(t3,w3)},其中,t表示偏好标签,w是该用户对相应偏好标签的偏好度。
S16、从各个视频的标签中筛选出与所述目标用户的偏好标签匹配的标签。
将各个视频的标签与目标用户的偏好标签匹配,筛选出相应的标签,例如,筛选出的标签为m1(与t1匹配),m2(与t2匹配),m3(与t3匹配)。
S17、根据筛选出的标签下的各个视频的质量分数以及所述目标用户对偏好标签的偏好度,获得待推荐的视频。
每一个视频的标签下包括多个视频。为了更为准确地挖掘出优质视频,在一个实施例中,所述根据筛选出的标签下的各个视频的质量分数以及所述目标用户对偏好标签的偏好度,获得待推荐的视频,之前,还包括:按照质量分数对每个标签下的各个视频分别进行排序,分别保留质量分数最高的预设数目的视频作为每个标签下的各个视频。每个标签基于质量分数对包含的各个视频进行独立排序,取质量分数最高的前K个视频作为该标签下的优质视频。
根据匹配的标签下各个视频的质量分数以及目标用户的偏好度,筛选出待推荐的视频。具体实现时,可以将一个偏好标签的偏好度与该偏好标签(匹配的标签)下的各个视频的质量分数相乘,将另一个偏好标签的偏好度与该偏好标签下的各个视频的质量分数相乘,……,通过该种方式得到所有的乘积,然后将乘积最高的M个视频作为待推荐的视频,或者,可以将一个偏好标签的偏好度与该偏好标签下的各个视频的质量分数相加,将另一个偏好标签的偏好度与该偏好标签下的各个视频的质量分数相加,……,通过该种方式得到所有的和,然后将和最高的M个视频作为待推荐的视频。应当理解的是,本申请并不限制于上述两种方式,只要综合考虑偏好度和质量分数确定待推荐的视频的构思均在本申请的保护范围之内。
为了很好的理解该过程,结合一个例子进行说明。假设,目标用户的偏好标签和偏好度为{(t1,w1),(t2,w2)},筛选出的标签为m1、m2,m1的视频包括v1(质量分数为s1)、v2(质量分数为s2),m2的视频包括v3(质量分数为s3)、v4(质量分数为s4),则计算:w1*s1、w1*s2、w2*s3和w2*s4,对乘积进行排序,假设w1*s2分数最高,则将v2确定为待推荐的视频。
S18、将所述待推荐的视频推荐给所述目标用户。
本实施例由于在召回策略中同时考虑了质量分数和用户对标签的偏好度,因此相对全局贝叶斯方法单独排序方式,本申请的优点是在实际推荐中可以展现更多样的视频,方便排序算法进行个性化推荐。
基于同一发明构思,本申请还提供一种视频质量评估装置,下面结合附图对本申请装置的具体实施方式进行详细介绍。
如图6所示,在一个实施例中,一种视频质量评估装置,包括:
数据获取模块21,用于获取各个用户对待评估的视频的行为数据,以及各个用户的偏好标签;
检测模块22,用于检测各个用户的偏好标签与所述待评估的视频的标签是否存在交集;
有效行为数据筛选模块23,用于在存在交集时,将用户的行为数据判定为有效行为数据;
质量评估模块24,用于根据筛选出的有效行为数据,计算所述待评估的视频的质量分数。
在一个实施例中,所述装置还包括与质量评估模块24相连的视频推荐模块,所述视频推荐模块包括:
偏好标签及偏好度获取单元,用于获取目标用户的偏好标签以及所述目标用户对偏好标签的偏好度;
匹配单元,用于从各个视频的标签中筛选出与所述目标用户的偏好标签匹配的标签;
视频确定单元,用于根据筛选出的标签下的各个视频的质量分数以及所述目标用户对偏好标签的偏好度,获得待推荐的视频;
视频推送单元,用于将所述待推荐的视频推荐给所述目标用户。
在一个实施例中,视频确定单元在根据筛选出的标签下的各个视频的质量分数以及所述目标用户对偏好标签的偏好度,获得待推荐的视频,之前,还用于按照质量分数对每个标签下的各个视频分别进行排序,分别保留质量分数最高的预设数目的视频作为每个标签下的各个视频。
在一个实施例中,用户的偏好标签通过以下方式获取:
根据用户对各个视频的历史行为数据,获得用户对应的各个视频的标签以及对各个视频的标签的偏好度;
按照用户对各个视频的标签的偏好度,对用户对应的各个视频的标签进行排序,获取偏好度最高的设定数目的标签作为用户的偏好标签。
在一个实施例中,所述历史行为数据包括正向行为数据和负向行为数据;
用户对各个视频的标签的偏好度通过以下方式获得:
从各个视频的标签中选取一个标签;
获取用户对选取的标签的正向行为数据和负向行为数据;
根据预设的正向行为数据对应的权重以及负向行为数据对应的权重,分别获得正向行为分数以及负向行为分数;
根据所述正向行为分数和所述负向行为分数,获得用户对选取的标签的偏好度;
从各个视频的标签中选取另一个标签,返回获取用户对选取的标签的正向行为数据和负向行为数据的步骤,直至所有的标签均被选取。
在一个实施例中,所述用户对选取的标签的偏好度通过以下方式获得:
其中,i表示选取的第i个标签,w(i)表示用户对第i个标签的偏好度,j表示用户对第i个标签的第j个正向行为,pos表示正向行为分数,k表示用户对第i个标签的第k个负向行为,neg表示负向行为分数,decay表示预设的时间衰减系数,a和b表示先验平滑项。
在一个实施例中,所述有效行为数据包括正向有效行为数据和负向有效行为数据;质量评估模块24用于根据预设的正向有效行为数据对应的权重以及负向有效行为数据对应的权重,分别获得正向有效行为分数以及负向有效行为分数;根据所述正向有效行为分数和所述负向有效行为分数,获得待评估的视频的质量分数。
上述视频质量评估装置的其它技术特征与上述视频质量评估方法的技术特征相同,在此不予赘述。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一项所述的视频质量评估方法。其中,所述存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random AcceSS Memory,随即存储器)、EPROM(EraSable ProgrammableRead-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically EraSableProgrammable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。可以是只读存储器,磁盘或光盘等。
本申请实施例还提供一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任意一项所述的视频质量评估方法。
图7为本申请计算机设备的结构示意图,包括处理器32、存储装置33、输入单元34以及显示单元35等器件。本领域技术人员可以理解,图7示出的结构器件并不构成对所有计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件。存储装置33可用于存储应用程序31以及各功能模块,处理器32运行存储在存储装置33的应用程序31,从而执行设备的各种功能应用以及数据处理。存储装置33可以是内存储器或外存储器,或者包括内存储器和外存储器两者。内存储器可以包括只读存储器、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)、快闪存储器、或者随机存储器。外存储器可以包括硬盘、软盘、ZIP盘、U盘、磁带等。本申请所公开的存储装置包括但不限于这些类型的存储装置。本申请所公开的存储装置33只作为例子而非作为限定。
输入单元34用于接收信号的输入,以及接收各个用户对待评估的视频的行为数据,以及各个用户的偏好标签。输入单元34可包括触控面板以及其它输入设备。触控面板可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程序驱动相应的连接装置;其它输入设备可以包括但不限于物理键盘、功能键(比如播放控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元35可用于显示用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元35可采用液晶显示器、有机发光二极管等形式。处理器32是计算机设备的控制中心,利用各种接口和线路连接整个电脑的各个部分,通过运行或执行存储在存储装置33内的软件程序和/或模块,以及调用存储在存储装置内的数据,执行各种功能和处理数据。
在一实施方式中,计算机设备包括一个或多个处理器32,以及一个或多个存储装置33,一个或多个应用程序31,其中所述一个或多个应用程序31被存储在存储装置33中并被配置为由所述一个或多个处理器32执行,所述一个或多个应用程序31配置用于执行以上实施例所述的视频质量评估方法。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
应该理解的是,在本申请各实施例中的各功能单元可集成在一个处理模块中,也可以各个单元单独物理存在,也可以两个或两个以上单元集成于一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (9)
1.一种视频质量评估方法,其特征在于,包括:
获取各个用户对待评估的视频的行为数据,以及各个用户的偏好标签;
检测各个用户的偏好标签与所述待评估的视频的标签是否存在交集;
若存在交集,将用户的行为数据判定为有效行为数据,所述有效行为数据包括正向有效行为数据和负向有效行为数据;
根据筛选出的有效行为数据,计算所述待评估的视频的质量分数,包括:根据预设的正向有效行为数据对应的权重以及负向有效行为数据对应的权重,分别获得正向有效行为分数以及负向有效行为分数,根据所述正向有效行为分数和所述负向有效行为分数,获得待评估的视频的质量分数。
2.根据权利要求1所述的视频质量评估方法,其特征在于,所述根据筛选出的有效行为数据,计算所述待评估的视频的质量分数,之后,还包括:
获取目标用户的偏好标签以及所述目标用户对偏好标签的偏好度;
从各个视频的标签中筛选出与所述目标用户的偏好标签匹配的标签;
根据筛选出的标签下的各个视频的质量分数以及所述目标用户对偏好标签的偏好度,获得待推荐的视频;
将所述待推荐的视频推荐给所述目标用户。
3.根据权利要求2所述的视频质量评估方法,其特征在于,所述根据筛选出的标签下的各个视频的质量分数以及所述目标用户对偏好标签的偏好度,获得待推荐的视频,之前,还包括:
按照质量分数对每个标签下的各个视频分别进行排序,分别保留质量分数最高的预设数目的视频作为每个标签下的各个视频。
4.根据权利要求1所述的视频质量评估方法,其特征在于,所述用户的偏好标签通过以下方式获取:
根据用户对各个视频的历史行为数据,获得用户对应的各个视频的标签以及对各个视频的标签的偏好度;
按照用户对各个视频的标签的偏好度,对用户对应的各个视频的标签进行排序,获取偏好度最高的设定数目的标签作为用户的偏好标签。
5.根据权利要求4所述的视频质量评估方法,其特征在于,所述历史行为数据包括正向行为数据和负向行为数据;
用户对各个视频的标签的偏好度通过以下方式获得:
从各个视频的标签中选取一个标签;
获取用户对选取的标签的正向行为数据和负向行为数据;
根据预设的正向行为数据对应的权重以及负向行为数据对应的权重,分别获得正向行为分数以及负向行为分数;
根据所述正向行为分数和所述负向行为分数,获得用户对选取的标签的偏好度;
从各个视频的标签中选取另一个标签,返回获取用户对选取的标签的正向行为数据和负向行为数据的步骤,直至所有的标签均被选取。
7.一种视频质量评估装置,其特征在于,包括:
数据获取模块,用于获取各个用户对待评估的视频的行为数据,以及各个用户的偏好标签;
检测模块,用于检测各个用户的偏好标签与所述待评估的视频的标签是否存在交集;
有效行为数据筛选模块,用于在存在交集时,将用户的行为数据判定为有效行为数据,所述有效行为数据包括正向有效行为数据和负向有效行为数据;
质量评估模块,用于根据筛选出的有效行为数据,计算所述待评估的视频的质量分数,包括:根据预设的正向有效行为数据对应的权重以及负向有效行为数据对应的权重,分别获得正向有效行为分数以及负向有效行为分数,根据所述正向有效行为分数和所述负向有效行为分数,获得待评估的视频的质量分数。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任意一项所述的视频质量评估方法。
9.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6中任意一项所述的视频质量评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811533825.4A CN109729395B (zh) | 2018-12-14 | 2018-12-14 | 视频质量评估方法、装置、存储介质和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811533825.4A CN109729395B (zh) | 2018-12-14 | 2018-12-14 | 视频质量评估方法、装置、存储介质和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109729395A CN109729395A (zh) | 2019-05-07 |
CN109729395B true CN109729395B (zh) | 2022-02-08 |
Family
ID=66297089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811533825.4A Active CN109729395B (zh) | 2018-12-14 | 2018-12-14 | 视频质量评估方法、装置、存储介质和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109729395B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110366043B (zh) * | 2019-08-20 | 2022-02-18 | 北京字节跳动网络技术有限公司 | 视频处理方法、装置、电子设备及可读介质 |
CN110730369B (zh) * | 2019-10-15 | 2022-01-04 | 青岛聚看云科技有限公司 | 一种视频推荐方法及服务器 |
CN111125514B (zh) * | 2019-11-20 | 2023-08-22 | 泰康保险集团股份有限公司 | 用户行为分析的方法、装置、电子设备和存储介质 |
CN111107342B (zh) * | 2019-12-30 | 2022-04-05 | 广州市百果园网络科技有限公司 | 一种音视频评估方法、装置、设备及存储介质 |
CN111726649B (zh) * | 2020-06-28 | 2021-12-28 | 百度在线网络技术(北京)有限公司 | 视频流处理方法、装置、计算机设备和介质 |
CN112188295B (zh) * | 2020-09-29 | 2022-07-05 | 有半岛(北京)信息科技有限公司 | 一种视频推荐方法及装置 |
CN112163633A (zh) * | 2020-10-14 | 2021-01-01 | 北京嘀嘀无限科技发展有限公司 | 测试评估方法、装置、电子设备及存储介质 |
CN112416987B (zh) * | 2020-11-24 | 2021-08-24 | 致讯科技(天津)有限公司 | 基于用户画像和脑电数据的体验质量确定方法及装置 |
CN112612949B (zh) * | 2020-12-15 | 2024-06-11 | 北京达佳互联信息技术有限公司 | 推荐数据集合的建立方法及装置 |
CN114329230B (zh) * | 2021-12-30 | 2023-01-31 | 北京百度网讯科技有限公司 | 信息生成方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105142028A (zh) * | 2015-07-29 | 2015-12-09 | 华中科技大学 | 面向三网融合的电视节目内容搜索与推荐方法 |
CN105843953A (zh) * | 2016-04-12 | 2016-08-10 | 乐视控股(北京)有限公司 | 多媒体推荐方法及装置 |
CN105975641A (zh) * | 2016-07-15 | 2016-09-28 | 合网络技术(北京)有限公司 | 视频推荐方法及装置 |
CN106294830A (zh) * | 2016-08-17 | 2017-01-04 | 合智能科技(深圳)有限公司 | 多媒体资源的推荐方法及装置 |
CN106407241A (zh) * | 2016-03-21 | 2017-02-15 | 传线网络科技(上海)有限公司 | 视频推荐方法及系统 |
CN107368573A (zh) * | 2017-07-14 | 2017-11-21 | 北京奇艺世纪科技有限公司 | 视频质量评估方法及装置 |
CN108509457A (zh) * | 2017-02-28 | 2018-09-07 | 阿里巴巴集团控股有限公司 | 一种视频数据的推荐方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100191689A1 (en) * | 2009-01-27 | 2010-07-29 | Google Inc. | Video content analysis for automatic demographics recognition of users and videos |
-
2018
- 2018-12-14 CN CN201811533825.4A patent/CN109729395B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105142028A (zh) * | 2015-07-29 | 2015-12-09 | 华中科技大学 | 面向三网融合的电视节目内容搜索与推荐方法 |
CN106407241A (zh) * | 2016-03-21 | 2017-02-15 | 传线网络科技(上海)有限公司 | 视频推荐方法及系统 |
CN105843953A (zh) * | 2016-04-12 | 2016-08-10 | 乐视控股(北京)有限公司 | 多媒体推荐方法及装置 |
CN105975641A (zh) * | 2016-07-15 | 2016-09-28 | 合网络技术(北京)有限公司 | 视频推荐方法及装置 |
CN106294830A (zh) * | 2016-08-17 | 2017-01-04 | 合智能科技(深圳)有限公司 | 多媒体资源的推荐方法及装置 |
CN108509457A (zh) * | 2017-02-28 | 2018-09-07 | 阿里巴巴集团控股有限公司 | 一种视频数据的推荐方法和装置 |
CN107368573A (zh) * | 2017-07-14 | 2017-11-21 | 北京奇艺世纪科技有限公司 | 视频质量评估方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109729395A (zh) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109729395B (zh) | 视频质量评估方法、装置、存储介质和计算机设备 | |
CN110832499B (zh) | 通过稀疏时间池化网络的弱监督动作定位 | |
US10958748B2 (en) | Resource push method and apparatus | |
CN107613022B (zh) | 内容推送方法、装置及计算机设备 | |
CN107851462B (zh) | 使用循环神经网络分析健康事件 | |
CN112487278A (zh) | 推荐模型的训练方法、预测选择概率的方法及装置 | |
CN108921221A (zh) | 用户特征的生成方法、装置、设备及存储介质 | |
CN109359247B (zh) | 内容推送方法及存储介质、计算机设备 | |
CN110363220B (zh) | 行为类别检测方法、装置、电子设备和计算机可读介质 | |
CN107766573B (zh) | 基于数据处理的商品推荐方法、装置、设备和存储介质 | |
CN110971659A (zh) | 推荐消息的推送方法、装置及存储介质 | |
JP2018045516A (ja) | 分類装置、分類方法およびプログラム | |
US20130246017A1 (en) | Computing parameters of a predictive model | |
CN115034315B (zh) | 基于人工智能的业务处理方法、装置、计算机设备及介质 | |
US11727686B2 (en) | Framework for few-shot temporal action localization | |
CN114202123A (zh) | 业务数据预测方法、装置、电子设备及存储介质 | |
CN111275205A (zh) | 虚拟样本的生成方法、终端设备及存储介质 | |
CN111382605A (zh) | 视频内容审核方法、装置、存储介质和计算机设备 | |
CN112099889A (zh) | 一种信息显示方法、设备、装置及存储介质 | |
CN109086345B (zh) | 一种内容识别方法、内容分发方法、装置及电子设备 | |
CN117194772B (zh) | 一种基于用户标签的内容推送方法及装置 | |
CN112328881A (zh) | 文章推荐方法、装置、终端设备及存储介质 | |
CN116091174A (zh) | 推荐策略优化系统、方法、装置及相关设备 | |
CN112434629B (zh) | 一种在线时序动作检测方法及设备 | |
CN109710793B (zh) | 一种哈希参数确定方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20221123 Address after: 31a, 15th floor, building 30, maple commercial city, bangrang Road, Brazil Patentee after: Baiguoyuan Technology (Singapore) Co.,Ltd. Address before: Building B-1, North District, Wanda Commercial Plaza, Wanbo business district, No. 79, Wanbo 2nd Road, Nancun Town, Panyu District, Guangzhou City, Guangdong Province Patentee before: GUANGZHOU BAIGUOYUAN INFORMATION TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right |