视频推荐方法和装置
技术领域
本发明涉及多媒体技术领域,尤其涉及一种视频推荐方法和装置。
背景技术
目前,在采用网络视频来播放电视剧等节目时,通常可以在网页中显示其他的推荐内容。举例而言,在播放电视剧时,基本通过协同过滤推荐方法来推荐UGC(UserGenerated Content,用户原创内容),或者根据电视剧名称与UGC视频的标题进行匹配来推荐。
采用协同过滤推荐方法,在播放某一电视剧时,推荐出的视频多为同一个电视剧的不同集,比如播放第10集,推荐的是第2集的关联内容,推荐出的视频与当前播放剧集内容关联度低,推荐出的UGC视频数量比较少。
发明内容
技术问题
有鉴于此,本发明要解决的技术问题是,如何向用户推荐与目标视频关联度高的视频。
解决方案
为了解决上述技术问题,根据本发明的一实施例,提供了一种视频推荐方法,包括:
从目标视频的元信息中提取人物特征信息;
根据用户行为日志,对与所述人物特征信息关联的视频进行排序;
根据排序后的视频,在所述目标视频的网页上显示推荐结果。
对于上述方法,在一种可能的实现方式中,从目标视频的元信息中提取人物特征信息,包括:
从所述元信息中获取所述目标视频的演员排序,并根据所述演员排序计算所述目标视频的各演员的第一权重;
从所述元信息中获取所述目标视频的内容介绍,并统计所述内容介绍中各角色出现的次数;
根据所述元信息中演员与角色的对应关系,将各角色出现的次数转换为各演员出现的次数;
根据各演员出现的次数和第一权重,计算所述目标视频的演员权重向量。
对于上述方法,在一种可能的实现方式中,根据用户行为日志,对与所述人物特征信息关联的视频进行排序,包括:
从所述用户行为日志中,获取所述目标视频的各演员与视频的关联关系;
从所述用户行为日志中,获取与各演员关联的视频的搜索点击次数和平均播放完成率,并计算与各演员关联的视频的第二权重;
按照所述第二权重对与各演员关联的视频进行排序,得到各演员对应的视频列表。
对于上述方法,在一种可能的实现方式中,根据用户行为日志,对与所述人物特征信息关联的视频进行排序,还包括:
根据设置的过滤词和与各演员关联的视频在设定时间段内的评论数据,对各演员对应的视频列表进行调整。
对于上述方法,在一种可能的实现方式中,根据排序后的视频,在所述目标视频的网页上显示推荐结果,包括:
根据推荐列表长度和所述演员权重向量,确定各演员对应的视频推荐数;
根据各演员对应的视频推荐数和设定的排列组合顺序,生成所述推荐结果。
根据本发明的另一实施例,提供了一种视频推荐装置,包括:
特征提取模块,用于从目标视频的元信息中提取人物特征信息;
排序模块,与所述特征提取模块连接,用于根据用户行为日志,对与所述人物特征信息关联的视频进行排序;
推荐模块,用于根据排序后的视频,在所述目标视频的网页上显示推荐结果。
对于上述装置,在一种可能的实现方式中,所述特征提取模块包括:
第一权重计算单元,用于从所述元信息中获取所述目标视频的演员排序,并根据所述演员排序计算所述目标视频的各演员的第一权重;
出现次数统计单元,用于从所述元信息中获取所述目标视频的内容介绍,并统计所述内容介绍中各角色出现的次数;
出现次数转换单元,与所述出现次数统计单元连接,用于根据所述元信息中演员与角色的对应关系,将各角色出现的次数转换为各演员出现的次数;
权重向量计算单元,与所述第一权重计算单元和所述出现次数转换单元分别连接,用于根据各演员出现的次数和第一权重,计算所述目标视频的演员权重向量。
对于上述装置,在一种可能的实现方式中,所述排序模块包括:
关联关系获取单元,用于从所述用户行为日志中,获取所述目标视频的各演员与视频的关联关系;
第二权重计算单元,用于从所述用户行为日志中,获取与各演员关联的视频的搜索点击次数和平均播放完成率,并计算与各演员关联的视频的第二权重;
视频列表排序单元,与所述关联关系获取单元和所述第二权重计算单元分别连接,用于按照所述第二权重对与各演员关联的视频进行排序,得到各演员对应的视频列表。
对于上述装置,在一种可能的实现方式中,所述排序模块还包括:
过滤单元,与所述视频列表排序单元连接,用于根据设置的过滤词和与各演员关联的视频在设定时间段内的评论数据,对各演员对应的视频列表进行调整。
对于上述装置,在一种可能的实现方式中,所述推荐模块包括:
推荐数确定单元,用于根据推荐列表长度和所述演员权重向量,确定各演员对应的视频推荐数;
排列组合单元,与所述推荐数确定单元连接,用于根据各演员对应的视频推荐数和设定的排列组合顺序,生成所述推荐结果。
有益效果
本发明实施例,通过从目标视频的元信息中提取人物特征信息,并结合用户行为日志对视频进行排序,得到的推荐的视频与目标视频关联度高,能够反映人物特征对推荐结果的影响。
根据下面参考附图对示例性实施例的详细说明,本发明的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面,并且用于解释本发明的原理。
图1示出根据本发明一实施例的视频推荐方法的流程图;
图2示出根据本发明一实施例的视频推荐方法中特征提取过程的流程图;
图3示出根据本发明一实施例的视频推荐方法中排序过程的流程图;
图4示出根据本发明另一实施例的视频推荐方法的流程图;
图5示出根据本发明另一实施例的视频推荐方法中电视剧示例的示意图;
图6示出根据本发明一实施例的视频推荐装置的结构示意图;
图7示出根据本发明另一实施例的视频推荐装置的结构示意图。
具体实施方式
以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本发明的主旨。
实施例1
图1示出根据本发明一实施例的视频推荐方法的流程图。如图1所示,该视频推荐方法主要可以包括:
步骤101、从目标视频的元信息中提取人物特征信息;
步骤102、根据用户行为日志,对与所述人物特征信息关联的视频进行排序;
步骤103、根据排序后的视频,在所述目标视频的网页上显示推荐结果。
本实施例中的目标视频是指作为后续推荐依据的视频。目标视频的状态可以是当前播放的视频、当前选中待播放的视频等。目标视频的类型可以是电视剧的剧集,也可以是电影等具有元信息的视频。其中,视频的元信息中通常记载有该视频的人物关系(例如:演员排序、演员与角色的对应关系等)、内容介绍等。
在一种可能的实现方式中,如图2所示,步骤101的特征提取过程具体包括:
步骤201、从目标视频的元信息中获取所述目标视频的演员排序,并根据所述演员排序计算所述目标视频的各演员的第一权重。
其中,演员的基本权重(即第一权重)可以按照演员的排序来确定。目标视频的演员可能有很多,为了减轻计算负担,可以仅将主演或部分主演作为计算对象。
步骤202、从所述元信息中获取所述目标视频的内容介绍,并统计所述内容介绍中各角色出现的次数。
步骤203、根据所述元信息中演员与角色的对应关系,将各角色出现的次数转换为各演员出现的次数。
步骤204、根据各演员出现的次数和第一权重,计算所述目标视频的演员权重向量。
其中,步骤201可以在步骤201之前,也可以在步骤202之后,本发明不限定步骤201与步骤202的时序关系。
在一种可能的实现方式中,如图3所示,步骤102的排序过程具体包括:
步骤301、从所述用户行为日志中,获取所述目标视频的各演员与视频(待推荐视频,例如UGC视频)的关联关系。以UGC视频为例,从用户行为日志中能够获取用户对UGC视频的点击搜索行为,例如用于搜索某个演员后,对某个UGC视频进行了点击和播放。在一段时间内,针对某个演员的搜索和UGC视频点击播放行为进行统计,能够得到与该演员关联的UGC视频的搜索点击次数和平均播放完成率。
步骤302、从所述用户行为日志中,获取与各演员关联的视频的搜索点击次数和平均播放完成率,并计算与各演员关联的视频的第二权重。
步骤303、按照所述第二权重对与各演员关联的视频进行排序,得到各演员对应的视频列表。
在一种可能的实现方式中,如图3所示,步骤102的排序过程具体还包括:
步骤304、根据设置的过滤词和与各演员关联的视频在设定时间段内的评论数据,对各演员对应的视频列表进行调整。
在一种可能的实现方式中,如图3所示,步骤103的推荐过程具体包括:
步骤305、根据推荐列表长度和所述演员权重向量,确定各演员对应的视频推荐数。通常,演员权重向量越大,从该演员对应的各演员对应的视频列表中选取的视频推荐数越多。
步骤306、根据各演员对应的视频推荐数和设定的排列组合顺序,生成所述推荐结果。设定的排列组合顺序可以有多种,通常原则是权重大的演员对应的推荐视频排在前面,但是也要给权重小的演员对应的视频一定的露出机会,要穿插展现,具体示例可以参见下述实施例2。
本实施例的视频推荐方法,通过从目标视频的元信息中提取人物特征信息,并结合用户行为日志对视频进行排序,得到的推荐的视频与目标视频关联度高,能够反映人物特征对推荐结果的影响。
实施例2
图4示出根据本发明另一实施例的视频推荐方法的流程图。如图4所示,在本实施例中,以目标视频为某一集电视剧、待推荐视频为UGC视频为例进行示例性说明。其中,电影或其他具有关联元信息的视频与电视剧的推荐原理类似,待推荐视频也可以为其他类型的视频,因此不再重复举例。
步骤401、提取电视剧分集视频的特征。
步骤4011、计算电视剧演员的基本权重。
具体而言,可以根据电视剧元信息中演员的排序(按重要程度排),计算演员的基本权重。电视剧元信息通常可以包括电视剧中的各演职人员的信息、内容介绍等。
基本权重计算公式可以参考式1:
其中,actorbaseweight为演员基本权重,rank为某演员的排序。如图5所示,以电视剧《后宫甄嬛传》为例,主演包括“孙俪、陈建斌、蔡少芬、刘雪华、李天柱、蒋欣”等。可以将主演或更多的演员作为计算对象,也可以从主演中选择部分演员作为计算对象。本实施例中采用前三位演员作为计算对象。则将演员排序代入上式1可得到以下每个演员的基本权重的计算结果:
actorbaseweight孙俪=1;actorbaseweight陈建斌=0.707;actorbaseweight蔡少芬=0.577。
步骤4012、确定演员和角色的对应关系。
从剧集元信息中可以得到演员和角色的对应关系。接上例《后宫甄嬛传》对应关系为:甄嬛-孙俪;皇帝-陈建斌;皇后-蔡少芬......
步骤4013、从电视剧每集的分集剧情中提取出角色名称。
具体而言,根据电视剧每集的剧集简介,提取出分集剧集中的角色出现的次数。然后,根据步骤4012中的数据,将角色出现的次数转换为演员出现的次数。
例如,第四集的剧情简介如下:
“甄嬛无意中发现碎玉轩海棠树不开花的秘密——树底下被人埋了大量麝香,这正是此前住在碎玉轩的芳贵人无故小产的缘由。甄嬛害怕自己得宠后遭他人谋害,便请来温实初协助自己,假称受惊染上风寒不便侍寝。温实初甘愿冒杀头死罪,替甄嬛隐瞒实情,并用药物催发甄嬛病情。甄嬛染疾,皇帝便翻了眉庄的牌子,温柔大方的眉庄颇得皇帝欢心。次日,皇帝赏赐宫中稀有的绿菊给眉庄,并希望她学习六宫事宜,为华妃分忧。此举让华妃怒火中烧。与此同时,皇后一边埋怨齐妃的懦弱,另一边却十分抬举眉庄,借机扩张势力。宫女福子的死因经皇后查明系华妃指使他人所为,差人告知皇帝,皇帝不满华妃的跋扈行为。恰逢此时西北准葛尔部落发生叛乱,满朝文武百官当中唯有派年羹尧前去平叛方能化险为夷。皇帝为顾全大局,只得劝皇后低调处理福子溺毙之事。甄嬛的病一直没有起色,原本趋炎附势的太监宫女们纷纷另谋出路。首领太监康禄海不满甄嬛失势,主动请辞去服侍丽嫔。甄嬛感叹世态炎凉。”
其中,甄嬛出现了8次,皇帝出现了6次,皇后出现了3次
则将上述角色出现的次数转换为演员出现次数则为:
actorfreq孙俪=8;actorfreq陈建斌=6;actorfreq蔡少芬=3。
步骤4014、计算分集的演员权重。
假设采用式2计算分集的演员权重:
episode_actorweight=actorbaseweight×actorfreq 式2,
其中,episode_actorweight为演员权重,actorbaseweight为演员基本权重,actorfreq为演员出现的次数,则接上例代入式2可得:
episode_actorweight孙俪=8.0;episode_actorweight陈建斌=4.242;episode_actorweight蔡少芬=1.731。
然后,采用下式3对上述演员权重进行归一化计算:
其中,finalepisode_actorweight为分集演员权重向量,episode_actorweight_sum为本集所有演员权重的和。
接上例代入式3则得出分集演员权重向量。
finalepisode_actorweight孙俪=0.57,finalepisode_actorweight陈建斌=0.30,finalepisode_actorweight蔡少芬=0.13。
步骤402、提取UGC视频特征。
步骤4021、根据视频搜索点击日志确定与演员关联的UGC视频。
根据某一个或多个视频网站例如youku每天的视频搜索点击日志,提取UGC视频与演员的关联关系。
比如搜索“孙俪”的搜索结果中,对应UGC视频,00001视频点击了100次,平均播放完成率为50%;00002视频搜索了80次,平均播放完成率为90%;00003视频搜索点击了50次,平均播放完成率为20%。
则参考下式4可以计算与演员关联的UGC视频权重。
WeightUgc=clickfreq×averageplayrate 式4,
其中,WeightUgc与某一演员关联的UGC视频权重,clickfreq为搜索该演员并点击某个UGC视频的次数,averageplayrate点击该UGC视频后的平均播放完成率,通常播放完成率为播放时间与视频时长的比值。
接上例,则与演员孙俪关联的UGC视频及权重为:
WeightUgc00001=50.0;WeightUgc00002=72;WeightUgc00002=10。
对孙俪关联的UGC视频进行排序如下:
00002,00001,00003......
步骤4022、过滤标题党的UGC视频。
对于与演员关联的UGC视频列表,进行过滤,可以减少标题党的情况。
举例而言,分析每个UGC视频(可以对与演员关联的UGC视频列表中的各UGC视频进行分析,也可以定期对整个视频网站的UGC视频进行分析)最近一段时间(如一个月)的评论数据。当某一UGC视频的评论数据中出现过滤词库中的过滤词,并且出现次数多于设定阈值Nfreshold次时,可以将该UGC视频标记为标题党视频。然后,从与演员关联的UGC视频列表中删除该UGC视频的相关信息。其中,可以根据实际需要调整阈值Nfreshold。
其中,过滤词库中的词可以包括“骗人,标题党,骗点击......”等人工或计算机总结出的过滤词。
步骤403、生成电视剧分剧集推荐列表。
假设电视剧分集推荐列表长度为reclistLength=10。
接上例,根据上式3计算得到的分集的演员权重向量为finalepisode_actorweight孙俪=0.57,finalepisode_actorweight陈建斌=0.30,finalepisode_actorweight蔡少芬=0.13。
则可以采用下式5计算推荐列表中与每个演员关联的UGC视频数:
ugcnum=reclistLength×actorweight 式5,
其中,ugcnum值可以四舍五入取整数。接上例代入式5,则ugcnum孙俪=6,ugcnum陈建斌=3,ugcnum蔡少芬=1。
假设在在步骤402中,计算得到孙俪关联UGC视频列表为{A1,A2,A3,A4,A5,A6,A7....};陈建斌关联UGC列表为{B1,B2,B3,B4,B5,B6.....};蔡少芬关联UGC列表为{C1,C2,C3.....}。则按照设定的排列组合可以生成推荐列表。
举例而言,按照分集的演员权重向量中的演员顺序,每次插入一个,最终《后宫甄嬛传》第四集播放时的推荐列表为{A1,B1,C1,A2,B2,A3,B3,A4,A5,A6}。当然,也可以按照分集的演员权重向量中的演员顺序每次插入两个(或多个),例如{A1,A2,B1,B2,C1,A3,A4,B3,A5,A6}。或者,直接按照演员权重向量从高到低的顺序,结合所计算的视频推荐数,排列UGC视频,例如:{A1,A2,A3,A4,A5,A6,B1,B2,B3,C1}。
本实施例中,按照电视剧分集剧集的视频进行人物特征提取与权重计算,从而根据分集剧集演员特征进行推荐,能够根据所播放的电视剧不同剧集,推荐内容和侧重点不同的UGC视频,与所播放的剧集相关度更高。
实施例3
图6示出根据本发明一实施例的视频推荐装置的结构示意图,如图6所示,该视频推荐装置主要可以包括:
特征提取模块61,用于从目标视频的元信息中提取人物特征信息;
排序模块63,与所述特征提取模块61连接,用于根据用户行为日志,对与所述人物特征信息关联的视频进行排序;
推荐模块65,与所述排序模块63连接,用于根据排序模块63排序后的视频,在所述目标视频的网页上显示推荐结果。
本实施例的视频推荐装置能够执行上述实施例中的视频推荐方法,通过从目标视频的元信息中提取人物特征信息,并结合用户行为日志对视频进行排序,得到的推荐的视频与目标视频关联度高,能够反映人物特征对推荐结果的影响。
实施例4
图7示出根据本发明另一实施例的视频推荐装置的结构示意图。图7中标号与图6相同的组件具有相同的功能,在此不再赘述。
如图7所示,与上一实施例的不同之处在于,所述特征提取模块61包括:
第一权重计算单元611,用于从所述元信息中获取所述目标视频的演员排序,并根据所述演员排序计算所述目标视频的各演员的第一权重;
出现次数统计单元613,用于从所述元信息中获取所述目标视频的内容介绍,并统计所述内容介绍中各角色出现的次数;
出现次数转换单元615,与所述出现次数统计单元613连接,用于根据所述元信息中演员与角色的对应关系,将各角色出现的次数转换为各演员出现的次数;
权重向量计算单元617,与所述第一权重计算单元611和所述出现次数转换单元615分别连接,用于根据各演员出现的次数和第一权重,计算所述目标视频的演员权重向量。
在一种可能的实现方式中,所述排序模块63包括:
关联关系获取单元631,用于从所述用户行为日志中,获取所述目标视频的各演员与视频的关联关系;
第二权重计算单元633,用于从所述用户行为日志中,获取与各演员关联的视频的搜索点击次数和平均播放完成率,并计算与各演员关联的视频的第二权重;
视频列表排序单元635,与所述关联关系获取单元631和所述第二权重计算单元633分别连接,用于按照所述第二权重对与各演员关联的视频进行排序,得到各演员对应的视频列表。
在一种可能的实现方式中,所述排序模块63还包括:
过滤单元637,与所述视频列表排序单元655连接,用于根据设置的过滤词和与各演员关联的视频在设定时间段内的评论数据,对各演员对应的视频列表进行调整。
在一种可能的实现方式中,所述推荐模块65包括:
推荐数确定单元651,与权重向量计算单元617和视频列表排序单元635分别连接,用于根据推荐列表长度和所述演员权重向量,确定各演员对应的视频推荐数;通常,演员权重向量越大,从该演员对应的各演员对应的视频列表中选取的视频推荐数越多。此外,推荐数确定单元651也可以与过滤单元637连接,过滤后的各演员对应的视频列表中确定视频推荐数。
排列组合单元653,与所述推荐数确定单元651连接,用于根据各演员对应的视频推荐数和设定的排列组合顺序,生成所述推荐结果。
本实施例的视频推荐装置能够执行上述实施例中的视频推荐方法,通过从目标视频的元信息中提取人物特征信息,并结合用户行为日志对视频进行排序,得到的推荐的视频与目标视频关联度高,能够反映人物特征对推荐结果的影响。具体原理和示例可以参见上述视频推荐方法中的相关描述。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。