CN111767429B - 一种视频推荐方法、装置及电子设备 - Google Patents

一种视频推荐方法、装置及电子设备 Download PDF

Info

Publication number
CN111767429B
CN111767429B CN202010605954.0A CN202010605954A CN111767429B CN 111767429 B CN111767429 B CN 111767429B CN 202010605954 A CN202010605954 A CN 202010605954A CN 111767429 B CN111767429 B CN 111767429B
Authority
CN
China
Prior art keywords
target
tag
video
user
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010605954.0A
Other languages
English (en)
Other versions
CN111767429A (zh
Inventor
周静亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202010605954.0A priority Critical patent/CN111767429B/zh
Publication of CN111767429A publication Critical patent/CN111767429A/zh
Application granted granted Critical
Publication of CN111767429B publication Critical patent/CN111767429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明实施例提供了一种视频推荐方法、装置及电子设备,应用于互联网技术领域。该方法包括:获取多个目标标签;针对每一目标标签,获取该目标标签的热度值和该目标标签对应的第一兴趣值,并基于目标客户端的用户总人数和在目标客户端中访问过具有该目标标签的视频的目标人数,确定该目标标签对于区分用户兴趣的重要程度值,利用该目标标签的热度值和对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重;基于各个目标标签的标签权重,选取用于视频推荐的目标标签;基于所选取的目标标签,从视频库选取针对目标用户的推荐视频,并推荐给目标用户。通过本方案可以解决现有技术中视频推荐的准确度不高的问题。

Description

一种视频推荐方法、装置及电子设备
技术领域
本发明涉及互联网技术领域,特别是涉及一种视频推荐方法、装置及电子设备。
背景技术
由于用户感兴趣的视频内容不同,客户端通常会根据用户的访问行为,为用户进行视频推荐,以符合用户个性化需求。而为了进行视频推荐,预先会为视频设置用于表征视频内容的内容标签,这样,用户所访问视频的内容标签可以用于视频推荐过程。
现有技术中,在基于内容标签进行视频推荐时,考虑到不同的内容标签具有不同的热度值,而热度值高的内容标签表明受欢迎程度更高,因此,通常会将具有较高热度值的内容标签的视频,作为推荐视频。其中,内容标签的热度值能够体现具有该内容标签的视频的受欢迎程度,热度值越高的内容标签,表明具有该内容标签的视频越受欢迎。
发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
即便用户对于热度较高的视频的访问次数很少,也就是,对具有较高热度的内容标签的视频的访问次数很少,但是,由于热度较高,该具有较高热度的内容标签的视频也会大量的推荐给用户。这样,个性化推荐由用户主导变成了热度主导,视频推荐的准确度不高,无疑影响用户对客户端的使用粘性。
发明内容
本发明实施例的目的在于提供一种视频推荐方法、装置及电子设备,以解决现有技术中视频推荐的准确度不高的问题目标用户。具体技术方案如下:
第一方面,本发明实施例提供了一种视频推荐方法,包括:
获取多个目标标签,所述目标标签为目标用户已访问视频的内容标签;
针对每一目标标签,获取该目标标签的热度值和该目标标签对应的第一兴趣值,所述第一兴趣值用于表征所述目标用户对于具有该目标标签的同一类视频的感兴趣程度;
针对每一目标标签,基于目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数,确定该目标标签对于区分用户兴趣的重要程度值;其中,所述目标客户端是为所述目标用户提供视频的客户端;
针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重;
基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签;
基于所选取的目标标签,从视频库选取针对所述目标用户的推荐视频,并将所选取的推荐视频推荐给所述目标用户。
可选地,所述确定该目标标签对于区分用户兴趣的重要程度值所利用的公式,包括:
Figure BDA0002559062090000021
其中,F(t)为目标标签t对于区分用户兴趣的重要程度值,N为所述目标客户端的用户总人数,K为在所述目标客户端中访问过具有目标标签t的视频的目标人数。
可选地,所述针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重,包括:
针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第一预定公式,计算该目标标签的标签权重;
其中,所述第一预定公式包括:
W(u,t)=Mu,t*Ht*F(t)
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,Mu,t为目标标签t对应的第一兴趣值;Ht为目标标签t的热度值,F(t)为目标标签t对于区分用户兴趣的重要程度值。
可选地,所述针对每一目标标签,获取该目标标签的热度值和该目标标签对应的第一兴趣值,包括:
针对每一目标标签,获取在所述目标用户每次访问具有该目标标签的视频时,该目标标签的热度值和该目标标签对应的第一兴趣值;
所述针对每一目标标签,基于目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数,确定该目标标签对于区分用户兴趣的重要程度值,包括:
针对每一目标标签,获取在所述目标用户每次访问具有该目标标签的视频时,目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数;并利用所获取到的用户总人数和目标人数,确定在所述目标用户每次访问具有该目标标签的视频时,该目标标签对于区分用户兴趣的重要程度值。
可选地,所述针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重,包括:
针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第二预定公式,计算该目标标签的标签权重;
其中,所述第二预定公式包括:
Figure BDA0002559062090000031
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,n为目标用户u访问具有目标标签t的视频的访问次数,i为访问次数的标识;
Figure BDA0002559062090000032
为目标用户u第i次访问具有目标标签t的视频时,目标标签t对应的第一兴趣值;/>
Figure BDA0002559062090000033
为目标用户u第i次访问具有该目标标签t的视频时,目标标签t的热度值;F(t)i为目标用户u第i次访问具有该目标标签t的视频时,目标标签t对于区分用户兴趣的重要程度值。
可选地,基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签之前,所述方法还包括:
针对每一目标标签,确定所述目标用户对于该目标标签的目标关注时长;其中,所述目标关注时长为从所述目标用户第一次访问具有该目标标签的视频的时间点到当前时间的时长;
针对每一目标标签,从预先为该目标标签对应的视频类型所设定的、关于各个关注时长与各个关注时长下所述目标用户对于所述视频类型的兴趣值的映射关系,确定与所述目标关注时长对应的兴趣值,作为该目标标签对应的第二兴趣值;其中,该目标标签对应的视频类型为具有该目标标签的视频所属的视频类型,所述目标用户对于所述视频类型的兴趣值用于表征所述目标用户对于所述视频类型的视频的感兴趣程度;
针对每一目标标签,确定所述目标用户对于该目标标签对应的视频类型的关注周期的总时长,并确定所述多个目标标签中属于该目标标签对应视频类型的标签数量,作为该目标标签对应的标签数量;
针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
所述基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签,包括:
基于各个目标标签的修改后的标签权重,从各个目标标签中,选取用于视频推荐的目标标签。
可选地,所述针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重,包括:
针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,按照预定的修正公式,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
其中,所述预定的修正公式包括:
W(u,t)’=W(u,t)*Pt
其中,
Figure BDA0002559062090000051
式中,cur为目标用户u对于目标标签t的目标关注时长,m为目标标签t对应的标签数量,T为目标用户u对目标标签t对应的视频类型的关注周期的总时长,f为目标标签t对应的第二兴趣值,v为预设调整因子。
第二方面,本发明实施例提供了一种视频推荐装置,包括:
标签获取模块,用于获取多个目标标签,所述目标标签为目标用户已访问视频的内容标签;
数据获取模块,用于针对每一目标标签,获取该目标标签的热度值和该目标标签对应的第一兴趣值,所述第一兴趣值用于表征所述目标用户对于具有该目标标签的同一类视频的感兴趣程度;
程度值确定模块,用于针对每一目标标签,基于目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数,确定该目标标签对于区分用户兴趣的重要程度值;其中,所述目标客户端是为所述目标用户提供视频的客户端;
权重计算模块,用于针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于所述目标用户的重要程度值,计算该目标标签的标签权重;
标签选取模块,用于基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签;
视频推荐模块,用于基于所选取的目标标签,从视频库选取针对所述目标用户的推荐视频,并将所选取的推荐视频推荐给所述目标用户。
可选地,所述确定该目标标签对于区分用户兴趣的重要程度值所利用的公式,包括:
Figure BDA0002559062090000061
其中,F(t)为目标标签t对于区分用户兴趣的重要程度值,N为所述目标客户端的用户总人数,K为在所述目标客户端中访问过具有目标标签t的视频的目标人数。
可选地,所述权重计算模块具体用于:针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第一预定公式,计算该目标标签的标签权重;
其中,所述第一预定公式包括:
W(u,t)=Mu,t*Ht*F(t)
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,Mu,t为目标标签t对应的第一兴趣值;Ht为目标标签t的热度值,F(t)为目标标签t对于区分用户兴趣的重要程度值。
可选地,所述数据获取模块具体用于:针对每一目标标签,获取在所述目标用户每次访问具有该目标标签的视频时,该目标标签的热度值和该目标标签对应的第一兴趣值;
所述程度值确定模块具体用于:针对每一目标标签,获取在所述目标用户每次访问具有该目标标签的视频时,目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数;并利用所获取到的用户总人数和目标人数,确定在所述目标用户每次访问具有该目标标签的视频时,该目标标签对于区分用户兴趣的重要程度值。
可选地,所述权重计算模块具体用于:
针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第二预定公式,计算该目标标签的标签权重;
其中,所述第二预定公式包括:
Figure BDA0002559062090000071
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,n为目标用户u访问具有目标标签t的视频的访问次数,i为访问次数的标识;
Figure BDA0002559062090000072
为目标用户u第i次访问具有目标标签t的视频时,目标标签t对应的第一兴趣值;/>
Figure BDA0002559062090000073
为目标用户u第i次访问具有该目标标签t的视频时,目标标签t的热度值;F(t)i为目标用户u第i次访问具有该目标标签t的视频时,目标标签t对于区分用户兴趣的重要程度值。
可选地,所述装置还包括:
修正模块,用于标签选取模块基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签之前,
针对每一目标标签,确定所述目标用户对于该目标标签的目标关注时长;其中,所述目标关注时长为从所述目标用户第一次访问具有该目标标签的视频的时间点到当前时间的时长;
针对每一目标标签,从预先为该目标标签对应的视频类型所设定的、关于各个关注时长与各个关注时长下所述目标用户对于所述视频类型的兴趣值的映射关系,确定与所述目标关注时长对应的兴趣值,作为该目标标签对应的第二兴趣值;其中,该目标标签对应的视频类型为具有该目标标签的视频所属的视频类型,所述目标用户对于所述视频类型的兴趣值用于表征所述目标用户对于所述视频类型的视频的感兴趣程度;
针对每一目标标签,确定所述目标用户对于该目标标签对应的视频类型的关注周期的总时长,并确定所述多个目标标签中属于该目标标签对应视频类型的标签数量,作为该目标标签对应的标签数量;
针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
所述标签选取模块具体用于:
基于各个目标标签的修改后的标签权重,从各个目标标签中,选取用于视频推荐的目标标签。
可选地,所述修正模块针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重,包括:
针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,按照预定的修正公式,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
其中,所述预定的修正公式包括:
W(u,t)’=W(u,t)*Pt
其中,
Figure BDA0002559062090000081
式中,cur为目标用户u对于目标标签t的目标关注时长,m为目标标签t对应的标签数量,T为目标用户u对目标标签t对应的视频类型的关注周期的总时长,f为目标标签t对应的第二兴趣值,v为预设调整因子。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所提供的视频推荐方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所提供的视频推荐方法的步骤。
本发明实施例所提供的方案中,在获取到多个目标标签后,不但获取每一目标标签的热度值和每一目标标签对应的第一兴趣值,而且,还基于目标客户端的用户总人数和在目标客户端中访问过具有该目标标签的视频的目标人数,计算该目标标签对于区分用户兴趣的重要程度值;进而,利用这三类数据,计算每一目标标签的标签权重,基于各个目标标签的标签权重,选取用于视频推荐的目标标签,基于所选取的目标标签,从视频库选取针对目标目标用户的推荐视频,并将所选取的推荐视频推荐给该目标用户。相对现有技术而言,本方案考虑的数据维度增多,能够降低热度对于视频推荐的影响,达到去热度化效果。因此,通过本方案解决现有技术中视频推荐的准确度不高的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例所提供的一种视频推荐方法的流程图;
图2为本发明实施例所提供的一种视频推荐方法的另一流程图;
图3为本发明实施例所提供的一种视频推荐方法的推荐原理图;
图4为本发明实施例所提供的一种视频推荐装置的结构示意图;
图5为本发明实施例所提供的一种视频推荐装置的另一结构示意图;
图6为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术中视频推荐的准确度不高的问题,本发明实施例提出了一种视频推荐方法、装置及电子设备。
下面首先对本发明实施例所提供的一种视频推荐方法进行介绍。
其中,本发明实施例所提供的一种视频推荐方法,应用于电子设备。在具体应用中,该电子设备可以是服务器,当然,该电子设备也可以是终端设备,例如:智能手机、平板电脑、笔记本电脑、台式计算机等等。并且,当该电子设备为服务器时,执行方法的执行主体具体可以为运行于服务器中的、具有视频推荐功能的客户端所对应的服务端程序。而当该电子设备为终端设备时,执行方法的执行主体具体可以是具有视频推荐功能的客户端。另外,可以理解的是,该客户端可以为网页类型的客户端,或者,APP(Application)类型的客户端,这都是合理的。
并且,该视频推荐方法中所利用的目标标签为目标用户已访问视频的内容标签。举例而言,若目标用户浏览了“中央广播电视总台2019主持人大赛”这档视频节目,则目标标签可以为“主持人大赛”、“撒贝宁”或“中央电视台综合频道”等等;若目标用户观看了“中国女排世界杯十连胜”这则新闻,目标标签可以为“中国女排”、“女排世界杯”或“郎平”等等。需要说明的是,目标标签是基于内容本身设定的标签,每一目标标签对应有视频类型,任一视频类型中包含一定数量的目标标签。举例而言,针对“主持人大赛”的目标标签,其对应的视频类型可以为“综艺类”;针对“中国女排”的目标标签,其对应的视频类型可以为“体育类”,等等。需要说明的是,针对任一视频,该视频的内容标签的确定方式,本发明实施例不做限定。
如图1所示,本发明实施例所提供的一种视频推荐方法,可以包括如下步骤:
S101,获取多个目标标签,目标标签为目标用户已访问视频的内容标签;
当需要向该目标用户进行视频推荐时,可以基于目标用户已访问视频,获取多个目标标签,而每一目标标签均为目标用户已访问视频的内容标签。可以理解的是,目标用户已访问视频可以包括但不局限于目标用户观看、点赞、收藏、下载或评论的视频,也就是,目标用户发生过观看、点赞、收藏、下载或评论等操作的视频,均属于目标用户已访问视频。
其中,获取该多个目标标签的方式存在多种。示例性的,在一种实现方式中,从用于记录目标用户已访问视频的视频列表中,确定各个目标用户已访问视频;针对每一目标用户已访问视频,确定该视频的内容标签,作为目标标签。示例性的,在另一种实现方式中,从该目标用户的标签列表中,选取多个目标标签;其中,该目标用户的标签列表为用于记录该目标用户已访问视频的内容标签的列表。上述的获取该多个目标标签的方式仅仅作为示例,并不应该构成对本发明实施例的限定。
S102,针对每一目标标签,获取该目标标签的热度值和该目标标签对应的第一兴趣值,该第一兴趣值用于表征该目标用户对于具有该目标标签的同一类视频的感兴趣程度;
针对每一目标标签,该目标用户可以访问一次或多次具有该目标标签的视频。那么,可选地,在一种实现方式中,在视频推荐时,针对每一目标视频,获取该目标标签的当前的热度值,以及该目标标签对应的当前的第一兴趣值。其中,该目标标签对应的当前的第一兴趣值可以为目标用户最近一次访问具有该目标标签的视频时,该目标标签对应的第一兴趣值,当然并不局限于此。
可选地,在另一种实现方式中,在视频推荐时,针对每一目标标签,获取在该目标用户每次访问具有该目标标签的视频时,该目标标签的热度值和该目标标签对应的第一兴趣值。
示例性的,该目标用户任一次访问具有该目标标签的视频时,该目标标签对应的第一兴趣值的计算方式可以包括:确定该目标用户该次对于具有该目标标签的视频的目标访问行为,基于预先设定的关于访问行为与交互值的映射关系,确定该目标访问行为对应的交互值,作为该目标视频对应的第一兴趣值。可以理解的是,不同的访问行为所对应的交互值的大小,可以根据不同的访问行为能够表征的兴趣度的高低来设定,表征兴趣度高的访问行为所对应的交互值,大于表征兴趣度低的访问行为所对应的交互值。示例性的,关于访问行为与交互值的映射关系可以包括:观看对应有交互值:1,点赞对应有交互值:2,下载对应有交互值:3,等等;或者,观看对应有交互值:3,点赞对应有交互值:2,下载对应有交互值:4,等等。
或者,该目标用户任一次访问具有该目标标签的视频时,该目标标签对应的第一兴趣值的计算方式可以包括:确定该目标用户该次对于具有该目标标签的视频的目标访问行为,以及在该次之前,每次对于具有该目标标签的视频的目标访问行为,并基于预先设定的关于访问行为与交互值的映射关系,确定各个目标访问行为对应的交互值,计算所确定的各个交互值的和值,作为该目标标签对应的第一兴趣值。
另外,可以理解的是,在任一时刻下,每一目标标签的热度值可以与具有该目标标签的视频的访问人数成正相关。示例性的,在一种实现方式中,若需要确定目标时刻下某一目标标签的热度值,则可以确定在该目标时刻下,目标客户端中访问过具有该目标标签的视频的总人数值,作为该目标标签的热度值。示例性的,在另一种实现方式中,若需要确定目标时刻下某一目标标签的热度值,则可以确定在目标时刻以及目标时刻之前,目标客户端中的各目标用户对于具有该目标标签的视频的各次访问行为对应的交互值,并计算所确定的交互值的和值,作为该目标标签的热度值。其中,该目标客户端为目标用户提供视频的客户端。
S103,针对每一目标标签,基于目标客户端的用户总人数和在该目标客户端中访问过具有该目标标签的视频的目标人数,确定该目标标签对于区分用户兴趣的重要程度值;其中,该目标客户端是为该目标用户提供视频的客户端;
考虑到一个标签的热度值很高时,即便目标用户对于该标签的兴趣值较低,该标签也可能会作为用于视频推荐的标签,最终将导致不符合目标用户兴趣倾向,视频推荐的准确率较低。为了避免该种情况,本方案采用TF-IDF原理,对计算标签权重所利用的数据的维度进行改进,即通过热度值、兴趣值和重要程度值来计算标签权重,该重要程度值具体为:目标标签对于区分用户兴趣的重要程度值。其中,对于区分用户兴趣的重要程度高的目标标签,相对于区分用户兴趣的重要程度低的目标标签,更适合用于视频推荐。
并且,基于TF-IDF可知,针对每一目标标签,该目标标签对于区分用户兴趣的重要程度,随着该目标标签在目标用户访问过程中出现的次数成正比增加,但同时随着该目标标签在所有用户中出现的频率成反比下降。因此,针对每一目标标签,可以基于目标客户端的用户总人数和在目标客户端中访问过具有该目标标签的视频的目标人数,来确定该目标标签对于区分用户兴趣的重要程度值。其中,TF-IDF(term frequency–inverse documentfrequency,)是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度,字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。
其中,确定该目标标签对于区分用户兴趣的重要程度值所利用的公式为基于TF-IDF原理所确定出的公式。
示例性的,在一种实现方式中,基于TF-IDF原理所确定的关于重要程度值的确定公式可以包括:
Figure BDA0002559062090000131
其中,F(t)为目标标签t对于区分用户兴趣的重要程度值,|N|为目标客户端的用户总人数,|{j:Ct∈Dt}|为在目标客户端中访问过具有目标标签t的视频的目标人数;
那么,基于公式(1)可得,确定该目标标签对于区分用户兴趣的重要程度值所利用的公式,包括:
Figure BDA0002559062090000132
其中,F(t)为目标标签t对于区分用户兴趣的重要程度值,N为目标客户端的用户总人数,K为在目标客户端中访问过具有目标标签t的视频的目标人数。
示例性的,在另一种实现方式中,基于TF-IDF原理所确定的关于重要程度值的确定公式可以包括:
Figure BDA0002559062090000133
其中,F(t)为目标标签t对于区分用户兴趣的重要程度值,|N|为目标客户端的用户总人数,|{j:Ct∈Dt}|为在目标客户端中访问过具有目标标签t的视频的目标人数;
那么,基于公式(2)可得,确定该目标标签对于区分用户兴趣的重要程度值所利用的公式,包括:
Figure BDA0002559062090000134
其中,F(t)为目标标签t对于区分用户兴趣的重要程度值,N为目标客户端的用户总人数,K为在目标客户端中访问过具有目标标签t的视频的目标人数。
另外,可以理解的是,针对每一目标标签,该目标用户可以访问一次或多次具有该目标标签的视频。若在视频推荐时,针对每一目标视频,获取该目标标签的当前的热度值,以及该目标标签对应的当前的第一兴趣值;相应的,则针对每一目标标签,基于目标客户端的当前的用户总人数和在该目标客户端中访问过具有该目标标签的视频的当前的目标人数,确定该目标标签对于区分用户兴趣的重要程度值。若在视频推荐时,针对每一目标标签,获取在该目标用户每次访问具有该目标标签的视频时,该目标标签的热度值和该目标标签对应的第一兴趣值,相应的,则针对每一目标标签,获取在该目标用户每次访问具有该目标标签的视频时,目标客户端的用户总人数和在该目标客户端中访问过具有该目标标签的视频的目标人数;并利用所获取到的用户总人数和目标人数,确定在该目标用户每次访问具有该目标标签的视频时,该目标标签对于区分用户兴趣的重要程度值。
S104,针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重;
在获得三个维度的数据后,可以利用该三个维度的数据,计算该目标标签的标签权重。
若在视频推荐时,针对每一目标视频,获取该目标标签的当前的热度值、该目标标签对应的当前的第一兴趣值,以及基于目标客户端的当前的用户总人数和在该目标客户端中访问过具有该目标标签的视频的当前的目标人数,确定该目标标签对于区分用户兴趣的重要程度值,相应的,则针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重,可以包括:
针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第一预定公式,计算该目标标签的标签权重;
其中,该第一预定公式包括:
W(u,t)=Mu,t*Ht*F(t)
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,Mu,t为目标标签t对应的第一兴趣值;Ht为目标标签t的热度值,F(t)为目标标签t对于区分用户兴趣的重要程度值。
若在视频推荐时,针对每一目标标签,获取在该目标用户每次访问具有该目标标签的视频时,该目标标签的热度值、该目标标签对应的第一兴趣值,以及,确定在该目标用户每次访问具有该目标标签的视频时,该目标标签对于区分用户兴趣的重要程度值,相应的,则针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重,可以包括:
针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第二预定公式,计算该目标标签的标签权重;其中,第二预定公式包括:
Figure BDA0002559062090000151
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,n为目标用户u访问具有目标标签t的视频的访问次数,i为访问次数的标识;
Figure BDA0002559062090000152
为目标用户u第i次访问具有目标标签t的视频时,目标标签t对应的第一兴趣值;/>
Figure BDA0002559062090000153
为目标用户u第i次访问具有该目标标签t的视频时,目标标签t的热度值;F(t)i为目标用户u第i次访问具有该目标标签t的视频时,目标标签t对于区分用户兴趣的重要程度值。/>
S105,基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签;
其中,基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签的具体实现方式存在多种。
例如:从各个目标标签中,选取标签权重大于预定阈值的目标标签,作为用于视频推荐的目标标签;或者,按照标签权重,对各个目标标签进行降序排序,选取排序靠前的L个目标标签,作为用于视频推荐的目标标签,等等。
S106,基于所选取的目标标签,从视频库选取针对该目标用户的推荐视频,并将所选取的推荐视频推荐给该目标用户。
在选取目标标签后,由于视频库中的各个视频具有设置有内容标签,因此,在选取目标标签后,可以基于所选取的目标标签,从视频库选取针对该目标用户的推荐视频,并将所选取的推荐视频推荐给该目标用户。具体而言:可以从视频库中筛选设置有所选取的目标标签的视频,作为推荐视频。
为了方便理解方案,结合图3所示的原理图对本发明实施例所提供的视频推荐方法进行介绍。如图3所示,视频推荐装置所实现的步骤通过推荐系统和用户标签权重系统相互协作来完成。具体而言:推荐系统基于目标用户的用户行为数据,即用户已访问视频,生成多个内容标签tag,并存储在数据池中;当需要向目标用户进行视频推荐时,推荐系统可以从数据池中获取多个内容标签tag,即多个目标标签,并将所获取到的多个内容标签tag发送至用户标签权重系统;该用户标签权重系统利用本发明实施例所提供的标签权重计算方式,计算各个内容标签tag的标签权重,并反馈至推荐系统;推荐系统基于用户标签权重系统反馈的各个内容标签tag的标签权重,从各个内容标签tag中,选取用于视频推荐的内容标签tag,基于所选取的内容标签tag,从视频库选取针对目标用户的推荐视频,并将所选取的推荐视频推荐给该目标用户。其中,图3右侧所示出的输出数据为基于所选取的内容标签tag向目标用户推荐的推荐视频;并且,用户标签权重系统可以基于目标用户对于输出数据的访问行为,来获取后续计算各个内容标签tag的标签权重所需利用的数据,例如:兴趣值。
本发明实施例所提供的方案中,在获取到多个目标标签后,不但获取每一目标标签的热度值和每一目标标签对应的第一兴趣值,而且,还基于目标客户端的用户总人数和在目标客户端中访问过具有该目标标签的视频的目标人数,计算该目标标签对于区分用户兴趣的重要程度值;进而,利用这三类数据,计算每一目标标签的标签权重,基于各个目标标签的标签权重,选取用于视频推荐的目标标签,基于所选取的目标标签,从视频库选取针对目标目标用户的推荐视频,并将所选取的推荐视频推荐给该目标用户。相对现有技术而言,本方案考虑的数据维度增多,能够降低热度对于视频推荐的影响,达到去热度化效果。因此,通过本方案解决现有技术中视频推荐的准确度不高的问题。
另外,发明人研究发现,基于大众的观看习惯或规律,大众对于任一视频类型的视频的关注通常会存在一个关注周期,在关注周期内的不同关注时长下,大众对于视频类型的视频的感兴趣程度不同。因此,为了进一步提升标签权重与目标用户实际兴趣倾向的匹配程度,从而提升视频推荐的准确度,在视频推荐时,还可以依据目标用户自身对于目标标签对应视频类型的感兴趣规律,来对各个目标标签的标签权重进行修正。基于该种处理思想,可选地,在上述的S101-S106的基础上,如图2所示,基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签之前,本发明实施例所提供的视频推荐方法还可以包括如下步骤:
S107A,针对每一目标标签,确定该目标用户对于该目标标签的目标关注时长;
其中,该目标关注时长为从该目标用户第一次访问具有该目标标签的视频的时间点到当前时间的时长。
S107B,针对每一目标标签,从预先为该目标标签对应的视频类型所设定的、关于各个关注时长与各个关注时长下该目标用户对于该视频类型的兴趣值的映射关系,确定与该目标关注时长对应的兴趣值,作为该目标标签对应的第二兴趣值;
其中,该目标标签对应的视频类型为具有该目标标签的视频所属的视频类型,该目标用户对于该视频类型的兴趣值用于表征该目标用户对于该视频类型的视频的感兴趣程度。
其中,该目标标签对应的视频类型可以包括一定数量的标签,该一定数量的标签中至少包括该目标标签。示例性的,针对“主持人大赛”的目标标签,该目标标签对应的视频类型可以为“综艺类”,该“综艺类”而视频类型还可以包括:“芝麻开门”、“奔跑吧兄弟”等等;针对“撒贝宁”的目标标签,该目标标签对应的视频类型可以为“明星类”,而该“明星类”视频类型还可以包括“何炅”等等。
其中,针对该目标标签对应的视频类型,关于各个关注时长与各个关注时长下该目标用户对于该视频类型的兴趣值的映射关系的确定方式,可以存在多种。
示例性的,在一种实现方式中,针对每一预定的关注时长,统计该关注时长与上一关注时长之间的时段内,该目标用户对于该视频类型的视频的访问次数,利用该访问次数,生成该关注时长下该目标用户对于该视频类型的兴趣值。举例而言,假设关注周期的总时长为4周,第一周内访问次数为10次,第二周内访问次数为8次,第三周内访问次数为5次,第四周内访问次数为2次,那么,在一周的关注时长下该目标用户对于该视频类型的兴趣值可以为1,在两周的关注时长下该目标用户对于该视频类型的兴趣值可以为0.8,在三周的关注时长下该目标用户对于该目标用户对于该视频类型的兴趣值可以为0.5,在四周的关注时长下该目标用户对于该视频类型的兴趣值可以为0.2。
示例性的,在另一种实现方式中,针对每一预定的关注时长,统计该关注时长与上一关注时长之间的时段内,该目标用户对于该视频类型的视频的各个目标访问行为,利用各个目标访问行为对应的交互值的累加值,生成该关注时长下该目标用户对于该视频类型的兴趣值。举例而言:假设关注周期的总时长为4周,第一周内各个目标访问行为对应的交互值的累加值为100,第二周内各个目标访问行为对应的交互值的累加值为80,第三周内各个目标访问行为对应的交互值的累加值为50,第四周内各个目标访问行为对应的交互值的累加值为20,那么,在一周的关注时长下该目标用户对于该视频类型的兴趣值可以为1,在两周的关注时长下该目标用户对于该视频类型的兴趣值可以为0.8,在三周的关注时长下该目标用户对于该目标用户对于该视频类型的兴趣值可以为0.5,在四周的关注时长下该目标用户对于该视频类型的兴趣值可以为0.2。
S107C,针对每一目标标签,确定该目标用户对于该目标标签对应的视频类型的关注周期的总时长,并确定该多个目标标签中属于该目标标签对应视频类型的标签数量,作为该目标标签对应的标签数量;
其中,每一视频类型的关注周期的总时长的确定方式存在多种。
示例性的,一种实现方式中,针对每一视频类型,若该视频类型所包括的一个内容标签,例如:“挑战主持人”,目标用户在某一关注时长下对该内容标签的兴趣值达到一个较小且稳定的数值时,认为完成一个关注周期,进而,可以将该内容标签的关注总时长,即该某一关注时长,作为该视频类型的关注周期的总时长。示例性的,在另一实现方式中,针对每一视频类型,对于该视频类型包括的每一内容标签,若目标用户在某一关注时长下对该内容标签的兴趣值达到一个较小且稳定的数值,得到该内容标签的关注总时长,进而,将该多个内容标签的关注总时长的平均值确定为该视频类型的关注周期的总时长。示例性的,在又一种实现方式中,可以根据经验来确定每个视频类型的关注周期的总时长,例如:“综艺类”视频类型,由于综艺类的一季视频通常播出12周,那么,可以将“综艺类”视频类型的关注周期的总时长确定为12周。
S107D,针对每一目标标签,利用该目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、该目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
相应的,步骤S105,可以包括:
S105A,基于各个目标标签的修改后的标签权重,从各个目标标签中,选取用于视频推荐的目标标签。
示例性的,针对每一目标标签,利用该目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、该目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重,包括:
针对每一目标标签,利用目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,按照预定的修正公式,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
其中,该预定的修正公式包括:
W(u,t)’=W(u,t)*Pt
其中,
Figure BDA0002559062090000191
式中,cur为目标用户u对于目标标签t的目标关注时长,m为目标标签t对应的标签数量,T为目标用户u对目标标签t对应的视频类型的关注周期的总时长,f为目标标签t对应的第二兴趣值,v为预设调整因子。
相对现有技术而言,本实施例所提供方案,考虑的数据维度增多,能够降低热度对于视频推荐的影响,达到去热度化效果。因此,通过本方案解决现有技术中视频推荐的准确度不高的问题。并且,依据目标用户自身对于目标标签对应视频类型的感兴趣规律,对目标标签的标签权重进行修正,使得更贴合目标用户的实际兴趣倾向,进一步提升视频推荐的准确度。
相应于上述方法实施例,本发明实施例还提供了一种视频推荐装置,如图4所示,所述装置可以包括:
标签获取模块410,用于获取多个目标标签,所述目标标签为目标用户已访问视频的内容标签;
数据获取模块420,用于针对每一目标标签,获取该目标标签的热度值和该目标标签对应的第一兴趣值,所述第一兴趣值用于表征所述目标用户对于具有该目标标签的同一类视频的感兴趣程度;
程度值确定模块430,用于针对每一目标标签,基于目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数,确定该目标标签对于区分用户兴趣的重要程度值;其中,所述目标客户端是为所述目标用户提供视频的客户端;
权重计算模块440,用于针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于所述目标用户的重要程度值,计算该目标标签的标签权重;
标签选取模块450,用于基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签;
视频推荐模块460,用于基于所选取的目标标签,从视频库选取针对所述目标用户的推荐视频,并将所选取的推荐视频推荐给所述目标用户。
本发明实施例所提供的方案中,在获取到多个目标标签后,不但获取每一目标标签的热度值和每一目标标签对应的第一兴趣值,而且,还基于目标客户端的用户总人数和在目标客户端中访问过具有该目标标签的视频的目标人数,计算该目标标签对于区分用户兴趣的重要程度值;进而,利用这三类数据,计算每一目标标签的标签权重,基于各个目标标签的标签权重,选取用于视频推荐的目标标签,基于所选取的目标标签,从视频库选取针对目标目标用户的推荐视频,并将所选取的推荐视频推荐给该目标用户。相对现有技术而言,本方案考虑的数据维度增多,能够降低热度对于视频推荐的影响,达到去热度化效果。因此,通过本方案解决现有技术中视频推荐的准确度不高的问题。
可选地,所述确定该目标标签对于区分用户兴趣的重要程度值所利用的公式,包括:
Figure BDA0002559062090000211
其中,F(t)为目标标签t对于区分用户兴趣的重要程度值,N为所述目标客户端的用户总人数,K为在所述目标客户端中访问过具有目标标签t的视频的目标人数。
可选地,所述权重计算模块440具体用于:针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第一预定公式,计算该目标标签的标签权重;
其中,所述第一预定公式包括:
W(u,t)=Mu,t*Ht*F(t)
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,Mu,t为目标标签t对应的第一兴趣值;Ht为目标标签t的热度值,F(t)为目标标签t对于区分用户兴趣的重要程度值。
可选地,所述数据获取模块420具体用于:针对每一目标标签,获取在所述目标用户每次访问具有该目标标签的视频时,该目标标签的热度值和该目标标签对应的第一兴趣值;
所述程度值确定模块430具体用于:针对每一目标标签,获取在所述目标用户每次访问具有该目标标签的视频时,目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数;并利用所获取到的用户总人数和目标人数,确定在所述目标用户每次访问具有该目标标签的视频时,该目标标签对于区分用户兴趣的重要程度值。
可选地,所述权重计算模块440具体用于:
针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第二预定公式,计算该目标标签的标签权重;
其中,所述第二预定公式包括:
Figure BDA0002559062090000221
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,n为目标用户u访问具有目标标签t的视频的访问次数,i为访问次数的标识;
Figure BDA0002559062090000222
为目标用户u第i次访问具有目标标签t的视频时,目标标签t对应的第一兴趣值;/>
Figure BDA0002559062090000223
为目标用户u第i次访问具有该目标标签t的视频时,目标标签t的热度值;F(t)i为目标用户u第i次访问具有该目标标签t的视频时,目标标签t对于区分用户兴趣的重要程度值。
可选地,如图5所示,所述装置还包括:
修正模块470,用于标签选取模块450基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签之前,
针对每一目标标签,确定所述目标用户对于该目标标签的目标关注时长;其中,所述目标关注时长为从所述目标用户第一次访问具有该目标标签的视频的时间点到当前时间的时长;
针对每一目标标签,从预先为该目标标签对应的视频类型所设定的、关于各个关注时长与各个关注时长下所述目标用户对于所述视频类型的兴趣值的映射关系,确定与所述目标关注时长对应的兴趣值,作为该目标标签对应的第二兴趣值;其中,该目标标签对应的视频类型为具有该目标标签的视频所属的视频类型,所述目标用户对于所述视频类型的兴趣值用于表征所述目标用户对于所述视频类型的视频的感兴趣程度;
针对每一目标标签,确定所述目标用户对于该目标标签对应的视频类型的关注周期的总时长,并确定所述多个目标标签中属于该目标标签对应视频类型的标签数量,作为该目标标签对应的标签数量;
针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
所述标签选取模块450具体用于:
基于各个目标标签的修改后的标签权重,从各个目标标签中,选取用于视频推荐的目标标签。
可选地,所述修正模块470针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重,包括:
针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,按照预定的修正公式,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
其中,所述预定的修正公式包括:
W(u,t)′=W(u,t)*Pt
其中,
Figure BDA0002559062090000231
式中,cur为目标用户u对于目标标签t的目标关注时长,m为目标标签t对应的标签数量,T为目标用户u对目标标签t对应的视频类型的关注周期的总时长,f为目标标签t对应的第二兴趣值,v为预设调整因子。
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现本发明实施例所提供的视频推荐方法的步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例所提供的视频推荐方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例所提供的视频推荐方法的步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字目标用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种视频推荐方法,其特征在于,包括:
获取多个目标标签,所述目标标签为目标用户已访问视频的内容标签;
针对每一目标标签,获取该目标标签的热度值和该目标标签对应的第一兴趣值,所述第一兴趣值用于表征所述目标用户对于具有该目标标签的同一类视频的感兴趣程度;
针对每一目标标签,基于目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数,确定该目标标签对于区分用户兴趣的重要程度值;其中,所述目标客户端是为所述目标用户提供视频的客户端;
针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重;
基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签;
基于所选取的目标标签,从视频库选取针对所述目标用户的推荐视频,并将所选取的推荐视频推荐给所述目标用户。
2.根据权利要求1所述的方法,其特征在于,所述确定该目标标签对于区分用户兴趣的重要程度值所利用的公式,包括:
Figure FDA0002559062080000011
其中,F(t)为目标标签t对于区分用户兴趣的重要程度值,N为所述目标客户端的用户总人数,K为在所述目标客户端中访问过具有目标标签t的视频的目标人数。
3.根据权利要求2所述的方法,其特征在于,所述针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重,包括:
针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第一预定公式,计算该目标标签的标签权重;
其中,所述第一预定公式包括:
W(u,t)=Mu,t*Ht*F(t)
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,Mu,t为目标标签t对应的第一兴趣值;Ht为目标标签t的热度值,F(t)为目标标签t对于区分用户兴趣的重要程度值。
4.根据权利要求1所述的方法,其特征在于,所述针对每一目标标签,获取该目标标签的热度值和该目标标签对应的第一兴趣值,包括:
针对每一目标标签,获取在所述目标用户每次访问具有该目标标签的视频时,该目标标签的热度值和该目标标签对应的第一兴趣值;
所述针对每一目标标签,基于目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数,确定该目标标签对于区分用户兴趣的重要程度值,包括:
针对每一目标标签,获取在所述目标用户每次访问具有该目标标签的视频时,目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数;并利用所获取到的用户总人数和目标人数,确定在所述目标用户每次访问具有该目标标签的视频时,该目标标签对于区分用户兴趣的重要程度值。
5.根据权利要求4所述的方法,其特征在于,所述针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,计算该目标标签的标签权重,包括:
针对每一目标标签,根据所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于区分用户兴趣的重要程度值,利用第二预定公式,计算该目标标签的标签权重;
其中,所述第二预定公式包括:
Figure FDA0002559062080000021
式中,W(u,t)为在对目标用户u进行视频推荐时目标标签t的标签权重,n为目标用户u访问具有目标标签t的视频的访问次数,i为访问次数的标识;
Figure FDA0002559062080000031
为目标用户u第i次访问具有目标标签t的视频时,目标标签t对应的第一兴趣值;/>
Figure FDA0002559062080000032
为目标用户u第i次访问具有该目标标签t的视频时,目标标签t的热度值;F(t)i为目标用户u第i次访问具有该目标标签t的视频时,目标标签t对于区分用户兴趣的重要程度值。
6.根据权利要求1-5任一项所述的方法,其特征在于,基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签之前,所述方法还包括:
针对每一目标标签,确定所述目标用户对于该目标标签的目标关注时长;其中,所述目标关注时长为从所述目标用户第一次访问具有该目标标签的视频的时间点到当前时间的时长;
针对每一目标标签,从预先为该目标标签对应的视频类型所设定的、关于各个关注时长与各个关注时长下所述目标用户对于所述视频类型的兴趣值的映射关系,确定与所述目标关注时长对应的兴趣值,作为该目标标签对应的第二兴趣值;其中,该目标标签对应的视频类型为具有该目标标签的视频所属的视频类型,所述目标用户对于所述视频类型的兴趣值用于表征所述目标用户对于所述视频类型的视频的感兴趣程度;
针对每一目标标签,确定所述目标用户对于该目标标签对应的视频类型的关注周期的总时长,并确定所述多个目标标签中属于该目标标签对应视频类型的标签数量,作为该目标标签对应的标签数量;
针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
所述基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签,包括:
基于各个目标标签的修改后的标签权重,从各个目标标签中,选取用于视频推荐的目标标签。
7.根据权利要求6所述的方法,其特征在于,所述针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重,包括:
针对每一目标标签,利用所述目标用户对于该目标标签的目标关注时长、该目标标签对应的标签数量、所述目标用户对该目标标签对应的视频类型的关注周期的总时长,以及该目标标签对应的第二兴趣值,按照预定的修正公式,对该目标标签的标签权重进行修正,得到该目标标签的修正后的标签权重;
其中,所述预定的修正公式包括:
W(u,t)’=W(u,t)*Pt
其中,
Figure FDA0002559062080000041
式中,cur为目标用户u对于目标标签t的目标关注时长,m为目标标签t对应的标签数量,T为目标用户u对目标标签t对应的视频类型的关注周期的总时长,f为目标标签t对应的第二兴趣值,v为预设调整因子。
8.一种视频推荐装置,其特征在于,包括:
标签获取模块,用于获取多个目标标签,所述目标标签为目标用户已访问视频的内容标签;
数据获取模块,用于针对每一目标标签,获取该目标标签的热度值和该目标标签对应的第一兴趣值,所述第一兴趣值用于表征所述目标用户对于具有该目标标签的同一类视频的感兴趣程度;
程度值确定模块,用于针对每一目标标签,基于目标客户端的用户总人数和在所述目标客户端中访问过具有该目标标签的视频的目标人数,确定该目标标签对于区分用户兴趣的重要程度值;其中,所述目标客户端是为所述目标用户提供视频的客户端;
权重计算模块,用于针对每一目标标签,利用所获取到的该目标标签的热度值和该目标标签对应的第一兴趣值,以及该目标标签对于所述目标用户的重要程度值,计算该目标标签的标签权重;
标签选取模块,用于基于各个目标标签的标签权重,从各个目标标签中,选取用于视频推荐的目标标签;
视频推荐模块,用于基于所选取的目标标签,从视频库选取针对所述目标用户的推荐视频,并将所选取的推荐视频推荐给所述目标用户。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
CN202010605954.0A 2020-06-29 2020-06-29 一种视频推荐方法、装置及电子设备 Active CN111767429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010605954.0A CN111767429B (zh) 2020-06-29 2020-06-29 一种视频推荐方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010605954.0A CN111767429B (zh) 2020-06-29 2020-06-29 一种视频推荐方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111767429A CN111767429A (zh) 2020-10-13
CN111767429B true CN111767429B (zh) 2023-06-02

Family

ID=72722997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010605954.0A Active CN111767429B (zh) 2020-06-29 2020-06-29 一种视频推荐方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111767429B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112231580B (zh) * 2020-11-10 2024-04-02 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN112699159A (zh) * 2020-11-13 2021-04-23 杭州海康威视系统技术有限公司 一种数据显示方法、装置及设备
CN112765400B (zh) * 2020-12-31 2024-04-23 上海众源网络有限公司 兴趣标签的权重更新方法、内容推荐方法、装置及设备
CN113724016A (zh) * 2021-09-09 2021-11-30 北京有竹居网络技术有限公司 获取多媒体资源关注度的方法、装置、介质及设备
CN113507624B (zh) * 2021-09-10 2021-12-21 明品云(北京)数据科技有限公司 一种视频信息推荐方法及系统
CN113836355A (zh) * 2021-10-20 2021-12-24 盐城金堤科技有限公司 视频推荐方法及其装置、计算机存储介质、电子设备
CN114003826A (zh) * 2021-12-31 2022-02-01 思创数码科技股份有限公司 资源目录推荐方法、装置、可读存储介质及电子设备
CN116132745A (zh) * 2023-04-17 2023-05-16 北京盘腾科技有限公司 一种多终端的视频交互方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130112303A (ko) * 2012-04-03 2013-10-14 고려대학교 산학협력단 커뮤니티 서비스 기반의 컨텐츠 추천 시스템 및 컨텐츠 추천 방법
CN106383904A (zh) * 2016-09-29 2017-02-08 中国联合网络通信集团有限公司 视频推荐方法及装置
CN106445969A (zh) * 2015-08-11 2017-02-22 北京字节跳动科技有限公司 一种全局兴趣探索推荐方法和装置
CN109213933A (zh) * 2018-08-14 2019-01-15 腾讯科技(深圳)有限公司 内容项推荐方法、装置、设备及存储介质
CN111177538A (zh) * 2019-12-13 2020-05-19 杭州顺网科技股份有限公司 一种基于无监督权值计算的用户兴趣标签构建方法
CN111258484A (zh) * 2020-02-12 2020-06-09 北京奇艺世纪科技有限公司 一种视频播放方法、装置、电子设备及存储介质
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170169341A1 (en) * 2015-12-14 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method for intelligent recommendation
CN105872629B (zh) * 2016-03-18 2019-08-27 合一网络技术(北京)有限公司 内容推荐方法、装置及系统
CN107087235B (zh) * 2017-04-21 2021-09-10 腾讯科技(深圳)有限公司 媒体内容推荐方法、服务器及客户端
US20200074322A1 (en) * 2018-09-04 2020-03-05 Rovi Guides, Inc. Methods and systems for using machine-learning extracts and semantic graphs to create structured data to drive search, recommendation, and discovery

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130112303A (ko) * 2012-04-03 2013-10-14 고려대학교 산학협력단 커뮤니티 서비스 기반의 컨텐츠 추천 시스템 및 컨텐츠 추천 방법
CN106445969A (zh) * 2015-08-11 2017-02-22 北京字节跳动科技有限公司 一种全局兴趣探索推荐方法和装置
CN106383904A (zh) * 2016-09-29 2017-02-08 中国联合网络通信集团有限公司 视频推荐方法及装置
CN109213933A (zh) * 2018-08-14 2019-01-15 腾讯科技(深圳)有限公司 内容项推荐方法、装置、设备及存储介质
CN111177538A (zh) * 2019-12-13 2020-05-19 杭州顺网科技股份有限公司 一种基于无监督权值计算的用户兴趣标签构建方法
CN111258484A (zh) * 2020-02-12 2020-06-09 北京奇艺世纪科技有限公司 一种视频播放方法、装置、电子设备及存储介质
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A survey on personalized newa recommendation technology;miaomiao Li;IEEE;全文 *
基于向量化标签的视频推荐算法研究与实现;许良武;;无线互联科技(12);全文 *
融合热度和隐特征分析模型推荐个性化森林旅游景点;蔡清;;林业经济问题(01);全文 *

Also Published As

Publication number Publication date
CN111767429A (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
CN111767429B (zh) 一种视频推荐方法、装置及电子设备
CN110929052B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN109145210B (zh) 一种信息推荐的方法、装置及存储介质
US10162891B2 (en) Determining demographics based on user interaction
KR101060487B1 (ko) 태그 클라우드를 이용한 콘텐츠 추천 장치 및 방법
US20170171336A1 (en) Method and electronic device for information recommendation
CN106708817B (zh) 信息搜索方法及装置
CN109753601B (zh) 推荐信息点击率确定方法、装置及电子设备
CN109903086B (zh) 一种相似人群扩展方法、装置及电子设备
CN106878405B (zh) 一种调整推送项目的方法及装置
CN109451333B (zh) 一种弹幕显示方法、装置、终端及系统
CN113656681B (zh) 一种对象评价方法、装置、设备及存储介质
CN111753239B (zh) 一种资源分发方法、装置、电子设备及存储介质
CN113688310A (zh) 一种内容推荐方法、装置、设备及存储介质
CN111291217B (zh) 一种内容推荐方法、装置、电子设备以及计算机可读介质
CN113672793A (zh) 一种信息召回方法、装置、电子设备及存储介质
CN111597448A (zh) 一种信息的热度的确定方法、装置及电子设备
CN111090810A (zh) 一种应用消息的推送方法、装置及电子设备
US20190236091A1 (en) Media content recommendation method and apparatus and storage medium
US11200288B1 (en) Validating interests for a search and feed service
CN109168044B (zh) 一种视频特征的确定方法及装置
CN112733014A (zh) 推荐方法、装置、设备及存储介质
JP6960838B2 (ja) 情報提供装置、情報提供方法、およびプログラム
CN111177561A (zh) 一种测试方法和装置
CN111324733A (zh) 内容推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant