CN112417207B - 一种视频推荐方法、装置、设备及存储介质 - Google Patents
一种视频推荐方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112417207B CN112417207B CN202011333517.4A CN202011333517A CN112417207B CN 112417207 B CN112417207 B CN 112417207B CN 202011333517 A CN202011333517 A CN 202011333517A CN 112417207 B CN112417207 B CN 112417207B
- Authority
- CN
- China
- Prior art keywords
- video
- feature data
- candidate
- historical
- historical playing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种视频推荐方法、装置、设备及存储介质,涉及视频推荐技术领域。该方法包括:获取目标用户的历史操作数据;分别对该历史操作数据中的各历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各历史播放视频特征数据对应的注意力权重;根据各历史播放视频特征数据以及该注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据;以该目标用户的属性特征数据、上下文特征数据、每个候选视频对应的综合历史播放视频特征数据以及各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各候选视频的点击概率;根据候选视频的点击概率,向该目标用户推荐视频。这样可以提高视频推荐结果的准确性。
Description
技术领域
本申请涉及视频推荐技术领域,具体而言,涉及一种视频推荐方法、装置、设备及存储介质。
背景技术
随着互联网技术的发展以及智能电视的普及,家庭用户在享受智能电视多样化服务的同时,也逐渐显现出许多潜在的需求。为了更好的满足家庭用户的需求,为家庭用户推荐符合其兴趣、习惯的视频,视频推荐系统成为研究的热点。
目前,视频推荐系统直接将用户画像中的特征数据输入到经典的排序模型(如点击率预估模型)中,该排序模型可输出与该家庭用户画像中的特征数据匹配的视频。
随着智能电视性能的提升,家庭用户的兴趣也会因为外界因素(如热点)的影响,发生动态的变化,这些动态的变化与用户画像中的行为序列具有密切的联系。然而,目前的用户画像中,对于行为序列的处理较为简单,因此目前的用户画像难以表现出家庭用户实际的兴趣特点,进而,基于目前的用户画像向家庭用户推荐视频时,会导致推荐结果不准确的现象。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种视频推荐方法、装置、设备及存储介质,可以提高视频推荐的准确性。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种视频推荐方法,所述方法包括:
获取目标用户在预设历史时间段的历史操作数据,其中,所述历史操作数据包括所述目标用户的属性特征数据、历史播放视频特征数据;
分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各所述历史播放视频特征数据对应的注意力权重,所述候选视频特征数据用于表征候选视频的特征;
根据各所述历史播放视频特征数据以及各所述历史播放视频特征数据对应的注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据;
以所述目标用户的所述属性特征数据、所述目标用户对应的上下文特征数据、所述每个候选视频对应的综合历史播放视频特征数据以及所述各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各所述候选视频的点击概率;
根据各所述候选视频的点击概率,向所述目标用户推荐视频。
可选地,所述分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各所述历史播放视频特征数据对应的注意力权重,包括:
分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重。
可选地,所述分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行关联处理之前,所述方法还包括:
根据多个用户的历史操作数据以及视频库中的视频特征数据,从所述视频库中筛选出多个候选视频;
对各所述候选视频进行特征分析,得到各所述候选视频特征数据。
可选地,所述分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重,包括:
将所述目标用户的各历史播放视频特征数据以及各候选视频特征数据进行嵌入编码,得到各历史播放视频特征向量以及各候选视频特征向量;
分别对各历史播放视频特征向量与各候选视频特征向量进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重。
可选地,所述分别对各播放视频特征向量与各候选视频特征向量进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重,包括:
分别对各所述历史播放视频特征向量与各所述候选视频特征向量进行叉积操作,得到各所述历史播放视频特征向量对应的叉积操作结果;
分别将各所述历史播放视频特征向量、各所述历史播放视频特征向量对应的叉积操作结果以及各所述候选视频特征向量进行拼接,得到多个第一拼接向量;
将各所述第一拼接向量输入第一激活函数中,得到各所述历史播放视频特征数据对应的注意力权重。
可选地,所述根据各所述候选视频的点击概率,向所述目标用户推荐视频,包括:
向所述目标用户推荐点击概率大于预设阈值的候选视频。
可选地,所述以所述目标用户的所述属性特征数据、所述目标用户对应的上下文特征数据、所述每个候选视频对应的综合历史播放视频特征数据以及所述各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各所述候选视频的点击概率之前,所述方法还包括:
根据多个用户的历史操作数据以及各用户对各样本视频的操作数据,构建正负训练样本;
使用所述正负训练样本训练初始视频推荐模型,得到所述视频推荐模型。
第二方面,本申请实施例还提供了一种视频推荐装置,所述装置包括:
第一获取模块,用于获取目标用户在预设历史时间段的历史操作数据,其中,所述历史操作数据包括所述目标用户的属性特征数据、历史播放视频特征数据;
关联处理模块,用于分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各所述历史播放视频特征数据对应的注意力权重,所述候选视频特征数据用于表征候选视频的特征;
重构模块,用于根据各所述历史播放视频特征数据以及各所述历史播放视频特征数据对应的注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据;
第二获取模块,用于以所述目标用户的所述属性特征数据、所述目标用户对应的上下文特征数据、所述每个候选视频对应的综合历史播放视频特征数据以及所述各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各所述候选视频的点击概率;
推荐模块,用于根据各所述候选视频的点击概率,向所述目标用户推荐视频。
可选地,所述关联处理模块,具体用于分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重。
可选地,所述装置还包括:
筛选模块,用于根据多个用户的历史操作数据以及视频库中的视频特征数据,从所述视频库中筛选出多个候选视频;
分析模块,用于对各所述候选视频进行特征分析,得到各所述候选视频特征数据。
可选地,所述关联处理模块,还具体用于将所述目标用户的各历史播放视频特征数据以及各候选视频特征数据进行嵌入编码,得到各历史播放视频特征向量以及各候选视频特征向量;分别对各历史播放视频特征向量与各候选视频特征向量进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重。
可选地,所述关联处理模块,还具体用于分别对各所述历史播放视频特征向量与各所述候选视频特征向量进行叉积操作,得到各所述历史播放视频特征向量对应的叉积操作结果;分别将各所述历史播放视频特征向量、各所述历史播放视频特征向量对应的叉积操作结果以及各所述候选视频特征向量进行拼接,得到多个第一拼接向量;将各所述第一拼接向量输入第一激活函数中,得到各所述历史播放视频特征数据对应的注意力权重。
可选地,所述推荐模块,具体用于向所述目标用户推荐点击概率大于预设阈值的候选视频。
可选地,所述装置还包括:
训练模块,用于根据多个用户的历史操作数据以及各用户对各样本视频的操作数据,构建正负训练样本;使用所述正负训练样本训练初始视频推荐模型,得到所述视频推荐模型。
第三方面,本申请实施例提供了一种视频推荐设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述视频推荐设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行上述第一方面的所述视频推荐方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面的所述视频推荐方法的步骤。
本申请的有益效果是:
本申请实施例提供一种视频推荐方法、装置、设备及存储介质,该方法包括:获取目标用户在预设历史时间段的历史操作数据,其中,该历史操作数据包括该目标用户的属性特征数据、历史播放视频特征数据;分别对该目标用户的各历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各历史播放视频特征数据对应的注意力权重,该候选视频特征数据用于表征候选视频的特征;根据各历史播放视频特征数据以及各历史播放视频特征数据对应的注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据;以该目标用户的属性特征数据、该目标用户对应的上下文特征数据、每个候选视频对应的综合历史播放视频特征数据以及各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各候选视频的点击概率;根据候选视频的点击概率,向该目标用户推荐视频。
采用本申请实施例提供的视频推荐方法,在获取到目标用户的各历史播放视频特征数据后,可分别将各历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各候选播放视频相关联的各历史播放视频特征数据的注意力权重,进而重构出各候选视频对应的综合历史播放视频特征数据。也就是说,通过关联处理后得到的综合历史播放视频特征数据可以更好的表现出用户实际的兴趣特点,进而再基于预先训练获取的视频推荐模型以及目标用户当前请求对应的上下文、属性特征数据、综合历史播放视频特征数据可以向目标用户推荐更符合其兴趣特点的视频,即提高了视频推荐结果的准确性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种视频推荐方法的流程示意图;
图2为本申请实施例提供的一种展示视频推荐的过程的示意图;
图3为本申请实施例提供的另一种视频推荐方法的流程示意图;
图4为本申请实施例提供的又一种视频推荐方法的流程示意图;
图5为本申请实施例提供的一种视频推荐模型训练方法的流程示意图;
图6为本申请实施例提供的一种视频推荐装置的结构示意图;
图7为本申请实施例提供的一种视频推荐设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在对本申请实施例进行详细解释之前,首先对本申请的应用场景予以介绍。该应用场景具体可以为面向家庭用户的视频推荐场景,也可以为面向其他网络用户的视频推荐场景,本申请不对其进行限定。用户通过在多媒体播放设备上进行浏览等操作来获取想要观看的视频资源,该视频资源可由后台的服务器提供。通过埋点等技术,该服务器还可获取各用户产生的日志信息,通过分析获取到的预设时间段的日志信息得到各用户的兴趣爱好,进而为用户提供更好的服务。
随着网络技术的发展,用户的兴趣爱好会受外界因素(如热点)的影响,发生动态的变化。也就是说,直接利用日志信息表征用户的兴趣爱好是不明显的。本申请通过对日志信息中的历史播放视频特征数据进行处理,重构出每个候选视频对应的综合历史播放视频特征数据,该综合历史播放视频特征数据可表征各候选视频的重点关注点;然后基于各候选视频对应的综合历史播放视频特征数据、用户当前的请求数据(上下文特征数据)、其他日志信息中包含的其他数据以及预先训练好的视频推荐模型,得到和用户兴趣习惯相匹配的视频。
如下结合附图对本申请所提到的视频推荐方法进行示例说明。图1为本申请实施例提供的一种视频推荐方法的流程示意图,该方法应用于与多媒体播放终端进行交互的服务器。如图1所示,该方法可包括:
S101、获取目标用户在预设历史时间段的历史操作数据。
其中,该历史操作数据包括该目标用户的属性特征数据、历史播放视频特征数据。
多媒体播放终端可将该目标用户对应的日志发送给后台服务器,该服务器可将该目标用户对应的日志保存在相关联的数据库中,可从该数据库中保存的日志中获取该目标用户的历史操作数据。本申请以面向家庭用户的应用环境为例进行说明,其他应用环境类似。每个家庭可用家庭标识进行区分,该服务器可从该数据库中获取该目标用户的在预设历史时间段的多个日志,从多个日志中分析得到多个历史操作数据,其中,该预设历史时间段可以是一个月、三个月等。需要说明的是,该目标用户代表的是目标家庭,也就是说,该目标用户中可包括多个家庭成员,对应的历史操作数据是从多个家庭成员的历史行为中分析得到的。
进一步的,该目标用户的属性特征数据可包括家庭成员的分布数据(如老人、小孩)、年龄数据(如2-4岁、18-25岁、60-70岁)、性别(如男、女)、是否是会员、偏好时间段、偏好星期信息等;该目标用户的历史播放视频特征数据可包括视频标题、类别、语言、一二级分类、导演、演员嘉宾、获奖性等数据等,还可包括一些交叉特性(如18岁的男性)、非线性高阶特征等,需要说明的是,本申请不对其进行限定。
S102、分别对该目标用户的各历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各历史播放视频特征数据对应的注意力权重。
其中,该候选视频特征数据用于表征候选视频的特征;该候选视频的特征可包括视频的属性特征(如类别、标题、语言等)、被点击的次数以及点击率等特征。
可分别将该目标用户的各历史播放视频数据以及各候选视频特征数据输入注意力模块中,该注意力模块可将各历史播放视频数据与各候选视频特征数据进行关联,通过关联,可以得到各历史播放视频数据对应用户对各候选视频特征数据的关注程度。
举例来说,假设该目标用户对应的历史播放视频的个数为3个,即有3个历史播放视频特征数据,候选视频的个数为5个,即有5个候选视频特征数据。以一个候选视频来说,那么通过该注意力模块,就可知道这三个历史播放视频特征数据分别对该候选视频的关注度,该关注度可用注意力权重来表示。注意力权重越大,代表着该历史播放视频特征数据和该候选视频的关注度越大,即关联性越强;注意力权重越小,代表着该历史播放视频特征数据和该候选视频的关注度越小,即关联性越弱。
S103、根据各历史播放视频特征数据以及各历史播放视频特征数据对应的注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据。
此处以一个候选视频来说,该候选视频特征数据与各历史播放视频特征数据进行关联处理后,每个历史播放视频特征数据都会与该候选视频对应一个注意力权重,每个历史播放视频特征数据与对应的注意力权重进行池化操作,具体为两者进行加权平均,这样可得到该候选视频对应的综合历史播放视频特征数据。其他候选视频类似,此处不再详细解释。
S104、以该目标用户的属性特征数据、该目标用户对应的上下文特征数据、该每个候选视频对应的综合历史播放视频特征数据以及各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各候选视频的点击概率。
该服务器还可获取该目标用户当前请求对应的上下文数据,该上下文数据可包括时间数据,该时间数据可包括当前的时间点、日期、星期信息等,也可包括该目标用户当前点击的栏位位置数据等,本申请不对其进行限定。在获取到该目标用户对应的上下文特征数据后,可与该目标用户对应的历史操作数据中的属性特征数据、各候选视频特征数据以及上述提到的与各候选视频特征数据对应的综合历史播放视频特征数据进行拼接,一起输入到预先训练好的视频推荐模型中的多层全连接神经网络的输入层,通过多层全连接神经网络的softmax激励函数后,可输出各候选视频的点击率。
S105、根据各候选视频的点击概率,向该目标用户推荐视频。
其中,各候选视频的点击概率为(0-1)之间的任何一个数,并且所有候选视频的点击概率之和为1,在得到各候选视频的点击概率后,可根据预先设置的推荐条件,向该目标用户推荐满足该推荐条件的视频,其中,该推荐条件可以为可将点击概率大于阈值的视频推荐给该目标用户。
为了清楚展示视频推荐的过程,现对获取的特征数据,例如属性特征数据、历史播放视频特征数据、上下文特征数据以及候选视频特征数据,处理过程进行简要示出,如图2所示。在获取到该目标用户的属性特征数据、历史播放视频特征数据以及上下文特征数据后,首先将该历史播放视频特征数据与获取到的候选视频特征数据输入注意力模块100,该注意力模块输出该历史播放视频特征数据对应的注意力权重,同理,其他历史播放视频特征数据与其他候选视频特征数据也进行上述操作,将注意力模块100输出的注意力权重以及历史播放视频特征数据输入到池化模块200中,池化模块200输出每个候选视频对应的综合历史播放视频特征数据。
然后再将该目标用户的属性特征数据、上下文特征数据、池化模块200输出的综合历史播放视频特征数据以及候选视频特征数据进行拼接后输入多层全连接神经网络300的输入层,最后通过多层全连接神经网络300的softmax激励函数输出候选视频的点击率。
综上所述,本申请提供的视频推荐方法中,获取目标用户在预设历史时间段的历史操作数据,其中,该历史操作数据包括该目标用户的属性特征数据、历史播放视频特征数据;分别对该目标用户的各历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各历史播放视频特征数据对应的注意力权重,该候选视频特征数据用于表征候选视频的特征;根据各历史播放视频特征数据以及各历史播放视频特征数据对应的注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据;以该目标用户的属性特征数据、该目标用户对应的上下文特征数据、每个候选视频对应的综合历史播放视频特征数据以及各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各候选视频的点击概率;根据候选视频的点击概率,向该目标用户推荐视频。
采用本申请实施例提供的视频推荐方法,在获取到目标用户的各历史播放视频特征数据后,可分别将各历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各候选播放视频相关联的各历史播放视频特征数据的注意力权重,进而重构出各候选视频对应的综合历史播放视频特征数据。也就是说,通过关联处理后得到的综合历史播放视频特征数据可以更好的表现出用户实际的兴趣特点,进而再基于预先训练获取的视频推荐模型以及目标用户当前请求对应的上下文、属性特征数据、综合历史播放视频特征数据可以向目标用户推荐更符合其兴趣特点的视频,即提高了视频推荐结果的准确性。
可选地,上述分别对该目标用户的各历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各历史播放视频特征数据对应的注意力权重,包括:分别对该目标用户的各历史播放视频特征数据与各候选视频特征数据进行叉积操作,得到各历史播放视频特征数据对应的注意力权重。
其中,该目标用户的各历史播放视频特征数据可分别用向量表示,各候选视频特征数据也可分别用向量表示,每个用向量表示的历史播放视频特征数据可分别与一个用向量表示的候选视频特征数据进行向量叉积操作,向量叉积操作后得到的结果也是一个向量。需要说明的是,每个向量结果都会对应一个用向量表示的历史播放视频特征数据以及一个用向量表示的候选视频特征数据,然后基于每个向量结果、每个用向量表示的历史播放视频特征数据以及每个用向量表示的候选视频特征数据,可得到每个以向量表示的候选视频特征数据为维度,每个用向量表示的历史播放视频特征数据对应的注意力权重。
图3为本申请实施例提供的另一种视频推荐方法的流程示意图。如图3所示,可选地,分别对该目标用户的各历史播放视频特征数据与各候选视频特征数据进行关联处理之前,该方法还包括:
S201、根据多个用户的历史操作数据以及视频库中的视频特征数据,从该视频库中筛选出多个候选视频。
S202、对各候选视频进行特征分析,得到各候选视频特征数据。
其中,该用户可包括在多媒体播放终端注册过的用户,也可包括在多媒体播放终端未注册过的用户,本申请不对其进行限定。该视频库中预先存储的视频是千万量级别的,该服务器可根据该千万量级别的视频特征数据、多个用户在预设时间段内的历史操作数据以及预先训练好的筛选模型,得到与该多个用户的历史操作数据匹配程度较高的多个视频,将该多个视频分别作为候选视频,并提取各候选视频特征数据,其中,该候选视频特征可包括候选视频的属性特征(如类别、标题、语言等)、被点击的次数以及点击率等特征。这样可将千万量级别的视频降为千级别甚至百级别的视频,进而可以提高推荐视频的效率。
图4为本申请实施例提供的又一种视频推荐方法的流程示意图。如图4所示,可选地,分别对该目标用户的各历史播放视频特征数据与各候选视频特征数据进行叉积操作,得到各历史播放视频特征数据对应的注意力权重,包括:
S301、将该目标用户的各历史播放视频特征数据以及各候选视频特征数据进行嵌入编码,得到各历史播放视频特征向量以及各候选视频特征向量。
可采用embedding(嵌入)的编码方式分别将各历史播放视频特征数据用一向量表示,得到各历史播放视频特征向量,同理,利用embedding的编码方式分别将各候选视频特征数据用一向量表示,得到各候选视频特征向量。这样可用低维密度空间表示稀疏的视频特征数据。
S302、分别对各历史播放视频特征向量与各候选视频特征向量进行叉积操作,得到各历史播放视频特征数据对应的注意力权重。
可选地,分别对各历史播放视频特征向量与各候选视频特征向量进行叉积操作,得到各历史播放视频特征向量对应的叉积操作结果;分别将各历史播放视频特征向量、各历史播放视频特征向量对应的叉积操作结果以及各候选视频特征向量进行拼接,得到多个第一拼接向量;将各第一拼接向量输入第一激活函数中,得到各历史播放视频特征数据对应的注意力权重。
其中,两个向量进行叉积操作,得到的叉积操作结果还是一个向量,也就是说,H个历史播放视频特征向量与一个候选视频特征向量分别进行叉积操作,可得到H个向量叉积操作结果。可将每个向量叉积操作结果与其对应的历史播放视频特征向量以及候选视频特征向量输入到拼接层,该拼接层输出每个历史播放视频特征向量对应的第一拼接向量。分别将各第一拼接向量依次输入激活层(即第一激活函数)、线性输出层等,最后可输出每个候选视频对应的各历史播放视频的注意力权重。
可选地,根据各候选视频的点击概率,向该目标用户推荐视频,包括:向该目标用户推荐点击概率大于预设阈值的候选视频。
上述提到的视频推荐模型可输出各候选视频的点击概率,根据各候选视频的点击概率以及预设推荐条件,可将满足该预设推荐条件的候选视频推荐给该目标用户。其中,该预设推荐条件可以为点击概率大于预设阈值,或者按照点击概率从大到小排名的前n个视频,当然,也可以其他预设推荐条件,本申请不对其进行限定。
下述实施例对视频推荐模型的训练过程进行描述。图5为本申请实施例提供的一种视频推荐模型训练方法的流程示意图。如图5所示,可选地,以该目标用户的所述属性特征数据、该目标用户对应的上下文特征数据、每个候选视频对应的综合历史播放视频特征数据以及各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各候选视频的点击概率之前,该方法还可以包括:
S401、根据多个用户的历史操作数据以及各用户对各样本视频的操作数据,构建正负训练样本。
S402、使用该正负训练样本训练初始视频推荐模型,得到该视频推荐模型。
其中,各样本视频可通过专家在视频库中进行筛选而获取,可将各视频曝光在对应的栏位下,如果用户在预设时间段内点击了该视频,那么该视频就相当于正样本视频,如果用户在预设时间段内未点击该视频,那么该视频就相当于负样本视频,该服务器可根据该预设时间段内各用户产生的日志可得到正负训练样本。其中,该正训练样本可包括用户的属性特征数据、历史播放视频特征数据、点击的上下文特征数据以及点击标签数据(1),该负训练样本可包括用户的属性特征数据、历史播放视频特征数据、未点击的上下文特征数据以及未点击标签数据(0),其中,点击/未点击的上下文数据可包括视频所在的栏位位置数据、时间数据等,该时间数据可包括时间点、星期信息以及日期等。将构建好的正负训练样本输入该初始视频推荐模型的输入层,在满足训练停止条件时,代表着该初始视频推荐模型训练完成,即得到该视频推荐模型。
图6为本申请实施例提供的一种视频推荐装置的结构示意图。如图6所示,该装置可以包括:
第一获取模块501,用于获取目标用户在预设历史时间段的历史操作数据;
关联处理模块502,用于分别对该目标用户的各历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各历史播放视频特征数据对应的注意力权重;
重构模块503,用于根据各历史播放视频特征数据以及各历史播放视频特征数据对应的注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据;
第二获取模块504,用于以该目标用户的属性特征数据、该目标用户对应的上下文特征数据、该每个候选视频对应的综合历史播放视频特征数据以及各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各候选视频的点击概率;
推荐模块505,用于根据各候选视频的点击概率,向该目标用户推荐视频。
可选地,关联处理模块502,具体用于分别对该目标用户的各历史播放视频特征数据与各候选视频特征数据进行叉积操作,得到各历史播放视频特征数据对应的注意力权重。
可选地,该装置还包括:筛选模块,用于根据多个用户的历史操作数据以及视频库中的视频特征数据,从所述视频库中筛选出多个候选视频;分析模块,用于对各所述候选视频进行特征分析,得到各所述候选视频特征数据。
可选地,关联处理模块502,还具体用于将该目标用户的各历史播放视频特征数据以及各候选视频特征数据进行嵌入编码,得到各历史播放视频特征向量以及各候选视频特征向量;分别对各历史播放视频特征向量与各候选视频特征向量进行叉积操作,得到各历史播放视频特征数据对应的注意力权重。
可选地,关联处理模块502,还具体用于分别对各历史播放视频特征向量与各候选视频特征向量进行叉积操作,得到各历史播放视频特征向量对应的叉积操作结果;分别将各历史播放视频特征向量、各历史播放视频特征向量对应的叉积操作结果以及各候选视频特征向量进行拼接,得到多个第一拼接向量;将各第一拼接向量输入第一激活函数中,得到各历史播放视频特征数据对应的注意力权重。
可选地,推荐模块505,具体用于向该目标用户推荐点击概率大于预设阈值的候选视频。
可选地,该装置还包括:训练模块,用于根据多个用户的历史操作数据以及各用户对各样本视频的操作数据,构建正负训练样本;使用该正负训练样本训练初始视频推荐模型,得到该视频推荐模型。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(Digital Signal Processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图7为本申请实施例提供的一种视频推荐设备的结构示意图,如图7所示,该视频推荐设备可以包括:处理器601、存储介质602和总线603,存储介质602存储有处理器601可执行的机器可读指令,当该视频推荐设备运行时,处理器601与存储介质602之间通过总线603通信,处理器601执行机器可读指令,以执行上述视频推荐方法的步骤。具体实现方式和技术效果类似,这里不再赘述。
可选地,本申请还提供一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述视频推荐方法的步骤。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (9)
1.一种视频推荐方法,其特征在于,所述方法包括:
获取目标用户在预设历史时间段的历史操作数据,其中,所述历史操作数据包括所述目标用户的属性特征数据、历史播放视频特征数据;
分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各所述历史播放视频特征数据对应的注意力权重,所述候选视频特征数据用于表征候选视频的特征;
根据各所述历史播放视频特征数据以及各所述历史播放视频特征数据对应的注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据;
以所述目标用户的所述属性特征数据、所述目标用户对应的上下文特征数据、所述每个候选视频对应的综合历史播放视频特征数据以及所述各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各所述候选视频的点击概率;
根据各所述候选视频的点击概率,向所述目标用户推荐视频;
其中,所述分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各所述历史播放视频特征数据对应的注意力权重,包括:
分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重;
其中,所述根据各所述历史播放视频特征数据以及各所述历史播放视频特征数据对应的注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据,包括:
将每个候选视频关联的各所述历史播放视频特征数据与对应的注意力权重进行池化操作,重构出每个候选视频对应的综合历史播放视频特征数据。
2.根据权利要求1所述的方法,其特征在于,所述分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行关联处理之前,所述方法还包括:
根据多个用户的历史操作数据以及视频库中的视频特征数据,从所述视频库中筛选出多个候选视频;
对各所述候选视频进行特征分析,得到各所述候选视频特征数据。
3.根据权利要求1所述的方法,其特征在于,所述分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重,包括:
将所述目标用户的各历史播放视频特征数据以及各候选视频特征数据进行嵌入编码,得到各历史播放视频特征向量以及各候选视频特征向量;
分别对各历史播放视频特征向量与各候选视频特征向量进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重。
4.根据权利要求3所述的方法,其特征在于,所述分别对各播放视频特征向量与各候选视频特征向量进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重,包括:
分别对各所述历史播放视频特征向量与各所述候选视频特征向量进行叉积操作,得到各所述历史播放视频特征向量对应的叉积操作结果;
分别将各所述历史播放视频特征向量、各所述历史播放视频特征向量对应的叉积操作结果以及各所述候选视频特征向量进行拼接,得到多个第一拼接向量;
将各所述第一拼接向量输入第一激活函数中,得到各所述历史播放视频特征数据对应的注意力权重。
5.根据权利要求1所述的方法,其特征在于,所述根据各所述候选视频的点击概率,向所述目标用户推荐视频,包括:
向所述目标用户推荐点击概率大于预设阈值的候选视频。
6.根据权利要求1所述的方法,其特征在于,所述以所述目标用户的所述属性特征数据、所述目标用户对应的上下文特征数据、所述每个候选视频对应的综合历史播放视频特征数据以及所述各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各所述候选视频的点击概率之前,所述方法还包括:
根据多个用户的历史操作数据以及各用户对各样本视频的操作数据,构建正负训练样本;
使用所述正负训练样本训练初始视频推荐模型,得到所述视频推荐模型。
7.一种视频推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标用户在预设历史时间段的历史操作数据,其中,所述历史操作数据包括所述目标用户的属性特征数据、历史播放视频特征数据;
关联处理模块,用于分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行关联处理,得到各所述历史播放视频特征数据对应的注意力权重,所述候选视频特征数据用于表征候选视频的特征;
重构模块,用于根据各所述历史播放视频特征数据以及各所述历史播放视频特征数据对应的注意力权重,重构出每个候选视频对应的综合历史播放视频特征数据;
第二获取模块,用于以所述目标用户的所述属性特征数据、所述目标用户对应的上下文特征数据、所述每个候选视频对应的综合历史播放视频特征数据以及所述各候选视频特征数据作为参数,使用预先训练获取的视频推荐模型,得到各所述候选视频的点击概率;
推荐模块,用于根据各所述候选视频的点击概率,向所述目标用户推荐视频;
所述关联处理模块,具体用于分别对所述目标用户的各所述历史播放视频特征数据与各候选视频特征数据进行叉积操作,得到各所述历史播放视频特征数据对应的注意力权重;
所述重构模块,具体用于将每个候选视频关联的各所述历史播放视频特征数据与对应的注意力权重进行池化操作,重构出每个候选视频对应的综合历史播放视频特征数据。
8.一种视频推荐设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当所述视频推荐设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1-6任一项所述视频推荐方法的步骤。
9.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1-6任一项所述视频推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011333517.4A CN112417207B (zh) | 2020-11-24 | 2020-11-24 | 一种视频推荐方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011333517.4A CN112417207B (zh) | 2020-11-24 | 2020-11-24 | 一种视频推荐方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112417207A CN112417207A (zh) | 2021-02-26 |
CN112417207B true CN112417207B (zh) | 2023-02-21 |
Family
ID=74778255
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011333517.4A Active CN112417207B (zh) | 2020-11-24 | 2020-11-24 | 一种视频推荐方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112417207B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113268631B (zh) * | 2021-04-21 | 2024-04-19 | 北京点众快看科技有限公司 | 一种基于大数据的视频筛选方法和装置 |
CN113312512B (zh) * | 2021-06-10 | 2023-10-31 | 北京百度网讯科技有限公司 | 训练方法、推荐方法、装置、电子设备以及存储介质 |
CN113672196B (zh) * | 2021-07-16 | 2023-09-15 | 南京大学 | 一种基于单数字信号处理单元的双乘法计算装置和方法 |
CN113962753B (zh) * | 2021-12-22 | 2022-05-13 | 浙江口碑网络技术有限公司 | 候选商品排序方法、展示方法、装置以及电子设备 |
CN114339417B (zh) * | 2021-12-30 | 2024-05-10 | 未来电视有限公司 | 一种视频推荐的方法、终端设备和可读存储介质 |
CN114722238B (zh) * | 2022-05-13 | 2022-09-30 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、电子设备、存储介质及程序产品 |
CN117454015B (zh) * | 2023-12-19 | 2024-04-12 | 深圳须弥云图空间科技有限公司 | 一种信息推荐方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109325146A (zh) * | 2018-11-12 | 2019-02-12 | 平安科技(深圳)有限公司 | 一种视频推荐方法、装置、存储介质和服务器 |
CN110019943A (zh) * | 2017-09-11 | 2019-07-16 | 中国移动通信集团浙江有限公司 | 视频推荐方法、装置、电子设备和存储介质 |
CN110941740A (zh) * | 2019-11-08 | 2020-03-31 | 腾讯科技(深圳)有限公司 | 视频推荐方法及计算机可读存储介质 |
CN111309939A (zh) * | 2020-02-03 | 2020-06-19 | 天津智融创新科技发展有限公司 | 视频推荐排序方法和装置 |
WO2020211566A1 (zh) * | 2019-04-18 | 2020-10-22 | 腾讯科技(深圳)有限公司 | 一种用户推荐方法和装置以及计算设备和存储介质 |
KR20200123015A (ko) * | 2019-04-18 | 2020-10-28 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 정보를 추천하는 방법, 장치, 기기 및 저장 매체 |
-
2020
- 2020-11-24 CN CN202011333517.4A patent/CN112417207B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019943A (zh) * | 2017-09-11 | 2019-07-16 | 中国移动通信集团浙江有限公司 | 视频推荐方法、装置、电子设备和存储介质 |
CN109325146A (zh) * | 2018-11-12 | 2019-02-12 | 平安科技(深圳)有限公司 | 一种视频推荐方法、装置、存储介质和服务器 |
WO2020211566A1 (zh) * | 2019-04-18 | 2020-10-22 | 腾讯科技(深圳)有限公司 | 一种用户推荐方法和装置以及计算设备和存储介质 |
KR20200123015A (ko) * | 2019-04-18 | 2020-10-28 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 정보를 추천하는 방법, 장치, 기기 및 저장 매체 |
CN110941740A (zh) * | 2019-11-08 | 2020-03-31 | 腾讯科技(深圳)有限公司 | 视频推荐方法及计算机可读存储介质 |
CN111309939A (zh) * | 2020-02-03 | 2020-06-19 | 天津智融创新科技发展有限公司 | 视频推荐排序方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112417207A (zh) | 2021-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112417207B (zh) | 一种视频推荐方法、装置、设备及存储介质 | |
CN111538912B (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
CN110162703B (zh) | 内容推荐方法、训练方法、装置、设备及存储介质 | |
US20210271975A1 (en) | User tag generation method and apparatus, storage medium, and computer device | |
CN110309427B (zh) | 一种对象推荐方法、装置及存储介质 | |
CN110162701B (zh) | 内容推送方法、装置、计算机设备和存储介质 | |
CN111061946B (zh) | 场景化内容推荐方法、装置、电子设备及存储介质 | |
CN111444428A (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN110263243A (zh) | 媒体信息推荐方法、装置、存储介质和计算机设备 | |
CN110717098A (zh) | 基于元路径的上下文感知用户建模方法、序列推荐方法 | |
CN112364204B (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
CN112464100B (zh) | 信息推荐模型训练方法、信息推荐方法、装置及设备 | |
Borges et al. | On measuring popularity bias in collaborative filtering data | |
CN113204655B (zh) | 多媒体信息的推荐方法、相关装置及计算机存储介质 | |
CN117892011B (zh) | 基于大数据的智能信息推送方法及系统 | |
Choi et al. | Alleviating item-side cold-start problems in recommender systems using weak supervision | |
CN113836390B (zh) | 资源推荐方法、装置、计算机设备及存储介质 | |
CN113204699B (zh) | 信息推荐方法、装置、电子设备及存储介质 | |
CN115730217A (zh) | 模型的训练方法、物料的召回方法及装置 | |
CN113641897B (zh) | 基于会话文本的推荐方法和装置、电子设备和存储介质 | |
CN112035740B (zh) | 项目使用时长预测方法、装置、设备及存储介质 | |
Li et al. | Recommender Systems: Frontiers and Practices | |
CN114282115A (zh) | 一种内容推荐方法 | |
Nazari et al. | MoGaL: Novel Movie Graph Construction by Applying LDA on Subtitle | |
CN113836391B (zh) | 资源推荐方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |