CN113742567A

CN113742567A - 一种多媒体资源的推荐方法、装置、电子设备及存储介质

Info

Publication number: CN113742567A
Application number: CN202010478317.1A
Authority: CN
Inventors: 唐新春
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-05-29
Filing date: 2020-05-29
Publication date: 2021-12-03
Anticipated expiration: 2040-05-29
Also published as: CN113742567B

Abstract

本公开关于一种多媒体资源的推荐方法、装置、电子设备及存储介质，用以解决目前向用户推荐广告短视频的方式会导致给用户推荐的广告短视频类型过于单一的问题。本公开实施例对待推荐多媒体资源的目标账户的账户数据进行特征提取得到目标账户的账户特征信息；对候选多媒体资源的属性数据进行特征提取得到属性特征信息；将账户特征信息与属性特征信息进行融合处理，得到候选多媒体资源对应的筛选参数；根据候选多媒体资源对应的筛选参数从候选多媒体资源集合中筛选出目标多媒体资源。本公开实施例提供的多媒体资源推荐方法改变了当前单一基于账户历史点击过的多媒体资源类型进行筛选的现状，提供了多种筛选方式，使得资源的筛选更加准确。

Description

一种多媒体资源的推荐方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机技术领域，特别涉及一种多媒体资源的推荐方法、装置、电子设备及存储介质。

背景技术

随着短视频在移动互联网上的逐渐兴起，在观看短视频已逐渐形成一种生活习惯。一般短视频平台向用户推荐的短视频内容中，不仅有自然作品，还有广告作品。

目前，在向用户推荐广告类的短视频时，是基于用户历史点击的广告短视频，将与用户历史点击的广告短视频的类型相同的广告短视频推荐给用户；例如，用户历史点击“乐高玩具”的广告短视频，则在向用户推荐广告短视频时，将其他与“乐高玩具”相关的广告短视频推荐给用户。但是，目前向用户推荐广告短视频的方式会导致给用户推荐的广告短视频类型过于单一。

发明内容

本公开提供一种多媒体资源的推荐方法、装置、电子设备及存储介质，用以解决目前向用户推荐广告短视频的方式会导致给用户推荐的广告短视频类型过于单一的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种多媒体资源的推荐方法，包括：

对待推荐多媒体资源的目标账户的账户数据进行特征提取得到所述目标账户的账户特征信息；以及，对所述目标账户对应的候选多媒体资源集合中候选多媒体资源的属性数据进行特征提取，得到所述候选多媒体资源的属性特征信息；

将所述账户特征信息与所述属性特征信息进行融合处理，得到所述候选多媒体资源对应的筛选参数；其中，所述筛选参数为所述目标账户播放所述候选多媒体资源的时长不小于预设阈值的概率值；

根据所述候选多媒体资源对应的筛选参数，从所述候选多媒体资源集合中筛选出用于推荐给所述目标账户的目标多媒体资源。

在一种可能的实现方式中，所述对目标账户的账户数据进行特征提取得到所述目标账户的账户特征信息，包括：

基于已训练的第一特征提取网络，对所述目标账户的账户数据进行嵌入处理得到所述目标账户对应的包含语义信息的嵌入向量，并对所述嵌入向量进行变换处理得到所述目标账户的账户特征信息。

所述对所述目标账户对应的候选多媒体资源集合中候选多媒体资源的属性数据进行特征提取，得到所述候选多媒体资源的属性特征信息，包括：

基于已训练的第二特征提取网络，对所述候选多媒体资源的属性数据进行嵌入处理得到所述候选多媒体资源对应的包含语义信息的嵌入向量，并对所述嵌入向量进行变换处理得到所述候选多媒体资源的属性特征信息。

在一种可能的实现方式中，所述已训练的第二特征提取网络包括嵌入层和至少一个隐藏层；

所述对所述候选多媒体资源的属性数据进行嵌入处理得到所述候选多媒体资源对应的包含语义信息的嵌入向量，包括：

基于所述已训练的第二特征提取网络的嵌入层，对所述候选多媒体资源的属性数据进行嵌入处理，得到所述候选多媒体资源对应的包含语义信息的嵌入向量；

所述对所述嵌入向量进行变换处理得到所述候选多媒体资源的属性特征信息，包括：

基于所述已训练的第二特征提取网络的至少一个隐藏层，根据各隐藏层对应的第二权重矩阵对所述嵌入向量进行变换处理，得到所述候选多媒体资源的属性特征信息。

在一种可能的实现方式中，所述将所述账户特征信息与所述属性特征信息进行融合处理，得到所述候选多媒体资源对应的筛选参数，包括：

基于已训练的全连接神经网络，将所述账户特征信息与所述属性特征信息进行融合处理得到待输出的特征向量，并将所述待输出的特征向量进行线性回归处理得到所述候选多媒体资源对应的筛选参数。

在一种可能的实现方式中，所述已训练的全连接神经网络包括至少一个隐藏层和输出层；

所述将所述账户特征信息与所述属性特征信息进行融合处理得到待输出的特征向量，包括：

基于所述已训练的全连接神经网络的至少一个隐藏层，根据各隐藏层对应的第三权重矩阵，对所述账户特征信息与所述属性特征信息进行融合处理得到待输出的特征向量；

所述将所述待输出的特征向量进行线性回归处理得到所述候选多媒体资源对应的筛选参数，包括：

基于所述已训练的全连接神经网络的输出层，将所述待输出的特征向量进行线性回归处理得到所述候选多媒体资源对应的筛选参数。

在一种可能的实现方式中，根据下列方式对所述第一特征提取网络、所述第二特征提取网络、所述全连接神经网络进行训练：

基于初始的第一特征提取网络对训练样本中样本账户的账户数据进行特征提取，得到所述样本账户的账户特征信息；以及基于初始的第二特征提取网络对所述训练样本中样本多媒体资源的属性数据进行特征提取，得到所述样本多媒体资源属性特征信息；

基于初始的全连接神经网络将所述样本账户的账户特征信息与所述样本多媒体资源的属性特征信息进行融合处理，得到所述样本多媒体资源对应的筛选参数；

根据所述样本多媒体资源对应的筛选参数以及标注的训练样本的训练标签对所述第一特征提取网络、所述第二特征提取网络和所述全连接神经网络进行调整，直到确定出的损失值在预设范围内，得到训练后的所述第一特征提取网络、所述第二特征提取网络和所述全连接神经网络。

在一种可能的实现方式中，根据下列方式对所述第一特征提取网络、所述第二特征提取网络和所述全连接神经网络进行调整：

根据所述样本多媒体资源对应的筛选参数以及标注的训练样本的训练标签确定损失值；

根据确定出的所述损失值对所述第一特征提取网络的第一权重矩阵、所述第二特征提取网络的第二权重矩阵、所述全连接神经网络的第三权重矩阵进行调整。

在一种可能的实现方式中，所述训练样本中的样本多媒体资源为所述样本账户在预设历史时长内播放的多媒体资源；

根据下列方式标注训练样本的训练标签：

若样本账户在预设历史时长内播放所述样本多媒体资源的时长不小于预设阈值，则将所述训练样本的训练标签标注为正样本标签；或

若样本账户在预设历史时长内播放所述样本多媒体资源的时长小于预设阈值，则将所述训练样本的训练标签标注为负样本标签。

根据本公开实施例的第二方面，提供一种多媒体资源的推荐装置，包括：

特征提取单元，被配置为执行对待推荐多媒体资源的目标账户的账户数据进行特征提取得到所述目标账户的账户特征信息；以及，对所述目标账户对应的候选多媒体资源集合中候选多媒体资源的属性数据进行特征提取，得到所述候选多媒体资源的属性特征信息；

融合处理单元，被配置为执行将所述账户特征信息与所述属性特征信息进行融合处理，得到所述候选多媒体资源对应的筛选参数；其中，所述筛选参数为所述目标账户播放所述候选多媒体资源的时长不小于预设阈值的概率值；

筛选单元，被配置为执行根据所述候选多媒体资源对应的筛选参数，从所述候选多媒体资源集合中筛选出用于推荐给所述目标账户的目标多媒体资源。

在一种可能的实现方式中，所述特征提取单元具体被配置为执行：

在一种可能的实现方式中，所述已训练的第一特征提取网络包括嵌入层和至少一个隐藏层；

所述特征提取单元具体被配置为执行：

基于已训练的第一特征提取网络的嵌入层，对获所述目标账户的账户数据进行嵌入处理，得到所述目标账户对应的包含语义信息的嵌入向量；

基于所述已训练的第一特征提取网络的至少一个隐藏层，根据各隐藏层对应的第一权重矩阵对所述嵌入向量进行变换处理，得到所述目标账户的账户特征信息。

所述特征提取单元具体被配置为执行：

基于已训练的第二特征提取网络的嵌入层，对所述候选多媒体资源的属性数据进行嵌入处理，得到所述候选多媒体资源对应的包含语义信息的嵌入向量；

在一种可能的实现方式中，所述融合处理单元具体被配置为执行：

所述融合处理单元具体被配置为执行：

基于已训练的全连接神经网络的至少一个隐藏层，根据各隐藏层对应的第三权重矩阵，对所述账户特征信息与所述属性特征信息进行融合处理得到待输出的特征向量；

在一种可能的实现方式中，该装置还包括训练单元；

所述训练单元被配置为执行根据下列方式对所述第一特征提取网络、所述第二特征提取网络、所述全连接神经网络进行训练：

在一种可能的实现方式中，所述训练单元具体被配置为执行根据下列方式对所述第一特征提取网络、所述第二特征提取网络、所述全连接神经网络进行训练：

所述训练单元具体被配置为执行根据下列方式标注训练样本的训练标签：

若样本账户在预设历史时长内播放所述样本多媒体资源的播放不小于预设阈值，则将所述训练样本的训练标签标注为正样本标签；或

若样本账户在预设历史时长内播放所述样本多媒体资源的播放小于预设阈值，则将所述训练样本的训练标签标注为负样本标签。

根据本公开实施例的第三方面，提供一种电子设备，包括：存储器，用于存储可执行指令；

处理器，用于读取并执行所述存储器中存储的可执行指令，以实现如本公开实施例第一方面中任一项所述的多媒体资源的推荐方法。

根据本公开实施例的第四方面，提供一种非易失性存储介质，当所述存储介质中的指令由多媒体资源推荐装置的处理器执行时，使得多媒体资源推荐装置能够执行本公开实施例第一方面中所述的多媒体资源的推荐方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

本公开实施例提供的一种多媒体资源的推荐方法，从获取到的目标账户的账户数据中提取出目标账户的账户特征信息，以及从确定出的目标账户对应的候选多媒体资源的属性数据中提取出候选多媒体资源的属性特征；并根据目标账户的账户特征信息和候选多媒体资源的属性特征确定候选多媒体资源对应的筛选参数；由于确定出的筛选参数为预测的目标账户播放候选多媒体资源的时长不小于预设阈值的概率值，筛选参数越大，则表示目标账户播放候选多媒体资源的时长不小于预设阈值的概率越大。因此，将根据该筛选参数从数据库中筛选出的目标候选多媒体资源推荐给目标账户后，目标账户播放该目标多媒体资源时可以播放较长的时长，提高了目标账户对应的用户的用户体验。另外，本公开实施例提供的多媒体资源推荐方法改变了当前单一基于账户历史点击过的多媒体资源类型进行筛选的现状，提供了多种筛选方式，使得资源的筛选更加准确。

附图说明

图1是根据一示例性实施例示出的应用场景的示意图；

图2是根据一示例性实施例示出的一种多媒体资源的推荐系统示意图；

图3是根据一示例性实施例示出的多媒体资源的推荐方法流程图；

图4是根据一示例性实施例示出的双塔分离的DNN模型的示意图；

图5是根据一示例性实施例示出的对第一特征提取网络、第二特征提取网络和全连接神经网络进行训练的方法流程图；

图6是根据一示例性实施例示出的一种完整的多媒体资源的推荐方法流程图；

图7是根据一示例性实施例示出的一种多媒体资源的推荐装置框图；

图8是根据一示例性实施例示出的另一种多媒体资源的推荐装置框图；

图9是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

以下，对本公开实施例中的部分用语进行解释说明，以便于本领域技术人员理解。

(1)本公开实施例中术语“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

(2)本公开实施例中术语“电子设备”可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

(3)本公开实施例中术语“短视频”是指在各种新媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容，几秒到几分钟不等。内容融合了技能分享、幽默搞怪、时尚潮流、社会热点、街头采访、公益教育、广告创意、商业定制等主题。由于内容较短，可以单独成片，也可以成为系列栏目。

(4)本公开实施例中术语“二分类模型”是指用于解决分类问题的一种深度学习模型，包括应用支持向量机、决策树等算法，是一种探索“响应变量的期望”与“自变量”的关系，以实现对非线性关系的某种拟合的模型。

(5)本公开实施例中术语“多媒体资源”，可以为数字传输的资源，具体可以是视频资源、文本资源或图片资源；例如，视频资源可以为短视频、直播等，其中短视频可以为广告短视频。

(6)本公开实施例中术语“DNN”，为Deep Neural Networks，是深度学习的基础，按不同层的位置划分，DNN内部的神经网络层可以分为三类，输入层，隐藏层和输出层，层与层之间是全连接的。在使用DNN之前，需要对DNN进行训练，对DNN完成训练后，可以将输入数据输入到DNN中并获取其对应的输出数据。

(7)本公开实施例中术语“客户端”，或称为用户端，是指与服务器相对应的，为用户提供本地服务的程序。除了一些只在本地运行的应用程序之外，一般安装在普通的客户机上，需要与服务端互相配合运行。

多媒体资源推荐可以应用在展示多媒体资源的应用程序上，如短视频应用程序或播放器应用程序，用户触发页面展示请求后，应用程序对多媒体资源进行筛选后展示给用户。

其中，以多媒体资源为广告短视频为例介绍广告短视频的推荐流程。

在大规模数字广告系统中，每一个流量(即在线用户)下可以选择投放的广告的数量巨大，在为用户推荐广告时，不可能一次计算选出最合适的广告，因此业内一般采用多级漏斗的方式筛选出最适合推荐给用户的广告，比如经过召回、粗选和精选三个主要阶段，最终使得用户、广告户和平台的利益最大化，实现互利共赢。

为了使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开作进一步地详细描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本公开保护的范围。

需要说明的是，在下文描述中的多媒体资源可以为上述内容中的广告短视频，但也可以为除广告短视频之外的其它多媒体资源。

图1为根据本公开实施例的一个应用场景的示意图。

如图1所示，该应用场景中可以包括至少一个服务器20和多个终端设备30。其中，终端设备30可以是可用来进行网络访问的任何合适的电子设备，包括但不限于计算机、笔记本电脑、智能电话、平板电脑或是其它类型的终端。服务器20则是能够通过网络访问的提供交互服务所需信息的任何服务器。终端设备30可以经由网络40实现与服务器20的信息收发。服务器20可以通过访问数据库50来获取终端设备30所需的内容，例如模型参数、广告内容、索引文件等。终端设备之间(例如，30_1与30_2或30_N之间)也可以经由网络40彼此通信。网络40可以是广义上的用于信息传递的网络，可以包括一个或多个通信网络，诸如无线通信网络、因特网、私域网、局域网、城域网、广域网或是蜂窝数据网络等。

在随后的描述中仅就单个服务器或终端设备加以详述，但是本领域技术人员应当理解的是，示出的单个服务器20、终端设备30和数据库50旨在表示本申请的技术方案涉及终端设备、服务器及数据库的操作。对单个终端设备以及单个服务器和数据库加以详述至少为了说明方便，而非暗示对终端设备和服务器的类型或是位置等具有限制。应当注意，如果向图示环境中添加附加模块或从其中去除个别模块，不会改变本发明的示例实施例的底层概念。另外，虽然为了方便说明而在图中示出了从数据库50到服务器20的双向箭头，但本领域技术人员可以理解的是，上述数据的收发也是可以通过网络40实现的。

由于目前在对广告短视频进行筛选时，是基于用户历史点击的广告短视频，将与用户历史点击的短视频类型相同的广告短视频筛选出来推荐给用户，从而会导致推荐给用户的广告短视频均为同一类型的短视频，从而造成推荐的广告视频类型过于单一。

基于上述问题，如图2所示，本公开实施例提供一种多媒体资源的推荐系统，包括客户端21、服务器22以及用户23。客户端21为安装在电子设备上的应用程序客户端，与服务器22配合为用户23提供服务，用户23可以查看客户端21展示的内容，或触发客户端21上支持的操作。

本公开实施例中，响应于用户23在客户端21上触发的展示页面的操作，客户端21向服务器22发送展示页面的请求，服务器22获取待推荐多媒体资源的目标账户的账户数据，并且服务器22可以根据目标账户的账户数据中的部分或全部数据，确定与目标账户对应的候选多媒体资源集合；服务器22还需要获取多媒体资源集合中候选多媒体资源的属性数据。其中，目标账户为用户23登录客户端21所使用的账户。

服务器22对目标账户的账户数据进行特征提取得到目标账户的账户特征信息；以及服务器22对候选多媒体资源集合中候选多媒体资源的属性数据进行特征提取得到候选多媒体资源的属性特征信息。然后，服务器22将目标账户的账户特征信息与候选多媒体资源的属性特征信息进行融合处理，得到候选多媒体资源对应的筛选参数；其中筛选参数为预测的目标账户播放候选多媒体资源的时长不小于预设阈值的概率值。服务器22根据候选多媒体资源集合中每个多媒体资源对应的筛选参数，从多媒体资源集合中筛选出需要推荐给目标账户的目标多媒体资源，并将筛选出的目标多媒体资源返回给客户端21。客户端21在接收到服务器22返回的目标多媒体资源后，生成包含目标多媒体资源的展示页面，并将生成的展示页面在客户端21上展示给用户23。

下面对本公开实施例提供的一种多媒体资源推荐方法进行说明。

如图3所示，为本公开实施例一种多媒体资源的推荐方法流程图，包括以下步骤：

在步骤S301中、对待推荐多媒体资源的目标账户的账户数据进行特征提取得到所述目标账户的账户特征信息；以及，对所述目标账户对应的候选多媒体资源集合中候选多媒体资源的属性数据进行特征提取，得到所述候选多媒体资源的属性特征信息；

在步骤S302中、将所述账户特征信息与所述属性特征信息进行融合处理，得到所述候选多媒体资源对应的筛选参数；其中，所述筛选参数为所述目标账户播放所述候选多媒体资源的时长不小于预设阈值的概率值；

在步骤S303中、根据候选多媒体资源对应的筛选参数，从候选多媒体资源集合中筛选出用于推荐给目标账户的目标多媒体资源。

其中，本公开实施例中目标账户的账户数据包括目标账户的用户画像和/或历史行为数据；

目标账户的用户画像包括但不限于：

账户对应的用户在注册时填写的性别、年龄、地域、职业等个人信息，以及注册时间、用户所使用终端的操作系统类型、用户的经济消费水平；

目标账户的历史行为数据为目标账户在预设历史时长内的行为数据，目标账户的历史行为数据包括但不限于：

短视频平台使用时长、目标账户历史观看的短视频数量、目标账户历史时长内点击过的短视频、目标账户历史时长内点赞过的短视频、被确定为目标账户“不喜欢”的短视频；

需要说明的是，若需要为目标账户推荐广告短视频，则目标账户的历史行为数据中均为与广告类的短视频相关的数据。

候选多媒体资源的属性数据包括但不限于：

多媒体资源的类型、多媒体资源所属行业、多媒体资源被播放的次数、多媒体资源是否被举报、多媒体资源的背景音乐、多媒体资源是否被评论、多媒体资源的ID、多媒体资源的上传作者。

需要说明的是，若需要为目标账户推荐广告短视频，则候选多媒体资源为广告类的资源。

本公开实施例在获取到目标账户的账户数据，以及获取到多媒体资源的属性数据后，需要预测目标账户播放该多媒体资源的时长不小于预设阈值的概率值；

由于，若预测出目标账户播放该多媒体资源的时长不小于预设阈值的概率值越大，说明用户对该多媒体资源较为感兴趣，可以优先为用户推荐该多媒体资源。

本公开实施例在确定候选多媒体资源对应的筛选参数时，是根据目标账户的账户特征信息以及候选多媒体资源的属性特征，确定候选多媒体资源对应的筛选参数；

在本公开一些实施例中，可以根据下列方式确定目标账户的账户特征信息：

基于已训练的第一特征提取网络，对目标账户的账户数据进行嵌入处理得到目标账户对应的包含语义信息的嵌入向量，并对嵌入向量进行变换处理得到目标账户的账户特征信息。

其中，第一特征提取网络包括嵌入层和至少一个隐藏层；

第一特征提取网络的嵌入层，用于对获取到的目标账户的账户数据进行嵌入处理，得到目标账户对应的包含语义信息的嵌入向量。

嵌入层对目标账户的账户数据进行特征抽取，得到离散特征和连续特征；

离散特征是从目标账户的账户数据中抽取出的整数型特征值；例如，针对目标账户的性别数据，抽取出的特征值为0或1的整数型特征值；

连续特征是从目标账户的账户数据中抽取出的连续的特征值；例如，针对目标账户的短视频平台使用时长数据，抽取出的为连续特征；

在从目标账户的账户数据中抽取出离散特征和连续特征之后，针对离散特征，采用embedding方法构建嵌入向量；针对连续特征，将连续特征进行离散化处理，离散化以后再采用embedding方法构建嵌入向量。

需要说明的是，采用embedding方法构建的嵌入向量为包含语义信息的向量，是将从目标账户的账户数据中抽取出的特征值转化为包含语义空间关系的低维向量。

第一特征提取网络的至少一个隐藏层，根据各隐藏层对应的第一权重矩阵对目标账户对应的包含语义信息的嵌入向量进行变换处理，得到目标账户的账户特征信息；

第一特征提取网络中每一个隐藏层对应一个第一权重矩阵；

根据第一特征提取网络中隐藏层的个数，确定对目标账户对应的嵌入向量进行变换处理的次数；例如，第一特征提取网络中包括两个隐藏层，则通过第一个隐藏层对应的第一权重矩阵对目标账户对应的嵌入向量进行第一次变换处理，将第一次变换处理的结果，通过第二个隐藏层对应的第二权重矩阵进行第二次变换处理，得到目标账户的账户特征信息。

需要说明的是，本公开实施例第一特征提取网络的每一个隐藏层对应的第一权重矩阵是在第一特征提取网络训练过程中确定的。

在本公开一些实施例中，可以根据下列方式确定候选多媒体资源的属性特征信息：

基于已训练的第二特征提取网络，对候选多媒体资源的属性数据进行嵌入处理得到候选多媒体资源对应的包含语义信息的嵌入向量，并对嵌入向量进行变换处理得到候选多媒体资源的属性特征信息。

其中，第二特征提取网络包括嵌入层和至少一个隐藏层；

第二特征提取网络的嵌入层，用于对获取到的候选多媒体资源的属性数据进行嵌入处理，得到候选多媒体资源对应的包含语义信息的嵌入向量。

嵌入层对候选多媒体资源的属性数据进行特征抽取，得到离散特征和连续特征；

离散特征是从候选多媒体资源的属性数据中抽取出的整数型特征值；连续特征是从候选多媒体资源的属性数据中抽取出的连续的特征值；

在从候选多媒体资源的属性数据中抽取出离散特征和连续特征之后，针对离散特征，采用embedding方法构建嵌入向量；针对连续特征，将连续特征进行离散化处理，离散化以后再采用embedding方法构建嵌入向量。

需要说明的是，采用embedding方法构建的嵌入向量为包含语义信息的向量，是将从候选多媒体资源的属性数据中抽取出的特征值转化为包含语义空间关系的低维向量。

第二特征提取网络的至少一个隐藏层，根据各隐藏层对应的第二权重矩阵对候选多媒体资源对应的包含语义信息的嵌入向量进行变换处理，得到候选多媒体资源的属性特征信息；

第二特征提取网络中每一个隐藏层对应一个第二权重矩阵；

根据第二特征提取网络中隐藏层的个数，确定对候选多媒体资源对应的嵌入向量进行变换处理的次数；例如，第二特征提取网络中包括两个隐藏层，则通过第一个隐藏层对应的第二权重矩阵对候选多媒体资源对应的嵌入向量进行第一次变换处理，将第一次变换处理的结果，通过第二个隐藏层对应的第二权重矩阵进行第二次变换处理，得到候选多媒体资源的属性特征信息。

需要说明的是，本公开实施例第二特征提取网络的每一个隐藏层对应的第二权重矩阵是在第二特征提取网络训练过程中确定的。

本公开实施例在确定出目标账户对应的账户特征信息，以及候选多媒体资源的属性特征信息之后，需要将目标账户对应的账户特征信息和候选多媒体资源的属性特征信息进行融合处理，得到候选多媒体资源对应的筛选参数。

在本公开一些实施例中，可以根据下列方式确定候选多媒体资源对应的筛选参数：

基于已训练的全连接神经网络，将账户特征信息与属性特征信息进行融合处理得到待输出的特征向量，并将待输出的特征向量进行线性回归处理得到候选多媒体资源对应的筛选参数。

其中，全连接神经网络包括至少一个隐藏层和输出层；

全连接神经网络的至少一个隐藏层，用于根据各隐藏层对应的第三权重矩阵，对目标账户的账户特征信息与候选多媒体资源的属性特征信息进行非线性的融合处理，得到待输出的特征向量；

全连接神经网络的输出层，将待输出的特征向量进行线性回归处理，得到候选多媒体资源对应的筛选参数。

本公开实施例将目标账户的账户特征信息与候选多媒体资源的属性特征信息组成一个特征矩阵，根据各隐藏层对应的第三权重矩阵对目标账户的账户特征信息与候选多媒体资源的属性特征信息组成的特征矩阵进行变换处理，得到候选多媒体资源对应的筛选参数；

全连接神经网络中每一个隐藏层对应一个第三权重矩阵；

根据全连接神经网络中隐藏层的个数，确定对目标账户的账户特征信息与候选多媒体资源的属性特征信息组成的特征矩阵进行变换处理的次数；例如，全连接神经网络中包括两个隐藏层，则通过第一个隐藏层对应的第三权重矩阵，对目标账户的账户特征信息与候选多媒体资源的属性特征信息组成的特征矩阵进行第一次变换处理，将第一次变换处理的结果，通过第二个隐藏层对应的第三权重矩阵进行第二次变换处理，得到待输出的特征向量。

全连接神经网络的输出层，将待输出的特征向量进行线性回归处理，得到候选多媒体资源对应的筛选参数；

需要说明的是，本公开实施例候选多媒体资源对应的筛选参数可以为0-1范围内的数值；因此，全连接神经网络的输出层将经至少一个隐藏层得到的待输出特征向量进行线性回归处理得到0-1范围内筛选参数。

本公开实施例确定候选多媒体资源对应的筛选参数过程中使用的第一特征提取网络、第二特征提取网络以及全连接神经网络可以集成在一个网络模型中；

下面以集成第一特征提取网络、第二特征提取网络以及全连接神经网络的双塔分离的DNN模型为例，介绍下本公开实施例确定候选多媒体资源对应的筛选参数的过程。

如图4所示的双塔分离的DNN模型，包括账户侧的DNN网络、多媒体资源侧的DNN网络和全连接神经网络；

其中，账户侧的DNN网络包括嵌入层和两个隐藏层，以第一个隐藏层包括256个神经元，第二个隐藏层包括128个神经元为例；

多媒体资源侧的DNN网络包括嵌入层和两个隐藏层，以第一个隐藏层包括256个神经元，第二个隐藏层包括128个神经元为例；

全连接神经网络包括两个隐藏层和输出层，以第一个隐藏层包括512个神经元，第二个隐藏层包括128个神经元为例。

针对账户侧的DNN网络：

将目标账户的账户数据输入账户侧的DNN网络的嵌入层，嵌入层将目标账户的账户数据进行特征抽取和embedding处理，得到与目标账户的账户数据对应的嵌入向量；

例如，将用户性别、年龄、职业等数据输入账户侧的DNN网络的嵌入层；嵌入层将用户性别、年龄、职业等数据进行特征抽取和embedding处理，得到与每个数据对应的embedding向量。

假设得到目标账户的账户数据对应的128个嵌入向量，则将该128个嵌入向量通过账户侧的DNN网络的第一个隐藏层对应的第一权重矩阵进行变换处理；

具体的，将目标账户的账户数据对应的128个嵌入向量组成一个行矩阵，假设为[A₀、A₁、A₂、A₃……A₁₂₇]；

账户侧的DNN网络的第一个隐藏层对应的第一权重矩阵为128*256的矩阵，假设第一个隐藏层对应的第一权重矩阵为：

则将目标账户对应的嵌入向量组成的行矩阵与账户侧的DNN网络的第一个隐藏层对应的第一权重矩阵作矩阵乘法运算，得到[B₀、B₁、B₂、B₃……B₂₅₅]；

账户侧的DNN网络的第二个隐藏层对应的第一权重矩阵为256*128的矩阵，假设第二个隐藏层对应的第一权重矩阵为：

将账户侧的DNN网络的第一个隐藏层处理得到的[B₀、B₁、B₂、B₃……B₂₅₅]、与账户侧的DNN网络的第二个隐藏层对应的第一权重矩阵作矩阵乘法运算，得到[C₀、C₁、C₂、C₃……C₁₂₇]作为目标账户的账户特征信息。

针对多媒体资源侧的DNN网络：

将候选多媒体资源的属性数据输入多媒体资源侧的DNN网络的嵌入层，嵌入层将候选多媒体资源的属性数据进行特征抽取和embedding处理，得到与候选多媒体资源的属性数据对应的嵌入向量；

例如，将多媒体资源的类型、多媒体资源被播放次数、多媒体资源ID等数据输入多媒体资源侧的DNN网络的嵌入层；嵌入层将多媒体资源的类型、多媒体资源被播放次数、多媒体资源ID等数据进行特征抽取和embedding处理，得到与每个数据对应的embedding向量。

假设得到候选多媒体资源的属性数据对应的128个嵌入向量，则将该128个嵌入向量通过多媒体资源侧的DNN网络的第一个隐藏层对应的第二权重矩阵进行变换处理；

具体的，将候选多媒体资源的属性数据对应的128个嵌入向量组成一个行矩阵，假设为[D₀、D₁、D₂、D₃……D₁₂₇]；

多媒体资源侧的DNN网络的第一个隐藏层对应的第二权重矩阵为128*256的矩阵，假设第一个隐藏层对应的第二权重矩阵为：

则将候选多媒体资源对应的嵌入向量组成的行矩阵与多媒体资源侧的DNN网络的第一个隐藏层对应的第二权重矩阵作矩阵乘法运算，得到[E₀、E₁、E₂、E₃……E₂₅₅]；

多媒体资源侧的DNN网络的第二个隐藏层对应的第二权重矩阵为256*128的矩阵，假设第二个隐藏层对应的第二权重矩阵为：

将多媒体资源侧的DNN网络的第一个隐藏层处理得到的[E₀、E₁、E₂、E₃……E₂₅₅]、与多媒体资源侧的DNN网络的第二个隐藏层对应的第二权重矩阵作矩阵乘法运算，得到[F₀、F₁、F₂、F₃……F₁₂₇]，作为候选多媒体资源对应的属性特征信息。

将账户侧的DNN网络得到的目标账户的账户特征信息与多媒体资源侧的DNN网络得到的候选多媒体资源的属性特征信息，组成一个更大维度的矩阵；将该矩阵作为全连接神经网络的输入矩阵。

例如，目标账户的账户特征信息为1*128的行矩阵[C₀、C₁、C₂、C₃……C₁₂₇]，候选多媒体资源的属性特征为1*128的行矩阵[F₀、F₁、F₂、F₃……F₁₂₇]，组成[C₀、C₁、C₂、C₃……C₁₂₇、F₀、F₁、F₂、F₃……F₁₂₇]的输入矩阵。

针对全连接神经网络：

将全连接神经网络的输入矩阵，经过全连接神经网络第一个隐藏层进行处理；

全连接神经网络的第一个隐藏层对应的第三权重为256*512的矩阵，假设全连接神经网络的第一个隐藏层对应的第三权重矩阵为：

则将全连接神经网络的输入矩阵与第一个隐藏层对应的第三权重矩阵作矩阵乘法运算，得到[G₀、G₁、G₂、G₃……G₂₅₅]；

全连接神经网络的第二个隐藏层对应的第三权重矩阵为512*128的矩阵，假设全连接神经网络的第二个隐藏层对应的第三权重矩阵为：

将全连接神经网络的第一个隐藏层处理得到的[G₀、G₁、G₂、G₃……G₂₅₅]、与全连接神经网络的第二个隐藏层对应的第三权重矩阵作矩阵乘法运算，得到[H₀、H₁、H₂、H₃……H₁₂₇]作为待输出的特征向量。

全连接神经网络的输出层对待输出的特征向量进行线性回归处理；实施中，全连接神经网络可以通过softmax函数，对待输出的特征向量进行逻辑回归处理，得到候选多媒体资源的筛选参数；

全连接神经网络的输出层通过128*1的变换矩阵，对待输出的特征向量的矩阵进行变换处理；

假设全连接神经网络的输出层的变换矩阵为：

[W0、W1、W2、W3、……W127]^T

实施中，将输出的特征向量组成的矩阵与输出层的变换矩阵作矩阵乘法运算，得到1*1的数值；softmax函数还需要对矩阵乘法运算得到的数值进行归一化处理，得到0-1范围的筛选参数。

本公开实施例提供第一特征提取网络、第二特征提取网络与全连接神经网络进行训练的方法；下面详细介绍第一特征提取网络、第二特征提取网络与全连接神经网络的训练过程。

1、搜集训练样本集：

从数据系统中，获取全局账户历史点击的多媒体资源的日志数据；从获取到的日志数据中分离出样本账户的账户数据，以及分离出样本账户点击过的多媒体资源的属性数据。

例如，账户A历史点击多媒体资源a、多媒体资源b、多媒体资源c；账户B历史点击多媒体资源d；账户C历史点击多媒体资源e、多媒体资源f等。

在搜集训练样本集时，将一个样本账户的账户数据，该样本账户在预设历史时长内播放的样本多媒体资源的属性数据、以及训练样本的训练标签组成一个训练样本。

其中，训练样本的训练标签为预先标注的；训练样本集中包括正训练样本和负训练样本；

实施中，根据样本账户播放多媒体资源的时长确定训练样本的训练标签；

若样本账户在预设历史时长内播放样本多媒体资源的时长不小于预设阈值，则将训练样本的训练标签标注为正样本标签；

若样本账户在预设历史时长内播放样本多媒体资源的时长小于预设阈值，则将训练样本的训练标签标注为负样本标签。

例如，假设预设阈值为3s，账户A历史点击多媒体资源a后，观看多媒体资源a的时长大于3s，则将账户A和多媒体资源a组成的训练样本的训练标签标注为正样本标签；

又例如，假设预设阈值为3s，账户B历史点击多媒体资源a后，观看多媒体资源a的时长小于3s，则将账户B和多媒体资源a组成的训练样本的训练标签标注为负样本标签。

一种可选的实施方式为，将训练样本的正样本标签标注为1，将训练样本的负样本标签标注为0。

2、对第一特征提取网络、第二特征提取网络与全连接神经网络进行训练：

如图5所示，为本公开实施例对第一特征提取网络、第二特征提取网络与全连接神经网络进行训练的方法流程图，包括以下步骤：

在步骤S501中、基于初始的第一特征提取网络对训练样本中样本账户的账户数据进行特征提取，得到样本账户的账户特征信息；以及

在步骤S502中、基于初始的第二特征提取网络对训练样本中样本多媒体资源的属性数据进行特征提取，得到样本多媒体资源属性特征信息；

在步骤S503中、基于初始的全连接神经网络将样本账户的账户特征信息与样本多媒体资源的属性特征信息进行融合处理，得到样本多媒体资源对应的筛选参数；

在步骤S504中、根据样本多媒体资源对应的筛选参数以及标注的训练样本的训练标签对第一特征提取网络、第二特征提取网络和全连接神经网络进行调整，直到确定出的损失值在预设范围内，得到训练后的第一特征提取网络、第二特征提取网络和全连接神经网络。

实施中，本公开实施例可以根据下列方式对第一特征提取网络、第二特征提取网络和全连接神经网络进行调整：

根据样本多媒体资源对应的筛选参数以及标注的训练样本的训练标签确定损失值；根据确定出的损失值对第一特征提取网络的第一权重矩阵、第二特征提取网络的第二权重矩阵、全连接神经网络的第三权重矩阵进行调整。

本公开实施例在采用上述方式确定出候选多媒体资源集合中每个候选多媒体资源的筛选参数后，根据每个候选多媒体资源对应的筛选参数，从多媒体资源集合中筛选出目标多媒体资源。

本公开实施例可以根据下列方式从多媒体资源集合中筛选目标多媒体资源：

方式1、按照候选多媒体资源对应的筛选参数，对候选多媒体资源集合中的候选多媒体资源按照筛选参数从大到小的顺序进行排序，将排序靠前的候选多媒体资源作为目标多媒体资源。

方式2、针对候选多媒体资源集合中每个候选多媒体资源，预测目标账户对候选多媒体资源的点击率、点赞率和关注率；根据目标账户对候选多媒体资源的点击率、点赞率和关注率，以及候选多媒体资源对应的筛选参数，综合确定候选多媒体资源的排序参数；对候选多媒体资源集合中的候选多媒体资源按照排序参数从大到小的顺序进行排序，将排序靠前的候选多媒体资源作为目标多媒体资源；

其中，在方式2中，本公开实施例可以将目标账户对候选多媒体资源的点击率、点赞率和关注率，以及候选多媒体资源对应的筛选参数进行加权平均运算，确定候选多媒体资源的排序参数。

本公开实施例在确定出目标多媒体资源，生成包含目标多媒体资源的展示页面，并将该展示页面在客户端上展示，以向用户推荐目标多媒体资源。

如图6所示，为本公开实施例一种完整的多媒体资源推荐方法流程图，包括以下步骤：

在步骤S601中、响应于展示页面的请求，获取触发请求的目标账户的账户数据；

在步骤S602中、确定目标账户对应的候选多媒体资源集合；

在步骤S603中、获取目标账户对应的候选多媒体资源集合中候选多媒体资源的属性数据；

在步骤S604中、基于已训练的第一特征提取网络，对目标账户的账户数据进行嵌入处理得到目标账户对应的包含语义信息的嵌入向量，并对嵌入向量进行变换处理得到目标账户的账户特征信息；

在步骤S605中、基于已训练的第二特征提取网络，对候选多媒体资源的属性数据进行嵌入处理得到候选多媒体资源对应的包含语义信息的嵌入向量，并对嵌入向量进行变换处理得到候选多媒体资源的属性特征信息；

在步骤S606中、基于已训练的全连接神经网络，将账户特征信息与属性特征信息进行融合处理得到待输出的特征向量，并将待输出的特征向量进行线性回归处理得到候选多媒体资源对应的筛选参数；

其中，筛选参数为目标账户播放候选多媒体资源的时长不小于预设阈值的概率值；

在步骤S607中、根据候选多媒体资源对应的筛选参数，从候选多媒体资源集合中筛选出用于推荐给目标账户的目标多媒体资源；

在步骤S608中、生成包含目标多媒体资源的展示页面，并将生成的展示页面展示给用户。

图7是根据一示例性实施例示出的一种多媒体资源推荐装置框图。参照图7，该装置包括特征提取单元701、融合处理单元702、筛选单元703；

特征提取单元701，被配置为执行对待推荐多媒体资源的目标账户的账户数据进行特征提取得到所述目标账户的账户特征信息；以及对所述目标账户对应的候选多媒体资源集合中候选多媒体资源的属性数据进行特征提取，得到所述候选多媒体资源的属性特征信息；

融合处理单元702，被配置为执行将所述账户特征信息与所述属性特征信息进行融合处理，得到所述候选多媒体资源对应的筛选参数；其中，所述筛选参数为所述目标账户播放所述候选多媒体资源的时长不小于预设阈值的概率值；

筛选单元703，被配置为执行根据所述候选多媒体资源对应的筛选参数，从所述候选多媒体资源集合中筛选出用于推荐给所述目标账户的目标多媒体资源。

在一种可能的实现方式中，所述特征提取单元701具体被配置为执行：

在一种可能的实现方式中，所述已训练的第一特征提取网络包括嵌入层和至少一个隐藏层；所述特征提取单元701具体被配置为执行：

在一种可能的实现方式中，所述已训练的第二特征提取网络包括嵌入层和至少一个隐藏层；所述特征提取单元701具体被配置为执行：

在一种可能的实现方式中，所述融合处理单元702具体被配置为执行：

在一种可能的实现方式中，所述已训练的全连接神经网络包括至少一个隐藏层和输出层；所述融合处理单元702具体被配置为执行：

在一种可能的实现方式中，图8是根据一示例性实施例示出的一种多媒体资源推荐装置框图，该装置还包括训练单元704；

训练单元704被配置为执行根据下列方式对所述第一特征提取网络、所述第二特征提取网络、所述全连接神经网络进行训练：

在一种可能的实现方式中，所述训练单元704具体被配置为执行根据下列方式对所述第一特征提取网络、所述第二特征提取网络、所述全连接神经网络进行训练：

训练单元704具体被配置为执行根据下列方式标注训练样本的训练标签：

关于上述实施例中的装置，其中各个单元执行请求的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图9是根据一示例性实施例示出的一种电子设备900的框图，该电子设备包括：

处理器910；

用于存储所述处理器910可执行指令的存储器920；

其中，所述处理器910被配置为执行所述指令，以实现本公开实施例中的多媒体资源推荐方法。

在示例性实施例中，还提供了一种包括指令的非易失性存储介质，例如包括指令的存储器920，上述指令可由电子设备900的处理器910执行以完成上述方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本公开实施例还提供一种计算机程序产品，当所述计算机程序产品在电子设备上运行时，使得所述电子设备执行实现本公开实施例上述任意一项信息推荐方法或任意一项信息推荐方法任一可能涉及的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种多媒体资源的推荐方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述对目标账户的账户数据进行特征提取得到所述目标账户的账户特征信息，包括：

3.如权利要求2所述的方法，其特征在于，所述已训练的第一特征提取网络包括嵌入层和至少一个隐藏层；

所述对所述目标账户的账户数据进行嵌入处理得到所述目标账户对应的包含语义信息的嵌入向量，包括：

基于所述已训练的第一特征提取网络的嵌入层，对所述目标账户的账户数据进行嵌入处理，得到所述目标账户对应的包含语义信息的嵌入向量；

所述对所述嵌入向量进行变换处理得到所述目标账户的账户特征信息，包括：

4.如权利要求2所述的方法，其特征在于，所述对所述目标账户对应的候选多媒体资源集合中候选多媒体资源的属性数据进行特征提取，得到所述候选多媒体资源的属性特征信息，包括：

5.如权利要求4所述的方法，其特征在于，所述已训练的第二特征提取网络包括嵌入层和至少一个隐藏层；

6.如权利要求4所述的方法，其特征在于，所述将所述账户特征信息与所述属性特征信息进行融合处理，得到所述候选多媒体资源对应的筛选参数，包括：

7.如权利要求6所述的方法，其特征在于，所述已训练的全连接神经网络包括至少一个隐藏层和输出层；

8.一种多媒体资源的推荐装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现根据权利要求1至权利要求7中任一项所述的多媒体资源推荐方法。

10.一种存储介质，其特征在于，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行根据权利要求1至权利要求7中任一项所述的多媒体资源推荐方法。