CN116881483B

CN116881483B - 多媒体资源推荐方法、装置及存储介质

Info

Publication number: CN116881483B
Application number: CN202311142722.6A
Authority: CN
Inventors: 谈圳; 高志杰; 孙慧敏; 龚千健; 汪佳宝
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2023-09-06
Filing date: 2023-09-06
Publication date: 2023-12-01
Anticipated expiration: 2043-09-06
Also published as: CN116881483A

Abstract

本申请公开了一种多媒体资源推荐方法、装置及存储介质，可以应用于云技术、人工智能、智慧交通、车联网等各种场景，所述方法包括：获取待推荐多媒体资源；对待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；获取至少一个候选对象特征；获取待推荐多媒体资源对应的种子对象，并确定种子对象对应的种子对象特征；基于待推荐资源特征与种子对象特征之间的相似度，对种子对象特征进行更新，得到更新种子对象特征；基于更新种子对象特征与每个候选对象特征之间的相似度，从至少一个候选对象特征中筛选出推荐对象特征；向推荐对象特征对应的推荐对象推送待推荐多媒体资源。本申请提高了多媒体资源的推荐准确率。

Description

多媒体资源推荐方法、装置及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种多媒体资源推荐方法、装置及存储介质。

背景技术

相关技术中，在多媒体资源推荐过程中，通常采用人工圈选关键词筛选用户并进行推荐。该方案完全依赖于筛选者对于用户和多媒体资源的理解，仅可以对筛选者认为的可能对多媒体资源感兴趣的用户进行资源推荐，造成资源推荐的准确率较低。

发明内容

本申请提供了一种多媒体资源推荐方法、装置及存储介质，可以提高多媒体资源的推荐准确率。

一方面，本申请提供了一种多媒体资源推荐方法，所述方法包括：

获取待推荐多媒体资源；

对所述待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；

获取至少一个候选对象特征；每个候选对象特征为对每个候选对象的对象关联信息进行对象特征提取得到；

获取所述待推荐多媒体资源对应的种子对象，并确定所述种子对象对应的种子对象特征；所述种子对象为关注度参数大于预设参数阈值的对象；所述关注度参数表征所述种子对象对所述待推荐多媒体资源的感兴趣程度；

基于所述待推荐资源特征与所述种子对象特征之间的相似度，对所述种子对象特征进行更新，得到更新种子对象特征；

基于所述更新种子对象特征与每个候选对象特征之间的相似度，从所述至少一个候选对象特征中筛选出推荐对象特征；

向所述推荐对象特征对应的推荐对象推送所述待推荐多媒体资源。

另一方面提供了一种多媒体资源推荐装置，所述装置包括：

多媒体资源获取模块，用于获取待推荐多媒体资源；

推荐特征确定模块，用于对所述待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；

对象特征获取模块，用于获取至少一个候选对象特征；每个候选对象特征为对每个候选对象的对象关联信息进行对象特征提取得到；

种子对象获取模块，用于获取所述待推荐多媒体资源对应的种子对象，并确定所述种子对象对应的种子对象特征；所述种子对象为关注度参数大于预设参数阈值的对象；所述关注度参数表征所述种子对象对所述待推荐多媒体资源的感兴趣程度；

种子特征更新模块，用于基于所述待推荐资源特征与所述种子对象特征之间的相似度，对所述种子对象特征进行更新，得到更新种子对象特征；

筛选模块，用于基于所述更新种子对象特征与每个候选对象特征之间的相似度，从所述至少一个候选对象特征中筛选出推荐对象特征；

推荐模块，用于向所述推荐对象特征对应的推荐对象推送所述待推荐多媒体资源。

另一方面提供了一种电子设备，所述设备包括处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上所述的多媒体资源推荐方法。

另一方面提供了一种计算机存储介质，所述计算机存储介质存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如上所述的多媒体资源推荐方法。

另一方面提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行以实现如上所述的多媒体资源推荐方法。

本申请提供的多媒体资源推荐方法、装置及存储介质，具有如下技术效果：

本申请获取待推荐多媒体资源；对待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；获取至少一个候选对象特征；每个候选对象特征为对每个候选对象的对象关联信息进行对象特征提取得到；获取待推荐多媒体资源对应的种子对象，并确定种子对象对应的种子对象特征；种子对象为关注度参数大于预设参数阈值的对象；关注度参数表征种子对象对待推荐多媒体资源的感兴趣程度；基于待推荐资源特征与种子对象特征之间的相似度，对种子对象特征进行更新，得到更新种子对象特征；本申请在提取待推荐多媒体资源对应种子对象的种子对象特征之后，可以根据待推荐资源特征与种子对象特征之间的相似度，对种子对象特征进行更新，得到更新种子对象特征；若待推荐资源特征与种子对象特征的相似度较低，则对种子对象特征进行更新，直至待推荐资源特征与种子对象特征的相似度满足预设条件，从而使待推荐资源特征与种子对象特征具有较高的相似度；再基于更新种子对象特征与每个候选对象特征之间的相似度，从至少一个候选对象特征中筛选出推荐对象特征；从而可以提高推荐对象特征的筛选准确率，确保推荐对象特征与待推荐资源特征之间具有较高的相似度；可以从候选对象中筛选出与待推荐多媒体资源相似度较高的推荐对象，之后向推荐对象特征对应的推荐对象推送待推荐多媒体资源，可以提高多媒体资源的推荐准确率。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1是本说明书实施例提供的一种多媒体资源推荐系统的示意图；

图2是本说明书实施例提供的一种多媒体资源推荐方法的流程示意图；

图3是本说明书实施例提供的一种模型训练方法的流程示意图；

图4是本说明书实施例提供的一种基于所述第一预设模型对所述样本多媒体资源进行资源特征提取，得到所述样本资源特征的方法的流程示意图；

图5是本说明书实施例提供的一种待训练的多媒体资源推荐系统的结构示意图；

图6是本说明书实施例提供的一种对所述资源特征提取模型以及所述对象特征提取模型进行微调训练，得到更新资源特征提取模型以及更新对象特征提取模型的方法的流程示意图；

图7是本说明书实施例提供的一种获取所述待推荐多媒体资源对应的至少两个预训练对象以及每个预训练对象对应的预训练推荐结果标签的方法的流程示意图；

图8是本说明书实施例提供的一种确定更新种子对象特征的方法的流程示意图；

图9是本说明书实施例提供的一种推荐对象的筛选流程示意图；

图10是本说明书实施例提供的一种多媒体资源推荐装置的结构示意图；

图11是本说明书实施例提供的一种服务器的结构示意图。

具体实施方式

下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

可以理解的是，在本申请的具体实施方式中，涉及到用户信息等相关的数据，当本申请以上实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

请参阅图1，图1是本说明书实施例提供的一种多媒体资源推荐系统的示意图，如图1所示，该多媒体资源推荐系统可以至少包括服务器01和客户端02。

具体的，本说明书实施例中，所述服务器01可以包括一个独立运行的服务器，或者分布式服务器，或者由多个服务器组成的服务器集群，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN（ContentDelivery Network，内容分发网络）、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器01可以包括有网络通信单元、处理器和存储器等等。具体的，所述服务器01可以用于训练得到资源特征提取模型以及对象特征提取模型。

具体的，本说明书实施例中，所述客户端02可以包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备、智能音箱、车载终端、智能电视等类型的实体设备，也可以包括运行于实体设备中的软体，例如一些服务商提供给用户的网页页面，也可以为该些服务商提供给用户的应用。具体的，所述客户端02可以用于基于资源特征提取模型以及对象特征提取模型，从候选对象中筛选出针对待推荐多媒体资源的推荐对象。

以下介绍本申请的一种多媒体资源推荐方法，图2是本说明书实施例提供的一种多媒体资源推荐方法的流程示意图，本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的系统或服务器产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行（例如并行处理器或者多线程处理的环境）。具体的如图2所示，所述方法可以包括：

S201：获取待推荐多媒体资源。

在本说明书实施例中，待推荐多媒体资源可以包括但不限于视频、图像、文本等资源。在广告推荐场景中，待推荐多媒体资源可以为广告，在游戏推荐场景中，待推荐多媒体资源可以为游戏。

S203：对所述待推荐多媒体资源进行资源特征提取，得到待推荐资源特征。

示例性的，所述对所述待推荐多媒体资源进行资源特征提取，得到待推荐资源特征，包括：

基于资源特征提取模型对所述待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；其中，所述资源特征提取模型为根据样本相似度结果与样本推荐结果标签之间的差异，对第一预设模型进行训练得到；所述样本相似度结果为样本资源特征与样本对象特征之间的相似度，所述样本资源特征为基于第一预设模型对样本多媒体资源进行资源特征提取得到，所述样本对象特征为基于第二预设模型对样本对象关联信息进行对象特征提取得到；所述样本推荐结果标签表征向样本对象推送所述样本多媒体资源的推荐结果。

在本说明书实施例中，可以预先训练得到资源特征提取模型，在资源推荐场景中，通过资源特征提取模型提取待推荐多媒体资源的特征，得到待推荐资源特征；其中，资源特征提取模型可以包括图像特征提取网络、文本特征提取网络、特征融合网络等。

示例性的，图像特征提取网络用于根据输入图像提取图像特征，图像特征可以包括但不限于图像的颜色特征、纹理特征、形状特征和空间关系特征等；图像特征提取网络可以包括但不限于深度神经网络、卷积神经网络；神经网络 (Neural Network，NN)即人工神经网络，由具有权重和偏置的神经元组成，简单来说就是模拟生物神经元进行信息处理的模型。在训练过程中，神经网络通过调整神经元的权重和偏置，最终得到一个能将输入信息处理成为接近或符合预期输出的模型。深度神经网络 (Deep Neural Network，DNN)为具有多层的神经网络；是一种多层无监督神经网络，并且将上一层的输出特征作为下一层的输入进行特征学习，通过逐层特征映射后，将现有空间样本的特征映射到另一个特征空间，以此来学习对现有输入具有更好的特征表达。卷积神经网络 (Convolutional NeuralNetworks，CNN)在处理数据时充分考虑图像的结构，其中的神经元按三维排列，全连接层的每个神经元均与前一层的所有神经元相连，因而，能够有效提取图像的特征。CNN通常使用以下类型的层: 输入层、卷积层、激励层、池化层、全连接层。

示例性的，文本特征提取网络用于根据输入文本提取文本特征，文本特征可以包括但不限于文本类别特征、文本关键词特征等；文本特征提取网络可以包括但不限于词集模型、词袋模型等；其中，词集模型(Set of Words，SoW) 为单词构成的集合，每个单词只出现一次。和词袋模型唯一的不同是它仅仅考虑词是否在文本中出现，而不考虑词频。也就是一个词在文本中出现1次和多次特征处理是一样的。词袋模型(Bag of Words，BoW)，即将所有词语装进一个袋子里，不考虑其词法和语序的问题，即每个词语都是独立的，把每一个单词都进行统计，同时计算每个单词出现的次数。也就是说，词袋模型不考虑文本中词与词之间的上下文关系，仅仅只考虑所有词的权重，而权重与词在文本中出现的频率有关。

示例性的，特征融合网络用于对提取的图像特征以及文本特征进行融合处理，得到用于表征待推荐多媒体资源的待推荐资源特征；特征融合网络可以包括但不限于深度神经网络、卷积神经网络。

在本说明书实施例中，可以先对待推荐多媒体资源进行解析，得到待推荐图像特征以及待推荐文本特征，再将待推荐图像特征输入图像特征提取网络进行图像特征提取处理，得到待推荐图像特征，将待推荐文本特征输入文本特征提取网络进行文本特征提取处理，得到待推荐文本特征；然后将待推荐图像特征以及待推荐文本特征输入特征融合网络进行特征融合处理，得到待推荐资源特征。

在本说明书实施例中，在模型应用之前，可以训练得到资源特征提取模型以及对象特征提取模型，如图3所示，图3为一种模型训练方法，该方法包括：

S301：获取所述样本对象对应的所述样本多媒体资源以及所述样本对象关联信息，所述样本多媒体资源标注了所述样本推荐结果标签；

在本说明书实施例中，所述样本推荐结果标签表征向样本对象推送所述样本多媒体资源的推荐结果，推荐结果可以包括推荐成功结果以及推荐失败结果；推荐结果可以根据样本对象的点击行为确定，即样本推荐结果标签可以表征所述样本对象是否点击所述样本多媒体资源；样本推荐结果标签可以为数值标签，在向样本对象推荐样本多媒体资源的过程中，在样本对象点击所述样本多媒体资源的情况下，可以确定样本推荐结果标签为数值1，即推荐成功；在样本对象未点击所述样本多媒体资源的情况下，可以确定样本推荐结果标签为数值0，即推荐失败。其中，样本对象关联信息可以包括但不限于样本对象的属性信息以及样本对象的交互信息；样本对象的交互信息可以为样本对象与历史多媒体资源的交互信息，交互信息可以为历史行为数据，例如，样本对象在历史多媒体资源的多次投放下的浏览数据、点击数据等。

在本说明书实施例中，样本对象、样本多媒体资源可以为多个，可以向每个样本对象推荐相同或不同的样本多媒体资源，并得到各个样本对象-样本多媒体资源的推荐结果，并根据推荐结果标注样本推荐结果标签；并可以根据每个样本对象-样本多媒体资源的推荐结果，确定正负样本对象以及正负样本多媒体资源。

S303：基于所述第一预设模型对所述样本多媒体资源进行资源特征提取，得到所述样本资源特征；

在本说明书实施例中，第一预设模型可以包括但不限于：深度神经网络(DeepNeural Networks，DNN)、预训练语言模型、多模态模型、图片/视频的预训练模型等。

其中，预训练语言模型是指通过预设文本数据进行预先训练，得到一套模型参数，然后利用这套参数对机器学习模型进行初始化，再进行训练得到的模型。

多模态模型是一种能够处理多种类型数据（如文本、图像、音频和视频）的人工智能模型。这种模型的目标是通过结合不同类型的数据来提供更全面、更准确的信息。例如，一个多模态模型不仅能够分析文本数据中的信息，还能够分析图像和音频数据中的信息。

图片/视频的预训练模型是指通过预设的图片/视频进行预先训练，得到一套模型参数，然后利用这套参数对机器学习模型进行初始化，再进行训练得到的模型。

示例性的，所述第一预设模型包括待训练图像特征提取网络、待训练文本特征提取网络以及待训练特征融合网络，如图4所示，所述基于所述第一预设模型对所述样本多媒体资源进行资源特征提取，得到所述样本资源特征，包括：

S3031：基于所述待训练图像特征提取网络，对所述样本多媒体资源进行图像特征提取，得到样本图像特征；

在本说明书实施例中，所述待训练图像特征提取网络包括待训练图像提取子网络以及待训练图像特征提取子网络，所述基于所述待训练图像特征提取网络，对所述样本多媒体资源进行图像特征提取，得到样本图像特征，包括：

基于所述待训练图像提取子网络，对所述样本多媒体资源进行图像提取，得到样本图像；

基于所述待训练图像特征提取子网络，对所述样本图像进行图像特征提取，得到所述样本图像特征。

在本说明书实施例中，待训练图像特征提取网络可以为编码器，待训练图像特征提取网络可以包括待训练图像提取子网络以及待训练图像特征提取子网络，待训练图像提取子网络可以用于提取样本多媒体资源中的样本图像，待训练图像特征提取子网络用于提取样本图像对应的样本图像特征；样本图像特征可以为样本图像的向量表示。

S3033：基于所述待训练文本特征提取网络，对所述样本多媒体资源进行文本特征提取，得到样本文本特征；

在本说明书实施例中，所述待训练文本特征提取网络包括待训练文本提取子网络以及待训练文本特征提取子网络，所述基于所述待训练文本特征提取网络，对所述样本多媒体资源进行文本特征提取，得到样本文本特征，包括：

基于所述待训练文本提取子网络，对所述样本多媒体资源进行文本提取，得到样本文本；

基于所述待训练文本特征提取子网络，对所述样本文本进行文本特征提取，得到所述样本文本特征。

在本说明书实施例中，待训练文本特征提取网络可以为编码器，待训练文本特征提取网络可以包括待训练文本提取子网络以及待训练文本特征提取子网络，待训练文本提取子网络可以用于提取样本多媒体资源中的样本文本，待训练文本特征提取子网络用于提取样本文本对应的样本文本特征；样本文本特征可以为样本文本的向量表示。

S3035：基于所述待训练特征融合网络，对所述样本图像特征以及所述样本文本特征进行融合处理，得到所述样本资源特征。

在本说明书实施例中，在得到样本图像特征以及样本文本特征之后，可以将两种特征输入待训练特征融合网络进行融合处理，得到样本资源特征；即样本资源特征可以为样本图像特征以及样本文本特征的组合特征。

在本说明书实施例中，在模型训练过程中，通过模型中不同的网络分别进行图像特征提取、文本特征提取以及特征融合处理，从而可以实现图像特征、文本特征的快速、准确提取，实现图像特征、文本特征的快速、准确融合，从而提高了样本资源特征的准确率以及确定效率。

S305：基于所述第二预设模型对所述样本对象关联信息进行对象特征提取，得到所述样本对象特征；

在本说明书实施例中，第二预设模型可以包括但不限于深度神经网络(DeepNeural Networks， DNN)、各种序列表征网络等，可以通过第二预设模型对所述样本对象关联信息进行对象特征提取，得到所述样本对象特征；样本对象关联信息可以包括样本对象的属性信息以及样本对象的交互信息；可以通过第二预设模型分别提取样本对象的属性信息以及样本对象的交互信息各自对应的特征并进行特征组合，得到样本对象特征。样本对象特征可以为向量特征；样本对象的交互信息可以为样本对象与历史多媒体资源的交互信息，样本对象的交互信息可以为样本对象针对历史多媒体资源的历史行为数据；例如，样本对象的交互信息可以为样本对象在历史多媒体资源的多次投放下的浏览数据、点击数据等。

在本说明书实施例中，可以将第一预设模型、第二预设模型输出的特征映射至同一特征空间，并进行归一化处理后，得到样本资源特征以及样本对象特征。具体的，通过第一预设模型对所述样本多媒体资源进行资源特征提取，得到初始样本资源特征，再将初始样本资源特征映射至预设特征空间，得到映射样本资源特征，之后对映射样本资源特征进行归一化处理，得到所述样本资源特征；通过第二预设模型对样本对象关联信息进行资源特征提取，得到初始样本对象特征，再将初始样本对象特征映射至预设特征空间，得到映射样本对象特征，之后对映射样本对象特征进行归一化处理，得到所述样本对象特征。

S307：确定所述样本资源特征与所述样本对象特征之间的相似度，得到所述样本相似度结果；

在本说明书实施例中，可以计算样本资源特征与所述样本对象特征之间的相似度，得到所述样本相似度结果；样本相似度结果可以为0-1范围内的数值。

在本说明书实施例中，所述样本多媒体资源包括向正样本对象推荐成功的正样本多媒体资源，以及向负样本对象推荐失败的负样本多媒体资源，所述样本推荐结果标签包括第一数值标签以及第二数值标签；第一数值大于第二数值；所述正样本多媒体资源标注了所述第一数值标签，所述负样本多媒体资源标注了所述第二数值标签；示例性的，第一数值可以为1，第二数值可以为0。其中，正样本对象与正样本多媒体资源可以构成正样本对，正样本对对应的标签为第一数值标签，负样本对象与负样本多媒体资源可以构成负样本对，负样本对对应的标签为第二数值标签。

在本说明书实施例中，所述确定所述样本资源特征与所述样本对象特征之间的相似度，得到所述样本相似度结果，包括：

确定正样本资源特征与所述正样本对象对应的正样本对象特征之间的相似度，得到第一样本相似度结果；所述正样本资源特征为所述正样本多媒体资源对应的资源特征；

确定负样本资源特征与所述负样本对象对应的负样本对象特征之间的相似度，得到第二样本相似度结果；所述负样本资源特征为所述负样本多媒体资源对应的资源特征。

在本说明书实施例中，相似度计算方法包括但不限于向量点乘法、余弦（cosine）相似度；其中，样本资源特征与样本对象特征可以为向量特征；向量（也称为欧几里得向量、几何向量、矢量），指具有大小（magnitude）和方向的量；它可以形象化地表示为带箭头的线段。向量点乘法是指计算一个向量和它在另一个向量上的投影的长度的乘积。余弦相似度，又称为余弦相似性，是通过计算两个向量的夹角余弦值来评估他们的相似度。

示例性的，样本相似度结果可以为余弦相似度数值；第一样本相似度结果、第二样本相似度结果的取值范围可以为0-1；在模型训练过程中，使第一样本相似度结果越来越大，使第二样本相似度结果越来越小；从而使正样本资源特征与正样本对象特征之间的差异越来越小，使负样本资源特征与负样本对象特征之间的差异越来越大。

S309：基于所述样本相似度结果与所述样本推荐结果标签之间的差异，对所述第一预设模型以及所述第二预设模型进行训练，得到所述资源特征提取模型以及所述对象特征提取模型。

在本说明书实施例中，样本相似度结果与所述样本推荐结果标签可以均为0-1范围内的数值，可以根据两者的差异，调整所述第一预设模型以及所述第二预设模型的模型参数直至训练结束，得到所述资源特征提取模型以及所述对象特征提取模型。

在本说明书实施例中，所述基于所述样本相似度结果与所述样本推荐结果标签之间的差异，对所述第一预设模型以及所述第二预设模型进行训练，得到所述资源特征提取模型以及所述对象特征提取模型，包括：

基于所述第一样本相似度结果与所述第一数值标签之间的第一差异，以及所述第二样本相似度结果与所述第二数值标签之间的第二差异，对所述第一预设模型以及所述第二预设模型进行训练直至满足训练结束条件；

将训练结束时的所述第一预设模型确定为所述资源特征提取模型，将训练结束时的所述第二预设模型确定为所述对象特征提取模型。

在本说明书实施例中，所述基于所述第一样本相似度结果与所述第一数值标签之间的第一差异，以及所述第二样本相似度结果与所述第二数值标签之间的第二差异，对所述第一预设模型以及所述第二预设模型进行训练直至满足训练结束条件，包括：

基于所述第一样本相似度结果与所述第一数值标签之间的第一差异，确定第一损失信息；

基于所述第二样本相似度结果与所述第二数值标签之间的第二差异，确定第二损失信息；

基于所述第一损失信息以及所述第二损失信息，确定目标损失信息；

基于所述目标损失信息调整所述第一预设模型以及所述第二预设模型各自对应的模型参数直至满足训练结束条件。

在本说明书实施例中，可以根据第一样本相似度结果与所述第一数值标签之间的第一差异，确定两者之间的第一损失信息；根据第二样本相似度结果与所述第二数值标签之间的第二差异，确定两者之间的第二损失信息；并根据第一损失信息以及第二损失信息，确定目标损失信息，从而根据目标损失信息调整第一预设模型以及第二预设模型各自对应的模型参数直至满足训练结束条件。可以根据交叉熵或KL散度构建模型的损失函数。交叉熵（Cross Entropy）是损失函数的一种（也称为损失函数或代价函数），用于描述模型预测值与真实值的差距大小；交叉熵用于衡量模型的性能，交叉熵的意义是用该模型对文本识别的难度，或者从压缩的角度来看，每个词平均要用几个位来编码。KL散度（Kullback-Leibler Divergence）一般用于度量两个概率分布函数之间的“距离”；KL散度可以用来衡量两个分布之间的差异程度；若两者差异越小，KL散度越小，反之则KL散度越大；当两个分布一致时，其KL散度为0。

示例性的，可以构建交叉熵损失函数，并根据交叉熵损失函数计算目标损失信息（损失值），示例性的，交叉熵损失函数如下：

其中，CE为目标损失信息，N为样本对象-样本多媒体资源对的总数量，i为样本对象-样本多媒体资源对，表示第i个样本对象-样本多媒体资源对的样本推荐结果标签（样本推荐结果标签可以为数值标签j，j取值为0-1），正样本对所对应的标签j为1，负样本对所对应的标签j为0；p_ij表示第i个样本对象-样本多媒体资源对的预测结果为正样本对所对应标签的概率。

在一些实施例中，训练结束条件可以为推荐成功的样本资源特征与样本对象特征的相似度大于第一阈值，推荐失败的样本资源特征与样本对象特征的相似度小于第二阈值；其中，第一阈值大于第二阈值；训练结束条件可以为目标损失信息小于预设阈值，还可以根据目标损失信息以及训练迭代次数确定训练结束条件。例如，可以将训练结束条件设置为目标损失信息小于预设阈值，且训练迭代次数达到预设次数阈值。训练结束条件还可以根据实际情况进行设置。

在本说明书实施例中，根据第一样本相似度结果与所述第一数值标签之间的第一差异，确定两者之间的第一损失信息；根据第二样本相似度结果与所述第二数值标签之间的第二差异，确定两者之间的第二损失信息；并根据第一损失信息以及第二损失信息，确定目标损失信息；再根据目标损失信息调整第一预设模型以及所述第二预设模型各自对应的模型参数，从而可以提高两个模型的训练效率以及模型提取特征的准确率。

在本说明书实施例中，如图5所示，图5为一种待训练的多媒体资源推荐系统的结构示意图，该系统包括图像素材编码器、文本素材编码器以及对象特征编码器，在样本多媒体资源为视频或图像的情况下，可以将其解析成样本图像以及样本文本；将样本图像输入图像素材编码器进行图像特征提取处理，得到样本图像特征；可以进一步确定样本文本对应的文本类别，然后将样本文本及其对应的文本类别输入文本素材编码器进行文本特征提取，得到样本文本特征；然后将样本图像特征以及样本资源特征进行融合处理，得到样本资源特征；将样本对象关联信息输入对象特征编码器进行对象特征提取处理，得到样本对象特征；之后计算样本对象特征与样本资源特征之间的相似度，得到目标损失信息；再根据目标损失信息反向对图像素材编码器、文本素材编码器以及对象特征编码器的网络参数进行调整，直至满足训练结束条件。

在本说明书实施例中，可以确定待推荐多媒体资源的预投放对象，并进行资源预投放，得到预投放数据，并根据预投放数据对资源特征提取模型、对象特征提取模型进行微调训练。

在本说明书实施例中，如图6所示，所述基于资源特征提取模型对所述待推荐多媒体资源进行资源特征提取，得到待推荐资源特征之后，所述方法还包括：

S601：获取所述待推荐多媒体资源对应的至少两个预训练对象以及每个预训练对象对应的预训练推荐结果标签；

在本说明书实施例中，预训练对象可以为预投放对象，预训练推荐结果标签可以根据预训练对象是否点击待推荐多媒体资源确定，预训练推荐结果标签表征预训练对象是否点击待推荐多媒体资源；若预训练对象点击了待推荐多媒体资源，则可以确定预训练推荐结果标签为数值1，若预训练对象未点击待推荐多媒体资源，则可以确定预训练推荐结果标签为数值0。

在本说明书实施例中，如图7所示，所述候选对象为至少两个，所述获取所述待推荐多媒体资源对应的至少两个预训练对象以及每个预训练对象对应的预训练推荐结果标签，包括：

S6011：根据所述待推荐资源特征与每个候选对象特征之间的相似度，得到每个候选对象特征对应的候选相似度；

S6013：基于所述每个候选对象特征对应的候选相似度，从所述至少两个候选对象中筛选所述至少两个预训练对象；

在本说明书实施例中，可以基于所述每个候选对象特征对应的候选相似度，对所述至少两个候选对象特征进行排序；根据排序结果，确定筛选对象特征；或者将候选相似度大于预设相似度阈值的候选对象特征确定为筛选对象特征。最后将所述筛选对象特征对应的候选对象，确定为所述预训练对象。

S6015：向所述至少两个预训练对象推送所述待推荐多媒体资源；

在本说明书实施例中，可以在确定待推荐多媒体资源的预投放对象之后，进行资源预投放，得到预投放数据（推荐结果），并根据预投放数据对资源特征提取模型、对象特征提取模型进行微调训练。

S6017：根据所述至少两个预训练对象各自对应的推荐结果，确定每个预训练对象对应的预训练推荐结果标签。

在本说明书实施例中，预训练推荐结果标签可以根据预训练对象是否点击待推荐多媒体资源确定，预训练推荐结果标签表征预训练对象是否点击待推荐多媒体资源；若预训练对象点击了待推荐多媒体资源，则可以确定预训练推荐结果标签为数值1，若预训练对象未点击待推荐多媒体资源，则可以确定预训练推荐结果标签为数值0。

在一些实施例中，可以从所述至少两个候选对象中筛选多个初始预训练对象，并确定投放数据的数量阈值，在根据筛选的初始预训练对象进行资源投放的过程中，可以根据数量阈值，从筛选的初始预训练对象中确定预训练对象。

S603：基于所述对象特征提取模型对每个预训练对象进行对象特征提取，得到每个预训练对象的预训练对象特征；

在本说明书实施例中，可以将每个预训练对象的对象关联信息，输入对象特征提取模型对进行对象特征提取，得到每个预训练对象的预训练对象特征。预训练对象的对象关联信息与样本对象关联信息可以为同一类别的信息。

S605：根据所述待推荐资源特征与每个预训练对象特征之间的相似度，确定每个预训练对象对应的预训练相似度结果；

在本说明书实施例中，可以通过计算待推荐资源特征与每个预训练对象特征之间的余弦相似度，确定每个预训练对象对应的预训练相似度结果；预训练相似度结果可以为0-1范围内的数值。

S607：基于所述每个预训练对象对应的预训练相似度结果与所述每个预训练对象对应的预训练推荐结果标签之间的差异，对所述资源特征提取模型以及所述对象特征提取模型进行微调训练，得到更新资源特征提取模型以及更新对象特征提取模型。

在本说明书实施例中，微调训练与之前的训练方法类似，通过待推荐多媒体资源对应的预投放数据，对资源特征提取模型以及对象特征提取模型进行微调训练，得到更新资源特征提取模型以及更新对象特征提取模型，相比于初始的资源特征提取模型以及对象特征提取模型，更新后的资源特征提取模型以及对象特征提取模型的准确率更高，从而可以提高待推荐资源特征与每个候选对象特征之间的相似度的计算准确率，提高了推荐对象的准确率，提高了待推荐多媒体资源的推荐成功率。

在本说明书实施例中，所述方法还包括：

基于所述更新资源特征提取模型对所述待推荐多媒体资源进行资源特征提取，得到更新待推荐资源特征；

相应的，所述基于所述对象特征提取模型对每个候选对象的对象关联信息进行对象特征提取，得到每个候选对象对应的候选对象特征，包括：

基于所述更新对象特征提取模型对每个候选对象对应的对象关联信息进行对象特征提取，得到每个候选对象对应的更新候选对象特征；

在本说明书实施例中，所述方法还包括：

基于所述更新对象特征提取模型对所述种子对象对应的对象关联信息进行对象特征提取，得到所述种子对象对应的目标种子对象特征；

所述基于所述待推荐资源特征与所述种子对象特征之间的相似度，对所述种子对象特征进行更新，得到更新种子对象特征，包括：

基于所述更新待推荐资源特征与所述目标种子对象特征之间的相似度，对所述种子对象特征进行更新，得到更新种子对象特征。

如图8所示，图8为一种确定更新种子对象特征的方法的流程示意图，包括：

S801：基于所述更新资源特征提取模型对所述待推荐多媒体资源进行资源特征提取，得到更新待推荐资源特征；

S803：基于所述更新对象特征提取模型对所述种子对象对应的对象关联信息进行对象特征提取，得到所述种子对象对应的目标种子对象特征；

S805：基于所述更新待推荐资源特征与所述目标种子对象特征之间的相似度，对所述种子对象特征进行更新，得到更新种子对象特征。

在本说明书实施例中，在微调训练得到更新资源特征提取模型以及更新对象特征提取模型之后，可以通过更新资源特征提取模型重新提取待推荐多媒体资源的特征，得到更新待推荐资源特征；通过更新对象特征提取模型对种子对象对应的对象关联信息进行对象特征提取，得到目标种子对象特征；再计算更新待推荐资源特征与所述目标种子对象特征之间的相似度，对所述种子对象特征进行更新，得到更新种子对象特征，从而提高了更新种子对象特征的准确率；进一步提高了推荐对象特征的筛选准确率。

S205：获取至少一个候选对象特征；每个候选对象特征为对每个候选对象的对象关联信息进行对象特征提取得到。

在本说明书实施例中，所述获取至少一个候选对象特征，包括：

根据对象特征提取模型对每个候选对象的对象关联信息进行对象特征提取，得到至少一个候选对象特征；所述对象特征提取模型为根据所述样本相似度结果与所述样本推荐结果标签之间的差异，对所述第二预设模型进行训练得到。

在本说明书实施例中，所述对象关联信息包括对象属性信息以及对象交互信息；候选对象特征可以为基于候选对象的对象关联信息进行特征提取得到；可以将资源特征提取模型、对象特征提取模型输出的特征映射至同一特征空间，并进行归一化处理后，得到样本资源特征以及样本对象特征。具体的，可以通过资源特征提取模型对待推荐多媒体资源进行资源特征提取，得到初始待推荐特征，再将初始待推荐特征映射至预设特征空间，得到映射待推荐特征，之后对映射待推荐特征进行归一化处理，得到待推荐资源特征；通过对象特征提取模型对候选对象的对象关联信息进行对象特征提取，得到初始候选对象特征，再将初始候选对象特征映射至预设特征空间，得到映射候选对象特征，之后对映射候选对象特征进行归一化处理，得到所述候选对象特征。

在本说明书实施例中，所述方法还包括：

获取至少一个初始对象对应的对象关联信息；

基于所述对象特征提取模型对每个初始对象的对象关联信息进行对象特征提取，得到每个初始对象对应的初始对象特征；

基于所述每个初始对象对应的初始对象特征，构建对象信息库。

在本说明书实施例中，对象信息库可以为对象信息记忆矩阵；可以在其中存储所有初始对象的对象关联信息与初始对象特征的对应关系，并可以定期进行更新。

示例性的，所述获取至少一个初始对象对应的对象关联信息，包括：

获取至少一个初始对象对应的对象属性信息以及对象交互信息；

将每个初始对象对应的对象属性信息以及对象交互信息，确定为所述每个初始对象对应的对象关联信息。

在本说明书实施例中，初始对象的对象关联信息可以包括但不限于初始对象的属性信息以及初始对象的交互信息；初始对象的交互信息可以为初始对象与历史多媒体资源的交互信息，初始对象的交互信息可以为初始对象针对历史多媒体资源的历史行为数据；例如，初始对象的交互信息可以为初始对象在历史多媒体资源的多次投放下的浏览数据、点击数据等。

示例性的，所述获取至少一个候选对象特征，包括：

基于所述对象信息库，获取所述至少一个候选对象特征。

在本说明书实施例中，可以将对象信息库中的部分或全部初始对象确定为候选对象，从而进一步确定候选对象特征。

在本说明书实施例中，所述方法还包括：

每间隔预设时段获取所述对象信息库中各个初始对象对应的对象关联信息；

将对象关联信息发生变更的初始对象确定为待更新对象；

基于所述对象特征提取模型对所述待更新对象的更新对象关联信息进行对象特征提取，得到所述待更新对象的更新对象特征；

基于所述待更新对象的更新对象特征，对所述对象信息库进行更新。

在本说明书实施例中，预设时段可以根据实际情况进行设置，例如可以设置为一周、一个月等；可以定期获取对象信息库中各个初始对象对应的实时对象关联信息以及存储对象关联信息，实时对象关联信息为间隔预设时段获取的信息；可以将实时对象关联信息与存储对象关联信息进行比对，将对比不一致的对象确定为待更新对象，并将其对应的存储对象关联信息替换成实时对象关联信息，得到更新对象关联信息；并根据对象特征提取模型对所述待更新对象的更新对象关联信息进行对象特征提取，得到所述待更新对象的更新对象特征；并根据所述待更新对象的更新对象特征，对所述对象信息库进行更新；从而可以根据更新的对象信息库，得到更新的初始对象特征；通过定期对上述对象信息库进行更新，可以提高候选对象的候选对象特征的准确率。

S207：获取所述待推荐多媒体资源对应的种子对象，并确定所述种子对象对应的种子对象特征；所述种子对象为关注度参数大于预设参数阈值的对象；所述关注度参数表征所述种子对象对所述待推荐多媒体资源的感兴趣程度。

在本说明书实施例中，可以通过圈选关键词生成种子对象，可以基于匹配框架得到基于历史投放数据圈选的种子对象包；种子对象可以为一个或多个，种子对象为关注度参数大于预设参数阈值的对象；所述关注度参数表征所述种子对象对所述待推荐多媒体资源的感兴趣程度；即种子对象可以理解为点击待推荐多媒体资源的对象；若待推荐多媒体资源存在对应的种子对象，可以根据种子对象以及待推荐多媒体资源对上述对象特征提取模型进行微调训练，从而提高该模型的特征提取准确率。

在本说明书实施例中，可以基于所述对象特征提取模型对所述种子对象进行对象特征提取，得到种子对象特征；示例性的，可以获取种子对象的对象关联信息，然后将所述种子对象的对象关联信息输入对象特征提取模型进行对象特征提取，得到种子对象特征。

S209：基于所述待推荐资源特征与所述种子对象特征之间的相似度，对所述种子对象特征进行更新，得到更新种子对象特征；

在本说明书实施例中，待推荐多媒体资源与所述种子对象构成正样本对，可以根据该正样本对，对资源特征提取模型以及对象特征提取模型进行微调训练。在训练过程中，可以同时调整资源特征提取模型以及对象特征提取模型的模型参数，也可以仅调整对象特征提取模型的模型参数，直至两个模型提取的特征之间的相似度大于预设相似度阈值；若同时调整资源特征提取模型以及对象特征提取模型的模型参数，则得到调整后资源特征提取模型以及调整后对象特征提取模型。若仅调整对象特征提取模型的模型参数，则得到资源特征提取模型以及调整后对象特征提取模型。可以根据调整后对象特征提取模型，提取种子对象的对象特征，得到更新种子对象特征；在一示例性实施例中，待推荐资源特征、种子对象特征可以均为16维向量，通过调整后对象特征提取模型，可以对种子对象特征的16维向量中每一维赋予不同的权重，从而得到更新种子对象特征。

S2011：基于所述更新种子对象特征与每个候选对象特征之间的相似度，从所述至少一个候选对象特征中筛选出所述推荐对象特征。

在本说明书实施例中，可以根据更新种子对象特征与每个候选对象特征之间的相似度，从所述至少一个候选对象特征中筛选出所述推荐对象特征；例如可以根据多个候选对象特征各自对应的相似度计算结果，从大到小进行排序，将排序靠前的预设数量个候选对象特征确定为推荐对象特征；还可以将相似度计算结果大于预设相似度阈值的候选对象特征确定推荐对象特征。其中，预设数量可以根据实际情况进行设置。本实施例根据种子对象以及待推荐多媒体资源对上述对象特征提取模型进行微调训练，从而提高该模型的特征提取准确率。

在本说明书实施例中，还可以通过种子对象得到调整后资源特征提取模型以及调整后对象特征提取模型；然后通过预投放数据确定预训练对象，在调整后资源特征提取模型以及调整后对象特征提取模型的基础上进行微调训练，从而得到更新资源特征提取模型以及更新对象特征提取模型，最后根据更新资源特征提取模型以及更新对象特征提取模型进行特征提取并确定推荐对象，从而进行资源推荐。

S2013：向所述推荐对象特征对应的推荐对象推送所述待推荐多媒体资源。

在本说明书实施例中，在确定出推荐对象特征之后，可以确定推荐对象特征对应的推荐对象，推荐对象可以为一个或多个；从而向推荐对象推送所述待推荐多媒体资源，由此可以提高待推荐多媒体资源的转化率。

本申请可以充分利用历史多次投放的数据，并且将投放使用的素材也纳入特征中，捕捉用户和素材之间更直接的关联关系。本申请首先使用历史投放的素材和用户实际的转化点击数据进行模型训练，可以学习每一个用户对投放素材的喜爱度，得到多模态素材编码器和用户信息记忆矩阵（用于存储用户特征）。当新素材需要投放时，利用训练后的多模态素材编码器对新素材进行编码处理，得到新素材特征，在用户信息记忆矩阵中搜索与新素材特征最接近的目标用户特征。目标用户特征对应的用户即为对新素材最感兴趣的用户，由此可以确定新素材对应的推荐对象。

在本说明书实施例中，服务器在训练得到资源特征提取模型以及对象特征提取模型之后，可以将两个模型发送至客户端进行应用；如图9所示，图9为一种推荐对象的筛选流程示意图，在客户端的显示页面中显示文本素材输入控件以及图像输入控件，用户可以根据文本素材输入控件输入待推荐多媒体资源的文本素材，用户可以根据图像输入控件输入待推荐多媒体资源的图像素材；通过资源特征提取模型提取文本素材以及图像素材各自对应的特征，并进行融合处理，得到待推荐资源特征；通过对象特征提取模型提取各个候选对象的候选对象特征，并通过计算待推荐资源特征与各个候选对象特征之间的相似度，得到推荐对象特征，从而确定推荐对象，并可以展示推荐对象的对象关联信息，推荐对象的对象关联信息可以为推荐对象的属性信息等。用户可以点击页面中的“去投放”控件，向推荐对象对应的客户端发送待推荐多媒体资源。

在一些实施例中，种子对象可以为种子用户，多个种子用户组成种子人群；业务方上传素材后，可以基于匹配框架得到基于历史投放数据圈选的种子人群包；也可以手动圈选关键词筛选种子人群，得到种子人群包。系统自动下发该种子人群包；当种子人群包中素材投放成功的种子人数达到预设数量阈值时，可以利用收集到的投放数据进一步微调原有的框架，生成适用于当前任务的投放模型（包括资源特征提取模型以及对象特征提取模型）；其中，预设数量阈值可以根据实际情况进行设置。

由以上本说明书实施例提供的技术方案可见，本说明书实施例获取待推荐多媒体资源；对待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；获取至少一个候选对象特征；每个候选对象特征为对每个候选对象的对象关联信息进行对象特征提取得到；获取待推荐多媒体资源对应的种子对象，并确定种子对象对应的种子对象特征；种子对象为关注度参数大于预设参数阈值的对象；关注度参数表征种子对象对待推荐多媒体资源的感兴趣程度；基于待推荐资源特征与种子对象特征之间的相似度，对种子对象特征进行更新，得到更新种子对象特征；本申请在提取待推荐多媒体资源对应种子对象的种子对象特征之后，可以根据待推荐资源特征与种子对象特征之间的相似度，对种子对象特征进行更新，得到更新种子对象特征；若待推荐资源特征与种子对象特征的相似度较低，则对种子对象特征进行更新，直至待推荐资源特征与种子对象特征的相似度满足预设条件，从而使待推荐资源特征与种子对象特征具有较高的相似度；再基于更新种子对象特征与每个候选对象特征之间的相似度，从至少一个候选对象特征中筛选出推荐对象特征；从而可以提高推荐对象特征的筛选准确率，确保推荐对象特征与待推荐资源特征之间具有较高的相似度；可以从候选对象中筛选出与待推荐多媒体资源相似度较高的推荐对象，之后向推荐对象特征对应的推荐对象推送待推荐多媒体资源，可以提高多媒体资源的推荐准确率。

本说明书实施例还提供了一种多媒体资源推荐装置，如图10所示，所述装置包括：

多媒体资源获取模块1010，用于获取待推荐多媒体资源；

推荐特征确定模块1020，用于对所述待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；

对象特征获取模块1030，用于获取至少一个候选对象特征；每个候选对象特征为对每个候选对象的对象关联信息进行对象特征提取得到；

种子对象获取模块1040，用于获取所述待推荐多媒体资源对应的种子对象，并确定所述种子对象对应的种子对象特征；所述种子对象为关注度参数大于预设参数阈值的对象；所述关注度参数表征所述种子对象对所述待推荐多媒体资源的感兴趣程度；

种子特征更新模块1050，用于基于所述待推荐资源特征与所述种子对象特征之间的相似度，对所述种子对象特征进行更新，得到更新种子对象特征；

筛选模块1060，用于基于所述更新种子对象特征与每个候选对象特征之间的相似度，从所述至少一个候选对象特征中筛选出推荐对象特征；

推荐模块1070，用于向所述推荐对象特征对应的推荐对象推送所述待推荐多媒体资源。

在一些实施例中，所述推荐特征确定模块包括：

待推荐资源特征提取单元，用于基于资源特征提取模型对所述待推荐多媒体资源进行资源特征提取，得到所述待推荐资源特征；其中，所述资源特征提取模型为根据样本相似度结果与样本推荐结果标签之间的差异，对第一预设模型进行训练得到；所述样本相似度结果为样本资源特征与样本对象特征之间的相似度，所述样本资源特征为基于第一预设模型对样本多媒体资源进行资源特征提取得到，所述样本对象特征为基于第二预设模型对样本对象关联信息进行对象特征提取得到；所述样本推荐结果标签表征向样本对象推送所述样本多媒体资源的推荐结果。

在一些实施例中，所述对象特征获取模块包括：

候选特征提取单元，用于根据对象特征提取模型对每个候选对象的对象关联信息进行对象特征提取，得到至少一个候选对象特征；所述对象特征提取模型为根据所述样本相似度结果与所述样本推荐结果标签之间的差异，对所述第二预设模型进行训练得到。

在一些实施例中，所述装置还可以包括：

样本关联信息获取模块，用于获取所述样本对象对应的所述样本多媒体资源以及所述样本对象关联信息，所述样本多媒体资源标注了所述样本推荐结果标签；

样本资源特征提取模块，用于基于所述第一预设模型对所述样本多媒体资源进行资源特征提取，得到所述样本资源特征；

样本对象特征提取模块，用于基于所述第二预设模型对所述样本对象关联信息进行对象特征提取，得到所述样本对象特征；

样本相似度确定模块，用于确定所述样本资源特征与所述样本对象特征之间的相似度，得到所述样本相似度结果；

训练模块，用于基于所述样本相似度结果与所述样本推荐结果标签之间的差异，对所述第一预设模型以及所述第二预设模型进行训练，得到所述资源特征提取模型以及所述对象特征提取模型。

在一些实施例中，所述样本多媒体资源包括向正样本对象推荐成功的正样本多媒体资源，以及向负样本对象推荐失败的负样本多媒体资源，所述样本推荐结果标签包括第一数值标签以及第二数值标签；所述第一数值大于所述第二数值；所述正样本多媒体资源标注了所述第一数值标签，所述负样本多媒体资源标注了所述第二数值标签；所述样本相似度确定模块包括：

第一相似度确定单元，用于确定正样本资源特征与所述正样本对象对应的正样本对象特征之间的相似度，得到第一样本相似度结果；所述正样本资源特征为所述正样本多媒体资源对应的资源特征；

第二相似度确定单元，用于确定负样本资源特征与所述负样本对象对应的负样本对象特征之间的相似度，得到第二样本相似度结果；所述负样本资源特征为所述负样本多媒体资源对应的资源特征；

相应的，所述训练模块包括：

训练单元，用于基于所述第一样本相似度结果与所述第一数值标签之间的第一差异，以及所述第二样本相似度结果与所述第二数值标签之间的第二差异，对所述第一预设模型以及所述第二预设模型进行训练直至满足训练结束条件；

模型确定单元，用于将训练结束时的所述第一预设模型确定为所述资源特征提取模型，将训练结束时的所述第二预设模型确定为所述对象特征提取模型。

在一些实施例中，所述训练单元包括：

第一损失确定子单元，用于基于所述第一样本相似度结果与所述第一数值标签之间的第一差异，确定第一损失信息；

第二损失确定子单元，用于基于所述第二样本相似度结果与所述第二数值标签之间的第二差异，确定第二损失信息；

目标损失确定子单元，用于基于所述第一损失信息以及所述第二损失信息，确定目标损失信息；

参数调整子单元，用于基于所述目标损失信息调整所述第一预设模型以及所述第二预设模型各自对应的模型参数直至满足训练结束条件。

在一些实施例中，所述第一预设模型包括待训练图像特征提取网络、待训练文本特征提取网络以及待训练特征融合网络，所述样本资源特征提取模块包括：

样本图像特征提取单元，用于基于所述待训练图像特征提取网络，对所述样本多媒体资源进行图像特征提取，得到样本图像特征；

样本文本特征提取单元，用于基于所述待训练文本特征提取网络，对所述样本多媒体资源进行文本特征提取，得到样本文本特征；

样本融合单元，用于基于所述待训练特征融合网络，对所述样本图像特征以及所述样本文本特征进行融合处理，得到所述样本资源特征。

在一些实施例中，所述装置还包括：

对象关联信息获取模块，用于获取至少一个初始对象对应的对象关联信息；

初始对象特征确定模块，用于基于所述对象特征提取模型对每个初始对象的对象关联信息进行对象特征提取，得到每个初始对象对应的初始对象特征；

信息库构建模块，用于基于所述每个初始对象对应的初始对象特征，构建对象信息库；

相应的，所述对象特征获取模块包括：

候选特征获取单元，用于基于所述对象信息库，获取所述至少一个候选对象特征。

在一些实施例中，所述装置还包括：

初始信息获取模块，用于每间隔预设时段获取所述对象信息库中各个初始对象对应的对象关联信息；

待更新对象确定模块，用于将对象关联信息发生变更的初始对象确定为待更新对象；

更新特征确定模块，用于基于所述对象特征提取模型对所述待更新对象的更新对象关联信息进行对象特征提取，得到所述待更新对象的更新对象特征；

信息库更新模块，用于基于所述待更新对象的更新对象特征，对所述对象信息库进行更新。

在一些实施例中，所述对象关联信息获取模块包括：

交互信息获取单元，用于获取至少一个初始对象对应的对象属性信息以及对象交互信息；

初始信息确定单元，用于将每个初始对象对应的对象属性信息以及对象交互信息，确定为所述每个初始对象对应的对象关联信息。

在一些实施例中，所述装置还包括：

预训练对象获取模块，用于获取所述待推荐多媒体资源对应的至少两个预训练对象以及每个预训练对象对应的预训练推荐结果标签；

预训练对象特征确定模块，用于基于所述对象特征提取模型对每个预训练对象进行对象特征提取，得到每个预训练对象的预训练对象特征；

预训练相似度结果确定模块，用于根据所述待推荐资源特征与每个预训练对象特征之间的相似度，确定每个预训练对象对应的预训练相似度结果；

微调模块，用于基于所述每个预训练对象对应的预训练相似度结果与所述每个预训练对象对应的预训练推荐结果标签之间的差异，对所述资源特征提取模型以及所述对象特征提取模型进行微调训练，得到更新资源特征提取模型以及更新对象特征提取模型。

在一些实施例中，所述候选对象为至少两个，所述预训练对象获取模块包括：

候选相似度确定单元，用于根据所述待推荐资源特征与每个候选对象特征之间的相似度，得到每个候选对象特征对应的候选相似度；

对象筛选单元，用于基于所述每个候选对象特征对应的候选相似度，从所述至少两个候选对象中筛选所述至少两个预训练对象；

推送单元，用于向所述至少两个预训练对象推送所述待推荐多媒体资源；

预训练标签确定单元，用于根据所述至少两个预训练对象各自对应的推荐结果，确定每个预训练对象对应的预训练推荐结果标签。

在一些实施例中，所述装置还包括：

特征更新模块，用于基于所述更新资源特征提取模型对所述待推荐多媒体资源进行资源特征提取，得到更新待推荐资源特征；

在一些实施例中，所述装置还包括：

目标特征确定模块，用于基于所述更新对象特征提取模型对所述种子对象对应的对象关联信息进行对象特征提取，得到所述种子对象对应的目标种子对象特征；

相应的，上述种子特征更新模块包括：

特征更新单元，用于基于所述更新待推荐资源特征与所述目标种子对象特征之间的相似度，对所述种子对象特征进行更新，得到更新种子对象特征。

所述的装置实施例中的装置与方法实施例基于同样地发明构思。

本说明书实施例提供了一种电子设备，该设备包括处理器和存储器，该存储器中存储有至少一条指令或至少一段程序，该至少一条指令或至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的多媒体资源推荐方法。

本申请的实施例还提供了一种计算机存储介质，所述存储介质可设置于终端之中以保存用于实现方法实施例中一种多媒体资源推荐方法相关的至少一条指令或至少一段程序，该至少一条指令或至少一段程序由该处理器加载并执行以实现上述方法实施例提供的多媒体资源推荐方法。

本申请的实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行以实现上述方法实施例提供的多媒体资源推荐方法。

可选地，在本说明书实施例中，存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本说明书实施例所述存储器可用于存储软件程序以及模块，处理器通过运行存储在存储器的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、功能所需的应用程序等；存储数据区可存储根据所述设备的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器还可以包括存储器控制器，以提供处理器对存储器的访问。

本说明书实施例所提供的多媒体资源推荐方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例，图11是本说明书实施例提供的一种多媒体资源推荐方法的服务器的硬件结构框图。如图11所示，该服务器1100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器（CentralProcessing Units，CPU）1110（中央处理器1110可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置）、用于存储数据的存储器1130，一个或一个以上存储应用程序1123或数据1122的存储介质1120（例如一个或一个以上海量存储设备）。其中，存储器1130和存储介质1120可以是短暂存储或持久存储。存储在存储介质1120的程序可以包括一个或一个以上模块，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1110可以设置为与存储介质1120通信，在服务器1100上执行存储介质1120中的一系列指令操作。服务器1100还可以包括一个或一个以上电源1160，一个或一个以上有线或无线网络接口1150，一个或一个以上输入输出接口1140，和/或，一个或一个以上操作系统1121，例如Windows ServerTM，Mac OS XTM，UnixTM， LinuxTM，FreeBSDTM等等。

输入输出接口1140可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器1100的通信供应商提供的无线网络。在一个实例中，输入输出接口1140包括一个网络适配器（Network Interface Controller，NIC），其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，输入输出接口1140可以为射频（RadioFrequency，RF）模块，其用于通过无线方式与互联网进行通讯。

本领域普通技术人员可以理解，图11所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，服务器1100还可包括比图11中所示更多或者更少的组件，或者具有与图11所示不同的配置。

由上述本申请提供的多媒体资源推荐方法、装置、设备或存储介质的实施例可见，本申请获取待推荐多媒体资源；对待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；获取至少一个候选对象特征；每个候选对象特征为对每个候选对象的对象关联信息进行对象特征提取得到；获取待推荐多媒体资源对应的种子对象，并确定种子对象对应的种子对象特征；种子对象为关注度参数大于预设参数阈值的对象；关注度参数表征种子对象对待推荐多媒体资源的感兴趣程度；基于待推荐资源特征与种子对象特征之间的相似度，对种子对象特征进行更新，得到更新种子对象特征；本申请在提取待推荐多媒体资源对应种子对象的种子对象特征之后，可以根据待推荐资源特征与种子对象特征之间的相似度，对种子对象特征进行更新，得到更新种子对象特征；若待推荐资源特征与种子对象特征的相似度较低，则对种子对象特征进行更新，直至待推荐资源特征与种子对象特征的相似度满足预设条件，从而使待推荐资源特征与种子对象特征具有较高的相似度；再基于更新种子对象特征与每个候选对象特征之间的相似度，从至少一个候选对象特征中筛选出推荐对象特征；从而可以提高推荐对象特征的筛选准确率，确保推荐对象特征与待推荐资源特征之间具有较高的相似度；可以从候选对象中筛选出与待推荐多媒体资源相似度较高的推荐对象，之后向推荐对象特征对应的推荐对象推送待推荐多媒体资源，可以提高多媒体资源的推荐准确率。

需要说明的是：上述本说明书实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备、存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种多媒体资源推荐方法，其特征在于，所述方法包括：

获取待推荐多媒体资源；

基于资源特征提取模型对所述待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；

根据对象特征提取模型对每个候选对象的对象关联信息进行对象特征提取，得到至少一个候选对象特征；

向所述推荐对象特征对应的推荐对象推送所述待推荐多媒体资源；

其中，所述资源特征提取模型以及所述对象特征提取模型的训练方法包括：

确定正样本资源特征与正样本对象对应的正样本对象特征之间的相似度，得到第一样本相似度结果；所述正样本资源特征为所述正样本多媒体资源对应的资源特征；所述正样本多媒体资源标注了第一数值标签；

确定负样本资源特征与负样本对象对应的负样本对象特征之间的相似度，得到第二样本相似度结果；所述负样本资源特征为所述负样本多媒体资源对应的资源特征，所述负样本多媒体资源标注了第二数值标签；

基于所述第一样本相似度结果与所述第一数值标签之间的第一差异，以及所述第二样本相似度结果与所述第二数值标签之间的第二差异，确定目标损失信息；基于所述目标损失信息对第一预设模型以及第二预设模型进行训练直至满足训练结束条件；

将训练结束时的第一预设模型确定为所述资源特征提取模型，将训练结束时的第二预设模型确定为所述对象特征提取模型。

2.根据权利要求1所述的方法，其特征在于，所述资源特征提取模型为根据样本相似度结果与样本推荐结果标签之间的差异，对第一预设模型进行训练得到；所述样本相似度结果为样本资源特征与样本对象特征之间的相似度，所述样本资源特征为基于所述第一预设模型对样本多媒体资源进行资源特征提取得到，所述样本对象特征为基于第二预设模型对样本对象关联信息进行对象特征提取得到；所述样本推荐结果标签表征向样本对象推送所述样本多媒体资源的推荐结果；所述样本资源特征包括所述正样本资源特征以及所述负样本资源特征，所述样本对象特征包括所述正样本对象特征以及所述负样本对象特征；所述样本推荐结果标签包括所述第一数值标签以及所述第二数值标签，第一数值大于第二数值；所述对象特征提取模型为根据所述样本相似度结果与所述样本推荐结果标签之间的差异，对所述第二预设模型进行训练得到。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

获取所述样本对象对应的所述样本多媒体资源以及所述样本对象关联信息，所述样本多媒体资源标注了所述样本推荐结果标签；

基于所述第一预设模型对所述样本多媒体资源进行资源特征提取，得到所述样本资源特征；

基于所述第二预设模型对所述样本对象关联信息进行对象特征提取，得到所述样本对象特征。

4.根据权利要求1所述的方法，其特征在于，所述基于所述第一样本相似度结果与所述第一数值标签之间的第一差异，以及所述第二样本相似度结果与所述第二数值标签之间的第二差异，确定目标损失信息；基于所述目标损失信息对第一预设模型以及第二预设模型进行训练直至满足训练结束条件，包括：

5.根据权利要求3所述的方法，其特征在于，所述第一预设模型包括待训练图像特征提取网络、待训练文本特征提取网络以及待训练特征融合网络，所述基于所述第一预设模型对所述样本多媒体资源进行资源特征提取，得到所述样本资源特征，包括：

基于所述待训练图像特征提取网络，对所述样本多媒体资源进行图像特征提取，得到样本图像特征；

基于所述待训练文本特征提取网络，对所述样本多媒体资源进行文本特征提取，得到样本文本特征；

基于所述待训练特征融合网络，对所述样本图像特征以及所述样本文本特征进行融合处理，得到所述样本资源特征。

6.根据权利要求2所述的方法，其特征在于，所述方法还包括：

获取至少一个初始对象对应的对象关联信息；

基于所述每个初始对象对应的初始对象特征，构建对象信息库；

基于所述对象信息库，获取所述至少一个候选对象特征。

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

将对象关联信息发生变更的初始对象确定为待更新对象；

8.根据权利要求6所述的方法，其特征在于，所述获取至少一个初始对象对应的对象关联信息，包括：

9.根据权利要求6所述的方法，其特征在于，所述基于资源特征提取模型对所述待推荐多媒体资源进行资源特征提取，得到所述待推荐资源特征之后，所述方法还包括：

获取所述待推荐多媒体资源对应的至少两个预训练对象以及每个预训练对象对应的预训练推荐结果标签；

基于所述对象特征提取模型对每个预训练对象进行对象特征提取，得到每个预训练对象的预训练对象特征；

根据所述待推荐资源特征与每个预训练对象特征之间的相似度，确定每个预训练对象对应的预训练相似度结果；

基于所述每个预训练对象对应的预训练相似度结果与所述每个预训练对象对应的预训练推荐结果标签之间的差异，对所述资源特征提取模型以及所述对象特征提取模型进行微调训练，得到更新资源特征提取模型以及更新对象特征提取模型。

10.根据权利要求9所述的方法，其特征在于，所述候选对象为至少两个，所述获取所述待推荐多媒体资源对应的至少两个预训练对象以及每个预训练对象对应的预训练推荐结果标签，包括：

根据所述待推荐资源特征与每个候选对象特征之间的相似度，得到每个候选对象特征对应的候选相似度；

基于所述每个候选对象特征对应的候选相似度，从所述至少两个候选对象中筛选所述至少两个预训练对象；

向所述至少两个预训练对象推送所述待推荐多媒体资源；

根据所述至少两个预训练对象各自对应的推荐结果，确定每个预训练对象对应的预训练推荐结果标签。

11.根据权利要求9所述的方法，其特征在于，所述方法还包括：

基于所述更新待推荐资源特征与所述目标种子对象特征之间的相似度，对所述种子对象特征进行更新，得到所述更新种子对象特征。

12.一种多媒体资源推荐装置，其特征在于，所述装置包括：

多媒体资源获取模块，用于获取待推荐多媒体资源；

推荐特征确定模块，用于基于资源特征提取模型对所述待推荐多媒体资源进行资源特征提取，得到待推荐资源特征；

对象特征获取模块，用于根据对象特征提取模型对每个候选对象的对象关联信息进行对象特征提取，得到至少一个候选对象特征；每个候选对象特征为对每个候选对象的对象关联信息进行对象特征提取得到；

推荐模块，用于向所述推荐对象特征对应的推荐对象推送所述待推荐多媒体资源；

训练模块，用于训练得到所述资源特征提取模型以及所述对象特征提取模型；所述训练模块包括：

第一相似度确定单元，用于确定正样本资源特征与正样本对象对应的正样本对象特征之间的相似度，得到第一样本相似度结果；所述正样本资源特征为所述正样本多媒体资源对应的资源特征；所述正样本多媒体资源标注了第一数值标签；

第二相似度确定单元，用于确定负样本资源特征与负样本对象对应的负样本对象特征之间的相似度，得到第二样本相似度结果；所述负样本资源特征为所述负样本多媒体资源对应的资源特征，所述负样本多媒体资源标注了第二数值标签；

训练单元，用于基于所述第一样本相似度结果与所述第一数值标签之间的第一差异，以及所述第二样本相似度结果与所述第二数值标签之间的第二差异，确定目标损失信息；基于所述目标损失信息对第一预设模型以及第二预设模型进行训练直至满足训练结束条件；

模型确定单元，用于将训练结束时的第一预设模型确定为所述资源特征提取模型，将训练结束时的第二预设模型确定为所述对象特征提取模型。

13.根据权利要求12所述的装置，其特征在于，所述所述资源特征提取模型为根据样本相似度结果与样本推荐结果标签之间的差异，对第一预设模型进行训练得到；所述样本相似度结果为样本资源特征与样本对象特征之间的相似度，所述样本资源特征为基于所述第一预设模型对样本多媒体资源进行资源特征提取得到，所述样本对象特征为基于第二预设模型对样本对象关联信息进行对象特征提取得到；所述样本推荐结果标签表征向样本对象推送所述样本多媒体资源的推荐结果；所述样本资源特征包括所述正样本资源特征以及所述负样本资源特征，所述样本对象特征包括所述正样本对象特征以及所述负样本对象特征；所述样本推荐结果标签包括所述第一数值标签以及所述第二数值标签，第一数值大于第二数值；所述对象特征提取模型为根据所述样本相似度结果与所述样本推荐结果标签之间的差异，对所述第二预设模型进行训练得到。

14.根据权利要求13所述的装置，其特征在于，所述装置还包括：

样本对象特征提取模块，用于基于所述第二预设模型对所述样本对象关联信息进行对象特征提取，得到所述样本对象特征。

15.根据权利要求12所述的装置，其特征在于，所述训练单元包括：

16.根据权利要求14所述的装置，其特征在于，所述第一预设模型包括待训练图像特征提取网络、待训练文本特征提取网络以及待训练特征融合网络，所述样本资源特征提取模块包括：

17.根据权利要求13所述的装置，其特征在于，所述装置还包括：

18.根据权利要求17所述的装置，其特征在于，所述装置还包括：

19.根据权利要求17所述的装置，其特征在于，所述对象关联信息获取模块包括：

20.根据权利要求17所述的装置，其特征在于，所述装置还包括：

21.根据权利要求20所述的装置，其特征在于，所述候选对象为至少两个，所述预训练对象获取模块包括：

22.根据权利要求20所述的装置，其特征在于，所述装置还包括：

相应的，所述种子特征更新模块包括：

特征更新单元，用于基于所述更新待推荐资源特征与所述目标种子对象特征之间的相似度，对所述种子对象特征进行更新，得到所述更新种子对象特征。

23.一种电子设备，其特征在于，所述设备包括：处理器和存储器，所述存储器中存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如权利要求1-11任一所述的多媒体资源推荐方法。

24.一种计算机存储介质，其特征在于，所述计算机存储介质存储有至少一条指令或至少一段程序，所述至少一条指令或至少一段程序由处理器加载并执行以实现如权利要求1-11任一所述的多媒体资源推荐方法。