CN113934871B

CN113934871B - 多媒体推荐模型的训练方法、装置、电子设备及存储介质

Info

Publication number: CN113934871B
Application number: CN202111272217.4A
Authority: CN
Inventors: 周红刚; 徐宽; 梁东旭; 洪立印
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-10-29
Filing date: 2021-10-29
Publication date: 2022-09-09
Anticipated expiration: 2041-10-29
Also published as: CN113934871A

Abstract

本公开关于一种多媒体推荐模型的训练方法、装置、电子设备及存储介质，属于网络技术领域，该方法包括：基于针对多个对象的第二多媒体推荐模型，确定针对目标对象组的第一多媒体推荐模型，在利用目标对象组的实时样本数据训练该第一多媒体推荐模型时，当该第一多媒体推荐模型对目标对象组的学习不充分时，将该第二多媒体推荐模型处理同一对象的样本数据得到的样本特征，迁移至该第一多媒体推荐模型的训练过程中，以对第一多媒体推荐模型进行训练。通过上述技术方案，在训练多媒体推荐模型时，能够有效地避免迁移学习所造成的模型参数的效果衰减，从而提升多媒体推荐模型的推荐准确度。

Description

多媒体推荐模型的训练方法、装置、电子设备及存储介质

技术领域

本公开涉及网络技术领域，尤其涉及一种多媒体推荐模型的训练方法、装置、电子设备及存储介质。

背景技术

迁移学习是指，在执行需要学习大量数据的目标任务时，利用一个和目标任务不同但相关的任务，将该任务上学习到的知识或模式，迁移到目标任务中。

相关技术中，在不同的多媒体推荐任务存在相关性的情况下，常通过大量的多媒体资源数据进行预训练，得到一个预训练推荐模型，再将预训练推荐模型的模型参数迁移到目标推荐模型。迁移过程一般需要对预训练推荐模型的模型参数进行调整，将调整后的模型参数配置给目标推荐模型，再对目标推荐模型进行训练，以得到多媒体推荐模型，从而更好地执行目标推荐任务。

上述技术中，对预训练推荐模型的模型参数进行调整时，需要改变该模型参数的结构和参数值。该模型参数的改变会造成该模型参数的效果的衰减，进而影响目标推荐模型的模型参数的效果，最终导致目标推荐模型的推荐准确度降低。

发明内容

本公开提供一种多媒体推荐模型的训练方法、装置、电子设备及存储介质，能够提升多媒体推荐模型的推荐准确度。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种多媒体推荐模型的训练方法，该方法包括：

获取第一多媒体推荐模型，该第一多媒体推荐模型的初始模型基于第二多媒体推荐模型确定，该第二多媒体推荐模型基于多个对象的历史样本数据训练得到，该历史样本数据表示该对象针对多媒体资源的历史操作行为；

基于该第一多媒体推荐模型，对目标对象组的实时样本数据进行嵌入处理，得到该目标对象组的第一嵌入特征集合，该目标对象组包括属于目标类型的至少一个样本对象，该实时样本数据表示该样本对象针对多媒体资源的实时操作行为，该第一嵌入特征集合包括对象特征和多媒体资源特征；

基于第二嵌入特征集合，对该目标对象组的第一嵌入特征集合进行更新，该第二嵌入特征集合包括基于该多个对象的历史样本数据和该第二多媒体推荐模型得到的多个第二嵌入特征；

基于更新后的该目标对象组的第一嵌入特征集合，对该第一多媒体推荐模型进行训练。

在一种可能实施方式中，该多媒体推荐模型的训练方法还包括：

每间隔目标时长，执行该基于第二嵌入特征集合，对该目标对象组的第一嵌入特征集合进行更新的步骤。

在一种可能实施方式中，该基于第二嵌入特征集合，对该目标对象组的第一嵌入特征集合进行更新包括：

基于该第一嵌入特征集合中第一嵌入特征的特征标识，确定该第二嵌入特征集合中是否存在目标嵌入特征集合，该目标嵌入特征集合中的第二嵌入特征的特征标识与该第一嵌入特征的特征标识相同；

在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，基于该目标嵌入特征集合和该第一嵌入特征，对该目标对象组的第一嵌入特征集合进行更新。

在一种可能实施方式中，该在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，基于该目标嵌入特征集合和该第一嵌入特征，对该目标对象组的第一嵌入特征集合进行更新包括：

在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，根据该第一嵌入特征的学习分数，基于该目标嵌入特征集合中的第二嵌入特征，对该第一嵌入特征集合进行更新，该学习分数表示该第一嵌入特征对该目标对象组的实时样本数据的学习充分程度。

在一种可能实施方式中，该方法还包括：将该第二嵌入特征集合中除了该目标嵌入特征集合以外的第二嵌入特征，添加至该第一嵌入特征集合。

在一种可能实施方式中，该在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，根据该第一嵌入特征的学习分数，基于该目标嵌入特征集合中的第二嵌入特征，对该第一嵌入特征集合进行更新包括：

在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，确定该第一嵌入特征对应的第一学习分数；

在该第一学习分数小于第一分数阈值的情况下，用该目标嵌入特征集合中的第二嵌入特征替换该第一嵌入特征集合中的该第一嵌入特征。

在一种可能实施方式中，该第一嵌入特征包括特征值和特征更新信息，该特征更新信息用于表示该第一嵌入特征的已更新次数；

该确定该第一嵌入特征对应的第一学习分数包括：

基于该特征值和特征更新信息，确定该第一嵌入特征的学习分数。

在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，对该第一嵌入特征和该目标嵌入特征集合中对应的第二嵌入特征进行特征融合，得到第三嵌入特征；

基于该第三嵌入特征，对该目标对象组的第一嵌入特征集合进行更新。

在一种可能实施方式中，该基于该第三嵌入特征，对该目标对象组的第一嵌入特征集合进行更新包括：

确定该第三嵌入特征对应的第二学习分数；

在该第二学习分数大于第二分数阈值的情况下，用该第三嵌入特征替换该目标对象组的第一嵌入特征集合中的该第一嵌入特征。

在该第二嵌入特征集合中不存在该标嵌入特征集合的情况下，将该第二嵌入特征集合添加至该目标对象组的第一嵌入特征集合。

获取该第二多媒体推荐模型；

基于该第二多媒体推荐模型，确定该第一多媒体推荐模型的初始模型。

根据本公开实施例的第二方面，提供一种多媒体推荐方法，该方法包括：

响应于接收到针对属于目标类型的目标对象的推荐指令，获取该目标对象的对象数据；

基于该目标类型对应的第一多媒体推荐模型，对该目标对象的对象数据进行处理，得到该目标对象的多媒体推荐信息，其中，该第一多媒体推荐模型基于上述第一方面提供的多媒体资源推荐模型的训练方法得到；

基于该目标对象的多媒体推荐信息，对该目标对象进行多媒体资源推荐。

根据本公开实施例的第三方面，提供一种多媒体推荐模型的训练装置，该装置包括：

第一模型获取单元，被配置为执行获取第一多媒体推荐模型，该第一多媒体推荐模型的初始模型基于第二多媒体推荐模型确定，该第二多媒体推荐模型基于多个对象的历史样本数据训练得到，该历史样本数据表示该对象针对多媒体资源的历史操作行为；

嵌入单元，被配置为执行基于该第一多媒体推荐模型，对目标对象组的实时样本数据进行嵌入处理，得到该目标对象组的第一嵌入特征集合，该目标对象组包括属于目标类型的至少一个样本对象，该实时样本数据表示该样本对象针对多媒体资源的实时操作行为，该第一嵌入特征集合包括对象特征和多媒体资源特征；

更新单元，被配置为执行基于第二嵌入特征集合，对该目标对象组的第一嵌入特征集合进行更新，该第二嵌入特征集合包括基于该多个对象的历史样本数据和该第二多媒体推荐模型得到的多个第二嵌入特征；

训练单元，被配置为执行基于更新后的该目标对象组的第一嵌入特征集合，对该第一多媒体推荐模型进行训练。

在一种可能实施方式中，该多媒体推荐模型的训练装置被配置为执行：

在一种可能实施方式中，该更新单元包括：

集合确定子单元，被配置为执行基于该第一嵌入特征集合中第一嵌入特征的特征标识，确定该第二嵌入特征集合中是否存在目标嵌入特征集合，该目标嵌入特征集合中的第二嵌入特征的特征标识与该第一嵌入特征的特征标识相同；

第一更新子单元，被配置为执行在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，基于该目标嵌入特征集合和该第一嵌入特征，对该目标对象组的第一嵌入特征集合进行更新。

在一种可能实施方式中，该第一更新子单元包括：

第一更新模块，被配置为执行在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，根据该第一嵌入特征的学习分数，基于该目标嵌入特征集合中的第二嵌入特征，对该第一嵌入特征集合进行更新，该学习分数表示该第一嵌入特征对该目标对象组的实时样本数据的学习充分程度。

在一种可能实施方式中，该装置还包括：

添加模块，被配置为执行将该第二嵌入特征集合中除了该目标嵌入特征集合以外的第二嵌入特征，添加至该第一嵌入特征集合。

在一种可能实施方式中，该第一更新子单元包括：

分数确定模块，被配置为执行在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，确定该第一嵌入特征对应的第一学习分数；

替换模块，被配置为执行在该第一学习分数小于第一分数阈值的情况下，用该目标嵌入特征集合中的第二嵌入特征替换该第一嵌入特征集合中的该第一嵌入特征。

该分数确定模块被配置为执行：

在一种可能实施方式中，该第一更新子单元包括：

第三嵌入模块，被配置为执行在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，对该第一嵌入特征和该目标嵌入特征集合中对应的第二嵌入特征进行特征融合，得到第三嵌入特征；

第二更新模块，被配置为执行基于该第三嵌入特征，对该目标对象组的第一嵌入特征集合进行更新。

在一种可能实施方式中，该第二更新模块被配置为执行：

确定该第三嵌入特征对应的第二学习分数；

在一种可能实施方式中，该更新单元还包括：

第二更新子单元，被配置为执行在该第二嵌入特征集合中不存在该标嵌入特征集合的情况下，将该第二嵌入特征集合添加至该目标对象组的第一嵌入特征集合。

在一种可能实施方式中，该多媒体推荐模型的训练装置还包括：

第二模型获取单元，被配置为执行获取该第二多媒体推荐模型的模型；

模型确定单元，被配置为执行基于该第二多媒体推荐模型的模型，确定该第一多媒体推荐模型的初始模型。

根据本公开实施例的第四方面，提供一种多媒体推荐装置，该装置包括：

目标获取单元，被配置为执行响应于接收到针对属于目标类型的目标对象的推荐指令，获取该目标对象的对象数据；

处理单元，被配置为执行基于该目标类型对应的第一多媒体推荐模型，对该目标对象的对象数据进行处理，得到该目标对象的多媒体推荐信息，其中，该第一多媒体推荐模型基于上述第一方面提供的多媒体资源推荐模型的训练方法得到；

推荐单元，被配置为执行基于该目标对象的多媒体推荐信息，对该目标对象进行多媒体资源推荐。

根据本公开实施例的第五方面，提供一种电子设备，该电子设备包括：

一个或多个处理器；

用于存储该处理器可执行程序代码的存储器；

其中，该处理器被配置为执行该程序代码，以实现上述第一方面提供的多媒体推荐模型的训练方法以及第二方面提供的多媒体推荐方法。

根据本公开实施例的第六方面，提供一种计算机可读存储介质，该计算机可读存储介质包括：当该计算机可读存储介质中的程序代码由电子设备的处理器执行时，使得电子设备能够执行上述第一方面提供的多媒体推荐模型的训练方法以及第二方面提供的多媒体推荐方法。

根据本公开实施例的第七方面，提供一种计算机程序产品，包括一条或多条指令，该一条或多条指令由计算机设备的一个或多个处理器执行，使得该计算机设备能够执行上述第一方面提供的多媒体推荐模型的训练方法以及第二方面提供的多媒体推荐方法。

本公开实施例提供的技术方案，在对多媒体推荐模型进行训练时，基于针对多个对象的第二多媒体推荐模型，确定针对目标对象组的第一多媒体推荐模型，在利用目标对象组的实时样本数据训练该第一多媒体推荐模型时，当该第一多媒体推荐模型对目标对象组的学习不充分时，将该第二多媒体推荐模型处理同一对象的样本数据得到的样本特征，迁移至该第一多媒体推荐模型的训练过程中，以对第一多媒体推荐模型进行训练。通过上述技术方案，在训练多媒体推荐模型时，能够有效地避免迁移学习所造成的模型参数的效果衰减，从而提升多媒体推荐模型的推荐准确度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种多媒体推荐模型的训练方法的实施环境示意图；

图2是根据一示例性实施例示出的一种多媒体推荐模型的训练方法的流程图；

图3A是根据一示例性实施例示出的一种多媒体推荐模型的训练方法的流程图；

图3B是根据一示例性实施例示出的一种多媒体推荐模型的架构图；

图4是根据一示例性实施例示出的一种多媒体推荐模型的训练方法的流程图；

图5是根据一示例性实施例示出的一种嵌入特征集合更新方法的流程图；

图6是根据一示例性实施例示出的一种多媒体推荐模型的训练装置的框图；

图7是根据一示例性实施例示出的一种多媒体推荐装置的框图；

图8是根据一示例性实施例示出的一种服务器的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。本公开中术语“至少一个”是指一个或多个，“多个”的含义是指两个或两个以上，例如，多个用户是指两个或两个以上的用户。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开所涉及的数据是经用户授权或者经过各方充分授权的数据。

图1是本公开实施例提供的一种多媒体推荐模型的训练方法的实施环境示意图，参见图1，该实施环境中包括：终端110与服务器120。

可选地，终端110为智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端110可以泛指多个终端中的一个，本实施例仅以终端110来举例说明。本领域技术人员可以知晓，上述终端的数量可以更多或更少。终端110可以运行有各种不同类型的应用程序，如视频应用程序、音乐应用程序等。终端110能够通过无线网络或有线网络与服务器120相连，并能够通过无线网络或有线网络，将数据上传到服务器120，该数据可以是终端110收集到的样本数据。

可选地，服务器120是独立的物理服务器，或者是多个物理服务器构成的服务器集群或者分布式文件系统，或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

服务器120用于执行本公开实施例提供的一种多媒体推荐模型的训练方法。服务器120与终端110可以通过有线或无线通信方式进行直接或间接的连接，本公开实施例对此不作限定。可选地，上述服务器120的数量可以更多或更少，本公开实施例对此不加以限定。当然，服务器120还可以包括其他功能服务器，以便提供更全面且多样化的服务。

需要说明的是，本公开实施例所处理的用户数据既能够由终端上传至服务器，也能够由服务器自行获得，本公开实施例对此不做限定。

在介绍完本公开实施例的实施环境之后，下面将结合上述实施环境，对本公开实施例的应用场景进行介绍。需要说明的是，在下述说明过程中，终端也即是上述终端110，服务器也即是上述服务器120。

通过本公开实施例提供的一种多媒体推荐模型的训练方法，在终端上传样本数据至服务器后，服务器基于该目标对象组的实时样本数据，训练多媒体推荐模型，该多媒体推荐模型用于对该目标对象组所属的目标类型的对象进行多媒体资源推荐，当然，随着科学技术的发展，本公开实施例提供的多媒体推荐模型的训练方法也能够应用在其他对模型进行训练的场景下，本公开实施例对此不做限定。

在多媒体资源推荐的场景下，以该多媒体资源是短视频为例，上述实施环境中的终端110将获取到的短视频应用的用户数据上传至服务器120，服务器120接收到该短视频应用的用户数据，基于该短视频应用的用户数据训练多媒体推荐模型，该多媒体推荐模型用于对该短视频应用的用户进行短视频推荐。

在介绍完本公开实施例的实施环境和应用场景之后，下面对本公开实施例提供的多媒体推荐模型的训练方法进行说明。图2是根据一示例性实施例示出的一种多媒体推荐模型的训练方法的流程图，如图2所示，该方法包括以下步骤：

在步骤201中，服务器获取第一多媒体推荐模型，该第一多媒体推荐模型的初始模型基于第二多媒体推荐模型确定，该第二多媒体推荐模型基于多个对象的历史样本数据训练得到，该历史样本数据表示该对象针对多媒体资源的历史操作行为。

其中，该多媒体资源是一种包括至少一个类型的数据的资源。该至少一个类型的数据包括以下组合：文本；图像；文本和图像；图像和音频；文本、图像和音频，本公开实施例对该多媒体资源的具体形式不做限定，例如，在短视频推荐的场景下，该多媒体资源是同时包含文本、图像和音频的短视频。

其中，该对象是指：该多媒体资源面向的对象，例如，在短视频推荐的场景下，多媒体资源是短视频，则该对象是指：短视频面向的用户。

其中，该历史操作行为能够表示该对象对多媒体资源的兴趣取向，例如，在短视频推荐的场景下，该历史操作行为可以是用户对短视频的关注、点赞、转发或拉黑等行为，点赞表示该用户喜欢该短视频，拉黑则表示该用户不喜欢该短视频。基于该历史操作行为，能够学习到对象对多媒体资源的兴趣取向，从而用于多媒体资源推荐。

在本公开实施例中，该第二多媒体推荐模型基于多个对象的历史样本数据训练得到，也即是，该第二多媒体推荐模型学习了多个对象对多媒体资源的兴趣取向，因此，该第二多媒体推荐模型能够以符合对象的兴趣取向为出发点，进行多媒体资源的推荐。

在本公开实施例中，通过将该第二多媒体推荐模型的模型参数确定为该第一多媒体推荐模型的初始模型参数，使得该第一多媒体推荐模型能够继承该第二多媒体推荐模型学习到的该多个对象对多媒体资源的兴趣取向。

需要说明的是，该第一多媒体推荐模型的初始模型结构与该第二多媒体推荐模型的模型结构相同，因此，能够直接地将该第二多媒体推荐模型的模型参数确定为该第一多媒体推荐模型的初始模型参数。

在步骤202中，服务器基于该第一多媒体推荐模型，对目标对象组的实时样本数据进行嵌入处理，得到该目标对象组的第一嵌入特征集合，该目标对象组包括属于目标类型的至少一个样本对象，该实时样本数据表示该样本对象针对多媒体资源的实时操作行为，该第一嵌入特征集合包括对象特征和多媒体资源特征。

其中，该目标类型基于对象的属性差异所确定，例如，在短视频推荐的场景下，对象是短视频面向的用户，根据用户活跃程度这一用户的属性差异，可以将该用户划分为高活跃度类型与低活跃度类型，则目标类型可以是其中的高活跃度类型；根据用户注册时间这一用户的属性差异，可以将用户划分为老用户类型与新用户类型，则目标类型可以是其中的新用户类型。

其中，该实时样本数据是实时获取的该样本对象对多媒体资源的实时操作行为，能够表示该样本对象对多媒体资源的实时兴趣取向，例如，在短视频推荐的场景下，该实时操作行为可以是用户对短视频的关注、点赞、转发或拉黑等行为，点赞表示该用户喜欢该短视频，拉黑则表示该用户不喜欢该短视频。基于该实时操作行为，能够学习到该样本对象对多媒体资源的实时兴趣取向，也即是，该目标对象组的实时兴趣取向。

在本公开实施例中，基于该目标对象组的实时样本数据来训练该第一多媒体推荐模型，也即是，该第一多媒体推荐模型学习了该样本对象对多媒体资源的实时兴趣取向。通过该实时样本数据进行该第一多媒体推荐模型的训练，能够及时地捕捉到目标对象组对多媒体资源的兴趣取向的变化，该第一多媒体推荐模型可以为属于该目标类型的对象推荐符合实时兴趣取向的多媒体资源。

在本公开实施例中，该对象特征表示该样本对象的信息，该多媒体资源特征表示该多媒体资源的信息，例如，在短视频推荐的场景下，用户的年龄、性别和活跃度等信息可以被提取为对象特征，短视频的内容、类型和时长等信息都可以被提取为多媒体资源特征。

其中，该第一多媒体推荐模型包括至少一个嵌入层。服务器基于嵌入层对该实时样本数据进行嵌入处理，得到该目标对象组的第一嵌入特征集合。在本公开实施例中，该嵌入处理是指：通过嵌入层，分别对该实时样本数据中的对象数据和多媒体资源进行特征提取，得到该样本对象对应的对象特征以及多媒体资源特征。

在本公开实施例中，服务器能够从样本数据库中实时获取该目标对象组的实时样本数据。

在步骤203中，服务器基于第二嵌入特征集合，对该目标对象组的第一嵌入特征集合进行更新，该第二嵌入特征集合包括基于该多个对象的历史样本数据和该第二多媒体推荐模型得到的多个第二嵌入特征。

其中，该第二多媒体推荐模型通过对该多个对象的历史样本数据进行嵌入处理，得到该第二嵌入特征集合中的多个该第二嵌入特征，该嵌入处理与步骤202同理，在此不作赘述。

需要说明的是，该第一嵌入特征集合中的多个第一嵌入特征是对象特征或多媒体资源特征。

通过将该第二嵌入特征集合中的第二嵌入特征添加至该第一嵌入特征集合，或者，用该第二嵌入特征替换该第一嵌入特征集合中表达能力不佳的第一嵌入特征，实现对该第一嵌入特征集合的更新，以使得该第一嵌入特征集合中的第一嵌入特征，能够更准确地表达该目标对象组的实时样本数据，也即是，更充分地学习到该目标对象组的实时兴趣取向。

在步骤204中，服务器基于更新后的该目标对象组的第一嵌入特征集合，对该第一多媒体推荐模型进行训练。

其中，该第一多媒体推荐模型会对更新后的第一嵌入集合中，与同一条样本数据相关的对象特征和多媒体资源特征进行拼接，得到拼接特征，基于拼接特征进行预测，以得到第一预测结果。基于第一预测结果和该样本数据所表示对象对相应多媒体资源的实际操作行为，来确定第一多媒体推荐模型的损失值。

在本公开实施例中，在该损失值或迭代次数不满足训练停止条件的情况下，对该第一多媒体推荐模型的模型参数进行调整，该模型参数包括该至少一个嵌入层对应的第一嵌入参数以及该至少一个预测层对应的第一预测参数。基于参数调整后的模型，进行下一次迭代训练；在该损失值或迭代次数满足训练停止条件的情况下，将本次迭代训练所确定的第一多媒体推荐模型输出为训练好的第一多媒体推荐模型，其中，该训练停止条件为损失值满足目标值或者迭代次数达到目标次数或其他条件。

上述图2所示仅为本公开的基本流程，下面基于一种具体实施方式，来对本公开提供的方案进行进一步阐述，图3A是根据一示例性实施例示出的一种多媒体推荐模型的训练方法的流程图，如图3A所示，包括以下步骤：

在步骤301中，服务器获取第二多媒体推荐模型。

其中，该第二多媒体推荐模型基于多个对象对多媒体资源的历史行为数据进行训练得到。在本公开实施例中，基于多个对象的历史样本数据，对预训练得到的神经网络模型进行训练，将训练后的神经网络模型作为该第二多媒体推荐模型，其中，该历史样本数据是多个对象对多媒体资源的历史行为数据，例如，在短视频推荐的场景下，该对象是短视频面向的用户，该历史样本数据包含用户的信息、该短视频的多媒体资源信息以及用户对短视频的行为信息，多媒体推荐模型通过学习该样本数据中用户信息、该短视频的视频信息以及用户对短视频的行为信息之间的内在逻辑关系，对模型参数进行调整，确定该第二多媒体推荐模型。

在步骤302中，服务器基于该第二多媒体推荐模型，确定第一多媒体推荐模型的初始模型。

其中，该第二多媒体推荐模型包括至少一个嵌入层和至少一个预测层。该第二多媒体推荐模型的模型参数包括该至少一个嵌入层对应的第二嵌入参数以及该至少一个预测层对应的第二预测参数。在本公开实施例中，该第一多媒体推荐模型的初始模型结构与该第二多媒体推荐模型的模型结构相同，因此，将该第二嵌入参数，确定为该第一多媒体推荐模型的初始第一嵌入参数，将该第二预测参数，确定为该第一多媒体推荐模型的初始第一预测参数。

需要说明的是，该第一多媒体推荐模型的模型结构会根据所应用的目标对象组的目标类型来进行相应调整。在本公开实施例中，该第一嵌入参数对应该第一多媒体推荐模型的至少一个嵌入层，每个嵌入层中包含多个计算单元，分别用于对该实时样本数据进行嵌入处理，得到对象特征以及多媒体资源特征，也即是，该第一嵌入特征；该第一预测参数对应该第一多媒体推荐模型的至少一个预测层，每个预测层中均包含多个预测单元，用于基于该第一嵌入特征进行预测，得到预测结果。基于该第一多媒体推荐模型的初始模型参数，该第一多媒体推荐模型应用于具有新特征的目标用户组时，需要增加计算单元以及与新增计算单元对应的预测单元，用于对该新特征进行嵌入处理，以得到嵌入特征，基于该嵌入特征得到预测结果。例如，该第一多媒体推荐模型用于对低活跃度用户群体进行推荐时，嵌入层需要增加用于提取用户活跃度特征的计算单元，预测层也需要增加相应的预测单元用于得到预测结果。

图3B是根据一示例性实施例示出的一种多媒体推荐模型的架构图，对应上述实施方式，第一多媒体推荐模型的每个嵌入层都包括n+1个计算单元，n+1个计算单元分别用于计算不同维度的嵌入特征，相应地，每个预测层中包括有n+1个预测单元，该n+1个预测单元用于对n+1个计算单元所输出的特征进行进一步处理。该第一多媒体推荐模型中包括了n个与基本多媒体推荐模型相同的计算单元，其新增的计算单元对应于该第一多媒体推荐模型的目标对象组所特有的特征，也即是，目标类型所对应的特征，例如，目标用户组属于的目标类型是高活跃度类型，则需要对其活跃度进行关注，因此，相对于基本多媒体推荐模型来说，可新增用于对活跃度进行嵌入处理的计算单元，n为大于1或等于1的整数。

通过上述技术方案，可以根据应用目标用户的特性，灵活地调整模型结构，以获得更好的模型性能，进而提高模型对目标用户群体进行推荐的准确性。

在步骤303中，服务器基于该第一多媒体推荐模型的初始模型，基于目标用户组的实时样本数据中的样本数据S₁，进行第一次迭代训练，得到第一次迭代训练后的第一多媒体推荐模型M₁。

在本公开实施例中，第一次迭代训练的过程包括：对获取到的该实时样本数据中的样本数据S₁进行嵌入处理，得到第一样本数据对应的第一嵌入特征，根据该第一嵌入特征进行预测，得到第一预测结果，基于该第一预测结果，对该第一多媒体推荐模型的初始模型参数进行调整，得到M₁，M₁将作为第一多媒体推荐模型进行下一次迭代训练。对实时样本数据进行嵌入处理的过程参见步骤202的内容，在此不作赘述。

需要说明的是，在本次迭代训练时，将所得到的样本数据S₁的第一嵌入特征添加至该目标对象组的第一嵌入特征集合。

在步骤304中，服务器在第i次迭代训练时，获取第i-1次迭代训练所确定的第一多媒体推荐模型M_i-1，i为大于1的整数。

在步骤305中，服务器基于M_i-1，对目标用户组的实时样本数据的样本数据S_i进行嵌入处理，将所得到的样本数据S_i的第一嵌入特征添加至该目标对象组的第一嵌入特征集合。

其中，该目标对象组包括属于目标类型的至少一个样本对象，该实时样本数据表示该样本对象针对多媒体资源的实时操作行为，该第一嵌入特征集合包括对象特征和多媒体资源特征。

需要说明的是，该目标对象组的第一嵌入特征集合中包括基于历次迭代训练以及集合更新所得到的嵌入特征。

在步骤306中，响应于定时器计时到达目标时长，服务器基于目标对象组的第一嵌入特征集合中第一嵌入特征的特征标识，确定该第二嵌入特征集合中是否存在目标嵌入特征集合，该目标嵌入特征集合中的第二嵌入特征的特征标识与该第一嵌入特征的特征标识相同。

其中，该目标时长可以根据不同应用场景中的需求进行设置，本公开实施例对此不作限定。通过设置定时器来执行上述过程，可以有效的实现特征的更新，在保证能够触发更新过程的前提下，还避免了每次迭代都要进行更新所造成的计算资源浪费。

其中，上述任一个嵌入特征都具有特征标识，该特征标识指向嵌入特征对应的对象或多媒体资源。对于不同的嵌入特征集合中的多个嵌入特征，相同的特征标识即表示该嵌入特征对应于相同的对象或相同的多媒体资源，不同的嵌入特征对相同的对象或相同的多媒体资源有不同的特征表达，也即是，该目标嵌入特征集合中的多个第二嵌入特征能够为该第一嵌入特征集合提供对于相同对象或多媒体资源的不同特征表达。

在本公开实施例中，基于该第一嵌入特征集合中第一嵌入特征的特征标识，确定该第二嵌入特征集合中是否存在目标嵌入特征集合的过程包括：对于第一嵌入特征集合中的第一嵌入特征F₁，根据F₁的特征标识，与该第二嵌入特征集合中的M个第二嵌入特征对应的M个特征标识逐个进行对比，直至找到与F₁具有相同特征标识的第二嵌入特征，也即是该目标嵌入特征集合中的第二嵌入特征H₁，同理，对该第一嵌入特征集合中的剩余N-1个第一嵌入特征依次重复上述过程后，能够得到该目标嵌入特征集合，其中，M和N都是正整数。

在步骤307中，在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，服务器基于该第一嵌入特征的特征值和特征更新信息，确定该第一嵌入特征对应的第一学习分数，该学习分数表示该第一嵌入特征对该目标对象组的实时样本数据的学习充分程度。

该第一嵌入特征包括特征值和特征更新信息，该特征更新信息用于表示该第一嵌入特征的已更新次数。其中，该第二嵌入特征集合中存在该目标嵌入特征集合，则该第二嵌入特征集合中存在能用于更新该第一嵌入特征集合的第二嵌入特征。而是否进行更新，需要通过计算该第一嵌入特征的第一学习分数，来判断该第一嵌入特征对该目标对象组的实时样本数据的学习充分程度。

在一些实施例中，基于该第一嵌入特征的特征值和特征更新信息，确定该第一嵌入特征的学习分数，该学习分数的确定过程见公式(1)：

公式(1)中，score为该第一嵌入特征的学习分数，n为该第一嵌入特征的已更新次数，w_i为该第一嵌入特征的特征值；其中，随着n的增大，也即是该第一嵌入特征已更新次数的增多，该学习分数会也会提高。

在步骤308中，在该第一学习分数小于第一分数阈值的情况下，服务器用该目标嵌入特征集合中的第二嵌入特征替换该第一嵌入特征集合中的该第一嵌入特征。

其中，分数阈值的设置可以根据不同应用场景下的精度需求来设置，本公开实施例对此不作限定。例如，分数阈值设定为200。

在本公开实施例中，该第一学习分数小于第一分数阈值，说明该第一嵌入特征对该目标对象组的实时样本数据的学习充分程度不够充分，则认为该第一嵌入特征应该被该目标嵌入特征集合中具有相同标识的第二嵌入特征替换掉。由于该第二嵌入特征是该第二多媒体推荐模型基于多个对象的历史样本数据确定的，该历史样本数据具有一定的参考价值，当该第一嵌入特征不能满足标准时，选择用该第二嵌入特征作为替换，以保证该第一嵌入特征集合能够较为准确地表示该实时样本数据的对象特征以及多媒体资源特征。

其中，该第二嵌入特征的标识与该第一嵌入特征的标识相同，替换过程通过用该第二嵌入特征的特征值覆盖该第一嵌入特征的特征值实现，同时，更新该第一嵌入特征对应的特征更新信息。

由于学习分数能够体现一个嵌入特征的学习能力，因此，基于上述学习分数来确定对哪些第一嵌入特征进行替换，使得第一嵌入特征集合中的嵌入特征能够更加精准的表示相应的实时样本数据的特性，从而提高后续训练所采用的嵌入特征的表达能力，达到提高模型的推荐准确性的目的。

在执行上述步骤308中用该目标嵌入特征集合中的第二嵌入特征替换该第一嵌入特征集合中的该第一嵌入特征的步骤之外，在一些实施例中，通过将该第二嵌入特征集合中除了该目标嵌入特征集合以外的第二嵌入特征，添加至该第一嵌入特征集合，以实现对该第一嵌入特征集合的补充。

在一些实施例中，上述步骤307至步骤308可以被替换为下述步骤1至步骤3：

步骤1、在该第二嵌入特征集合中存在该目标嵌入特征集合的情况下，服务器对该第一嵌入特征和该目标嵌入特征集合中对应的第二嵌入特征进行特征融合，得到第三嵌入特征。

其中，特征融合的目的是将相同特征标识该第一嵌入特征与该第二嵌入特征进行融合，以将两个特征对同一对象或同一多媒体资源的表达结合，得到的该第三嵌入特征同时包含了历史样本数据以及实时样本数据中的信息。

步骤2、服务器确定该第三嵌入特征对应的第二学习分数。

本步骤参考步骤307，在此不作赘述。

步骤3、在该第二学习分数大于第二分数阈值的情况下，服务器用该第三嵌入特征替换该目标对象组的第一嵌入特征集合中的该第一嵌入特征。

本步骤参考步骤308，在此不作赘述。

通过上述技术方案，结合实时样本数据与历史样本数据，在一定程度上保证了嵌入特征的实时性，也通过分数阈值确保该第三嵌入特征对样本数据的学习充分程度达到标准，进一步使得第一嵌入特征集合中的嵌入特征能够更加精准的表示相应的实时样本数据的特性，从而提高后续训练所采用的嵌入特征的表达能力，达到提高模型的推荐准确性的目的。

在步骤309中，在该第二嵌入特征集合中不存在该标嵌入特征集合的情况下，将该第二嵌入特征集合添加至该目标对象组的第一嵌入特征集合。

其中，该第二嵌入特征集合中不存在该目标嵌入特征集合，则该第二嵌入特征集合对于该第一嵌入特征集合而言，都是全新的样本数据对应的对象特征以及多媒体资特征，故将该第二嵌入特征集合添加至该第一嵌入特征集合作为补充，实现对该第一嵌入特征集合的更新。

该步骤309为可选步骤，在一些实施例中，可以不执行该将第二嵌入特征集合添加至第一嵌入特征集合的步骤，以提高第一多媒体推荐模型对目标类型的对象的推荐针对性。

在步骤310中，服务器基于M_i-1，基于更新后的该目标对象组的第一嵌入特征集合，得到第i次迭代训练对应的第一预测结果。

服务器从更新后的目标对象组的第一嵌入特征集合中，获取样本数据Si对应的第一嵌入特征，M_i-1的第一预测参数，对该样本数据S_i对应的第一嵌入特征进行处理，得到第i次迭代训练对应的第一预测结果。其中，该第一多媒体推荐模型会对获取到的样本数据S_i对应的第一嵌入特征的对象特征和多媒体资源特征进行拼接，得到样本数据S_i的拼接特征，基于样本数据S_i的拼接特征进行预测，以得到该第一预测结果。

在该第一学习分数大于或等于第一分数阈值的情况下，则该第一嵌入特征对实时样本数据的学习充分程度达到要求，因此，保留该第一嵌入特征，且不对该第一嵌入特征集合进行更新。M_i-1可以直接基于步骤305所确定的样本数据Si对应的第一嵌入特征进行处理，得到第i次迭代训练对应的第一预测结果。

需要说明的是，在服务器未响应于定时器计时到达目标时长的情况下，M_i-1直接对步骤305所确定的样本数据Si对应的第一嵌入特征进行处理，得到第i次迭代训练对应的第一预测结果。

在步骤311中，服务器基于该第一预测结果，对M_i-1进行训练。

其中，服务器基于该第一预测结果和该样本数据S_i所表示对象对相应多媒体资源的实际操作行为，来确定第一多媒体推荐模型的第一损失值。

基于该第一损失值对M_i-1进行训练步骤参考步骤204，在此不作赘述。

通过本公开实施例提供的技术方案，在对多媒体推荐模型进行训练时，基于针对多个对象的第二多媒体推荐模型，确定针对目标对象组的第一多媒体推荐模型，在利用目标对象组的实时样本数据训练该第一多媒体推荐模型时，当该第一多媒体推荐模型对目标对象组的学习不充分时，将该第二多媒体推荐模型处理同一对象的样本数据得到的样本特征，迁移至该第一多媒体推荐模型的训练过程中，以对第一多媒体推荐模型进行训练。通过上述技术方案，在训练多媒体推荐模型时，能够有效地避免迁移学习所造成的模型参数的效果衰减，从而提升多媒体推荐模型的推荐准确度。

图4是根据一示例性实施例示出的一种多媒体推荐模型的训练方法的流程图，参见图4，对应于上述实施方式，基于第二多媒体推荐模型的模型参数，确定第一多媒体推荐模型的模型参数，得到第一多媒体推荐模型。该第一多媒体推荐模型对目标对象组的实时样本数据进行嵌入处理，确定第一嵌入特征集合，其中，响应于定时器到达目标时长，基于第二多媒体推荐模型的第二嵌入特征集合，对该第一嵌入特征集合进行更新。该第一多媒体推荐模型基于该第一嵌入特征集合得到预测结果，其中，该第一嵌入特征集合可以是已更新的，也可以是未更新的。若该预测结果满足训练结束条件，则将本次训练确定的该第一多媒体推荐模型作为训练好的第一多媒体推荐模型，结束模型训练过程；若该预测结果不满足训练结束条件，则根据该预测结果，对该第一多媒体推荐模型的模型参数进行调整，基于调整后的该第一多媒体推荐模型，重复上述模型训练过程。

图5是一种嵌入特征集合更新方法的流程图，参见图5，嵌入特征集合更新的过程包括：响应于定时器到达目标时长，获取第一嵌入特征集合中的第一嵌入特征，在第二嵌入特征集合中确定目标嵌入特征集合。若该目标嵌入特征集合不存在，将该第二嵌入特征集合添加至第一嵌入特征集合，结束流程；若该目标嵌入特征集合存在，则计算该第一嵌入特征的第一学习分数：若第一学习分数大于第一分数阈值，则不对其进行更新，结束流程；若该第一学习分数小于第一分数阈值，则用该目标嵌入特征集合中的第二嵌入特征替换同特征标识的第一嵌入特征，结束流程。

上述技术方案中，通过约束该第一多媒体推荐模型的初始模型结构与该第二多媒体推荐模型的模型结构相同，减少模型参数迁移造成的参数性能折损，从而提高了参数迁移的效率。

进一步地，在该第一多媒体推荐模型基于目标对象组的实时样本数据进行训练的过程中，在学习到目标对象组的特征信息的同时，利用了包含多个对象的历史样本数据的特征信息的第二嵌入特征集合作为补充，以得到具有更佳表达能力的第一嵌入特征集合，进而提高该第一多媒体推荐模型对属于目标类型的对象进行推荐的准确度。

通过本公开实施例提供的技术方案，对多媒体推荐模型进行训练时，基于针对多个对象的第二多媒体推荐模型，确定针对目标对象组的第一多媒体推荐模型，在利用目标对象组的实时样本数据训练该第一多媒体推荐模型时，当该第一多媒体推荐模型对目标对象组的学习不充分时，将该第二多媒体推荐模型处理同一对象的样本数据得到的样本特征，迁移至该第一多媒体推荐模型的训练过程中，以对第一多媒体推荐模型进行训练。通过上述技术方案，在训练多媒体推荐模型时，能够有效地避免迁移学习所造成的模型参数的效果衰减，从而提升多媒体推荐模型的推荐准确度。

图6是根据一示例性实施例示出的一种多媒体推荐模型的训练装置的框图，参照图6，该装置包括：

第一模型获取单元601，被配置为执行获取第一多媒体推荐模型，该第一多媒体推荐模型的初始模型基于第二多媒体推荐模型确定，该第二多媒体推荐模型基于多个对象的历史样本数据训练得到，该历史样本数据表示该对象针对多媒体资源的历史操作行为；

嵌入单元602，被配置为执行基于该第一多媒体推荐模型，对目标对象组的实时样本数据进行嵌入处理，得到该目标对象组的第一嵌入特征集合，该目标对象组包括属于目标类型的至少一个样本对象，该实时样本数据表示该样本对象针对多媒体资源的实时操作行为，该第一嵌入特征集合包括对象特征和多媒体资源特征；

更新单元603，被配置为执行基于第二嵌入特征集合，对该目标对象组的第一嵌入特征集合进行更新，该第二嵌入特征集合包括基于该多个对象的历史样本数据和该第二多媒体推荐模型得到的多个第二嵌入特征；

训练单元604，被配置为执行基于更新后的该目标对象组的第一嵌入特征集合，对该第一多媒体推荐模型进行训练。

在一种可能实施方式中，该更新单元603包括：

在一种可能实施方式中，该第一更新子单元包括：

在一种可能实施方式中，该装置还包括：

在一种可能实施方式中，该第一更新子单元包括：

该分数确定模块被配置为执行：

在一种可能实施方式中，该第一更新子单元包括：

在一种可能实施方式中，该第二更新模块被配置为执行：

确定该第三嵌入特征对应的第二学习分数；

在一种可能实施方式中，该更新单元603还包括：

需要说明的是：上述实施例提供的多媒体推荐模型的训练装置在训练多媒体推荐模型时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的多媒体推荐模型的训练装置与多媒体推荐模型的训练方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不作赘述。

图7是根据一示例性实施例示出的一种多媒体推荐装置的框图，参照图7，该装置包括：

目标获取单元701，被配置为执行响应于接收到针对属于目标类型的目标对象的推荐指令，获取该目标对象的对象数据；

处理单元702，被配置为执行基于该目标类型对应的第一多媒体推荐模型，对该目标对象的对象数据进行处理，得到该目标对象的多媒体推荐信息，其中，该第一多媒体推荐模型基于上述实施例提供的多媒体资源推荐模型的训练方法得到；

推荐单元703，被配置为执行基于该目标对象的多媒体推荐信息，对该目标对象进行多媒体资源推荐。

需要说明的是：上述实施例提供的多媒体推荐装置在进行多媒体推荐时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的多媒体推荐装置与多媒体推荐方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不作赘述。

本公开实施例提供的技术方案中，基于针对多个对象的第二多媒体推荐模型，确定针对目标对象组的第一多媒体推荐模型，在利用目标对象组的实时样本数据训练该第一多媒体推荐模型时，当该第一多媒体推荐模型对目标对象组的学习不充分时，将该第二多媒体推荐模型处理同一对象的样本数据得到的样本特征，迁移至该第一多媒体推荐模型的训练过程中，以对第一多媒体推荐模型进行训练。通过上述技术方案，在训练多媒体推荐模型时，能够有效地避免迁移学习所造成的模型参数的效果衰减，从而提升多媒体推荐模型的推荐准确度。

本公开实施例提供了一种服务器，用于执行上述方法，这里的服务器也即是上述服务器120，下面对服务器的结构进行介绍：

图8是根据一示例性实施例示出的一种服务器的框图，该服务器800可因配置或性能不同而产生比较大的差异，可以包括一个或多个处理器(Central Processing Units，CPU)801和一个或多个的存储器802，其中，该一个或多个存储器802中存储有至少一条程序代码，该至少一条程序代码由该一个或多个处理器801加载并执行以实现上述各个方法实施例提供的多媒体推荐模型的训练方法中服务器执行的过程。当然，该服务器800还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器800还可以包括其他用于实现设备功能的部件，在此不作赘述。

在示例性实施例中，还提供了一种包括程序代码的计算机可读存储介质，例如包括程序代码的存储器802，上述程序代码可由服务器800的处理器801执行以完成上述实施例提供的多媒体推荐模型的训练方法以及多媒体推荐方法。可选地，计算机可读存储介质可以是只读内存(read-only memory，ROM)、随机存取存储器(random access memory)，RAM)、只读光盘(compact-disc read-only memory，CD-ROM)、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括程序代码，该程序代码存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该程序代码，处理器执行该程序代码，使得该计算机设备执行上述实施例提供的多媒体推荐模型的训练方法以及多媒体推荐方法。。

在一些实施例中，本公开实施例所涉及的计算机程序可被部署在一个计算机设备上执行，或者在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种多媒体推荐模型的训练方法，其特征在于，所述方法包括：

获取第一多媒体推荐模型，所述第一多媒体推荐模型的初始模型基于第二多媒体推荐模型确定，所述第二多媒体推荐模型基于多个对象的历史样本数据训练得到，所述历史样本数据表示所述对象针对多媒体资源的历史操作行为；

基于所述第一多媒体推荐模型，对目标对象组的实时样本数据进行嵌入处理，得到所述目标对象组的第一嵌入特征集合，所述目标对象组包括属于目标类型的至少一个样本对象，所述实时样本数据表示所述样本对象针对多媒体资源的实时操作行为，所述第一嵌入特征集合包括对象特征和多媒体资源特征；

基于所述第一嵌入特征集合中第一嵌入特征的特征标识，确定第二嵌入特征集合中是否存在目标嵌入特征集合，所述目标嵌入特征集合中的第二嵌入特征的特征标识与所述第一嵌入特征的特征标识相同，所述第二嵌入特征集合包括基于所述多个对象的历史样本数据和所述第二多媒体推荐模型得到的多个第二嵌入特征；

在所述第二嵌入特征集合中存在所述目标嵌入特征集合的情况下，根据所述第一嵌入特征的学习分数，基于所述目标嵌入特征集合中的第二嵌入特征，对所述第一嵌入特征集合进行更新，所述学习分数表示所述第一嵌入特征对所述目标对象组的所述实时样本数据的学习充分程度；

基于更新后的所述目标对象组的第一嵌入特征集合，对所述第一多媒体推荐模型进行训练。

2.根据权利要求1所述的多媒体推荐模型的训练方法，其特征在于，所述方法还包括：

每间隔目标时长，执行基于所述第二嵌入特征集合，对所述目标对象组的第一嵌入特征集合进行更新的步骤。

3.根据权利要求1所述的多媒体推荐模型的训练方法，其特征在于，所述方法还包括：

将所述第二嵌入特征集合中除了所述目标嵌入特征集合以外的所述第二嵌入特征，添加至所述第一嵌入特征集合。

4.根据权利要求1所述的多媒体推荐模型的训练方法，其特征在于，所述在所述第二嵌入特征集合中存在所述目标嵌入特征集合的情况下，所述根据所述第一嵌入特征的学习分数，基于所述目标嵌入特征集合中的第二嵌入特征，对所述第一嵌入特征集合进行更新包括：

在所述第二嵌入特征集合中存在所述目标嵌入特征集合的情况下，确定所述第一嵌入特征对应的第一学习分数；

在所述第一学习分数小于第一分数阈值的情况下，用所述目标嵌入特征集合中的第二嵌入特征替换所述第一嵌入特征集合中的所述第一嵌入特征。

5.根据权利要求4所述的多媒体推荐模型的训练方法，其特征在于，所述第一嵌入特征包括特征值和特征更新信息，所述特征更新信息用于表示所述第一嵌入特征的已更新次数；

所述确定所述第一嵌入特征对应的第一学习分数包括：

基于所述特征值和特征更新信息，确定所述第一嵌入特征的学习分数。

6.根据权利要求1所述的多媒体推荐模型的训练方法，其特征在于，所述方法还包括：

在所述第二嵌入特征集合中存在所述目标嵌入特征集合的情况下，对所述第一嵌入特征和所述目标嵌入特征集合中对应的所述第二嵌入特征进行特征融合，得到第三嵌入特征；

基于所述第三嵌入特征，对所述目标对象组的第一嵌入特征集合进行更新。

7.根据权利要求6所述的多媒体推荐模型的训练方法，其特征在于，所述基于所述第三嵌入特征，对所述目标对象组的第一嵌入特征集合进行更新包括：

确定所述第三嵌入特征对应的第二学习分数；

在所述第二学习分数大于第二分数阈值的情况下，用所述第三嵌入特征替换所述目标对象组的第一嵌入特征集合中的所述第一嵌入特征。

8.根据权利要求1所述的多媒体推荐模型的训练方法，其特征在于，所述方法还包括：

在所述第二嵌入特征集合中不存在所述目标嵌入特征集合的情况下，将所述第二嵌入特征集合添加至所述目标对象组的第一嵌入特征集合。

9.根据权利要求1所述的多媒体推荐模型的训练方法，其特征在于，所述方法还包括：

获取所述第二多媒体推荐模型；

基于所述第二多媒体推荐模型，确定所述第一多媒体推荐模型的初始模型。

10.一种多媒体推荐方法，其特征在于，所述方法包括：

响应于接收到针对属于目标类型的目标对象的推荐指令，获取所述目标对象的对象数据；

基于所述目标类型对应的第一多媒体推荐模型，对所述目标对象的对象数据进行处理，得到所述目标对象的多媒体推荐信息，其中，所述第一多媒体推荐模型基于权利要求1至9任一项所述的多媒体推荐模型的训练方法得到；

基于所述目标对象的多媒体推荐信息，对所述目标对象进行多媒体资源推荐。

11.一种多媒体推荐模型的训练装置，其特征在于，所述装置包括：

第一模型获取单元，被配置为执行获取第一多媒体推荐模型，所述第一多媒体推荐模型的初始模型基于第二多媒体推荐模型确定，所述第二多媒体推荐模型基于多个对象的历史样本数据训练得到，所述历史样本数据表示所述对象针对多媒体资源的历史操作行为；

嵌入单元，被配置为执行基于所述第一多媒体推荐模型，对目标对象组的实时样本数据进行嵌入处理，得到所述目标对象组的第一嵌入特征集合，所述目标对象组包括属于目标类型的至少一个样本对象，所述实时样本数据表示所述样本对象针对多媒体资源的实时操作行为，所述第一嵌入特征集合包括对象特征和多媒体资源特征；

更新单元，被配置为执行基于第二嵌入特征集合，对所述目标对象组的第一嵌入特征集合进行更新，所述第二嵌入特征集合包括基于所述多个对象的历史样本数据和所述第二多媒体推荐模型得到的多个第二嵌入特征；

训练单元，被配置为执行基于更新后的所述目标对象组的第一嵌入特征集合，对所述第一多媒体推荐模型进行训练；

所述更新单元，包括集合确定子单元和第一更新子单元，所述第一更新子单元包括第一更新模块；所述集合确定子单元，被配置为执行基于所述第一嵌入特征集合中第一嵌入特征的特征标识，确定所述第二嵌入特征集合中是否存在目标嵌入特征集合，所述目标嵌入特征集合中的所述第二嵌入特征的特征标识与所述第一嵌入特征的特征标识相同；

所述第一更新模块，被配置为执行在所述第二嵌入特征集合中存在所述目标嵌入特征集合的情况下，根据所述第一嵌入特征的学习分数，基于所述目标嵌入特征集合中的所述第二嵌入特征，对所述第一嵌入特征集合进行更新，所述学习分数表示所述第一嵌入特征对所述目标对象组的实时样本数据的学习充分程度。

12.根据权利要求11所述的多媒体推荐模型的训练装置，其特征在于，所述装置被配置为执行：

13.根据权利要求11所述的多媒体推荐模型的训练装置，其特征在于，所述装置还包括：

添加模块，被配置为执行将所述第二嵌入特征集合中除了所述目标嵌入特征集合以外的所述第二嵌入特征，添加至所述第一嵌入特征集合。

14.根据权利要求11所述的多媒体推荐模型的训练装置，其特征在于，所述第一更新子单元还包括：

分数确定模块，被配置为执行在所述第二嵌入特征集合中存在所述目标嵌入特征集合的情况下，确定所述第一嵌入特征对应的第一学习分数；

替换模块，被配置为执行在所述第一学习分数小于第一分数阈值的情况下，用所述目标嵌入特征集合中的所述第二嵌入特征替换所述第一嵌入特征集合中的所述第一嵌入特征。

15.根据权利要求14所述的多媒体推荐模型的训练装置，其特征在于，所述第一嵌入特征包括特征值和特征更新信息，所述特征更新信息用于表示所述第一嵌入特征的已更新次数；

所述分数确定模块被配置为执行：

16.根据权利要求11所述的多媒体推荐模型的训练装置，其特征在于，所述第一更新子单元还包括：

第三嵌入模块，被配置为执行在所述第二嵌入特征集合中存在所述目标嵌入特征集合的情况下，对所述第一嵌入特征和所述目标嵌入特征集合中对应的所述第二嵌入特征进行特征融合，得到第三嵌入特征；

第二更新模块，被配置为执行基于所述第三嵌入特征，对所述目标对象组的第一嵌入特征集合进行更新。

17.根据权利要求16所述的多媒体推荐模型的训练装置，其特征在于，所述更新模块被配置为执行：

确定所述第三嵌入特征对应的第二学习分数；

18.根据权利要求11所述的多媒体推荐模型的训练装置，其特征在于，所述更新单元还包括：

第二更新子单元，被配置为执行在所述第二嵌入特征集合中不存在所述目标嵌入特征集合的情况下，将所述第二嵌入特征集合添加至所述目标对象组的第一嵌入特征集合。

19.根据权利要求11所述的多媒体推荐模型的训练装置，其特征在于，所述装置还包括：

第二模型获取单元，被配置为执行获取所述第二多媒体推荐模型；

模型确定单元，被配置为执行基于所述第二多媒体推荐模型，确定所述第一多媒体推荐模型的初始模型。

20.一种多媒体推荐装置，其特征在于，所述装置包括：

目标获取单元，被配置为执行响应于接收到针对属于目标类型的目标对象的推荐指令，获取所述目标对象的对象数据；

处理单元，被配置为执行基于所述目标类型对应的第一多媒体推荐模型，对所述目标对象的对象数据进行处理，得到所述目标对象的多媒体推荐信息，其中，所述第一多媒体推荐模型基于权利要求1至9任一项所述的多媒体推荐模型的训练方法得到；

推荐单元，被配置为执行基于所述目标对象的多媒体推荐信息，对所述目标对象进行多媒体资源推荐。

21.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

用于存储所述处理器可执行程序代码的存储器；

其中，所述处理器被配置为执行所述程序代码，以实现如权利要求1至9任一项所述的多媒体推荐模型的训练方法以及如权利要求10 所述的多媒体推荐方法。

22.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的程序代码由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至9中任一项所述的多媒体推荐模型的训练方法以及如权利要求10 所述的多媒体推荐方法。

23.一种计算机程序产品，其特征在于，包括一条或多条指令，所述一条或多条指令由计算机设备的一个或多个处理器执行，使得所述计算机设备能够执行如权利要求1至9中任一项所述的多媒体推荐模型的训练方法以及如权利要求10所述的多媒体推荐方法。