CN113704511B

CN113704511B - 多媒体资源的推荐方法、装置、电子设备及存储介质

Info

Publication number: CN113704511B
Application number: CN202110869637.4A
Authority: CN
Inventors: 廖一桥
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-07-30
Filing date: 2021-07-30
Publication date: 2022-11-22
Anticipated expiration: 2041-07-30
Also published as: CN113704511A

Abstract

本公开关于一种多媒体资源的推荐方法、装置、电子设备及存储介质。该方法包括：接收到多媒体推荐请求，获取属性信息以及目标对象的历史行为序列信息；属性信息包括目标对象的对象关联属性信息和待推荐多媒体资源的多媒体属性信息；根据对象关联属性信息和/或多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头目标注意力头；将历史行为序列信息、对象关联属性信息和多媒体属性信息输入多头注意力模型，进行推荐预测处理，得到目标注意力头输出的预测信息；基于目标注意力头输出的预测信息，向目标对象推荐所述待推荐多媒体资源。根据本公开提供的技术方案，可以避免多头注意力机制的坍缩现象和提升推荐精准性。

Description

多媒体资源的推荐方法、装置、电子设备及存储介质

技术领域

本公开涉及数据处理技术领域，尤其涉及一种多媒体资源的推荐方法、装置、电子设备及存储介质。

背景技术

在多媒体推荐系统中，对象历史行为信息蕴含着对象兴趣点的信息，基于这些兴趣点，推荐系统可以给对象推荐更感兴趣的内容。相关技术中，一般会采用Transformer结构(编解码结构)，例如利用多头注意力机制(Multi-head Attention)对对象历史行为序列进行兴趣点预测。多头注意力机制能否准确的捕捉到对象的多峰兴趣对推荐的效果至关重要。而在实际应用场景中，多头注意力可能会存在坍缩现象，这种多头注意力的坍缩现象会大幅削弱模型的表达能力、带来额外的参数和复杂度消耗。并且，现有的多头注意力模型中的多个注意力头各自的注意力缺乏可解释性，这些均会导致推荐效果欠佳。

发明内容

本公开提供一种多媒体资源的推荐方法、装置、电子设备及存储介质，以至少解决相关技术中如何避免多头注意力机制的坍缩现象的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种多媒体资源的推荐方法，包括：

接收到多媒体推荐请求，获取属性信息以及目标对象的历史行为序列信息；所述属性信息包括所述目标对象的对象关联属性信息和待推荐多媒体资源的多媒体属性信息，所述历史行为序列信息为所述目标对象执行过预设行为的多媒体资源的多媒体属性序列；所述目标对象为所述多媒体推荐请求中目标对象标识对应的对象；

根据所述对象关联属性信息和/或所述多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头；

将所述历史行为序列信息、所述对象关联属性信息和所述多媒体属性信息输入所述多头注意力模型，进行推荐预测处理，得到所述目标注意力头输出的预测信息；

基于所述目标注意力头输出的预测信息，向所述目标对象推荐所述待推荐多媒体资源。

在一种可能的实现方式中，所述对象关联属性信息包括所述目标对象的对象属性信息和所述目标对象触发所述多媒体推荐请求的上下文属性信息；所述根据所述对象关联属性信息和/或所述多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头步骤包括：

根据所述对象属性信息、所述多媒体属性信息和所述上下文属性信息中的至少一种，确定目标属性组合；

基于所述目标属性组合，确定所述目标注意力头。

在一种可能的实现方式中，所述基于所述目标属性组合，确定所述目标注意力头步骤包括：

对所述目标属性组合进行编码处理，得到编码信息；

将所述编码信息输入预设嵌入层网络，进行特征处理，得到特征信息；

将所述特征信息映射到预设范围内，得到目标特征值；

获取多个特征值范围与注意力头的对应关系，所述多个特征值范围在所述预设范围内；

基于所述多个特征值范围与注意力头的对应关系，从所述多个注意力头中，确定与所述目标特征值对应的至少一个注意力头作为所述目标注意力头。

获取所述目标属性组合下对应的多媒体资源的数量信息；

基于所述数量信息，从所述多个注意力头中确定目标数量的注意力头作为所述目标注意力头，其中，所述目标数量与所述数量信息成正相关关系。

获取属性组合与注意力头的对应关系；

基于所述对应关系，确定所述目标属性组合对应的所述目标注意力头。

在一种可能的实现方式中，所述基于所述目标注意力头输出的预测信息，向所述目标对象推荐所述待推荐多媒体资源步骤包括：

对所述目标注意力头输出的预测信息进行加权处理，得到所述待推荐多媒体资源的预测加权信息；

基于所述预测加权信息，向所述目标对象推荐所述待推荐多媒体资源。

对所述目标注意力头输出的预测信息进行信息拼接处理，得到所述待推荐多媒体资源的预测拼接信息；

根据所述预测拼接信息，向所述目标对象推荐所述待推荐多媒体资源。

在一种可能的实现方式中，所述方法还包括：

获取多个样本数据和对应的标签信息，每个样本数据包括样本属性信息和样本对象的样本行为序列信息，所述样本属性信息包括所述样本对象的样本对象关联属性信息和样本多媒体资源的样本多媒体属性信息，所述样本行为序列信息为所述样本对象执行过预设行为的多媒体资源的多媒体属性序列；

基于所述样本行为序列信息、所述样本对象关联属性信息、所述样本多媒体属性信息以及对应的标签信息，训练预设注意力模型，得到所述多头注意力模型。

在一种可能的实现方式中，所述基于所述样本行为序列信息、所述样本对象关联属性信息和所述样本多媒体属性信息，训练预设注意力模型，得到所述多头注意力模型步骤包括：

根据每个样本数据的所述样本对象关联属性信息和/或所述样本多媒体属性信息，确定每个样本数据对应的样本注意力头，所述样本注意力头为所述预设注意力模型中多个注意力头中的至少一个；

在第一时间段内，将每个样本数据的所述样本行为序列信息、所述样本对象关联属性信息和所述样本多媒体属性信息输入所述预设注意力模型，得到每个样本数据对应的样本注意力头输出的第一样本预测信息；

基于所述第一样本预测信息和所述标签信息，对所述预设注意力模型进行训练，得到初始注意力模型；

在第二时间段内，将每个样本数据的所述样本行为序列信息、所述样本对象关联属性信息和所述样本多媒体属性信息输入所述初始注意力模型，得到所述初始注意力模型中多个注意力头输出的第二样本预测信息；

基于所述第二样本预测信息和所述标签信息，对所述初始注意力模型进行训练，得到所述多头注意力模型。

根据本公开实施例的第二方面，提供一种多媒体资源的推荐装置，包括：

属性与行为信息获取模块，被配置为执行接收到多媒体推荐请求，获取属性信息以及目标对象的历史行为序列信息；所述属性信息包括所述目标对象的对象关联属性信息和待推荐多媒体资源的多媒体属性信息，所述历史行为序列信息为所述目标对象执行过预设行为的多媒体资源的多媒体属性序列；所述目标对象为所述多媒体推荐请求中目标对象标识对应的对象；；

目标注意力头确定模块，被配置为执行根据所述对象关联属性信息和/或所述多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头；

预测信息获取模块，被配置为执行将所述历史行为序列信息、所述对象关联属性信息和所述多媒体属性信息输入所述多头注意力模型，进行推荐预测处理，得到所述目标注意力头输出的预测信息；

推荐模块，被配置为执行基于所述目标注意力头输出的预测信息，向所述目标对象推荐所述待推荐多媒体资源。

在一种可能的实现方式中，所述对象关联属性信息包括所述目标对象的对象属性信息和所述目标对象触发所述多媒体推荐请求的上下文属性信息；所述目标注意力头确定模块包括：

目标属性组合确定单元，被配置为执行根据所述对象属性信息、所述多媒体属性信息和所述上下文属性信息中的至少一种，确定目标属性组合；

目标注意力头确定单元，被配置为执行基于所述目标属性组合，确定所述目标注意力头。

在一种可能的实现方式中，所述目标注意力头确定单元包括：

编码信息获取子单元，被配置为执行对所述目标属性组合进行编码处理，得到编码信息；

特征信息获取子单元，被配置为执行将所述编码信息输入预设嵌入层网络，进行特征处理，得到特征信息；

特征值获取子单元，被配置为执行将所述特征信息映射到预设范围内，得到目标特征值；

第一对应关系获取子单元，被配置为执行第一获取多个特征值范围与注意力头的对应关系，所述多个特征值范围在所述预设范围内；

第一目标注意力头确定子单元，被配置为执行基于所述多个特征值范围与注意力头的对应关系，从所述多个注意力头中，确定与所述目标特征值对应的至少一个注意力头作为所述目标注意力头。

数量信息获取子单元，被配置为执行获取所述目标属性组合下对应的多媒体资源的数量信息；

第二目标注意力头确定子单元，被配置为执行基于所述数量信息，从所述多个注意力头中确定目标数量的注意力头作为所述目标注意力头，其中，所述目标数量与所述数量信息成正相关关系。

第二对应关系获取子单元，被配置为执行获取属性组合与注意力头的对应关系；

第三目标注意力头确定子单元，被配置为执行基于所述对应关系，确定所述目标属性组合对应的所述目标注意力头。

在一种可能的实现方式中，所述推荐模块包括：

预测加权信息获取单元，被配置为执行对所述目标注意力头输出的预测信息进行加权处理，得到所述待推荐多媒体资源的预测加权信息；

第一推荐单元，被配置为执行基于所述预测加权信息，向所述目标对象推荐所述待推荐多媒体资源。

在一种可能的实现方式中，所述推荐模块包括：

预测拼接信息获取单元，被配置为执行对所述目标注意力头输出的预测信息进行信息拼接处理，得到所述待推荐多媒体资源的预测拼接信息；

第二推荐单元，被配置为执行根据所述预测拼接信息，向所述目标对象推荐所述待推荐多媒体资源。

在一种可能的实现方式中，所述装置还包括：

训练样本获取模块，被配置为执行获取多个样本数据和对应的标签信息，每个样本数据包括样本属性信息和样本对象的样本行为序列信息，所述样本属性信息包括所述样本对象的样本对象关联属性信息和样本多媒体资源的样本多媒体属性信息，所述样本行为序列信息为所述样本对象执行过预设行为的多媒体资源的多媒体属性序列；

训练模块，被配置为执行基于所述样本行为序列信息、所述样本对象关联属性信息、所述样本多媒体属性信息以及对应的标签信息，训练预设注意力模型，得到所述多头注意力模型。

在一种可能的实现方式中，所述训练模块包括：

样本注意力头确定单元，被配置为执行根据每个样本数据的所述样本对象关联属性信息和/或所述样本多媒体属性信息，确定每个样本数据对应的样本注意力头，所述样本注意力头为预设注意力模型中多个注意力头中的至少一个；

第一样本预测信息获取单元，被配置为执行在第一时间段内，将每个样本数据的所述样本行为序列信息、所述样本对象关联属性信息和所述样本多媒体属性信息输入所述预设注意力模型，得到每个样本数据对应的样本注意力头输出的第一样本预测信息；

第一训练单元，被配置为执行基于所述第一样本预测信息和所述标签信息，对所述预设注意力模型进行训练，得到初始注意力模型；

第二样本预测信息获取单元，被配置为执行在第二时间段内，将每个样本数据的所述样本行为序列信息、所述样本对象关联属性信息和所述样本多媒体属性信息输入所述初始注意力模型，得到所述初始注意力模型中多个注意力头输出的第二样本预测信息；

第二训练单元，被配置为执行基于所述第二样本预测信息和所述标签信息，对所述初始注意力模型进行训练，得到所述多头注意力模型。

根据本公开实施例的第三方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如上述第一方面中任一项所述的方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行本公开实施例的第一方面中任一所述方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，包括计算机指令，所述计算机指令被处理器执行时，使得计算机执行本公开实施例的第一方面中任一项所述方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

通过对象关联属性信息和/或所述多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头，实现给多头注意力增加可控性和可解释性，使得不同注意力头可以学习不同属性信息的知识，避免多头注意力机制的坍缩现象及避免额外的参数和复杂度消耗，能够充分利用多头注意力的表达能力，使得目标注意力头输出的预测信息更加精准；进而在利用目标注意力头输出的预测信息，向目标对象推荐待推荐多媒体资源时，使得推荐精准性可以得到提升，保证推荐效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种应用环境的示意图。

图2是根据一示例性实施例示出的一种多媒体资源的推荐方法的流程图。

图3是根据一示例性实施例示出的一种多头注意力模型和推荐模型的示意图。

图4是根据一示例性实施例示出的一种根据对象关联属性信息和/或多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头的方法流程图。

图5是根据一示例性实施例示出的一种基于目标属性组合，确定目标注意力头的方法流程图。

图6是根据一示例性实施例示出的一种基于目标属性组合，确定目标注意力头的方法流程图。

图7是根据一示例性实施例示出的一种基于目标注意力头输出的预测信息，向目标对象推荐待推荐多媒体资源的方法流程图。

图8是根据一示例性实施例示出的一种基于目标注意力头输出的预测信息，向目标对象推荐待推荐多媒体资源的方法流程图。

图9是根据一示例性实施例示出的一种多头注意力模型的训练方法流程图。

图10是根据一示例性实施例示出的一种多头注意力模型的训练方法流程图。

图11是根据一示例性实施例示出的一种多媒体资源的推荐装置框图。

图12是根据一示例性实施例示出的一种用于多媒体资源的推荐的电子设备的框图。

图13是根据一示例性实施例示出的一种用于多媒体资源的推荐的电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

近年来，随着人工智能技术研究和进步，人工智能技术在多个领域得到广泛应用，本申请实施例提供的方案涉及机器学习/深度学习等技术，具体通过如下实施例进行说明：

请参阅图1，图1是根据一示例性实施例示出的一种应用环境的示意图，如图1所示，该应用环境可以包括服务器01和终端02。

在一个可选的实施例中，服务器01可以用于多媒体资源的推荐处理。具体的，服务器01可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。

在一个可选的实施例中，终端02可以用于发送多媒体推荐请求，并可以用于接收及展示推荐的多媒体资源。具体的，终端02可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmentedreality，AR)/虚拟现实(virtual reality，VR)设备、智能可穿戴设备等类型的电子设备。可选的，电子设备上运行的操作系统可以包括但不限于安卓系统、IOS系统、linux、windows等。

此外，需要说明的是，图1所示的仅仅是本公开提供的图像处理方法的一种应用环境。例如，终端02可以接收服务器01训练好的多头注意力模型，从而可以使用多头注意力模型执行多媒体资源的推荐处理。

本说明书实施例中，上述服务器01以及终端02可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

需要说明的是，以下图中示出的是一种可能的步骤顺序，实际上并不限定必须严格按照此顺序。有些步骤可以在互不依赖的情况下并行执行。本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息、用户行为信息等)和数据(包括但不限于用于展示的数据、训练的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

图2是根据一示例性实施例示出的一种多媒体资源的推荐方法的流程图。如图2所示，可以包括以下步骤。

在步骤S201中，接收到多媒体推荐请求，获取属性信息以及目标对象的历史行为序列信息；其中，属性信息可以包括目标对象的对象关联属性信息和待推荐多媒体资源的多媒体属性信息。

本说明书实施例中，目标对象可以是目标用户，该目标用户可以是多媒体推荐平台中的任一用户；该历史行为序列信息可以为目标对象执行过预设行为的多媒体资源的多媒体属性序列。预设行为可以包括点击、点赞、转发等。每一种预设行为对应的历史行为序列信息可以包括至少一种多媒体属性序列，一种多媒体属性序列可以对应一种多媒体属性。例如，在预设行为是点击时，多媒体属性序列可以对应点击过的多媒体资源的多媒体类别，比如[体育，美食，搞笑，教育，美妆]；或者多媒体属性序列可以对应点击过的多媒体资源的多媒体标识，比如[多媒体1，多媒体3，多媒体7，多媒体2，多媒体6]，本公开对此不作限定。其中，多媒体资源可以包括视频、图文资源等。

实际应用中，目标对象可以在终端触发多媒体推荐指令，终端可以响应于该多媒体推荐指令，发送多媒体推荐请求至服务器。相应地，服务器在接收到多媒体推荐请求的情况下，响应于该多媒体推荐请求，可以确定多媒体推荐请求中的目标对象标识对应的对象为目标对象。进而可以获取目标对象的历史行为序列信息。例如，可以获取目标对象执行过预设行为的多媒体资源，从而可以提取目标对象执行过预设行为的多媒体资源的多媒体属性，构建多媒体属性序列以获取目标对象的历史行为序列信息。

进一步地，还可以获取属性信息，例如可以获取目标对象的对象关联属性信息和待推荐多媒体资源的多媒体属性信息。其中，待推荐多媒体资源可以是通过召回方式获取的与目标对象匹配的多媒体资源，本公开对召回方式不作限定，例如可以获取与目标对象的画像信息匹配的多媒体资源作为待推荐多媒体资源。待推荐多媒体资源与历史行为序列信息中的多媒体资源可以不同。

在一个示例中，对象关联属性信息可以包括目标对象的对象属性信息；在另一个示例中，对象关联属性信息可以包括目标对象的对象属性信息和该目标对象触发多媒体推荐请求的上下文属性信息，例如，上下文属性信息可以包括当前时间信息、目标对象触发多媒体推荐请求所处的位置信息等，当前时间信息可以包括早上、中午、下午和晚上等，本公开对此不作限定。本说明书实施例中，多媒体属性信息可以是指能够表征多媒体资源属性的信息，例如可以包括多媒体类别、多媒体时长、多媒体标识中的至少一个；其中，多媒体类别可以是指多媒体的内容类别，例如搞笑、教育、美妆、美食、游戏、音乐等。多媒体时长可以是指多媒体的内容被完整展示的时长；或者多媒体时长可以是指多媒体的内容被完整展示的时长对应的时长分类，例如可以包括短、中、长。以多媒体资源为视频为例，可以包括短视频、中视频和长视频，该短视频、中视频和长视频各自对应的被完整展示的时长可以依次增大，本公开对该多媒体时长的具体划分不作限定，例如，时长分类可以基于时长阈值进行划分，本公开对该时长阈值不作限定。

本说明书实施例中，对象属性信息可以是指能够表征对象基本特征的信息，例如可以包括对象类别、对象性别、对象年龄、对象标识和对象对多媒体资源执行预设行为的倾向信息等。例如，对象类别可以包括新对象和老对象；对象对多媒体资源执行预设行为的倾向信息可以是指对象在一定时长内执行过预设行为的多媒体资源的数量，该一定时长可以是距离当前时间的一定时长，例如最近一小时观看过的短视频的数量为20个。本公开对这些均不作限定。

在步骤S203中，根据对象关联属性信息和/或多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头。

实际应用中，确定的至少一个注意力头可以是与对象关联属性信息和/或多媒体属性信息对应的。在一个示例中，可以预先设置对象关联属性信息和/或多媒体属性信息与至少一个注意力头的对应关系，这样可以基于该对应关系，确定与对象关联属性信息和/或多媒体属性信息对应的目标注意力头。其中，对应关系可以是对象关联属性信息与至少一个注意力头的对应关系，多媒体属性信息与至少一个注意力头的对应关系，或者对象关联属性信息、多媒体属性信息与至少一个注意力头三者之间的对应关系。

在步骤S205中，将历史行为序列信息、对象关联属性信息和多媒体属性信息输入多头注意力模型，进行推荐预测处理，得到目标注意力头输出的预测信息。

本说明书实施例中，可以将历史行为序列信息、对象关联属性信息和多媒体属性信息输入多头注意力模型，进行推荐预测处理，得到目标注意力头输出的预测信息。其中，多头注意力模型可以是预先训练得到的，本公开对训练过程不作限定。需要说明的是，历史行为序列信息、对象关联属性信息和多媒体属性信息可以是特征向量的形式，本公开对此不作限定。

在一种可能的实现方式中，在对象关联属性信息包括目标对象的对象属性信息和该目标对象触发多媒体推荐请求的上下文属性信息时，可以将历史行为序列信息、对象属性信息、多媒体属性信息和上下文属性信息输入多头注意力模型，进行推荐预测处理，得到目标注意力头输出的预测信息。例如，可以得到多头注意力模型中多个注意力头各自的输出：多个预测信息，从而可以从多个预测信息中获取目标注意力头输出的预测信息。在一个示例中，可以将对象属性信息、多媒体属性信息和上下文属性信息作为查询矩阵Q对应的输入、将历史行为序列信息作为键矩阵K和值矩阵V对应的输入。也就是说可以将属性信息与W^Q相乘，得到查询矩阵Q；将历史行为序列信息与W^K相乘，得到键矩阵K；将历史行为序列信息与W^v相乘，得到值矩阵V。其中，W^Q、W^K、W^V可以是多头注意力模型中的权重矩阵，本公开对此不作限定。

在步骤S207中，基于目标注意力头输出的预测信息，向目标对象推荐待推荐多媒体资源。

在一种可能的实现方式中，可以进一步基于预测信息和推荐模型进行推荐预测。如图3所示，可以将目标注意力头输出的预测信息输入至推荐模型中，得到推荐预测信息，比如推荐或不推荐，从而可以将推荐预测信息为推荐的待推荐多媒体资源向目标对象推荐。

可选地，推荐预测信息可以是推荐预测概率，基于此，可以将推荐预测概率大于概率阈值的待推荐多媒体资源向目标对象推荐；或者，在待推荐多媒体资源为多个时，可以根据推荐预测概率对待推荐多媒体资源进行排序，得到排序结果，从而可以基于排序结果，将排序靠前的、一定数量的待推荐多媒体资源向目标对象推荐。

其中，上述推荐模型可以是预先训练得到的，例如多任务学习模型MMOE(Multi-gated Mixture of Expert，多门-多专家)模型、多层感知器MLP(Multilayer Perceptron)等，本公开对此不作限定。

通过对象关联属性信息和/或多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头，实现给多头注意力增加可控性和可解释性，使得不同注意力头可以学习不同属性信息的知识，避免多头注意力机制的坍缩现象及避免额外的参数和复杂度消耗，能够充分利用多头注意力的表达能力，使得目标注意力头输出的预测信息更加精准；进而在利用目标注意力头输出的预测信息向目标对象推荐待推荐多媒体资源时，使得推荐精准性可以得到提升，保证推荐效果。

图4是根据一示例性实施例示出的一种根据对象关联属性信息和/或多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头的方法流程图。在一种可能的实现方式中，在对象关联属性信息包括目标对象的对象属性信息和目标对象触发多媒体推荐请求的上下文属性信息的情况下，该步骤S203可以包括：

在步骤S401中，根据对象属性信息、多媒体属性信息和上下文属性信息中的至少一种，确定目标属性组合；

在步骤S403中，基于目标属性组合，确定目标注意力头。

本说明书实施例中，可以获取预设的多个属性组合，从而可以对对象属性信息、多媒体属性信息和上下文属性信息中的至少一种进行分类，根据该分类，从多个属性组合中确定目标属性组合。并可以获取属性组合与注意力头之间的对应关系，基于该对应关系，确定目标属性组合对应的目标注意力头。根据对应关系确定目标注意力头的方式，可以提高目标注意力头的确定效率。

实际应用中，上述属性组合与注意力头之间的对应关系可以是预先构建的。可以对对象属性信息、多媒体属性信息和上下文属性信息中的至少一种进行分类，得到多个属性组合；并可以确定多个注意力头的组合方式，从而可以确定属性组合与组合方式的对应关系，以确定属性组合与注意力头的对应关系。本公开对此不作限定，只要对应关系中包括尽可能多的组合方式或者对应关系中包括尽可能多的注意力头即可。

在一个示例中，可以对对象属性信息、多媒体属性信息和上下文属性信息中的三种均进行分类，得到对象属性信息的种类为N1种、多媒体属性信息的种类为N2种、上下文属性信息的种类为N3种，这样可以确定属性组合为N1*N2*N3个。基于此，可以预先构建N1*N2*N3个属性组合与注意力头之间的对应关系。比如N1＝3,N2＝30,N3＝3，这样属性组合为3*30*3＝270种。假设有8个注意力头，则注意力头的组合方式可以是2⁸＝256种。这样可以建立270种属性组合与256种组合方式之间的对应关系，从而可以构建属性组合与注意力头之间的对应关系。例如，一个对应关系可以是：一个属性组合(对象属性信息/新对象；多媒体属性信息/多媒体时长：短；上下文属性信息/中午)----注意力头(注意力头1、注意力头5～7)。

在另一个示例中，考虑上述全面分类得到的N1*N2*N3可能较大，可以基于对象属性信息、多媒体属性信息和上下文属性信息中一个维度上的属性信息进行分类，得到属性组合，在这种情况下，可以认为没有分类的属性信息的种类为1。比如以多媒体属性信息进行分类，多媒体属性信息的种类为3种，那么对象属性信息的种类和上下文属性信息的种类可以为1，这样得到的属性组合可以为3*1*1＝3种。假设有8个注意力头，可以建立3种属性组合与8个注意力头之间的对应关系。举例来说，以多媒体属性信息中的多媒体时长进行分类，得到属性组合与注意力头(注意力头1～8)的对应关系可以如下表1所示：

表1

上述表2中包括3种属性组合：(对象属性信息/--；多媒体属性信息/多媒体时长：短；上下文属性信息/--)；(对象属性信息/--；多媒体属性信息/多媒体时长：中；上下文属性信息/--)；(对象属性信息/--；多媒体属性信息/多媒体时长：长；上下文属性信息/--)。

上述表2中“--”可以是指对应对象属性信息和上下文属性信息不作限定，即没有被分类或分类为1种。这样可以基于对象属性信息、多媒体属性信息和上下文属性信息中一个维度上的属性信息，确定对应的目标注意力头。例如，待推荐多媒体资源为短视频，可以确定对应的目标属性组合为：(对象属性信息/--；多媒体属性信息/多媒体时长：短；上下文属性信息/--)，从而可以确定该目标属性组合对应的目标注意力头为注意力头1～3。这样既可以提高目标注意力头的确定效率，又可以提高多头注意力模型的预测精准度。

通过设置属性组合的方式，基于属性信息确定目标属性组合，并基于目标属性组合确定目标注意力头，可以保证激活的目标注意力头能够较好的表征属性信息，进而可以精准控制不同注意力头学习不同属性组合的知识，有效避免多个注意力头的趋同和坍缩现象，提高多头注意力模型的预测精准度，进而可以提高推荐效果。

图5是根据一示例性实施例示出的一种基于目标属性组合，确定目标注意力头的方法流程图。在一种可能的实现方式中，该步骤S403可以包括：

在步骤S501中，对目标属性组合进行编码处理，得到编码信息；

在步骤S503中，将编码信息输入预设嵌入层网络，进行特征处理，得到特征信息；

在步骤S505中，将特征信息映射到预设范围内，得到目标特征值；

在步骤S507中，获取多个特征值范围与注意力头的对应关系，多个特征值范围在预设范围内；

在步骤S509中，基于多个特征值范围与注意力头的对应关系，从多个注意力头中，确定与目标特征值对应的至少一个注意力头作为目标注意力头。

本说明书实施例中，编码信息可以是独热编码one-hot编码，预设嵌入层网络可以是预先训练得到的，预设范围可以是[0，1]，本公开对这些均不作限定。在一个示例中，可以将大于或等于1的特征信息映射为1、将大于或等于0至小于1之间的特征信息直接作为特征值。

对于编码处理，可以分别对目标属性组合中的对象属性信息、多媒体属性信息和上下文属性信息进行编码处理，例如进行one-hot编码处理，分别得到对象属性信息、多媒体属性信息和上下文属性信息各自对应的one-hot编码，然后将各自对应的one-hot编码进行拼接，得到编码信息。

作为一个示例，可以预先设置多个特征值范围与注意力头的对应关系，以8个注意力头(注意力头1～注意力头8)为例，如下表2所示：

表2

上述表2中的[1,0,0,0,0,0,0,0]、[1,1,0,0,0,0,0,0]和[1,1,1,1,1,1,1,1]中的1可以是指被激活的注意力头，0可以是指被掩蔽的注意力头。

如上表2中，可以基于多个特征值范围与注意力头的对应关系，确定与目标特征值对应的目标注意力头，从而实现从多个注意力头中，确定与目标特征值对应的至少一个注意力头作为目标注意力头的目的。例如，目标特征值为0.9，可以确定与0.9匹配的特征值为[0.8，1]，进而可以确定[0.8，1]对应的注意力头为0.9对应的目标注意力头：注意力头1～注意力头8。

通过对目标属性组合进行编码处理，得到编码信息，进而基于编码信息得到的特征值可以更有效地表征属性信息，从而可以更精准的对属性信息进行分类，提高多个注意力头的注意力的可解释性以提高推荐准确性。

在一种可能的实现方式中，图6是根据一示例性实施例示出的一种基于目标属性组合，确定目标注意力头的方法流程图。如图6所示，该步骤S403可以包括：

在步骤S601中，获取目标属性组合下对应的多媒体资源的数量信息；

在步骤S603中，基于数量信息，从多个注意力头中确定目标数量的注意力头作为目标注意力头，其中，目标数量与数量信息成正相关关系。

本说明书实施例中，目标属性组合下对应的多媒体资源可以是指与目标属性组合匹配的多媒体资源。例如目标属性组合为新对象、短视频和中午，该目标属性组合下对应的多媒体资源可以是指与新对象匹配的、在中午被执行过预设行为的短视频，从而可以统计短视频的数量，得到数量信息。

进一步地，可以基于数量信息，确定对应的目标数量。例如可以根据预设公式，确定数量信息对应的目标数量，本公开对预设公式不作限定，只要目标数量与数量信息成正相关关系即可。或者，可以预先设置数量范围与目标数量的对应关系，比如8个注意力头，可以设置数量范围[0，1000)，对应目标数量为1；[1000，2000)，对应目标数量为2；……；[7000，∞)，对应目标数量为8。假设目标属性组合下对应的多媒体资源的数量信息为1500，可以确定目标数量为2，这样可以从8个注意力头中选择2个注意力头作为目标注意力头。

通过目标属性组合下对应的多媒体资源的数量信息确定目标注意力头，可以根据不同属性组合下实时的多媒体资源的数量，动态确定目标注意力头，可以提高属性信息与目标注意力头的匹配程度，从而可以提高多头注意力模型对属性信息的表达能力。

图7是根据一示例性实施例示出的一种基于目标注意力头输出的预测信息，向目标对象推荐待推荐多媒体资源的方法流程图。在一种可能的实现方式中，该步骤S207可以包括：

在步骤S701中，对目标注意力头输出的预测信息进行加权处理，得到待推荐多媒体资源的预测加权信息；

在步骤S703中，基于预测加权信息，向目标对象推荐待推荐多媒体资源。

本说明书实施例中，可以对目标注意力头输出的预测信息进行加权处理，得到待推荐多媒体资源的预测加权信息。这里每个注意力头的权重可以为1，本公开对此不作限定。并可以基于预测加权信息，向目标对象推荐待推荐多媒体资源，具体过程可以参见步骤S207，在此不再赘述。

通过对目标注意力头输出的预测信息进行加权处理，得到待推荐多媒体资源的预测加权信息，使得预测加权信息可以是统一的标量，从而在面对不同目标注意力头时，均可以使后续能够基于统一的标量进行推荐处理，使得推荐处理可以简单且精准。

图8是根据一示例性实施例示出的一种基于目标注意力头输出的预测信息，向目标对象推荐待推荐多媒体资源的方法流程图。在一种可能的实现方式中，该步骤S207可以包括：

在步骤801中，对目标注意力头输出的预测信息进行信息拼接处理，得到待推荐多媒体资源的预测拼接信息；

在步骤803中，根据预测拼接信息，向目标对象推荐待推荐多媒体资源。

本说明书实施例中，可以对目标注意力头输出的预测信息进行信息拼接处理，得到待推荐多媒体资源的预测拼接信息。并可以根据预测拼接信息，向目标对象推荐待推荐多媒体资源，具体过程可以参见步骤S207，在此不再赘述。

可选地，上述拼接处理可以包括非目标注意力头的输出信息，非目标注意力头可以是指多个注意力头中除目标注意力之外的注意力头。具体地，可以将非目标注意力头的输出信息乘以0之后与目标注意力头输出的预测信息进行信息拼接处理，也就是说非目标注意力头的输出信息参与拼接处理，只是改变了拼接后的维度，并不影响拼接后预测拼接信息的内容。比如，8个注意力头，一个注意力头输出的预测信息为64维，选择非目标注意力头的输出信息参与拼接处理时，使得预测拼接信息可以是8*64维的，这样可以保证不同属性组合对应的预测拼接信息可以是相同维度，便于后续基于统一维度的预测信息进行推荐处理。

通过对目标注意力头输出的预测信息进行信息拼接处理，可以保留预测信息的表达，使得后续推荐处理可以更加精准。

在上述拼接处理的情况下，对应的训练过程中可以采用占空比的方式训练预设注意力模型以得到多头注意力模型，具体训练过程如下：

在一种可能的实现方式中，图9是根据一示例性实施例示出的一种多头注意力模型的训练方法流程图。如图9所示，该训练过程可以包括：

在步骤S901中，获取多个样本数据和对应的标签信息，每个样本数据可以包括样本属性信息和样本对象的样本行为序列信息，该样本属性信息可以包括样本对象的样本对象关联属性信息和样本多媒体资源的样本多媒体属性信息，样本行为序列信息可以为样本对象执行过预设行为的多媒体资源的多媒体属性序列。

在一个示例中，样本对象关联属性信息可以包括样本对象的对象属性信息；在另一个示例中，样本对象关联属性信息可以包括样本对象的对象属性信息以及样本行为序列信息中样本对象执行预设行为的上下文属性信息，例如样本对象执行预设行为的时间信息、位置信息等，其中，该时间信息可以包括早上、中午、下午和晚上等，本公开对这些均不作限定。

实际应用中，可以获取多个样本对象，从而可以从海量的多媒体资源中获取被该多个样本对象执行过预设行为的多媒体资源，并可以提取该多个样本对象执行过预设行为的多媒体资源资源的多媒体属性信息，得到样本行为序列信息。还可以从海量的多媒体资源中获取样本多媒体资源，从而可以获取样本多媒体资源的样本多媒体属性信息。其中，样本多媒体资源可以与样本行为序列信息中的多媒体资源不同，本公开对此不作限定。

另外还可以获取多个样本对象各自的对象属性信息。基于这些，可以将一个样本行为序列信息、一个样本对象的对象属性信息、一个样本多媒体资源的样本多媒体属性信息作为一个样本数据，从而可以获取多个样本数据。

进一步地，可以为多个样本数据标注标签信息，例如匹配或不匹配，从而可以将多个样本数据和对应的标签信息作为样本训练集。

在步骤S903中，基于样本行为序列信息、样本对象关联属性信息、样本多媒体属性信息以及对应的标签信息，训练预设注意力模型，得到多头注意力模型。

在一个示例中，该步骤S903可以包括以下步骤，如图10所示：

在步骤S1001中，根据每个样本数据的样本对象关联属性信息和/或样本多媒体属性信息，确定每个样本数据对应的样本注意力头，样本注意力头为预设注意力模型中多个注意力头中的至少一个；

在步骤S1003中，在第一时间段内，将每个样本数据的样本行为序列信息、样本对象关联属性信息和样本多媒体属性信息输入预设注意力模型，得到每个样本数据对应的样本注意力头输出的第一样本预测信息。

上述步骤S1001和S1003可以参见S203和S205，在此不再赘述。

在步骤S1005中，基于第一样本预测信息和标签信息，对预设注意力模型进行训练，得到初始注意力模型；

在步骤S1007中，在第二时间段内，将每个样本数据的样本行为序列信息、样本对象关联属性信息和样本多媒体属性信息输入初始注意力模型，得到初始注意力模型中多个注意力头输出的第二样本预测信息；

在步骤S1009中，基于第二样本预测信息和标签信息，对初始注意力模型进行训练，得到多头注意力模型。

本说明书实施例中，第二时间段可以在第一时间段之后，第一时间段可以比第二时间段长。在进行占空比训练中，可以在第一时间段内进行掩蔽训练(预设注意力模型中多个注意力头中的样本注意力头激活，即部分注意力头被激活)，即可以基于样本注意力头输出的第一样本预测信息与标签信息的损失信息，对预设注意力模型进行训练，得到初始注意力模型；在第二时间段内所有注意力头被激活，可以基于初始注意力模型中多个注意力头输出的第二样本预测信息与标签信息的损失信息，对初始注意力模型进行训练，得到多头注意力模型。

可选地，对于目标注意力头输出的预测信息进行加权处理的情况下，可以利用S901、S1001～S1003对预设注意力模型进行训练，直至满足预设条件为止，以得到多头注意力模型。该预设条件可以是第一样本预测信息和标签信息的损失信息小于损失阈值，本公开对此不作限定。

通过采用占空比的方式训练预设注意力模型以得到多头注意力模型，可以避免训练时部分注意力头激活与应用中全部注意力头激活的不一致性，保证多头注意力模型的预测精度。

图11是根据一示例性实施例示出的一种多媒体资源的推荐装置框图。参照图11，该装置可以包括：

属性与行为信息获取模块1101，被配置为执行接收到多媒体推荐请求，获取属性信息以及目标对象的历史行为序列信息；属性信息包括目标对象的对象关联属性信息和待推荐多媒体资源的多媒体属性信息，历史行为序列信息为目标对象执行过预设行为的多媒体资源的多媒体属性序列；目标对象为多媒体推荐请求中目标对象标识对应的对象；

目标注意力头确定模块1103，被配置为执行根据对象关联属性信息和/或多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头；

预测信息获取模块1105，被配置为执行将历史行为序列信息、对象关联属性信息和多媒体属性信息输入多头注意力模型，进行推荐预测处理，得到目标注意力头输出的预测信息；

推荐模块1107，被配置为执行基于目标注意力头输出的预测信息，向目标对象推荐待推荐多媒体资源。

通过对象关联属性信息和/或多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头，实现给多头注意力增加可控性和可解释性，使得不同注意力头可以学习不同属性信息的知识，避免多头注意力机制的坍缩现象及避免额外的参数和复杂度消耗，能够充分利用多头注意力的表达能力，使得目标注意力头输出的预测信息更加精准；进而在利用目标注意力头输出的预测信息，向目标对象推荐待推荐多媒体资源时，使得推荐精准性可以得到提升，保证推荐效果。

在一种可能的实现方式中，对象关联属性信息可以包括目标对象的对象属性信息和目标对象触发多媒体推荐请求的上下文属性信息；目标注意力头确定模块1103可以包括：

目标属性组合确定单元，被配置为执行根据对象属性信息、多媒体属性信息和上下文属性信息中的至少一种，确定目标属性组合；

目标注意力头确定单元，被配置为执行基于目标属性组合，确定目标注意力头。

在一种可能的实现方式中，目标注意力头确定单元可以包括：

编码信息获取子单元，被配置为执行对目标属性组合进行编码处理，得到编码信息；

特征信息获取子单元，被配置为执行将编码信息输入预设嵌入层网络，进行特征处理，得到特征信息；

特征值获取子单元，被配置为执行将特征信息映射到预设范围内，得到目标特征值；

第一对应关系获取子单元，被配置为执行第一获取多个特征值范围与注意力头的对应关系，多个特征值范围在预设范围内；

第一目标注意力头确定子单元，被配置为执行基于多个特征值范围与注意力头的对应关系，从多个注意力头中，确定与目标特征值对应的至少一个注意力头作为目标注意力头。

数量信息获取子单元，被配置为执行获取目标属性组合下对应的多媒体资源的数量信息；

第二目标注意力头确定子单元，被配置为执行基于数量信息，从多个注意力头中确定目标数量的注意力头作为目标注意力头，其中，目标数量与数量信息成相关关系。

第三目标注意力头确定子单元，被配置为执行基于对应关系，确定目标属性组合对应的目标注意力头。

在一种可能的实现方式中，该推荐模块1107可以包括：

预测加权信息获取单元，被配置为执行对目标注意力头输出的预测信息进行加权处理，得到待推荐多媒体资源的预测加权信息；

第一推荐单元，被配置为执行基于预测加权信息，向目标对象推荐待推荐多媒体资源。

在一种可能的实现方式中，该推荐模块1107还可以包括：

预测拼接信息获取单元，被配置为执行对目标注意力头输出的预测信息进行信息拼接处理，得到待推荐多媒体资源的预测拼接信息；

第二推荐单元，被配置为执行根据预测拼接信息，向目标对象推荐待推荐多媒体资源。

在一种可能的实现方式中，该装置还可以包括：

训练样本获取模块，被配置为执行获取多个样本数据和对应的标签信息，每个样本数据包括样本属性信息和样本对象的样本行为序列信息，样本属性信息包括样本对象的样本对象关联属性信息和样本多媒体资源的样本多媒体属性信息，样本行为序列信息为样本对象执行过预设行为的多媒体资源的多媒体属性序列；

训练模块，被配置为执行基于样本行为序列信息、样本对象关联属性信息、样本多媒体属性信息以及对应的标签信息，训练预设注意力模型，得到多头注意力模型。

在一种可能的实现方式中，训练模块可以包括：

样本注意力头确定单元，被配置为执行根据每个样本数据的样本对象关联属性信息和/或样本多媒体属性信息，确定每个样本数据对应的样本注意力头，样本注意力头为预设注意力模型中多个注意力头中的至少一个；

第一样本预测信息获取单元，被配置为执行在第一时间段内，将每个样本数据的样本行为序列信息、样本对象关联属性信息和样本多媒体属性信息输入预设注意力模型，得到每个样本数据对应的样本注意力头输出的第一样本预测信息；

第一训练单元，被配置为执行基于第一样本预测信息和标签信息，对预设注意力模型进行训练，得到初始注意力模型；

第二样本预测信息获取单元，被配置为执行在第二时间段内，将每个样本数据的样本行为序列信息、样本对象关联属性信息和样本多媒体属性信息输入初始注意力模型，得到初始注意力模型中多个注意力头输出的第二样本预测信息；

第二训练单元，被配置为执行基于第二样本预测信息和标签信息，对初始注意力模型进行训练，得到多头注意力模型。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图12是根据一示例性实施例示出的一种用于多媒体资源的推荐的电子设备的框图，该电子设备可以是终端，其内部结构图可以如图12所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多媒体资源的推荐的方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该电子设备的输入装置可以是显示屏上覆盖的触摸层，也可以是电子设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图12中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

图13是根据一示例性实施例示出的一种用于多媒体资源的推荐的电子设备的框图，该电子设备可以是服务器，其内部结构图可以如图13所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多媒体资源的推荐的方法。

本领域技术人员可以理解，图13中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在示例性实施例中，还提供了一种电子设备，包括：处理器；用于存储该处理器可执行指令的存储器；其中，该处理器被配置为执行该指令，以实现如本公开实施例中的多媒体资源的推荐方法。

在示例性实施例中，还提供了一种计算机可读存储介质，当该计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开实施例中的多媒体资源的推荐方法。计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行本公开实施例中的多媒体资源的推荐的方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种多媒体资源的推荐方法，其特征在于，包括：

基于所述目标注意力头输出的预测信息，向所述目标对象推荐所述待推荐多媒体资源；

其中，所述根据所述对象关联属性信息和/或所述多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头，包括：

获取预先设置的所述对象关联属性信息和/或所述多媒体属性信息，与所述至少一个注意力头的对应关系；

基于所述对应关系，确定与所述对象关联属性信息和/或所述多媒体属性信息对应的所述目标注意力头。

2.根据权利要求1所述的多媒体资源的推荐方法，其特征在于，所述对象关联属性信息包括所述目标对象的对象属性信息和所述目标对象触发所述多媒体推荐请求的上下文属性信息；所述根据所述对象关联属性信息和/或所述多媒体属性信息，从多头注意力模型的多个注意力头中确定至少一个注意力头作为目标注意力头步骤包括：

基于所述目标属性组合，确定所述目标注意力头。

3.根据权利要求2所述的多媒体资源的推荐方法，其特征在于，所述基于所述目标属性组合，确定所述目标注意力头步骤包括：

对所述目标属性组合进行编码处理，得到编码信息；

将所述特征信息映射到预设范围内，得到目标特征值；

基于所述多个特征值范围与注意力头的对应关系，从所述多个注意力头中确定与所述目标特征值对应的至少一个注意力头作为所述目标注意力头。

4.根据权利要求2所述的多媒体资源的推荐方法，其特征在于，所述基于所述目标属性组合，确定所述目标注意力头步骤包括：

获取所述目标属性组合下对应的多媒体资源的数量信息；

5.根据权利要求2所述的多媒体资源的推荐方法，其特征在于，所述基于所述目标属性组合，确定所述目标注意力头步骤包括：

获取属性组合与注意力头的对应关系；

6.根据权利要求1-5任一项所述的多媒体资源的推荐方法，其特征在于，所述基于所述目标注意力头输出的预测信息，向所述目标对象推荐所述待推荐多媒体资源步骤包括：

7.根据权利要求1-5任一项所述的多媒体资源的推荐方法，其特征在于，所述基于所述目标注意力头输出的预测信息，向所述目标对象推荐所述待推荐多媒体资源步骤包括：

8.根据权利要求7所述的多媒体资源的推荐方法，其特征在于，所述方法还包括：

9.根据权利要求8所述的多媒体资源的推荐方法，其特征在于，所述基于所述样本行为序列信息、所述样本对象关联属性信息和所述样本多媒体属性信息，训练预设注意力模型，得到所述多头注意力模型步骤包括：

10.一种多媒体资源的推荐装置，其特征在于，包括：

属性与行为信息获取模块，被配置为执行接收到多媒体推荐请求，获取属性信息以及目标对象的历史行为序列信息；所述属性信息包括所述目标对象的对象关联属性信息和待推荐多媒体资源的多媒体属性信息，所述历史行为序列信息为所述目标对象执行过预设行为的多媒体资源的多媒体属性序列；所述目标对象为所述多媒体推荐请求中目标对象标识对应的对象；

推荐模块，被配置为执行基于所述目标注意力头输出的预测信息，向所述目标对象推荐所述待推荐多媒体资源；

其中，所述目标注意力头确定模块，还被配置为执行获取预先设置的所述对象关联属性信息和/或所述多媒体属性信息，与所述至少一个注意力头的对应关系；并基于所述对应关系，确定与所述对象关联属性信息和/或所述多媒体属性信息对应的所述目标注意力头。

11.根据权利要求10所述的多媒体资源的推荐装置，其特征在于，所述对象关联属性信息包括所述目标对象的对象属性信息和所述目标对象触发所述多媒体推荐请求的上下文属性信息；所述目标注意力头确定模块包括：

12.根据权利要求11所述的多媒体资源的推荐装置，其特征在于，所述目标注意力头确定单元包括：

13.根据权利要求11所述的多媒体资源的推荐装置，其特征在于，所述目标注意力头确定单元包括：

14.根据权利要求11所述的多媒体资源的推荐装置，其特征在于，所述目标注意力头确定单元包括：

15.根据权利要求10-14任一项所述的多媒体资源的推荐装置，其特征在于，所述推荐模块包括：

16.根据权利要求10-14任一项所述的多媒体资源的推荐装置，其特征在于，所述推荐模块包括：

17.根据权利要求16所述的多媒体资源的推荐装置，其特征在于，所述装置还包括：

18.根据权利要求17所述的多媒体资源的推荐装置，其特征在于，所述训练模块包括：

样本注意力头确定单元，被配置为执行根据每个样本数据的所述样本对象关联属性信息和/或所述样本多媒体属性信息，确定每个样本数据对应的样本注意力头，所述样本注意力头为所述预设注意力模型中多个注意力头中的至少一个；

第一训练模单元，被配置为执行基于所述第一样本预测信息和所述标签信息，对所述预设注意力模型进行训练，得到初始注意力模型；

19.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至9中任一项所述的多媒体资源的推荐方法。

20.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至9中任一项所述的多媒体资源的推荐方法。