CN113935388A

CN113935388A - 匹配模型训练方法、装置、电子设备及存储介质

Info

Publication number: CN113935388A
Application number: CN202010603276.4A
Authority: CN
Inventors: 白明
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-06-29
Filing date: 2020-06-29
Publication date: 2022-01-14

Abstract

本公开是关于一种匹配模型训练方法、装置、电子设备及存储介质，属于互联网技术领域。方法包括：获取多个样本用户属性信息和多个样本数据属性信息，根据每个样本用户属性信息中多个用户维度的信息项和每个样本数据属性信息中多个数据维度的信息项进行融合处理，得到每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度，根据每个样本用户属性信息、每个样本数据属性信息及对应的样本匹配度，训练匹配模型。样本匹配度能够量化样本用户与样本多媒体数据的相关性，准确客观，根据样本用户属性信息、样本数据属性信息及样本匹配度训练的匹配模型准确性高，具备根据用户属性信息与数据属性信息准确获取用户与多媒体数据的匹配度的能力。

Description

匹配模型训练方法、装置、电子设备及存储介质

技术领域

本公开涉及互联网技术领域，尤其涉及一种匹配模型训练方法、装置、电子设备及存储介质。

背景技术

随着互联网技术的快速发展，互联网中出现了大量的视频，丰富了用户的日常生活，受到了广大用户的欢迎。任一用户可以在互联网中发布视频，也可以向任一用户推荐视频，供该用户观看。但是，如果用户对推荐的视频不感兴趣，容易对用户造成打扰。因此，如何为用户推荐匹配的视频至关重要。

发明内容

本公开提供了一种匹配模型训练方法、装置、电子设备及存储介质，能够提高多媒体数据与用户之间的匹配程度，提升推荐效果，不容易对用户造成打扰。

根据本公开实施例的第一方面，提供一种匹配模型训练方法，所述方法包括：

获取多个样本用户属性信息，每个样本用户属性信息包括多个用户维度的信息项，每个用户维度的信息项用于从对应的用户维度描述对应的样本用户；

获取多个样本数据属性信息，每个样本数据属性信息包括多个数据维度的信息项，每个数据维度的信息项用于从对应的数据维度描述对应的样本多媒体数据；

根据所述每个样本用户属性信息中所述多个用户维度的信息项和所述每个样本数据属性信息中所述多个数据维度的信息项进行融合处理，得到所述每个样本用户属性信息和所述每个样本数据属性信息对应的样本匹配度；

根据所述每个样本用户属性信息、所述每个样本数据属性信息以及所述每个样本用户属性信息和所述每个样本数据属性信息对应的样本匹配度，训练匹配模型。

在一种可能实现方式中，所述根据所述每个样本用户属性信息中所述多个用户维度的信息项和所述每个样本数据属性信息中所述多个数据维度的信息项进行融合处理，得到所述每个样本用户属性信息和所述每个样本数据属性信息对应的样本匹配度，包括：

获取关系数据，所述关系数据包括所述多个用户维度的权重和所述多个数据维度的权重，所述关系数据用于指示匹配度与所述多个用户维度的信息项、所述多个数据维度的信息项、所述多个用户维度的权重和所述多个数据维度的权重之间的关系；

根据所述样本用户属性信息中所述多个用户维度的信息项、所述样本数据属性信息中所述多个数据维度的信息项以及所述关系数据，获取所述样本匹配度。

在另一种可能实现方式中，所述根据所述每个样本用户属性信息、所述每个样本数据属性信息以及所述每个样本用户属性信息和所述每个样本数据属性信息对应的样本匹配度，训练匹配模型之后，所述方法还包括：

获取目标用户属性信息，所述目标用户属性信息包括所述多个用户维度的信息项；

获取各个多媒体数据的数据属性信息，每个数据属性信息包括所述多个数据维度的信息项；

根据所述各个多媒体数据的数据属性信息和所述目标用户属性信息，调用所述匹配模型获取所述各个多媒体数据与目标用户之间的匹配度；

根据多个多媒体数据的匹配度，为所述目标用户推荐多媒体数据。

在另一种可能实现方式中，所述匹配模型包括至少一个特征提取层和至少一个融合层，所述根据所述各个多媒体数据的数据属性信息和所述目标用户属性信息，调用所述匹配模型获取所述各个多媒体数据与目标用户之间的匹配度，包括：

调用所述至少一个特征提取层对所述目标用户属性信息进行特征提取，得到目标用户特征；

调用所述至少一个特征提取层对任一多媒体数据的数据属性信息进行特征提取，得到所述任一多媒体数据的数据属性信息对应的数据特征；

调用所述至少一个融合层对所述目标用户特征和所述数据特征进行融合处理，得到所述任一多媒体数据与所述目标用户之间的匹配度。

在另一种可能实现方式中，所述目标用户属性信息至少包括目标用户标识、用户静态信息、用户统计信息和用户行为信息；所述调用所述至少一个特征提取层对所述目标用户属性信息进行特征提取，得到目标用户特征，包括：

调用所述至少一个特征提取层对所述用户行为信息进行特征提取，得到用户行为特征；

将所述目标用户标识、所述用户静态信息、所述用户统计信息和所述用户行为特征进行组合，得到所述目标用户特征。

在另一种可能实现方式中，所述任一多媒体数据的数据属性信息至少包括数据标识、数据静态信息、数据统计信息和数据内容信息；所述调用所述至少一个特征提取层对任一多媒体数据的数据属性信息进行特征提取，得到所述任一多媒体数据的数据属性信息对应的数据特征，包括：

调用所述至少一个特征提取层对所述任一多媒体数据的数据内容信息进行特征提取，得到所述任一多媒体数据的数据内容特征；

将所述数据标识、所述数据静态信息、所述数据统计信息和所述数据内容特征进行组合，得到所述任一多媒体数据的数据属性信息对应的数据特征。

在另一种可能实现方式中，所述调用所述至少一个融合层对所述目标用户特征和所述数据特征进行融合处理，得到所述任一多媒体数据与所述目标用户之间的匹配度，包括：

获取上下文信息或概率信息中的至少一种，所述上下文信息包括当前环境信息、历史推荐数据信息或者历史观看数据信息中的至少一项，所述概率信息包括对所述任一多媒体数据执行至少一种预设操作的概率；

调用所述至少一个融合层对所述上下文信息或所述概率信息中的至少一种、所述目标用户特征和所述数据特征进行融合处理，得到所述任一多媒体数据与所述目标用户之间的匹配度。

在另一种可能实现方式中，所述根据多个多媒体数据的匹配度，为所述目标用户推荐多媒体数据，包括：

按照所述匹配度从大到小的顺序，从所述多个多媒体数据中，选取至少一个多媒体数据；

为所述目标用户推荐选取的多媒体数据。

从所述多个多媒体数据中，选取所述匹配度大于预设阈值的至少一个多媒体数据；

为所述目标用户推荐选取的多媒体数据。

根据本公开实施例的第二方面，提供一种匹配模型训练装置，所述装置包括：

样本用户信息获取单元，被配置为执行获取多个样本用户属性信息，每个样本用户属性信息包括多个用户维度的信息项，每个用户维度的信息项用于从对应的用户维度描述对应的样本用户；

样本数据信息获取单元，被配置为执行获取多个样本数据属性信息，每个样本数据属性信息包括多个数据维度的信息项，每个数据维度的信息项用于从对应的数据维度描述对应的样本多媒体数据；

融合单元，被配置为执行根据所述每个样本用户属性信息中所述多个用户维度的信息项和所述每个样本数据属性信息中所述多个数据维度的信息项进行融合处理，得到所述每个样本用户属性信息和所述每个样本数据属性信息对应的样本匹配度；

训练单元，被配置为执行根据所述每个样本用户属性信息、所述每个样本数据属性信息以及所述每个样本用户属性信息和所述每个样本数据属性信息对应的样本匹配度，训练匹配模型。

在一种可能实现方式中，所述融合单元，包括：

关系数据获取子单元，被配置为执行获取关系数据，所述关系数据包括所述多个用户维度的权重和所述多个数据维度的权重，所述关系数据用于指示匹配度与所述多个用户维度的信息项、所述多个数据维度的信息项、所述多个用户维度的权重和所述多个数据维度的权重之间的关系；

样本匹配度获取子单元，被配置为执行根据所述样本用户属性信息中所述多个用户维度的信息项、所述样本数据属性信息中所述多个数据维度的信息项以及所述关系数据，获取所述样本匹配度。

在另一种可能实现方式中，所述装置还包括：

目标用户信息获取单元，被配置为执行获取目标用户属性信息，所述目标用户属性信息包括所述多个用户维度的信息项；

数据获取单元，被配置为执行获取所述各个多媒体数据的数据属性信息，每个数据属性信息包括所述多个数据维度的信息项；

调用单元，被配置为执行根据各个多媒体数据的数据属性信息和所述目标用户属性信息，调用所述匹配模型获取所述各个多媒体数据与目标用户之间的匹配度；

推荐单元，被配置为执行根据多个多媒体数据的匹配度，为所述目标用户推荐多媒体数据。

在另一种可能实现方式中，所述匹配模型包括至少一个特征提取层和至少一个融合层，所述调用单元，包括：

用户特征提取子单元，被配置为执行调用所述至少一个特征提取层对所述目标用户属性信息进行特征提取，得到目标用户特征；

数据特征提取子单元，被配置为执行调用所述至少一个特征提取层对任一多媒体数据的数据属性信息进行特征提取，得到所述任一多媒体数据的数据属性信息对应的数据特征；

融合子单元，被配置为执行调用所述至少一个融合层对所述目标用户特征和所述数据特征进行融合处理，得到所述任一多媒体数据与所述目标用户之间的匹配度。

在另一种可能实现方式中，所述目标用户属性信息至少包括目标用户标识、用户静态信息、用户统计信息和用户行为信息；

所述用户特征提取子单元，还被配置为执行调用所述至少一个特征提取层对所述用户行为信息进行特征提取，得到用户行为特征；

所述用户特征提取子单元，还被配置为执行将所述目标用户标识、所述用户静态信息、所述用户统计信息和所述用户行为特征进行组合，得到所述目标用户特征。

在另一种可能实现方式中，所述任一多媒体数据的数据属性信息至少包括数据标识、数据静态信息、数据统计信息和数据内容信息；

所述数据特征提取子单元，还被配置为执行调用所述至少一个特征提取层对所述任一多媒体数据的数据内容信息进行特征提取，得到所述任一多媒体数据的数据内容特征；

所述数据特征提取子单元，还被配置为执行将所述数据标识、所述数据静态信息、所述数据统计信息和所述数据内容特征进行组合，得到所述任一多媒体数据的数据属性信息对应的数据特征。

在另一种可能实现方式中，所述融合子单元，还被配置为执行获取上下文信息或概率信息中的至少一种，所述上下文信息包括当前环境信息、历史推荐数据信息或者历史观看数据信息中的至少一项，所述概率信息包括对所述任一多媒体数据执行至少一种预设操作的概率；

所述融合子单元，还被配置为执行调用所述至少一个融合层对所述上下文信息或所述概率信息中的至少一种、所述目标用户特征和所述数据特征进行融合处理，得到所述任一多媒体数据与所述目标用户之间的匹配度。

在另一种可能实现方式中，所述推荐单元，包括：

选取子单元，被配置为执行按照所述匹配度从大到小的顺序，从所述多个多媒体数据中，选取至少一个多媒体数据；

推荐子单元，被配置为执行为所述目标用户推荐选取的多媒体数据。

在另一种可能实现方式中，所述推荐单元，包括：

选取子单元，被配置为执行从所述多个多媒体数据中，选取所述匹配度大于预设阈值的至少一个多媒体数据；

根据本公开实施例的第三方面，提供了一种用于训练匹配模型的电子设备，所述电子设备包括：

一个或多个处理器；

用于存储所述一个或多个处理器可执行命令的易失性或非易失性存储器；

其中，所述一个或多个处理器被配置为执行第一方面所述的匹配模型训练方法。

根据本公开实施例的第四方面，提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行第一方面所述的匹配模型训练方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，当所述计算机程序产品中的指令由电子设备的处理器执行时，使得电子设备能够执行第一方面所述的匹配模型训练方法。

本公开实施例提供的匹配模型训练方法、装置、电子设备及存储介质，样本匹配度是综合考虑多个用户维度和多个数据维度后得到的，能够将样本用户与样本多媒体数据之间的相关性进行量化，得到的样本匹配度准确客观，则根据样本用户属性信息、样本数据属性信息以及样本匹配度训练匹配模型，使得匹配模型具备根据用户属性信息与数据属性信息准确获取用户与多媒体数据的匹配度的能力，有效提升了匹配模型的准确率。后续可以调用该匹配模型来为用户推荐多媒体数据，也能够提升推荐准确率。

并且，本公开综合考虑多个用户维度中的信息项和多个数据维度上的信息项，引入了个性化综合度量衡机制，更具有针对性，可以实现多媒体数据的个性化推荐。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种匹配模型训练方法的流程图。

图2是根据一示例性实施例示出的另一种匹配模型训练方法的流程图。

图3是根据一示例性实施例示出的一种匹配模型的结构示意图。

图4是根据一示例性实施例示出的一种电子设备的结构示意图。

图5是根据一示例性实施例示出的一种多媒体数据推荐方法的流程图。

图6是根据一示例性实施例示出的一种匹配模型训练装置的结构示意图。

图7是根据一示例性实施例示出的另一种匹配模型训练装置的结构示意图。

图8是根据一示例性实施例示出的一种终端的框图。

图9是根据一示例性实施例示出的一种服务器的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图说明中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)可以为经用户授权或者经过各方充分授权的信息。

图1是根据一示例性实施例提供的一种匹配模型训练方法的示意图，参见图1，包括以下步骤：

101、获取多个样本用户属性信息，每个样本用户属性信息包括多个用户维度的信息项，每个用户维度的信息项用于从对应的用户维度描述对应的样本用户。

102、获取多个样本数据属性信息，每个样本数据属性信息包括多个数据维度的信息项，每个数据维度的信息项用于从对应的数据维度描述对应的样本多媒体数据。

103、根据每个样本用户属性信息中多个用户维度的信息项和每个样本数据属性信息中多个数据维度的信息项进行融合处理，得到每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度。

104、根据每个样本用户属性信息、每个样本数据属性信息以及每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度，训练匹配模型。

本公开实施例提供的方法，样本匹配度是综合考虑多个用户维度和多个数据维度后得到的，能够将样本用户与样本多媒体数据之间的相关性进行量化，得到的样本匹配度准确客观，则根据样本用户属性信息、样本数据属性信息以及样本匹配度训练匹配模型，使得匹配模型具备根据用户属性信息与数据属性信息准确获取用户与多媒体数据的匹配度的能力，有效提升了匹配模型的准确率。后续可以调用该匹配模型来为用户推荐多媒体数据，也能够提升推荐准确率。

并且，本公开综合考虑多个用户维度中的信息项和多个数据维度上的信息项，引入了个性化综合度量衡机制，更具有针对性，实现了多媒体数据的个性化推荐，并达到了用户的消费体验、社交体验、生产体验、直播体验以及商业化体验等多种体验之间的平衡。其中，个性化不仅体现在用户维度，也体现在数据维度。

在一种可能实现方式中，根据每个样本用户属性信息中多个用户维度的信息项和每个样本数据属性信息中多个数据维度的信息项进行融合处理，得到每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度，包括：

获取关系数据，关系数据包括多个用户维度的权重和多个数据维度的权重，关系数据用于指示匹配度与多个用户维度的信息项、多个数据维度的信息项、多个用户维度的权重和多个数据维度的权重之间的关系；

根据样本用户属性信息中多个用户维度的信息项、样本数据属性信息中多个数据维度的信息项以及关系数据，获取样本匹配度。

在另一种可能实现方式中，根据每个样本用户属性信息、每个样本数据属性信息以及每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度，训练匹配模型之后，方法还包括：

获取目标用户属性信息，目标用户属性信息包括多个用户维度的信息项；

获取各个多媒体数据的数据属性信息，每个数据属性信息包括多个数据维度的信息项；

根据各个多媒体数据的数据属性信息和目标用户属性信息，调用匹配模型获取各个多媒体数据与目标用户之间的匹配度；

根据多个多媒体数据的匹配度，为目标用户推荐多媒体数据。

在另一种可能实现方式中，匹配模型包括至少一个特征提取层和至少一个融合层，根据各个多媒体数据的数据属性信息和目标用户属性信息，调用匹配模型获取各个多媒体数据与目标用户之间的匹配度，包括：

调用至少一个特征提取层对目标用户属性信息进行特征提取，得到目标用户特征；

调用至少一个特征提取层对任一多媒体数据的数据属性信息进行特征提取，得到任一多媒体数据的数据属性信息对应的数据特征；

调用至少一个融合层对目标用户特征和数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度。

在另一种可能实现方式中，目标用户属性信息至少包括目标用户标识、用户静态信息、用户统计信息和用户行为信息；调用至少一个特征提取层对目标用户属性信息进行特征提取，得到目标用户特征，包括：

调用至少一个特征提取层对用户行为信息进行特征提取，得到用户行为特征；

将目标用户标识、用户静态信息、用户统计信息和用户行为特征进行组合，得到目标用户特征。

在另一种可能实现方式中，任一多媒体数据的数据属性信息至少包括数据标识、数据静态信息、数据统计信息和数据内容信息；调用至少一个特征提取层对任一多媒体数据的数据属性信息进行特征提取，得到任一多媒体数据的数据属性信息对应的数据特征，包括：

调用至少一个特征提取层对任一多媒体数据的数据内容信息进行特征提取，得到任一多媒体数据的数据内容特征；

将数据标识、数据静态信息、数据统计信息和数据内容特征进行组合，得到任一多媒体数据的数据属性信息对应的数据特征。

在另一种可能实现方式中，调用至少一个融合层对目标用户特征和数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度，包括：

获取上下文信息或概率信息中的至少一种，上下文信息包括当前环境信息、历史推荐数据信息或者历史观看数据信息中的至少一项，概率信息包括对任一多媒体数据执行至少一种预设操作的概率；

调用至少一个融合层对上下文信息或概率信息中的至少一种、目标用户特征和数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度。

在另一种可能实现方式中，根据多个多媒体数据的匹配度，为目标用户推荐多媒体数据，包括：

按照匹配度从大到小的顺序，从多个多媒体数据中，选取至少一个多媒体数据；

为目标用户推荐选取的多媒体数据。

从多个多媒体数据中，选取匹配度大于预设阈值的至少一个多媒体数据；

为目标用户推荐选取的多媒体数据。

图2是根据一示例性实施例示出的一种匹配模型训练方法的流程图，应用于电子设备中，参见图2，包括以下步骤：

201、获取多个样本用户属性信息。

本公开实施例提供了一种匹配模型训练方法，能够根据样本信息进行训练，得到匹配模型，通过调用该匹配模型为用户推荐多媒体数据，可以提高推荐给用户的多媒体数据与用户之间的匹配程度，提升推荐准确率。

本公开实施例提供的匹配模型训练方法可以应用于电子设备中，电子设备包括终端，还可以包括服务器，终端可以为手机、电脑、平板电脑等，服务器可以是一台服务器，或者由若干台服务器组成的服务器集群，或者是一个云计算服务中心。

电子设备可以直接显示多媒体数据，也可以基于用户标识进行登录，基于已登录的用户标识显示多媒体数据。基于用户标识进行登录的情况下，当前显示的多媒体数据即为该用户标识对应的用户查看的多媒体数据。其中，用户标识用于确定唯一的用户，可以为昵称、账号、手机号码或其他可以确定唯一用户的标识。

关于多媒体数据的格式，多媒体数据可以为静态图片、动态图片、音频或视频等。从多媒体数据的内容来说，该多媒体数据可以为电影、电视剧等影视作品、美食类视频、美妆类视频、旅游类食品、搞笑视频等。另外，该多媒体数据还可以为静态图片、动态图片或视频中的一种或多种组合而成的短视频。

从多媒体数据的来源来说，若该电子设备为终端，则多媒体数据可以由终端拍摄得到，或者由终端从互联网中下载，或者由其他设备发送至终端，该其他设备可以为终端或服务器。

其中，服务器中的多媒体数据是一个或多个终端上传的，或者由多媒体数据的发布者提供给维护人员，由维护人员存储至服务器，或者由其他设备发送至服务器。终端向服务器上传多媒体数据时，可以实时发送，也可以每隔第一预设时长发送一次，可以主动在获取到多媒体数据时发送，也可以是在接收到服务器发送的获取请求时发送，在此不做具体限定。

为了提高推荐给用户的多媒体数据与用户之间的匹配程度，本公开实施例通过训练得到匹配模型，后续可以根据训练后的匹配模型，获取用于表示多媒体数据与用户之间的匹配程度的匹配度，然后根据匹配度为用户推荐多媒体数据。其中，该匹配模型可以采用深度学习模型，也可以采用其他学习模型，本公开实施例对此不作具体限定。

考虑到用户在多媒体数据广泛普及的大环境下，扮演着多种角色，至少包括：作为数据消费者，用户可以查看其他用户发布的多媒体数据；作为数据生产者，用户可以制作多媒体数据，将制作的多媒体数据上传至互联网中；作为社交者，用户可以与其他用户进行交互，对其他用户或其他用户上传的多媒体数据执行相关操作；作为直播参与者，用户可以基于社交平台进行直播，上传直播形式的多媒体数据。因此，用户属性信息也包括多个用户维度的信息项，分别从对应维度描述用户。

本公开实施例中，电子设备首先获取多个样本用户属性信息，每个样本用户属性信息包括多个用户维度的信息项，每个用户维度的信息项用于从对应的用户维度描述对应的样本用户。

在一种可能实现方式中，多个用户维度包括以下至少两项：

用于表示用户属性的至少一个维度；

用于表示页面类型的至少一个维度；

用于表示数据上传数量的至少一个维度；

用于表示用户交互行为的至少一个维度。

(1)用于表示用户属性的至少一个维度，至少包括用户标识维度、性别维度、年龄维度和地域维度，也可以包括用于表示用户喜好的用户标签维度和用于表示用户活跃程度的活跃维度，该活跃维度的信息项可以为高活跃度或低活跃度，高活跃度表示对应用户的活跃度较高，低活跃度表示对应用户的活跃度较低。另外，用于表示用户属性的至少一个维度还可以包括除上述多个维度以外的其他用于表示用户属性的维度，在此不做具体限定。

(2)用于表示页面类型的至少一个维度，至少包括登录目标用户标识的终端当前显示的页面所属的页面类型维度，还可以包括用于表示页面类型的其他维度，页面所属的类型维度的信息项可以为关注用户的关注页、表示处于同一城市的同城页、个人发布多媒体数据的个人页、用于对用户进行详细描述的详情页以及发现页等。

其中，电子设备可以基于登录的用户标识对其他用户标识执行添加关注操作，对于任一用户标识，通过执行添加关注操作，可以确定当前登录的用户标识的关注用户标识。对于任两个用户标识，若该任两个用户标识互为对方的关注用户标识，则表示该两个用户标识之间的关联关系为双关关系，二者互为对方的双关用户标识；若该任两个用户标识中，仅有一方是另一方的关注用户标识，则表示该两个用户标识之间的关联关系是单关关系，被关注的一方为关注方的单关用户标识。

(3)用于表示数据上传数量的至少一个维度，至少包括用于表示用户标识上传的多媒体数据数量的数量维度。

(4)电子设备可以基于登录的用户标识对其他用户标识上传的多媒体数据进行点赞操作、评论操作、分享操作、收藏操作、下载操作等，还可以向其他用户标识发送私信、执行添加关注操作等。

用于表示用户交互行为的至少一个维度，是通过对用户标识的历史交互行为进行统计后得到的，包括点赞维度、评论维度、分享维度、收藏维度、上传维度、下载维度、私信维度、关注维度中的一个或多个。

其中，点赞维度的信息项包括点赞次数、点赞时间和被点赞的多媒体数据中的一种或多种；评论维度的信息项包括评论次数、评论时间、在评论区中的时长、评论内容信息和被评论的多媒体数据中的一种或多种；分享维度的信息项包括分享次数、分享时间、分享方式、分享对象和被分享的多媒体数据中的一种或多种；收藏维度的信息项包括收藏数量、收藏时间和被收藏的多媒体数据中的一种或多种；上传维度的信息项包括上传时间、上传数量和上传的多媒体数据中的一种或多种；下载维度的信息项包括下载次数、下载时间、存储位置和被下载的多媒体数据中的一种或多种；私信维度的信息项包括私信内容、私信时间和私信对象中的一种或多种；关注维度的信息项包括关注用户数量、关注时间和关注用户类型中的一种或多种，该关注用户类型可以为单关用户标识或双关用户标识。

上述多项用户维度中的至少两项用户维度可以相互组合，共同构成本公开实施例中的多个用户维度。

例如，关注维度和上传维度进行组合，获取双关用户标识数量为0-10的用户标识上传多媒体数据的数量、双关用户标识数量为11-40的用户标识上传多媒体数据的数量、双关用户标识数量为41-90的用户标识上传多媒体数据的数量以及双关用户标识数量为90以上的用户标识上传多媒体数据的数量。

在一种可能实现方式中，电子设备首先获取历史操作记录，根据该历史操作记录获取样本用户属性信息。由于样本用户属性信息是根据历史操作记录获取的，因此该样本用户属性信息具有足够的真实性，更符合用户的需求，后续基于该样本用户属性信息训练得到的匹配模型，准确性也更高。

202、获取多个样本数据属性信息。

电子设备获取多个样本数据属性信息，每个样本数据属性信息包括多个数据维度的信息项，每个数据维度的信息项用于从对应的数据维度描述对应的样本多媒体数据。

在一种可能实现方式中，多个数据维度包括以下至少两项：

用于表示数据属性的至少一个维度；

用于表示数据交互行为的至少一个维度；

用于表示数据的关联用户属性的至少一个维度。

(1)用于表示数据属性的至少一个维度，至少包括数据时长维度、上传作者维度、上传时间维度、所属类别维度和数据类型维度中一种或多种，还可以包括用于表示数据属性的其他维度。其中，所属类别维度的信息项可以为美食类、美妆类、旅游类、教育类、娱乐类等，数据类型维度的信息项可以为直播类型、录播类型、推广类型或非推广类型等。

(2)用于表示数据交互行为的至少一个维度，是通过统计基于用户标识对多媒体数据执行过的如历史操作等行为得到的，包括点赞维度、评论维度、分享维度、收藏维度、下载维度中的一个或多个，还可以包括用于描述数据交互行为的其他维度。

其中，点赞维度的信息项包括点赞数量、点赞时间和执行点赞操作的用户标识中的一种或多种；评论维度的信息项包括评论数量、评论时间、评论内容信息和发布评论的用户标识中的一种或多种；分享维度的信息项包括分享数量、分享时间、分享方式、执行分享操作的用户标识和分享对象中的一种或多种；收藏维度的信息项包括收藏数量、收藏时间和执行收藏操作的用户标识中的一种或多种；下载维度的信息项包括下载次数、下载时间和执行下载操作的用户标识中的一种或多种。

(3)用于表示数据的关联用户属性的至少一个维度，至少包括对应关联用户标识的用户标识维度、性别维度、年龄维度和地域维度，也可以包括用于表示该关联用户标识所属类别的用户标签维度和用于表示用户活跃程度的活跃维度，还可以包括用于表示用户属性的其他维度。

其中，数据的关联用户属性用于描述与多媒体数据具有关联关系的用户标识的用户属性，与多媒体数据具有关联关系的用户标识包括：对多媒体数据执行过点赞操作、评论操作、分享操作、收藏操作、下载操作等任一操作的用户标识。

在一种可能实现方式中，电子设备首先获取历史操作记录，根据该历史操作记录获取样本数据属性信息。由于样本数据属性信息是根据历史操作记录获取的，因此该样本数据属性信息具有足够的真实性，更符合用户的需求，后续基于该样本数据属性信息训练得到的匹配模型，准确性也更高。

203、根据每个样本用户属性信息中多个用户维度的信息项和每个样本数据属性信息中多个数据维度的信息项进行融合处理，得到每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度。

在一种可能实现方式中，关于获取样本匹配度的过程，包括：电子设备获取关系数据，根据样本用户属性信息中多个用户维度的信息项、样本数据属性信息中多个数据维度的信息项以及关系数据，获取样本匹配度。

其中，关系数据包括多个用户维度的权重和多个数据维度的权重，关系数据用于指示匹配度与多个用户维度的信息项、多个数据维度的信息项、多个用户维度的权重和多个数据维度的权重之间的关系。

该关系数据可以以描述语句的形式表示，也可以以函数的形式表示，或者以其他形式表示。

另外，该多个用户维度的权重和该多个数据维度的权重可以是预先设置的，也可以是通过其他方式确定的，本公开实施例对此不作具体限定。每个用户维度或数据维度的权重与该维度对用户的影响程度呈正相关关系，权重越大，表示该维度对用户的影响越大，权重越小，表示该维度对用户的影响越小。

关于获取匹配度的具体过程，在一种可能实现方式中，电子设备首先对样本用户属性信息中多个用户维度的信息项按照每个用户维度的权重进行加权求和，得到第一数值，然后对任一样本数据属性信息中多个数据维度按照每个数据维度的权重进行加权求和，得到第二数值，将该第一数值和该第二数值的和确定为该样本用户属性信息和该任一样本数据属性信息对应的匹配度。

根据权重获取多媒体数据与用户之间的匹配度的方式，更符合用户的需求，通过设置不同用户维度的权重和不同数据维度的权重，可以有针对性地提高或降低不同维度对多媒体数据与用户之间的匹配度的影响力，基于该方式获取到的样本匹配度更加准确，后续根据样本用户属性信息、样本数据属性信息和对应的该样本匹配度进行训练，得到的匹配模型更加准确。

在一种可能实现方式中，多个用户维度和多个数据维度也可以相互组合，根据对应维度的权重进行加权求和，共同构成关系数据。

例如，关系数据为：匹配度＝低活发现页视频时长+2.91×低活关注页单关视频时长+7.10×低活关注页双关视频时长+0.17×低活个人页视频时长+4.84×低活同城页视频时长+2.13×低活其他页视频时长+0.99×1.5×低活关注页直播时长+0.58×1.5×低活个人页直播时长+0.42×1.5×低活同城页直播时长+2.16×1.5×低活详情页直播时长+0.93×1.5×低活其他页直播时长+33.43×低活观看发现页人数+35.59×低活观看关注页人数+25.75×低活观看同城页人数+0.64×高活发现页视频时长+2.66×高活关注页单关视频时长+13.85×高活关注页双关视频时长+0.14×高活个人页视频时长+2.67×高活同城页视频时长+0.61×高活其他页视频时长+0.43×1.5×高活关注页直播时长+0.89×1.5×高活个人页直播时长+0.16×1.5×高活同城页直播时长+3.01×1.5×高活详情页直播时长+0.12×1.5×高活其他页直播时长+151×短视频上传数量+27×上传视频作者数量+43×双关用户标识数量为0-10的作者短视频上传数量+68×双关用户标识数量为11-40的作者短视频上传数量+115×双关用户标识数量为41-90的作者短视频上传数量+255×双关用户标识数量为90以上的作者短视频上传数量+18.3×流量+关注用户标识数量综合分+0.67×低活评论区时长+2.23×高活评论区时长+470×pymk(People You May Know，可能认识的人)双关用户标识数量+0.07×视频点赞次数/视频被点赞次数+0.02×直播点赞次数+1.35×视频评论次数/被评论次数+0.34×直播评论次数+2.94×收到私信数量+72×分享次数+55×客态水印下载次数+40×主态水印下载次数+0.4×发现页视频时长+0.5×同城页视频时长+2.5×非电商直播时长+0.35×电商直播时长+0.6×发现页电商短视频时长-0.08×ARRR-0.00005×CPU(central processing unit，中央处理器)利用率×实时每秒查询率。

其中，例如“低活发现页视频时长”是指通过统计处理获取到的所有活跃维度的信息项为低活跃度的用户在发现页观看视频的平均时长；“低活关注页单关视频时长”是指通过统计处理获取到的所有活跃维度的信息项为低活跃度的用户在关注页中观看单关用户标识上传的视频的平均时长；“低活观看同城页人数”是指通过统计处理获取到的所有活跃维度为低活跃度的用户观看同城页的用户数量；“双关用户标识数量为0-10的作者短视频上传数量”是指通过统计处理获取到的双关用户标识数量为1-10之间的作者上传短视频的数量；“低活评论区时长”是指通过统计处理获取到的所有活跃维度为低活跃度的用户在评论区所处的时长，在评论区中可以输入评论内容，也可以浏览其他用户标识的评论内容；“主态水印下载次数”是指通过统计处理获取到的包含上传作者添加的水印信息的视频被下载的次数；“客态水印下载次数”是指通过统计处理获取到的包含系统自动生成的水印信息的视频被下载的次数；“RRR”是用户举报率，根据用户举报数量和对应视频的实际曝光数量确定，“ARRR”是一种模型拟合多维度信息的指标，用于衡量用户的观看情况，每个视频都对应一个ARRR，ARRR是根据对应视频的低观感概率与曝光数量的乘积确定，与RRR相比，ARRR更加稳定，覆盖率也更高；“CPU利用率”是指为用户提供视频实时推荐服务时需要消耗的CPU的利用率；“实时每秒查询率”是指为用户提供视频实施推荐服务时服务器实时的每秒查询率。

上述过程仅是根据一个样本用户属性信息和一个样本数据属性信息获取对应的一个样本匹配度的过程，为了提高匹配模型的准确性，本公开实施例可以根据获取到的多个样本用户属性信息中任一样本用户属性信息、多个样本数据属性信息中的任一样本数据属性信息以及关系数据，得到该任一样本用户属性信息、该任一样本数据属性信息对应的样本匹配度，以每个样本用户属性信息、每个样本数据属性信息和对应的样本匹配度为一组样本信息，能够得到多组样本信息，后续可以根据该多组样本信息训练匹配模型。

对于任一组样本信息，该组样本信息包含的信息项越多，基于该组样本信息训练的匹配模型准确性越高，因此，在另一种可能实现方式中，为了进一步提升匹配模型的准确性，本公开实施例中电子设备还获取了样本上下文信息或样本概率信息中的至少一项，每组样本信息中除样本用户属性信息、样本数据属性信息和对应的样本匹配度以外，还包括样本上下文信息或样本概率信息中的至少一项。

其中，上下文信息包括当前环境信息、历史推荐数据信息或者历史观看数据信息中的至少一项，当前环境信息可以包括当前为正常时间或节假日、当前用户所处的位置、当前用于观看多媒体数据的终端的价格或其他用于描述当前使用环境的信息；概率信息包括对任一多媒体数据执行至少一种预设操作的概率，预设操作可以点击操作、下载操作、转发操作、点赞操作，还可以包括对多媒体数据执行的其他操作，本申请实施例对此不作具体限定。

在一种可能实现方式中，电子设备首先获取历史操作记录，根据该历史操作记录获取样本用户属性信息和样本数据属性信息，由于样本匹配度是根据对应的样本用户属性信息和样本数据属性信息获取的，而样本用户属性信息和样本数据属性信息是根据历史操作记录获取的，因此该样本匹配度的准确度更高，与实际情况更相符，后续基于该样本匹配度训练得到的匹配模型，准确性也更高。

204、根据每个样本用户属性信息、每个样本数据属性信息以及每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度，训练匹配模型。

获取到多个样本用户属性信息、多个样本数据属性信息以及每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度后，对于每个样本用户属性信息、每个样本数据属性信息以及对应的样本匹配度，电子设备以该样本用户属性信息和该样本数据属性信息作为输入，以该样本用户属性信息和该样本数据属性信息对应的样本匹配度作为输出，训练匹配模型。以每个样本用户属性信息、每个样本数据属性信息和对应的样本匹配度为一组样本信息，样本信息的数量越多，训练后得到的匹配模型准确性越高，因此，为了得到足够准确的匹配模型，可以在步骤201-203中获取足够多的数量的样本数据。

在一种可能实现方式中，电子设备还获取了样本上下文信息或样本概率信息中的至少一种作为样本信息，根据每个样本用户属性信息、每个样本数据属性信息以及每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度，训练匹配模型的过程，包括：以获取到的样本上下文信息或样本概率信息中的至少一种、每个样本用户属性信息、每个样本数据属性信息以及每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度作为输入，训练匹配模型。

根据步骤201-204，可以得到训练后的匹配模型，后续可以基于该匹配模型获取匹配度。

205、获取目标用户属性信息。

训练得到匹配模型后，还可以调用该匹配模型进行多媒体数据推荐。本公开实施例以目标用户为例，对为目标用户推荐多媒体数据的过程进行说明。因此，电子设备获取目标用户属性信息，该目标用户属性信息包括多个用户维度的信息项，每个用户维度的信息项用于从对应的用户维度描述目标用户。

获取目标用户属性信息的过程与上述步骤201中获取样本信息中的样本用户属性信息的过程类似，在此不再赘述。

206、获取各个多媒体数据的数据属性信息。

为了向目标用户推荐多媒体数据，电子设备获取了多个多媒体数据，该多个多媒体数据作为备选的多媒体数据，对于各个多媒体数据，获取该各个多媒体数据与目标用户之间的匹配程度，根据匹配程度为目标用户推荐多媒体数据。该各个多媒体数据的数据属性信息包括多个数据维度的信息项，每个数据维度的信息项用于从对应的数据维度描述对应的该各个多媒体数据。

获取各个多媒体数据的数据属性信息的过程与上述步骤202中获取样本数据属性信息的过程类似，在此不再赘述。

在实际情况中，由于用户数量众多，每个用户均可以上传多媒体数据，因此对于目标用户来说，可供选择的多媒体数据的数量非常庞大，而直接将数量庞大的多媒体数据都作为备选的多媒体数据，不仅计算量非常庞大，会造成系统资源的浪费，还会增加消耗时长，降低推荐效率。因此，电子设备获取备选的多媒体数据的过程至少包括以下情况：

(1)对多媒体数据进行一次筛选处理的情况：

在一种可能实现方式中，电子设备首先根据目标用户属性信息对海量的多媒体数据进行一次筛选处理，得到与目标用户标识具有关联关系的多个多媒体数据，然后再获取该筛选处理后得到的多个多媒体数据中各个多媒体数据的数据属性信息。

例如，电子设备获取到100000个多媒体数据后，根据目标用户属性信息，从该100000个多媒体数据中，筛选出与目标用户浏览过的多媒体数据类型相同的至少一个多媒体数据、上传作者的地域与目标用户的地域相同的至少一个多媒体数据，以及目标用户的关注用户上传的至少一个多媒体数据，得到10000个多媒体数据，获取该10000个多媒体数据中每个多媒体数据的数据属性信息。

(2)对多媒体数据进行两次筛选处理的情况：

在另一种可能实现方式中，电子设备还可以对海量的多媒体数据进行两次筛选处理：电子设备首先根据目标用户属性信息对海量的多媒体数据进行第一次筛选处理，得到第一数量的多媒体数据，该第一数量的多媒体数据为海量的多媒体数据中与目标用户标识具有关联关系的多媒体数据。然后，电子设备再根据目标用户属性信息对该第一数量的多媒体数据进行第二次筛选处理，得到第二数量的多媒体数据。其中，该第二数量的多媒体数据与目标用户标识之间的关联程度，大于其他多媒体数据与目标用户标识之间的关联程度，第二数量小于第一数量。

例如，电子设备获取到100000个多媒体数据后，对该100000个多媒体数据进行第一次筛选处理，得到10000个多媒体数据，该10000个多媒体数据均与目标用户标识具有关联关系。然后，电子设备对第一次筛选处理后得到的该10000个多媒体数据进行第二次筛选处理，得到1000个多媒体数据，该1000个多媒体数据与目标用户标识之间的关联程度，大于其他9000个多媒体数据与目标用户标识之间的关联程度。

在另一种可能实现方式中，还可以对海量的多媒体数据进行更多次数的筛选处理，本公开实施例对此不作具体限定，每次筛选处理后得到的多媒体数据与目标用户标识的关联程度，大于前一次筛选处理后得到的多媒体数据与目标用户标识的关联程度。对多媒体数据逐次进行筛选处理的方式，可以大大减少要获取匹配度的多媒体数据的数量，有效减小计算量，缩短耗时，提高推荐效率。

207、根据各个多媒体数据的数据属性信息和目标用户属性信息，调用匹配模型，获取各个多媒体数据与目标用户之间的匹配度。

获取到目标用户属性信息和各个多媒体数据的数据属性信息后，分别调用训练后的匹配模型，以目标用户属性信息和各个多媒体数据的数据属性信息为输入，获取该每个多媒体数据与目标用户之间的匹配度。其中，匹配度用于表示多媒体数据与目标用户之间的匹配程度，匹配度越大，表示多媒体数据与目标用户之间的匹配程度越高，也即是目标用户对该多媒体数据越感兴趣，匹配度越小，表示多媒体数据与目标用户之间的匹配程度越低，也即是目标用户对该多媒体数据越不感兴趣。

在一种可能实现方式中，参见图3，匹配模型包括至少一个特征提取层和至少一个融合层，根据各个多媒体数据的数据属性信息和目标用户属性信息，调用匹配模型获取各个多媒体数据与目标用户之间的匹配度的过程，包括：电子设备调用该至少一个特征提取层对目标用户属性信息进行特征提取，得到目标用户特征，调用该至少一个特征提取层对任一多媒体数据的数据属性信息进行特征提取，得到该任一多媒体数据的数据属性信息对应的数据特征，调用该至少一个融合层对目标用户特征和数据特征进行融合处理，得到该任一多媒体数据与目标用户之间的匹配度。

其中，该至少一个特征提取层采用可以采用卷积神经网络、循环神经网络、深度神经网络等中的任一个。该至少一个融合层可以为全连接层或其他网络层。

在另一种可能实现方式中，用于对目标用户属性信息进行特征提取的至少一个特征提取层与用于对数据属性信息进行特征提取的至少一个特征提取层不同。

例如，用于对目标用户属性信息进行特征提取的至少一个特征提取层采用循环神经网络，用于对数据属性信息进行特征提取的至少一个特征提取层采用卷积神经网络，该至少一个融合层为全连接层。根据各个多媒体数据的数据属性信息和目标用户属性信息，调用匹配模型获取各个多媒体数据与目标用户之间的匹配度的过程，包括：调用循环神经网络层对目标用户属性信息进行特征提取，得到目标用户特征，调用卷积神经网络层对多媒体数据的数据属性信息进行特征提取，得到对应的数据特征。调用全连接层对该目标用户特征和该数据特征进行融合处理，得到对应的匹配度。

(1)获取目标用户特征的过程：

在一种可能实现方式中，参见图3，目标用户属性信息至少包括目标用户标识、用户静态信息、用户统计信息和用户行为信息，调用至少一个特征提取层对目标用户属性信息进行特征提取，得到目标用户特征的过程，包括：电子设备调用该至少一个特征提取层对用户行为信息进行特征提取，得到用户行为特征，将该目标用户标识、该用户静态信息、该用户统计信息和该用户行为特征进行组合，得到目标用户特征。

其中，该用户静态信息用于描述用户的固有属性信息，如用户的性别、年龄、地域等；该用户统计信息用于描述用户的统计属性信息，如用户在预设时长内对任一类别的多媒体数据的点击率或点击量、用户在预设时长内对指定类别的多媒体数据的平均观看时长与其他用户对该指定类别的多媒体数据的平均观看时长的比值，以及其他通过统计用户的各项信息获取到的信息；用户行为信息用于描述用户执行过的操作等历史行为，如用户观看过的多媒体数据、点赞过的多媒体数据、收藏过的多媒体数据、发布过的评论信息等。

(2)获取数据特征的过程：

在另一种可能实现方式中，参见图3，任一多媒体数据的数据属性信息至少包括数据标识、数据静态信息、数据统计信息和数据内容信息，调用至少一个特征提取层对任一多媒体数据的数据属性信息进行特征提取，得到任一多媒体数据的数据属性信息对应的数据特征的过程，包括：对于任一多媒体数据，电子设备调用该至少一个特征提取层对该任一多媒体数据的数据内容信息进行特征提取，得到该任一多媒体数据的数据内容特征，将该数据标识、该数据静态信息、该数据统计信息和该数据内容特征进行组合，得到该任一多媒体数据的数据属性信息对应的数据特征。

其中，该数据静态信息用于描述多媒体数据的固有属性信息，如多媒体数据的时长、上传时间、所属类别、上传作者等；该数据统计信息用于描述多媒体数据的统计属性信息，如多媒体数据的点击量与该多媒体数据的上传作者发布的多个多媒体数据的点击量之和的比值、多媒体数据的平均观看时长与所属类别相同的多个多媒体数据的平均观看时长之和的比值，以及其他通过统计对应多媒体数据的多项信息获取到的信息；数据内容信息用于描述多媒体数据包含的内容。

为了进一步提升匹配模型的准确性，在另一种可能实现方式中，除目标用户属性信息和多媒体数据的数据属性信息以外，电子设备还获取了上下文信息或概率信息中的至少一种。

在该方式下，调用至少一个融合层对目标用户特征和数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度的过程，包括：电子设备获取上下文信息，调用至少一个融合层对该上下文信息、该目标用户特征和该数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度。

在另一种可能实现方式中，调用至少一个融合层对目标用户特征和数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度，包括：电子设备获取概率信息，调用至少一个融合层对该概率信息、该目标用户特征和该数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度。

在另一种可能实现方式中，调用至少一个融合层对目标用户特征和数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度的过程，包括：电子设备获取上下文信息和概率信息，调用至少一个融合层对该上下文信息、该概率信息、该目标用户特征和该数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度。

需要说明的是，在另一种可能实现方式中，电子设备还可以获取其他信息，根据该其他信息、目标用户属性信息和数据属性信息进行处理，得到对应的匹配度，本公开实施例对此不作具体限定。

208、根据多个多媒体数据的匹配度，为目标用户推荐多媒体数据。

获取到该多个多媒体数据中各个多媒体数据的匹配度后，电子设备根据该多个多媒体数据的匹配度，为目标用户推荐多媒体数据。

其中，匹配度越大，表示多媒体数据与目标用户之间越匹配，目标用户对该多媒体数据越感兴趣，因此，在一种可能实现方式中，根据多个多媒体数据的匹配度，为目标用户推荐多媒体数据的过程，包括：电子设备按照匹配度从大到小的顺序，对该多个多媒体数据进行排序，然后按照排列顺序，从该多个多媒体数据中，选取至少一个多媒体数据，为目标用户推荐选取的该至少一个多媒体数据。

例如，电子设备获取100个多媒体数据的匹配度，按照匹配度从大到小的顺序对这100个多媒体数据进行排序，按照排列顺序，选取前30个多媒体数据，这30个多媒体数据的匹配度最高，表示多媒体数据与目标用户之间的匹配程度最高，将这30个多媒体数据推荐给目标用户。

在一种可能实现方式中，终端基于目标用户对应的目标用户标识登录，当电子设备获取到多个多媒体数据的匹配度后，根据该多个匹配度，向已登录目标用户标识的终端发送推荐的多媒体数据。

在另一种可能实现方式中，根据多个多媒体数据的匹配度，为目标用户推荐多媒体数据的过程，包括：电子设备获取预设阈值，从该多个多媒体数据中，选取匹配度大于该预设阈值的至少一个多媒体数据，为目标用户推荐选取的该至少一个多媒体数据。

例如，电子设备获取100个多媒体数据的匹配度以及预设阈值Y，从这100个多媒体数据中选取匹配度大于预设阈值Y的30个多媒体数据，表示这30个多媒体数据与目标用户之间的匹配程度足够高，将这30个多媒体数据推荐给目标用户。

按照匹配度从大到小的顺序选取的方式，或按照匹配度大于预设阈值进行选取的方式，更接近实际情况，选取的多媒体数据与目标用户之间的匹配程度更高，后续将该选取的多媒体数据推荐给目标用户，更符合用户的需求，推荐效果更好。

对于目标用户，电子设备直接向该目标用户推荐选取的多媒体数据。对于多个用户，电子设备根据每个用户与多媒体数据之间的匹配度，向每个用户推荐各自对应的多媒体数据，形成个性化分发机制，能够实现多媒体数据的个性化分发。

并且，调用训练后的匹配模型结合用户属性信息和数据属性信息推荐多媒体数据，由于匹配模型准确，可以保证推荐准确率，而且推荐流程简单，无需进行复杂的处理，有效减少了处理量，降低了占用的处理资源，提高了推荐效率。

并且，本公开综合考虑多个用户维度中的信息项和多个数据维度上的信息项，引入了个性化综合度量衡机制，更具有针对性，可以实现多媒体数据的个性化推荐，并达到了用户的消费体验、社交体验、生产体验、直播体验以及商业化体验等多种体验之间的平衡。其中，个性化不仅体现在用户维度，也体现在数据维度。

需要说明的是，本公开实施例中的电子设备可以包括终端，也可以包括终端和服务器。当电子设备包括终端时，终端可以获取多组样本信息，根据该多组样本信息训练匹配模型，得到训练后的匹配模型，当终端获取到目标用户属性信息和任一多媒体数据的数据属性信息时，通过调用该匹配模型对该目标用户属性信息和该任一多媒体数据的数据属性信息进行处理，得到该任一多媒体数据与目标用户之间的匹配度。终端也可以将该训练后的匹配模型发送给其他设备，供其他设备使用。当电子设备包括终端和服务器时，服务器获取多组样本信息，根据该多组样本信息训练匹配模型，得到训练后对匹配模型，服务器可以将该匹配模型发送给终端，供终端使用，也可以在终端获取到目标用户属性信息和任一多媒体数据的数据属性信息时，接收终端发送的目标用户属性信息和数据属性信息，调用该匹配模型，获取该任一多媒体数据与目标用户之间的匹配度，将获取到的匹配度发送给终端。

根据上述实施例提供的方法，对推荐多媒体数据的过程进行说明，该过程应用于电子设备中，电子设备包括终端和服务器，终端包括召回模块和粗排模块，参见图3、图4和图5，包括：

1、服务器根据终端发送的历史操作记录，获取样本上下文信息、样本概率信息、样本用户属性信息和样本数据属性信息。

其中，样本用户属性信息包括用户标识、用户静态信息、用户行为信息和用户统计信息；样本数据属性信息包括数据标识、数据静态信息、数据统计信息和数据内容信息。

2、服务器根据获取到的样本上下文信息、样本概率信息、样本用户属性信息和样本数据属性信息对匹配模型进行训练，得到训练后的匹配模型。

其中，该匹配模型包括至少一个循环神经网络层、至少一个卷积神经网络层和至少一个全连接层。

3、服务器将训练后的匹配模型发送给终端，该匹配模型构成终端中的推荐模块。

4、终端获取目标上下文信息、目标概率信息、目标用户属性信息和100000个多媒体数据，通过调用召回模块，对该100000个多媒体数据进行第一次筛选，得到1000个多媒体数据。

其中，目标用户属性信息包括目标用户标识、用户静态信息、用户行为信息和用户统计信息；任一多媒体数据的数据属性信息包括数据标识、数据静态信息、数据统计信息和数据内容信息。

5、终端调用粗排模块，对该1000个多媒体数据进行第二次筛选，得到100个多媒体数据。

6、终端调用匹配模型中的至少一个循环神经网络层，对目标用户属性信息中的用户行为信息进行特征提取，得到用户行为特征，将目标用户标识、用户静态信息、用户行为特征信息和用户统计信息进行组合，得到目标用户特征。

7、对于任一多媒体数据，终端分别调用匹配模型中的至少一个卷积神经网络层，对该多媒体数据的数据属性信息中的数据内容信息进行特征提取，得到数据内容特征，将数据标识、数据静态信息、数据统计信息和数据内容特征进行组合，得到该任一多媒体数据的数据特征。

8、分别调用匹配模型中的至少一个全连接层对目标上下文信息、目标概率信息、目标用户特征以及任一多媒体数据的数据特征进行融合处理，得到对应的匹配度。

9、重复执行步骤7和8，得到该100个多媒体数据各自对应的匹配度。

10、终端调用推荐模块，按照匹配度从大到小的顺序，对该100个多媒体数据进行排序。

11、终端根据该100个多媒体数据的排列顺序，从该100个多媒体数据中选取前10个多媒体数据。

12、终端为目标用户推荐该10个多媒体数据。

图6是根据一示例性实施例示出的一种匹配模型训练装置的框图，参见图6，该装置包括：

样本用户信息获取单元601，被配置为执行获取多个样本用户属性信息，每个样本用户属性信息包括多个用户维度的信息项，每个用户维度的信息项用于从对应的用户维度描述对应的样本用户；

样本数据信息获取单元602，被配置为执行获取多个样本数据属性信息，每个样本数据属性信息多个数据维度的信息项，每个数据维度的信息项用于从对应的数据维度描述对应的样本多媒体数据；

融合单元603，被配置为执行根据每个样本用户属性信息中多个用户维度的信息项和每个样本数据属性信息中多个数据维度的信息项进行融合处理，得到每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度；

训练单元604，被配置为执行根据每个样本用户属性信息、每个样本数据属性信息以及每个样本用户属性信息和每个样本数据属性信息对应的样本匹配度，训练匹配模型。

在一种可能实现方式中，参见图7，融合单元603，包括：

关系数据获取子单元6031，被配置为执行获取关系数据，关系数据包括多个用户维度的权重和多个数据维度的权重，关系数据用于指示匹配度与多个用户维度的信息项、多个数据维度的信息项、多个用户维度的权重和多个数据维度的权重之间的关系；

样本匹配度获取子单元6032，被配置为执行根据样本用户属性信息中多个用户维度的信息项、样本数据属性信息中多个数据维度的信息项以及关系数据，获取样本匹配度。

在另一种可能实现方式中，参见图7，装置还包括：

目标用户信息获取单元605，被配置为执行获取目标用户属性信息，目标用户属性信息包括多个用户维度的信息项；

数据获取单元606，被配置为执行获取各个多媒体数据的数据属性信息，每个数据属性信息包括多个数据维度的信息项；

调用单元607，被配置为执行根据各个多媒体数据的数据属性信息和目标用户属性信息，调用匹配模型获取各个多媒体数据与目标用户之间的匹配度；

推荐单元608，被配置为执行根据多个多媒体数据的匹配度，为目标用户推荐多媒体数据。

在另一种可能实现方式中，参见图7，匹配模型包括至少一个特征提取层和至少一个融合层，调用单元607，包括：

用户特征提取子单元6071，被配置为执行调用至少一个特征提取层对目标用户属性信息进行特征提取，得到目标用户特征；

数据特征提取子单元6072，被配置为执行调用至少一个特征提取层对任一多媒体数据的数据属性信息进行特征提取，得到任一多媒体数据的数据属性信息对应的数据特征；

融合子单元6073，被配置为执行调用至少一个融合层对目标用户特征和数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度。

在另一种可能实现方式中，参见图7，目标用户属性信息至少包括目标用户标识、用户静态信息、用户统计信息和用户行为信息；

用户特征提取子单元6071，还被配置为执行调用至少一个特征提取层对用户行为信息进行特征提取，得到用户行为特征；

用户特征提取子单元6071，还被配置为执行将目标用户标识、用户静态信息、用户统计信息和用户行为特征进行组合，得到目标用户特征。

在另一种可能实现方式中，参见图7，任一多媒体数据的数据属性信息至少包括数据标识、数据静态信息、数据统计信息和数据内容信息；

数据特征提取子单元6072，还被配置为执行调用至少一个特征提取层对任一多媒体数据的数据内容信息进行特征提取，得到任一多媒体数据的数据内容特征；

数据特征提取子单元6072，还被配置为执行将数据标识、数据静态信息、数据统计信息和数据内容特征进行组合，得到任一多媒体数据的数据属性信息对应的数据特征。

在另一种可能实现方式中，参见图7，融合子单元6073，还被配置为执行获取上下文信息或概率信息中的至少一种，上下文信息包括当前环境信息、历史推荐数据信息或者历史观看数据信息中的至少一项，概率信息包括对任一多媒体数据执行至少一种预设操作的概率；

融合子单元6073，还被配置为执行调用至少一个融合层对上下文信息或概率信息中的至少一种、目标用户特征和数据特征进行融合处理，得到任一多媒体数据与目标用户之间的匹配度。

在另一种可能实现方式中，参见图7，推荐单元608，包括：

选取子单元6081，被配置为执行按照匹配度从大到小的顺序，从多个多媒体数据中，选取至少一个多媒体数据；

推荐子单元6082，被配置为执行为目标用户推荐选取的多媒体数据。

在另一种可能实现方式中，参见图7，推荐单元，包括：

选取子单元6081，被配置为执行从多个多媒体数据中，选取匹配度大于预设阈值的至少一个多媒体数据；

关于上述实施例中的装置，其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图8是根据一示例性实施例示出的一种终端800的框图。该终端800用于执行上述匹配模型训练方法中终端所执行的步骤，可以是便携式移动终端，比如：智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端800还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端800包括有：一个或多个处理器801和一个或多个存储器802。

处理器801可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器801可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器801也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器801可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器801还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器802可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器802还可包括易失性存储器或非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器802中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器801所具有以实现本申请中方法实施例提供的匹配模型训练方法。

在一些实施例中，终端800还可选包括有：外围设备接口803和至少一个外围设备。处理器801、存储器802和外围设备接口803之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口803相连。具体地，外围设备包括：射频电路804、触摸显示屏805、摄像头806、音频电路807、定位组件808和电源809中的至少一种。

外围设备接口803可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器801和存储器802。在一些实施例中，处理器801、存储器802和外围设备接口803被集成在同一芯片或电路板上；在一些其他实施例中，处理器801、存储器802和外围设备接口803中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路804用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路804通过电磁信号与通信网络以及其他通信设备进行通信。射频电路804将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路804包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路804可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及13G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路804还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏805用于显示UI(UserInterface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏805是触摸显示屏时，显示屏805还具有采集在显示屏805的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器801进行处理。此时，显示屏805还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏805可以为一个，设置终端800的前面板；在另一些实施例中，显示屏805可以为至少两个，分别设置在终端800的不同表面或呈折叠设计；在再一些实施例中，显示屏805可以是柔性显示屏，设置在终端800的弯曲表面上或折叠面上。甚至，显示屏805还可以设置成非矩形的不规则图形，也即异形屏。显示屏805可以采用LCD(LiquidCrystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件806用于采集图像或视频。可选地，摄像头组件806包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件806还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路807可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器801进行处理，或者输入至射频电路804以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端800的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器801或射频电路804的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路807还可以包括耳机插孔。

定位组件808用于定位终端800的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件808可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

电源809用于为终端800中的各个组件进行供电。电源809可以是交流电、直流电、一次性电池或可充电电池。当电源809包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端800还包括有一个或多个传感器180。该一个或多个传感器180包括但不限于：加速度传感器811、陀螺仪传感器812、压力传感器813、指纹传感器814、光学传感器815以及接近传感器816。

加速度传感器811可以检测以终端800建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器811可以用于检测重力加速度在三个坐标轴上的分量。处理器801可以根据加速度传感器811采集的重力加速度信号，控制触摸显示屏805以横向视图或纵向视图进行用户界面的显示。加速度传感器811还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器812可以检测终端800的机体方向及转动角度，陀螺仪传感器812可以与加速度传感器811协同采集用户对终端800的3D动作。处理器801根据陀螺仪传感器812采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器813可以设置在终端800的侧边框和/或触摸显示屏805的下层。当压力传感器813设置在终端800的侧边框时，可以检测用户对终端800的握持信号，由处理器801根据压力传感器813采集的握持信号进行左右手识别或快捷操作。当压力传感器813设置在触摸显示屏805的下层时，由处理器801根据用户对触摸显示屏805的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器814用于采集用户的指纹，由处理器801根据指纹传感器814采集到的指纹识别用户的身份，或者，由指纹传感器814根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器801授权该用户具有相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器814可以被设置终端800的正面、背面或侧面。当终端800上设置有物理按键或厂商Logo时，指纹传感器814可以与物理按键或厂商标志集成在一起。

光学传感器815用于采集环境光强度。在一个实施例中，处理器801可以根据光学传感器815采集的环境光强度，控制触摸显示屏805的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏805的显示亮度；当环境光强度较低时，调低触摸显示屏805的显示亮度。在另一个实施例中，处理器801还可以根据光学传感器815采集的环境光强度，动态调整摄像头组件806的拍摄参数。

接近传感器816，也称距离传感器，通常设置在终端800的前面板。接近传感器816用于采集用户与终端800的正面之间的距离。在一个实施例中，当接近传感器816检测到用户与终端800的正面之间的距离逐渐变小时，由处理器801控制触摸显示屏805从亮屏状态切换为息屏状态；当接近传感器816检测到用户与终端800的正面之间的距离逐渐变大时，由处理器801控制触摸显示屏805从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图8中示出的结构并不构成对终端800的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图8是根据一示例性实施例示出的一种服务器的结构示意图，该服务器800可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(centralprocessing units，CPU)801和一个或一个以上的存储器802，其中，所述存储器802中存储有至少一条指令，所述至少一条指令由所述处理器801加载并执行以实现上述各个方法实施例提供的方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

服务器800可以用于执行上述匹配模型训练方法中服务器所执行的步骤。

在示例性实施例中，还提供了一种非临时性计算机可读存储介质，当存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述匹配模型训练方法中服务器或终端所执行的步骤。

在示例性实施例中，还提供了一种计算机程序产品，当计算机程序产品中的指令由电子设备的处理器执行时，使得电子设备能够执行上述匹配模型训练方法中服务器或终端所执行的步骤。

本领域技术人员在考虑说明书及实践这里的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种匹配模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述每个样本用户属性信息中所述多个用户维度的信息项和所述每个样本数据属性信息中所述多个数据维度的信息项进行融合处理，得到所述每个样本用户属性信息和所述每个样本数据属性信息对应的样本匹配度，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述每个样本用户属性信息、所述每个样本数据属性信息以及所述每个样本用户属性信息和所述每个样本数据属性信息对应的样本匹配度，训练匹配模型之后，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述匹配模型包括至少一个特征提取层和至少一个融合层，所述根据所述各个多媒体数据的数据属性信息和所述目标用户属性信息，调用所述匹配模型获取所述各个多媒体数据与目标用户之间的匹配度，包括：

5.根据权利要求4所述的方法，其特征在于，所述目标用户属性信息至少包括目标用户标识、用户静态信息、用户统计信息和用户行为信息；所述调用所述至少一个特征提取层对所述目标用户属性信息进行特征提取，得到目标用户特征，包括：

6.根据权利要求4所述的方法，其特征在于，所述任一多媒体数据的数据属性信息至少包括数据标识、数据静态信息、数据统计信息和数据内容信息；所述调用所述至少一个特征提取层对任一多媒体数据的数据属性信息进行特征提取，得到所述任一多媒体数据的数据属性信息对应的数据特征，包括：

7.根据权利要求4所述的方法，其特征在于，所述调用所述至少一个融合层对所述目标用户特征和所述数据特征进行融合处理，得到所述任一多媒体数据与所述目标用户之间的匹配度，包括：

8.一种匹配模型训练装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

其中，所述一个或多个处理器被配置为执行如权利要求1至权利要求7任一项所述的匹配模型训练方法。

10.一种非临时性计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至权利要求7任一项所述的匹配模型训练方法。