CN113204655B

CN113204655B - 多媒体信息的推荐方法、相关装置及计算机存储介质

Info

Publication number: CN113204655B
Application number: CN202110754222.2A
Authority: CN
Inventors: 李影; 王蕾
Original assignee: Beijing Sohu New Media Information Technology Co Ltd
Current assignee: Beijing Sohu New Media Information Technology Co Ltd
Priority date: 2021-07-02
Filing date: 2021-07-02
Publication date: 2021-11-23
Anticipated expiration: 2041-07-02
Also published as: CN113204655A

Abstract

本申请提供了一种多媒体信息的推荐方法、相关装置及计算机存储介质，该方法将所有目标用户的基本信息、目标用户获取多媒体信息的历史序列信息和多媒体信息集合输入至多媒体信息推荐模型中，得到目标用户对每一个多媒体信息的点击概率；多媒体信息推荐模型由多个训练样本用户的基本信息、训练样本用户获取多媒体信息的历史序列信息、训练样本多媒体信息集合和训练样本用户各自的真实喜好多媒体信息对神经网络模型进行训练得到；根据目标用户对每一个多媒体信息的点击概率，生成推荐多媒体信息集合。本申请根据用户获取多媒体信息的历史序列信息确定用户对每一个多媒体信息的点击概率，达到精确的向用户推荐更符合用户当前兴趣的多媒体信息的目的。

Description

多媒体信息的推荐方法、相关装置及计算机存储介质

技术领域

本申请涉及计算机技术领域，特别涉及一种多媒体信息的推荐方法、相关装置及计算机存储介质。

背景技术

互联网已经成为当今时代人们获取视频、音乐、娱乐等多媒体信息的主要来源，而随着多媒体信息中信息、内容与数据的极速增长，用户面对的多媒体信息越来越多，如何准确地向用户展示其喜好的内容，筛选出符合用户需求的多媒体信息是现下的难题。

目前，通常会采用根据用户的兴趣和多媒体信息的属性来研究它们之间的匹配程度的方式，将预测出的匹配程度最高的多媒体信息推荐给用户，从而提升用户体验。但在实际场景中，用户的兴趣并非是单一的、一成不变的，用户兴趣既有可能在长期发展中逐渐演化，也可能在短期内呈现不同时段、不同场景下的特有兴趣。从而导致预测出的多媒体信息并不能符合用户的当前兴趣，进而影响用户的体验。

发明内容

有鉴于此，本申请提供了一种多媒体信息的推荐方法、相关装置及计算机存储介质，用于精确的向用户推荐更符合用户当前兴趣的多媒体信息。

本申请第一方面提供了一种多媒体信息的推荐方法，包括：

获取目标用户的用户信息和多媒体信息集合；其中，所述目标用户的用户信息包括目标用户的基本信息以及目标用户获取多媒体信息的历史序列信息；所述多媒体信息集合包括至少一个多媒体信息；

将所有所述用户信息和所述多媒体信息集合输入至多媒体信息推荐模型中，得到所述目标用户对每一个所述多媒体信息的点击概率；其中，所述多媒体信息推荐模型由多个训练样本用户的用户信息、训练样本多媒体信息集合和所述训练样本用户各自的真实喜好多媒体信息对神经网络模型进行训练得到；所述训练样本用户的用户信息包括训练样本用户的基本信息以及训练样本用户获取多媒体信息的历史序列信息；

根据所述目标用户对每一个所述多媒体信息的点击概率，生成推荐多媒体信息集合。

可选的，所述多媒体信息推荐模型的构建方法，包括：

构建训练样本集；其中，所述训练样本集包括多个训练样本用户的用户信息、训练样本多媒体信息集合和训练样本用户各自的真实喜好多媒体信息集合；所述训练样本多媒体信息集合包括至少一个训练样本多媒体信息；

将所述训练样本用户的用户信息和训练样本多媒体信息集合输入至神经网络模型的嵌入层，得到所述训练样本用户的基本信息中的每一个属性信息的嵌入向量、训练样本用户获取多媒体信息的历史序列信息中的每一个历史多媒体信息的嵌入向量以及训练样本多媒体信息集合中的每一个目标多媒体信息的嵌入向量；

将训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，输入至神经网络模型的注意力机制层，得到所述训练样本用户的当前兴趣向量；

将训练样本用户的基本信息中的属性信息的嵌入向量、训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量以及训练样本多媒体信息集合中的目标多媒体信息的嵌入向量进行拼接，得到所述目标多媒体信息的目标特征向量；

将所述目标多媒体信息的目标特征向量以及所述训练样本用户的当前兴趣向量输入至神经网络模型的全连接层中，得到所述目标多媒体信息的预测点击概率；

利用所述目标多媒体信息的预测点击概率与所述训练样本用户的真实喜好多媒体信息之间的误差，对所述神经网络模型进行调整，直至所述目标多媒体信息的预测点击概率与所述训练样本用户的真实喜好多媒体信息之间的误差满足预设的收敛条件，将调整后的神经网络模型作为所述多媒体信息推荐模型。

可选的，所述将训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，输入至神经网络模型的注意力机制层，得到所述训练样本用户的当前兴趣向量，包括：

根据训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，得到所述训练样本多媒体信息集合中的目标多媒体信息的权重系数；

将所述训练样本多媒体信息集合中的目标多媒体信息的权重系数与训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量做加权求和，得到所述训练样本用户的当前兴趣向量。

可选的，所述将调整后的神经网络模型作为所述多媒体信息推荐模型之后，还包括：

采用计算ROC曲线下的面积的方式，对所述多媒体信息推荐模型的性能进行评价，得到所述多媒体信息推荐模型的评价结果；其中，所述ROC曲线下的面积越大，所述多媒体信息推荐模型的性能越好。

本申请第二方面提供了一种多媒体信息的推荐装置，包括：

获取单元，用于获取目标用户的用户信息和多媒体信息集合；其中，所述目标用户的用户信息包括目标用户的基本信息以及目标用户获取多媒体信息的历史序列信息；所述多媒体信息集合包括至少一个多媒体信息；

第一输入单元，用于将所有所述用户信息和所述多媒体信息集合输入至多媒体信息推荐模型中，得到所述目标用户对每一个所述多媒体信息的点击概率；其中，所述多媒体信息推荐模型由多个训练样本用户的用户信息、训练样本多媒体信息集合和所述训练样本用户各自的真实喜好多媒体信息对神经网络模型进行训练得到；所述训练样本用户的用户信息包括训练样本用户的基本信息以及训练样本用户获取多媒体信息的历史序列信息；

生成单元，用于根据所述目标用户对每一个所述多媒体信息的点击概率，生成推荐多媒体信息集合。

可选的，所述多媒体信息推荐模型的构建单元，包括：

训练样本集构建单元，用于构建训练样本集；其中，所述训练样本集包括多个训练样本用户的用户信息、训练样本多媒体信息集合和训练样本用户各自的真实喜好多媒体信息集合；所述训练样本多媒体信息集合包括至少一个训练样本多媒体信息；

第二输入单元，用于将所述训练样本用户的用户信息和训练样本多媒体信息集合输入至神经网络模型的嵌入层，得到所述训练样本用户的基本信息中的每一个属性信息的嵌入向量、训练样本用户获取多媒体信息的历史序列信息中的每一个历史多媒体信息的嵌入向量以及训练样本多媒体信息集合中的每一个目标多媒体信息的嵌入向量；

第三输入单元，用于将训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，输入至神经网络模型的注意力机制层，得到所述训练样本用户的当前兴趣向量；

拼接单元，用于将训练样本用户的基本信息中的属性信息的嵌入向量、训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量以及训练样本多媒体信息集合中的目标多媒体信息的嵌入向量进行拼接，得到所述目标多媒体信息的目标特征向量；

第四输入单元，用于将所述目标多媒体信息的目标特征向量以及所述训练样本用户的当前兴趣向量输入至神经网络模型的全连接层中，得到所述目标多媒体信息的预测点击概率；

确定单元，用于利用所述目标多媒体信息的预测点击概率与所述训练样本用户的真实喜好多媒体信息之间的误差，对所述神经网络模型进行调整，直至所述目标多媒体信息的预测点击概率与所述训练样本用户的真实喜好多媒体信息之间的误差满足预设的收敛条件，将调整后的神经网络模型作为所述多媒体信息推荐模型。

可选的，所述第三输入单元，包括：

权重系数确定单元，用于根据训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，得到所述训练样本多媒体信息集合中的目标多媒体信息的权重系数；

计算单元，用于将所述训练样本多媒体信息集合中的目标多媒体信息的权重系数与训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量做加权求和，得到所述训练样本用户的当前兴趣向量。

可选的，所述多媒体信息的推荐装置，还包括：

评价单元，用于采用计算ROC曲线下的面积的方式，对所述多媒体信息推荐模型的性能进行评价，得到所述多媒体信息推荐模型的评价结果；其中，所述ROC曲线下的面积越大，所述多媒体信息推荐模型的性能越好。

本申请第三方面提供了一种电子设备，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如第一方面任意一项所述的多媒体信息的推荐方法。

本申请第四方面提供了一种计算机存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如第一方面任意一项所述的多媒体信息的推荐方法。

由以上方案可知，本申请提供的一种多媒体信息的推荐方法、相关装置及计算机存储介质中，所述多媒体信息的推荐方法通过获取目标用户的用户信息包括目标用户的基本信息、目标用户获取多媒体信息的历史序列信息和多媒体信息集合；然后，将所有目标用户的基本信息、目标用户获取多媒体信息的历史序列信息和多媒体信息集合输入至多媒体信息推荐模型中，得到目标用户对每一个多媒体信息的点击概率；其中，多媒体信息推荐模型由多个训练样本用户的基本信息、训练样本用户获取多媒体信息的历史序列信息、训练样本多媒体信息集合和训练样本用户各自的真实喜好多媒体信息对神经网络模型进行训练得到；最终，根据目标用户对每一个多媒体信息的点击概率，生成推荐多媒体信息集合。由于本申请结合了用户获取多媒体信息的历史序列信息来确定用户对每一个多媒体信息的点击概率，达到精确的向用户推荐更符合用户当前兴趣的多媒体信息的目的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种多媒体信息的推荐方法的具体流程图；

图2为本申请另一实施例提供的一种多媒体信息推荐模型的构建方法的流程图；

图3为本申请另一实施例提供的一种确定目标用户当前兴趣向量的方法的流程图；

图4为本申请另一实施例提供的一种多媒体信息的推荐装置的示意图；

图5为本申请另一实施例提供的一种实现多媒体信息的推荐方法的电子设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要注意，本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系，而术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本申请实施例提供了一种多媒体信息的推荐方法，如图1所示，具体包括以下步骤：

S101、获取目标用户的用户信息和多媒体信息集合。

其中，目标用户的用户信息包括目标用户的基本信息以及目标用户获取多媒体信息的历史序列信息；多媒体信息集合包括至少一个多媒体信息。

需要说明的是，目标用户的用户信息和多媒体信息集合中的类别特征可以处理成但不限于独热编码形式，此处不做限定。多媒体信息可以是但不限于音乐、视频等，此处不做限定。

目标用户的基本信息，包括但不限于目标用户的年龄、职业、性别等，此处不做限定。多媒体信息集合中的多媒体信息可以是但不限于待向用户推荐的多媒体信息、当前热门的多媒体信息等，此处不做限定。

以多媒体信息为视频为例，目标用户获取多媒体信息的历史序列信息包括但不限于视频的标识、视频的作者、视频的类型、目标用户观看视频的时长、观看视频时的时间戳，且目标用户获取历史多媒体信息按照时间戳进行排序，可以将时间戳拆解为日期、小时，还可以按照工作日、纪念日等进行类别特征提取，此处不做限定。

还需要说明的是，目标用户获取多媒体信息的历史序列信息中，可以包含多种类型的多媒体信息，既包括目标用户获取的音乐信息，又包括目标用户获取的视频信息。

S102、将所有用户信息和多媒体信息集合输入至多媒体信息推荐模型中，得到目标用户对每一个多媒体信息的点击概率。

其中，多媒体信息推荐模型由多个训练样本用户的用户信息、训练样本多媒体信息集合和训练样本用户各自的真实喜好多媒体信息对神经网络模型进行训练得到；训练样本用户的用户信息包括训练样本用户的基本信息以及训练样本用户获取多媒体信息的历史序列信息；

可选的，在本申请的另一实施例中，多媒体信息推荐模型的构建方法，如图2所示，包括：

S201、构建训练样本集。

其中，训练样本集包括多个训练样本用户的用户信息、训练样本多媒体信息集合和训练样本用户各自的真实喜好多媒体信息集合；训练样本用户的用户信息包括训练样本用户的基本信息以及训练样本用户获取多媒体信息的历史序列信息；训练样本多媒体信息集合包括至少一个训练样本多媒体信息。

需要说明的是，训练样本用户的用户信息和训练样本多媒体信息集合的相关解释说明可以分别参见上述的目标用户的用户信息和多媒体信息集合，此处不再赘述。

训练样本用户各自的真实喜好多媒体信息集合，为训练样本用户后续获取多媒体信息的集合，例如：当前时间为2020年3月1日，训练样本用户A获取多媒体信息的历史序列信息中的时间截止至2020年2月11日，那么训练样本用户A真实喜好多媒体信息集合中的多媒体信息为训练样本用户A在2020年2月11日之后获取的多媒体信息。

S202、将训练样本用户的用户信息和训练样本多媒体信息集合输入至神经网络模型的嵌入层，得到训练样本用户的基本信息中的每一个属性信息的嵌入向量、训练样本用户获取多媒体信息的历史序列信息中的每一个历史多媒体信息的嵌入向量以及训练样本多媒体信息集合中的每一个目标多媒体信息的嵌入向量。

由于，输入至神经网络模型中的训练样本用户的用户信息和训练样本多媒体信息集合中有较多的类别特征，若将类别特征处理成了独热编码的形式，那么，会使特征向量表现为高维的稀疏向量，因此，需要利用嵌入表达的方法，将高维的稀疏向量转为地维的稠密数据表示。

以将训练样本用户的基本信息为例，训练样本用户的基本信息中的属性信息可以包括但不限于年龄、性别等。将训练样本用户的年龄输入至神经网络的嵌入层，得到训练样本用户的年龄的嵌入向量。

S203、将训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，输入至神经网络模型的注意力机制层，得到训练样本用户的当前兴趣向量。

需要说明的是，神经网络模型的注意机制层是可以使得神经网络具备专注于其输入（或特征）子集的能力：选择特定的输入、决定需要关注输入的哪部分并分配有限的信息处理资源给重要的部分。

具体的，将上述获取得到的所有历史多媒体信息的嵌入向量和所述训练样本多媒体信息集合中的目标多媒体信息的嵌入向量输入至神经网络的注意力机制层，最终输出得到训练样本用户的当前兴趣向量。

可选的，在本申请的另一实施例中，步骤S203的一种实施方式，如图3所示，包括：

S301、根据训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，得到训练样本多媒体信息集合中的目标多媒体信息的权重系数。

具体的，将训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量输入至注意力机制层中时，注意力机制层以神经网络模型为基础对训练样本用户获取多媒体信息的历史序列与和目标多媒体信息的关联关系建模，利用多层感知机对多媒体信息之间的各自属性的非线性交互进行建模，从而突出了训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息和训练样本多媒体信息集合中的目标多媒体信息之间的关注差异，从而输出得到权重系数w_i=g(V_i，V_a)，其中，V_i为训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量，V_a为训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，g为注意力单元。

S302、将训练样本多媒体信息集合中的目标多媒体信息的权重系数与训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量做加权求和，得到训练样本用户的当前兴趣向量。

由于，训练样本用户获取多媒体信息的历史序列信息包含日期、时段等信息，因此最终得到的训练样本用户的当前兴趣向量为动态向量。使得最终得到的目标多媒体信息的预测点击概率更加符合训练样本用户的当前兴趣。

S204、将训练样本用户的基本信息中的属性信息的嵌入向量、训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量以及训练样本多媒体信息集合中的目标多媒体信息的嵌入向量进行拼接，得到目标多媒体信息的目标特征向量。

S205、将目标多媒体信息的目标特征向量以及训练样本用户的当前兴趣向量输入至神经网络模型的全连接层中，得到目标多媒体信息的预测点击概率。

S206、判断目标多媒体信息的预测点击概率与训练样本用户的真实喜好多媒体信息之间的误差是否满足预设的收敛条件。

可以理解的是，不仅可以通过判断目标多媒体信息的预测点击概率与训练样本用户的真实喜好多媒体信息之间的误差是否满足预设的收敛条件，来确定当前多媒体信息推荐模型是否训练完毕，还可以通过设定一定的迭代次数来训练得到多媒体信息推荐模型。

由于，神经网络模型对点击概率的预测实际上是对用户是否点击的分类预测，因此，在神经网络模型训练时，可以以交叉熵作为损失函数。

具体的，若目标多媒体信息的预测点击概率与训练样本用户的真实喜好多媒体信息之间的误差满足预设的收敛条件，则执行步骤S207；目标多媒体信息的预测点击概率与训练样本用户的真实喜好多媒体信息之间的误差不满足预设的收敛条件，则执行步骤S208。

S207、将神经网络模型作为多媒体信息推荐模型。

S208、利用目标多媒体信息的预测点击概率与训练样本用户的真实喜好多媒体信息之间的误差，对神经网络模型进行调整。

可选的，在本申请的另一实施例中，在将调整后的神经网络模型作为多媒体信息推荐模型后，还可以对多媒体信息推荐模型进行评价，可以采用但不限于计算ROC曲线下的面积的方式，对多媒体信息推荐模型的性能进行评价，得到多媒体信息推荐模型的评价结果，其中，ROC曲线下的面积越大，多媒体信息推荐模型的性能越好。

S103、根据目标用户对每一个多媒体信息的点击概率，生成推荐多媒体信息集合。

可以理解的是，在生成推荐多媒体信息集合后，可以通过十分多样化、且成熟的方式向目标用户推送推荐多媒体信息集合中的多媒体信息，此处不做赘述。

由以上方案可知，本申请提供的一种多媒体信息的推荐方法中，通过获取目标用户的用户信息包括目标用户的基本信息、目标用户获取多媒体信息的历史序列信息和多媒体信息集合；然后，将所有目标用户的基本信息、目标用户获取多媒体信息的历史序列信息和多媒体信息集合输入至多媒体信息推荐模型中，得到目标用户对每一个多媒体信息的点击概率；其中，多媒体信息推荐模型由多个训练样本用户的基本信息、训练样本用户获取多媒体信息的历史序列信息、训练样本多媒体信息集合和训练样本用户各自的真实喜好多媒体信息对神经网络模型进行训练得到；最终，根据目标用户对每一个多媒体信息的点击概率，生成推荐多媒体信息集合。由于本申请结合了用户获取多媒体信息的历史序列信息来确定用户对每一个多媒体信息的点击概率，达到精确的向用户推荐更符合用户当前兴趣的多媒体信息的目的。

本申请另一实施例提供了一种多媒体信息的推荐装置，如图4所示，具体包括：

获取单元401，用于获取目标用户的用户信息和多媒体信息集合。

第一输入单元402，用于将所有用户信息和多媒体信息集合输入至多媒体信息推荐模型中，得到目标用户对每一个多媒体信息的点击概率。

其中，多媒体信息推荐模型由多个训练样本用户的用户信息、训练样本多媒体信息集合和训练样本用户各自的真实喜好多媒体信息对神经网络模型进行训练得到；训练样本用户的用户信息包括训练样本用户的基本信息以及训练样本用户获取多媒体信息的历史序列信息。

生成单元403，用于根据目标用户对每一个多媒体信息的点击概率，生成推荐多媒体信息集合。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，如图1所示，此处不再赘述。

可选的，在本申请的另一实施例中，多媒体信息推荐模型的构建单元，包括：

训练样本集构建单元，用于构建训练样本集。

第二输入单元，用于将训练样本用户的用户信息和训练样本多媒体信息集合输入至神经网络模型的嵌入层，得到训练样本用户的基本信息中的每一个属性信息的嵌入向量、训练样本用户获取多媒体信息的历史序列信息中的每一个历史多媒体信息的嵌入向量以及训练样本多媒体信息集合中的每一个目标多媒体信息的嵌入向量。

第三输入单元，用于将训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，输入至神经网络模型的注意力机制层，得到训练样本用户的当前兴趣向量。

拼接单元，用于将训练样本用户的基本信息中的属性信息的嵌入向量、训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量以及训练样本多媒体信息集合中的目标多媒体信息的嵌入向量进行拼接，得到目标多媒体信息的目标特征向量。

第四输入单元，用于将目标多媒体信息的目标特征向量以及=训练样本用户的当前兴趣向量输入至神经网络模型的全连接层中，得到目标多媒体信息的预测点击概率。

确定单元，用于利用目标多媒体信息的预测点击概率与训练样本用户的真实喜好多媒体信息之间的误差，对神经网络模型进行调整，直至目标多媒体信息的预测点击概率与训练样本用户的真实喜好多媒体信息之间的误差满足预设的收敛条件，将调整后的神经网络模型作为多媒体信息推荐模型。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，如图2所示，此处不再赘述。

可选的，在本申请的另一实施例中，第三输入单元的一种实施方式，包括：

权重系数确定单元，用于根据训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，得到训练样本多媒体信息集合中的目标多媒体信息的权重系数。

计算单元，用于将训练样本多媒体信息集合中的目标多媒体信息的权重系数与训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量做加权求和，得到训练样本用户的当前兴趣向量。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，如图3所示，此处不再赘述。

可选的，在本申请的另一实施例中，多媒体信息的推荐装置的一种实施方式，还包括：

评价单元，用于采用计算ROC曲线下的面积的方式，对多媒体信息推荐模型的性能进行评价，得到多媒体信息推荐模型的评价结果。

其中，ROC曲线下的面积越大，多媒体信息推荐模型的性能越好。

本申请上述实施例公开的单元的具体工作过程，可参见对应的方法实施例内容，此处不再赘述。

由以上方案可知，本申请提供的一种多媒体信息的推荐装置中，通过获取单元401获取目标用户的用户信息包括目标用户的基本信息、目标用户获取多媒体信息的历史序列信息和多媒体信息集合；然后，第一输入单元402将所有目标用户的基本信息、目标用户获取多媒体信息的历史序列信息和多媒体信息集合输入至多媒体信息推荐模型中，得到目标用户对每一个多媒体信息的点击概率；其中，多媒体信息推荐模型由多个训练样本用户的基本信息、训练样本用户获取多媒体信息的历史序列信息、训练样本多媒体信息集合和训练样本用户各自的真实喜好多媒体信息对神经网络模型进行训练得到；最终，生成单元403根据目标用户对每一个多媒体信息的点击概率，生成推荐多媒体信息集合。由于本申请结合了用户获取多媒体信息的历史序列信息来确定用户对每一个多媒体信息的点击概率，达到精确的向用户推荐更符合用户当前兴趣的多媒体信息的目的。

本申请另一实施例提供了一种电子设备，如图5所示，包括：

一个或多个处理器501。

存储装置502，其上存储有一个或多个程序。

当所述一个或多个程序被所述一个或多个处理501执行时，使得所述一个或多个处理器501实现如上述实施例中任意一项所述的多媒体信息的推荐方法。

本申请另一实施例提供了一种计算机存储介质，其上存储有计算机程序，其中，计算机程序被处理器执行时实现如上述实施例中任意一项所述的多媒体信息的推荐方法。

在本申请公开的上述实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本公开的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本公开各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，直播设备，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种多媒体信息的推荐方法，其特征在于，包括：

获取目标用户的用户信息和多媒体信息集合；其中，目标用户的用户信息包括目标用户的基本信息以及目标用户获取多媒体信息的历史序列信息；所述多媒体信息集合包括至少一个多媒体信息；

根据所述目标用户对每一个所述多媒体信息的点击概率，生成推荐多媒体信息集合；

其中，所述多媒体信息推荐模型的构建方法，包括：

利用所述目标多媒体信息的预测点击概率与所述训练样本用户的真实喜好多媒体信息之间的误差，对所述神经网络模型进行调整，直至所述目标多媒体信息的预测点击概率与所述训练样本用户的真实喜好多媒体信息之间的误差满足预设的收敛条件，将调整后的神经网络模型作为所述多媒体信息推荐模型；

2.根据权利要求1所述的推荐方法，其特征在于，所述将训练样本用户获取多媒体信息的历史序列信息中的历史多媒体信息的嵌入向量和训练样本多媒体信息集合中的目标多媒体信息的嵌入向量，输入至神经网络模型的注意力机制层，得到所述训练样本用户的当前兴趣向量，包括：

3.一种多媒体信息的推荐装置，其特征在于，包括：

生成单元，用于根据所述目标用户对每一个所述多媒体信息的点击概率，生成推荐多媒体信息集合；

所述多媒体信息推荐模型的构建单元，包括：

确定单元，用于利用所述目标多媒体信息的预测点击概率与所述训练样本用户的真实喜好多媒体信息之间的误差，对所述神经网络模型进行调整，直至所述目标多媒体信息的预测点击概率与所述训练样本用户的真实喜好多媒体信息之间的误差满足预设的收敛条件，将调整后的神经网络模型作为所述多媒体信息推荐模型；

4.根据权利要求3所述的推荐装置，其特征在于，所述第三输入单元，包括：

5.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至2中任一所述的多媒体信息的推荐方法。

6.一种计算机存储介质，其特征在于，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1至2中任一所述的多媒体信息的推荐方法。