CN114528491A

CN114528491A - 信息处理方法、装置、计算机设备和存储介质

Info

Publication number: CN114528491A
Application number: CN202210153581.7A
Authority: CN
Inventors: 李卓聪
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-02-18
Filing date: 2022-02-18
Publication date: 2022-05-24

Abstract

本申请涉及一种信息处理方法、装置、计算机设备和存储介质。所述方法包括：获取样本用户数据，其包括第一数目个样本对象；通过特征提取模型提取样本对象的第一样本对象特征、样本对象的正样本的第一正样本特征和负样本的第一负样本特征，优化特征提取模型，获得训练后的特征提取模型；通过训练后的特征提取模型提取第一数目个样本对象的第二样本对象特征；通过多兴趣抽取模型对第二样本对象特征进行多兴趣抽取，获得第二数目个样本兴趣特征，优化获得训练后的多兴趣抽取模型，最终获得多兴趣特征提取模型。采用本方法可以使得样本对象特征具有区分度，提高多兴趣特征提取模型提取目标用户的兴趣特征的准确性，提高向目标用户进行兴趣推荐的效果。

Description

信息处理方法、装置、计算机设备和存储介质

技术领域

本申请涉及人工智能技术领域，特别是涉及一种信息处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

背景技术

随着人工智能技术的发展，在游戏、资讯、视频等各领域都可以基于用户的兴趣进行相关的推荐。而在大规模推荐系统中，无论是在物品的召回阶段还是后处理阶段，对于用户兴趣的建模是很有必要的。

传统技术中，一般是基于用户的历史点击序列的向量进行平均池化，在用户侧和物品侧分别输出一个维度相同的向量并进行内积，以此拟合预测用户对物品的点击兴趣。然而，这种方式预测的准确性不高，而且召回的物品的类型过于单一，从而导致对用户进行兴趣推荐的效果不佳。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高向用户进行兴趣推荐的效果的信息处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

一种信息处理方法，所述方法包括：

获取样本用户数据，所述样本用户数据包括样本行为数据，所述样本行为数据包括第一数目个样本对象；

通过特征提取模型提取所述样本对象的第一样本对象特征、所述样本对象的正样本的第一正样本特征、以及所述样本对象的负样本的第一负样本特征，并以所述样本对象特征与所述第一正样本特征相近、且所述样本对象特征与所述第一负样本特征远离为目标，优化所述特征提取模型，直至达到训练结束条件，获得训练后的特征提取模型；所述正样本为所述样本对象，所述负样本为随机选取的另一个样本对象；

通过训练后的所述特征提取模型提取所述第一数目个样本对象的第二样本对象特征；

通过多兴趣抽取模型对所述第一数目个所述第二样本对象特征进行多兴趣抽取，获得第二数目个样本兴趣特征，并基于所述第二数目个样本兴趣特征与对应的第二样本对象特征的相似度，优化所述多兴趣抽取模型，直至达到优化结束条件，获得训练后的多兴趣抽取模型；

通过训练后的所述特征提取模型和训练后的所述多兴趣抽取模型，获得多兴趣特征提取模型。

一种信息处理方法，所述方法包括：

获取目标用户的目标数据，所述目标数据包括历史行为数据以及属性数据，所述历史行为数据包括第一数目个行为对象；

通过多兴趣特征提取模型对所述目标数据进行多兴趣特征提取，获得所述目标用户的目标特征；所述多兴趣特征提取包括：通过所述多兴趣特征提取模型中的特征提取模型提取第一数目个所述行为对象的行为对象特征，通过所述多兴趣特征提取模型中的多兴趣抽取模型对第一数目个所述行为对象特征进行多兴趣抽取，获得所述第二数目个第一兴趣特征，并通过所述多兴趣特征提取模型提取所述属性数据的属性特征，将所述第二数目个所述第一兴趣特征分别与所述属性特征融合，获得所述目标用户的目标特征，所述目标特征包括所述第二数目个第二兴趣特征；所述多兴趣特征提取模型采用如上述的方法获得；

根据所述目标特征，确定待推荐给所述用户的目标推荐对象。

一种信息处理装置，所述装置包括：

样本数据获取模块，用于获取样本用户数据，所述样本用户数据包括样本行为数据，所述样本行为数据包括第一数目个样本对象；

特征提取模型训练模块，用于通过特征提取模型提取所述样本对象的第一样本对象特征、所述样本对象的正样本的第一正样本特征、以及所述样本对象的负样本的第一负样本特征，并以所述样本对象特征与所述第一正样本特征相近、且所述样本对象特征与所述第一负样本特征远离为目标，优化所述特征提取模型，直至达到训练结束条件，获得训练后的特征提取模型；所述正样本为所述样本对象，所述负样本为随机选取的另一个样本对象；

样本特征提取模块，用于通过训练后的所述特征提取模型提取所述第一数目个样本对象的第二样本对象特征；

多兴趣抽取模型训练模块，用于通过多兴趣抽取模型对所述第一数目个所述第二样本对象特征进行多兴趣抽取，获得第二数目个样本兴趣特征，并基于所述第二数目个样本兴趣特征与对应的第二样本对象特征的相似度，优化所述多兴趣抽取模型，直至达到优化结束条件，获得训练后的多兴趣抽取模型；

模型确定模块，用于通过训练后的所述特征提取模型和训练后的所述多兴趣抽取模型，获得多兴趣特征提取模型。

一种信息处理装置，所述装置包括：

目标数据获取模块，用于获取目标用户的目标数据，所述目标数据包括历史行为数据以及属性数据，所述历史行为数据包括第一数目个行为对象；

目标特征提取模块，用于通过多兴趣特征提取模型对所述目标数据进行多兴趣特征提取，获得所述目标用户的目标特征；所述多兴趣特征提取包括：通过所述多兴趣特征提取模型中的特征提取模型提取第一数目个所述行为对象的行为对象特征，通过所述多兴趣特征提取模型中的多兴趣抽取模型对第一数目个所述行为对象特征进行多兴趣抽取，获得所述第二数目个第一兴趣特征，并通过所述多兴趣特征提取模型提取所述属性数据的属性特征，将所述第二数目个所述第一兴趣特征分别与所述属性特征融合，获得所述目标用户的目标特征，所述目标特征包括所述第二数目个第二兴趣特征；所述多兴趣特征提取模型采用如上述的方法获得；

推荐对象确定模块，用于根据所述目标特征，确定待推荐给所述目标用户的目标推荐对象。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述的方法的步骤。

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现上述的方法的步骤。

一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现上述的方法的步骤。

上述信息处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品，通过在多兴趣特征提取模型的特征提取模型的训练过程中引入样本对象的正样本和负样本，再对特征提取模型进行训练，可以通过训练后的特征提取模型拉近相似的样本对象特征之间的距离，拉远不相似的样本对象特征之间的距离，从而使得样本对象特征的区分度更高。通过在多兴趣特征提取模型的多兴趣抽取模型的训练过程中使用具有区分度的样本对象特征进行训练，可以使得抽取得到的样本兴趣特征的准确性更高，从而，提高后续多兴趣特征提取模型提取目标用户的兴趣特征的准确性，进而，提高根据该目标用户的兴趣特征向目标用户进行兴趣推荐的效果。

附图说明

图1为一个实施例中信息处理方法的应用环境图；

图2为一个实施例中信息处理方法的流程示意图；

图3为一个实施例中特征提取模型的示意图；

图4为一个实施例中多兴趣抽取模型的示意图；

图5为另一个实施例中信息处理方法的流程示意图；

图6为一个实施例中多兴趣度特征提取模型的示意图；

图7为一个实施例中兴趣度预测模型的示意图；

图8为一个具体实施例中传统的信息处理方法的示意图；

图9为一个具体实施例中信息处理方法的示意图；

图10为一个实施例中信息处理装置的结构框图；

图11为另一个实施例中信息处理装置的结构框图；

图12为一个实施例中计算机设备的内部结构图；

图13为另一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

需要首先说明的是，本申请所涉及的用户的信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，例如，样本用户数据、样本行为数据、目标数据、历史行为数据、属性数据等，均为经用户授权或者经过各方充分授权的信息和数据。

在其中一个实施例中，本申请提供的信息处理方法，可以应用于如图1所示的应用环境中，该应用环境可以涉及同时终端102和服务器104，一些实施例中，还可以同时涉及终端106。其中，终端102和终端106分别可以通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104，也可以放在云上或其他网络服务器上。

具体地，服务器104可以通过终端102和/或终端106获取样本用户数据，样本用户数据包括样本行为数据，样本行为数据包括第一数目个样本对象，服务器104可以通过特征提取模型提取样本对象的第一样本对象特征、样本对象的正样本的第一正样本特征、以及样本对象的负样本的第一负样本特征，并以样本对象特征与第一正样本特征相近、且样本对象特征与第一负样本特征远离为目标，优化特征提取模型，直至达到训练结束条件，获得训练后的特征提取模型；正样本为样本对象，负样本为随机选取的另一个样本对象。

服务器104通过训练后的特征提取模型提取第一数目个样本对象的第二样本对象特征；通过多兴趣抽取模型对第一数目个第二样本对象特征进行多兴趣抽取，获得第二数目个样本兴趣特征，并基于第二数目个样本兴趣特征与对应的第二样本对象特征的相似度，优化多兴趣抽取模型，直至达到优化结束条件，获得训练后的多兴趣抽取模型；通过训练后的特征提取模型和训练后的多兴趣抽取模型，在服务器104获得多兴趣特征提取模型。

从而，以使用终端102的用户作为目标用户，服务器104向该目标用户进行兴趣推荐为例，服务器104可以通过终端102获取目标用户的目标数据，目标数据包括历史行为数据以及属性数据，历史行为数据包括第一数目个行为对象。

服务器104通过已获得的多兴趣特征提取模型对目标数据进行多兴趣特征提取，获得目标用户的目标特征；多兴趣特征提取包括：通过多兴趣特征提取模型中的特征提取模型提取第一数目个行为对象的行为对象特征，通过多兴趣特征提取模型中的多兴趣抽取模型对第一数目个行为对象特征进行多兴趣抽取，获得第二数目个第一兴趣特征，并通过多兴趣特征提取模型提取属性数据的属性特征，将第二数目个第一兴趣特征分别与属性特征融合，获得目标用户的目标特征，目标特征包括第二数目个第二兴趣特征；服务器104根据目标特征，确定待推荐给目标用户的目标推荐对象。进而，可以将目标推荐对象向终端102推送，以实现对目标用户进行兴趣推荐。

在另一些实施例中，在终端102和/或终端106的数据处理能力满足要求的情况下，在服务器104中训练获得多兴趣特征抽取模型之后，服务器104还可以将多兴趣特征抽取模型发送至终端102和/或终端106，从而，在终端102和/或终端106中进行目标用户的目标数据的相关数据处理，最终，确定待推荐给目标用户的目标待推荐对象，以实现对目标用户进行兴趣推荐。

其中，终端102和终端106可以但不限于是各种手机、电脑、智能语音交互设备、智能家电、车载终端和便携式可穿戴设备等，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本申请所涉及的实施例，可应用于云技术、人工智能等各种场景。例如，数据存储系统104可以为云存储系统，以存储各样本用户数据以及训练获得的多兴趣特征提取模型。

在其中一个实施例中，如图2所示，提供了一种信息处理方法，以该方法应用于图1中的服务器104为例进行说明，包括以下步骤：

步骤S202，获取样本用户数据，样本用户数据包括样本行为数据，样本行为数据包括第一数目个样本对象。

一个实施例中，样本用户数据是指模型的训练过程中作为训练样本的样本用户的数据，样本用户数据包括样本行为数据，样本行为数据包括但不限于是样本用户在各种网页、界面上的预设时长内的访问数据，具体可以包括点击、搜索和浏览的数据等。其中，预设时长可以根据模型训练精度、模型训练速度等实际技术需要进行设置，在此不做限制。在一些实施例中，样本用户数据还包括样本属性数据，样本属性数据包括但不限于是样本用户的姓名、性别、年龄、所在城市、和所在城市的城市等级等。需要说明的是，上述涉及的样本用户数据、样本行为数据、样本属性数据等均是经用户授权或者经过各方充分授权的信息和数据。

其中，将样本行为数据所包含的点击、搜索和浏览的各种物品称为样本对象，物品的类型包括但不限于是文字、图片等。由于样本行为数据的数据量较大，因此包含的样本对象的数目存在多个，将获取的样本行为数据中的样本对象的数目确定为第一数目，即样本行为数据包括第一数目个样本对象。第一数目可以根据实际技术需要进行设置，在此不做限制。一个实施例中，可以将第一数目表示为N，第一数目个样本对象表示为样本对象1、样本对象2……样本对象N。

步骤S204，通过特征提取模型提取样本对象的第一样本对象特征、样本对象的正样本的第一正样本特征、以及样本对象的负样本的第一负样本特征，并以样本对象特征与第一正样本特征相近、且样本对象特征与第一负样本特征远离为目标，优化特征提取模型，直至达到训练结束条件，获得训练后的特征提取模型；其中，正样本为样本对象，负样本为随机选取的另一个样本对象。

一个实施例中，为了分析和量化样本用户的兴趣所在，进一步实现后续的兴趣预测和推荐，需要先对获取的样本用户数据进行特征提取分析，将样本用户数据转化为可以量化的特征向量，具体可以采用特征提取模型进行量化。特征提取模型的模型结构和模型类型可以根据实际技术需要进行设置和选择。

为了使样本对象的特征之间具有更好的区分度，特征提取模型使用对比学习模型。具体地，使用普遍的特征提取模型，获得的样本对象的特征的分布比较均匀，而对比学习的思想是将相似的样本之间的距离拉近，将不相似的样本之间的距离拉开，相似的样本称为正样本，而不相似的样本称为负样本，对比学习的目标是要从样本中学习到一个好的语义表示空间，对比学习可以是无监督或者自监督学习，即本实施例的特征提取模型可以使得各个特征之间的区分度更高，该特征提取模型的对比学习方式也可以称为基于样本对象特征的对比学习。

其中，为了简化网络结构，同时抑制过拟合，特征提取模型可以采用结构更加简单的正则化处理后的全连接网络。正则化处理的类型可以根据实际技术需要进行设置，一个实施例中采用的是Dropout，即特征提取模型为带Dropout的全连接网络。Dropout是一种在学习过程中随机删除神经元的方法，训练时，随机选出隐藏层的神经元将其删除，被删除的神经元不再进行信号的传递，测试时，传递所有的神经元信号，对于各神经元的输出，需要乘以训练时的删除比例后再输出。因此，当同一个样本对象两次输入至特征提取模型时，由于Dropout的存在，其获得的样本对象的特征不完全相同。

由于需要根据样本对象的正样本和负样本进行对比学习，以拉近相似的样本之间的距离，拉远不相似的样本之间的距离，因此，需要构建样本对象的正样本和负样本，再进行后续的特征提取模型的训练。其中，正样本设置为样本对象自身，即样本对象输入特征提取模型两次，将样本对象的特征称为第一样本对象特征，将样本对象的正样本的特征称为第一正样本特征，负样本为随机选取的另一个样本对象，将样本对象的负样本的特征称为第一负样本特征。

可以理解的是，为了提高信息处理的效率，而且，特征提取模型的训练过程中，可能并未使用到所有输入的样本对象及其正样本和负样本，就已经训练结束，因此，并不一定需要针对每一个样本对象，均构建样本对象的正样本和负样本，在每次需要输入样本对象时，构建该样本对象的正样本和负样本进行输入即可。

一个实施例中，分别将样本对象、样本对象的正样本和负样本分别输入至特征提取模型，即可获得对应的特征，进而进行后续的特征提取模型的训练。以通过特征提取模型提取样本对象的第一样本对象特征为例，具体可以包括步骤S2041至步骤S2042。

步骤S2041，将样本对象输入特征提取模型，获得初始样本对象特征，特征提取模型为正则化处理后的全连接网络。

其中，特征提取模型为正则化处理后的全连接网络，即特征提取模型为带Dropout的全连接网络。将样本对象输入特征提取模型，将获得的样本对象的特征称为初始样本对象特征。同理，将样本对象的正样本输入特征提取模型，将获得的样本对象的特征称为初始正样本特征，将样本对象的负样本输入特征提取模型，将获得的样本对象的特征称为初始负样本特征。

由于样本对象的类型多样，获得的初始样本对象特征的维度可能不同，同理，获得的初始正样本特征和初始负样本特征的维度也可能不同，因此，需要对其维度进行统一，以便进行后续处理。

步骤S2042，将初始样本对象特征转化为预定维度向量的特征，获得第一样本对象特征。

其中，可以采用任意一种可实现的方式将初始样本对象特征转化为预定维度向量的特征，一个实施例中可以采用向量化处理层，即Embedding层，对初始样本对象特征进行编码，转化为预定维度向量的Embedding特征，预定维度可以根据实际技术需要进行设置，进而获得第一样本对象特征，即第一样本对象特征是低维稠密向量。即本实施例的特征提取模型是带有Dropout的全连接网络与Embedding层组成。同理，对初始正样本特征和初始负样本特征进行相类似的处理，分别获得第一正样本特征与第一负样本特征，具体过程在此不再赘述。

在通过特征提取模型提取样本对象的第一样本对象特征、样本对象的正样本的第一正样本特征、以及样本对象的负样本的第一负样本特征之后，需要对特征提取模型进行训练，即进行无监督或者自监督学习，以获得训练后的特征提取模型，便于后续针对于目标用户进行推荐使用。

具体地，以样本对象特征与第一正样本特征相近、且样本对象特征与第一负样本特征远离为目标，优化特征提取模型，直至达到训练结束条件，获得训练后的特征提取模型。

其中，训练结束条件可以根据实际技术需要进行设置，一个实施例中可以设置为测试集的损失收敛。在另外的实施例中，训练结束条件还可以设置为达到预先设定的迭代次数等。一个实施例中训练后的特征提取模型的损失函数表示如下：

其中，

h_i表示样本对象i的第一样本对象特征与样本对象i的正样本的第一正样本特征的乘积，h′_i表示扩充和复制的h_i，

表示样本对象i的负样本的第一负样本特征，τ为超参数。

步骤S206，通过训练后的特征提取模型提取第一数目个样本对象的第二样本对象特征。

一个实施例中，在获得训练后的特征提取模型之后，需要再次将第一数目个样本对象输入训练后的特征提取模型中，以获得第一数目个样本对象的第二样本对象特征，其中，第二样本对象特征是有区分度的特征，即相似的样本之间的距离被拉近，不相似的样本之间的距离被拉远。

其中，在经过特征提取模型的Embedding层之后，还可以将获得的第一数目个样本对象的第二样本对象特征进行串行化处理，也即，将第一数目个具有区分度的第二样本对象特征转化为对应的向量序列。一个实施例中，将向量序列表示为：

其中，I_u表示样本对象，

表示第二样本对象特征，E_U表示向量序列。

为了方便理解，本实施例将上述计算过程结合附图进行相关说明。如图3所示为特征提取模型的示意图。其中，特征提取模型采用的是正则化处理后的全连接网络，即带Dropout的全连接网络，构建样本对象的正样本和负样本，将样本对象、样本对象的正样本和负样本输入特征提取模型，分别提取得到第一样本对象特征、第一正样本特征以及第一负样本特征。以样本对象特征与第一正样本特征相近、且样本对象特征与第一负样本特征远离为目标，优化特征提取模型，直至达到训练结束条件，获得训练后的特征提取模型。

在获得训练后的特征提取模型之后，将各样本对象再次输入至模型中，获得各样本对象的具有区分度的第二样本对象特征，并对各第二样本对象特征进行了串行化处理，即第二样本对象特征均为预设维度的Embedding特征。

步骤S208，通过多兴趣抽取模型对第一数目个第二样本对象特征进行多兴趣抽取，获得第二数目个样本兴趣特征，并基于第二数目个样本兴趣特征与对应的第二样本对象特征的相似度，优化多兴趣抽取模型，直至达到优化结束条件，获得训练后的多兴趣抽取模型。

一个实施例中，可以从样本用户的特征中提取出样本用户的多兴趣向量，以充分表征用户的兴趣。具体地，可以采用多兴趣抽取模型进行提取，一个实施例中的多兴趣抽取模型可以选择Multi-Interest Extractor Layer模型，其主要基于动态路由实现，其模型结构和模型类型可以根据实际技术需要进行设置。本实施例中多兴趣抽取模型可以为capsule胶囊网络，对于capsule胶囊网络，一般是输入一组向量，对这组向量进行仿射变换，并进行加权求和，通过非线性映射函数进行处理，得到另一组向量的输出。

其中，需要先构建capsule胶囊网络，capsule胶囊网络的层数可以设置为两层或者三层，具体可以根据实际技术需要进行设置。一个实施例中，以capsule胶囊网络设置为两层为例，第一层和第二层分别为低层级capsule和高层级capsule，动态路由的核心目标即基于低层级capsule，通过迭代的方式计算得到高层级capsule。具体地，capsule胶囊网络的输入为训练后的特征提取模型的输出，即输入的是第一数目个第二样本对象特征。

一个实施例中，将输入的第二样本对象特征表示为

输入的第二样本对象特征的数量为第一数目，此处用m表示，l表示第l层，capsule胶囊网络的输出为样本兴趣特征，将样本兴趣特征表示为

首先，需要计算capsule胶囊网络的两层之间的路由权重，将路由权重表示为b_ij，计算公式为：

其中，S_ij表示可学习的全连接矩阵，该矩阵在模型训练过程中可以根据模型的损失进行自适应调节，每一个输入的第二样本对象特征对应一个单独的可学习的全连接矩阵。

表示全连接矩阵处理后的第二样本对象特征。

在确定路由权重之后，根据路由权重b_ij对

进行加权求和，计算出capsule胶囊网络的高层级capsule的候选输出向量

计算公式表示为：

其中，w_ij表示两层之间归一化处理后的路由权重，计算公式为：

在确定capsule胶囊网络的候选输出向量

之后，采用非线性映射函数对其进行处理，得到高层级capsule的输出

计算公式为：

其中，非线性映射函数可以根据实际技术需要进行设置，本实施例中采用的是squash函数。

需要说明的是，上述计算过程为capsule胶囊网络的一次迭代计算过程，还需要基于输出的样本兴趣特征与对应的第二样本对象特征的相似度，优化多兴趣抽取模型，调整第二样本对象特征对应的权重，具体地，下一次迭代过程中的第二样本对象对应的权重，可以在上一次迭代过程中的第二样本对象对应的权重的基础上进行更新，放大相似的第二样本对象对应的权重，直至达到优化结束条件，获得训练后的多兴趣抽取模型。

其中，优化结束条件可以根据实际技术需要进行设置，一个实施例中可以设置为样本兴趣特征与对应的第二样本对象特征的相似度阈值，还可以设置为高层级capsule的数值收敛。在获得训练后的多兴趣抽取模型时，即可获得输入的第一数目个第二样本对象特征对应的第二数目个样本兴趣特征，一个实施例中将样本兴趣特征对应的第二数目表示为K，其中，第二数目小于第一数目。

为了方便理解，本实施例将上述计算过程结合附图进行相关说明。如图4所示为多兴趣抽取模型的示意图，其中，图示中是以多兴趣抽取模型为两层的capsule胶囊网络为例进行说明，将特征向量i₁和i₂输入至capsule胶囊网络中，分别采用对应的可学习的全连接矩阵w₁和w₂对输入的特征向量i₁和i₂进行运算，获得对应的全连接矩阵处理后的特征向量u₁和u₂，计算公式表示为：

u₁＝w₁×i₁

u₂＝w₂×i₂

在模型第一次迭代时，设定全连接矩阵处理后的特征向量u₁和u₂对应的随机初始化的路由权重为c₀和d₀，根据路由权重进行加权求和，进而确定低层级capsule对应的候选输出向量s₁，计算公式表示为：

s₁＝c₀u₁+d₀u₂

采用非线性映射squash函数对候选输出向量s₁进行映射处理，得到高层级capsule的输出v，计算公式表示为：

在模型第二次迭代时，路由权重会在第一次迭代的路由权重的基础上进行更新，更新后的路由权重表示为：

c₁＝c₀+u₁v

在模型第三次迭代时，路由权重会在第二次迭代的路由权重的基础上进行更新，更新后的路由权重表示为：

c₂＝c₁+u₁v

该模型会进行多次迭代，采用动态路由提取样本用户的兴趣，直至达到优化结束条件，获得训练后的多兴趣抽取模型。

步骤S210，通过训练后的特征提取模型和训练后的多兴趣抽取模型，获得多兴趣特征提取模型。

其中，通过结合训练后的特征提取模型以及训练后的多兴趣抽取模型，共同确定出多兴趣特征提取模型，可以用于后续提取目标用户的兴趣特征。

上述信息处理方法中，通过获取样本用户数据，样本用户数据包括样本行为数据，样本行为数据包括第一数目个样本对象；通过特征提取模型提取样本对象的第一样本对象特征、样本对象的正样本的第一正样本特征、以及样本对象的负样本的第一负样本特征，并以样本对象特征与第一正样本特征相近、且样本对象特征与第一负样本特征远离为目标，优化特征提取模型，直至达到训练结束条件，获得训练后的特征提取模型；正样本为样本对象，负样本为随机选取的另一个样本对象；通过训练后的特征提取模型提取第一数目个样本对象的第二样本对象特征；通过多兴趣抽取模型对第一数目个第二样本对象特征进行多兴趣抽取，获得第二数目个样本兴趣特征，并基于第二数目个样本兴趣特征与对应的第二样本对象特征的相似度，优化多兴趣抽取模型，直至达到优化结束条件，获得训练后的多兴趣抽取模型；通过训练后的特征提取模型和训练后的多兴趣抽取模型，获得多兴趣特征提取模型。采用上述实施例的方法，通过在多兴趣特征提取模型的特征提取模型的训练过程中引入样本对象的正样本和负样本，再对特征提取模型进行训练，可以通过训练后的特征提取模型拉近相似的样本对象特征之间的距离，拉远不相似的样本对象特征之间的距离，从而使得样本对象特征的区分度更高。通过在多兴趣特征提取模型的多兴趣抽取模型的训练过程中使用具有区分度的样本对象特征进行训练，可以使得抽取得到的样本兴趣特征的准确性更高，从而，提高后续多兴趣特征提取模型提取目标用户的兴趣特征的准确性，进而提高根据该目标用户的兴趣特征向目标用户进行兴趣推荐的效果。

在训练获得多兴趣特征提取模型之后，可以使用多兴趣特征提取模型对目标用户进行兴趣推荐。

在其中一个实施例中，如图5所示，提供了一种信息处理方法，以该方法应用于图1中的服务器104为例进行说明，包括以下步骤：

步骤S502，获取目标用户的目标数据，目标数据包括历史行为数据以及属性数据，历史行为数据包括第一数目个行为对象。

将目标用户的数据称为目标数据，目标数据包括历史行为数据，历史行为数据包括但不限于是目标用户在各种网页、界面上的预设历史时长内的访问数据，具体可以包括点击、搜索和浏览的数据等。其中，预设历史时长可以根据实际技术需要进行设置，在此不做限制。目标数据还包括属性数据，属性数据包括但不限于是目标用户的姓名、性别、年龄、所在城市、和所在城市的城市等级等。需要说明的是，上述涉及的目标用户的目标数据、历史行为数据、属性数据等均是经用户授权或者经过各方充分授权的信息和数据。

其中，将目标行为数据所包含的点击、搜索和浏览的各种物品称为行为对象，物品的类型包括但不限于是文字、图片等。由于目标行为数据的数据量较大，因此包含的行为对象的数目存在多个，将获取的目标行为数据中的目标对象的数目确定为第一数目，即历史行为数据包括第一数目个行为对象。第一数目可以根据实际技术需要进行设置，在此不做限制。一个实施例中，可以将第一数目表示为N，第一数目个行为对象表示为行为对象1、行为对象2……行为对象N。

步骤S504，通过多兴趣特征提取模型对目标数据进行多兴趣特征提取，获得目标用户的目标特征；多兴趣特征提取包括：通过多兴趣特征提取模型中的特征提取模型提取第一数目个行为对象的行为对象特征，通过多兴趣特征提取模型中的多兴趣抽取模型对第一数目个行为对象特征进行多兴趣抽取，获得第二数目个第一兴趣特征，并通过多兴趣特征提取模型提取属性数据的属性特征，将第二数目个第一兴趣特征分别与属性特征融合，获得目标用户的目标特征，目标特征包括第二数目个第二兴趣特征；多兴趣特征提取模型采用步骤S202至步骤S210的方法获得。

一个实施例中，为了量化和表征用户的兴趣，通过多兴趣特征提取模型对目标数据进行多兴趣特征提取，将多兴趣特征提取模型提取的特征称为目标特征，该目标特征包含第二数目个第二兴趣特征。其中，如图6所示为多兴趣特征提取模型的示意图。多兴趣特征提取模型包括训练后的特征提取模型以及训练后的多兴趣抽取模型，使用多兴趣特征提取模型时，即先通过训练后的特征提取模型，对输入的第一数目个行为对象对应的特征进行特征提取，将提取得到的特征称为行为对象特征，行为对象特征的数量为第一数目，表示为N个，进而，将第一数目个行为对象特征输入至训练后的多兴趣抽取模型进行多兴趣抽取，将得到的特征称为第一兴趣特征，第一兴趣特征的数量为第二数目，表示为K个，其中，第二数目小于第一数目。

一个实施例中，为了更好的结合目标用户的属性数据以及多兴趣抽取模型获得的第一兴趣特征，提高后续预测召回的准确性，在获得第二数目的第一兴趣特征之后，还包括：通过多兴趣特征提取模型提取属性数据的属性特征，将第二数目个第一兴趣特征分别与属性特征融合，获得目标用户的目标特征，其中，目标特征包括第二数目个第二兴趣特征，目标特征可以用于表征用户对某一方面的兴趣。

具体地，特征融合的方式可以采用任意一种可实现的方式进行，以采用拼接的方式为例，将第二数目个第一兴趣特征分别与属性特征融合，获得目标用户的目标特征，包括：将第二数目个第一兴趣特征分别与属性特征进行拼接，获得目标用户的目标特征。

其中，在将第二数目个第一兴趣特征分别与属性特征进行拼接时，属性特征与第一兴趣特征的位置可以根据实际情况进行设置，一个实施例中属性特征可以拼接在第一兴趣特征的后面。

一个实施例中，特征拼接时，可以使得第一兴趣特征的维度与属性特征的维度相同，以提高拼接后获得的目标特征的准确性。参照前述实施例可知，经过多兴趣特征提取模型中的训练后的特征提取模型进行特征提取之后，获得的第一数目行为对象特征是Embedding特征，因此，可以对属性数据同样需要进行相应的Embedding处理，获得的属性特征同样是Embedding特征，以确保获得的第一兴趣特征的维度与属性特征的维度的一致性。

其中，将第二数目个第一兴趣特征分别与属性特征进行拼接之后，该拼接后的特征向量还需要经过两层全连接层进行处理，以最终获得目标用户的目标特征。其中，两层全连接层的激活函数可以根据实际技术需要设置，一个实施例中激活函数设置为线性整流(Relu)函数，其可以使得最终获得的目标用户的目标特征更具有代表性，提高网络的泛化能力，缓解过拟合。

步骤S506，根据目标特征，确定待推荐给目标用户的目标推荐对象。

一个实施例中，将最终推荐给用户的对象称为目标推荐对象，目标推荐对象可以包括一个或者多个。

具体地，在获得目标特征后，根据目标特征，确定待推荐给目标用户的目标推荐对象时，可以用不同的方式进行。其中一种，可以是采用召回的方式，即根据目标特征，召回该目标特征语义相近的多个物品，将召回的多个物品作为待推荐对象，从各待推荐对象中确定最终的目标推荐对象。另外一种，可以是采用预测的方式，即根据目标特征，预测该目标用户对于一个或者多个确定的待推荐对象的兴趣度，兴趣度可以表征该目标用户对待推荐对象进行点击和浏览的概率，进而，从待推荐对象中确定最终的目标推荐对象。以下分别就这两种方式进行举例说明。应当理解的是，在其他实施例中，在获得目标特征后，也可以采用其他的方式确定目标推荐对象。

一个实施例中，若采用召回的方式确定目标推荐对象，此时，上述根据目标特征，确定待推荐给目标用户的目标推荐对象，可以包括步骤S5061至步骤S5062。

步骤S5061，将各第二兴趣特征分别与各待推荐对象的待推荐对象特征进行相似度匹配，获得各第二兴趣特征匹配的待推荐对象。

一个实施例中，相似度匹配可以是根据特征之间的余弦相似度进行匹配。具体地，对于每一个第二兴趣特征，计算第二兴趣特征与各待推荐对象的待推荐对象特征之间的余弦相似度，余弦相似度的数值越接近1，就表明夹角越接近0度，即第二兴趣特征与待推荐对象特征之间越相似。其中，获得各第二兴趣特征匹配的推荐对象，也即确定与各第二兴趣特征最相似的待推荐对象特征。其中，每个第二兴趣特征匹配的待推荐对象的数目不限，可以为一个也可以是大于一个的多个。

步骤S5062，对各第二兴趣特征匹配的待推荐对象进行后处理，获得待推荐给目标用户的目标推荐对象。

一个实施例中，在获取各第二兴趣向量分别匹配的多个待推荐对象之后，需要对待推荐对象进行后处理，以获得待推荐给目标用户的目标推荐对象。其中，后处理的方式包括但不限于是筛选、排序等方式，具体可以根据实际技术需要进行选择。结合兴趣推荐的实际情况，最终确定的待推荐给目标用户的目标推荐对象可以是一个或者多个，在此不做限制。

基于如上所述的方式，可以召回最相似的预设数量个待推荐对象特征对应的待推荐对象，即获得的待推荐对象包括多个。

其中，预设数量可以根据实际技术需要进行设置，一个实施例中可以设置为N个。确定最相似的预设数量个待推荐对象特征，并召回最相似的预设数量个待推荐对象特征对应的待推荐对象的方式，可以选择任意一种可实现的方式，一个实施例中可以采用向量检索的方式实现，向量检索的方式可以根据实际技术需要进行选择。例如，可以采用Faiss检索的方式。Faiss是一种针对聚类和相似性搜索库，能够为稠密向量提供高效相似度搜索和聚类，支持十亿级别向量的搜索，是目前最为成熟的近似近邻搜索库，其包含多种搜索任意大小向量集的算法，以及用于算法评估和参数调整的支持代码，其功能包括相似度搜索。

一个实施例中，若采用预测的方式确定目标推荐对象，此时，上述根据目标特征，确定待推荐给目标用户的目标推荐对象，还可以包括步骤S5063至步骤S5064。

步骤S5063，对第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行运算，获得目标用户对待推荐对象的兴趣度，运算包括：对第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行加权求和，获得目标加权特征；并将目标加权特征与待推荐对象的待推荐对象特征进行点积运算，获得目标用户对待推荐对象的兴趣度。

一个实施例中，对于一个确定的待推荐对象，可以对目标用户的目标特征中的第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行运算，以获得目标用户对该待推荐对象的兴趣度，该兴趣度用于表征目标用户对该推荐对象的兴趣。具体地，对第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行运算，获得目标用户对待推荐对象的兴趣度，包括：通过兴趣度预测模型对各目标特征与待推荐对象的待推荐对象特征进行运算，获得目标用户对待推荐对象的兴趣。

其中，由于一个目标用户存在多个第二兴趣特征，而不同的第二兴趣特征可能对应于不同的兴趣，因此，本实施例中的兴趣度预测模型可以采用包含注意力预测模型的模型，注意力预测模型即Label-aware Attention Layer，其采用的是Attention方式，用以确定目标用户更感兴趣的内容。

一个实施例中，通过兴趣度预测模型对第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行运算，其中，运算包括：对第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行加权求和，获得目标加权特征；并将目标加权特征与待推荐对象的待推荐对象特征进行点积运算，获得目标用户对待推荐对象的兴趣度。

具体地，使用Label-aware Attention Layer来计算第二数目个第二兴趣特征与待推荐对象的待推荐对象特征的相关性，赋予第二兴趣特征不同的权重。其中，将目标加权特征表示为

上述加权求和的运算过程可以表示为：

其中，

表示待推荐对象特征，V_u表示第二兴趣特征，p为超参数，softmax表示归一化处理。

在确定目标加权特征

之后，再与待推荐对象特征进行点积运算，以获得目标用户对待推荐对象的兴趣度。

一个实施例中，兴趣度预测模型的确定方式，包括步骤S5064至步骤S5066。

步骤S5064，通过注意力预测模型对样本目标特征与样本对象特征进行加权求和，获得样本目标加权特征；样本目标特征通过多兴趣特征提取模型对样本用户数据进行多兴趣特征提取获得，样本目标特征包括第二数目个样本第二兴趣特征。

其中，注意力预测模型即Label-aware Attention Layer，在兴趣度预测模型的训练过程中，其是对样本目标特征与确定的样本对象特征进行加权求和，获得样本目标加权特征，加权求和的具体计算方式与上述实施例中的方式相同，在此不再赘述。

需要说明的是，在兴趣度预测模型训练时，多兴趣特征提取模型已是预先训练好的模型，因此，样本目标特征可以是获取的公开的数据集，还可以是样本用户数据输入至多兴趣特征提取模型后处理得到的特征，即样本目标特征可以通过多兴趣特征提取模型对样本用户数据进行多兴趣特征提取获得，样本目标特征包括第二数目个样本第二兴趣特征。

步骤S5065，通过特征映射模型提取样本目标加权特征的样本用户映射特征、样本目标加权特征的正样本的第二正样本特征、以及样本目标加权特征的负样本的第二负样本特征，并以样本用户映射特征与第二正样本特征相近、且样本对象特征与第二负样本特征远离为目标，优化特征映射模型，直至达到训练结束条件，获得训练后的特征映射模型。

一个实施例中，为了提高不同目标用户的用户向量之间的区分度，提高兴趣度确定的准确性，特征映射模型与特征提取模型类似，特征映射模型使用对比学习模型，特征映射模型的模型结构可以与特征提取模型的模型结构相同，即采用正则化处理的全连接网络。正则化处理的类型可以根据实际技术需要进行设置，一个实施例中采用的是Dropout，即特征映射模型为带Dropout的全连接网络，该特征映射模型的对比学习方式也可以称为基于目标加权特征的对比学习。

其中，对比学习需要构建样本目标加权特征的正样本和负样本，正样本设置为样本目标加权特征本身，负样本设置为随机选取的另一个样本目标加权特征，将样本目标加权特征经过提取后的特征称为样本映射特征，将样本目标加权特征的正样本的特征称为第二正样本特征，将样本目标加权特征的负样本的特征称为第二负样本特征。具体地，通过特征映射模型提取样本目标加权特征的样本用户映射特征、样本目标加权特征的正样本的第二正样本特征、以及样本目标加权特征的负样本的第二负样本特征。

具体地，对比学习的目标是拉近相似的样本目标加权特征之间的距离，拉远不相似的样本目标加权特征之间的距离。即以样本用户映射特征与第二正样本特征相近、且样本对象特征与第二负样本特征远离为目标，优化特征映射模型，直至达到训练结束条件，获得训练后的特征映射模型。

其中，训练结束条件可以根据实际技术需要进行设置，一个实施例中可以设置为测试集的损失收敛。在另外的实施例中，训练结束条件还可以设置为达到预先设定的迭代次数等。在达到训练结束条件之后，训练后的特征映射模型的损失函数表示如下：

其中，

h_i表示样本用户映射特征与第二正样本特征相近的乘积，h′_i表示扩充和复制的h_i，

表示第二负样本特征，τ为超参数。

步骤S5066，通过注意力预测模型与训练后的特征映射模型，确定兴趣度预测模型。

其中，通过注意力预测模型与训练后的特征映射模型，确定的兴趣度预测模型，包含注意力预测模型与训练后的特征映射模型。

基于如上所述的实施例，在训练获得兴趣度预测模型的过程中，可以结合特征映射模型对各用户的目标加权特征进行特征映射，并将训练后的特征映射模型的损失作为注意力预测模型的辅助损失，也即，兴趣度预测模型包括注意力预测模型与训练后的特征映射模型，提高了兴趣度确定的准确性。

一个实施例中，在兴趣度预测模型中的特征映射模型训练结束后，在使用训练得到的兴趣度预测模型对第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行运算时，具体可以是：对第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行加权求和，获得目标加权特征；将获得的目标加权特征输入至训练后的特征映射模型进行处理，并将获得的特征映射模型处理后得到的目标加权特征与待推荐对象的待推荐对象特征进行点积运算，获得目标用户对待推荐对象的兴趣度。

为了方便理解，本实施例将上述计算过程结合附图进行相关说明。如图7所示为兴趣度预测模型的示意图，其中，兴趣度预测模型包括注意力预测模型和训练后的特征映射模型。该目标用户的目标特征包括第二数目个兴趣特征1、2……K，通过注意力预测模型对用户的各兴趣特征与待推荐对象的待推荐对象特征X进行运算，确定用户的各兴趣特征对应的权重α₁、α₂……α_k，进而确定归一化处理后的权重α′₁、α′₂……α′_k，根据兴趣特征及其对应的归一化处理后的权重，对各兴趣特征与待推荐对象特征进行加权求和，获得目标加权特征U。采用训练后的特征映射模型对目标加权特征U进行处理，得到处理后的目标加权特征U，将处理后的目标加权特征U与待推荐对象的待推荐对象特征X进行点积运算，获得该目标用户对待推荐对象的兴趣度P。

其中，在对特征映射模型进行训练时，通过构建样本用户的目标加权特征U的正样本和负样本，通过特征映射模型提取目标加权特征U的用户映射特征U1、目标加权特征的正样本对应的用户映射特征U’、以及目标加权特征的负样本对应的目标加权特征Y，并以用户映射特征U1与目标加权特征U’相近、且用户映射特征U1与目标加权特征Y远离为目标，优化特征映射模型，直至达到训练结束条件，获得训练后的特征映射模型。

步骤S5064，根据各待推荐对象的兴趣度，从各待推荐对象中筛选确定待推荐给目标用户的目标推荐对象。

一个实施例中，兴趣度可以表征该目标用户对于待推荐对象进行点击和浏览的概率，因此，可以根据各待推荐对象的兴趣度，从各待推荐对象中筛选确定待推荐给目标用户的目标推荐对象。其中，可以采用任意一种可实现的方式进行筛选处理，结合实际情况，推荐给目标用户的目标推荐对象可以是一个或者多个。

采用上述实施例的信息处理方法，通过多兴趣特征提取模块，可以提取获得目标对象的具有区分度的多个兴趣特征，从而，在通过多个兴趣特征确定待推荐给目标用户的目标推荐对象时，可以避免推荐的对象的类型过于单一，提高对目标用户进行兴趣推荐的效果，进一步还可以提高用户体验。

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及具体实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

以向目标用户进行兴趣推荐为例，传统技术中，采用的是深度召回模型DSSM(DeepStructured Semantic Models)对目标用户进行兴趣推荐，其原理是基于用户的历史点击序列的向量进行平均池化，用户侧和物品侧分别输出一个维度相同的向量进行内积，以此拟合用户的点击兴趣。具体地，如图8所示为传统的信息处理方法的示意图，其中，Q表示目标用户的历史行为数据，XQ表示历史行为数据的特征，D表示待推荐对象，XD表示待推荐对象的特征，W1、W2、W3、W4表示对上述的特征进行处理过程中的权重，YQ表示最终获得的用户的兴趣特征，YD表示最终获得的待推荐对象的待推荐对象特征，将YQ与YD进行点积计算，以拟合目标用户对待推荐对象的点击兴趣，也即兴趣度。然而，这种方式用户侧向量仅有一个，存在召回的待推荐对象的类型过于单一的问题。

一个具体实施例中，本实施例提供的信息处理方法主要包括模型训练阶段和模型运行阶段，其中，通过模型训练阶段训练获得多兴趣特征提取模型，通过模型运行阶段运行多兴趣特征提取模型，进而实现向目标用户进行兴趣推荐。

如图9所示为信息处理方法的示意图，以模型训练阶段训练获得多兴趣特征提取模型为例进行说明，步骤如下：

获取样本用户数据，样本用户数据包括样本行为数据，样本行为数据包括第一数目个样本对象；其中，样本行为数据包括样本用户点击、搜索和浏览的数据，样本对象为样本行为数据对应的物品。

通过对比学习的方式，构建样本对象的正样本和负样本，其中，正样本为样本对象，即样本对象输入至特征提取模型两次，负样本为随机选取的另一个样本对象。

通过特征提取模型，提取样本对象的第一样本对象特征A、样本对象的正样本的第一正样本特征A′、以及样本对象的负样本的第一负样本特征B，其中，特征提取模型为带有Dropout的全连接网络。

以样本对象特征A与第一正样本特征A′相近、且样本对象特征A与第一负样本特征远离B为目标，优化特征提取模型，直至达到训练结束条件，获得训练后的特征提取模型；其中，训练结束条件可以根据实际技术需要进行设置，一个实施例中设置为测试集的损失收敛；训练后的特征提取模型的损失函数表示如下：

其中，

表示样本对象i的负样本的第一负样本特征，τ为超参数。

获得训练后的特征提取模型后，将第一数目个样本对象再次输入至训练后的特征提取模型，通过训练后的特征提取模型提取第一数目个样本对象的第二样本对象特征；其中，特征提取模型还包括Embedding层，将第二样本对象特征转化为对应的向量序列，向量序列表示为：

其中，I_u表示样本对象，

表示第二样本对象特征，E_U表示向量序列。

构建多兴趣抽取模型，其中，多兴趣抽取模型为Multi-Interest ExtractorLayer，一个实施例中选择的是capsule胶囊网络，将第一数目个第二样本对象特征输入至多兴趣抽取模型，通过多兴趣抽取模型对第一数目个第二样本对象特征进行多兴趣抽取，获得第二数目个样本兴趣特征；基于第二数目个样本兴趣特征与对应的第二样本对象特征的相似度，优化多兴趣抽取模型，直至达到优化结束条件，获得训练后的多兴趣抽取模型。

一个实施例中，以多兴趣抽取模型的第一次迭代为例，将输入的m组第二样本对象特征表示为

l表示第l层，将capsule胶囊网络输出的样本兴趣特征表示为

计算capsule胶囊网络的两层之间的路由权重b_ij，其中，计算公式为：

其中，S_ij表示可学习的全连接矩阵，

表示全连接矩阵处理后的第二样本对象特征。

根据路由权重b_ij对

计算公式表示为：

在确定capsule胶囊网络的候选输出向量

之后，采用非线性映射squash函数对其进行处理，得到高层级capsule的输出

计算公式为：

通过多兴趣抽取模型的多次迭代计算，优化多兴趣抽取模型，在达到优化结束条件时，获得训练后的多兴趣抽取模型，多兴趣特征提取模型包括训练后的特征提取模型和训练后的多兴趣抽取模型。

以模型运行阶段，通过多兴趣特征提取模型对目标用户进行兴趣推荐为例进行说明，步骤如下：

获取目标用户的目标数据，目标数据包括历史行为数据以及属性数据，历史行为数据包括第一数目个行为对象；其中，行为对象即目标用户点击过的物品，图9中表示为物品1、物品2……物品N，属性数据包括性别、年龄、所在城市、以及所在城市的城市等级。

通过多兴趣特征提取模型对目标数据进行多兴趣特征提取，获得目标用户的目标特征，目标特征包括第二数目个第二兴趣特征。

其中，多兴趣特征提取包括：通过多兴趣特征提取模型中的特征提取模型提取物品1、物品2……物品N的行为对象特征，获得N(第一数目)个行为对象特征。以针对物品1为例，将物品1的信息输入至正则化处理后的全连接网络，提取得到对应的行为对象特征。

通过多兴趣特征提取模型中的多兴趣抽取模型对第一数目个行为对象特征进行多兴趣抽取，获得第二数目个第一兴趣特征；即经过多兴趣抽取后得到多兴趣特征向量1、特征向量2……特征向量K。

通过多兴趣特征提取模型提取属性数据的属性特征，将第二数目个第一兴趣特征分别与属性特征融合，获得目标用户的目标特征；其中，一个实施例中，特征融合的方式为分别将第一兴趣特征与属性特征进行拼接，并经过两层全连接层处理后，获得目标用户的目标特征，目标特征包括第二数目个第二兴趣特征，一个实施例中，两层全连接层的激活函数为Relu函数。

根据目标特征，确定待推荐给目标用户的目标推荐对象；其中，此处的确定方式包括两种，一种是采用召回的方式，对每个目标特征分别召回与目标特征语义相近的待推荐对象，另一种是采用预测的方式，根据目标特征预测该目标用户对于待推荐对象的兴趣度，以下分别针对两种方式进行说明。

一个实施例中，若采用召回的方式，可以采用Faiss检索的方式将各第二兴趣特征分别与各待推荐对象的待推荐对象特征进行相似度匹配，获得各第二兴趣特征匹配的待推荐对象；对各第二兴趣特征匹配的待推荐对象进行筛选和排序等后处理步骤，获得待推荐给目标用户的目标推荐对象，其中，目标推荐对象可以是一个或者多个。

一个实施例中，若采用预测的方式，可以通过兴趣度预测模型对第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行运算，获得目标用户对待推荐对象的兴趣度；其中，兴趣度预测模型包含注意力预测模型和训练后的特征映射模型，注意力预测模型即Label-aware Attention Layer。

具体地，通过注意力预测模型对第二数目个第二兴趣特征与待推荐对象的待推荐对象特征进行加权求和，获得目标加权特征

上述运算过程可以表示为：

其中，

采用训练后的特征映射模型对目标加权特征进行处理，获得处理后的目标加权特征；并将处理后的目标加权特征分别与待推荐对象的待推荐对象特征进行点积运算，获得目标用户对待推荐对象的兴趣度；其中，兴趣度预测模型的确定方式包括：通过注意力预测模型对样本目标特征与样本对象特征进行加权求和，获得样本目标加权特征；样本目标特征通过多兴趣特征提取模型对样本用户数据进行多兴趣特征提取获得，样本目标特征包括第二数目个样本第二兴趣特征；构建样本目标特征的正样本和负样本，正样本为样本目标特征，负样本为随机选取的另一个样本目标加权特征，通过特征映射模型提取样本目标加权特征的样本用户映射特征、样本目标加权特征的正样本的第二正样本特征、以及样本目标加权特征的负样本的第二负样本特征，并以样本用户映射特征与第二正样本特征相近、且样本对象特征与第二负样本特征远离为目标，优化特征映射模型，直至达到训练结束条件，获得训练后的特征映射模型；通过注意力预测模型与训练后的特征映射模型，即可获得兴趣度预测模型。

应该理解的是，虽然上述实施例涉及的各流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述实施例涉及的各流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请还提供了一种用于实现上述实施例涉及的信息处理方法的信息处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个信息处理装置实施例中的具体限定可以参见上文中对于信息处理方法的限定，在此不再赘述。

在其中一个实施例中，如图10所示，提供了一种信息处理装置10，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：样本数据获取模块1010、特征提取模型训练模块1020、样本特征提取模块1030、多兴趣抽取模型训练模块1040和模型确定模块1050，其中：

样本数据获取模块1010，用于获取样本用户数据，所述样本用户数据包括样本行为数据，所述样本行为数据包括第一数目个样本对象。

特征提取模型训练模块1020，用于通过特征提取模型提取所述样本对象的第一样本对象特征、所述样本对象的正样本的第一正样本特征、以及所述样本对象的负样本的第一负样本特征，并以所述样本对象特征与所述第一正样本特征相近、且所述样本对象特征与所述第一负样本特征远离为目标，优化所述特征提取模型，直至达到训练结束条件，获得训练后的特征提取模型；所述正样本为所述样本对象，所述负样本为随机选取的另一个样本对象。

样本特征提取模块1030，用于通过训练后的所述特征提取模型提取所述第一数目个样本对象的第二样本对象特征。

多兴趣抽取模型训练模块1040，用于通过多兴趣抽取模型对所述第一数目个所述第二样本对象特征进行多兴趣抽取，获得第二数目个样本兴趣特征，并基于所述第二数目个样本兴趣特征与对应的第二样本对象特征的相似度，优化所述多兴趣抽取模型，直至达到优化结束条件，获得训练后的多兴趣抽取模型。

模型确定模块1050，用于通过训练后的所述特征提取模型和训练后的所述多兴趣抽取模型，获得多兴趣特征提取模型。

在其中一个实施例中，所述特征提取模型训练模块1020，用于将所述样本对象输入所述特征提取模型，获得初始样本对象特征，所述特征提取模型为正则化处理后的全连接网络；将所述初始样本对象特征转化为预定维度向量的特征，获得所述第一样本对象特征。

在其中一个实施例中，如图11所示，提供了一种信息处理装置11，该装置可以采用软件模块或硬件模块，或者是二者的结合成为计算机设备的一部分，该装置具体包括：目标数据获取模块1110、目标特征提取模块1120和推荐对象确定模块1130，其中：

目标数据获取模块1110，用于获取目标用户的目标数据，所述目标数据包括历史行为数据以及属性数据，所述历史行为数据包括第一数目个行为对象。

目标特征提取模块1120，用于通过多兴趣特征提取模型对所述目标数据进行多兴趣特征提取，获得所述目标用户的目标特征；所述多兴趣特征提取包括：通过所述多兴趣特征提取模型中的特征提取模型提取第一数目个所述行为对象的行为对象特征，通过所述多兴趣特征提取模型中的多兴趣抽取模型对第一数目个所述行为对象特征进行多兴趣抽取，获得所述第二数目个第一兴趣特征，并通过所述多兴趣特征提取模型提取所述属性数据的属性特征，将所述第二数目个所述第一兴趣特征分别与所述属性特征融合，获得所述目标用户的目标特征，所述目标特征包括所述第二数目个第二兴趣特征。

推荐对象确定模块1130，用于根据所述目标特征，确定待推荐给所述目标用户的目标推荐对象。

在其中一个实施例中，所述信息处理装置11还包括所述信息处理装置10。

在其中一个实施例中，所述推荐对象确定模块1130，用于将各所述第二兴趣特征分别与各待推荐对象的待推荐对象特征进行相似度匹配，获得各所述第二兴趣特征匹配的待推荐对象；对各所述第二兴趣特征匹配的所述待推荐对象进行后处理，获得待推荐给所述目标用户的目标推荐对象。

在其中一个实施例中，所述推荐对象确定模块1130，还用于对所述第二数目个所述第二兴趣特征与待推荐对象的待推荐对象特征进行运算，获得所述目标用户对所述待推荐对象的兴趣度，所述运算包括：对所述第二数目个所述第二兴趣特征与所述待推荐对象的所述待推荐对象特征进行加权求和，获得目标加权特征；并将所述目标加权特征与所述待推荐对象的所述待推荐对象特征进行点积运算，获得所述目标用户对所述待推荐对象的兴趣度；根据各所述待推荐对象的兴趣度，从各所述待推荐对象中筛选确定待推荐给所述目标用户的目标推荐对象。

在其中一个实施例中，所述推荐对象确定模块1130，还用于通过兴趣度预测模型对所述第二数目个所述第二兴趣特征与待推荐对象的待推荐对象特征进行运算，获得所述目标用户对所述待推荐对象的兴趣度。

在其中一个实施例中，所述推荐对象确定模块1130，还包括：兴趣度预测模型确定模块。

在其中一个实施例中，所述兴趣度预测模型确定模块，用于通过注意力预测模型对样本目标特征与样本对象特征进行加权求和，获得样本目标加权特征；所述样本目标特征通过所述多兴趣特征提取模型对样本用户数据进行多兴趣特征提取获得，所述样本目标特征包括第二数目个样本第二兴趣特征；通过特征映射模型提取所述样本目标加权特征的样本用户映射特征、所述样本目标加权特征的正样本的第二正样本特征、以及所述样本目标加权特征的负样本的第二负样本特征，并以所述样本用户映射特征与所述第二正样本特征相近、且所述样本对象特征与所述第二负样本特征远离为目标，优化所述特征映射模型，直至达到训练结束条件，获得训练后的特征映射模型；通过训练后的所述特征映射模型对所述样本目标加权特征进行处理，获得处理后的样本目标加权特征；将处理后的各所述样本目标加权特征分别与所述样本对象特征进行点积运算，获得对应的各样本兴趣度；通过所述注意力预测模型与训练后的所述特征映射模型，确定所述兴趣度预测模型。

关于信息处理装置的具体限定可以参见上文中对于信息处理方法的限定，在此不再赘述。上述信息处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在其中一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储信息处理数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息处理方法。

在其中一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种信息处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图12和图13中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在其中一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在其中一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在其中一个实施例中，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方法实施例中的步骤。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，例如，样本行为数据、目标数据等，均为经用户授权或者经过各方充分授权的信息和数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种信息处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述通过特征提取模型提取所述样本对象的第一样本对象特征，包括：

将所述样本对象输入所述特征提取模型，获得初始样本对象特征，所述特征提取模型为正则化处理后的全连接网络；

将所述初始样本对象特征转化为预定维度向量的特征，获得所述第一样本对象特征。

3.一种信息处理方法，其特征在于，所述方法包括：

通过多兴趣特征提取模型对所述目标数据进行多兴趣特征提取，获得所述目标用户的目标特征；所述多兴趣特征提取包括：通过所述多兴趣特征提取模型中的特征提取模型提取第一数目个所述行为对象的行为对象特征，通过所述多兴趣特征提取模型中的多兴趣抽取模型对第一数目个所述行为对象特征进行多兴趣抽取，获得所述第二数目个第一兴趣特征，并通过所述多兴趣特征提取模型提取所述属性数据的属性特征，将所述第二数目个所述第一兴趣特征分别与所述属性特征融合，获得所述目标用户的目标特征，所述目标特征包括所述第二数目个第二兴趣特征；所述多兴趣特征提取模型采用如权利要求1所述的方法获得；

根据所述目标特征，确定待推荐给所述目标用户的目标推荐对象。

4.根据权利要求3所述的方法，其特征在于，所述将所述第二数目个所述第一兴趣特征分别与所述属性特征融合，获得所述目标用户的目标特征，包括：

将所述第二数目个所述第一兴趣特征分别与所述属性特征进行拼接，获得所述目标用户的目标特征。

5.根据权利要求3所述的方法，其特征在于，所述根据所述目标特征，确定待推荐给所述目标用户的目标推荐对象，包括：

将各所述第二兴趣特征分别与各待推荐对象的待推荐对象特征进行相似度匹配，获得各所述第二兴趣特征匹配的待推荐对象；

对各所述第二兴趣特征匹配的所述待推荐对象进行后处理，获得待推荐给所述目标用户的目标推荐对象。

6.根据权利要求3所述的方法，其特征在于，所述根据所述目标特征，确定待推荐给所述目标用户的目标推荐对象，还包括：

对所述第二数目个所述第二兴趣特征与待推荐对象的待推荐对象特征进行运算，获得所述目标用户对所述待推荐对象的兴趣度，所述运算包括：对所述第二数目个所述第二兴趣特征与所述待推荐对象的所述待推荐对象特征进行加权求和，获得目标加权特征；并将所述目标加权特征与所述待推荐对象的所述待推荐对象特征进行点积运算，获得所述目标用户对所述待推荐对象的兴趣度；

根据各所述待推荐对象的兴趣度，从各所述待推荐对象中筛选确定待推荐给所述目标用户的目标推荐对象。

7.根据权利要求6的方法，其特征在于，所述对所述第二数目个所述第二兴趣特征与待推荐对象的待推荐对象特征进行运算，获得所述目标用户对所述待推荐对象的兴趣度，包括：

通过兴趣度预测模型对各所述第二数目个所述第二兴趣特征与待推荐对象的待推荐对象特征进行运算，获得所述目标用户对所述待推荐对象的兴趣度；

所述兴趣度预测模型的确定方式包括：

通过注意力预测模型对样本目标特征与样本对象特征进行加权求和，获得样本目标加权特征；所述样本目标特征通过所述多兴趣特征提取模型对样本用户数据进行多兴趣特征提取获得，所述样本目标特征包括第二数目个样本第二兴趣特征；

通过特征映射模型提取所述样本目标加权特征的样本用户映射特征、所述样本目标加权特征的正样本的第二正样本特征、以及所述样本目标加权特征的负样本的第二负样本特征，并以所述样本用户映射特征与所述第二正样本特征相近、且所述样本对象特征与所述第二负样本特征远离为目标，优化所述特征映射模型，直至达到训练结束条件，获得训练后的特征映射模型；

通过所述注意力预测模型与训练后的所述特征映射模型，确定所述兴趣度预测模型。

8.根据权利要求7所述的方法，其特征在于，所述通过兴趣度预测模型对各所述第二数目个所述第二兴趣特征与待推荐对象的待推荐对象特征进行运算，获得所述目标用户对所述待推荐对象的兴趣度，包括：

对所述第二数目个所述第二兴趣特征与待推荐对象的待推荐对象特征进行加权求和，获得目标加权特征；

将获得的所述目标加权特征输入至训练后的所述特征映射模型进行处理；

将获得的所述特征映射模型处理后得到的目标加权特征与待推荐对象的待推荐对象特征进行点积运算，获得所述目标用户对所述待推荐对象的兴趣度。

9.一种信息处理装置，其特征在于，所述装置包括：

10.一种信息处理装置，其特征在于，所述装置包括：

目标特征提取模块，用于通过多兴趣特征提取模型对所述目标数据进行多兴趣特征提取，获得所述目标用户的目标特征；所述多兴趣特征提取包括：通过所述多兴趣特征提取模型中的特征提取模型提取第一数目个所述行为对象的行为对象特征，通过所述多兴趣特征提取模型中的多兴趣抽取模型对第一数目个所述行为对象特征进行多兴趣抽取，获得所述第二数目个第一兴趣特征，并通过所述多兴趣特征提取模型提取所述属性数据的属性特征，将所述第二数目个所述第一兴趣特征分别与所述属性特征融合，获得所述目标用户的目标特征，所述目标特征包括所述第二数目个第二兴趣特征；所述多兴趣特征提取模型采用如权利要求1所述的方法获得；

11.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。

12.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。