CN115309975A

CN115309975A - 基于交互特征的产品推荐方法及系统

Info

Publication number: CN115309975A
Application number: CN202210750616.5A
Authority: CN
Inventors: 吴扬红
Original assignee: Bank of China Financial Technology Co Ltd
Current assignee: Bank of China Financial Technology Co Ltd
Priority date: 2022-06-28
Filing date: 2022-06-28
Publication date: 2022-11-08
Anticipated expiration: 2042-06-28

Abstract

本发明提供一种基于交互特征的产品推荐方法及系统，涉及人工智能技术领域，该方法包括：将目标输入实例中用户特征输入推荐模型中的第一自注意力模块，提取用户特征的内部交互特征；将目标输入实例中产品特征输入推荐模型中的第二自注意力模块，提取产品特征的内部交互特征；将用户特征和产品特征拼接的第一特征矩阵，输入推荐模型中的第三自注意力模块，提取用户特征和产品特征之间的交互特征；将根据用户特征的内部交互特征、产品特征的内部交互特征，以及用户特征和产品特征之间的交互特征确定的输入信息输入推荐模型中的预测模块，预测目标用户对候选产品的偏好信息，以对目标用户执行产品推荐操作。本发明实现自动精准地进行产品推荐。

Description

基于交互特征的产品推荐方法及系统

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于交互特征的产品推荐方法及系统。

背景技术

随着互联网时代到来，已逐步进入信息爆炸的时代。如何将海量的信息推荐给合适的对象，是企业面临的重大难题。同时，对于个体而言，如何从庞大的互联网数据中选择自己需要的信息，也是用户面临的问题。在这样的背景下，推荐系统得以迅速发展。

现有技术中，推荐系统的主要目标是根据用户与产品的历史交互信息来学习用户的兴趣偏好，最终根据用户的兴趣个性化推荐产品。但推荐系统始终面临着数据稀疏和冷启动问题，通过引入用户的特征和产品的特征能在一定程度上缓解上述问题，而特征之间往往不是独立的，特征之间的相互关系往往影响着推荐性能。通过手工构建所有有意义的组合是难以实现的，找到有意义的高阶组合特征很大程度上依赖于领域专家，且会花费大量的人力资源，导致推荐成本高和精度差。因此，如何自动捕获有效的特征间关系，以实现为用户进行精准地产品推荐是目前业界亟待解决的重要课题。

随时神经网络的方法的兴起，许多基于深度神经网络的方法被提出用来建模高阶特征交互，以实现产品推荐，如注意力因式分解机模型和神经因式分解机等。但是，由于当基于用户特征和产品特征交互来执行联合决策时，用户特征和产品特征在推荐中的角色不同，而上述模型在学习高阶特征交互特征中均同等的对待用户特征和产品特征，使得用户特征和产品特征在推荐中的角色一致，提取的交互信息不全面，难以捕获到精准的推荐结果。

发明内容

本发明提供一种基于交互特征的产品推荐方法及系统，用以解决现有技术中在学习高阶特征交互特征中均同等的对待用户特征和产品特征，导致推荐结果精度低的缺陷，实现自动精准地进行产品推荐。

本发明提供一种基于交互特征的产品推荐方法，包括：

从目标输入实例中，获取目标用户的用户特征和候选产品的产品特征；

将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征；所述用户特征的内部交互特征包括所述用户特征内部的各子特征之间的交互特征；

将所述产品特征输入所述推荐模型中的第二自注意力模块，提取所述产品特征的内部交互特征；所述产品特征的内部交互特征包括所述产品特征内部的各子特征之间的交互特征；

将所述用户特征和所述产品特征拼接形成的第一特征矩阵，输入所述推荐模型中的第三自注意力模块，提取所述用户特征和所述产品特征之间的交互特征；

根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，将所述第一输入信息输入所述预测模块，预测所述目标用户对所述候选产品的偏好信息，并根据所述偏好信息，对所述目标用户执行产品推荐操作；

其中，所述推荐模型是，基于样本输入实例和所述样本输入实例中样本用户对应的产品选择记录进行训练得到的。

根据本发明提供的一种基于交互特征的产品推荐方法，所述根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，包括：

将所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征进行拼接，得到第二特征矩阵；

根据所述第二特征矩阵，确定所述第一输入信息。

将所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征进行特征融合，得到第一融合结果；

根据所述第一融合结果，确定所述第一输入信息。

根据本发明提供的一种基于交互特征的产品推荐方法，所述第一自注意力模块包括多个堆叠的自注意力单元；

所述将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征，包括：

对于每一自注意力单元执行如下操作：

根据当前自注意力单元对应的上一自注意力单元的输出结果，获取所述当前自注意力单元的第二输入信息；

基于所述当前自注意力单元，对所述第二输入信息进行交互特征提取，得到所述当前自注意力单元对应的所述用户特征的内部交互子特征；

将所述多个堆叠的自注意力单元对应的所述用户特征的内部交互子特征进行特征融合，得到第二融合结果；

根据所述第二融合结果，获取所述用户特征的内部交互特征。

根据本发明提供的一种基于交互特征的产品推荐方法，每一自注意力单元包括多头自注意力层、残差层、正则化层和全连接层；

所述基于所述当前自注意力单元，对所述第二输入信息进行交互特征提取，得到所述当前自注意力单元对应的所述用户特征的内部交互子特征，包括：

基于所述当前自注意力单元中的多头自注意力层，将所述第二输入信息映射到多个子空间中，得到所述用户特征在多个子空间中的第一内部交互子特征；

将所述用户特征在多个子空间中的第一内部交互子特征进行特征融合，得到第三融合结果；

基于所述当前自注意力单元中的残差层，对所述第三融合结果和所述用户特征进行残差连接，得到所述用户特征的第二内部交互子特征；

基于所述当前自注意力单元中的正则化层，对所述第二内部交互子特征进行正则化变换；

基于所述当前自注意力单元中的全连接层，对正则化变换结果进行特征映射，得到所述当前自注意力单元对应的所述用户特征的内部交互子特征。

根据本发明提供的一种基于交互特征的产品推荐方法，所述将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征，包括：

将所述用户特征输入所述推荐模型的嵌入层，得到所述用户特征中每一子特征的嵌入向量；

将所述用户特征中所有子特征的嵌入向量形成的嵌入特征矩阵，输入所述第一自注意力模块，提取所述用户特征的内部交互特征。

本发明还提供一种基于交互特征的产品推荐系统，包括：

获取模块，用于：从目标输入实例中，获取目标用户的用户特征和候选产品的产品特征；

第一提取模块，用于：将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征；所述用户特征的内部交互特征包括所述用户特征内部的各子特征之间的交互特征；

第二提取模块，用于：将所述产品特征输入所述推荐模型中的第二自注意力模块，提取所述产品特征的内部交互特征；所述产品特征的内部交互特征包括所述产品特征内部的各子特征之间的交互特征；

第三提取模块，用于：将所述用户特征和所述产品特征拼接形成的第一特征矩阵，输入所述推荐模型中的第三自注意力模块，提取所述用户特征和所述产品特征之间的交互特征；

推荐模块，用于：根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，将所述第一输入信息输入所述预测模块，预测所述目标用户对所述候选产品的偏好信息，并根据所述偏好信息，对所述目标用户执行产品推荐操作；

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述基于交互特征的产品推荐方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述基于交互特征的产品推荐方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述基于交互特征的产品推荐方法。

本发明提供的基于交互特征的产品推荐方法及系统，通过一方面根据特征的属性信息，将目标输入实例中的特征，划分为用户特征和产品特征，并针对用户特征进行内部交互特征提取，得到用户特征的内部交互特征，针对产品特征进行内部交互特征提取，得到产品特征的内部交互特征，针对产品特征和用户特征进行外部交互特征提取，得到用户特征和产品特征之间的交互特征，进而使得提取的交互特征更具有针对性，且更加全面，以使联合特征内部的交互特征和特征之间的交互特征预测得到的推荐结果更精准，有效提高推荐性能和用户的体验感；另一方面，采用自注意力模块对目标输入实例中特征的内部的高阶交互特征和外部的高阶交互特征进行学习，以深度挖掘目标输入实例中每一特征的与其他特征之间的交互关系，使得推荐过程具有较强的可解释性，进一步提高推荐性能和用户的体验感。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的基于交互特征的产品推荐方法的流程示意图；

图2是本发明提供的基于交互特征的产品推荐方法中推荐模型的结构示意图；

图3是本发明提供的基于交互特征的产品推荐方法中自注意力模块的构示意图；

图4是本发明提供的基于交互特征的产品推荐系统的结构示意图；

图5是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

现有技术中，通常采用因式分解机模型用来建模高阶特征交互，以实现产品推荐。例如，因式分解机模型(Factorization Machine，FM)，其结合了多项式回归模型和分解技术，被用来建模特征交互，已在各项任务中被证明是有效的。然而，该方法由于多项式拟合时间的限制，只适用于建模低阶特征的相互作用，而不适用于捕获高阶特征的相互作用。因为随着捕获阶数的增加，模型参数会呈现指数级增长，因此限制了模型的推荐性能。又如，场感知因式分解机(Field-aware Factorization Machine，FFM)、高阶因式分解机(Higher-Order Factorization Machines，HOFM)等方法，也有类似的局限性，即大多仅考虑低阶交互，限制了模型的推荐性能。

另外，随时神经网络的方法的兴起，许多基于深度神经网络的方法被提出用来建模高阶特征交互，如注意力因式分解机模型(Attentional Factorization Machines，AFM)通过注意力机制为不同的二阶组合特征分配不同的权重，但该方法同样仅建模低阶交互。神经因式分解机(Neural Factorization Machines，NFM)，对特征进行点积操作并通过全连接层来捕获高阶交互，但在一定程度上降低了模型的可解释性且固定的特征表示会限制推荐性能。AutoInt(Automatic Feature Interaction)模型通过自注意力网络显式地对不同阶的特征组合进行建模，建模低高阶组合的同时也提供了良好的可解释性，但没有区分不同属性特征的交互特征，这可能会削弱模型建模特征交互的能力，影响推荐性能。

因此，上述模型均同等的对待用户特征和产品特征，没有区分这两种类型的属性交互，导致不能完全挖掘出与推荐结果密切关联的交互特征，无法有效利用交互特征所携带的信息。而当用特征交互来执行联合决策时，不同属性的交互特征可以在推荐中扮演不同的角色。以电商推荐场景为例，特征间交互被划分为用户组特征交互和产品组特征交互，用户组特征交互如<女性，20-30岁>，产品组特征交互如<粉色，长款>。用户组和产品组的组合特征如<女性，粉色>表征一位女性对粉色的偏好程度。因此不同属性特征在推荐中扮演不同的角色，对推荐结果的影响程度不同，而现有技术中在学习高阶特征交互特征中均同等的对待用户特征和产品特征，使得用户特征和产品特征在推荐中的角色一致，交互信息不全面，难以捕获到精准的推荐结果。

综上，现有技术中仅考虑低阶交互，或在学习高阶特征交互特征中均同等的对待用户特征和产品特征，导致提取的交互信息不全面，难以捕获到精准的推荐结果。

为了解决上述技术问题，本申请实施例提供一种基于交互特征的产品推荐方法，该方法包括：首先，根据特征的本体属性将特征划分为用户特征和产品特征；其次将用户特征输入第一自注意力模块学习用户特征的内部交互特征，将产品特征输入第二自注意力模块学习产品特征的内部交互特征，将用户特征和产品特征拼接形成特征矩阵输入第三自注意力模块学习用户特征和产品特征之间的外部交互特征，然后，基于用户特征的内部交互特征和产品特征的内部交互特征，以及用户特征和产品特征之间的外部交互特征进行推荐预测，得到目标用户对候选产品的偏好信息，以为目标用户进行精准地产品推荐；通过对用户特征的内部交互特征和产品特征的内部交互特征，以及用户特征和产品特征之间的外部交互特征进行针对性学习，以获取更加全面和更具有针对性的交互特征，有效提升推荐性能。

需要说明的是，下文中的内部交互是指用户特征内部的各子特征之间的交互或产品特征内部的各子特征之间的交互；外部交互是指用户特征与产品特征之间的交互。

下面结合图1-图3描述本申请实施例的基于交互特征的产品推荐方法。

如图1所示，为本申请实施例的基于交互特征的产品推荐方法的流程示意图，该方法包括如下步骤：

步骤101，从目标输入实例中，获取目标用户的用户特征和候选产品的产品特征；

其中，目标输入实例可以是目标用户输入的推荐请求指令，或者企业输入的为目标用户进行产品推荐的推荐请求指令等，本实施例对此不作具体地限定。

其中，候选产品为待向目标用户推荐的所有产品，如小说、视频、电影、融资产品等，本实施例对此不作具体地限定；相应地，目标用户为需要进行产品推荐的用户，如电子书应用程序、视频应用程序、电影应用程序，融信应用程序等不同类型的信息提供平台的用户，本实施例对此不作具体地限定。也就是说，本实施例中提出的基于交互特征的产品推荐方法可适用于各种类型的产品推荐场景。

用户特征为用于描述用户的特征信息，包括但不限于用户的年龄、性别、职业、ID(Identity document，身份标识)和个性签名，本实施对此不做具体地限定。

产品特征为用于描述产品的特征信息，包括但不限于产品的热门程度、ID和类型，本实施对此不做具体地限定。

可选地，实时接收目标输入实例，在接收到目标输入实例的情况下，根据目标输入实例中特征的属性信息，将特征划分为用户特征或产品特征，以获取目标用户的用户特征和候选产品的产品特征。

步骤102，将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征；所述用户特征的内部交互特征包括所述用户特征内部的各子特征之间的交互特征；其中，所述推荐模型是，基于样本输入实例和所述样本输入实例中样本用户对应的产品选择记录进行训练得到的；

其中，推荐模型通过对输入实例进行分析，利用自注意力机制学习用户特征的内部高阶特征交互和产品特征的内部交互特征，以及用户特征和产品特征之间的外部高阶特征，使得推荐模型能够学习每一特征与其他特征之间的任意阶的交互，进而更加全面的高阶交互特征，建模能力强，且可解释性较强。

如图2所示，推荐模型包括多个特征提取模块和预测模块；其中，每一模块的具体结构和调优方式，如网络类型、结构、层数、初始化参数、激活函数和损失函数等，可以根据实际需求进行设置，本实施例对此不做具体地限定。

第一自注意力模块基于自注意网络构建生成，用于学习同一特征内部的子特征之间的内部交互特征，具体用于学习用户特征内部的每一子特征与用户特征内部的其他子特征之间的交互特征。

其中，自注意网络采用自注意力机制，可自动地学习特征之间的高阶交互特征。注意力机制为借鉴人类的注意力机制，可以将注意力聚焦在重点区域并忽略其他信息。

自注意力网络层的具体结构可以根据实际需求进行设置，如基于多头自注意力层、残差层和正则化层中的一种或多种组合构建生成，本实施例对此不做具体地限定。

在执行步骤102之前，需要先对推荐模型进行训练，具体训练步骤包括：

首先，获取训练数据集；其中，训练数据集由样本输入实例，以及样本输入实例中样本用户对应的商品选择记录构建生成。训练数据集中样本的数量可以根据实际需求进行设置。

例如，训练数据集中有N个样本，训练数据集可表示为D＝{(x₁,y₁),(x₂,y₂),…,(x_N,y_N)}；其中，x_i是第i个样本输入实例，包括样本用户的用户信息和候选商品的商品信息。y_i是第i个样本输入实例对应的样本标签，可表示在当前样本输入实例下，样本用户是否购买或者点击某商品，y_i的取值为-1或者1；-1表示没有购买或者点击，1表示有购买或者点击行为。推荐模型的目标是给定输入实例，预测该用户在当前输入实例下是否会购买或者选择输入实例中的候选商品。

然后，采用训练数据集对推荐模型进行优化训练，以使训练好的推荐模型可以准确输出用户的偏好信息，进而为用户进行精准推荐，提高用户的体验感。其中，训练方式可以根据实际需求进行设置，如梯度下降法及其衍生优化算法和遗传算法等。

需要说明的是，本实施例中的偏好信息包括评分、排名和选择决策结果中的一种或多种组合；相应地产品推荐方法可应用于多种预测任务，包括评分的回归预测任务，以及选择决策结果的分类任务，以及排名预测任务。

对于回归任务，在对推荐模型进行训练时，可以采用平方损失函数作为推荐模型的损失函数L_reg，具体为：

其中，X是样本输入实例，

和y(x)分别表示样本输入实例对应的预测推荐结果和产品选择记录中的实际选择结果。

对于分类任务，可以采用hinge损失或对数损失平均函数，对于排名任务可以用成对个性化排名损失。

在商品推荐方法包含多种组合预测任务时，可联合多种组合预测任务的损失函数对推荐模型进行共同训练，以得到更加准确的推荐结果。

需要说明的是，本实施例中的推荐模型的损失函数可以根据实际应用场景，如回归任务、排序任务和分类任务，选择不同的损失函数。

例如，在实际应用中选用电影推荐系统movielens数据集作为训练集，输入实例中包含用户特征和候选电影特征，标签为用户对候选电影的评分。通过该训练集对推荐模型进行训练后会学习到一套参数，记录了用户对于电影的偏好信息，进而输入用户没有进行评分的电影及属性时，即可预测用户对电影的打分情况，以实现对用户的个性化推荐。对于推荐系统而言，传递给用户的是用户可能感兴趣的某部电影或者电影集合。

可选地，在获取到训练好的推荐模型后，可以将目标输入实例中的目标用户的用户特征抽取出来，然后对目标用户的用户特征进行预处理后输入推荐模型中的第一自注意力模块，由第一自注意力模块对用户特征中各子特征与用户特征中的其他特征之间的内部交互特征进行学习，以得到用户特征的内部交互特征。

步骤103，将所述产品特征输入所述推荐模型中的第二自注意力模块，提取所述产品特征的内部交互特征；所述产品特征的内部交互特征包括所述产品特征内部的各子特征之间的交互特征；

其中，第二自注意力模块也是基于自注意力网络构建生成的，其基本结构可以与第一自注意力模块相同也可以不同。

第二自注意力模块也用于学习同一特征内部的各子特征之间的内部交互特征；具体用于学习产品特征内部的每一子特征与产品特征内部的其他子特征之间的交互特征。

可选地，在执行步骤102的同时，可同步将目标输入实例中的候选产品的产品特征抽取出来，然后对产品特征进行预处理后输入推荐模型中的第二自注意力模块，由第二自注意力模块对产品特征中各子特征与产品特征中的其他特征之间的内部交互特征进行学习，以得到产品特征的内部交互特征。

步骤104，将所述用户特征和所述产品特征拼接形成的第一特征矩阵，输入所述推荐模型中的第三自注意力模块，提取所述用户特征和所述产品特征之间的交互特征；

其中，第三自注意力模块基于自注意力网络构建生成，用于学习不同类别特征之间的交互特征，具体用于学习用户特征与产品特征之间的外部交互特征。

可选地，在执行步骤102和103的同时，可同步将用户特征和产品特征进行拼接形成第一特征矩阵；

然后，将第一特征矩阵输入第三自注意力模块，由第三自注意力模块对用户特征和产品特征之间的外部协同关联关系进行学习，以得到用户特征和产品特征之间的交互特征。

步骤105，根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，将所述第一输入信息输入所述预测模块，预测所述目标用户对所述候选产品的偏好信息，并根据所述偏好信息，对所述目标用户执行产品推荐操作；

其中，预测模块可以基于全连接网络和卷积网络等神经网络模型构建生成，本实施例对此不做具体地限定。

可选地，在获取到用户特征的内部交互特征、产品特征的内部交互特征，以及用户特征和所述产品特征之间的交互特征之后，可以根据用户特征的内部交互特征、所述产品特征的内部交互特征，以及用户特征和产品特征之间的交互特征确定预测模块的第一输入信息；

其中，第一输入信息具体确定方式，包括对用户特征的内部交互特征、所述产品特征的内部交互特征，以及用户特征和产品特征之间的交互特征进行拼接得到第一输入信息；或者对用户特征的内部交互特征、所述产品特征的内部交互特征，以及用户特征和产品特征之间的交互特征进行特征融合得到第一输入信息。

然后，基于预测模块对第一输入信息进行学习，预测得到目标用户对所述候选产品的偏好信息，进而根据偏好信息，得到产品推荐结果，以为用户进行精准推荐。

需要说明的是，候选商品的数量可以是一个或多个；在候选商品的数量为多个的情况下，预测模块输出的是目标用户对各候选商品的偏好信息。

本实施例中将特征交互划分为内部交互和外部交互，以针对性提取用户特征的内部交互特征、产品特征的内部交互特征，以及用户特征和产品特征之间的交互特征，并联合用户特征的内部交互特征、产品特征的内部交互特征和用户特征和产品特征之间的交互特征，以捕获与推荐结果关联的更为全面的交互信息，进而提高推荐性能，以更加自动精准地为用户进行产品推荐。

在获取到目标用户对每一候选商品的偏好信息后，即可预测用户对每一候选商品感兴趣程度、评分或是否会选择候选商品，进而为目标用户进行精准推荐。本实施例中的产品推荐方法，可以根据后台输入的目标输入实例，可实时地从庞大的商品集合中筛选出目标用户可能感兴趣的商品，以为用户进行个性化推荐。

本实施例一方面根据特征的属性信息，将目标输入实例中的特征，划分为用户特征和产品特征，并针对用户特征进行内部交互特征提取，得到用户特征的内部交互特征，针对产品特征进行内部交互特征提取，得到产品特征的内部交互特征，针对产品特征和用户特征进行外部交互特征提取，得到用户特征和产品特征之间的交互特征，进而使得提取的交互特征更具有针对性，且更加全面，以使联合特征内部的交互特征和特征之间的交互特征预测得到的推荐结果更精准，有效提高推荐性能和用户的体验感；另一方面，采用自注意力模块对目标输入实例中特征的内部的高阶交互特征和外部的高阶交互特征进行学习，以深度挖掘目标输入实例中每一特征的与其他特征之间的交互关系，使得推荐过程具有较强的可解释性，进一步提高推荐性能和用户的体验感。

在一些实施例中，所述根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，包括：

根据所述第二特征矩阵，确定所述第一输入信息。

其中，用户特征的内部交互特征、产品特征的内部交互特征，以及用户特征和产品特征之间的交互特征的行维度相同。

可选地，确定第一输入信息的具体步骤包括：

首先，将用户特征的内部交互特征、产品特征的内部交互特征，以及用户特征和产品特征之间的交互特征进行按行维度拼接，以得到第二特征矩阵；如用户特征的内部交互特征的行维度为255和列维度为3，即特征维度表示为255*3，产品特征的内部交互特征的行维度为255和列维度为4，即特征维度为255*4，用户特征和产品特征之间的交互特征的行维度为255和列维度为7，即特征维度为255*7，拼接后得到的第二特征矩阵的特征维度为255*14。

然后，直接将第二特征矩阵，作为第一输入信息，输入至第三自注意力模块，以获取目标用户对候选产品的偏好信息，进而根据偏好信息顺利实现对用户进行精准推荐。具体公式为：

其中，

为推荐模型预测的用户对候选产品的偏好信息；w^T和b分别是权重和偏置，p、q和p+q分别代表用户特征的内部交互特征E^U、产品特征的内部交互特征E^R、用户特征和产品特征之间的交互特征E^UR的列数(即用户特征的内部交互特征中子特征的个数、产品特征的内部交互特征中子特征的个数、用户特征和产品特征之间的交互特征中子特征的个数的总和)。

为用户特征的内部交互特征中第i个子特征；

为产品特征的内部交互特征中第i个子特征，

为用户特征和产品特征之间的交互特征中第i个子特征。

根据所述第一融合结果，确定所述第一输入信息。

可选地，确定第一输入信息的具体步骤还包括：

直接采用融合模块，将用户特征的内部交互特征、产品特征的内部交互特征，以及用户特征和产品特征之间的交互特征进行特征融合，得到第一融合结果；

然后，直接将第一融合结果，作为第一输入信息，输入至第三自注意力模块，以获取目标用户对候选产品的偏好信息，进而根据偏好信息顺利实现对用户进行精准推荐。

本实施例中直接将用户特征的内部交互特征、产品特征的内部交互特征，以及用户特征和产品特征之间的交互特征进行特征融合，确定预测模块的输入信息，使得输入信息中包含丰富的与推荐结果关联的特征，进而使得预测模块输出的偏好信息更加精准，有效提高推荐模型的推荐性能。

在一些实施例中，所述第一自注意力模块包括多个堆叠的自注意力单元；

步骤102中所述将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征，包括：

对于每一自注意力单元执行如下操作：

其中，第一自注意力模块基于多个自注意力单元堆叠形成，自注意力单元的数量具体可以根据实际需求进行设置。

每一自注意力单元均可以采用一头或多头的按比例缩放的点积注意力模型构建生成，也可以是一头或多头的按比例缩放的点积注意力模型和残差网络联合构建生成等，本实施例对此不作具体地限定。

可选地，步骤102中提取用户特征的内部交互特征的具体步骤包括：

首先，将用户特征作为自注意力网络层的第一层自注意力单元的输入，由第一层自注意力单元对用户特征内部的子特征进行内部交互特征提取，得到第一层自注意力单元输出的用户特征的内部交互子特征；

再将第一层自注意力单元输出的用户特征的内部交互子特征作为第一层自注意力单元的下一层自注意力单元的输入，以获取下一层自注意力单元输出的用户特征的内部交互子特征；

继续执行上述高阶交互特征提取过程，直到第一自注意力模块中所有的自注意力单元均输出用户特征的内部交互子特征。

然后，将第一自注意力模块中所有的自注意力单元输出的用户特征的内部交互子特征进行融合，得到第二融合结果，并将第二融合结果，作为用户特征的内部交互特征。

需要说明的是，第二自注意力模块和第三自注意力模块也可以包括多个堆叠的自注意力单元，第二自注意力模块和第三自注意力模块内部学习交互特征的具体步骤参见第一自注意力模块内部学习交互特征的执行步骤，此处不再赘述。

以下为了简化表示，本实施例使用SAttB(Self-Attention Block，自注意力块)来表示上述过程。通过堆叠多个自注意力块，可以捕获高阶交互特征。为了简化表述，使用U表示用户特征，第一自注意力模块提取用户特征的内部交互特征的具体公式为：

其中，

和U分别为第一自注意力模块中第一层自注意力单元输出的用户特征的内部交互子特征，以及第一层自注意力块的输入信息，即用户特征；E^U为第b层自注意力单元输出的用户特征的内部交互子特征；

为第b层自注意力单元的输入信息，即第b-1层自注意力块的输出信息。b(b>＝1)为第一自注意力模块中自注意力单元的数量。

需要说明的是每一层自注意力单元输出的用户特征的内部交互子特征中的每个子特征均已经合并了其他子特征对其自身的二阶影响，将多个自注意力块进行堆叠即可，得到各子特征和其他子特征之间的高阶交互的交互特征。

使用R表示产品特征，第二自注意力模块提取产品特征的内部交互特征的具体公式为：

其中，

和R分别为第二自注意力模块中第一层自注意力单元输出的产品特征的内部交互子特征，以及第一层自注意力块的输入信息，即产品特征；E^R为第二自注意力模块中第b层自注意力单元输出的产品特征的内部交互子特征；

为第二自注意力模块中第b层自注意力单元的输入信息，即第b-1层自注意力块的输出信息。

第三自注意力单元提取产品特征和用户特征之间的交互特征的具体公式为：

其中，

和U|R分别为第三自注意力模块中第一层自注意力单元输出的用户特征和产品特征之间的交互子特征，以及第一层自注意力块的输入信息，即产品特征和用户特征形成的第一拼接矩阵；E^UR为第三自注意力模块中第b层自注意力单元输出的产品特征和用户特征之间的交互子特征；

为第三自注意力模块中第b层自注意力单元的输入信息，即第b-1层自注意力块的输出信息。

本实施例中，通过将多个自注意力块堆叠形成自注意力网络层，使得自注意力网络层可有效学习特征内部或特征之间的高阶交互特征，并考虑各子特征与其他子特征之间的关联性，具有较强的可解释性和推荐性能。

在一些实施例中，所述每一自注意力单元包括多头自注意力层、残差层、正则化层和全连接层；

所述基于所述当前自注意力单元，对所述第二输入信息进行内部交互特征提取，得到所述当前自注意力单元对应的所述用户特征的内部交互子特征，包括：

如图3所示，每一自注意力单元包括多头自注意力层、残差层、正则化层和全连接层；全连接层的层数可以根据实际需求进行设置，如两层。

其中，多头自注意力层可采用按比例缩放的点积注意力模型构建生成，具体定义为：

其中，Q,K和V分别表示多头自注意力层中的查询，键和值。

用于约束点积的规模，其中d为多头自注意力层的输入信息的特征维度。

以下以第一层自注意力单元为例，对自注意力单元内部的学习机制进行具体说明。

对于第一层自注意力单元，为了学习用户特征内部的各子特征之间的高阶交互，Q,K和V都是由用户特征U生成的，即输入信息为用户特征U。首先，可以通过线性变换将用户特征U转换为三个矩阵，以学习用户特征U的内部交互特征H_U：

H_U＝Attention(UW^Q,UW^K,UW^V)；

其中，W^Q、W^K和W^V∈R^d×d是第一层自注意力单元的可学习的权重。

可选地，采用多头自注意力层将不同特征交互映射到多个不同子空间，得到用户特征在多个子空间中的第一内部交互子特征，并将用户特征在多个子空间中的第一内部交互子特征进行拼接融合，得到第三融合结果，具体公式为：

其中，n_h为多头自注意力层的头数量，W^U、W_i ^Q、W_i ^K和W_i ^V为多头自注意力子块的可学习权重矩阵的参数。M_U为多头自注意层输出的用户特征在多个子空间中的第一内部交互子特征的第三融合结果；h_i为用户特征在第i个子空间中第一内部交互子特征，即第i头自注意力层的输出结果。

为了保留先前学习的嵌入特征，可以使用残差层将第三融合结果和用户特征进行残差连接，得到用户特征的第二内部交互子特征。

进一步地，为了提高推荐模型的性能，在获取到残差层的输出结果后，可以将残差层的输出结果顺次输入两个全连接层，得到用户特征的内部交互子特征，具体公式如下：

M′_U＝LayerNorm(M_U+U)；

O_U＝Re LU((M′_UW₁+b₁)W₂+b₂)；

其中，W₁,W₂∈R^d×d表示权重，b₁,b₂∈R^d表示偏置量。M_U+U为残差层的输出结果；M′_U为残差子块的输出结果经过正则化处理后的结果；O_U为用户特征的内部交互子特征。

对于其他层的自注意力单元，其输入信息根据上一层自注意力单元的输出结果进行确定，然后按照上述方式，学习输出用户特征的内部交互子特征。

需要说明的是，第二自注意力模块中的每一自注意力单元和第三自注意力模块中的每一自注意力单元的结构可以与第一自注意力模块中的自注意力单元结构相同，第二自注意力模块中的每一自注意力单元和第三自注意力模块中的每一自注意力单元内部的执行步骤参见第一自注意力模块的自注意力单元内部的执行步骤，此处不再赘述。

本实施例通过在每一自注意力单元中添加多头自注意力层和残差层，以及正则化层和全连接层，不仅可以在多个不同子空间中提取内部交互子特征、外部交互子特征，以提取丰富多样、可靠和有效的交互子特征，并且还可以提高浅层网络的表征能力，有效避免网络退化问题，进而使得推荐模型的推荐性能更优，推荐结果更加准确。

在一些实施例中，步骤102中所述将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征，包括：

可选地，通常目标输入实例可能除了有类别形式的特征，还有数值型的特征；其中，类别型特征可直接采用独立热编码映射为特征向量；但是对于数值型特征，往往不好操作，为了解决这个问题，我们一般考虑为每一种数值型特征给定一个参数向量，数值型特征通过乘以参数向量后再映射到嵌入层，具体预处理方法同FFM(Field-awareFactorization Machine，场感知因式分解机)的特征预处理方式。

可选地，在获取到训练好的推荐模型后，可以先将目标输入实例中的用户特征取出来，然后对用户特征中每一子特征进行上述预处理后输入训练好的推荐模型的嵌入层，以将用户特征中每一子特征x′_i映射为密集的嵌入向量U_i∈R^d，进而消除不同类型的特征对推荐结果的影响，提高推荐结果的准确性。其中，d是嵌入向量的维度。

需要说明的是，考虑到用户特征的稀疏性，嵌入后可能存在较多的零向量，为了提高计算的效率和准确性，在后续计算中仅考虑非全零的嵌入向量，即将全零的嵌入向量删除，仅保留非全零的嵌入向量集合作为嵌入层的下一层的输入信息。

需要说明的是，后续提到的用户特征向量集合和产品特征向量集合均指非零特征集合。

本实施例通过嵌入层将稀疏的特征映射到密集的特征空间，有效提高交互特征提取的准确性和便捷性，进而提高推荐模型的推荐性能。

下面对本发明提供的基于交互特征的产品推荐系统进行描述，下文描述的基于交互特征的产品推荐系统与上文描述的基于交互特征的产品推荐方法可相互对应参照。

如图4所示，本申请实施例提供一种基于交互特征的产品推荐系统，该系统是一种可利用电子商务网站向客户提供商品信息和建议，即向用户推荐感兴趣商品的辅助选择信息，辅助用户做出选择决策的系统。该系统包括获取模块401、第一提取模块402、第二提取模块403、第三提取模块404和推荐模块405，其中：

获取模块401用于：从目标输入实例中，获取目标用户的用户特征和候选产品的产品特征；

第一提取模块402用于：将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征；所述用户特征的内部交互特征包括所述用户特征内部的各子特征之间的交互特征；

第二提取模块403用于：将所述产品特征输入所述推荐模型中的第二自注意力模块，提取所述产品特征的内部交互特征；所述产品特征的内部交互特征包括所述产品特征内部的各子特征之间的交互特征；

第三提取模块404用于：将所述用户特征和所述产品特征拼接形成的第一特征矩阵，输入所述推荐模型中的第三自注意力模块，提取所述用户特征和所述产品特征之间的交互特征；

推荐模块405用于：根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，将所述第一输入信息输入所述预测模块，预测所述目标用户对所述候选产品的偏好信息，并根据所述偏好信息，对所述目标用户执行产品推荐操作；

本实施例中一方面根据特征的属性信息，将目标输入实例中的特征，划分为用户特征和产品特征，并针对用户特征进行内部交互特征提取，得到用户特征的内部交互特征，针对产品特征进行内部交互特征提取，得到产品特征的内部交互特征，针对产品特征和用户特征进行外部交互特征提取，得到用户特征和产品特征之间的交互特征，进而使得提取的交互特征更具有针对性，且更加全面，以使联合特征内部的交互特征和特征之间的交互特征预测得到的推荐结果更精准，有效提高推荐性能和用户的体验感；另一方面，采用自注意力模块对目标输入实例中特征的内部的高阶交互特征和外部的高阶交互特征进行学习，以深度挖掘目标输入实例中每一特征的与其他特征之间的交互关系，使得推荐过程具有较强的可解释性，进一步提高推荐性能和用户的体验感

在一些实施例中第三特征提取模块，具体用于：

根据所述第二特征矩阵，确定所述第一输入信息。

在一些实施例中第三提取模块，具体用于：

根据所述第一融合结果，确定所述第一输入信息。

第一提取模块，具体用于：

对于每一自注意力单元执行如下操作：

第一提取模块，还用于：

在一些实施例中第一提取模块还用于：

图5示例了一种电子设备的实体结构示意图，如图5所示，该电子设备可以包括：处理器(processor)501、通信接口(Communications Interface)502、存储器(memory)503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信。处理器501可以调用存储器503中的逻辑指令，以执行基于交互特征的产品推荐方法，该方法包括：从目标输入实例中，获取目标用户的用户特征和候选产品的产品特征；将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征；所述用户特征的内部交互特征包括所述用户特征内部的各子特征之间的交互特征；将所述产品特征输入所述推荐模型中的第二自注意力模块，提取所述产品特征的内部交互特征；所述产品特征的内部交互特征包括所述产品特征内部的各子特征之间的交互特征；将所述用户特征和所述产品特征拼接形成的第一特征矩阵，输入所述推荐模型中的第三自注意力模块，提取所述用户特征和所述产品特征之间的交互特征；根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，将所述第一输入信息输入所述预测模块，预测所述目标用户对所述候选产品的偏好信息，并根据所述偏好信息，对所述目标用户执行产品推荐操作；其中，所述推荐模型是，基于样本输入实例和所述样本输入实例中样本用户对应的产品选择记录进行训练得到的。

此外，上述的存储器503中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的基于交互特征的产品推荐方法，该方法包括：从目标输入实例中，获取目标用户的用户特征和候选产品的产品特征；将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征；所述用户特征的内部交互特征包括所述用户特征内部的各子特征之间的交互特征；将所述产品特征输入所述推荐模型中的第二自注意力模块，提取所述产品特征的内部交互特征；所述产品特征的内部交互特征包括所述产品特征内部的各子特征之间的交互特征；将所述用户特征和所述产品特征拼接形成的第一特征矩阵，输入所述推荐模型中的第三自注意力模块，提取所述用户特征和所述产品特征之间的交互特征；根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，将所述第一输入信息输入所述预测模块，预测所述目标用户对所述候选产品的偏好信息，并根据所述偏好信息，对所述目标用户执行产品推荐操作；其中，所述推荐模型是，基于样本输入实例和所述样本输入实例中样本用户对应的产品选择记录进行训练得到的。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的基于交互特征的产品推荐方法，该方法包括：从目标输入实例中，获取目标用户的用户特征和候选产品的产品特征；将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征；所述用户特征的内部交互特征包括所述用户特征内部的各子特征之间的交互特征；将所述产品特征输入所述推荐模型中的第二自注意力模块，提取所述产品特征的内部交互特征；所述产品特征的内部交互特征包括所述产品特征内部的各子特征之间的交互特征；将所述用户特征和所述产品特征拼接形成的第一特征矩阵，输入所述推荐模型中的第三自注意力模块，提取所述用户特征和所述产品特征之间的交互特征；根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，将所述第一输入信息输入所述预测模块，预测所述目标用户对所述候选产品的偏好信息，并根据所述偏好信息，对所述目标用户执行产品推荐操作；其中，所述推荐模型是，基于样本输入实例和所述样本输入实例中样本用户对应的产品选择记录进行训练得到的。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于交互特征的产品推荐方法，其特征在于，包括：

2.根据权利要求1所述的基于交互特征的产品推荐方法，其特征在于，所述根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，包括：

根据所述第二特征矩阵，确定所述第一输入信息。

3.根据权利要求1所述的基于交互特征的产品推荐方法，其特征在于，所述根据所述用户特征的内部交互特征、所述产品特征的内部交互特征，以及所述用户特征和所述产品特征之间的交互特征，确定所述推荐模型中的预测模块的第一输入信息，包括：

根据所述第一融合结果，确定所述第一输入信息。

4.根据权利要求1-3任一所述的基于交互特征的产品推荐方法，其特征在于，所述第一自注意力模块包括多个堆叠的自注意力单元；

对于每一自注意力单元执行如下操作：

5.根据权利要求4所述的基于交互特征的产品推荐方法，其特征在于，每一自注意力单元包括多头自注意力层、残差层、正则化层和全连接层；

6.根据权利要求1-3任一所述的基于交互特征的产品推荐方法，其特征在于，所述将所述用户特征输入推荐模型中的第一自注意力模块，提取所述用户特征的内部交互特征，包括：

7.一种基于交互特征的产品推荐系统，其特征在于，包括：

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述基于交互特征的产品推荐方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于交互特征的产品推荐方法。

10.一种计算机程序商品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于交互特征的产品推荐方法。