CN112364236A

CN112364236A - 目标对象推荐系统、方法、装置、数据处理方法及装置

Info

Publication number: CN112364236A
Application number: CN201910671141.9A
Authority: CN
Inventors: 李晨亮; 全聪; 王双; 戚赟炜; 邓玉明
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2019-07-24
Filing date: 2019-07-24
Publication date: 2021-02-12

Abstract

本发明实施例提供了一种目标对象推荐方法、系统、装置、电子设备及计算机存储介质，其中，目标对象推荐方法包括：分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量；将所述第一向量和所述第二向量输入用于进行情感评级预测的神经网络模型，通过所述神经网络模型对所述第一向量和第二向量进行处理，以基于处理后获得的正向情感特征和负向情感特征输出所述用户对所述目标对象的情感信息；根据所述情感信息确定是否向所述用户推荐所述目标对象。通过本发明实施例，可以对用户评论的内容，尤其是具有两面性评论的内容，进行有效地挖掘，以获得更为精准、有效的信息。

Description

目标对象推荐系统、方法、装置、数据处理方法及装置

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种目标对象推荐系统、方法、装置，一种数据处理方法及装置，以及，一种电子设备及一种计算机存储介质。

背景技术

随着通信和互联网技术的快速兴起，为人们提供各种服务的平台也应运而生，其中很多平台提供了评论功能。通过评论功能，人们可以对感兴趣的对象进行各种评论，发表针对某个对象的看法、使用体验、喜好程度等信息。

例如，以网上购物为例，大多数提供网上购物的电子商务平台均允许用户针对自身的购物行为留下相应的评价(包括对商品打分和评论等)，以表达用户的购物体验等。然而，在真实的电商场景中，用户对商品的评价可能具有两面性，喜欢的同时可能也存在着不喜欢。例如，用户可能喜欢iphoneX的功能和设计，但觉得它的售价太高了。用户所表现出的两面性可以更好地让商家了解商品的属性并对商品进行相应的调整。

然而，现有的基于评论的处理系统如商品推荐系统或商品决策系统均无法有效地处理用户评论中所表现出的两面性。

因此，如何对用户评论的内容，尤其是具有两面性评论的内容，进行有效地挖掘，以获得更为精准、有效的信息，成为我们亟待解决的问题。

发明内容

有鉴于此，本发明实施例提供一种目标对象推荐方案，以至少部分解决上述问题。

根据本发明实施例的第一方面，提供了一种目标对象推荐系统，包括：输入模块、特征提取模块、逻辑单元模块、胶囊网络模块、和输出模块；所述输入模块包括：用于接收与用户的评论数据对应的词向量的第一输入部分，和，用于接收与目标对象的评论数据对应的词向量的第二输入部分；所述特征提取模块，用于对所述第一输入部分输出的向量和所述第二输入部分输出的向量进行特征提取，获得与所述第一输入部分输出的向量对应的观点向量，和，与所述第二输入部分输出的向量对应的属性向量；所述逻辑单元模块，用于对所述观点向量和所述属性向量进行配对，生成对应的逻辑单元；所述胶囊网络模块包括：用于对所述逻辑单元进行正向情感预测并输出正向情感特征向量的第一胶囊网络部分，和，用于对所述逻辑单元进行负向情感预测并输出负向情感特征向量的第二胶囊网络部分；所述输出模块，用于根据所述第一胶囊网络部分输出的正向情感特征向量和所述第二胶囊网络部分输出的负向情感特征向量，预测输出用户对目标对象的情感信息。

根据本发明实施例的第二方面，提供了一种目标对象推荐方法，包括：分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量；将所述第一向量和所述第二向量输入用于进行情感评级预测的神经网络模型，通过所述神经网络模型对所述第一向量和第二向量进行处理，以基于处理后获得的正向情感特征和负向情感特征输出所述用户对所述目标对象的情感信息；根据所述情感信息确定是否向所述用户推荐所述目标对象，其中，所述神经网络模型采用如第一方面所述的目标对象推荐系统的结构。

根据本发明实施例的第三方面，提供了一种数据处理方法，包括：通过神经网络模型的输入部分接收第一样本数据对应的第一词向量和第二样本数据对应的第二词向量，其中，所述第一样本数据用于表示多个样本用户的用户评论样本数据，所述第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；所述第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据；通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量；对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元；将所述多个逻辑单元输入所述神经网络模型的胶囊网络部分，获得对应的情感特征向量；通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

根据本发明实施例的第四方面，提供了一种目标对象推荐装置，包括：生成模块，用于分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量；处理模块，用于将所述第一向量和所述第二向量输入用于进行情感评级预测的神经网络模型，通过所述神经网络模型对所述第一向量和第二向量进行处理，以基于处理后获得的正向情感特征和负向情感特征输出所述用户对所述目标对象的情感信息；推荐模块，用于根据所述情感信息确定是否向所述用户推荐所述目标对象。

根据本发明实施例的第五方面，提供了一种数据处理装置，包括：接收模块，用于通过神经网络模型的输入部分接收第一样本数据对应的第一词向量和第二样本数据对应的第二词向量，其中，所述第一样本数据用于表示多个样本用户的用户评论样本数据，所述第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；所述第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据；第一获得模块，用于通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量；逻辑单元生成模块，用于对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元；第二获得模块，用于将所述多个逻辑单元输入所述神经网络模型的胶囊网络部分，获得对应的情感特征向量；预测输出模块，用于通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

根据本发明实施例的第六方面，提供了一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如第二方面所述的目标对象推荐方法对应的操作，或者，执行如第三方面所述的数据处理方法对应的操作。

根据本发明实施例的第七方面，提供了一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第二方面所述的目标对象推荐方法，或者，该程序被处理器执行时实现如第三方面所述的数据处理方法。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1A为根据本发明实施例一的一种目标对象推荐方法的步骤流程图；

图1B为一种图1A所示实施例的使用场景的示意图；

图2A为根据本发明实施例二的一种目标对象推荐方法的步骤流程图；

图2B为图2A所示实施例中使用的一种神经网络模型的结构示意图；

图3为根据本发明实施例三的一种数据处理方法的步骤流程图；

图4为根据本发明实施例四的一种目标对象推荐系统的结构框图；

图5为根据本发明实施例五的一种目标对象推荐装置的结构框图；

图6为根据本发明实施例六的一种数据处理装置的结构框图；

图7为根据本发明实施例七的一种电子设备的结构示意图。

具体实施方式

为了使本领域的人员更好地理解本发明实施例中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明实施例一部分实施例，而不是全部的实施例。基于本发明实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本发明实施例保护的范围。

下面结合本发明实施例附图进一步说明本发明实施例具体实现。

实施例一

参照图1A，示出了根据本发明实施例一的一种目标对象推荐方法的步骤流程图。

本实施例的目标对象推荐方法包括以下步骤：

步骤S102：分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量。

本发明实施例使用训练完成的、用于进行情感评级预测的神经网络模型进行目标对象推荐，因此，对于该训练完成的神经网络模型来说，第一历史评论数据和/或第二历史评论数据中可以包含或不包含两面性的评论数据，可以部分包含，也可以全部包含。

其中，第一历史评论数据为用户对处理过的目标对象发表的评论数据，如，用户A对目标对象X、Y和Z等发表过的评论数据；第二历史评论数据为目标对象被处理者评论过的评论数据，如，目标对象B被用户X、Y和Z等评论过的数据。所述“处理”可以为任意适当的处理，包括但不限于：购买、阅读、发帖、跟帖等等。所述两面性的评论数据意指既包含正面情感的评论数据又包含负面情感的评论数据，例如，“IPONEX功能很好，就是太贵”，其中，“功能很好”表达了正面情感，而“太贵”则表达了负面情感。

此外，本发明实施例中，因需要通过所述神经网络模型来获得用户对目标对象的情感信息，因此，需要将第一历史评论数据和第二历史评论数据均处理成为神经网络模型可以处理的向量，即，与第一历史评论数据对应的第一向量，和，与第二历史评论数据对应的第二向量。具体的将历史评论数据处理为向量的方式可以由本领域技术人员根据实际需求采用任意适当的方式，如，word2vec方式等，本发明实施例对此不作限制。第一向量和第二向量可以表征为词向量的形式。

步骤S104：将第一向量和第二向量输入用于进行情感评级预测的神经网络模型，通过所述神经网络模型对第一向量和第二向量进行处理，以基于处理后获得的正向情感特征和负向情感特征输出所述用户对所述目标对象的情感信息。

如前所述，本发明实施例中的神经网络模型可以为已训练好的神经网络模型，将第一向量和第二向量输入后，该神经网络模型对其进行处理，最终输出用户对目标对象的情感信息，包括但不限于，正向情感程度、负向情感程度、偏好程度、厌恶程度等，具体的情感信息表征方式可以由本领域技术人员根据实际的需求采用任意适当的形式。

其中，所述用户对目标对象的情感信息基于神经网络模型处理第一向量和第二向量后获得的正向情感特征和负向情感特征生成，神经网络模型对第一和第二向量的具体处理与模型本身结构和设置有关，本实施例中，不对模型的具体结构进行限制，对第一和第二向量多次处理后可生成相应的正向情感特征和负向情感特征，进而能够基于此输出用户对目标对象的情感信息即可。在一种可选方式中，本实施例的神经网络模型可以采用如图2B所示的神经网络模型，或者，采用如图4所示的目标对象推荐系统的结构。

步骤S106：根据所述情感信息确定是否向所述用户推荐所述目标对象。

用户对目标对象的情感信息表征了用户对目标对象的偏好程度，据此，可以确定是否向用户推荐所述目标对象。例如，若所述情感信息高于某一设定阈值，则向用户推荐该目标对象；反之，则不推荐。

以下，以使用场景为网上购物为例，对本实施例的目标对象推荐方法的使用场景进行说明，如图1B所示。图1B中，左侧界面示出了当用户A在网上成功购买了能量饮料X后，供用户A对该能量饮料X进行评价的界面。在实际应用中，用户A一般不会只对某个购买过的商品进行评价，而会对其购买过的全部或大部分商品通过类似图1B中的左侧界面进行评价。后台服务端收集到用户A对能量饮料X的评价后，与之前已经收集到的用户A对其它商品的评价数据一起，形成用户A的第一历史评论数据。当需要向用户A进行商品推荐时，后台服务端会利用该第一历史评论数据，结合待推荐的商品的第二历史评论数据(包括用户A或不包括用户A在内的多个用户对待推荐的商品的所有评论数据)，来确定是否向用户A推荐所述待推荐的商品，以及，如果确定向用户A推荐，则推荐所述待推荐的商品中的哪些商品。以待推荐的商品为“牛油红锅”和一款“运动鞋”为例，如图1B的右侧界面所示，后台服务端会将第一历史评论数据转换为第一向量，将第二历史评论数据转换为第二向量，然后，将第一向量和第二向量输入用于情感评级预测的神经网络模型中，通过该神经网络模型的处理，输出用户A分别针对“牛油红锅”和“运动鞋”的情感信息，例如，用户A可能对“牛油红锅”有较大兴趣，而对“运动鞋”兴趣较低。进一步地，则可以据此向用户A推荐“牛油红锅”而不推荐“运动鞋”。

根据本实施例，通过用于进行情感评级预测的神经网络模型，获取用户对目标对象的情感信息，因该情感信息既基于用户对目标对象的正向情感特征，又基于用户对目标对象的负向情感特征获得。又因该神经网络模型处理的数据包括某个或某类用户对其处理过的目标对象的评论数据(即第一历史评论数据)，以及，某个或某类目标对象被多个处理者评论过的评论数据(即第二历史评论数据)。可见，不管是历史评论数据中包含的两面性信息，还是用户对目标对象情感的两面性信息，本实施例均可兼顾。由此，本实施例提供的方案可以对用户评论的内容，尤其是具有两面性评论的内容，进行有效地挖掘，以获得更为精准、有效的信息。

本实施例的目标对象推荐方法可以由任意适当的具有数据处理能力的电子设备执行，包括但不限于：服务器、移动终端(如手机、PAD等)和PC机等。

实施例二

参照图2A，示出了根据本发明实施例二的一种目标对象推荐方法的步骤流程图。

为了对本发明实施例提供的方案进行清楚地说明，本实施例中设置了两部分内容，其中，第一部分内容用于说明如何对神经网络模型进行训练，第二部分内容用于说明如何基于训练完成的神经网络模型进行目标对象推荐。

基于此，本实施例的目标对象推荐方法包括：

(一)使用第一样本数据和第二样本数据，对用于进行情感评级预测的神经网络模型进行训练。

以下，首先对本发明实施例使用的神经网络模型结构进行说明，如图2B所示。

图2B中，所述神经网络模型包括输入部分(虚线框①)、特征提取部分(虚线框②)、逻辑单元部分(虚线框③)、胶囊网络部分(虚线框④)、和输出部分(虚线框⑤)。

其中：

输入部分包括：用于接收与用户的评论数据对应的词向量的第一输入部分(虚线框①中上半部分)，和，用于接收与目标对象的评论数据对应的词向量的第二输入部分(虚线框①中下半部分)。

特征提取部分，用于对第一输入部分输出的向量和所述第二输入部分输出的向量进行特征提取，获得与第一输入部分输出的向量对应的观点向量(虚线框②中上半部分)，和，与第二输入部分输出的向量对应的属性向量(虚线框②中下半部分)。

逻辑单元部分，用于对所述观点向量和所述属性向量进行配对，生成对应的逻辑单元。

胶囊网络部分包括：用于对逻辑单元进行正向情感预测并输出正向情感特征向量的第一胶囊网络部分(虚线框④中上半部分)，和，用于对逻辑单元进行负向情感预测并输出负向情感特征向量的第二胶囊网络部分(虚线框④中下半部分)。

输出部分，用于根据第一胶囊网络部分输出的正向情感特征向量和第二胶囊网络部分输出的负向情感特征向量，预测输出用户对目标对象的情感信息。

其中，特征提取部分包括卷积部分和自注意力部分。

所述卷积部分包括：用于对第一输入部分输出的向量进行卷积，并输出对应的语义向量的第一卷积部分(虚线框②中上半部分左侧)，和，用于对第二输入部分输出的向量进行卷积，并输出对应的语义向量的第二卷积部分(虚线框②中下半部分左侧)。

所述自注意力部分包括：用于使用门机制和自注意力机制对第一卷积部分输出的语义向量进行处理并输出用户的观点向量的第一自注意力部分(虚线框②中上半部分右侧)，和，用于使用门机制和自注意力机制对第二卷积部分输出的语义向量进行处理并输出目标对象的属性向量的第二自注意力部分(虚线框②中下半部分右侧)。

所述神经网络模型的输出部分包括高速网络层和回归层，其中，高速网络层，用于根据所述正向情感特征向量和所述负向情感特征向量，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；所述回归层，用于根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出用户对目标对象的情感信息。

此外，所述神经网络模型通过双动态路由协议将逻辑单元部分输出的逻辑单元路由至胶囊网络部分，所述双动态路由协议中的路由权重根据第一权重和第二权重确定；其中，第一权重用于指示逻辑单元与第一胶囊网络部分和第二胶囊网络部分之间的权重，第二权重用于指示第一胶囊网络部分内部的逻辑单元权重和第二胶囊网络部分内部的逻辑单元权重。

基于上述神经网络模型的结构，对该神经网络模型的训练过程包括：

步骤S202：获取第一样本数据和第二样本数据，并将第一样本数据和第二样本数据分别转换为对应的第一词向量和第二词向量。

其中，第一样本数据用于表示多个样本用户的用户评论样本数据，第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据。

将第一样本数据转换为第一词向量和将第二样本数据转换为第二词向量的具体操作可以由本领域技术人员采用任意适当的方式实现，如，TF-IDF方式、word2vec方式等，本发明实施例对此不作限制。

例如，以网上购物为例，针对每个用户u，把该用户对购买过的商品所写过的所有评论拼接在一起，形成用户u的评论数据(w₁，w₂，…，w_l1)，l1表示第一样本数据中词的个数；针对每个商品i，把所有用户写给当前商品的评论拼接在一起，形成商品i的评论数据(w₁，w₂，…，w_l2)，l2表示第二样本数据中词的个数；初始化词向量映射矩阵E，其包括了第一样本数据和第二样本数据中的所有词对应的词向量，通过E，可以获得针对用户u拼接过的评论对应的第一词向量D’_u和针对商品i拼接过的评论对应的第二词向量D’_i。其中，D’_u＝(e₁，e₂，…，e_l1)，D’_i＝(e₁，e₂，…，e_l2)。

步骤S204：通过神经网络模型的输入部分，接收第一样本数据对应的第一词向量和第二样本数据对应的第二词向量。

本实施例中，神经网络模型的输入部分可以采用常规设置，可同时接收第一词向量和第二词向量并传递给神经网络模型的后续部分进行处理即可。

仍以前述网上购物为例，则本步骤中，可以通过图2B中所示的输入部分接收第一词向量D’_u和第二词向量D’_i。

步骤S206：通过神经网络模型的特征提取部分，获得第一词向量和第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量。

如图2B中所示，本实施例的神经网络模型的特征提取部分可以包括卷积部分和自注意力部分，则可以通过神经网络模型的卷积部分，获得第一词向量和第二词向量分别对应的第一语义向量和第二语义向量；使用门机制和自注意力机制，对第一语义向量和第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

门机制也称门控机制，用来控制神经网络中信息的传递。其可以用来控制记忆单元中的信息有多少需要保留，有多少需要丢弃。在本神经网络模型中，门机制主要用于控制第一语义向量所携带的信息中与各个第一主题相关的信息有多少需要保留，有多少需要丢弃。类似地，本神经网络模型中的门机制还用于控制第二语义向量所携带的信息中与各个第二主题相关的信息有多少需要保留，有多少需要丢弃。通过门机制过滤后的特征向量的维度与过滤前维度一致。也即，通过门机制，实现了样本用户的用户评论样本数据中每个词所对应的词向量所携带的信息中与第一主题(代表用户观点)相关的信息的过滤，和，样本目标对象的目标对象评论样本数据中每个词所对应的词向量所携带的信息中与第二主题(代表目标对象属性)相关的信息的过滤。

自注意力(SELF-ATTENTION)机制是注意力(ATTENTION)机制的一种形式，其在注意力序列内部做ATTENTION，寻找序列内部的联系。通过自注意力机制，减少了对外部信息的依赖，更擅长捕捉数据或特征的内部相关性。具体到本实施例中的神经网络模型，引入自注意力机制可以将关注点聚焦于各个主题下的向量间的特征表达和关联。

本实施例中，第一主题根据第一样本数据获得，包括但不限于对第一样本数据进行聚类或者按照第一设定规则进行分类获得；类似地，第二主题根据第二样本数据获得，包括但不限于对第二样本数据进行聚类或者按照第二设定规则进行分类获得。其中，第一设定规则和第二设定规则均可由本领域技术人员根据实际需求适当设置，本发明实施例对此不作限制。例如，对第一样本数据进行聚类获得五个第一主题，如，外形好看、功能全面、省电、耐用、太贵；对第二样本数据进行聚类获得五个第二主题，如，待机时间长、省电、操作简单、外形好看、性价比高。可见，第一主题和第二主题中可以包含相同的主题，当然，也可以为完全不同或完全相同的主题。第一主题和第二主题的信息可以预先设置在神经网络模型中(例如，以向量的形式预先设置在神经网络模型中)，在需要时使用。一般来说，第一主题的数量和第二主题的数量可相等，例如，可设置为3个、5个、7个或9个等。较优地，可选择5个或7个，既能满足训练需要又能达到较好的训练效果。但不限于此，本领域技术人员也可以根据实际情况，选择其它适当的主题数量。

具体到本实施例，可以使用门机制和自注意力机制对第一语义向量进行针对各个第一主题的过滤，过滤后，可以使得不同第一主题下对应的第一语义向量的权重不同。同样，使用门机制和自注意力机制对第二语义向量进行针对各个第二主题的过滤，过滤后，可以使得不同第二主题下对应的第二语义向量的权重不同。

因第一语义向量可以表征用户的观点特征，第二语义向量可以表征目标对象的属性特征，因此，在通过门机制和自注意力机制过滤后，各个第一主题下对应的第一语义向量称为观点向量，各个第二主题下对应的第二语义向量称为属性向量。

在一种可行方式中，使用门机制和自注意力机制，对第一语义向量和第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量可以包括：根据门机制和第一样本数据对应的多个第一主题，对第一语义向量进行过滤，获得第一语义向量在不同第一主题下的第一语义表达；以及，根据门机制和第二样本数据对应的多个第二主题，对第二语义向量进行过滤，获取第二语义向量在不同第二主题下的第二语义表达；使用自注意力机制分别对第一语义表达和第二语义表达进行特征提取，获得对应的第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。通过门机制过滤，使得针对不同主题的语义表达更具有代表性，进一步通过自注意力机制过滤，可以对不同主题下的语义表达进行有效的特征聚焦，使提取的特征更能代表各个主题。

仍以前述网上购物为例，在通过神经网络模型的卷积部分，获得第一词向量和第二词向量分别对应的第一语义向量和第二语义向量时，对于D′_u里的每一个单词w_j依次映射到词向量空间(其中，j＝1，2……，l1)，得到向量e_j∈R^d，其中，d表示嵌入尺寸，R表示实数集，R^d表示一个维度为d的实数向量。由此得到对应的词向量矩阵D_u＝(e₁，e₂，...，e_l1)；类似地，对于D′_i里的每一个单词w_j依次映射到词向量空间(其中，j＝1，2……，l2)，得到向量e_j∈R^d，由此得到对应的词向量矩阵D_i＝(e₁，e₂，...，e_l2)。对词向量矩阵D_u和D_i，通过n(取值范围一般为【50，100，150】，可选地为50)个窗口大小为c(取值一般可为3、4、5，可选地为3)的卷积核分别对D_u和D_i进行卷积操作，分别得到嵌入长度为c的上下文信息的语义向量c_l1∈Rⁿ(对应于D_u的第一语义向量)和向量c_l2∈Rⁿ(对应于D_i的第二语义向量)，c_l1＝(c₁，c₂，...，c_|l1|)，c_l2＝(c₁，c₂，...，c_|l2|)。其中，n表示过滤器数量，Rⁿ表示n维的实数向量，|l1|表示D_u的长度，|l2|表示D_i的长度。并且，

通过上述公式，可以把n个卷积核对应的卷积值拼接起来，得到一个维度为n的实数向量。其中，

是卷积核参数，*号表示卷积操作，b_f是一个偏置值。每个卷积核对应一个W^f和一个b_f。

是第f个卷积核在第j个词的输出，是一个常数。

基于获得的c_l1和c_l2，在使用门机制进行过滤时，利用门机制结合对应的主题向量(第一主题对应的向量和第二主题对应的向量)对语义向量c_l1和c_l2进行过滤操作，然后通过一个主题共享的转换矩阵得到针对不同主题的语义表达。其中，假设第一主题中的某一个主题x，所有用户都用同一个主题转移矩阵Wx来转移，则该主题转换矩阵即可为主题共享的转换矩阵，一种主题共享的转换矩阵如公式4中的Wp。

以对c_l1的过滤为例，对于c_l1＝(c₁，c₂，...，c_|l1|)中的第j个单词c_j，利用门机制操作对c_l1向量所携带的特征进行过滤，得到相关观点向量s_u，x，j∈Rⁿ，公式如下：

s_u，x，j＝c_j⊙σ(W_x，1c_j+W_x，2q_u，x+b_x) (公式3)

其中，W_x，1，W_x，2∈R^n×n和b_x∈Rⁿ分别是权重矩阵和偏差向量，q_u，x是对于用户u第x个主题向量，⊙表示逐维相乘，σ表示sigmoid激活函数。在一种可行方式中，上述权重矩阵和偏差向量可以在初始时随机生成，但符合正太分布，均值为0，方差为0.3。

将观点向量s_u，x，j通过一个映射矩阵W_p∈R^k×n映射到对应的主题空间下，公式如下：

p_u，x，j＝W_ps_u，x，j (公式4)

由此，得到c_l1在不同的第一主题下的第一语义表达p_u，x，j＝(p_u，x，1，p_u，x，2，...，p_u，x，l1)。

类似地，可以得到c_l2在不同的第二主题下的第二语义表达p_i，x，j＝(p_i，x，1，p_i，x，2，...，p_i，x，l2)。

对p_u，x，j，采用自注意力机制，为每个用户提取M个对应不同主题的观点向量；同样地，对p_i，x，j，采用自注意力机制，为每个商品提取M个对应不同主题的属性向量。如前所述，M可由本领域技术人员适当设置，可选M＝5或M＝7等。

具体地，针对不同第一主题的语义向量矩阵P_u，1，P_u，2，...，P_u，M，对于每个语义向量矩阵P_u，x，即对于第x个主题，通过对语义向量矩阵P_u，x采取平均和的操作，得初级观点向量v_u，x∈R^k，公式如下：

其中，l1含义如前。

然后，根据特定主题空间的第j个词的表达p_u，x，j和初级观点向量v_u，x，计算对应主题下第j个词的自注意力的权重如下：

根据公式(6)所计算的基于自注意力的权重，对P_u，x里的向量采取加权和，得到用户u第x个主题的最终观点表达v_u，x∈R^k，即观点向量如下：

v_u，x＝∑_jattn_u，x，jp_u，x，j (公式7)

类似地，商品i的属性向量a_i，y可参照上述观点向量的计算方式获得。但需说明的是，商品i的属性向量a_i，y学习过程与用户的观点向量虽一致，但参数不共享。

步骤S208：对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元。

例如，可以对观点向量中的每一个观点向量，分别与每一个属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元。

假设，观点向量有10个，属性向量也有10个，则两两结合配对后，将形成10*10＝100个逻辑单元。

在一种可行方式中，可以对观点向量中的每一个观点向量，分别与每一个属性向量通过计算向量之间的差和向量之间的点乘进行两两拼接配对，根据配对结果生成对应的多个逻辑单元。通过该种拼接配对的方式，可以高效且低成本地实现逻辑单元的生成。

仍以上述网络购物为例，给定用户u和商品i，将步骤S206得到的用户观点向量v_u，x和商品属性向量a_i，y两两配对，构成逻辑单元表达g_x，y∈R^2k(维度为2K的实数向量)，公式如下：

其中，

为向量拼接操作。

通过将观点向量和属性向量配对为逻辑单元的形式，为后续情感特征向量的生成提供了客观和全面的数据依据。

步骤S210：将多个逻辑单元输入胶囊网络部分，获得对应的情感特征向量。

一个胶囊网络是由胶囊而不是由神经元构成，其中，一个胶囊是一小群神经元。胶囊网络的输出是一个向量(例如，一个8维的向量)，每个胶囊网络输出向量的长度代表了目标是否存在的估计概率。胶囊网络也是由多层构成，处于最底层的胶囊被称为向量胶囊，它们每个都只用一部分数据作为输入，然后试图去探测某个特殊的特征(例如，一个设定语言表达)是否存在。在更高层的胶囊则是探测更大和更复杂的目标等。具有到本神经网络模型，运用胶囊网络对特征间复杂关系的良好建模能力，可以很好地解决了对用户评论中的情感行为的潜在原因的推理问题，由此可以有效地获得与每个逻辑单元对应的情感特征向量。

本实施例中的胶囊网络部分包括用于正向情感预测的第一胶囊网络部分和用于负向情感预测的第二胶囊网络部分，因此，本步骤可以实现为：将多个逻辑单元分别输入用于正向情感预测的第一胶囊网络部分和用于负向情感预测的第二胶囊网络部分，获取对应的正向情感特征向量和负向情感特征向量。也即，由逻辑单元部分生成的多个逻辑单元输入胶囊网络部分后，通过第一胶囊网络部分的处理获得对应的一个正向情感特征向量，通过第二胶囊网络部分的处理获得对应的一个负向情感特征向量。

其中，所述逻辑单元部分和所述胶囊网络部分之间采用双动态路由协议，双动态路由协议中的路由权重根据第一权重和第二权重确定，第一权重用于指示逻辑单元与胶囊网络部分(包括第一胶囊网络部分和第二胶囊网络部分)之间的权重，第二权重用于指示第一胶囊网络部分内部的逻辑单元权重和第二胶囊网络部分内部的逻辑单元权重。每个逻辑单元和胶囊网络部分的权重综合考虑该逻辑单元对应的第一权重和第二权重。

逻辑单元部分根据双动态路由协议将各个逻辑单元路由至胶囊网络部分，通过胶囊网络部分获得各个逻辑单元对应的正向情感特征向量和负向情感特征向量。

例如，给定用户u和商品i，将经过步骤S208得到的所有逻辑单元g_1，1，g_1，2，...，g_M，M分别输入代表正向情感预测的第一胶囊网络和负向情感预测的第二胶囊网络。

对于每一个逻辑单元g_x，y，初始化参数b_s，x，y＝0，通过一个转换矩阵(如公式9中的W_s，x，y)把它转换成胶囊网络的隐向量t_s，x，y∈R^k，(维度为K的实数向量)x，y∈1......M，s∈S＝{pos，neg}(第一胶囊网络和第二胶囊网络)，公式如下：

t_s，x，y＝W_s，x，yg_x，y (公式9)

其中，W_s，x，y∈R^k×2k是第s个胶囊里第(x，y)对的逻辑单元所对应的转换权重矩阵。

对每对逻辑单元g_x，y，根据对应胶囊里的参数b_s，x，y，分别计算它胶囊间的权重

(第一权重)和胶囊内的权重

(第二权重)如下：

根据逻辑单元对应的胶囊间的权重和胶囊内的权重，通过L1归一化的操作计算每个逻辑单元g_x，y在对应胶囊s内的对应权重如下：

根据得到的胶囊s内的隐向量t_s，x，y和对应的权重c_s，x，y，进行合并成一个向量如下：

s_s，u，i＝∑_x，yc_s，x，yt_s，x，y (公式13)

类似一般的胶囊网络，对向量s_s，u，i进行压缩，得到胶囊网络最终的输出o_s，u，i∈R^k，公式如下：

其中，||||表示向量长度，也表征相应情感存在的概率。

根据输出o_s，u，i，更新胶囊内参数b_s，x，y，公式如下：

返回胶囊间权重(第一权重)和胶囊内权重(第二权重)的计算步骤迭代计算(如迭代1-4次，可选地为3次)，最后输出的情感向量o_s，u，i当作是情感胶囊s输出的情感特征向量，其包括向量o_poS，u，i，o_neg，u，i∈R^k。

步骤S212：通过神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

在输出部分采用如图2B中所示的高速网络层和回归层设置时，本步骤可以实现为：将正向情感特征向量和负向情感特征向量输入输出部分中的高速网络层，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；通过神经网络模型的输出部分中的回归层，根据正向情感特征向量、负向情感特征向量、正向程度向量和负向程度向量，输出样本用户对样本目标对象的情感信息。

其中，高速网络层(highway network)用来控制神经网络中信息的传递。本神经网络模型中，高速网络层用来控制输入其中的向量中有多少信息需要保留，有多少需要丢弃，新的状态向量又有多少需要保留。

例如，给定用户u和商品i，根据前述步骤得到的正向情感向量o_pos，u，i和负向情感向量o_neg，u，i，通过下述过程完成对用户u对商品i打分的预测

该过程包括：将胶囊网络的输出o_s，u，i，通过一层高速网络得到最终的情感特征向量h_s，u，i，公式如下：

η_s＝σ(H_s，1o_s，u，i+b_s，1) (公式16)

h_s，u，i＝η_s⊙o_s，u，i+(1-η_s)⊙tanh(H_s，2o_s，u，i+b_s，2) (公式17)

其中，H_s，1，H_s，2∈R^k×k是转换矩阵，b_s，1，b_s，2∈Rk是偏差向量。σ表示sigmoid激活函数。

需要说明的是，本实施例中在计算时引入的“转换矩阵”及其它计算参数，均可参考现有胶囊网络中对转换矩阵的设置和操作实现。

根据情感特征向量h_s，u，i，通过一层回归层计算出用户对商品存在的正向/负向情感的程度向量r_s，u，i，公式如下：

其中，w_s∈R^k是回归函数的权重向量，b_s，3∈R是偏置值。

分别对正向情感特征向量和负向情感特征向量计算得到的正向程度向量r_pos，u，i和负向程度向量r_neg，u，i，以及根据||o_pos，u，i||和||o_neg，u，i||，经过一个变形的sigmoid函数完成对用户u对商品i的分数预测

公式如下：

其中，||o_pos，u，i||和||o_neg，u，i||分别代表正向情感向量和负向情感向量的长度，也表示用户u对商品i持有对应情感的概率。函数

是sigmoid函数的变形，可以预测分数范围在[1，C]。

步骤S214：根据预测输出的所述情感信息与对应的情感标注信息的差异，调整所述神经网络模型的训练参数，并根据调整后的训练参数对神经网络模型进行迭代训练，直至满足训练终止条件。

其中，情感标注信息可以为样本用户对样本目标对象进行的实际评论中的情感信息表达；调整的所述训练参数可以为神经网络模型训练过程中需要调整的常规参数，包括但不限于：各种权重参数，各种卷积参数等等；所述训练终止条件可以是训练满足设定的次数后终止，或者，预测输出的情感信息与情感标注信息的差异满足设定的阈值后终止。其中，设定的次数和设定的阈值均可以由本领域技术人员根据实际情况适当设置，本发明实施例对此不作限制。

例如，训练时，给定集合O＝{(u，i)}_1→|O|，其中(u，i)表示一对用户-商品对，u表示第u个用户，i表示第i个商品，r_u，i表示用户u对商品i给出的实际分数，根据预测分数

可以得到模型的MSE损失函数，公式如下：

根据用户给商品打的实际分值，可以把集合O中用户的打分行为分为正面O_pos和负面O_neg两个分离的数据集。然后根据情感特征向量o_s，u，i，得到模型的情感分类函数，公式如下：

其中，

代表着与s相反的情感倾向。

结合公式20和21，模型训练时的最终损失函数为下式：

L＝λL_sqr+(1-λ)L_stm (公式22)

其中，λ为可调节两个任务重要程度的重要性因子，通常为0到1之间的实数，模型在训练时运用反向传播以及随机梯度下降算法进行优化。模型训练若干轮数后训练完成。

由上可见，本实施例的神经网络模型可以通过对用户所写评论进行两极情感建模来完成分数预测任务和用户打分行为潜在原因的推理任务。本神经网络模型通过嵌入词向量、卷积操作等方式构建嵌入上下文信息的语义表达，然后通过带有主题向量的门机制和自注意机制，提取出用户和商品与主题有关的多个隐含表达，并通过两个情感胶囊网络提取最重要的相关性信号特征，接着通过一层高速网络和一个修改后的sigmoid函数将正负面的情感特征转化成基于特定用户对于商品的预测得分。为了引入情感因素，模型训练时采取了多任务训练过程，保证模型具有正负面情感的感知能力。

本实施例的神经网络模型很好地利用了词向量空间上的丰富信息，通过自注意力机制、胶囊网络、多任务训练等技术有效地完成了分数预测和用户打分行为潜在原因的推理任务。本实施例的神经网络模型可以很好地应用在推荐系统的分数预测任务上，对用户的打分行为具有较好的可解释性。与此同时，本实施例的神经网络模型可以很好地应用到各种场景之中，具有广泛的实际意义和商业价值。

训练完模型后，给定用户u和商品i所对应的历史评论数据D′_u和D′_i后，就可以预测该用户u与该商品i的打分

即，完成训练后的神经网络模型即可根据输入的用户的第一历史评论和目标对象的第二历史评论数据，输出是否建议向该用户推荐该目标对象的信息。具体如下第(二)部分说明。

(二)使用训练后的所述神经网络模型，获取是否向用户推荐目标对象的建议。

具体地，包括：

步骤S216：获取用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据。

其中，多个第一历史评论数据中的至少部分第一历史评论数据中同时包含有正向情感数据和负向情感数据；和/或，多个第二历史评论数据中的至少部分第二历史评论数据中同时包含有正向情感数据和负向情感数据。

步骤S218：分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量。

其中，第一向量可以为第一词向量，第二向量可以为第二词向量。

步骤S220：将第一向量和第二向量输入用于进行情感评级预测的神经网络模型，通过所述神经网络模型对第一向量和第二向量进行处理，以基于处理后获得的正向情感特征和负向情感特征输出用户对目标对象的情感信息。

基于前述第(一)部分的神经网络模型，向其输入第一历史评论数据对应的第一向量和第二历史评论数据对应的第二向量，即可获得用户对目标对象的情感信息，例如，用户对该目标对象的感兴趣或喜爱程度的信息等。

步骤S222：根据所述情感信息确定是否向用户推荐所述目标对象。

例如，若所述情感信息指示用户对该目标对象的兴趣超过某一设定阈值，则向该用户推荐该目标对象，反之，则不推荐。

实施例三

参照图3，示出了根据本发明实施例三的一种数据处理方法的步骤流程图。

本实施例的数据处理方法包括以下步骤：

步骤S302：通过神经网络模型的输入部分接收第一样本数据对应的第一词向量和第二样本数据对应的第二词向量。

步骤S304：通过神经网络模型的特征提取部分，获得第一词向量和第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量。

可选地，本步骤可以实现为：通过神经网络模型的卷积部分，获得第一词向量和第二词向量分别对应的第一语义向量和第二语义向量；使用门机制和自注意力机制，对第一语义向量和第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

可选地，所述使用门机制和自注意力机制，对第一语义向量和第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量，包括：根据门机制和第一样本数据对应的多个第一主题，对第一语义向量进行过滤，获得第一语义向量在不同第一主题下的第一语义表达；以及，根据所述门机制和所述第二样本数据对应的多个第二主题，对所述第二语义向量进行过滤，获取所述第二语义向量在不同第二主题下的第二语义表达；使用自注意力机制分别对所述第一语义表达和所述第二语义表达进行特征提取，获得对应的第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

步骤S306：对观点向量和属性向量进行配对，生成对应的多个逻辑单元。

可选地，本步骤可以实现为：对所述观点向量中的每一个观点向量，分别与每一个所述属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元。

进一步可选地，所述对所述观点向量中的每一个观点向量，分别与每一个所述属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元，包括：对所述观点向量中的每一个观点向量，分别与每一个所述属性向量通过计算向量之间的差和向量之间的点乘进行两两拼接配对，根据配对结果生成对应的多个逻辑单元。

步骤S308：将多个逻辑单元输入神经网络模型的胶囊网络部分，获得对应的情感特征向量。

可选地，本步骤可以实现为：将所述多个逻辑单元分别输入用于正向情感预测的第一胶囊网络部分和用于负向情感预测的第二胶囊网络部分，获取对应的正向情感特征向量和负向情感特征向量。

步骤S310：通过神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

可选地，本步骤可以实现为：将所述正向情感特征向量和所述负向情感特征向量输入所述输出部分中的高速网络层，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；通过所述神经网络模型的输出部分中的回归层，根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出样本用户对样本目标对象的情感信息。

步骤S312：根据所述输出部分输出的所述情感信息，对所述神经网络模型的训练参数进行调整，并使用调整后的训练参数对所述神经网络模型继续进行训练，直至达到训练终止条件。

其中，所述训练参数为所述神经网络模型中的常规训练参数，包括但不限于如权重参数、偏置参数等等。在调整训练参数后，继续对神经网络模型进行训练，如返回步骤S304继续执行，对所述神经网络模型进行迭代训练，直至达到训练终止条件，如训练次数达到预定次数，或者，如，训练的目标参数如损失函数对应的损失值达到预定阈值等等。

通过对所述神经网络模型的迭代训练，最终达到符合要求的用于进行情感评级预测的神经网络模型。

需要说明的是，本实施例的数据处理方法的过程与前述实施例二中的第(一)部分即神经网络模型训练部分较为相似，因此描述得较为简单，相关部分可参照实施例二中相关部分的描述，在此不再详述。

通过本实施例，实现了用于进行情感评级预测的神经网络模型的训练。通过训练完成的神经网络模型，可以获取用户对目标对象的情感信息，因该情感信息既基于用户对目标对象的正向情感特征，又基于用户对目标对象的负向情感特征获得。又因该神经网络模型处理的数据包括某个或某类用户对其处理过的目标对象的评论数据(即第一历史评论数据)，以及，某个或某类目标对象被多个处理者评论过的评论数据(即第二历史评论数据)。可见，不管是历史评论数据中包含的两面性信息，还是用户对目标对象情感的两面性信息，该神经网络模型均可兼顾。由此，该神经网络模型可以对用户评论的内容，尤其是具有两面性评论的内容，进行有效地挖掘，以获得更为精准、有效的信息。

本实施例的数据处理方法可以由任意适当的具有数据处理能力的电子设备执行，包括但不限于：服务器、移动终端(如手机、PAD等)和PC机等。

实施例四

参照图4，示出了根据本发明实施例四的一种目标对象推荐系统的结构框图。

本实施例的目标对象推荐系统包括：输入模块402、特征提取模块404、逻辑单元模块406、胶囊网络模块408、和输出模块410。

输入模块402包括：用于接收与用户的评论数据对应的词向量的第一输入部分，和，用于接收与目标对象的评论数据对应的词向量的第二输入部分。

针对每个用户u，把该用户写的所有评论拼接在一起，形成用户的评论数据(即用户的评论文档)(w₁，w₂，…，w_l1)。给语料库中每个词一个初始化的维度为300的wordembedding，然后把用户的评论数据里每一个词转换成对应的词向量e_w(embedding)。这样用户的评论数据就是一个词向量矩阵D‘_u∈

其中l1表示用户的评论数据长度，可以设置l1＝300，d为词向量维度，可以设置为300。

类似地，针对每个目标对象，可以把该目标对象对应的所有评论拼接后进行类似处理，向量化为一个词向量矩阵D’_i，

同样可以设置l2＝300，d＝300。

然后，将D’_u和D’_i分别输入模块402，其中，第一输入部分接收D’_u，第二输入部分接收D’_i。特征提取模块404，用于对第一输入部分输出的向量和第二输入部分输出的向量进行特征提取，获得与第一输入部分输出的向量对应的观点向量，和，与第二输入部分输出的向量对应的属性向量。

可选地，特征提取模块404包括卷积部分和自注意力部分；卷积部分包括：用于对第一输入部分输出的向量进行卷积，并输出对应的语义向量的第一卷积部分，和，用于对第二输入部分输出的向量进行卷积，并输出对应的语义向量的第二卷积部分；自注意力部分包括：用于使用门机制和自注意力机制对第一卷积部分输出的语义向量进行处理并输出用户的观点向量的第一自注意力部分，和，用于使用门机制和自注意力机制对所述第二卷积部分输出的语义向量进行处理并输出目标对象的属性向量的第二自注意力部分。

其中，卷积部分可以实现为卷积层。卷积层可以只有一层，根据每个用户的评论数据得到对应的词向量矩阵D’_u后，对该词向量矩阵D’_u采用一维卷积操作，卷积核长度是c＝3，每次步长为1，filter的数量是n＝50。卷积层把D’_u矩阵里每个词向量e_s转换成嵌入上下文的词向量c_j∈Rⁿ，即第一语义向量。卷积层输出矩阵C_l1＝[c1，c2，…，c|l1|]。类似地，可以得到D’_i对应的第二语义向量，卷积层输出矩阵C_l2＝[c1，c2，…，c|l2|]，即第二语义向量。

而自注意力部分主要对得到嵌入上下文的词向量C_l1和C_l2进行操作。

具体地，每个主题(包括：根据用户的评论数据获得多个第一主题和根据目标对象的评论数据获得的多个第二主题)对应有相应的主题向量

其中n取值和卷积层filter数量取值一致，n＝50，q_u，x表示针对用户u的第x个主题向量。然后采用门机制操作过滤词向量C_l1和C_l2每个维度携带的信息：

s_u，x，j＝c_j⊙σ(W_x，1c_j+W_x，2q_u，x+b_x)

其中，W_x，1，W_x，2∈R^n×n和b_x∈Rⁿ分别是权重矩阵和偏差向量，⊙表示逐维相乘。

经过门机制后，对每个词向量相当于做了一次过滤，得到向量表达s_u，x，j，然后再把每个词对应的向量s_u，x，j通过不同的映射矩阵W_p∈R^k×n映射到每个主题空间下：

p_u，x，j＝W_ps_u，x，j

其中，k可以有多种取值，如可以取值为25。

然后，在每个主题空间下对词向量采取self-attetion操作。

Self-attention操作先对一个主题空间下所有的词向量p_u，x，j取均值，得到一个初步观点表v_u，x。再根据向量v_u，x和向量p_u，x，j计算每个词对应的权重(attentive weight)attn_u，x，j，然后再根据算出来的权重对向量p_u，x，j重算加权和后，得到最终的观点向量v_u，x：

v_u，x＝∑_jattn_u，x，jp_u，x，j

v_u，x表示用户u在第x个第一主题下的观点向量。类似地，可以获得目标对象i在第y个第二主题下的属性向量a_i，y。

经过了自注意力机制后，每个用户u可以关联M个v_u，x向量，每个目标对象i关联M个a_i，y向量。自注意力部分最终输出为：M个用户的观点向量和M个目标对象的属性向量。

逻辑单元模块406，用于对所述观点向量和所述属性向量进行配对，生成对应的逻辑单元。

对每个用户都会有M个v_u，x向量，对每个目标对象也会有M个a_i，y向量。给定一对用户-目标对象，目标对象推荐系统会让得到的v_u，x向量和a_i，y向量两两配对，得到M*M个逻辑单元g_x，y：

其中，符号

表示向量拼接操作，也就是每个v_u，x向量和a_i，y向量的逐维的差和逐维的乘积，然后拼接在一起得到向量

构建好的M*M(如5*5＝25)个逻辑单元(Logic unit)作为胶囊网络模块308(Sentiment Capsule)的输入。

胶囊网络模块408包括：用于对逻辑单元进行正向情感预测并输出正向情感特征向量的第一胶囊网络部分，和，用于对逻辑单元进行负向情感预测并输出负向情感特征向量的第二胶囊网络部分。

本实施例的第一胶囊网络部分代表正向情感(positive caps)，第二胶囊网络部分代表负向情感(negative caps)。两者结构相同，但参数不同。输入都是上一步构建的M*M个逻辑单元。两个胶囊网络部分(capsule)会根据所有的逻辑单元学习出各自的输出表达o_pos，u，i(正向情感特征向量)/o_neg，u，i(负向情感特征向量)。胶囊网络部分的一个特点是输入是一堆向量，输出是一个向量，具体细节如下：

t_s，x，y＝W_s，x，yg_x，y

s_s，u，i＝∑_x，yC_s，x，yt_s，x，y

上述过程中，首先，每个胶囊网络部分会对每个输入的逻辑单元分配一个初始值为0的权重b_s，x，y。每个胶囊网络部分里的每个逻辑单元会对应一个转移矩阵W_s，x，y∈R^k×2k，得到向量

然后C_s，x，y是每个逻辑单元对应的权重，具体值由对应的b_s，x，y计算得出。对t_s，x，y向量加权求和后得到s_s，u，i向量。胶囊网络部分输出向量的长度代表这个胶囊网络部分所学习的特征存在的一个概率，所以最后一步是对s_s，u，i向量做一个非线性变化的squash的操作，同时把向量长度压缩到(0-1)之间。该步骤迭代执行，每次迭代会根据向量o和t的关系，更新向量t对应的b值。

本实施例中，推荐系统通过双动态路由协议将所述逻辑单元模块输出的逻辑单元路由至所述胶囊网络模块，所述双动态路由协议中的路由权重根据第一权重和第二权重确定；其中，所述第一权重用于指示逻辑单元与所述第一胶囊网络部分和所述第二胶囊网络部分之间的权重，所述第二权重用于指示所述第一胶囊网络部分内部的逻辑单元权重和所述第二胶囊网络部分内部的逻辑单元权重。

也即，本实施例在胶囊网络中，将传统动态路由机制改成了双动态路由(bi-agreement)机制。传统的动态路由只有

x，y这一个权重(inter-caps)，本实施例把

x，y也加入计算中(intra-caps)。胶囊网络模块408最终的输出分别为嵌入正面情感信息的正向情感特征向量O_pos，u，i和嵌入负面情感信息的负向情感特征向量O_neg，u，i。

所述输出模块410，用于根据所述第一胶囊网络部分输出的正向情感特征向量和所述第二胶囊网络部分输出的负向情感特征向量，预测输出用户对目标对象的情感信息。

可选地，所述输出模块410包括高速网络层和回归层。所述高速网络层，用于根据所述正向情感特征向量和所述负向情感特征向量，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；所述回归层，用于根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出用户对目标对象的情感信息。

目标对象推荐系统最后对分数的预测是：喜欢的概率×喜欢的程度-不喜欢的概率×不喜欢的程度这样一个类型。其中，由于胶囊网络部分学习出的向量o的长度代表特征存在的概率，所以可以直接用||o||得到对应情感的概率。

根据向量opos，u，i和oneg，u，i分别计算喜欢的程度和不喜欢的程度r。这里借助高速网络(highway network)层和一层回归层操作来进行计算。

首先是让向量o通过高速网络层提取有效特征：

η_s＝σ(H_s，1o_s，u，i+b_s，1)

h_s，u，i＝η_s⊙o_s，u，i+(1-η_s)⊙tanh(H_s，2o_s，u，i+b_s，2)

其中，H_s，1，H_s，2∈R^k×k是转换矩阵，b_s，1，b_s，2∈R^k是偏差向量。

然后，根据变换后的向量h，通过回归层操作计算最终的情感程度：

其中，w_s∈R^k是回归函数的权重向量，b_s，3∈R是偏置值。

最后，根据得到的情感程度和概率，通过一个拉伸后的sigmoid函数计算最终预测的分数如下：

可以看出，这个拉伸过的sigmoid函数fc(x)预测的分数范围在[1，C]，可选地，C＝5。

据此，如果一个用户喜欢某个目标对象的可能性高，那么这个x的值就是正数(喜欢-不喜欢＞0)，反之则x为负数，但最终预测的分数是1-5，所以这里就做了一个变换，取值范围在1-5之间。同时还具备可解释性，可以看用户喜欢和不喜欢的程度来推断这个分数的原因。

需要说明的是，如果最后只是想要预测分数，也可以用传统的方法，比如两个o向量拼接然后过一层全连接(MLP)，以简单实现，降低成本。然而，通过本实施例的预测方式，可以把喜欢和不喜欢量化出来，且具备可解释性。

需要说明的是，本实施例的目标对象推荐系统描述较为简略，其具体结构及其说明可参照图2B及实施例二中相关部分。

根据本实施例，通过用于进行情感评级预测的神经网络模型，获取用户对目标对象的情感信息，因该情感信息既基于用户对目标对象的正向情感特征，又基于用户对目标对象的负向情感特征获得。又因该神经网络模型处理的数据包括某个或某类用户对其处理过的目标对象的评论数据(即第一历史评论数据)，以及，某个或某类目标对象被多个处理者评论过的评论数据(即第二历史评论数据)。可见，不管是历史评论数据中包含的两面性信息，还是用户对目标对象情感的两面性信息，本发明实施例均可兼顾。由此，本发明实施例提供的方案可以对用户评论的内容，尤其是具有两面性评论的内容，进行有效地挖掘，以获得更为精准、有效的信息。

实施例五

参照图5，示出了根据本发明实施例五的一种目标对象推荐装置的结构框图。

本实施例的目标对象推荐装置包括：生成模块502，用于分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量；处理模块504，用于将所述第一向量和所述第二向量输入用于进行情感评级预测的神经网络模型，通过所述神经网络模型对所述第一向量和第二向量进行处理，以基于处理后获得的正向情感特征和负向情感特征输出所述用户对所述目标对象的情感信息；推荐模块506，用于根据所述情感信息确定是否向所述用户推荐所述目标对象。

可选地，多个所述第一历史评论数据中的至少部分第一历史评论数据中同时包含有正向情感数据和负向情感数据；和/或，多个所述第二历史评论数据中的至少部分第二历史评论数据中同时包含有正向情感数据和负向情感数据。

可选地，本实施例的目标对象推荐系统还包括：训练模块508，用于使用第一样本数据和第二样本数据，对所述神经网络模型进行训练；其中，所述第一样本数据用于表示多个样本用户的用户评论样本数据，所述第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；所述第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据。

可选地，所述训练模块508包括：输入子模块5082，用于通过所述神经网络模型的输入部分，接收所述第一样本数据对应的第一词向量和所述第二样本数据对应的第二词向量；特征提取子模块5084，用于通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量；逻辑单元子模块5086，用于对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元；胶囊网络子模块5088，用于将所述多个逻辑单元输入胶囊网络部分，获得对应的情感特征向量；输出子模块5080，通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

可选地，所述特征提取子模块5084，用于通过所述神经网络模型的卷积部分，获得所述第一词向量和所述第二词向量分别对应的第一语义向量和第二语义向量；使用门机制和自注意力机制，对所述第一语义向量和所述第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

可选地，所述特征提取子模块5084在使用门机制和自注意力机制，对所述第一语义向量和所述第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量时：根据门机制和所述第一样本数据对应的多个第一主题，对所述第一语义向量进行过滤，获得所述第一语义向量在不同第一主题下的第一语义表达；以及，根据所述门机制和所述第二样本数据对应的多个第二主题，对所述第二语义向量进行过滤，获取所述第二语义向量在不同第二主题下的第二语义表达；使用自注意力机制分别对所述第一语义表达和所述第二语义表达进行特征提取，获得对应的第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

可选地，逻辑单元子模块5086，用于对所述观点向量中的每一个观点向量，分别与每一个所述属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元。

可选地，逻辑单元子模块5086，用于对所述观点向量中的每一个观点向量，分别与每一个所述属性向量通过计算向量之间的差和向量之间的点乘进行两两拼接配对，根据配对结果生成对应的多个逻辑单元。

可选地，胶囊网络子模块5088，用于将所述多个逻辑单元分别输入用于正向情感预测的第一胶囊网络部分和用于负向情感预测的第二胶囊网络部分，获取对应的正向情感特征向量和负向情感特征向量。

可选地，所述输出子模块5080，用于将所述正向情感特征向量和所述负向情感特征向量输入所述输出部分中的高速网络层，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；通过所述神经网络模型的输出部分中的回归层，根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出样本用户对样本目标对象的情感信息。

可选地，所述神经网络模型包括：输入部分、特征提取部分、逻辑单元部分、胶囊网络部分、和输出部分。

其中，

所述输入部分包括：用于接收与用户的评论数据对应的词向量的第一输入部分，和，用于接收与目标对象的评论数据对应的词向量的第二输入部分；

所述特征提取部分，用于对所述第一输入部分输出的向量和所述第二输入部分输出的向量进行特征提取，获得与所述第一输入部分输出的向量对应的观点向量，和，与所述第二输入部分输出的向量对应的属性向量；

所述逻辑单元部分，用于对所述观点向量和所述属性向量进行配对，生成对应的逻辑单元；

所述胶囊网络部分包括：用于对所述逻辑单元进行正向情感预测并输出正向情感特征向量的第一胶囊网络部分，和，用于对所述逻辑单元进行负向情感预测并输出负向情感特征向量的第二胶囊网络部分；

所述输出部分，用于根据所述第一胶囊网络部分输出的正向情感特征向量和所述第二胶囊网络部分输出的负向情感特征向量，预测输出用户对目标对象的情感信息。

可选地，所述特征提取部分包括卷积部分和自注意力部分；所述卷积部分包括：用于对所述第一输入部分输出的向量进行卷积，并输出对应的语义向量的第一卷积部分，和，用于对所述第二输入部分输出的向量进行卷积，并输出对应的语义向量的第二卷积部分；所述自注意力部分包括：用于使用门机制和自注意力机制对所述第一卷积部分输出的语义向量进行处理并输出用户的观点向量的第一自注意力部分，和，用于使用门机制和自注意力机制对所述第二卷积部分输出的语义向量进行处理并输出目标对象的属性向量的第二自注意力部分。

可选地，所述神经网络模型通过双动态路由协议将所述逻辑单元部分输出的逻辑单元路由至所述胶囊网络部分，所述双动态路由协议中的路由权重根据第一权重和第二权重确定；其中，所述第一权重用于指示逻辑单元与所述第一胶囊网络部分和所述第二胶囊网络部分之间的权重，所述第二权重用于指示所述第一胶囊网络部分内部的逻辑单元权重和所述第二胶囊网络部分内部的逻辑单元权重。

可选地，所述输出部分包括高速网络层和回归层；所述高速网络层，用于根据所述正向情感特征向量和所述负向情感特征向量，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；所述回归层，用于根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出用户对目标对象的情感信息。

本实施例的目标对象推荐装置用于实现前述多个方法实施例中相应的目标对象推荐方法，并具有相应的方法实施例的有益效果，在此不再赘述。此外，本实施例的目标对象推荐装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述，在此亦不再赘述。

实施例六

参照图6，示出了根据本发明实施例六的一种数据处理装置的结构框图。

本实施例的数据处理装置包括：接收模块602，用于通过神经网络模型的输入部分接收第一样本数据对应的第一词向量和第二样本数据对应的第二词向量，其中，所述第一样本数据用于表示多个样本用户的用户评论样本数据，所述第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；所述第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据；第一获得模块604，用于通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量；逻辑单元生成模块606，用于对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元；第二获得模块608，用于将所述多个逻辑单元输入所述神经网络模型的胶囊网络部分，获得对应的情感特征向量；预测输出模块610，用于通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

可选地，第一获得模块604用于通过神经网络模型的卷积部分，获得第一词向量和第二词向量分别对应的第一语义向量和第二语义向量；使用门机制和自注意力机制，对第一语义向量和第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

可选地，第一获得模块604在所述使用门机制和自注意力机制，对第一语义向量和第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量时：根据门机制和第一样本数据对应的多个第一主题，对第一语义向量进行过滤，获得第一语义向量在不同第一主题下的第一语义表达；以及，根据所述门机制和所述第二样本数据对应的多个第二主题，对所述第二语义向量进行过滤，获取所述第二语义向量在不同第二主题下的第二语义表达；使用自注意力机制分别对所述第一语义表达和所述第二语义表达进行特征提取，获得对应的第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

可选地，逻辑单元生成模块606用于对所述观点向量中的每一个观点向量，分别与每一个所述属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元。

进一步可选地，逻辑单元生成模块606用于对所述观点向量中的每一个观点向量，分别与每一个所述属性向量通过计算向量之间的差和向量之间的点乘进行两两拼接配对，根据配对结果生成对应的多个逻辑单元。

可选地，第二获得模块608用于将所述多个逻辑单元分别输入用于正向情感预测的第一胶囊网络部分和用于负向情感预测的第二胶囊网络部分，获取对应的正向情感特征向量和负向情感特征向量。

可选地，预测输出模块610用于将所述正向情感特征向量和所述负向情感特征向量输入所述输出部分中的高速网络层，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；通过所述神经网络模型的输出部分中的回归层，根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出样本用户对样本目标对象的情感信息。

可选地，本实施例的数据处理装置还包括：继续训练模块612，用于根据所述输出部分输出的所述情感信息，对所述神经网络模型的训练参数进行调整，并使用调整后的训练参数对所述神经网络模型继续进行训练，直至达到训练终止条件。

本实施例的数据处理装置用于实现前述多个方法实施例中相应的数据处理方法，并具有相应的方法实施例的有益效果，在此不再赘述。此外，本实施例的数据处理装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述，在此亦不再赘述。

实施例七

参照图7，示出了根据本发明实施例七的一种电子设备的结构示意图，本发明具体实施例并不对电子设备的具体实现做限定。

如图7所示，该电子设备可以包括：处理器(processor)702、通信接口(Communications Interface)704、存储器(memory)706、以及通信总线708。

其中：

处理器702、通信接口704、以及存储器706通过通信总线708完成相互间的通信。

通信接口704，用于与其它电子设备或服务器进行通信。

处理器702，用于执行程序710，具体可以执行上述目标对象推荐方法实施例中的相关步骤，或者，可以执行上述数据处理方法实施例中的相关步骤。

具体地，程序710可以包括程序代码，该程序代码包括计算机操作指令。

处理器702可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。智能设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器706，用于存放程序710。存储器706可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序710具体可以用于使得处理器702执行以下操作：分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量；将所述第一向量和所述第二向量输入用于进行情感评级预测的神经网络模型，通过所述神经网络模型对所述第一向量和第二向量进行处理，以基于处理后获得的正向情感特征和负向情感特征输出所述用户对所述目标对象的情感信息；根据所述情感信息确定是否向所述用户推荐所述目标对象。

在一种可选的实施方式中，多个所述第一历史评论数据中的至少部分第一历史评论数据中同时包含有正向情感数据和负向情感数据；和/或，多个所述第二历史评论数据中的至少部分第二历史评论数据中同时包含有正向情感数据和负向情感数据。

在一种可选的实施方式中，程序710还用于使得处理器702在分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量之前，使用第一样本数据和第二样本数据，对所述神经网络模型进行训练；其中，所述第一样本数据用于表示多个样本用户的用户评论样本数据，所述第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；所述第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据。

在一种可选的实施方式中，程序710还用于使得处理器702在使用第一样本数据和第二样本数据，对所述神经网络模型进行训练时：通过所述神经网络模型的输入部分，接收所述第一样本数据对应的第一词向量和所述第二样本数据对应的第二词向量；通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量；对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元；将所述多个逻辑单元输入胶囊网络部分，获得对应的情感特征向量；通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

在一种可选的实施方式中，程序710还用于使得处理器702在通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量时：通过所述神经网络模型的卷积部分，获得所述第一词向量和所述第二词向量分别对应的第一语义向量和第二语义向量；使用门机制和自注意力机制，对所述第一语义向量和所述第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

在一种可选的实施方式中，程序710还用于使得处理器702在使用门机制和自注意力机制，对所述第一语义向量和所述第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量时：根据门机制和所述第一样本数据对应的多个第一主题，对所述第一语义向量进行过滤，获得所述第一语义向量在不同第一主题下的第一语义表达；以及，根据所述门机制和所述第二样本数据对应的多个第二主题，对所述第二语义向量进行过滤，获取所述第二语义向量在不同第二主题下的第二语义表达；使用自注意力机制分别对所述第一语义表达和所述第二语义表达进行特征提取，获得对应的第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

在一种可选的实施方式中，程序710还用于使得处理器702在对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元时：对所述观点向量中的每一个观点向量，分别与每一个所述属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元。

在一种可选的实施方式中，程序710还用于使得处理器702在对所述观点向量中的每一个观点向量，分别与每一个所述属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元时：对所述观点向量中的每一个观点向量，分别与每一个所述属性向量通过计算向量之间的差和向量之间的点乘进行两两拼接配对，根据配对结果生成对应的多个逻辑单元。

在一种可选的实施方式中，程序710还用于使得处理器702在将所述多个逻辑单元输入胶囊网络部分，获得对应的情感特征向量时：将所述多个逻辑单元分别输入用于正向情感预测的第一胶囊网络部分和用于负向情感预测的第二胶囊网络部分，获取对应的正向情感特征向量和负向情感特征向量。

在一种可选的实施方式中，程序710还用于使得处理器702在通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息时：将所述正向情感特征向量和所述负向情感特征向量输入所述输出部分中的高速网络层，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；通过所述神经网络模型的输出部分中的回归层，根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出样本用户对样本目标对象的情感信息。

在一种可选的实施方式中，所述神经网络模型包括：输入部分、特征提取部分、逻辑单元部分、胶囊网络部分、和输出部分；其中，所述输入部分包括：用于接收与用户的评论数据对应的词向量的第一输入部分，和，用于接收与目标对象的评论数据对应的词向量的第二输入部分；所述特征提取部分，用于对所述第一输入部分输出的向量和所述第二输入部分输出的向量进行特征提取，获得与所述第一输入部分输出的向量对应的观点向量，和，与所述第二输入部分输出的向量对应的属性向量；所述逻辑单元部分，用于对所述观点向量和所述属性向量进行配对，生成对应的逻辑单元；所述胶囊网络部分包括：用于对所述逻辑单元进行正向情感预测并输出正向情感特征向量的第一胶囊网络部分，和，用于对所述逻辑单元进行负向情感预测并输出负向情感特征向量的第二胶囊网络部分；所述输出部分，用于根据所述第一胶囊网络部分输出的正向情感特征向量和所述第二胶囊网络部分输出的负向情感特征向量，预测输出用户对目标对象的情感信息。

在一种可选的实施方式中，所述特征提取部分包括卷积部分和自注意力部分；所述卷积部分包括：用于对所述第一输入部分输出的向量进行卷积，并输出对应的语义向量的第一卷积部分，和，用于对所述第二输入部分输出的向量进行卷积，并输出对应的语义向量的第二卷积部分；所述自注意力部分包括：用于使用门机制和自注意力机制对所述第一卷积部分输出的语义向量进行处理并输出用户的观点向量的第一自注意力部分，和，用于使用门机制和自注意力机制对所述第二卷积部分输出的语义向量进行处理并输出目标对象的属性向量的第二自注意力部分。

在一种可选的实施方式中，所述神经网络模型通过双动态路由协议将所述逻辑单元部分输出的逻辑单元路由至所述胶囊网络部分，所述双动态路由协议中的路由权重根据第一权重和第二权重确定；其中，所述第一权重用于指示逻辑单元与所述第一胶囊网络部分和所述第二胶囊网络部分之间的权重，所述第二权重用于指示所述第一胶囊网络部分内部的逻辑单元权重和所述第二胶囊网络部分内部的逻辑单元权重。

在一种可选的实施方式中，所述输出部分包括高速网络层和回归层；所述高速网络层，用于根据所述正向情感特征向量和所述负向情感特征向量，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；所述回归层，用于根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出用户对目标对象的情感信息。

在另一实施场景中：

程序710具体可以用于使得处理器702执行以下操作：通过神经网络模型的输入部分接收第一样本数据对应的第一词向量和第二样本数据对应的第二词向量，其中，所述第一样本数据用于表示多个样本用户的用户评论样本数据，所述第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；所述第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据；通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量；对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元；将所述多个逻辑单元输入所述神经网络模型的胶囊网络部分，获得对应的情感特征向量；通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

在一种可选的实施方式中，程序710还用于使得处理器702在将所述多个逻辑单元输入胶囊网络部分，获得与每个所述逻辑单元对应的情感特征向量时：将所述多个逻辑单元分别输入用于正向情感预测的第一胶囊网络部分和用于负向情感预测的第二胶囊网络部分，获取对应的正向情感特征向量和负向情感特征向量。

在一种可选的实施方式中，程序710还用于使得处理器702根据所述输出部分输出的所述情感信息，对所述神经网络模型的训练参数进行调整，并使用调整后的训练参数对所述神经网络模型继续进行训练，直至达到训练终止条件。

程序710中各步骤的具体实现可以参见上述目标对象推荐方法实施例中的相应步骤和单元中对应的描述，或者，上述数据处理方法实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。

通过本实施例的电子设备，通过用于进行情感评级预测的神经网络模型，获取用户对目标对象的情感信息，因该情感信息既基于用户对目标对象的正向情感特征，又基于用户对目标对象的负向情感特征获得。又因该神经网络模型处理的数据包括某个或某类用户对其处理过的目标对象的评论数据(即第一历史评论数据)，以及，某个或某类目标对象被多个处理者评论过的评论数据(即第二历史评论数据)。可见，不管是历史评论数据中包含的两面性信息，还是用户对目标对象情感的两面性信息，本实施例均可兼顾。由此，本实施例提供的方案可以对用户评论的内容，尤其是具有两面性评论的内容，进行有效地挖掘，以获得更为精准、有效的信息。

需要指出，根据实施的需要，可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本发明实施例的目的。

上述根据本发明实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的目标对象推荐方法或数据处理方法。此外，当通用计算机访问用于实现在此示出的目标对象推荐方法或数据处理方法的代码时，代码的执行将通用计算机转换为用于执行在此示出的目标对象推荐方法或数据处理方法的专用计算机。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明实施例的范围。

以上实施方式仅用于说明本发明实施例，而并非对本发明实施例的限制，有关技术领域的普通技术人员，在不脱离本发明实施例的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明实施例的范畴，本发明实施例的专利保护范围应由权利要求限定。

Claims

1.一种目标对象推荐系统，包括：输入模块、特征提取模块、逻辑单元模块、胶囊网络模块、和输出模块；

所述输入模块包括：用于接收与用户的评论数据对应的词向量的第一输入部分，和，用于接收与目标对象的评论数据对应的词向量的第二输入部分；

所述特征提取模块，用于对所述第一输入部分输出的向量和所述第二输入部分输出的向量进行特征提取，获得与所述第一输入部分输出的向量对应的观点向量，和，与所述第二输入部分输出的向量对应的属性向量；

所述逻辑单元模块，用于对所述观点向量和所述属性向量进行配对，生成对应的逻辑单元；

所述胶囊网络模块包括：用于对所述逻辑单元进行正向情感预测并输出正向情感特征向量的第一胶囊网络部分，和，用于对所述逻辑单元进行负向情感预测并输出负向情感特征向量的第二胶囊网络部分；

所述输出模块，用于根据所述第一胶囊网络部分输出的正向情感特征向量和所述第二胶囊网络部分输出的负向情感特征向量，预测输出用户对目标对象的情感信息。

2.根据权利要求1所述的系统，其中，所述特征提取模块包括卷积部分和自注意力部分；

所述卷积部分包括：用于对所述第一输入部分输出的向量进行卷积，并输出对应的语义向量的第一卷积部分，和，用于对所述第二输入部分输出的向量进行卷积，并输出对应的语义向量的第二卷积部分；

所述自注意力部分包括：用于使用门机制和自注意力机制对所述第一卷积部分输出的语义向量进行处理并输出用户的观点向量的第一自注意力部分，和，用于使用门机制和自注意力机制对所述第二卷积部分输出的语义向量进行处理并输出目标对象的属性向量的第二自注意力部分。

3.根据权利要求1所述的系统，其中，所述推荐系统通过双动态路由协议将所述逻辑单元模块输出的逻辑单元路由至所述胶囊网络模块，所述双动态路由协议中的路由权重根据第一权重和第二权重确定；其中，所述第一权重用于指示逻辑单元与所述第一胶囊网络部分和所述第二胶囊网络部分之间的权重，所述第二权重用于指示所述第一胶囊网络部分内部的逻辑单元权重和所述第二胶囊网络部分内部的逻辑单元权重。

4.根据权利要求1所述的系统，其中，所述输出模块包括高速网络层和回归层；

所述高速网络层，用于根据所述正向情感特征向量和所述负向情感特征向量，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；

所述回归层，用于根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出用户对目标对象的情感信息。

5.一种目标对象推荐方法，包括：

分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量；

将所述第一向量和所述第二向量输入用于进行情感评级预测的神经网络模型，通过所述神经网络模型对所述第一向量和第二向量进行处理，以基于处理后获得的正向情感特征和负向情感特征输出所述用户对所述目标对象的情感信息；其中，所述神经网络模型采用如所述权利要求1-4中任一项所述的目标对象推荐系统的结构；

根据所述情感信息确定是否向所述用户推荐所述目标对象。

6.根据权利要求5所述的方法，其中，

多个所述第一历史评论数据中的至少部分第一历史评论数据中同时包含有正向情感数据和负向情感数据；

和/或，

多个所述第二历史评论数据中的至少部分第二历史评论数据中同时包含有正向情感数据和负向情感数据。

7.根据权利要求5或6所述的方法，其中，在所述分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量之前，所述方法还包括：

使用第一样本数据和第二样本数据，对所述神经网络模型进行训练；

其中，所述第一样本数据用于表示多个样本用户的用户评论样本数据，所述第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；所述第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据。

8.根据权利要求7所述的方法，其中，所述使用第一样本数据和第二样本数据，对所述神经网络模型进行训练，包括：

通过所述神经网络模型的输入部分，接收所述第一样本数据对应的第一词向量和所述第二样本数据对应的第二词向量；

通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量；

对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元；

将所述多个逻辑单元输入胶囊网络部分，获得对应的情感特征向量；

通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

9.根据权利要求8所述的方法，其中，所述通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量，包括：

通过所述神经网络模型的卷积部分，获得所述第一词向量和所述第二词向量分别对应的第一语义向量和第二语义向量；

使用门机制和自注意力机制，对所述第一语义向量和所述第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

10.根据权利要求9所述的方法，其中，所述使用门机制和自注意力机制，对所述第一语义向量和所述第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量，包括：

根据门机制和所述第一样本数据对应的多个第一主题，对所述第一语义向量进行过滤，获得所述第一语义向量在不同第一主题下的第一语义表达；以及，根据所述门机制和所述第二样本数据对应的多个第二主题，对所述第二语义向量进行过滤，获取所述第二语义向量在不同第二主题下的第二语义表达；

使用自注意力机制分别对所述第一语义表达和所述第二语义表达进行特征提取，获得对应的第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量。

11.根据权利要求8所述的方法，其中，所述对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元，包括：

对所述观点向量中的每一个观点向量，分别与每一个所述属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元。

12.根据权利要求11所述的方法，其中，所述对所述观点向量中的每一个观点向量，分别与每一个所述属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元，包括：

对所述观点向量中的每一个观点向量，分别与每一个所述属性向量通过计算向量之间的差和向量之间的点乘进行两两拼接配对，根据配对结果生成对应的多个逻辑单元。

13.根据权利要求8所述的方法，其中，所述将所述多个逻辑单元输入胶囊网络部分，获得与每个所述逻辑单元对应的情感特征向量，包括：

将所述多个逻辑单元分别输入用于正向情感预测的第一胶囊网络部分和用于负向情感预测的第二胶囊网络部分，获取对应的正向情感特征向量和负向情感特征向量。

14.根据权利要求13所述的方法，其中，所述通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息，包括：

将所述正向情感特征向量和所述负向情感特征向量输入所述输出部分中的高速网络层，获得对应的用于表征正向情感程度的正向程度向量和用于表征负向情感程度的负向程度向量；

通过所述神经网络模型的输出部分中的回归层，根据所述正向情感特征向量、所述负向情感特征向量、所述正向程度向量和所述负向程度向量，输出样本用户对样本目标对象的情感信息。

15.一种数据处理方法，包括：

通过神经网络模型的输入部分接收第一样本数据对应的第一词向量和第二样本数据对应的第二词向量，其中，所述第一样本数据用于表示多个样本用户的用户评论样本数据，所述第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；所述第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据；

将所述多个逻辑单元输入所述神经网络模型的胶囊网络部分，获得对应的情感特征向量；

16.根据权利要求15所述的方法，其中，所述通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量，包括：

17.根据权利要求16所述的方法，其中，所述使用门机制和自注意力机制，对所述第一语义向量和所述第二语义向量进行过滤，获得第一语义向量在多个第一主题下的观点向量，以及，第二语义向量在多个第二主题下的属性向量，包括：

18.根据权利要求15所述的方法，其中，所述对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元，包括：

19.根据权利要求18所述的方法，其中，所述对所述观点向量中的每一个观点向量，分别与每一个所述属性向量进行两两结合配对，根据配对结果生成对应的多个逻辑单元，包括：

20.根据权利要求15所述的方法，其中，所述将所述多个逻辑单元输入胶囊网络部分，获得与每个所述逻辑单元对应的情感特征向量，包括：

21.根据权利要求20所述的方法，其中，所述通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息，包括：

22.根据权利要求15-21任一项所述的方法，其中，所述方法还包括：

根据所述输出部分输出的所述情感信息，对所述神经网络模型的训练参数进行调整，并使用调整后的训练参数对所述神经网络模型继续进行训练，直至达到训练终止条件。

23.一种目标对象推荐装置，包括：

生成模块，用于分别根据用户的第一历史评论数据和待推荐的目标对象的第二历史评论数据，生成对应的第一向量和第二向量；

处理模块，用于将所述第一向量和所述第二向量输入用于进行情感评级预测的神经网络模型，通过所述神经网络模型对所述第一向量和第二向量进行处理，以基于处理后获得的正向情感特征和负向情感特征输出所述用户对所述目标对象的情感信息；

推荐模块，用于根据所述情感信息确定是否向所述用户推荐所述目标对象。

24.一种数据处理装置，包括：

接收模块，用于通过神经网络模型的输入部分接收第一样本数据对应的第一词向量和第二样本数据对应的第二词向量，其中，所述第一样本数据用于表示多个样本用户的用户评论样本数据，所述第二样本数据用于表示多个样本目标对象的目标对象评论样本数据；所述第一样本数据和第二样本数据中，均至少部分样本数据同时包含有正向情感数据和负向情感数据；

第一获得模块，用于通过所述神经网络模型的特征提取部分，获得所述第一词向量和所述第二词向量分别对应的样本用户的观点向量和样本目标对象的属性向量；

逻辑单元生成模块，用于对所述观点向量和所述属性向量进行配对，生成对应的多个逻辑单元；

第二获得模块，用于将所述多个逻辑单元输入所述神经网络模型的胶囊网络部分，获得对应的情感特征向量；

预测输出模块，用于通过所述神经网络模型的输出部分，根据所述情感特征向量预测输出样本用户对样本目标对象的情感信息。

25.一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求5-14任一项所述的目标对象推荐方法对应的操作，或者，执行如权利要求15-22任一项所述的数据处理方法对应的操作。

26.一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如权利要求5-14中任一项所述的目标对象推荐方法，或者，该程序被处理器执行时实现如权利要求15-22中任一项所述的数据处理方法。