CN111666410A

CN111666410A - 商品用户评论文本的情感分类方法及系统

Info

Publication number: CN111666410A
Application number: CN202010473656.0A
Authority: CN
Inventors: 温家辉; 张光达; 王之元; 王会权; 黄安文; 何益百; 王涛; 孙懿淳; 张鸿云
Original assignee: National Defense Technology Innovation Institute PLA Academy of Military Science
Current assignee: National Defense Technology Innovation Institute PLA Academy of Military Science
Priority date: 2020-05-29
Filing date: 2020-05-29
Publication date: 2020-09-15
Anticipated expiration: 2040-05-29
Also published as: CN111666410B

Abstract

本发明公开了一种商品用户评论文本的情感分类方法及系统，该方法包括：获取一个商品用户评论文本，对文本对应用户的行为特征和商品的属性特征间的交互进行建模，获取用户与商品的交互信息；确定评论文本的语义信息；确定商品的其余评论本文对应的其余用户的行为特征，确定用户与其余用户间的行为特征相似性，选择与用户的行为特征相似性最大的若干个用户对应的评论文本作为辅助文本，确定辅助文本的语义信息；获取评论文本的融合语义信息；基于融合语义信息和用户与商品的交互信息，确定评论文本的情感类别。本发明的方法及系统在评论文本的基础上结合用户的行为特征、商品的属性特征和辅助文本，进行评论文本的情感分类，能显著提高分类精度。

Description

商品用户评论文本的情感分类方法及系统

技术领域

本发明涉及互联网信息分类技术领域，尤其涉及一种商品用户评论文本的情感分类方法及系统。

背景技术

随着电商的发展，用户在电商平台上对网购商品进行评价已经成了日常生活的部分。如何对商品用户评论文本进行分析，获得其中的观点倾向和情感极性，是目前人工智能领域的一个重要研究问题。

情感分类一种最常见的文本信息挖掘方法，情感分类是指根据评论文本所表达的含义和情感信息将评论文本划分成褒扬的或贬义的两种或几种类型，是对文本评论作者倾向性和观点态度的划分。情感分类的应用非常广泛，在实际生活中通过分析每条评论文本的情感倾向，能够掌握消费者对产品或服务的满意程度，给商业决策和产品运营带来巨大价值。但网络评论文本，尤其是中文网络评论文本属于非结构化的短文本数据，具有长度不固一定，用词比较随意等特点。因此，为网络评论文本设计合适的情感分类方法仍然是个极具挑战性的任务。

现有的情感分类方法包括有NSC、HCSC、CMA和CTC等，现有的情感分类方法主要利用当前评论文本的语义信息来进行分类，商品的文本信息利用不充分，情感分类的精度具有较大的限制；并且当一个评论文本的情感极性确定性较差时，仅利用评论文本自身的语义信息来进行分类，可能会导致情感分类出现错误，从而降低了分类精度。

发明内容

为解决上述现有技术中存在的技术问题，本发明提供一种商品用户评论文本的情感分类方法及系统。

为此，本发明公开了一种商品用户评论文本的情感分类方法，包括如下内容：

获取一个商品用户评论文本，确定所述文本对应的用户和商品，获取所述文本对应的所述用户的行为特征和所述商品的属性特征，对所述用户的行为特征和所述商品的属性特征之间的交互进行建模，获取用户与商品的交互信息；

根据所述用户的行为特征和所述商品的属性特征，确定所述商品用户评论文本的语义信息；

获取所述商品的其余评论文本，确定所述商品的其余评论本文对应的用户的行为特征，确定所述用户与其余用户间的行为特征相似性，选择所述其余用户中与所述用户的行为特征相似性最大的若干个用户对应的评论文本作为辅助文本，并确定所述辅助文本的语义信息；

将所述商品用户评论文本的语义信息和所述辅助文本的语义信息以设定权重分配方式进行融合处理，获取所述商品用户评论文本的融合语义信息；

基于所述融合语义信息和所述用户与商品的交互信息，确定所述商品用户评论文本的情感类别。

进一步地，在上述商品用户评论文本的情感分类方法中，在确定所述商品用户评论文本对应的用户和商品的基础上，采用嵌入检索操作方法获取所述商品用户评论文本对应的所述用户的行为特征和所述商品的属性特征。

进一步地，在上述商品用户评论文本的情感分类方法中，将所述用户的行为特征和所述商品的属性特征进行拼接处理后输入多层神经网络进行信息处理，以获取用户与商品的交互信息。

进一步地，在上述商品用户评论文本的情感分类方法中，根据所述用户的行为特征和所述商品的属性特征，确定所述商品用户评论文本的语义信息，包括：

运用卷积神经网络对所述商品用户评论文本进行卷积操作，提取所述商品用户评论文本的局部语义信息；

基于所述用户的行为特征和所述商品的属性特征，运用注意力机制对所述商品用户评论文本的局部语义信息进行融合，获取所述商品用户评论文本的语义信息。

进一步地，在上述商品用户评论文本的情感分类方法中，所述辅助文本的语义信息利用下述方式确定：

运用卷积神经网络对所述辅助文本进行卷积操作，提取所述辅助文本的局部语义信息；

基于所述辅助本文对应的用户的行为特征和所述商品的属性特征，运用注意力机制对所述辅助文本的局部语义信息进行融合，获取所述辅助文本的语义信息。

进一步地，在上述商品用户评论文本的情感分类方法中，运用门网络机制对所述商品用户评论文本的语义信息和所述辅助文本的语义信息进行融合处理，获取所述商品用户评论文本的融合语义信息。

进一步地，在上述商品用户评论文本的情感分类方法中，运用单层神经网络对所述融合语义信息和所述用户与商品的交互信息进行信息处理，以计算确定所述商品用户评论文本的情感类别。

此外，本发明还公开了一种商品用户评论文本的情感分类系统，包括：用户商品交互模块、文本编码模块、推测性文本挖掘模块和输出模块；

所述用户商品交互模块用于对用户的行为特征和商品的属性特征之间的交互进行建模，以获取用户与商品的交互信息；

所述文本编码模块用于根据用户的行为特征和商品的属性特征提取商品用户评论文本的语义信息；

所述推测性文本挖掘模块用于根据用户的行为特征提取同一商品的其余评论文本对应的用户中与用户的行为特征相似性最大的若干个用户对应的评论文本，并将提取的若干个评论文本作为辅助文本以协同确定商品用户评论文本的情感类别；

所述输出模块用于对商品用户评论文本的语义信息和辅助文本的语义信息进行融合处理以获取商品用户评论文本的融合语义信息，以及用于对融合语义信息和用户与商品的交互信息进行融合处理以确定商品用户评论文本的情感类别。

本发明技术方案的主要优点如下：

本发明的商品用户评论文本的情感分类方法及系统根据商品用户评论文本确定其对应的用户的行为特征和商品的属性特征，基于用户的行为特征和商品的属性特征从商品的其余评论文本中提取若干个作为辅助文本，在商品用户评论文本的基础上结合用户的行为特征、商品的属性特征和辅助文本，进行商品用户评论文本的情感分类，能够显著提高商品用户评论文本的情感分类精度。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明一实施例的商品用户评论文本的情感分类方法的流程图；

图2为本发明一实施例的商品用户评论文本的情感分类系统的结构原理图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明的一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

以下结合附图，详细说明本发明实施例提供的技术方案。

如附图1所示，本发明一实施例提供了一种商品用户评论文本的情感分类方法，该方法包括如下内容：

获取一个商品用户评论文本，确定文本对应的用户和商品，获取文本对应的用户的行为特征和商品的属性特征，对用户的行为特征和商品的属性特征之间的交互进行建模，获取用户与商品的交互信息；

根据用户的行为特征和商品的属性特征，确定商品用户评论文本的语义信息；

获取商品的其余评论文本，确定商品的其余评论本文对应的用户的行为特征，确定用户与其余用户间的行为特征相似性，选择其余用户中与用户的行为特征相似性最大的若干个用户对应的评论文本作为辅助文本，并确定辅助文本的语义信息；

将商品用户评论文本的语义信息和辅助文本的语义信息以设定权重分配方式进行融合处理，获取商品用户评论文本的融合语义信息；

基于融合语义信息和用户与商品的交互信息，确定商品用户评论文本的情感类别。

以下对本发明一实施例提供的商品用户评论文本的情感分类方法的步骤及原理进行具体说明；

首先，假设：商品用户评论文本的输入形式以一个元祖＜u_i,p_j,d_k＞表示，u_i表示用户，p_j表示商品，d_k表示用户对商品的评论文本，商品用户评论文本的情感类别的输出结果以一个向量

表示。商品用户评论文本的情感类别的数量可以根据实际情况确定，例如可以为5或者10，当情感类别数量为5个时(如第1类表示差评，第5类表示好评，中间类别以此类推)，向量

为一个维度为5的向量。本发明一实施例中，取向量

中数值最大的维度作为对应的情感类别，如一个商品用户评论文本对应的输出向量

为(0.1,0.1,0.1,0.1,0.6)时，则该评论文本对应的情感类别为第5类。

基于上述假设，对于一个商品用户评论文本的输入元祖＜u_i,p_j,d_k＞中的用户u_i和商品p_j，通过嵌入检索(embedding lookup)操作，分别获取用户的行为特征和商品的属性特征，用户的行为特征以一个隐因子向量u_i表示，商品的属性特征以一个隐因子向量p_j表示。嵌入检索是一个1对1的映射，将一个用户u_i(商品p_j)对应唯一一个隐因子向量u_i(p_j)，隐因子向量为模型参数，需要在模型训练中自动学习更新。

本发明一实施例中，通过对用户和商品的交互建模，捕获用户的行为特征(兴趣偏好)和商品的属性特征。由于用户对商品的评论文本的情感极性和用户的兴趣偏好与商品的属性特征之间的匹配程度成正比，即当用户的兴趣偏好和商品的属性特征匹配程度较高时(比如两者的隐因子向量的点积u_i ^Tp_j)，那么该用户大概率会给该商品好评，反之亦然。传统的协同过滤方法使用用户和商品两者的隐因子向量的点积来对两者的交互进行建模，由于神经网络对任意函数具有良好拟合，本发明一实施例使用神经网络来对用户和商品的交互进行建模。

本发明一实施例中，将用户和商品的隐因子向量进行拼接，输入多层神经网络进行信息处理，以获取用户与商品的交互信息，用户与商品的交互信息以一个输出向量z_ij表示。

具体地，利用以下公式对用户和商品的隐因子向量进行处理，以获取用户与商品的交互信息；

z_ij＝φ_L(...φ₁(z₀)...)

φ_l(z_l-1)＝σ_l(W_lz_l-1+b_l)，l＝1，2，...，L

其中，[；]表示向量的拼接操作，°为向量的点乘操作，L表示神经网络的层数，φ_l表示第l层神经网络，σ_l表示第l层神经网络的激活函数，W_l和b_l表示第l层神经网络的参数。

进一步地，由于评论文本的语义信息和评论文本的情感极性具有很大关联性，例如如果评论文本中出现“喜欢”、“质量好”、“服务佳”、“物流快”等词语，那么该评论文本很有可能是好评(情感极性积极)；相反，如果评论文本中出现“失望”、“质量差”等词语，那么该评论文本很有可能是差评(情感极性消极)；因此，为了实现商品用户评论文本的情感分类，并保证情感分类精度，需要提取评论文本的语义信息，基于提取的评论文本的语义信息对评论文本进行情感分类。本发明一实施例中，运用卷积神经网络和注意力机制对评论文本进行操作处理，以提取评论文本的语义信息。

首先，运用卷积神经网络对商品用户评论文本进行卷积操作，提取商品用户评论文本的局部语义信息。自然语言中一般是若干个毗邻的词才能表达一定的语义信息，比如“质量好”，卷积神经网络中的卷积核能够很好地捕获这些局部语义信息。

假设：一个评论文本d_k表示为

评论文本的语义信息以一个特征向量d_k表示，局部语义信息以一个特征向量c_t表示，

表示评论文本中的第t个词，l_k表示评论文本长度；对于每个词

通过嵌入检索操作，获得每个词

对应的词向量

运用卷积神经网络对词向量进行卷积操作，以提取局部语义信息。

具体地，利用以下公式对评论文本进行卷积操作，以提取局部语义特征；

其中，W_f和b_f为模型参数，W_f也称为卷积核，g为非线性激活函数，*为卷积操作，n为卷积核的个数；对以

为中心，个数为s的词向量组成的输入进行卷积操作，输出

对应的特征标量c_t,f，在卷积神经网络中，一般采取若干个卷积核并行地进行卷积操作，对于

每个卷积核将为其产生一个特征标量

对这些特征标量进行拼接操作，可以得到

所对应的卷积特征向量c_t，则评论文本的卷积特征向量可以表示为

进一步地，由于自然语言通常由复杂的词法语法结构组成，并不是所有的词语都具有相同的重要性，用户对不同的物品具有不同的关注面，比如一个用户可能会关注一个商品的价格，那么“便宜”、“贵”等类似的词语更能体现该文本的情感极性，对于另外一个商品，用户可能会关注其便携性，那么“方便”、“笨重”等词语能够为情感极性分类提供更好的依据；为此，本发明一实施例中，结合用户的行为特征和商品的属性特征，运用注意力机制对商品用户评论文本的局部语义信息进行融合，获取商品用户评论文本的语义信息，即运用注意力机制对评论文本每个词的卷积特征向量c_t进行融合，以获取评论文本的特征向量d_k。

具体地，利用以下公式对评论文本每个词的卷积特征向量c_t进行融合，获取评论文本的特征向量d_k；

β_t＝v^Ttanh(W_cc_t+W_up[u_i；p_j]+b_d)

其中，v、W_c、W_up和b_d为模型参数，tanh为非线性变换函数，β_t表示语义关联度，α_t表示归一化的语义关联度；注意力机制的物理意义在于将每个词的卷积特征向量和用户及商品的隐因子向量(即用户的行为特征和商品的属性特征)映射到共同的向量空间，并在词空间比较两者的语义关联度β_t，将语义关联度β_t归一化得到相应的α_t，最后根据α_t对卷积特征向量

采取加权和操作，得到评论文本的特征向量d_k，在加权和过程中，与用户及商品具有更高语义关联度的词将会被赋予更高的权重，达到过滤无用文本信息的效果，从而提取有用的文本信息。

进一步地，本发明一实施例提供的商品用户评论文本的情感分类方法还根据用户的行为特征的相似性，推测性地利用相似的额外文本，以提高评论文本的情感分类的精度。

额外文本指的是当对一个商品用户评论文本进行情感分析时，该商品的其余所有用户评论文本。当对一个商品用户评论文本进行情感分析时，从额外文本中推测性地选取若干与当前评论文本具有相同的情感极性的评论文本作为辅助文本，利用这些辅助文本能够提高当前文本情感分类的精度。比如当一个评论文本的情感极性确定性比较差时，可以通过这些辅助文本提高当前评论文本情感类别的确定性，从而实现文本的正确分类。

具体地，本发明采用下述方式从额外文本中选取辅助文本：

对于一个商品用户评论文本及其对应的用户和商品，将该商品的其余评论文本作为备选的额外文本，根据用户的隐因子向量(行为特征)计算该用户和这些额外文本对应的用户之间的相似性，基于相似性从大到小对额外文本进行排序，选取位于前序的若干个用户对应的评论文本作为辅助文本，即选取相似性最大的若干个用户对应的评论文本作为辅助文本，来协同确定该评论文本的情感极性。

具体地，对于一个输入元祖＜u_i,p_j,d_k＞，设定商品p_j对应的所有额外文本表示为集合D(p_j)，所有额外文本对应的用户表示为集合U(p_j)，用户之间相似性的计算以及基于用户相似性的文本融合可以用注意力机制来实现，具体可以利用下述公式计算确定；

其中，v_ssd、W_u、W_p和b为模型参数，tanh为非线性变换函数，s(u_i,u_p)表示用户u_i与用户u_p的相似性，β_p表示归一化的相似性程度，d_p表示用户u_p对应的评论文本的特征向量，u_p表示用户u_p的隐因子向量，即行为特征，d_ssd表示辅助文本的特征向量，即辅助文本的语义信息；注意力机制的物理意义在于将用户u_i和U(p_j)中的每个用户u_p映射到共同的向量空间，并在此空间衡量两者的相似性s(u_i,u_p)，将s(u_i,u_p)进行归一化得到β_p，最后根据β_p对D(p_j)中的文本的特征向量d_p进行加权和操作，d_p表示用户u_p对应的评论文本的特征向量，即评论文本的语义信息，和用户u_i具有更高相似性的用户对应的评论文本将被赋予更高的权重；其中，用户u_p对应的评论文本的特征向量d_p的确定可以参照上述的商品用户评论文本的特征向量d_k的确定方式进行，用户u_p对应的隐因子向量u_p的确定可以参照上述的用户u_i对应的隐因子向量u_i的确定方式进行。

进一步地，当确定当前商品用户评论文本的语义信息(特征向量d_k)和辅助文本的语义信息(特征向量d_ssd)后，利用门网络(gated network)机制对两个特征向量进行融合；具体可以利用下述公式进行融合：

9＝σ(W_kd_k+W_ssdd_ssd+b_g)

其中，W_k、W_ssd和b_g为模型参数，°为向量点乘操作，σ为非线性变换函数，d表示商品用户评论文本的融合特征向量，即融合语义信息；门网络机制的物理意义为根据两个不同的输入向量，自动确定它们的权重，再采取加权和的操作对两个输入向量进行融合。

进一步地，当确定商品用户评论文本的融合语义信息后，运用单层神经网络对融合语义信息和用户与商品的交互信息进行处理，以计算确定商品用户评论文本的情感类别；具体可以利用下述公式进行处理：

其中，W_d、W_upi和b_y为模型参数，softmax为归一化指数函数，

表示商品用户评论文本的情感类别的输出结果。

进一步地，当训练模型时，本发明根据模型的输出值和真实值之间的差距定义目标函数，目标函数可用如下公式表示：

其中，D为训练的数据集，C为评论文本的情感总类别数，C的值因数据集的不同而不同(例如可以为5或者10)，

表示模型输出结果向量

的第c个维度的值，y_c表示真实值向量y的第c个维度的值，y_c＝1表示对应的评论文本的情感类别为c。

具体而言，对于一个输入元组＜u_i,p_j,d_k＞，以及评论文本d_k的情感类别真实值向量y，模型根据上述情感分类方法可输出一个情感类别结果向量

定义结果向量

和真实值向量y的误差，模型训练过程就是利用梯度下降法最小化结果向量

和真实值向量y之间的误差的过程。当利用模型进行评论文本的情感分类时，对于一个输入元组＜u_i,p_j,d_k＞，根据上述情感分类方法可输出一个情感类别结果向量

结果向量

中最大值所对应的维度即为输入元组＜u_i,p_j,d_k＞中评论文本d_k所对应的情感类别。

在上述的商品用户评论文本的情感分类方法的基础上，本发明一实施例还提供了一种商品用户评论文本的情感分类系统，该系统包括：用户商品交互模块(user-productinteraction component，UPI)、文本编码模块(document encoding component，DE)、推测性文本挖掘模块(speculative similar document component，SSD)和输出模块；用户商品交互模块用于对用户的行为特征和商品的属性特征之间的交互进行建模，以获取用户与商品的交互信息；文本编码模块用于根据用户的行为特征和商品的属性特征提取商品用户评论文本的语义信息；推测性文本挖掘模块用于根据用户的行为特征提取同一商品的其余评论文本对应的用户中与用户的行为特征相似性最大的若干个用户对应的评论文本，并将提取的若干个评论文本作为辅助文本以协同确定商品用户评论文本的情感类别；输出模块用于对商品用户评论文本的语义信息和辅助文本的语义信息进行融合处理以获取商品用户评论文本的融合语义信息，以及用于对融合语义信息和用户与商品的交互信息进行融合处理以确定商品用户评论文本的情感类别。

本发明一实施例提供的商品用户评论文本的情感分类方法及系统根据商品用户评论文本确定其对应的用户的行为特征和商品的属性特征，基于用户的行为特征和商品的属性特征从商品的其余评论文本中提取若干个作为辅助文本，在商品用户评论文本的基础上结合用户的行为特征、商品的属性特征和辅助文本，进行商品用户评论文本的情感分类，能够显著提高商品用户评论文本的情感分类精度。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外，本文中“前”、“后”、“左”、“右”、“上”、“下”均以附图中表示的放置状态为参照。

最后应说明的是：以上实施例仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种商品用户评论文本的情感分类方法，其特征在于，包括如下内容：

2.根据权利要求1所述的商品用户评论文本的情感分类方法，其特征在于，在确定所述商品用户评论文本对应的用户和商品的基础上，采用嵌入检索操作方法获取所述商品用户评论文本对应的所述用户的行为特征和所述商品的属性特征。

3.根据权利要求2所述的商品用户评论文本的情感分类方法，其特征在于，将所述用户的行为特征和所述商品的属性特征进行拼接处理后输入多层神经网络进行信息处理，以获取用户与商品的交互信息。

4.根据权利要求1或3所述的商品用户评论文本的情感分类方法，其特征在于，根据所述用户的行为特征和所述商品的属性特征，确定所述商品用户评论文本的语义信息，包括：

5.根据权利要求1至4中任一项所述的商品用户评论文本的情感分类方法，其特征在于，所述辅助文本的语义信息利用下述方式确定：

6.根据权利要求1至5中任一项所述的商品用户评论文本的情感分类方法，其特征在于，运用门网络机制对所述商品用户评论文本的语义信息和所述辅助文本的语义信息进行融合处理，获取所述商品用户评论文本的融合语义信息。

7.根据权利要求1至6中任一项所述的商品用户评论文本的情感分类方法，其特征在于，运用单层神经网络对所述融合语义信息和所述用户与商品的交互信息进行信息处理，以计算确定所述商品用户评论文本的情感类别。

8.一种商品用户评论文本的情感分类系统，其特征在于，包括：用户商品交互模块、文本编码模块、推测性文本挖掘模块和输出模块；