CN112131886A

CN112131886A - 一种文本的方面级别情感分析方法

Info

Publication number: CN112131886A
Application number: CN202010786017.XA
Authority: CN
Inventors: 尹久; 池凯凯; 张书彬; 黄亮
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2020-08-05
Filing date: 2020-08-05
Publication date: 2020-12-25

Abstract

一种文本的方面级别情感分析方法，包括以下步骤：1)获取将文本信息以及方面信息输入至预设的截断门控单元网络所得的句子级别的文本语义表示矩阵，以及所述文本语义表示向量；2)依据句子级别的文本语义表示矩阵、方面信息和预设的Attention模型，获取文本信息中各单词与方面信息对应的注意力值，得到每个单词的注意力权重；3)依据句子级别的文本语义表达矩阵和注意力权重，构建文本信息对应的文本方面情感表示向量；4)将新的文本方面情感表示向量映射到情感分类器，采用softmax函数对文本方面情感表示向量进行情感评估，得到各预设的情感极性的预测概率。本发明高效、准确地预测评论文本的方面级别情感倾向。

Description

一种文本的方面级别情感分析方法

技术领域

本发明涉及情感分析领域、深度学习技术，具体来讲提出一种基于截断循环神经网络(DGRU)和注意力机制的方面级别情感分类网络模型(ATT-DGRU)。

背景技术

情感分析是自然语言处理领域的一项备受关注的研究任务，文本情感分析的主要目的是从原始文本中提取出文本发表者的主观情绪。如今互联网各平台上存在大量用户关于产品和服务的评论信息，这些评论往往以短文本的形式出现，涉及产品的一个或者多个方面意见。方面级别的情感挖掘传统评论挖掘通常粗糙地对一篇文档或者一段句子进行情感分析，只能得到一个情感值的表达，而不能提供高情感值指向的对象的信息，因此方面级别的观点挖掘是对情感分析更深层次的研究。

深度学习通过提供强大的策略来提取传统方法难以控制的抽象非线性特征，从而彻底改变了各个领域。循环神经网络(RNN)是一类以序列数据为输入，在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络 (RNN)，擅长对整个句子进行建模，捕捉长距离依赖信息。门控循环单元(GRU) 是一种RNN的特殊类型，计算过程更为简洁。然而,研究表明，RNN对整个句子建模有时会成为一种负担，使模型忽略了关键的短语信息。卷积神经网络(CNN) 是一类包含卷积计算且具有深度结构的前馈神经网络(FeedforwardNeural Networks)，是深度学习(deep learning)的代表算法之一。用来处理文本的CNN 模型更擅长抽取局部的位置不变特征，而不擅长捕捉长距离依赖信息。而方面级别情感分析需要重点提取方面词向量邻近语义信息的同时更不能丢失文本的长距离语义信息。

针对以上，可采用结合循环神经网络(RNN)和卷积神经网络(CNN)的截断式循环神经网络(DRNN)为基础构建模型，以克服单纯的循环神经网络模型无法准确捕捉局部语义的缺陷、以及标准卷积神经网络无法拟合文本语义序列的上下文关联的缺点。

一条复杂语句中可能包含多个方面词，句中的每个词和方面词之间的联系能传达出关于关于该方面词的情感极性信息。神经语言模型中若使用注意力机制，能够从复杂语句中捕捉到与方面词关联较大的单词，降低对次要信息的关注度，甚至无视无关的信息。

鉴于此，提出了一种方面级别情感分类模型，基于截断门控单元网络与注意力机制的网络模型(ATT-DGRU)。

发明内容

为了克服现有技术的不足，本发明所关注的技术问题为：如何利用神经网络模型高效、准确地预测评论文本的方面级别情感倾向；利用注意力机制，设计产生一个文本各单词对给定方面情感的影响权重向量，基于截断门控单元网络与注意力机制的评论文本方面级别情感分析模型，首先使用DGRU网络对输入的单词文本与方面词进行编码，得到文本语义表达，接着使用注意力机制对文本语义表达提取情感权重系数，结合文本语义表达与情感权重表达得到给定方面情感表示向量。

为解决上述技术问题，本发明提供如下的技术方案：

一种文本的方面级别情感分析方法，所述方法包括以下步骤：

1)获取将文本信息以及方面信息输入至预设的截断门控单元网络DGRU所得的句子级别的文本语义表示矩阵，以及所述文本语义表示向量；

2)依据所述句子级别的文本语义表示矩阵、方面信息和预设的Attention模型，获取所述文本信息中各单词与方面信息对应的注意力值，得到每个单词的注意力权重；

3)依据所述句子级别的文本语义表达矩阵和注意力权重，构建所述文本信息对应的文本方面情感表示向量；

4)将所述的新的文本方面情感表示向量映射到情感分类器，采用softmax 函数对文本方面情感表示向量进行情感评估，得到各预设的情感极性的预测概率。

进一步，获取句子级别的文本语义表示矩阵H的过程为：

其中h_t为GRU计算单元在t时刻的输出，可视为第t个单词词向量与邻近 k-1单词对应的语义表达，表示为：

h_t＝GRU(x_t,x_t-1,x_t-2,...,x_t-k+1)

其中，所述x_t为所述输入的文本信息的第t个单词的词向量拼接所述给定方面词向量a而得来，即表示为

再进一步，获得第t个单词语义表达向量h_t的GRU函数计算单元的过程为：

r_t＝σ(W_r·[h_t-1,x_t])

z_t＝σ(W_z·[h_t-1,x_t])

其中，所述W_r、W_z、

分别为重置门r_t、更新门z_t、候选集

权重矩阵，x_t为当前时间步的输入，h_t-1为t-1时间步的隐状态，σ表示Sigmiod激活函数，*表示Hadmard乘积。

优选地，文本语义表示向量h_p为所述本语义表示矩阵进行最大池化操作而来，过程为：

h_p＝maxpooling(H)

优选地，获取所述文本信息中各单词与方面信息对应的注意力值的过程为：

将所述文本语义表示矩阵H输入到带有修正线性单元(Tanh)激活的注意力多层感知机MLP中，将MLP的输出发送到一个softmax函数中，得到一个注意力权重向量a∈R^N×1，为：

a＝soft max(w^TM)

其中M∈R^2d×N，W_v∈R^d×d，

w∈R^2d×1都为权重矩阵或权重向量，

即方面词向量v_a重复出现N次，e_N为长为N 的单位向量。

优选地，文本方面情感表示向量h^*的获取计算如下式所示：

r＝Ha^T

h^*＝tanh(W_rr+W_xh_p)

其中H为所述文本语义表示矩阵，a为所述注意力权重向量，r为文本情感权重表达隐状态r∈R^d×1，h_p为文本语义表示向量。

优选地，对文本方面情感表示向量进行情感评估的分类器的过程为：

将h^*送入Softmax分类器，得到情感分类的概率分布向量y∈R^|c|×1，分类器具体计算如下式所示：

y＝softmax(W_sh^*+b_s)

其中W_s、b_s为softmax分类器的参数矩阵和偏置项。

优选地，在得到最终的情感分析结果之后，所述方法还包括以下步骤：

5)根据情感分析结果与实际结果的偏差信息,使用Adam算法动态调整每个参数的学习率，使用交叉熵损失函数更新卷积神经网络中每个神经元的权重。

总体而言，本发明方法与现有技术方案相比，能够取得下列有益效果：

(1)本发明所使用的语义获取模块中，DGRU能在捕捉上下文长距离依赖过程中保留位置不变性信息，因此能有效提升针对复杂语句的方面级别情感分类有效性。

(2)本发明使用注意力机制对文本语义表达提取情感权重系数，进一步定位给定方面信息的情感来源，因此结合文本语义表达与情感权重表达能得到更有效的给定方面情感表达。

附图说明

图1是截断门控循环单元的网络结构图；

图2是门控循环单元内部结构；

图3是基于截断门控单元网络与注意力机制的分类模型结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图对本发明实施的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。

参照图1～图3，一种文本的方面级别情感分析方法，文本信息，如酒店评论，具有口语化、语法多变和文本较长、描述方面多远等特点，降低了现有文本挖掘方法的预估准确性。基于此，本发明提供了一种文本方面级别情感分析方法，该方法使用DGRU捕获文本语义局部不变性特征、Attention机制获取上下文长距离依赖的情感来源，从而能够更加深入的理解文本含义。

本实施例中可以按照下述步骤对文本进行方面级别情感分析，包括以下步骤：

1)，获取将文本信息以及方面信息输入至预设的截断门控单元网络DGRU所得的句子级别的文本语义表示矩阵，以及所述文本语义表示向量；

2)，依据所述句子级别的文本语义表示矩阵、方面信息和预设的Attention 模型，获取所述文本信息中各单词与方面信息对应的注意力值，得到每个单词的注意力权重；

3)，依据所述句子级别的文本语义表达矩阵和注意力权重，构建所述文本信息对应的文本方面情感表示向量；

4)，将所述的新的文本方面情感表示向量映射到情感分类器，采用softmax 函数对文本方面情感表示向量进行情感评估，得到各预设的情感极性的预测概率。

所述步骤1)中，所述文本信息为X＝{X∈R^2d×N|(x₁，x₂，x₃...x_t...x_N-1，x_N)}, 其中N为文本序列的长度，d为词向量长度，

w_t为文本序列的词向量， a为该样本所给定方面词向量，两向量长度均为d，具体地，本实例所使用的词向量均采用自Glove词向量集。

步骤1)中使用DGRU获取句子级别的文本语义表示矩阵

方法可参阅附图1，具体计算方法包括：

h_t＝GRU(x_t,x_t-1,x_t-2,...,x_t-k+1)

其中h_t为k个GRU计算单元在t时刻的输出，可视为第t个单词词向量与邻近k-1单词对应的语义表达，所述x_t为所述输入的文本信息的第t个单词的词向量拼接所述给定方面词向量a而得来，即可表示为

进一步地，参阅附图2，获得第t个单词语义表达向量h_t的GRU函数计算单元计算过程为：

r_t＝σ(W_r·[h_t-1,x_t])

z_t＝σ(W_z·[h_t-1,x_t])

其中，所述W_r、W_z、

分别为重置门r_t、更新门z_t、候选集

进一步地，文本语义表示向量h_p为所述本语义表示矩阵进行最大池化操作而来，过程为：

h_p＝maxpooling(H)

进一步地，所述步骤3)中，使用注意力机制获取所述文本信息中各单词与方面信息对应的注意力值，具体方法可参阅附图3，过程为：

将所述文本语义表示矩阵H输入到带有修正线性单元(Tanh)激活的注意力多层感知机MLP中，将MLP的输出发送到一个softmax函数中，得到一个注意力权重向量a∈R^N×1，具体为：

a＝softmax(w^TM)

其中M∈R^2d×N，W_v∈R^d×d，

w∈R^2d×1都为权重矩阵或权重向量，

即方面词向量v_a重复出现N次，e_N为长为N 的单位向量。

进一步地，文本方面情感表示向量h^*的获取计算如下式所示：

r＝Ha^T

h^*＝tanh(W_rr+W_xh_p)

进一步地，所述步骤4)中，对文本方面情感表示向量进行情感评估的分类器过程为：

y＝softmax(W_sh^*+b_s)

其中W_s、b_s为softmax分类器的参数矩阵和偏置项。

具体地,本实施例中预设的情感分类类型指的是预设类型的情感极性,例如情感极性可以包括负、中性、和正共三种类型的情感极性,也可以仅包括正和负这两种类型的情感极性。

优选地，在所述得到最终的情感分析结果之后，所述方法还包括以下：

本实施例所使用的语义获取模块中，DGRU能在捕捉上下文长距离依赖过程中保留位置不变性信息，因此能有效提升针对复杂语句的方面级别情感分类有效性。使用注意力机制对文本语义表达提取情感权重系数，进一步定位给定方面信息的情感来源，因此结合文本语义表达与情感权重表达能得到更有效的给定方面情感表达。

Claims

1.一种文本的方面级别情感分析方法，其特征在于，所述方法包括以下步骤：

4)将所述的新的文本方面情感表示向量映射到情感分类器，采用softmax函数对文本方面情感表示向量进行情感评估，得到各预设的情感极性的预测概率。

2.根据权利要求1所述的方法，其特征在于，所述获取句子级别的文本语义表示矩阵H的过程为：

H＝{H∈R^d×N|(h₁,h₂,h₃…h_t…h_N-1,h_N)}

其中h_t为GRU计算单元在t时刻的输出，可视为第t个单词词向量与邻近k-1单词对应的语义表达，表示为：

h_t＝GRU(x_t,x_t-1,x_t-2,...,x_t-k+1)

3.根据权利要求2所述的方法，其特征在于，所述获得第t个单词语义表达向量h_t的GRU函数计算单元计算过程为：

r_t＝σ(W_r·[h_t-1,x_t])

z_t＝σ(W_z·[h_t-1,x_t])

其中，所述W_r、W_z、

分别为重置门r_t、更新门z_t、候选集

4.根据权利要求3所述的方法，其特征在于，所述文本语义表示向量h_p为所述本语义表示矩阵进行最大池化操作而来，过程为：

h_p＝maxpooling(H)。

5.根据权利要求2所述的方法，其特征在于，获取所述文本信息中各单词与方面信息对应的注意力值的过程为：

将所述文本语义表示矩阵H输入到带有修正线性单元Tanh激活的注意力多层感知机MLP中，将MLP的输出发送到一个softmax函数中，得到一个注意力权重向量a∈R^N×1，为：

a＝softmax(w^TM)

其中M∈R^2d×N，W_v∈R^d×d，W_h∈R^d×d，w∈R^2d×1都为权重矩阵或权重向量，

即方面词向量v_a重复出现N次，e_N为长为N的单位向量。

6.根据权利要求5所述的方法，其特征在于，文本方面情感表示向量h^*的获取计算如下式所示：

r＝Ha^T

h^*＝tanh(W_rr+W_xh_p)

7.根据权利要求6所述方法，其特征在于，对文本方面情感表示向量进行情感评估的分类器的过程为：

y＝softmax(W_sh^*+b_s)

其中W_s、b_s为softmax分类器的参数矩阵和偏置项。

8.根据权利要求书1～7之一所述的方法，其特征在于，在最终的情感分析结果之后，所述方法还包括以下步骤：