CN112561718A

CN112561718A - 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法

Info

Publication number: CN112561718A
Application number: CN202011275960.0A
Authority: CN
Inventors: 余正涛; 王静赟; 相艳; 黄于欣; 郭军军; 线岩团
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2020-11-16
Filing date: 2020-11-16
Publication date: 2021-03-26

Abstract

本发明涉及基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，属于自然语言处理技术领域。本发明首先通过建立输入分别为案件微博评论和案件微博评价对象的双向BiLSTM分类模型，同时利用权重共享将两个不同空间的向量映射到同一个向量空间上，在同一向量空间上对不同向量进行编码，可以得到案件微博评论和评价对象的相关信息；最后结合注意力机制提高特征向量的表达能力，进行情感倾向性判别。本发明解决了目前案件微博评价对象情感倾向性分析基本都是通过对评价对象和评论文本分别进行编码，然后再输入到模型进行评价对象级别的情感倾向性分析，并没有考虑到这两种信息之间的差异性的问题。

Description

基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法

技术领域

本发明涉及基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，属于自然语言处理技术领域。

背景技术

情感倾向性分析是指对文本进行积极、消极、中性等类别的判断，细粒度情感分析是细粒度的情感分析一般指词汇级情感分析，也就是评价对象。案件微博评论数据存在表述不清晰、主语不明确等特点。往往在同一个评论里有一个或多个评价对象，而且每个评价对象的极性也是不相同的。不能单纯地通过情感词语来轻易判断情感极性，需要更细粒度的情感分析。如何基于案件微博评价对象对评论进行细粒度的情感分析，准确快捷地判别评论信息中评价对象对应的评价极性，利用案件信息正确地引导舆论走向，是一项极其有价值的工作。

发明内容

本发明提供了基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，以用于解决现有方法大多利用上下文为评价对象构造特征，在一个句子中存在多个评价对象的情况会因不同评价对象的特征较相近导致分类结果不准确等问题。

本发明的技术方案是：基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，所述方法包括：

Step1、收集用于案件微博评价对象情感倾向性分析的微博评论文本，对微博评论文本进行去重与筛选；

进一步地，所述Step1中，使用Scrapy作为爬取工具，收集用于案件微博评价对象情感倾向性分析的微博评论文本。

此优选方案设计是本发明的重要组成部分，主要为本发明收集语料过程，为本发明分析案件微博评价对象情感倾向性提供了数据支撑。

Step2、定制案件微博评价对象情感倾向性分析的标注体系，标记微博评论文本，将标记好的微博评论语料按照4：1的比例分配训练语料和测试语料；

Step3、获取评论语句对应的词向量和评价对象对应的词向量，训练数据经过预处理后作为具有权重共享的BiLSTM的输入；

Step4、采用权重共享的BiLSTM获取评论和评价对象的语义特征，训练案件微博评价对象情感倾向性分析模型；

Step5、将评价对象对应的隐含层输出向量进行mean pooling(平均池化)得到代表评价对象的向量，然后将末尾的隐含层的输出向量进行连接操作，结合注意力机制得到最终的特征表达，输入到softmax分类器，用于进行情感倾向性分析。

进一步地，所述步骤Step2的具体步骤为：

Step2.1、定制的案件微博评价对象情感倾向性分析的标注体系采用了XML的可扩展标记语言组织文本，分别针对评价对象文本、评价对象的开始位置、评价对象的结束位置、评价对象的情感极性对收集到的微博评论文本进行标记；

Step2.2、再将实验数据分为训练语料和测试语料。

本发明使用的数据集为人工标注共2379条案件微博评论，标注内容为案件微博评论句中的评价对象以及对应的情感极性，分别是A和B两个数据集。

此优选方案设计是本发明的重要组成部分，主要为本发明提供语料预处理过程，为后续工作提供模型训练时所需训练语料和为模型测试时提供测试语料；并且为本发明分析案件微博评价对象情感倾向性提供了支撑和挖掘的对象。

进一步地，所述步骤Step3包括：在嵌入层中用word2vec词向量模型对案件微博评论和评价对象进行表征，得到评论语句对应的词向量和评价对象对应的词向量。

模型输入如图2所示，

和

分别是评论语句对应的词向量和评价对象对应的词向量，其中，m代表组成评论语句词的个数，r是评价对象的个数。

此优选方案设计是本发明的重要组成部分，主要为本发明提供向量编码的过程。

作为本发明的优选方案，本发明利用权重共享的BiLSTM将两个不同空间的向量映射到同一个向量空间上，在同一向量空间上对不同向量进行编码，然后结合注意力机制提高特征向量的表达能力，进行情感倾向性判别，其中：

所述步骤Step4的具体步骤：

Step4.1、训练数据经过预处理后，输入到具有权重共享的BiLSTM中；

Step4.2、将案件微博评论句和评价对象的向量映射到同一个空间维度上，通过双向长短时记忆网络能够获取句子中潜在的语义信息，由一个前向的LSTM网络层和后向的LSTM网络层组成；

Step4.3、利用双向长短时记忆网络中的门结构单元对句子信息进行选择性记忆。

进一步地，所述步骤Step5的具体步骤为：

Step5.1、单独对评价对象对应的隐含层输出向量进行mean pooling，得到的结果拼接到评论句的每个词向量中，以获得每个词的最终上下文语义表示，最终输出的向量将作为下一步注意力机制层的输入；

Step5.2、结合注意力机制，通过计算对句子语义重要的信息，滤掉与句子无关的信息，突出评价对象作为关键信息在整体句子中的重要程度，增强关键特征所携带的特征信息，得到最终的特征表达；

Step5.3、将最终的特征表达输入到softmax分类器中，决策出最大概率的类别，得到评论句最终的情感极性；其中情感极性的标签是分为三个，分别是积极、中立和消极。

作为本发明的优选方案，所述权重共享的BiLSTM包括编码层和注意力机制层；

所述BiLSTM：

训练数据经过预处理后，输入到具有权重共享的BiLSTM中，将案件微博评论句和评价对象的向量映射到同一个空间维度上，通过双向长短时记忆网络能够获取句子中潜在的语义信息，由一个前向的LSTM网络层和后向的LSTM网络层组成。利用双向长短时记忆网络中的门结构单元对句子信息进行选择性记忆。在输入层表示的向量经过LSTM网络层的过程中，在时间步骤时会按公式式(1)-式(5)计算输入门、遗忘门和输出门的隐藏状态和单独完整LSTM网络层的输出状态值，表达式如下：

i_t＝σ(W_ih_t-1+V_ix_t+b_i) (1)

f_t＝σ(W_fh_t-1+V_fx_t+b_f) (2)

c＝tanh(W_ch_t-1+V_cx_t+b_c) (3)

o_t＝σ(W_oh_t-1+V_ox_t+b_o) (4)

h_t＝o_t tanh(c_t) (5)

其中σ表示的是sigmoid激活函数，c_t表示的是当前单元的细胞状态值。W_x和V_x (x＝i,o,f,c)分别表示输入门、遗忘门和输出门以及所在的单元状态所对应的权重参数，b_x(x＝i,o,f,c)分别表示所对应的偏置项。通过前向LSTM层和后向LSTM层计算的单元隐藏状态分别为

和

两个隐藏单元状态向量按公式(6)结合，案件微博评论句和评价对象的输出向量分别表示为

和

接下来，单独对评价对象的输出进行mean pooling，得到

将

拼接到评论句的每个词向量中，以获得每个词的最终上下文语义表示为公式7：

最终输出的向量h_i将作为下一步注意力机制层的输入。

所述注意力机制：

通过计算对句子语义重要的信息，滤掉与句子无关的信息，注意力机制层可以突出评价对象作为关键信息在整体句子中的重要程度，增强关键特征所携带的特征信息。

具体可以表示为：

e_i,j＝tanh(W_hh_i,j+b_h) (8)

其中，e_i,j为没有进行归一化的注意力分配概率权重值，α_i,j为编码器第i个元素对于解码器第j个元素所计算的隐层状态注意力权重值，m为输入集合中词的个数， W_h为注意力机制层的矩阵权重。

最后，将注意力机制得到的特征表达用于最后的分类。

本发明的有益效果是：

1、本发明的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，将案件微博评论和评价对象分别输入到两个BiLSTM网络进行编码，通过权重共享在获取句子语义特征的同时，还可以得到案件微博评价对象的相关性信息；

2、本发明的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，为了处理评价对象的杂乱问题使用mean pooling得到代表评价对象的向量；

3、本发明的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，加入了注意力机制，不仅关注评论中词与词之间的相互作用，同时能针对评价对象有所侧重，最后结合注意力机制可以提高特征向量的表达能力，可以更为准确地判断对评价对象的情感极性；

4、本发明的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，解决了案件微博评论的细粒度情感分析任务。

附图说明

图1为本发明提出的案件微博评价对象情感倾向性分析流程图；

图2为本发明提出的权重共享的BiLSTM模型图。

具体实施方式

实施例1：如图1-2所示，基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，所述方法包括：

进一步地，所述步骤Step2的具体步骤为：

Step2.2、再将实验数据分为训练语料和测试语料。

模型输入如图2所示，

和

所述步骤Step4的具体步骤：

进一步地，所述步骤Step5的具体步骤为：

所述BiLSTM：

i_t＝σ(W_ih_t-1+V_ix_t+b_i) (1)

f_t＝σ(W_fh_t-1+V_fx_t+b_f) (2)

c＝tanh(W_ch_t-1+V_cx_t+b_c) (3)

o_t＝σ(W_oh_t-1+V_ox_t+b_o) (4)

h_t＝o_t tanh(c_t) (5)

和

和

接下来，单独对评价对象的输出进行mean pooling，得到

将

最终输出的向量h_i将作为下一步注意力机制层的输入。

所述注意力机制：

具体可以表示为：

e_i,j＝tanh(W_hh_i,j+b_h) (8)

最后，将注意力机制得到的特征表达用于最后的分类。

Step6、本发明的实验模型基于Keras的深度学习框架，经过实验，证明模型设置的合理性与高效性，又将该模型与现有模型进行对比，证明本方法在案件微博评价对象情感倾向性分析上具有较好效果。

在实验中，把评价对象级别的情感极性处理成分类问题，因此采用判断正确分类结果的准确率(Acc，Accuracy)来评价模型的效果，计算公式如下式：

其中，Right_num表示预测正确情感极性的评价对象数量；total_num表示数据中所有评价对象的数量。

本发明的实验模型基于Keras的深度学习框架。最大句子长度设置为60，词向量的维度根据数据集的规模定为100维。LSTM层为64(BiLSTM为128)。在两个输入的嵌入层插入σ＝0.2的高斯噪声，在句子嵌入层进行dropout，参数为0.3，在LSTM层进行dropout，参数为0.2，LSTM层的递归连接与注意力机制层和Maxout 层之间进行dropout，参数为0.2，学习率为0.001。

本发明模型分别与CNN、LSTM、TDLSTM和BiLSTM等基准模型与本模型做了对比实验。实验结果如表1所示。

表1为A和B数据集模型准确率对比

在几种基准模型的进行实验对比后，可以看出在A数据集上，CNN方法的实验结果中准确率较低为60.42％。主要是因为是CNN对局部特征抽取的效果比较好，面对一个评论中有不同的评价对象具有不同的情感极性时，使得CNN在这种复杂的情况下无法确地抽取出相应的特征来进行判断。相对而言LSTM模型得到的准确率为62.15％，结果比CNN的准确率提高了1.73％。主要因为LSTM可以捕捉到的范围更大，通过门结构能够获取到句长较大且结构复杂的完整上下文信息，可以更好地利用上下文语义信息决定当前单元值的输出，相较于CNN抽取局部特征而言能更好地判断当前评价对象的情感极性。TDLSTM的准确率较LSTM增加了2.31％，因为它是从标准的LSTM发展起来的，用LSTM来处理位于评价对象两边的上下文表示，所以评价对象是通过两次表示的，可以集中地表示最终的特征。BiLSTM也比单向的LSTM要好，准确率为65.89％，双向的LSTM结构模型通过前后两个方向计算隐层输出单元的状态，相对独立的LSTM能更全面准确地获取上下文之间的特征信息，在准确率方面有所提高。

本发明模型相比其他基准模型在两个数据集上均取得了最高的准确率，分别为67.70％和65.98％。本发明模型将案件微博评论和评价对象分别输入到两个BiLSTM 网络进行编码，通过权重共享在获取句子语义特征的同时，还可以得到案件微博评价对象的相关性信息；为了处理评价对象的杂乱问题使用mean pooling得到代表评价对象的向量；加入注意力机制的目的是不仅关注评论中词与词之间的相互作用，同时能针对评价对象有所侧重。最后结合注意力机制可以提高特征向量的表达能力，可以更为准确地判断对评价对象的情感极性。

从以上数据可以看出，本发明方法相比其他基准的评价对象抽取模型能取得更好的结果。

上面结合附图对本发明的具体实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，其特征在于：所述方法包括：

Step2、定制案件微博评价对象情感倾向性分析的标注体系，标记微博评论文本，将标记好的微博评论语料分为训练语料和测试语料；

Step5、将评价对象对应的隐含层输出向量进行mean pooling得到代表评价对象的向量，然后将末尾的隐含层的输出向量进行连接操作，结合注意力机制得到最终的特征表达，输入到softmax分类器，用于进行情感倾向性分析。

2.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，其特征在于：所述Step1中，使用Scrapy作为爬取工具，收集用于案件微博评价对象情感倾向性分析的微博评论文本。

3.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，其特征在于：所述步骤Step2的具体步骤为：

Step2.2、再将实验数据分为训练语料和测试语料。

4.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，其特征在于：所述步骤Step3中：将评论语句中的词与评价对象输入到embedding层中得到评论语句对应的词向量

和评价对象对应的词向量

其中，m代表组成评论语句词的个数，r是评价对象的个数。

5.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，其特征在于：所述步骤Step4的具体步骤：

6.根据权利要求1所述的基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法，其特征在于：所述步骤Step5的具体步骤为：