CN111563373B

CN111563373B - 聚焦属性相关文本的属性级情感分类方法

Info

Publication number: CN111563373B
Application number: CN202010284202.9A
Authority: CN
Inventors: 邓晓衡; 李练; 刘奥
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2020-04-13
Filing date: 2020-04-13
Publication date: 2023-08-18
Anticipated expiration: 2040-04-13
Also published as: CN111563373A

Abstract

本发明提供了一种聚焦属性相关文本的属性级情感分类方法，包括：步骤1，对数据进行预处理使得数据中的每个样本包含属性X_a和上下文X_c，通过Bert预训练模型来获得属性和上下文的文本表征序列和其中，M和N分别代表输入样本中属性的个数和上下文的长度。本发明所提供的聚焦属性相关文本的属性级情感分类方法，使用了本发明设计的掩盖方法来缓解注意力分散问题。本发明充分利用了属性相关上下文信息，缓解了传统Attention‑LSTM网络在处理多属性多情感的文本时，由于注意力会分散到整个句子中，引入了噪声而导致模型的分类性能下降的问题。

Description

聚焦属性相关文本的属性级情感分类方法

技术领域

本发明涉及数据处理技术领域，特别涉及一种聚焦属性相关文本的属性级情感分类方法。

背景技术

随着移动互联网时代的到来，数以亿计的网民越来越倾向于在微博、知乎等互联网社交平台和淘宝、京东等购物网站上公开发表自己的观点和评论。研究如何从这些观点和评论中抽取出有价值的信息对于整个社会来说是十分重要的。为了解决这个问题，情感分析方法被认为是一种有效的解决方案，并且已经成功应用到了舆情监督、民意调查、口碑分析和市场情绪分析等领域。情感分析方法按粒度来划分一般可以分为文档及情感分析方法、句子级情感分析方法和属性级情感分析方法。但是，文档级情感分析方法和句子级情感分析方法仅针对文本的整体情感倾向进行分析，无法得到文本中特定实体(属性词)的情感倾向。

为了克服传统情感分析无法得到文本中属性词情感倾向的问题，研究人员尝试使用属性级情感分析方法来解决这个问题。目前，有许多网络结构被应用于属性级情感分析，其中效果较好、使用较广泛的是Attention-LSTM网络。具体的，LSTM结构能够学习到蕴含在文本中的语义信息，Attention结构则能学习到文本中每个词对于属性词的影响权重的大小。此外，该网络结构还可以通过学习属性词和上下文之间的交互信息来提升属性情感倾向分类的准确率。

多属性多情感的属性级情感分析方法可以看成是属性级情感分析方法的一部分。目前，基于Attrntion-LSTM结构的属性级情感分析方法在处理含有多个属性多个情感的复杂文本时，由于产生注意力分散问题，因此会在模型中引入噪声导致模型分类性能下降。

发明内容

本发明提供了一种聚焦属性相关文本的属性级情感分类方法，其目的是为了解决传统Attention-LSTM网络在处理多属性多情感文本时，由于注意力分散导致模型中引入了噪声而产生的模型分类性能下降的问题。

为了达到上述目的，本发明的实施例提供了一种聚焦属性相关文本的属性级情感分类方法，包括：

步骤1，对数据进行预处理使得数据中的每个样本包含属性X_a和上下文X_c，通过Bert预训练模型来获得属性和上下文的文本表征序列和其中，M和N分别代表输入样本中属性的个数和上下文的长度；

步骤2，将上下文的文本表征序列E_c复制一份，将第一份上下文的文本表征序列E_c与属性的文本表征序列E_a进行拼接，得到全局上下文的文本表征序列E_ac，再对全局上下文的文本表征序列E_ac使用双向长短时记忆网络和多头自注意力机制进行特征提取，得到全局上下文隐藏状态序列对第二份上下文的文本表征序列E_c直接使用双向长短时记忆网络和多头自注意力机制进行特征提取，得到上下文隐藏状态序列

步骤3，使用掩盖方法对上下文隐藏状态序列进行操作，得到属性相关文本的隐藏序列H_f，将隐藏序列H_f与属性的文本表征序列E_a进行拼接，得到属性上下文序列E_af，对属性上下文序列E_af使用长短时记忆网络与多头自注意力机制进行特征提取，得到隐藏状态序列

步骤4，将得到的隐藏状态序列与进行拼接，得到序列向量对序列向量执行最大池化操作，再使用多头自注意力机制进行特征提取，得到隐藏状态序列

步骤5，将得到的隐藏状态序列输入到采取Sigmoid激活函数的全连接层中，得到模型预测结果

步骤6，定义模型的损失进行模型评估与优化。

其中，所述步骤1具体包括：

通过Bert预训练模型得到的文本表征序列，动态的表征文本中每个词的词向量，获取文本表征向量的公式如下所示：

E_a＝Bert_a(X_a) (1)

E_c＝Bert_c(X_c) (2)

其中，E_a和E_c分别是属性和上下文的文本表征序列，Bert_a和Bert_c分别是属性和上下本的相应Bert预训练模型。

其中，所述步骤2具体包括：

E_a和E_c拼接过程可以用如下公式表示：

其中，E_ac是全局上下文的文本表征序列；

Bi-LSTM的特征抽取过程可以使用如下公式表示：

其中，为上下文隐藏状态序列，为全局上下文隐藏状态序列。

其中，所述步骤2还包括：

Bi-LSTM的特征抽取过程可以由以下公式详细表示，以处理E_c为例：

其中，表示的是向前的LSTM输出的隐藏状态表示，表示的是向后的LSTM输出的隐藏状态表示，将和进行拼接得到了该文本序列的隐藏状态表示

其中，所述步骤2还包括：

MH Self-Attention的特征抽取过程可以用如下公式表示：

其中，为上下文隐藏状态序列，为全局上下文隐藏状态序列，MHSA代表特征抽取器多头自注意力机制；

MHSA可以由以下公式详细表示，以处理为例：

其中，Q、K、V这三个参数是通过将上一层隐藏状态的输出表示乘以它们各自的权重矩阵得到的，这些权重矩阵需要在训练过程中进行学习，维度d_h，d_k，d_v等于d_h÷h，d_h是隐藏层的维度，h表示注意力头的个数，每个注意力头学习到的注意力表示需要乘以向量进行连接和变换，式中的“；”表示向量级联。

其中，所述步骤3具体包括：

属性相关文本的特征抽取过程可以用如下公式表示：

其中，H_f代表属性相关文本的隐藏状态序列，FRAC代表属性相关文本提取器。

其中，所述步骤3还包括：

FRAC用以下公式详细表示：

W_v＝{v₀，v₁，...，v_n} (17)

H_f＝W_v·E_af (18)

其中，v_i为掩码向量，α代表文本中每个词距离当前属性词的距离，k是一个自定义超参数，k决定属性词周围的哪些词不被屏蔽，W_v代表掩盖矩阵。

其中，所述步骤4具体包括：

获取属性上下文与全局上下文的交互信息，特征交互过程可以用如下公式表示：

其中，和分别代表最大池化操作和多头自注意力机制提取出的隐藏状态序列，MaxPooling代表最大池化操作，用于提取交互序列中的重要特征。

其中，所述步骤5具体包括：

模型的输出可以由下面的公式表示：

其中，W_s和b_s分别表示输出层的权重和偏置，o表示输出层的输出，代表模型的预测结果，Sigmoid为激活函数。

其中，所述步骤6具体包括：

损失函数定义如下：

其中，C代表类别数，代表样本预测标签，y_i代表样本真实标签，λ是L2正则化参数，Θ是模型的参数集，由式(27)计算模型的损失，根据损失对模型进行评估和优化，将优化好的模型作为最终使用的模型。

本发明的上述方案有如下的有益效果：

本发明的上述实施例所述的聚焦属性相关文本的属性级情感分类方法，使用了Bert预训练方法作为文本表征的方法，使得模型可以动态的获取文本中每个单词的词向量，有效解决了一词多义问题，增强了模型的表征能力，提升了模型的性能，引入了双向长短时记忆网络和多头自注意力机制来作为特征抽取器，有效提高了模型的性能，有效解决了因注意力分散所导致的模型由于引入了噪声而产生的分类性能下降问题，使得模型的分类准确率得到了一定的提高。

附图说明

图1为本发明的模型结构示意图；

图2为本发明使用的MAMS-ATSA和M-Restaurant数据集的数据分布情况图；

图3为本发明在MAMS-ATSA数据集和M-Restaurant数据集中的实验结果图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

本发明针对现有的传统Attention-LSTM网络在处理多属性多情感文本时，由于注意力分散导致模型中引入了噪声而产生的模型分类性能下降的问题，提供了一种聚焦属性相关文本的属性级情感分类方法。

如图1至图3所示，本发明的实施例提供了一种聚焦属性相关文本的属性级情感分类方法，包括：步骤1，对数据进行预处理使得数据中的每个样本包含属性X_a和上下文X_c，通过Bert预训练模型来获得属性和上下文的文本表征序列和其中，M和N分别代表输入样本中属性的个数和上下文的长度；步骤2，将上下文的文本表征序列E_c复制一份，将第一份上下文的文本表征序列E_c与属性的文本表征序列E_a进行拼接，得到全局上下文的文本表征序列E_ac，再对全局上下文的文本表征序列E_ac使用双向长短时记忆网络和多头自注意力机制进行特征提取，得到全局上下文隐藏状态序列对第二份上下文的文本表征序列E_c直接使用双向长短时记忆网络和多头自注意力机制进行特征提取，得到上下文隐藏状态序列步骤3，使用掩盖方法对上下文隐藏状态序列进行操作，得到属性相关文本的隐藏序列H_f，将隐藏序列H_f与属性的文本表征序列E_a进行拼接，得到属性上下文序列E_af，对属性上下文序列E_af使用长短时记忆网络与多头自注意力机制进行特征提取，得到隐藏状态序列步骤4，将得到的隐藏状态序列与进行拼接，得到序列向量对序列向量执行最大池化操作，再使用多头自注意力机制进行特征提取，得到隐藏状态序列步骤5，将得到的隐藏状态序列输入到采取Sigmoid激活函数的全连接层中，得到模型预测结果步骤6，定义模型的损失进行模型评估与优化。

本发明的上述实施例所述的聚焦属性相关文本的属性级情感分类方法，所述聚焦属性相关文本的属性级情感分类方法的模型结构如图1，该模型大致分为四阶段：第一个阶段为文本表征，其主要目的在于将文本表征为计算机可理解的序列，Bert预训练模型得到的文本表征序列，相对于其他方法有效解决了一词多义问题，能够动态的表征文本中每个词的词向量；第二个阶段是特征抽取，其主要目的在于提取序列中的重要特征，过滤掉不重要的信息；第三个阶段是聚焦属性相关文本，其目的在于缓解了传统Attention-LSTM网络由于注意力分散带来的问题；第四个阶段是特征交互，其主要目的在于获取属性上下文与全局上下文间的交互信息。首先，对于Foursquare数据集和SemEval 2014和SemEval 2016的Restaurant数据集仅保留了数据集中拥有多个属性多个情感的样本。由于经过上述操作后，每个数据集中的数据比较少，而Foursquare数据集是一个按照SemEval 2016的Restaurant数据集的标注标准进行标注的餐厅数据集。因此将SemEval 2014和SemEval2016的Restaurant数据集数据与Foursquare数据集进行了合并，得到新的数据集M-Restaurant，并重新切分了数据集。此外还使用了MAMS-ATSA数据集，该数据集中每个样本都至少包含拥有两个不同情感的属性，得到了M-Restaurant和MAMS-ATSA这两个多属性多情感的数据集。采取的对比方法分别是LSTM、TD-LSTM、ATAE-LSTM、IAN、AOA以及所述聚焦属性相关文本的属性级情感分类方法FARCN。

实验使用的方法是常用的10折交叉验证，在进行实验时，每次训练集随机选择90％的数据，最后的10％是验证数据集，在下面的实验中，依次进行3次的10折交叉实验且把3次结果的平均值作为实验的最终结果。

实验参数设置的具体设置：在实验中，对于未登录词的词向量在均匀分布U(-0.01,0.01)中进行随机采样来获取初始化值，学习率设置为10-e3，参数的正则化权重设置为10-e5，Dropout的值设置为0.5，隐藏层和嵌入层的维度设置为768，注意力头的个数h设置为8，此外，在实验中采取的优化器为Adam，其他模型的参数都按照该模型论文中的参数来进行设置。实验中采用的情感分析中常用的评价指标是准确率(Accuracy)和F1分数(F1-score)，Accuracy和F1-score的计算公式如下：

其中，TP(真阳性)：指预测为正，实际也为正的样本数，FP(假阳性)：指预测为正，实际为负的样本数；FN(假阴性)：指预测为负，实际为正的样本数；TN(真阴性)：指预测为负，实际也为负的样本数。

针对不同数据集和不同维度来对分类的准确度进行实验，最终在MAMA-ATSA数据集和M-Restaurant数据集的进行实验，数据集的分布情况如图2所示。通过与一些基准方法进行对比得出的结果如图3所示。

由图3可知，LSTM算法的性能表现是最差的,这说明仅采用单个LSTM的算法构建的分类器存在一定的缺陷，因此在M-Restaurant和MAMA-ATSA等数据集上的分类准确率表现很差，TD-LSTM优于单个LSTM，这主要是由于TD-LSTM额外考虑了目标左右文本信息，这说明引入其他信息有助提升分类结果的准确率，ATAE-LSTM方法要优于TD-LSTM和LSTM方法，这主要因为ATAE-LSTM引入了注意力机制，因此ATAE-LSTM拟合能力要优于TD-LSTM和LSTM，同时ATAE-LSTM引入了属性信息，来学习属性词和上下文之间的隐含关系，因此ATAE-LSTM表现优于TD-LSTM和LSTM。

此外，从图3还可以看出IAN两种方法的分类准确率均优于LSTM、TD-LSTM和ATAE-LSTM，这主要是因为AOA和IAN模型同时针对属性目标和上下文进行建模，并且获取了属性目标和上下文的交互信息，这一结果说明通过属性和文本进行交互能够获取到更多的信息，最后所述聚焦属性相关文本的属性级情感分类方法，在处理多属性多情感的文本数据集上，所述聚焦属性相关文本的属性级情感分类方法优于其他对比方法，这是由于模型中引入了表征能力更强的Bert预训练词向量，特征抽取能力更强的多头自注意力机制(MHSelf-Attention)和双向长短期记忆网络(Bi-LSTM)，最重要的是模型中加入了本发明所设计的聚焦于属性相关文本的掩盖机制，使得模型更加适用于多属性多情感文本数据场景，使得所述聚焦属性相关文本的属性级情感分类方法取了的很好的表现，实验结果表明，所述聚焦属性相关文本的属性级情感分类方法相比于传统方法在处理多属性多情感文本时的分类准确性更好。

其中，所述步骤1具体包括：通过Bert预训练模型得到的文本表征序列，动态的表征文本中每个词的词向量，获取文本表征向量的公式如下所示：

E_a＝Bert_a(X_a) (1)

E_c＝Bert_c(X_c) (2)

其中，所述步骤2具体包括：E_a和E_c拼接过程可以用如下公式表示：

其中，E_ac是全局上下文的文本表征序列；

Bi-LSTM的特征抽取过程可以使用如下公式表示：

其中，所述步骤2还包括：

其中，所述步骤2还包括：MH Self-Attention的特征抽取过程可以用如下公式表示：

MHSA可以由以下公式详细表示，以处理为例：

本发明的上述实施例所述的聚焦属性相关文本的属性级情感分类方法，特征抽取的目的在于提取关键特征并过滤掉不重要的文本信息。

其中，所述步骤3具体包括：属性相关文本的特征抽取过程可以用如下公式表示：

其中，所述步骤3还包括：FRAC用以下公式详细表示：

W_v＝{v₀，v₁，...，v_n} (17)

H_f＝W_v·E_af (18)

本发明的上述实施例所述的聚焦属性相关文本的属性级情感分类方法，所述步骤3的目的在于缓解了传统Attention-LSTM网络由于注意力分散导致模型中引入了噪声而带来的模型分类性能下降问题。

其中，所述步骤4具体包括：获取属性上下文与全局上下文的交互信息，特征交互过程可以用如下公式表示：

其中，所述步骤5具体包括：模型的输出可以由下面的公式表示：

其中，所述步骤6具体包括：损失函数定义如下：

本发明的上述实施例所述的聚焦属性相关文本的属性级情感分类方法，使用聚焦属性相关文本来缓解传统Attention-LSTM网络处理多属性多情感文本时，由于注意力分散导致的模型引入噪声而带来的模型性能下降问题，同时属性向量与属性上下文向量以及上下文向量分别进行拼接，然后在再进行特征提取的操作，使得模型在进行特征提取的时候能够更加方便地提取出对判断属性词的情感倾向影响权重大的文本特征。

本发明的上述实施例所述的聚焦属性相关文本的属性级情感分类方法，针对传统的文本表征方法存在无法解决一词多义的问题，使用了Bert预训练方法作为文本表征的方法，使得模型可以动态的获取文本中每个单词的词向量，有效解决了一词多义问题，Bert预训练方法增强了模型的表征能力，提升了模型的性能，针对一般的Attention和LSTM结构特征抽取能力偏弱的问题，引入了双向长短时记忆网络和多头自注意力机制来作为特征抽取器，有效提高了模型的性能，针对传统Attention-LSTM网络处理多属性多情感文本时，易产生注意力分散的问题，所述的聚焦属性相关文本的属性级情感分类方法，有效解决了因注意力分散而导致的模型中由于引入噪声而带来的性能下降问题，使得模型的分类准确率得到了一定的提高。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种聚焦属性相关文本的属性级情感分类方法，其特征在于，包括：

步骤6，定义模型的损失进行模型评估与优化。

2.根据权利要求1所述的聚焦属性相关文本的属性级情感分类方法，其特征在于，所述步骤1具体包括：

E_a＝Bert_a(X_a) (1)

E_c＝Bert_c(X_c) (2)

3.根据权利要求2所述的聚焦属性相关文本的属性级情感分类方法，其特征在于，所述步骤2具体包括：

E_a和E_c拼接过程可以用如下公式表示：

其中，E_ac是全局上下文的文本表征序列；

Bi-LSTM的特征抽取过程可以使用如下公式表示：

4.根据权利要求3所述的聚焦属性相关文本的属性级情感分类方法，其特征在于，所述步骤2还包括：

利用Bi-LSTM对E_c进行特征提取的过程如下：

5.根据权利要求4所述的聚焦属性相关文本的属性级情感分类方法，其特征在于，所述步骤2还包括：

MH Self-Attention的特征抽取过程可以用如下公式表示：

利用MHSA对进行特征提取的过程如下：

6.根据权利要求5所述的聚焦属性相关文本的属性级情感分类方法，其特征在于，所述步骤3具体包括：

属性相关文本的特征抽取过程可以用如下公式表示：

7.根据权利要求6所述的聚焦属性相关文本的属性级情感分类方法，其特征在于，所述步骤3还包括：

FRAC用以下公式详细表示：

W_v＝{v₀，v₁，...，v_n} (17)

H_f＝W_v·E_af (18)

8.根据权利要求7所述的聚焦属性相关文本的属性级情感分类方法，其特征在于，所述步骤4具体包括：

9.根据权利要求8所述的聚焦属性相关文本的属性级情感分类方法，其特征在于，所述步骤5具体包括：

模型的输出可以由下面的公式表示：

10.根据权利要求9所述的聚焦属性相关文本的属性级情感分类方法，其特征在于，所述步骤6具体包括：

损失函数定义如下：