CN114817566A

CN114817566A - 基于情绪嵌入的情绪原因对抽取方法

Info

Publication number: CN114817566A
Application number: CN202210464202.6A
Authority: CN
Inventors: 饶国政; 李志威
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2022-04-29
Filing date: 2022-04-29
Publication date: 2022-07-29
Anticipated expiration: 2042-04-29
Also published as: CN114817566B

Abstract

本发明公开一种基于情绪嵌入的情绪原因对抽取方法，利用基于情绪嵌入对情绪原因对抽取的模型实现情绪原因对抽取，该模型的抽取通过词嵌入、情绪编码、原因编码、情绪原因对编码和情绪原因对预测实现，通过词嵌入获得输入文本的词嵌入表征；通过情绪编码，获得情绪子句级特征表示；通过原因编码，获得原因子句级特征表示；然后利用情绪原因对编码，获得情绪原因对特征编码；最后利用softmax图层输出标签上的概率分布，实现情绪原因对抽取。本发明的方法可以利用情绪和原因之间的因果关系和相互指示的特性，提高情绪原因对抽取的能力。

Description

基于情绪嵌入的情绪原因对抽取方法

技术领域

本发明涉及情绪原因分析技术领域，特别是涉及一种基于情绪嵌入的情绪原因对抽取方法。

背景技术

互联网变得越来越普及，人们的生活和互联网的联系越来越紧密，越来越多的人开始通过互联网获取各类资讯以及发表自己的看法与意见。文本数据是互联网上每天源源不断的产生新的数据中，质量最高，数量也最多的一种。另一方面，文本数据也是最符合人们语言习惯的一种数据类型，因成为是人们获取信息和表达情绪最重的一种载体之一。如何对这些海量的文本数据进行分析来获取有用信息有非常重要的研究价值，文本数据的情绪分析是具体分析的一个方向。但是目前的文本情绪分析仅仅关注情绪类别，属于比较浅层的情绪分析任务。而我们有时候更关心到底是什么原因导致了这些情感，由此衍生了更深层次的情绪分析任务：情绪原因对抽取。。

情绪原因对抽取任务在许多领域中都有重要的意义，可以广泛应用于医学、社会学、商业分析等领域。现有研究主要处理方式是先分别获取情绪特征表示和原因特征表示，然后将它们进行拼接组合，生成情绪原因对特征表示，最后再对此特征表示进行特征转换。这些研究完全忽略了情绪和原因之间存在因果关系这一事实，未能利用它们相互指示的特性。

发明内容

本发明的目的是针对现有技术中存在的技术缺陷，而提供一种基于情绪嵌入的情绪原因对抽取模型，并提供基于情绪嵌入的情绪原因对抽取模型进行情绪原因对抽取的方法。

为实现本发明的目的所采用的技术方案是：

一种情绪嵌入的情绪原因对抽取方法，包括：

基于情绪嵌入的情绪原因对抽取模型实现情绪原因对抽取，该模型的实现步骤如下：

S1.词嵌入编码

模型的输入通过词嵌入得到文本的时序表示s＝{s₁,s₂,…,s_n}；

S2.情绪编码

通过第一层词级Bi-LSTM网络得到情绪词级特征表示

其中，

是词级Bi-LSTM网络，用于提取情绪词特征

然后将r′^e输入到子句级Bi-LSTM网络中，最终得到情绪子句级特征表示

其中，

是子句级Bi-LSTM网络，用于提取情绪子句特征

S3.原因编码

原因编码包括词级Bi-LSTM网络、情绪融合模块、情感嵌入模块和子句级Bi-LSTM网络；

通过词级Bi-LSTM网络，得到原因词级特征表示

使用一个大小受限的窗口在情感子句表示r^e上进行滑动，然后将窗口中的所有特征表示进行融合，最后将融合后的特征嵌入到中心子的原因词级特征中；当融合窗口的大小为t时，表示以当前子句为中心，即0位置，需要对{-t,…,0,…,t}范围内的情绪子句进行情绪特征融合操作；当t＝0时，表示不对情感子句做融合操作，换句话说，是情感和原因的子句级特征是独立提取的；

在情感嵌入模块中，将原因词级特征表示r′^c、情感词级特征表示r′^e和情感子句级特征表示融合r^e′进行拼接，生成带有情感特征嵌入的原因词级特征表示r^ce；

r^ce＝[r′^c,r′^e,r^e′]

其中[,]表示拼接函数，然后将它们输入到一个子句级Bi-LSTM网络中，得到原因子句级特征表示；

其中，

表示子句级别的Bi-LSTM网络，用于提取原因子句级特征表示

S4.情绪原因对编码

首先，将情感子句和原因子句两两组会配对，得到情感原因对，记为

其中包括情感从句特征r^e和原因从句特征r^c；

以

作为图的一个节点，所有具有相同情绪特征的节点一起构建一个简单图，称为子句对图；一个N个子句的文档总共需要构建N个子句对图；另外，一般情绪子句与对应的原因子句的距离大部分都比较近，因此只将与中心节点距离小于等于2的子句对用于构建子句对图，即

每个图具有三种不同的边，分别是D0边，用于表示节点自迁移的自循环边；D1边，用于连接距离为1的邻接节点，例如对于中心节点

则其邻接节点

和

需要用D1连接起来；D2边，用于连接距离为2的邻接节点，具体用法如D1；

通过对情绪子句编码网络和情绪嵌入网络的输出进行特征转换，可以得到转换得到节点

的特征表示

具体情况是，子句对图中的特征

是由与其连接的节点根据不同的边使用不同转换参数变换后集成得到；

其中

是权重矩阵，分别表示与节点

连接的D1边、D2边和D0边的权重；z是归一化因子，它的值等于节点的度，σ表示非线性激活函数，使用的是ReLU作为激活函数；

在对情绪原因对进行分类前加入距离信息，对于候选子句对节点

的最终表示p^final是

与d_i,j的拼接，

其中

是距离嵌入；

S5.情绪原因对预测

方法使用全连接神经网络作为分类器，对最终的情绪原因对p^final进行分类；

其中，W_p是权重矩阵，b_p是偏置向量；

通过最小化预测概率和真实标签之间的差值来得到最终的优化后的模型,文档中所有子句的交叉熵损失函数如下：

其中y_ij和

分别是子句对p_ij的真实预测值。

本发明模型与基准之间的差异具有统计学意义。使用准确率、召回率和F1值作为指标，将本发明模型与多个基准进行比较。本发明模型在ECPE任务中准确率和F1值方面均优于基线模型，EEM-ECPE模型提高了分别提高了5.56％和1.22％，EEM-ECPE-BERT模型分别提高了4.45％和1.61％。结果证明，方法可以通过情绪嵌入明显增强情绪原因对抽取的性能。

附图说明

图1是本发明的基于情绪嵌入的情绪原因对抽取模型整体结构图。

具体实施方式

以下结合附图和具体实施例对本发明作进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明的基于情绪嵌入的情绪原因对抽取方法，利用基于情绪嵌入的情绪原因对抽取的模型实现情绪原因对抽取，该模型的实现步骤如下：

步骤一：词嵌入编码

模型的输入通过词嵌入得到文本的时序表示s＝{s₁,s₂,…,s_n}，

S2.情绪编码

通过第一层词级Bi-LSTM网络得到情绪词级特征表示

其中，

是词级Bi-LSTM网络，用于提取情绪词特征

其中，

是子句级Bi-LSTM网络，用于提取情绪子句特征

步骤三：原因编码

原因编码由四个组件组成，包括词级Bi-LSTM网络、情绪融合模块、情感嵌入模块和子句级Bi-LSTM网络；

通过词级Bi-LSTM网络我们得到了原因词级特征表示

使用一个大小受限的窗口在情感子句表示r^e上进行滑动，然后将窗口中的所有特征表示进行融合，最后将融合后的特征嵌入到中心子的原因词级特征中；当融合窗口的大小为t时，表示以当前子句为中心(即0位置)，需要对{-t,…,0,…,t}范围内的情绪子句进行情绪特征融合操作；特别情况是当t＝0时，表示不对情感子句做融合操作，换句话说，就是情感和原因的子句级特征是独立提取的；

r^ce＝[r′^c,r′^e,r^e′]

其中，

表示子句级别的Bi-LSTM网络，用于提取原因子句级特征表示

步骤四：情绪原因对编码

首先，我们将情感子句和原因子句两两组会配对，得到情感原因对，记为

其中包括情感从句特征r^e和原因从句特征r^c；

以

则其邻接节点

和

的特征表示

具体情况是，子句对图中的特征

其中

是权重矩阵，分别表示与节点

的最终表示p^final是

与d_i,j的拼接，

其中

是距离嵌入；

步骤五：情绪原因对预测

使用全连接神经网络作为分类器，对最终的情绪原因对p^final进行分类；

其中，W_p是权重矩阵，b_p是偏置向量；

其中y_ij和

分别是子句对p_ij的真实预测值。

实验验证：

实验基于夏和丁开源的，通过与其他强大的基线模型进行比较来评估提出的模型的性能，并分析模型的性能。

ECPE中文语料库是在新浪新闻情绪原因语料上进行了再次加工而来的，语料共有1945个样本，一个样本可能含有一个或多个情绪，一个情绪可能拥有一个或者多个与之所对应的原因。其中，仅含还有一个情绪的样本有1816个，占比高达93.34％；含有两个及以上情绪的样本有129个，仅占总样本数7.63％。

90％的数据被随机选择用于训练，剩余的数据用于测试。实验重复两次10折交叉验证共计20次实验并报告平均结果。在实验中，使用了词嵌入，它使用Word2Vec工具包在110万个中文微博语料库上进行了预训练，词嵌入的维度为200。此外，还使用了BERT词向量表示中的基础中文模型。Word2Vec词嵌入的维数是200维，Bi-LSTM和GCN的隐藏单元都是100。BERT词嵌入的维数是768维，Bi-LSTM和GCN的隐藏单元都是200。包括权重矩阵与偏置向量等其他可学习参数通过均匀分布U(-0.01,0.01)来初始化。在训练时，我们使用Adam优化器来更新所有参数。小批量大小和学习率分别设置为32和0.005。为了减少过拟合，将dropou应用于所有特征向量，包括词嵌入和隐藏表示，并将其设置为0.5。每个子句的最多词数和每个文档的最大子句数分别设置为75和100。情感嵌入的方法使用的滑动窗口大小为1，融合方法维均值融合。

上表显示了本发明模型EEM-ECPE-BERT与基准在情绪原因对抽取(ECPE)任务和情绪子句抽取(EE)和原因子句抽取(CE)两个子任务的结果。EEM-ECPE模型在ECPE任务中的准确率和F1值取得了最好的结果，优于所有基线模型。具体的，EEM-ECPE模型与之前的最佳模型PairGCN相比，在ECPE的准确率和F1值分别提高了5.56％和1.22％。结果表明本发明模型确实能够利用情绪和原因之间的因果关系和相互指示的特性，提高了情绪原因对预测的能力。

上表显示了本发明模型EEM-ECPE-BERT与基准在情绪原因对抽取(ECPE)任务和情绪子句抽取(EE)和原因子句抽取(CE)两个子任务中使用的了BERT的结果。EEM-ECPE-BERT模型在ECPE任务中的准确率和F1值取得了最好的结果，优于所有基线模型。

具体的，EEM-ECPE-BERT模型与之前的最佳模型PairGCN-BERT相比，在ECPE的准确率和F1值分别提高了4.45％和1.61％。结果表明本发明模型确实能够利用情绪和原因之间的因果关系和相互指示的特性，提高了情绪原因对预测的能力。

以上所述仅是本发明的优选实施方式，应当指出的是，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.基于情绪嵌入的情绪原因对抽取方法，其特征在于，基于情绪嵌入的情绪原因对抽取的模型实现情绪原因对抽取，该模型的实现步骤如下：

S1.词嵌入编码

S2.情绪编码

通过第一层词级Bi-LSTM网络得到情绪词级特征表示

其中，

是词级Bi-LSTM网络，用于提取情绪词特征

其中，

是子句级Bi-LSTM网络，用于提取情绪子句特征

S3.原因编码

通过词级Bi-LSTM网络，得到原因词级特征表示

使用一个大小受限的窗口在情感子句表示r^e上进行滑动，然后将窗口中的所有特征表示进行融合，最后将融合后的特征嵌入到中心子的原因词级特征中；当融合窗口的大小为t时，表示以当前子句为中心，即0位置，需要对{-t,…,0,…,t}范围内的情绪子句进行情绪特征融合操作；当t＝0时，表示不对情感子句做融合操作，实现情感和原因的子句级特征是独立提取的；

r^ce＝[r′^c,r′^e,r^e′]