CN111353042B

CN111353042B - 一种基于深度多任务学习的细粒度文本观点分析方法

Info

Publication number: CN111353042B
Application number: CN202010125042.3A
Authority: CN
Inventors: 王乾宇; 蔡铭
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-02-27
Filing date: 2020-02-27
Publication date: 2023-06-30
Anticipated expiration: 2040-02-27
Also published as: CN111353042A

Abstract

本发明公开了一种基于深度多任务学习的细粒度文本观点分析方法，该方法基于深度神经网络BERT，通过多任务学习的方法，提取文本中被评论的方面词，并判断该方面词的情感极性。首先利用分词工具将文本分为一串词序列；将词序列输入BERT网络，获得BERT每一层的隐藏层输出；将BERT中间层的隐藏层输出输入到一个全连接网络加条件随机场的神经网络中，通过序列标注的方法得到文本中方面词的结果；将BERT最高层的隐藏层输出输入到一个三元分类器中，得到文本中每一个词的情感极性；将方面词结果和情感极性判别结果组合，得到最终文本的细粒度情感分析结果。这种方法不仅能够同时获取文本中方面词和对应的情感极性结果，而且使情感分析的准确率大大提升。

Description

一种基于深度多任务学习的细粒度文本观点分析方法

技术领域

本发明属于文本分析领域，尤其涉及一种基于深度多任务学习的细粒度文本观点分析方法。

背景技术

随着互联网用户的不断增加，用户所创造的内容数据呈爆炸增长。在用户生成的内容数据中，文本数据占大量比例，这些文本数据中所蕴藏的用户情感信息是十分重要的。如何从文本数据中挖掘情感至关重要，情感分析技术也就应运而生。

情感分析技术是自然语言处理(Natural Language Processing，NLP)中一个重要方向，分为文档级情感分析、句子级情感分析和方面级情感分析。文档级和句子级针对整篇文档或整句话判断单一的情感极性，而方面级情感分析则用于解决细粒度的情感分析问题，对于每一条文本数据，识别其中的方面词并判断评论者对该方面的情感。

例如对于饭店的评论“Great food but the service was dreadful！”中，细粒度情感分析能够识别用户对方面词“food”的情感是正向的，而对于方面词“service”的评价却是负向的。细粒度情感分析在实际生产生活中有着重要作用。例如，通过对商品评论的细粒度情感分析，消费者可以准确了解商品各方面的评价来选择是否购买商品，同时生产厂家可以针对性地改良产品。细粒度情感分析方法的研究能够使我们从海量的数据中更加准确地挖掘用户所表达的情感，有着非常重要的研究意义和价值。

现有的细粒度情感分析研究主要分为两阶段的任务进行。其中，第一阶段为方面词抽取任务。第二阶段为情感极性判别任务，即根据第一阶段取到的方面词，判断该方面词的情感极性。然而，这种流水线式的方法存在一定的问题。一方面而言，这种方法会造成链式错误，即当第一阶段的方面词抽取出现错误时，第二阶段会对错误的方面词进行情感判断，从而导致情感极性判别结果也出现错误。另一方面，这种方法忽略了两任务之间的信息传递。

基于以上背景，本发明提出一种基于深度多任务学习的细粒度情感分析方法。通过将BERT模型用于多任务学习，避免了链式冲突，更好地利用了多任务之间的信息交互和信息共享，使情感分析的准确率大大提升。

发明内容

本发明的目的在于针对现有技术的不足，提供一种基于深度多任务学习的细粒度文本观点分析方法。

本发明的目的是通过以下技术方案来实现的：一种基于深度多任务学习的细粒度文本观点分析方法，包括如下步骤：

(1)输入文本序列，方面词及对应的情感极性；

(2)首先利用分词工具将步骤(1)输入的文本序列按照分词规范重新组合成具有独立含义的词序列，在词序列的开头和结尾分别添加“[CLS]”和“[SEP]”标志位；然后根据预先设定的最大句子长度，在未达到最大长度的词序列末尾作0填充，得到预处理后的词序列S；

(3)通过序列标注的方式对预处理后的词序列S中每一个词作标注表示方面词位置；所述序列标注具体为标注方面词的开始位置、方面词的中间位置和非方面词位置；并对预处理后的词序列S中每一个词标注情感极性，方面词的情感极性包括正向情感、负向情感和中性情感，非方面词作特殊标注；

(4)将步骤(2)预处理后的词序列S输入细粒度文本观点分析模型结合步骤(3)标注的方面词位置和情感极性进行训练；所述细粒度文本观点分析模型包括BERT模型、方面词抽取网络和情感极性判别网络；所述细粒度文本观点分析模型的损失函数为方面词抽取网络的损失函数与情感极性判别网络的损失函数之和；其中，所述方面词抽取网络的损失函数为最大似然函数；所述情感极性判别网络的损失函数为交叉熵损失函数，且在步骤(3)中作特殊标注的非方面词的情感极性不计入该损失函数；

(5)将待测文本序列经过步骤(2)预处理得到词序列，输入步骤(4)训练得到的细粒度文本观点分析模型，得到待测文本序列的方面词以及每个词对应的情感极性；当方面词为多个词的组合时，取第一个词的情感极性为整个方面词的情感极性。

进一步地，所述步骤(4)中所述BERT模型的输入为预处理后的词序列S，BERT模型每一层的隐藏层输出为H＝[H₁,H₂,…,H_m,…,H_t]；其中，H_m为第m层隐藏层输出；H_t为第t层隐藏层输出。

进一步地，所述BERT模型为BERT-base模型，模型层数为t＝12，中间层m的取值为9。

进一步地，所述方面词抽取网络由全连接网络和条件随机场组成；所述全连接网络的输入为BERT模型的第m层隐藏层输出H_m，输出为隐藏层输出P；隐藏层输出P的维度为最大句子长度*3；所述条件随机场的输入为隐藏层输出P，输出为每个词的序列标注，用于表示方面词位置。

进一步地，所述情感极性判别网络为由全连接网络和非线性激活函数构成的三元分类器；所述由全连接网络和非线性激活函数构成的三元分类器的输入为BERT模型的第t层隐藏层输出H_t，输出为每一个词的情感极性判断结果。

本发明的有益效果是：可以同时获得文本的方面词和该方面词对应的情感极性。此外，通过多任务学习的方法，使两个任务在训练过程中实现信息交互和共享，并且使用BERT模型提高该方法的文本特征提取能力，相比流水线式的方法有更准确的细粒度情感分析结果。

附图说明

图1是基于深度多任务学习的细粒度文本观点分析方法流程图。

具体实施方式

下面结合附图对本发明作进一步详细说明。

本发明选用英文公开数据集SemEval-2014 Task4作为训练语料，其中包括餐馆和笔记本电脑两个领域的用户评论数据，每条评论都标注了方面词和对应的情感极性。如图1所示，本发明提供一种基于深度多任务学习的细粒度文本观点分析方法，包括如下步骤：

(1)输入文本序列，方面词及对应的情感极性；

(2)首先利用bert模型自带的分词工具将步骤(1)输入的文本序列按照分词规范重新组合成具有独立含义的词序列S＝[s₁,s₂,…,s_n]；在词序列S的开头和结尾分别添加“[CLS]”和“[SEP]”标志位，使其满足BERT(Bidirectional Encoder Representationsfrom Transformers)模型的输入要求；然后根据预先设定的最大句子长度，在未达到最大长度的词序列S末尾作0填充，得到预处理后的词序列S；

(3)通过序列标注的方式用B、I、O对预处理后的词序列S中每一个词作标注表示方面词位置其中，B代表方面词的开始位置，I代表方面词的中间位置，O代表非方面词位置；并对预处理后的词序列S中每一个词标注情感极性；方面词的情感极性包括POS，NEG，NEU三类；其中，POS代表正向情感，NEG代表负向情感，NEU代表中性情感；非方面词作特殊标注“-”，在模型训练中这些位置不会用于计算情感极性判别的损失函数。

(4)将步骤(2)预处理后的词序列S输入细粒度文本观点分析模型结合步骤(3)标注的方面词位置和情感极性进行训练；所述细粒度文本观点分析模型能够同时实现方面词抽取任务(即序列标注任务)和情感极性判别任务(即分类任务)。所述细粒度文本观点分析模型包括BERT模型、方面词抽取网络和情感极性判别网络。其中，所述方面词抽取网络的损失函数为最大似然函数loss_asp；所述情感极性判别网络的损失函数为交叉熵损失函数，且在步骤(3)中作特殊标注的非方面词的情感极性输出结果不计入该损失函数loss_sen，具体为：

其中，

为步骤(3)标注的情感极性，/>

为情感极性判别网络输出的结果，j表示第j个情感类别，i表示第i个方面词；所述细粒度文本观点分析模型的损失函数loss为方面词抽取网络的损失函数loss_asp与情感极性判别网络的损失函数loss_sen之和。

本实施例模型训练参数设置如下，学习率设置为5e-5，优化器设置为BertAdam，模型参数初始化方法为xavier_uniform，最大句子长度设置为80；为了避免过拟合，损失函数中加入L2正则项，设置正则项系数λ＝0.01，在全连接网络和分类器网络中加入dropout，概率设置为0.1。将模型进行多轮训练，当损失函数结果不再下降时，将模型保存。

所述BERT模型的输入为预处理后的词序列S，BERT模型每一层的隐藏层输出为H＝[H₁,H₂,…,H_m,…,H_t]；其中，H_m为第m层隐藏层输出，用于方面词抽取；H_t为第t层隐藏层输出，用于情感极性判别。选取BERT模型隐藏层输出时，本实施例选用BERT-base模型，该模型的总层数为t＝12，用于方面词抽取的中间层层数m的取值为9；这种方法既能够使BERT模型更好地抽取文本特征，第m层和第t层之间也能够实现方面词抽取任务向情感极性分析任务的信息传递，使模型能够取得最好的效果。

所述方面词抽取网络由全连接网络和条件随机场组成；所述全连接网络的输入为BERT模型的第m层隐藏层输出H_m，输出为隐藏层输出P，其维度为最大句子长度*3；所述条件随机场的输入为全连接网络隐藏层输出P，输出为每个词的序列标注标签，用于表示方面词位置。

所述情感极性判别网络为由全连接网络和非线性激活函数构成的三元分类器；所述由全连接网络和非线性激活函数构成的三元分类器的输入为BERT模型的第t层隐藏层输出H_t，输出为每一个词的情感极性判断结果。

例如，对句子“Great food but the service was dreadful！”进行细粒度文本观点分析；得到的模型预测结果为方面词“food”的情感极性为正向，方面词“service”对应的情感极性为负向。句子经预处理之后的结果，方面词标注结果，情感极性标注结果以及模型预测结果如表格1所示。

表1：方面词、情感极性标注以及模型预测结果

例句

[CLS]

great

food

but

the

service

was

dreadful

！

[SEP]

方面词标注

O

B

O

B

O

模型预测方面词

O

B

O

B

O

情感极性标注

-

POS

-

NEG

-

模型预测情感极性

NEG

POS

NEG

POS

NEG

Claims

1.一种基于深度多任务学习的细粒度文本观点分析方法，其特征在于，包括如下步骤：

(1)输入文本序列，方面词及对应的情感极性；

(5)将待测文本序列经过步骤(2)预处理得到词序列，输入步骤(4)训练得到的细粒度文本观点分析模型，得到待测文本序列的方面词以及每个词对应的情感极性；当方面词为多个词的组合时，取第一个词的情感极性为整个方面词的情感极性；

所述步骤(4)中所述BERT模型的输入为预处理后的词序列S，BERT模型每一层的隐藏层输出为H＝[H₁,H₂,…,H_m,…,H_t]；其中，H_m为第m层隐藏层输出；H_t为第t层隐藏层输出；

所述方面词抽取网络由全连接网络和条件随机场组成；所述全连接网络的输入为BERT模型的第m层隐藏层输出H_m，输出为隐藏层输出P；隐藏层输出P的维度为最大句子长度*3；所述条件随机场的输入为隐藏层输出P，输出为每个词的序列标注，用于表示方面词位置；

2.根据权利要求1所述基于深度多任务学习的细粒度文本观点分析方法，其特征在于，所述BERT模型为BERT-base模型，模型层数为t＝12，中间层m的取值为9。