CN109710761A - 基于注意力增强的双向lstm模型的情感分析方法 - Google Patents

基于注意力增强的双向lstm模型的情感分析方法 Download PDF

Info

Publication number
CN109710761A
CN109710761A CN201811566673.8A CN201811566673A CN109710761A CN 109710761 A CN109710761 A CN 109710761A CN 201811566673 A CN201811566673 A CN 201811566673A CN 109710761 A CN109710761 A CN 109710761A
Authority
CN
China
Prior art keywords
word
model
layer
output
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811566673.8A
Other languages
English (en)
Inventor
曹俐莉
吕学强
曾毅
侯非
程永红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Information Science and Technology University
China National Institute of Standardization
Original Assignee
Beijing Information Science and Technology University
China National Institute of Standardization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University, China National Institute of Standardization filed Critical Beijing Information Science and Technology University
Priority to CN201811566673.8A priority Critical patent/CN109710761A/zh
Publication of CN109710761A publication Critical patent/CN109710761A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及一种基于注意力增强的双向LSTM模型的情感分析方法,所述方法采用注意力机制与双向LSTM模型相结合,使用双向LSTM模型学习文本语义信息,使用注意力机制加强对重点词的关注,所述方法包括:首先对输入的句子利用预训练好词向量进行表示,然后分别经过双向LSTM模型和注意力模型学习表示,将两部分表示后的向量拼接,最终通过分类器完成文本情感分析的工作。本发明使用双向LSTM学习文本的语义信息,使用在词向量上建立的自注意力机制加强对句中情感关键词的关注度,本发明采用的词向量注意力机制与双向LSTM为并行结构,实验表明,本发明提出的模型表现出优越的性能,并在多个指标上超过了已知的最好模型,可以很好地满足实际应用的需要。

Description

基于注意力增强的双向LSTM模型的情感分析方法
技术领域
本发明属于文本处理技术领域,具体涉及一种基于注意力增强的双向LSTM模型的情感分析方法。
背景技术
随着互联网的发展,网民数量在近几年急剧上升,人们在信息交互的过程中产生了大量的对诸如人物、事件、产品等有价值的评论信息。这些信息表达了人们的各种感情色彩和情感倾向性,通过对情感信息的挖掘,可以更好的理解用户行为,从而预测出事件的发展方向或趋势。但随着信息规模的极具膨胀,仅靠人工已经不可能完成情感分析工作,所以使用计算机进行高效准确的情感分析工作有着重要的意义。
目前情感分析技术主要分为3类:基于情感词典的方法、基于特征的方法和基于深度学的方法。基于情感词典的方法主要根据文本中的情感词来判断文本的情感倾向,需要人工构建情感词典,结合情感词典和人工设置规则实现对文本的情感分析。这种方法基于人类语言的表述方式,透过情感词可以反映人的情感倾向,但是没有考虑到上下文的语义信息。基于特征的方法是采用统计学知识,从大量语料中选取特征,使用这些特征对文本进行表示,然后使用决策树、支持向量机(SVM)等机器学习算法进行分类。该方法对经验要求较高,特征的选取直接影响分析结果。基于深度学习的方法,可以分别对词语、句子和篇章进行向量化表示,学习文本的深层语义信息。该方法有强大的特征学习能力,省去了特征选取和规则制定等步骤。常见的深度学习模型有:卷积神经网络(Convolutional NeuralNetworks,CNN)、循环神经网络(Recurrent Neural Networks,RNN)等。
自2006年Hinton等提出深度学习后,深度学习在计算机视觉方面取得了巨大的成就,越来越多的学者也开始将深度学习应用到自然语言处理领域。由于短文本包含的信息量较少,同时传统方法不能发现文本中的深层语义信息,所以深度学习成为情感分析研究的主流方法。
基于深度学习的情感分析通常是使用神经网络将文本表示成一定长度的向量,所以基于深度学习的情感分析可以理解为自动学习文本编码然后分类的过程。现阶段基于深度学习的情感分析是以发掘文本语义信息为主的,但是在情感分析工作中,句中每个词对于整体情感倾向的影响是不同的,尤其是一些情感词,这些词语往往能够直接反映出人情感倾向。现有技术方案虽然使用了注意力机制学习权重分布,但其是在双向LSTM编码的基础上进行的,没有直接从文本中挖掘重点信息。在基于深度学习的情感分析工作中,传统的注意力机制主要以串行的方式作为其他模型的下一层,用于学习其他神经网络模型输出的权重分布。现有技术的情感分析结果差强人意,亟待改善。
发明内容
针对上述现有技术中存在的问题,本发明的目的在于提供一种可避免出现上述技术缺陷的基于注意力增强的双向LSTM模型的情感分析方法。
为了实现上述发明目的,本发明提供的技术方案如下:
一种基于注意力增强的双向LSTM模型的情感分析方法,采用注意力增强的双向LSTM模型进行文本情感分析。
进一步地,所述方法采用注意力机制与双向LSTM模型相结合,使用双向LSTM模型学习文本语义信息,使用注意力机制加强对重点词的关注。
进一步地,所述方法包括:首先对输入的句子利用预训练好词向量进行表示,然后分别经过双向LSTM模型和注意力模型学习表示,将两部分表示后的向量拼接,最终通过分类器完成文本情感分析的工作。
进一步地,所述注意力增强的双向LSTM模型的结构包括:词语表示层、语义学习层、重点词关注层和分类层,词语表示层的输出分别作为语义学习层和重点词关注层的输入,分类层将语义学习层和重点词关注层的结果连接作为输入。
进一步地,词语表示层在相关语料上预训练出一个RN×d规模的词典,N表示词典中词的个数,d表示词向量的维度;在进行词语表示时,用xt表示文本中的第t个词,xt∈Rd;若文本长度为T,则输入文本表示为:
S=[x1;x2;...;xT]∈RT×d
进一步地,采用双向LSTM模型对句子的语义信息进行编码;双向LSTM由正反两个LSTM模型组成,xt为t时刻LSTM单元的输入数据,ht是t时刻输出,C是不同时刻记忆单元的值;LSTM的遗忘门ft决定记忆信息的通过量,遗忘门将xt和上一时刻输出ht-1作为输入,输出值在0和1之间,值用来描述每个部分通过量的多少;ft的计算公式为:
ft=σ(Wf[ht-1,xt]+bf)
式中σ为sigmoid函数,Wf是遗忘门权重,bf为遗忘门偏置;
LSTM的输入门it控制当前的输入数据对记忆单元状态的影响,为要被添加到记忆单元的候选值;it的更新公式分别为:
it=σ(Wi[ht-1,xt]+bi)
Wi为输入门权重,bi是输入门偏置,tanh为双曲正切函数,Wc为更新后候选值权重,bc为更新候选值偏置。
进一步地,接下来更新记忆单元的状态,由状态Ct-1至Ct状态,原来状态Ct-1根据遗忘门的值丢弃要屏蔽的信息,根据输入门的值添加新的信息;Ct更新公式为:
输出门ot控制输出信息,该门通过xt和上一时刻输出决定从当前状态中输出的信息量,状态Ct通过tanh函数得到区间在-1和1的值,该值乘以ot作为本时刻的输出值;ot和ht的公式分别为:
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
式中Wo为更新输出值的权重,bo是更新输出值偏执,ht为最终输出值;
连接正反两个方向的LSTM模型输出向量作为t时刻双向LSTM的输出Bt
对每个双向LSTM单元的输出做和取平均作为语义学习层输出,公式为:
进一步地,采用注意力机制学习句子中不同词的权重分布,注意力机制自动从所给数据中学习权重分布:
vt=tanh(Wxt+b)
其中at表示第t个词对于当前文本的重要程度,vtA作为一种评分制度由模型从语料中自动学习,A、W均为权重矩阵,b为偏置;得到每个词的权重后,假设句中词数为T,将词向量按权重求和作为重点词关注层的输出:
进一步地,分类层将语义学习层和重点词关注层的结果连接作为输入:
inputclassify=[outputsema,outputatt]
输出每类的概率为pc
V=wclassifyinputclassify+bclassify
wclassify为L×C的权重矩阵,L为输入向量的维度,C为类数,bclassify为分类层的偏置向量。
进一步地,在得到预测的概率分布后,采用交叉熵损失函数来衡量真实分布和预测分布之间的差距,利用反向传播对模型中的参数进行更新。
本发明提供的基于注意力增强的双向LSTM模型的情感分析方法,使用双向LSTM学习文本的语义信息,使用在词向量上建立的自注意力机制加强对句中情感关键词的关注度,本发明采用的词向量注意力机制与双向LSTM为并行结构,实验表明,本发明提出的模型表现出优越的性能,并在包括正确率、召回率、F1值、准确率等的多个指标上超过了已知的最好模型,可以很好地满足实际应用的需要。
附图说明
图1为本发明的注意力增强的双向LSTM模型的整体结构图;
图2为LSTM的基本结构图;
图3为分词后语料句子长度分布图;
图4为注意力分布图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本发明做进一步说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于注意力增强的双向LSTM模型的情感分析方法,采用注意力机制与双向LSTM模型相结合的方式,使用双向LSTM模型学习文本语义信息,使用注意力机制加强对重点词的关注,首先对输入的句子利用预训练好词向量进行表示,然后分别经过双向LSTM模型和注意力模型学习表示,将两部分表示后的向量拼接,最终通过分类器完成文本情感分析的工作。词向量注意力增强的双向LSTM模型的整体结构如图1所示。
注意力增强的双向LSTM模型的结构包括:词语表示层、语义学习层、重点词关注层和分类层,分类层将语义学习层和重点词关注层的结果连接作为输入。
1)词语表示层:
词作为该模型处理的基本单元,第一步是对词进行符号化表示。与传统的表示方法不同,本发明使用连续的稠密向量作为模型的输入。Word2vec模型被提出后,词向量可以在低维空间中更好的学习词语蕴含语义信息。词语表示层会在相关语料上预训练出一个RN ×d规模的词典,N表示词典中词的个数,d表示词向量的维度。在进行词语表示时,用xt表示文本中的第t个词,xt∈Rd。若文本长度为T,则输入文本表示为:
S=[x1;x2;...;xT]∈RT×d
词语表示层的输出分别作为语义学习层和重点词关注层的输入。
2)语义学习层:
自然语言的词语之间存在时序关系,为了让模型可以学习词语间的语义依赖关系,本发明采用双向LSTM模型对句子的语义信息进行编码。双向LSTM由正反两个LSTM模型组成,长短期记忆网络(Long Short-Term Memory,LSTM)是循环神经网络的一种,它有较强的长距离语义捕获能力,图2是LSTM的基本结构。
xt为t时刻LSTM单元的输入数据,ht是t时刻输出,C是不同时刻记忆单元的值。LSTM主要有三个门结构控制模型中信息的加工。遗忘门ft决定记忆信息的通过量,该门将xt和上一时刻输出ht-1作为输入,输出值在0和1之间,值用来描述每个部分通过量的多少。ft的计算公式为:
ft=σ(Wf[ht-1,xt]+bf)
式中σ为sigmoid函数,Wf是遗忘门权重,bf为遗忘门偏置。输入门it控制当前的输入数据对记忆单元状态的影响,为要被添加到记忆单元的候选值。it的更新公式分别为:
Wi为输入门权重,bi是输入门偏置,tanh为双曲正切函数,Wc为更新后候选值权重,bc为更新候选值偏置。接下来更新记忆单元的状态,由状态Ct-1至Ct状态,原来状态Cy-1根据遗忘门的值丢弃要屏蔽的信息,根据输入门的值添加新的信息。Ct更新公式为:
输出门ot控制输出信息,该门通过xt和上一时刻输出决定从当前状态中输出的信息量,状态Ct通过tanh函数得到区间在-1和1的值,该值乘以ot作为本时刻的输出值。ot和ht的公式分别为:
ot=σ(Wo[ht-1,xt]+bo),
ht=ot*tanh(Ct);
式中Wo为更新输出值的权重,bo是更新输出值偏执,ht为最终输出值。
传统的LSTM模型能学习到文本中的正向语义信息,但忽略了未来的上下文信息,因此本发明使用双向LSTM模型增加对文本逆向语义的学习。连接正反两个方向的LSTM模型输出向量作为t时刻双向LSTM的输出Bt
对每个双向LSTM单元的输出做和取平均作为语义学习层输出,公式为:
3)重点词关注层:
在句子级情感分析中,由于句子中包含词数较少,也就难以获取很多的语义信息。通过对语料的分析,见表1,在句子中的情感词(如:喜欢、失望等)往往更能体现用户的情感倾向。为了加强这些情感词在分类时的作用,本发明采用注意力机制学习句子中不同词的权重分布。
表1 重点词分析
注意力机制最早在计算机视觉领域提出来的,模仿人类的注意力机制,给图像不同的局部赋予不同的权重。后来注意力机制被应用到机器翻译,这也是注意力机制在自然语言处理领域的首次应用。但是机器翻译中的注意力机制是将前一时刻输出的隐含状态与当前时刻输入的隐含状态进行对齐的模式,而在情感分析任务中使用对当前输入自适应加权的自注意力机制(Self-attention)更合适。也有人把自注意力模型应用到方面级(aspect-level)情感分析任务上,将自注意力机制与LSTM结合在一起,通过自注意力机制去获取对不同方面更重要的上下文信息,来解决某个给定的方面情感分类的问题。自注意力机制通常也不会使用其他额外的信息,它会自动从所给数据中学习权重分布:
vt=tanh(Wxt+b),
其中at表示第t个词对于当前文本的重要程度,vtA作为一种评分制度由模型从语料中自动学习,A、W均为权重矩阵,b为偏置。得到每个词的权重后,假设句中词数为T,将词向量按权重求和作为重点词关注层的输出:
4)分类层:
文本情感分析本质上是一个分类任务,所以模型的最后一层是分类层,分类层将语义学习层和重点词关注层的结果连接作为输入:
inputclassify=[outputsema,outputatt]
输出每类的概率为pc
V=wclassifyinputclassify+bclassify
wclassify为L×C的权重矩阵,L为输入向量的维度,C为类数,bclassify为分类层的偏置向量。在得到预测的概率分布后,本发明采用交叉熵损失函数来衡量真实分布和预测分布之间的差距,从而利用反向传播对模型中的参数进行更新。
实验与分析:
(1)实验数据
本发明的实验数据为NLPCC2014情感分析(NLPCC-SCDL)评测任务中文数据集,该数据集中共收集12500条中立、负面均衡的网购商品评论。从语料随机选取中立、负面数据1250条作为测试数据(共2500条),其余作为训练数据。实验语料采用Jieba分词工具进行分词,分词后句子长的分布如图3所示。
本发明选用维基百科的中文语料作为预训练词向量的语料库,因为中文维基百科语料中含有大量的繁体字,所以需要先对语料进行繁简转换,再使用Jieba进行分词。本发明利用Google开源的word2vec工具预训练词向量,选择cbow模型,上下文窗口大小设置为5,词向量维度大小设为200,采样值大小设为le-3,其他参数使用模型的默认值。在使用预训练的词向量时采用随机初始化<UNK>来表示未登录词,使用全零初始化<PAD>补齐句子,并在训练神经网络时对词向量进行微调。
(2)评价标准
本实验采用正确率(Precision)、召回率(Recall)、F1值(F1-measure)准确率(Accuracy)作为评价标准。
TP:正确分类中的中立条数
FP:错误分类中的中立条数
TN:正确分类中的负面条数
FN:错误分类中的负面条数
(3)实验对比模型
NBOW:Mikolov提出的神经网络词袋模型,该模型将句中的词向量的平均值作为句子表示,在文本分类任务中的效率很高。
CNN:基于kim等人提出的CNN分类模型,使用卷积核大小为1、2、3分别提取文本特征,经过最大池化后的使用softmax进行情感分类。
CNN+SVM:Cao等人提出的使用CNN提取文本特征,使用迁移学习的思想,利用SVM进行文本分类,该模型在NLPCC-SCDL任务上取得了最好的效果。
CNN+EMB_ATT:冯兴杰等人提出的基于词向量注意力机制的卷积神经网络模型。LSTM:使用LSTM进行语义学习,将每个输入对应的输出取平均作为文本表示。LSTM+ATT:使用LSTM进行语义学习,使用自注意力机制学习LSTM的输出,最后按权重做和作为句子的表示。
BiLSTM:使用双向LSTM学习文本语义,将每个输入对应的输出取平均作为文本表示。
BiLSTM+ATT:使用双向LSTM进行语义学习,使用自注意力机制学习双向LSTM的输出,最后按权重做和作为句子的表示。
BiLSTM+EM_ATT:本发明提出的注意力增强的双向LSTM模型。
(4)实验参数
因为模型输入需要一定的长度限制,根据4.1节中的语料句子的长度分布,将模型输入文本的最大长度限制在100个词,超出100个词的句子截取前100个词,不足的用<PAD>补齐。LSTM模型和自注意力机制的隐藏层设置为200。每轮参数更新的学习率衰减为上轮学习率的0.8倍。当准确率在5轮内没有超过当前最高的准确率时,模型提前终止学习。模型中使用的主要超参数及参数值如表2。
表2 模型中的参数设置
(5)实验结果及分析
本实验在服务器上进行,服务器CPU为2颗英特尔至强(R)处理器E5-2603v4,GPU为NVIDIA Tesla K40M。在训练阶段,将训练数据分为5份做交叉验证,最终实验结果取5次实验的平均值。实验结果如表3。
表3 实验结果
从表中可以看出,本发明提出的BiLSTM+EMB_ATT模型在除中立准确率、负面召回率两个指标上均取得最好的结果。因为自然语言存在时序性的特点,LSTM模型中的记忆单元有效记录了文本时序信息,本发明采用双向LSTM结构学习文本的语义信息,为模型中增加了逆向文本的语义信息,加强了模型对文本上下文的语义学习能力。但LSTM模型只是理论上可以持续记忆文本信息,在实际效果上看LSTM依然存在着不足,而自注意力机制在情感分析的任务需求上,可以通过学习文本规律,以分配不同词语相应权重的方式自动捕获影响文本情感倾向重要信息,为了便于观察文本中的注意力分布,本发明将权重输出,如图4。所以可以使用注意力机制作为辅助的方式从文本中得到更多的信息。通过在BiLSTM模型上加入基于词向量的注意力机制,结果得到了提升,验证了可以使用注意力机制加强模型直接从词向量中学习文本信息的想法。
另外,根据实验结果还可以得出结论:(1)CNN和CNN+SVM的结果说明了在该实验语料上,使用SVM代替softmax分类器的方式并不能提高结果,因为softmax分类会使用一层全链接网络对特征进行学习,在最小化损失学习后,softmax可以让概率分布更接近标准结果一些。(2)在LSTM模型和BiLSTM模型上直接加上注意力机制的结构训练用时更短,说明了注意力机制虽然增加了模型的规模,但是其关注关键信息的特性使得模型的收敛速度更快。(3)在LSTM和BiLSTM模型上增加注意力机制并没有达到相同的效果,这说明盲目加入注意力机制有时不会使结果更好,相反,在CNN上加入基于词向量的注意力机制的CNN+EMB_ATT模型和BiLSTM上加入基于词向量的注意力机制的BiLSTM+EMV_ATT模型的效果都得到了提高,这也验证了正确的加入注意力机制有助于模型效果的提升。
本发明提出了一种注意力增强的双向LSTM模型,使用双向LSTM学习文本的语义信息,使用在词向量上建立的自注意力机制加强对句中情感关键词的关注度。与传统双向LSTM模型加注意力机制不同,本发明采用的词向量注意力机制与双向LSTM为并行结构,实验表明,本发明提出的模型表现出优越的性能,并在多个指标(包括正确率、召回率、F1值、准确率)上超过了已知的最好模型。
以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于注意力增强的双向LSTM模型的情感分析方法,其特征在于,采用注意力增强的双向LSTM模型进行文本情感分析。
2.根据权利要求1所述的情感分析方法,其特征在于,所述方法采用注意力机制与双向LSTM模型相结合,使用双向LSTM模型学习文本语义信息,使用注意力机制加强对重点词的关注。
3.根据权利要求1所述的情感分析方法,其特征在于,所述方法包括:首先对输入的句子利用预训练好词向量进行表示,然后分别经过双向LSTM模型和注意力模型学习表示,将两部分表示后的向量拼接,最终通过分类器完成文本情感分析的工作。
4.根据权利要求1所述的情感分析方法,其特征在于,所述注意力增强的双向LSTM模型的结构包括:词语表示层、语义学习层、重点词关注层和分类层,词语表示层的输出分别作为语义学习层和重点词关注层的输入,分类层将语义学习层和重点词关注层的结果连接作为输入。
5.根据权利要求1所述的情感分析方法,其特征在于,词语表示层在相关语料上预训练出一个RN×d规模的词典,N表示词典中词的个数,d表示词向量的维度;在进行词语表示时,用xt表示文本中的第t个词,xt∈Rd;若文本长度为T,则输入文本表示为:
S=[x1;x2;...;xT]∈RT×d
6.根据权利要求1所述的情感分析方法,其特征在于,采用双向LSTM模型对句子的语义信息进行编码;双向LSTM由正反两个LSTM模型组成,xt为t时刻LSTM单元的输入数据,ht是t时刻输出,C是不同时刻记忆单元的值;LSTM的遗忘门ft决定记忆信息的通过量,遗忘门将xt和上一时刻输出ht-1作为输入,输出值在0和1之间,值用来描述每个部分通过量的多少;ft的计算公式为:
ft=σ(Wf[ht-1,xt]+bf)
式中σ为sigmoid函数,Wf是遗忘门权重,bf为遗忘门偏置;
LSTM的输入门it控制当前的输入数据对记忆单元状态的影响,为要被添加到记忆单元的候选值;it的更新公式分别为:
it=σ(Wi[ht-1,xt]+bi)
Wi为输入门权重,bi是输入门偏置,tanh为双曲正切函数,WC为更新后候选值权重,bC为更新候选值偏置。
7.根据权利要求1所述的情感分析方法,其特征在于,接下来更新记忆单元的状态,由状态Ct-1至Ct状态,原来状态Ct-1根据遗忘门的值丢弃要屏蔽的信息,根据输入门的值添加新的信息;Ct更新公式为:
输出门ot控制输出信息,该门通过xt和上一时刻输出决定从当前状态中输出的信息量,状态Ct通过tanh函数得到区间在-1和1的值,该值乘以ot作为本时刻的输出值;ot和ht的公式分别为:
ot=σ(Wo[ht-1,xt]+bo)
ht=ot*tanh(Ct)
式中Wo为更新输出值的权重,bo是更新输出值偏执,ht为最终输出值;
连接正反两个方向的LSTM模型输出向量作为t时刻双向LSTM的输出Bt
对每个双向LSTM单元的输出做和取平均作为语义学习层输出,公式为:
8.根据权利要求1所述的情感分析方法,其特征在于,采用注意力机制学习句子中不同词的权重分布,注意力机制自动从所给数据中学习权重分布:
vt=tanh(Wxt+b)
其中at表示第t个词对于当前文本的重要程度,vtA作为一种评分制度由模型从语料中自动学习,A、W均为权重矩阵,b为偏置;得到每个词的权重后,假设句中词数为T,将词向量按权重求和作为重点词关注层的输出:
9.根据权利要求1所述的情感分析方法,其特征在于,分类层将语义学习层和重点词关注层的结果连接作为输入:
inputclassify=[outputsema,outputatt]
输出每类的概率为pc
V=wclassifyinputclassify+bclassify
for c in(1,2..C)
wclassify为L×C的权重矩阵,L为输入向量的维度,C为类数,bclassify为分类层的偏置向量。
10.根据权利要求1所述的情感分析方法,其特征在于,在得到预测的概率分布后,采用交叉熵损失函数来衡量真实分布和预测分布之间的差距,利用反向传播对模型中的参数进行更新。
CN201811566673.8A 2018-12-21 2018-12-21 基于注意力增强的双向lstm模型的情感分析方法 Pending CN109710761A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811566673.8A CN109710761A (zh) 2018-12-21 2018-12-21 基于注意力增强的双向lstm模型的情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811566673.8A CN109710761A (zh) 2018-12-21 2018-12-21 基于注意力增强的双向lstm模型的情感分析方法

Publications (1)

Publication Number Publication Date
CN109710761A true CN109710761A (zh) 2019-05-03

Family

ID=66257052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811566673.8A Pending CN109710761A (zh) 2018-12-21 2018-12-21 基于注意力增强的双向lstm模型的情感分析方法

Country Status (1)

Country Link
CN (1) CN109710761A (zh)

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059192A (zh) * 2019-05-15 2019-07-26 北京信息科技大学 基于五笔码的字符级文本分类方法
CN110175237A (zh) * 2019-05-14 2019-08-27 华东师范大学 一种面向多类别的二次情感分类方法
CN110263321A (zh) * 2019-05-06 2019-09-20 成都数联铭品科技有限公司 一种情感词典构建方法及系统
CN110263328A (zh) * 2019-05-22 2019-09-20 平安国际智慧城市科技股份有限公司 一种学科能力类型标注方法、装置、存储介质及终端设备
CN110287320A (zh) * 2019-06-25 2019-09-27 北京工业大学 一种结合注意力机制的深度学习多分类情感分析模型
CN110289096A (zh) * 2019-06-28 2019-09-27 电子科技大学 一种基于深度学习的icu院内死亡率预测方法
CN110287323A (zh) * 2019-06-27 2019-09-27 成都冰鉴信息科技有限公司 一种面向目标的情感分类方法
CN110309306A (zh) * 2019-06-19 2019-10-08 淮阴工学院 一种基于wsd层级记忆网络的文档建模分类方法
CN110347831A (zh) * 2019-06-28 2019-10-18 西安理工大学 基于自注意力机制的情感分类方法
CN110400579A (zh) * 2019-06-25 2019-11-01 华东理工大学 基于方向自注意力机制和双向长短时网络的语音情感识别
CN110457480A (zh) * 2019-08-16 2019-11-15 国网天津市电力公司 基于交互式注意力机制的细粒度情感分类模型的构建方法
CN110472042A (zh) * 2019-07-02 2019-11-19 桂林电子科技大学 一种细粒度情感分类方法
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
CN110609898A (zh) * 2019-08-19 2019-12-24 中国科学院重庆绿色智能技术研究院 一种面向不平衡文本数据的自分类方法
CN110728298A (zh) * 2019-09-05 2020-01-24 北京三快在线科技有限公司 多任务分类模型训练方法、多任务分类方法及装置
CN110879938A (zh) * 2019-11-14 2020-03-13 中国联合网络通信集团有限公司 文本情感分类方法、装置、设备和存储介质
CN110929034A (zh) * 2019-11-26 2020-03-27 北京工商大学 一种基于改进lstm的商品评论细粒度情感分类方法
CN110991190A (zh) * 2019-11-29 2020-04-10 华中科技大学 文档主题增强的自注意力网络、文本情绪预测系统和方法
CN111008529A (zh) * 2019-07-24 2020-04-14 贵州大学 一种基于神经网络的中文关系抽取方法
CN111160037A (zh) * 2019-12-02 2020-05-15 广州大学 一种支持跨语言迁移的细粒度情感分析方法
CN111191459A (zh) * 2019-12-25 2020-05-22 医渡云(北京)技术有限公司 一种文本处理方法、装置、可读介质及电子设备
CN111221966A (zh) * 2019-12-31 2020-06-02 北京科东电力控制系统有限责任公司 一种文本语义关系提取方法及系统
CN111274398A (zh) * 2020-01-20 2020-06-12 福州大学 一种方面级用户产品评论情感分析方法及系统
CN111291187A (zh) * 2020-01-22 2020-06-16 北京芯盾时代科技有限公司 一种情感分析方法、装置、电子设备及存储介质
CN111339772A (zh) * 2020-03-16 2020-06-26 大连外国语大学 俄语文本情感分析方法、电子设备和存储介质
CN111400494A (zh) * 2020-03-16 2020-07-10 江南大学 一种基于GCN-Attention的情感分析方法
CN112115243A (zh) * 2020-08-11 2020-12-22 南京理工大学 通过对时序时间相关性建模的会话表示学习方法
CN112163414A (zh) * 2020-08-27 2021-01-01 同济大学 一种基于Word2Vec、LSTM和注意力机制的中文歌词生成方法
CN112199503A (zh) * 2020-10-28 2021-01-08 南京信息工程大学 一种基于特征增强的非平衡Bi-LSTM的中文文本分类方法
CN112214601A (zh) * 2020-10-21 2021-01-12 厦门市美亚柏科信息股份有限公司 一种社交短文本情感分类方法、装置及存储介质
CN112307760A (zh) * 2020-11-13 2021-02-02 成都知原点科技有限公司 基于深度学习的财务报告情感分析方法、装置及终端
CN112434161A (zh) * 2020-11-24 2021-03-02 哈尔滨工程大学 一种采用双向长短期记忆网络的方面级情感分析方法
CN112667816A (zh) * 2020-12-31 2021-04-16 华中师范大学 一种基于深度学习的方面级情感分析方法及系统
CN112784041A (zh) * 2021-01-06 2021-05-11 河海大学 一种中文短文本情感倾向性分析方法
CN112883724A (zh) * 2021-02-03 2021-06-01 虎博网络技术(上海)有限公司 文本数据增强处理方法、装置、电子设备和可读存储介质
CN113111148A (zh) * 2021-03-29 2021-07-13 北京工业大学 面向微博“树洞”留言文本的情感分析方法
CN113361617A (zh) * 2021-06-15 2021-09-07 西南交通大学 基于多元注意力修正的方面级情感分析建模方法
CN113435211A (zh) * 2021-07-19 2021-09-24 北京理工大学 一种结合外部知识的文本隐式情感分析方法
CN113868425A (zh) * 2021-10-20 2021-12-31 西安邮电大学 一种方面级情感分类方法
CN113987188A (zh) * 2021-11-10 2022-01-28 重庆邮电大学 一种短文本分类方法、装置及电子设备
CN114648031A (zh) * 2022-03-30 2022-06-21 重庆邮电大学 基于双向lstm和多头注意力机制的文本方面级情感识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160350653A1 (en) * 2015-06-01 2016-12-01 Salesforce.Com, Inc. Dynamic Memory Network
CN107220231A (zh) * 2016-03-22 2017-09-29 索尼公司 用于自然语言处理的电子设备和方法以及训练方法
CN108170681A (zh) * 2018-01-15 2018-06-15 中南大学 文本情感分析方法、系统及计算机可读存储介质
US20180268287A1 (en) * 2017-03-15 2018-09-20 Salesforce.Com, Inc. Probability-Based Guider

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160350653A1 (en) * 2015-06-01 2016-12-01 Salesforce.Com, Inc. Dynamic Memory Network
CN107220231A (zh) * 2016-03-22 2017-09-29 索尼公司 用于自然语言处理的电子设备和方法以及训练方法
US20180268287A1 (en) * 2017-03-15 2018-09-20 Salesforce.Com, Inc. Probability-Based Guider
CN108170681A (zh) * 2018-01-15 2018-06-15 中南大学 文本情感分析方法、系统及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张仰森等: "基于双重注意力模型的微博情感分析方法", 《清华大学学报(自然科学版)》 *
郑国伟等: "基于LSTM的金融新闻倾向性", 《计算机工程与设计》 *

Cited By (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263321A (zh) * 2019-05-06 2019-09-20 成都数联铭品科技有限公司 一种情感词典构建方法及系统
CN110175237A (zh) * 2019-05-14 2019-08-27 华东师范大学 一种面向多类别的二次情感分类方法
CN110175237B (zh) * 2019-05-14 2023-02-03 华东师范大学 一种面向多类别的二次情感分类方法
CN110059192A (zh) * 2019-05-15 2019-07-26 北京信息科技大学 基于五笔码的字符级文本分类方法
CN110263328B (zh) * 2019-05-22 2024-01-23 平安国际智慧城市科技股份有限公司 一种学科能力类型标注方法、装置、存储介质及终端设备
CN110263328A (zh) * 2019-05-22 2019-09-20 平安国际智慧城市科技股份有限公司 一种学科能力类型标注方法、装置、存储介质及终端设备
CN110309306A (zh) * 2019-06-19 2019-10-08 淮阴工学院 一种基于wsd层级记忆网络的文档建模分类方法
CN110287320A (zh) * 2019-06-25 2019-09-27 北京工业大学 一种结合注意力机制的深度学习多分类情感分析模型
CN110400579A (zh) * 2019-06-25 2019-11-01 华东理工大学 基于方向自注意力机制和双向长短时网络的语音情感识别
CN110287323A (zh) * 2019-06-27 2019-09-27 成都冰鉴信息科技有限公司 一种面向目标的情感分类方法
CN110289096A (zh) * 2019-06-28 2019-09-27 电子科技大学 一种基于深度学习的icu院内死亡率预测方法
CN110347831A (zh) * 2019-06-28 2019-10-18 西安理工大学 基于自注意力机制的情感分类方法
CN110289096B (zh) * 2019-06-28 2021-12-07 电子科技大学 一种基于深度学习的icu院内死亡率预测方法
CN110472042A (zh) * 2019-07-02 2019-11-19 桂林电子科技大学 一种细粒度情感分类方法
CN110472042B (zh) * 2019-07-02 2021-11-26 桂林电子科技大学 一种细粒度情感分类方法
CN111008529B (zh) * 2019-07-24 2023-07-21 贵州大学 一种基于神经网络的中文关系抽取方法
CN111008529A (zh) * 2019-07-24 2020-04-14 贵州大学 一种基于神经网络的中文关系抽取方法
CN110457480A (zh) * 2019-08-16 2019-11-15 国网天津市电力公司 基于交互式注意力机制的细粒度情感分类模型的构建方法
CN110457480B (zh) * 2019-08-16 2023-07-28 国网天津市电力公司 基于交互式注意力机制的细粒度情感分类模型的构建方法
CN110609898A (zh) * 2019-08-19 2019-12-24 中国科学院重庆绿色智能技术研究院 一种面向不平衡文本数据的自分类方法
CN110609898B (zh) * 2019-08-19 2023-05-05 中国科学院重庆绿色智能技术研究院 一种面向不平衡文本数据的自分类方法
CN110491465A (zh) * 2019-08-20 2019-11-22 山东众阳健康科技集团有限公司 基于深度学习的疾病分类编码方法、系统、设备及介质
CN110728298A (zh) * 2019-09-05 2020-01-24 北京三快在线科技有限公司 多任务分类模型训练方法、多任务分类方法及装置
CN110879938A (zh) * 2019-11-14 2020-03-13 中国联合网络通信集团有限公司 文本情感分类方法、装置、设备和存储介质
CN110929034A (zh) * 2019-11-26 2020-03-27 北京工商大学 一种基于改进lstm的商品评论细粒度情感分类方法
CN110991190A (zh) * 2019-11-29 2020-04-10 华中科技大学 文档主题增强的自注意力网络、文本情绪预测系统和方法
CN111160037A (zh) * 2019-12-02 2020-05-15 广州大学 一种支持跨语言迁移的细粒度情感分析方法
WO2021109671A1 (zh) * 2019-12-02 2021-06-10 广州大学 一种支持跨语言迁移的细粒度情感分析方法
CN111191459A (zh) * 2019-12-25 2020-05-22 医渡云(北京)技术有限公司 一种文本处理方法、装置、可读介质及电子设备
CN111191459B (zh) * 2019-12-25 2023-12-12 医渡云(北京)技术有限公司 一种文本处理方法、装置、可读介质及电子设备
CN111221966A (zh) * 2019-12-31 2020-06-02 北京科东电力控制系统有限责任公司 一种文本语义关系提取方法及系统
CN111274398A (zh) * 2020-01-20 2020-06-12 福州大学 一种方面级用户产品评论情感分析方法及系统
CN111274398B (zh) * 2020-01-20 2022-06-14 福州大学 一种方面级用户产品评论情感分析方法及系统
CN111291187B (zh) * 2020-01-22 2023-08-08 北京芯盾时代科技有限公司 一种情感分析方法、装置、电子设备及存储介质
CN111291187A (zh) * 2020-01-22 2020-06-16 北京芯盾时代科技有限公司 一种情感分析方法、装置、电子设备及存储介质
CN111400494A (zh) * 2020-03-16 2020-07-10 江南大学 一种基于GCN-Attention的情感分析方法
CN111339772B (zh) * 2020-03-16 2023-11-14 大连外国语大学 俄语文本情感分析方法、电子设备和存储介质
CN111339772A (zh) * 2020-03-16 2020-06-26 大连外国语大学 俄语文本情感分析方法、电子设备和存储介质
CN111400494B (zh) * 2020-03-16 2023-07-07 江南大学 一种基于GCN-Attention的情感分析方法
CN112115243B (zh) * 2020-08-11 2023-06-16 南京理工大学 通过对时序时间相关性建模的会话表示学习方法
CN112115243A (zh) * 2020-08-11 2020-12-22 南京理工大学 通过对时序时间相关性建模的会话表示学习方法
CN112163414A (zh) * 2020-08-27 2021-01-01 同济大学 一种基于Word2Vec、LSTM和注意力机制的中文歌词生成方法
CN112163414B (zh) * 2020-08-27 2022-09-20 同济大学 一种基于Word2Vec、LSTM和注意力机制的中文歌词生成方法
CN112214601A (zh) * 2020-10-21 2021-01-12 厦门市美亚柏科信息股份有限公司 一种社交短文本情感分类方法、装置及存储介质
CN112214601B (zh) * 2020-10-21 2022-06-10 厦门市美亚柏科信息股份有限公司 一种社交短文本情感分类方法、装置及存储介质
CN112199503A (zh) * 2020-10-28 2021-01-08 南京信息工程大学 一种基于特征增强的非平衡Bi-LSTM的中文文本分类方法
CN112199503B (zh) * 2020-10-28 2023-04-28 南京信息工程大学 一种基于特征增强的非平衡Bi-LSTM的中文文本分类方法
CN112307760A (zh) * 2020-11-13 2021-02-02 成都知原点科技有限公司 基于深度学习的财务报告情感分析方法、装置及终端
CN112434161A (zh) * 2020-11-24 2021-03-02 哈尔滨工程大学 一种采用双向长短期记忆网络的方面级情感分析方法
CN112667816B (zh) * 2020-12-31 2022-07-05 华中师范大学 一种基于深度学习的方面级情感分析方法及系统
CN112667816A (zh) * 2020-12-31 2021-04-16 华中师范大学 一种基于深度学习的方面级情感分析方法及系统
CN112784041B (zh) * 2021-01-06 2022-12-30 河海大学 一种中文短文本情感倾向性分析方法
CN112784041A (zh) * 2021-01-06 2021-05-11 河海大学 一种中文短文本情感倾向性分析方法
CN112883724A (zh) * 2021-02-03 2021-06-01 虎博网络技术(上海)有限公司 文本数据增强处理方法、装置、电子设备和可读存储介质
CN113111148A (zh) * 2021-03-29 2021-07-13 北京工业大学 面向微博“树洞”留言文本的情感分析方法
CN113361617A (zh) * 2021-06-15 2021-09-07 西南交通大学 基于多元注意力修正的方面级情感分析建模方法
CN113435211A (zh) * 2021-07-19 2021-09-24 北京理工大学 一种结合外部知识的文本隐式情感分析方法
CN113868425A (zh) * 2021-10-20 2021-12-31 西安邮电大学 一种方面级情感分类方法
CN113987188B (zh) * 2021-11-10 2022-07-08 重庆邮电大学 一种短文本分类方法、装置及电子设备
CN113987188A (zh) * 2021-11-10 2022-01-28 重庆邮电大学 一种短文本分类方法、装置及电子设备
CN114648031A (zh) * 2022-03-30 2022-06-21 重庆邮电大学 基于双向lstm和多头注意力机制的文本方面级情感识别方法

Similar Documents

Publication Publication Date Title
CN109710761A (zh) 基于注意力增强的双向lstm模型的情感分析方法
CN111858945B (zh) 基于深度学习的评论文本方面级情感分类方法及系统
CN111339255B (zh) 目标情感分析的方法、模型训练方法、介质和设备
CN107656990A (zh) 一种基于字和词两个层面特征信息的文本分类方法
CN110516073A (zh) 一种文本分类方法、装置、设备和介质
CN110502749A (zh) 一种基于双层注意力机制与双向gru的文本关系抽取方法
CN109992780B (zh) 一种基于深度神经网络特定目标情感分类方法
CN110083700A (zh) 一种基于卷积神经网络的企业舆情情感分类方法及系统
CN108460089A (zh) 基于Attention神经网络的多元特征融合中文文本分类方法
CN108595601A (zh) 一种融入Attention机制的长文本情感分析方法
CN110069778A (zh) 中文融入嵌入词位置感知的商品情感分析方法
CN110472042A (zh) 一种细粒度情感分类方法
CN110334781A (zh) 一种基于Res-Gan的零样本学习算法
CN110232123A (zh) 文本的情感分析方法及其装置、计算设备与可读介质
CN107145514A (zh) 基于决策树和svm混合模型的中文句型分类方法
CN112215696A (zh) 基于时序归因分析的个人信用评估与解释方法、装置、设备及存储介质
CN109710760A (zh) 短文本的聚类方法、装置、介质及电子设备
Yu et al. Research and implementation of CNN based on TensorFlow
CN111814453A (zh) 基于BiLSTM-TextCNN的细粒度情感分析方法
CN116579347A (zh) 一种基于动态语义特征融合的评论文本情感分析方法、系统、设备及介质
Tiwari et al. Quantum fuzzy neural network for multimodal sentiment and sarcasm detection
Suddle et al. Metaheuristics based long short term memory optimization for sentiment analysis
CN108268629A (zh) 基于关键词的图像描述方法和装置、设备、介质、程序
Lv et al. Cognitive robotics on 5G networks
Younis et al. A new parallel bat algorithm for musical note recognition.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190503

WD01 Invention patent application deemed withdrawn after publication