CN110765769A - 一种基于子句特征的实体属性依赖情感分析方法 - Google Patents

一种基于子句特征的实体属性依赖情感分析方法 Download PDF

Info

Publication number
CN110765769A
CN110765769A CN201910795234.2A CN201910795234A CN110765769A CN 110765769 A CN110765769 A CN 110765769A CN 201910795234 A CN201910795234 A CN 201910795234A CN 110765769 A CN110765769 A CN 110765769A
Authority
CN
China
Prior art keywords
clause
word
sentence
ith
clauses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910795234.2A
Other languages
English (en)
Other versions
CN110765769B (zh
Inventor
杨尚明
刘勇国
李巧勤
朱俊林
王志华
陆佳鑫
傅翀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910795234.2A priority Critical patent/CN110765769B/zh
Publication of CN110765769A publication Critical patent/CN110765769A/zh
Application granted granted Critical
Publication of CN110765769B publication Critical patent/CN110765769B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明属于自然语言处理领域,涉及文本情感分析,具体为一种基于子句特征的实体属性依赖的情感分析方法,主要包括:1)实现句子级的话语分割,将一个长句切割为多个基础语篇单元EDUs;2)采用ELMo词嵌入模型,实现单词用法的复杂特性以及对单词的多义性建模;3)利用BiLSTM提取子句以及不同子句间的高级特征表示;4)运用多个注意力机制分别实现不同单词以及子句的权重加强。本发明充分考虑不同实体相关的子句信息,通过提取子句特征以及子句间的特征来增强情感分类的准确性,显著提高实体属性依赖的文本情感分析准确率。

Description

一种基于子句特征的实体属性依赖情感分析方法
技术领域
本发明属于自然语言处理领域,涉及文本情感分析,具体为一种基于子句特征的实体属性依赖的情感分析方法。
背景技术
随着Web2.0的出现,社交媒体网站论坛以及各类APP的数量不断增加,互联网上滋生出大量对人物、事件、产品等的评论信息,这些评论信息可以为人们的某些行为提供参考。例如:消费者购物时相比于广告推销往往更倾向于相信其他用户的评论意见;营销人员会通过用户评论意见得到对产品的不良评价,从而改善产品问题来满足消费者的需求等。而人工提取评论的情感表达是非常麻烦和费时的,因此智能分析文本情感状态的技术应运而生,称为情感分析SA(Sentiment Analysis)。
情感分析是自然语言处理领域中一个非常活跃的研究领域,它可以从一组文档中提取情感,其本质就是对带有情感色彩的主观性文本进行分析、处理、归纳和推理。目前文本情感分析研究根据粒度可分为以下三类:①文档级情感分析:此级别的任务是确定文档的总体意见;②句子级情感分析:此级别的任务是确定每个句子的情感极性,句子分为事实信息的客观句和表达观点的主观句,分析过程是评估主观句的情感极性;③实体属性依赖的情感分析: 该级别是情绪分析中的一项细粒度任务,目的是识别目标实体在上下文语境的情绪极性。在这种情况下,首先识别出句子中实体,然后提取特征评估每个实体的情感。
针对实体属性依赖的文本情感分析根据采用的技术主要分为三大类:
①基于词典的实体属性依赖情感分析,该类方法通过构建文本情感词典来计算句子的情绪分数,然后将该情绪与该句子中提到的目标实体联系起来从而确定属性情感分析;基于词典的文本情感分析,其中构建情感词典是关键。Hu等通过WordNet同义词/反义词图扩展已知基础词的情绪从而获得情感词典;详见文献:“S.Moghaddam,M.Ester.Opiniondigger:An unsupervised opinion miner from unstructured product reviews[C].in:Proceedings of the 19th ACM Int.Conf.Inf.Knowl.Manage.,pp.1825-1828,2010.”。
②基于传统机器学习的方法,该类方法使用大量人工设计的特征(如语言学特征、基于情感词典的特征等),结合机器学习算法,如支持向量机算法(Support VectorMachine,SVM) 等,构建有监督的分类或回归模型,进行情感极性分类或情感强度预测。Jiang等抽取了词、标点符号、表情符号、主题标签等上下文特征和情感词典特征作为目标不相关特征,同时根据语法解析树识别句子中与目标相关的表达,抽取目标相关的特征,来构建目标依赖的情感分类模型;详见文献“L.Jiang,Y.Mo,M.Zhou,et al.Target-dependent twitter sentiment classification[C].in:Proceedings of theAssociation for Computational Linguistics:Human LanguageTechnologies.Association for Computational Linguistics,2012,pp.151-160.”。
③基于深度学习的属性情绪识别,近年来,深度学习在该领域得到大量的运用与实践; Tang等将语境分为带目标的左部和带目标的右部,分别使用两个长短时记忆网络(long short-term memory,LSTM)模型对两部分进行建模,然后将两部分的组合目标特定表示用于情感分类;详见文献“D.Tang,B.Qin,T.Liu.Aspect level sentimentclassification with deep memory network[C].in:Proceedings of the2016Conference on Empirical Methods in Natural Language Processing,2016,pp.214-224.”。
然而,上述实体属性依赖的文本情感分析方法中,都存在或多或少的问题,具体如下:
基于词典的方法在进行实体属性依赖的情感分析时,将每个句子的情绪分数与句子中的所有实体属性联系起来,这样无法正确处理包含不同情绪的实体属性的句子;例如:“The food is great and tasty,but the sitting space is too small.”,该句子中有两个实体属性,分别是food 和sitting space,对这两个实体属性的评论情绪分别在前后两个子句,而且评论情绪分别是正面和负面,基于词典的方法不能正确处理;
基于传统机器学习的方法,高度依赖人工抽取特征的质量,在做分类任务时,系统的泛化性和迁移性较差;另外,人工提取特征任务繁琐,耗时较大;
基于深度学习的研究方法存在如下问题:(1)目前研究仍然是从整个句子的角度提取特征,忽略了不同子句对实体依赖的情绪分析影响不同,导致识别精度受影响,目前基于实体属性依赖的文本情绪识别精度不高于80%;(2)为了实现模型特定长度的输入,均采用截断或补零的方式来使句子长度保持一致,但由于评论文本长度可能有较大差别,当句子长度方差过大时会导致大多句子丢失信息或者引入无用的噪声;(3)目前该领域采用词嵌入的方法主要还是采用word2vec,而该词嵌入方法忽略了单词用法中的复杂特性以及单词的多义性问题。
发明内容
本发明的目的在于针对所述的背景技术不足,提供一种基于子句特征的实体属性依赖情感分析方法;通过子句分割技术,将句子分割为不同大小的子句,并提取不同子句以及子句之间的特征,最终融合注意力机制实现实体属性依赖的情感分类;本发明能够有效弥补背景技术方案的缺陷。
为实现上述目的,本发明采用的技术方案如下:
一种基于子句特征的实体属性依赖情感分析方法,包括以下步骤:
步骤1:数据预处理
步骤1-1:子句分割:将句子切分为基本语篇单元(elementary discourse units,EDUs),得到子句集合C;
步骤1-2:词嵌入:将子句集合C中的每一个子句分别输入到ELMo词嵌入模型中,得到词嵌入结果为
Figure RE-GDA0002287019410000031
其中,
Figure RE-GDA0002287019410000032
表示第i个子句中第l个单词的嵌入向量;同时,得到实体词嵌入向量为etarget
步骤2:构建并训练分类模型
步骤2-1:BiLSTM特征提取
将子句集合C中的每一个子句对应的嵌入向量输入到BiLSTM模型中提取句子特征,得到最终高级特征为:
Figure RE-GDA0002287019410000033
其中,hci,wl表示第i个子句中第l个单词的高级特征;同时,实体词的高级特征表示为Htarget
步骤2-2:基于实体属性依赖的注意力机制
1)对第i个子句ci的第j个单词设置权重αci,j
Figure RE-GDA0002287019410000034
其中,
Figure RE-GDA0002287019410000035
Wa、ba代表单词注意力机制的权重和偏置;
进而得到第i个子句的高级特征表示为:
其中,
Figure RE-GDA0002287019410000037
最终得到分配注意力后的句子特征向量表示:
2)将
Figure RE-GDA0002287019410000039
重新输入到一个BiLSTM中,得到更抽象的子句特征
Figure RE-GDA0002287019410000041
并对第i个子句设置权重βi
其中,Wc、bc代表子句注意力机制中的权重和偏置;
进而得到最终提取的高级特征为:
Rfinal=β·R
其中,β=(β12,...,βm);
将高级特征Rfinal输入softmax层进行分类,得到分类结果y;
步骤2-3:构建训练集,训练集中数据均采用步骤1进行预处理;设置损失函数,利用反向传播法来计算梯度并更新所有的参数,完成模型参数训练;所述损失函数为:
Figure RE-GDA0002287019410000044
其中,Q为样本总数,gq为真实标签,yq为预测输出结果,λr为L2正则化的系数,θ代表参数集中的某一参数;
步骤3:情感分类
将待分析语句采用步骤1进行预处理后输入步骤2训练完成分类模型,得到分类结果。
本发明的有益效果在于:
本发明提供一种基于子句特征实现实体属性依赖情感分析的有效方法,主要包括:1)实现句子级的话语分割,将一个长句切割为多个基础语篇单元EDUs;2)采用ELMo词嵌入模型,实现单词用法的复杂特性以及对单词的多义性建模;3)利用BiLSTM提取子句以及不同子句间的高级特征表示;4)运用多个注意力机制分别实现不同单词以及子句的权重加强。本发明充分考虑不同实体相关的子句信息,通过提取子句特征以及子句间的特征来增强情感分类的准确性,显著提高实体属性依赖的文本情感分析准确率。
附图说明
图1为本发明基于子句特征的实体属性依赖情感分析方法流程示意图。
图2为本发明实施例中句子注意力权重可视化结果图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细说明。
本实施例提供一种基于子句特征的实体属性依赖情感分析方法,其流程如图1所示,主要分为子句分割模块、词嵌入模块、BiLSTM特征提取模块、子句注意力机制模块以及情感分类五个部分。首先实现句子级的话语分割,将一个长句切割为多个基础语篇单元EDUs;其次采用ELMo实现词嵌入;然后利用BiLSTM提取子句以及不同子句间的高级特征表示;运用多个注意力机制分别实现不同单词以及子句的权重加强;最后通过softmax层实现句子目标实体情感分类。具体过程如下:
步骤1:数据预处理
步骤1-1:子句分割:将句子切分为基本语篇单元(elementary discourse units,EDUs),即将一个给定文本分割成非重叠的部分,EDUs代表着子句或类似子句的单位;子句分割以句子为输入,输出为句子的基本语篇单元边界;将长度(以单词为单位)为n的句子 S=(w1,w2,...,wn)输入到专门用于子句分割的模型,输出为:C=(c1,c2,...,cm),ci=(w1,w2,…,wl),其中,w代表句子及子句中的单词,C代表输出的子句集合,ci代表第i个子句,m表示子句的数量;l表示第i个子句的长度;
步骤1-2:词嵌入:本发明采用ELMo(Embeddings from Language Models)方法实现词嵌入,ELMo是从双向语言模型中训练得到的词嵌入,每一个词语的表征都是整个输入语句的函数,相同的词的词向量并不是一成不变的,会根据上下文环境来调整词向量表征;该模型不仅能够模拟使用词的语法和语义等复杂特性,同时还能考虑相同词在不同语境下的使用变化;模型具体细节如下:
双向语言模型biLM:
给定一个长度为N的单词序列(t1,t2,...,tN),前向语言模型基于(t1,t2,...,tk-1)计算第tk个单词出现的概率,计算公式如下:
Figure RE-GDA0002287019410000051
后向语言模型与前向语言模型相似,不同的是将序列反转,基于(tk+1,tk+2,...,tn)计算tk个单词出现的概率:
Figure RE-GDA0002287019410000052
biLM结合了前向和后向语言模型,其目标函数为最大似然函数,公式如下:
Figure RE-GDA0002287019410000061
其中,Θx表示初始词向量表示过程中的参数,
Figure RE-GDA0002287019410000062
Figure RE-GDA0002287019410000063
分别代表语言模型正向和反向中的网络参数,Θs代表Softmax层的参数;
ELMo:
ELMo是语言模型的biLM运用L层的双向LSTM来计算新词向量;假设输入单词表示为
Figure RE-GDA0002287019410000064
在每一个单词位置k,每一层LSTM上都输出相应的基于上下文的前向单词表示
Figure RE-GDA0002287019410000065
及后向单词表示
Figure RE-GDA0002287019410000066
其中,L代表双向LSTM的层数,顶层的LSTM 输出
Figure RE-GDA0002287019410000067
因此,在本实施例中,对于每一个单词
Figure RE-GDA00022870194100000615
一个拥有L层的biLM可以计算出2L+1个表示,如下:
Figure RE-GDA0002287019410000068
其中,
Figure RE-GDA0002287019410000069
表示单词层,对于每层BiLSTM:
Figure RE-GDA00022870194100000610
则,ELMo最终将多层biLM的输出整合成一个单独向量ELMok
Figure RE-GDA00022870194100000611
其中,Θtask代表整合中的参数集合,
Figure RE-GDA00022870194100000612
表示softmax层第j层biLM训练迭代的权重,标量参数γtask用于缩放ELMo向量、使最终输出向量为对应的向量维度;
本实施例中,将子句集合C中的每一个子句分别输入到ELMo词嵌入模型中,得到词嵌入结果为
Figure RE-GDA00022870194100000613
其中,
Figure RE-GDA00022870194100000614
表示第i个子句中第l个单词的嵌入向量;同时,得到实体词嵌入向量为etarget
步骤2:构建并训练分类模型
步骤2-1:BiLSTM特征提取
双向LSTM同时考虑了过去的特征和未来的特征,过去特征通过前向过程提取,未来特征通过后向过程提取;双向LSTM本质相当于两个LSTM,一个正向输入序列,一个反向输入序列,再将两者的输出结合起来作为最终的结果;
LSTM是一种特殊的循环体结构,其相比单一tanh循环体结构拥有三个特殊的门控单元:输入门、遗忘门以及输出门;LSTM各部分的公式定义如下:
输入值:z=tanh(Wz[ht-1,xt]+bz)
输入门:i=sigmoid(Wi[ht-1,xt]+bi)
遗忘门:f=sigmoid(Wf[ht-1,xt]+bf)
输出门:o=sigmoid(Wo[ht-1,xt]+bo)
新状态:ct=f·ct-1+i·z
输出:ht=o·tanct
其中,xt表示LSTM当前输入,ct-1表示上一时刻的状态,Wz、Wi、Wf、Wo分别代表LSTM中输入值、输入门、遗忘门和输出门的权重,bz、bi、bf、bo分别为LSTM中输入值、输入门、遗忘门和输出门的偏置;正向LSTM的特征输出为
Figure RE-GDA0002287019410000071
反向LSTM的特征输出为
Figure RE-GDA0002287019410000072
BiLSTM 最终的特征输出为
Figure RE-GDA0002287019410000073
本实施例中,将子句集合C中的每一个子句对应的嵌入向量输入到BiLSTM模型中提取句子特征,得到最终高级特征为:
Figure RE-GDA0002287019410000074
其中,表示第i 个子句中第l个单词的高级特征;同时,实体词的高级特征表示为Htarget
步骤2-2:基于实体属性依赖的注意力机制
在每一个句子中,不同单词对不同实体属性的情感分析拥有的信息量不同;同时在包含多个子句的句子中,不同子句所包含的信息量也是不一样的;例如“The food isgreat and tasty, but the sitting space is too small.”,该句子有两个子句,在进行“food”实体属性情感分析时,其信息主要包含在第一个子句“The food is great andtasty”中,而在句子“The food is great and tasty”中,影响“food”实体情感的主要单词集中在“great”和“tasty”中;因此,本发明针对不同实体属性引入了注意力机制,为不同子句的不同单词分配不同权重来提高结果准确度。
1)针对子句ci,基于单词的注意力机制
为了区分子句中不同单词的重要程度,本发明运用基于单词的注意力机制计算不同单词表征的权重向量α,其中,第j个单词表征权重计算公式如下:
Figure RE-GDA0002287019410000076
其中,
Figure RE-GDA0002287019410000077
类似一个分数函数,用一个双层网络结构来计算单词表征在上下文中重要性,其计算公式如下:
Figure RE-GDA0002287019410000081
其中,[,]表示括号内两个向量拼接;Wa、ba代表单词注意力机制的权重和偏置,tanh是非线性激活函数;
本实施例中,将各个子句高级特征以及实体属性高级特征Htarget作为输入,得到第i个子句的高级特征表示计算公式如下:
Figure RE-GDA0002287019410000083
其中,
其他子句类似计算,最终得到分配注意力后的句子特征向量表示:
2)基于子句的注意力机制
Figure RE-GDA0002287019410000086
重新输入到一个BiLSTM中,得到更抽象的子句特征
Figure RE-GDA0002287019410000087
然后运用子句的注意力机制来区分不同子句的重要程度,不同的子句的注意力权重用β表示,其中,第i个子句表征权重计算公式如下:
Figure RE-GDA0002287019410000088
其中,m为子句个数,另外
Figure RE-GDA0002287019410000089
计算公式如下:
Figure RE-GDA00022870194100000810
其中,Wc、bc代表子句注意力机制中的权重和偏置;
则,本发明最终提取的高级特征表示为:
Rfinal=β·R
其中,β=(β12,...,βm);
将高级特征Rfinal输入softmax层进行分类,得到分类结果y;
步骤2-3:构建训练集,训练集中数据均采用步骤1进行预处理;设置损失函数完成模型参数训练;所述损失函数为:
Figure RE-GDA00022870194100000811
其中,gq为真实标签,yq为预测输出结果,λr为L2正则化的系数,θ代表参数集Θ中的某一参数;同时利用反向传播法来计算梯度并更新所有的参数,完成模型训练。
步骤3:情感分类
将待分析语句采用步骤1进行预处理后输入步骤2训练完成分类模型,得到分类结果。
与现有技术相比,本发明提出的技术方案中考虑了句子的子句信息对实体属性依赖的情感识别的影响,实验采用公开数据集SemEval2014 task4提供的关于餐厅和电脑的评论信息,其中识别准确率达到82%,高于背景技术方案的识别精度。另外,为了更好的观察分析实验结果,这里可视化了同一句子不同实体的子句及单词的权重分布图,如图2所示;其中红色区域代表子句,蓝色领域代表单词,颜色越深说明模型中对于相应子句以及单词的权重越大。
以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换;所公开的所有特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以任何方式组合。

Claims (1)

1.一种基于子句特征的实体属性依赖情感分析方法,包括以下步骤:
步骤1:数据预处理
步骤1-1:子句分割:将句子切分为基本语篇单元(elementary discourse units,EDUs),得到子句集合C;
步骤1-2:词嵌入:将子句集合C中的每一个子句分别输入到ELMo词嵌入模型中,得到词嵌入结果为
Figure FDA0002180741110000011
其中,
Figure FDA0002180741110000012
表示第i个子句中第l个单词的嵌入向量;同时,得到实体词嵌入向量为etarget
步骤2:构建并训练分类模型
步骤2-1:BiLSTM特征提取
将子句集合C中的每一个子句对应的嵌入向量输入到BiLSTM模型中提取句子特征,得到最终高级特征为:
Figure FDA0002180741110000013
其中,
Figure FDA0002180741110000014
表示第i个子句中第l个单词的高级特征;同时,实体词的高级特征表示为Htarget
步骤2-2:基于实体属性依赖的注意力机制
1)对第i个子句ci的第j个单词设置权重
Figure FDA0002180741110000015
其中,
Figure FDA0002180741110000017
Wa、ba代表单词注意力机制的权重和偏置;
进而得到第i个子句的高级特征表示为:
Figure FDA0002180741110000018
其中,
Figure FDA0002180741110000019
最终得到分配注意力后的句子特征向量表示:
Figure FDA00021807411100000110
2)将重新输入到BiLSTM模型中,得到子句特征并对第i个子句设置权重βi
Figure FDA00021807411100000113
其中,
Figure FDA00021807411100000114
Wc、bc代表子句注意力机制中的权重和偏置;
进而得到最终提取的高级特征为:
Rfinal=β·R
其中,β=(β12,...,βm);
将高级特征Rfinal输入softmax层进行分类,得到分类结果y;
步骤2-3:构建训练集,训练集中数据均采用步骤1进行预处理;设置损失函数,利用反向传播法来计算梯度并更新所有的参数,完成模型参数训练;所述损失函数为:
Figure FDA0002180741110000021
其中,Q为样本总数,gq为真实标签,yq为预测输出结果,λr为L2正则化的系数,θ代表参数集中的某一参数;
步骤3:情感分类
将待分析语句采用步骤1进行预处理后输入步骤2训练完成分类模型,得到分类结果。
CN201910795234.2A 2019-08-27 2019-08-27 一种基于子句特征的实体属性依赖情感分析方法 Active CN110765769B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910795234.2A CN110765769B (zh) 2019-08-27 2019-08-27 一种基于子句特征的实体属性依赖情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910795234.2A CN110765769B (zh) 2019-08-27 2019-08-27 一种基于子句特征的实体属性依赖情感分析方法

Publications (2)

Publication Number Publication Date
CN110765769A true CN110765769A (zh) 2020-02-07
CN110765769B CN110765769B (zh) 2023-05-02

Family

ID=69330105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910795234.2A Active CN110765769B (zh) 2019-08-27 2019-08-27 一种基于子句特征的实体属性依赖情感分析方法

Country Status (1)

Country Link
CN (1) CN110765769B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100325A (zh) * 2020-08-28 2020-12-18 广州探迹科技有限公司 一种基于分层门控循环单元的人机对话情感分析方法
CN112199956A (zh) * 2020-11-02 2021-01-08 天津大学 一种基于深度表示学习的实体情感分析方法
CN112347269A (zh) * 2020-11-11 2021-02-09 重庆邮电大学 基于BERT和Att-BiLSTM的论点对识别方法
CN112800184A (zh) * 2021-01-13 2021-05-14 华东师范大学 基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法
CN112926344A (zh) * 2021-03-13 2021-06-08 中国科学院新疆理化技术研究所 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质
CN114282530A (zh) * 2021-12-24 2022-04-05 厦门大学 一种基于语法结构与连接信息触发的复杂句情感分析方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033865A (zh) * 2009-09-25 2011-04-27 日电(中国)有限公司 基于子句关联的文本情感分类系统和方法
CN103631961A (zh) * 2013-12-17 2014-03-12 苏州大学张家港工业技术研究院 一种情感词与评价对象的关系识别方法
CN103995803A (zh) * 2014-04-25 2014-08-20 西北工业大学 一种细粒度文本情感分析方法
CN107862343A (zh) * 2017-11-28 2018-03-30 南京理工大学 基于规则和神经网络的商品评论属性级情感分类方法
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN108388654A (zh) * 2018-03-01 2018-08-10 合肥工业大学 一种基于转折句语义块划分机制的情感分类方法
CN108399158A (zh) * 2018-02-05 2018-08-14 华南理工大学 基于依存树和注意力机制的属性情感分类方法
CN108932227A (zh) * 2018-06-05 2018-12-04 天津大学 一种基于句子结构及上下文的短文本情感值计算方法
CN108984724A (zh) * 2018-07-10 2018-12-11 凯尔博特信息科技(昆山)有限公司 利用高维表示提高特定属性情感分类准确率方法
CN109992779A (zh) * 2019-03-29 2019-07-09 长沙理工大学 一种基于cnn的情感分析方法、装置、设备及存储介质
CN110162636A (zh) * 2019-05-30 2019-08-23 中森云链(成都)科技有限责任公司 基于d-lstm的文本情绪原因识别方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033865A (zh) * 2009-09-25 2011-04-27 日电(中国)有限公司 基于子句关联的文本情感分类系统和方法
CN103631961A (zh) * 2013-12-17 2014-03-12 苏州大学张家港工业技术研究院 一种情感词与评价对象的关系识别方法
CN103995803A (zh) * 2014-04-25 2014-08-20 西北工业大学 一种细粒度文本情感分析方法
CN107862343A (zh) * 2017-11-28 2018-03-30 南京理工大学 基于规则和神经网络的商品评论属性级情感分类方法
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN108399158A (zh) * 2018-02-05 2018-08-14 华南理工大学 基于依存树和注意力机制的属性情感分类方法
CN108388654A (zh) * 2018-03-01 2018-08-10 合肥工业大学 一种基于转折句语义块划分机制的情感分类方法
CN108932227A (zh) * 2018-06-05 2018-12-04 天津大学 一种基于句子结构及上下文的短文本情感值计算方法
CN108984724A (zh) * 2018-07-10 2018-12-11 凯尔博特信息科技(昆山)有限公司 利用高维表示提高特定属性情感分类准确率方法
CN109992779A (zh) * 2019-03-29 2019-07-09 长沙理工大学 一种基于cnn的情感分析方法、装置、设备及存储介质
CN110162636A (zh) * 2019-05-30 2019-08-23 中森云链(成都)科技有限责任公司 基于d-lstm的文本情绪原因识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHANGLI ZHANG 等: ""Sentiment Analysis of Chinese Documents: From Sentence to Document Level"" *
凡子威;张民;李正华;: "基于BiLSTM并结合自注意力机制和句法信息的隐式篇章关系分类" *
王芝辉 等: "\"基于神经网络的文本分类方法研究\"" *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100325A (zh) * 2020-08-28 2020-12-18 广州探迹科技有限公司 一种基于分层门控循环单元的人机对话情感分析方法
CN112199956A (zh) * 2020-11-02 2021-01-08 天津大学 一种基于深度表示学习的实体情感分析方法
CN112347269A (zh) * 2020-11-11 2021-02-09 重庆邮电大学 基于BERT和Att-BiLSTM的论点对识别方法
CN112800184A (zh) * 2021-01-13 2021-05-14 华东师范大学 基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法
CN112800184B (zh) * 2021-01-13 2021-08-06 华东师范大学 基于Target-Aspect-Opinion联合抽取的短文本评论情感分析方法
CN112926344A (zh) * 2021-03-13 2021-06-08 中国科学院新疆理化技术研究所 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质
CN112926344B (zh) * 2021-03-13 2023-11-17 中国科学院新疆理化技术研究所 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质
CN114282530A (zh) * 2021-12-24 2022-04-05 厦门大学 一种基于语法结构与连接信息触发的复杂句情感分析方法
CN114282530B (zh) * 2021-12-24 2024-06-07 厦门大学 一种基于语法结构与连接信息触发的复杂句情感分析方法

Also Published As

Publication number Publication date
CN110765769B (zh) 2023-05-02

Similar Documents

Publication Publication Date Title
CN112001185B (zh) 一种结合中文句法和图卷积神经网络的情感分类方法
CN109933664B (zh) 一种基于情感词嵌入的细粒度情绪分析改进方法
CN112001187B (zh) 一种基于中文句法和图卷积神经网络的情感分类系统
CN108363753B (zh) 评论文本情感分类模型训练与情感分类方法、装置及设备
Zhao et al. Combination of convolutional neural network and gated recurrent unit for aspect-based sentiment analysis
CN110765769B (zh) 一种基于子句特征的实体属性依赖情感分析方法
CN107862087B (zh) 基于大数据和深度学习的情感分析方法、装置和存储介质
CN112001186A (zh) 一种利用图卷积神经网络和中文句法的情感分类方法
CN109977413A (zh) 一种基于改进cnn-lda的情感分析方法
Chang et al. Research on detection methods based on Doc2vec abnormal comments
CN107305539A (zh) 一种基于Word2Vec网络情感新词发现的文本倾向性分析方法
CN109145292B (zh) 释义文本深度匹配模型构建方法与释义文本深度匹配方法
CN111813895B (zh) 一种基于层次注意力机制和门机制的属性级别情感分析方法
CN112597302B (zh) 基于多维评论表示的虚假评论检测方法
CN109726745A (zh) 一种融入描述知识的基于目标的情感分类方法
CN109101490B (zh) 一种基于融合特征表示的事实型隐式情感识别方法和系统
CN112818698B (zh) 一种基于双通道模型的细粒度的用户评论情感分析方法
Niu et al. An Improved Method for Web Text Affective Cognition Computing Based on Knowledge Graph.
CN110750646A (zh) 一种旅店评论文本的属性描述提取方法
Chen et al. Sentiment classification of tourism based on rules and LDA topic model
Jia Sentiment classification of microblog: A framework based on BERT and CNN with attention mechanism
CN113704459A (zh) 一种基于神经网络的在线文本情感分析方法
CN114547303A (zh) 基于Bert-LSTM的文本多特征分类方法及装置
Wang et al. Empirical exploring word-character relationship for chinese sentence representation
CN117291190A (zh) 一种基于情感词典和lda主题模型的用户需求计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant