CN109933795A - 基于上下文-情感词向量的文本情感分析系统 - Google Patents

基于上下文-情感词向量的文本情感分析系统 Download PDF

Info

Publication number
CN109933795A
CN109933795A CN201910207069.4A CN201910207069A CN109933795A CN 109933795 A CN109933795 A CN 109933795A CN 201910207069 A CN201910207069 A CN 201910207069A CN 109933795 A CN109933795 A CN 109933795A
Authority
CN
China
Prior art keywords
term vector
emotion
context
word
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910207069.4A
Other languages
English (en)
Other versions
CN109933795B (zh
Inventor
金悦媛
饶若楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201910207069.4A priority Critical patent/CN109933795B/zh
Publication of CN109933795A publication Critical patent/CN109933795A/zh
Application granted granted Critical
Publication of CN109933795B publication Critical patent/CN109933795B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

一种基于上下文‑情感词向量的文本情感分析系统,包括:预处理单元、词向量单元、预训练单元、情感细化单元和情感分类器单元,本发明实现了通用语料预训练模型得到的上下文词向量与目标语料情感词向量的结合,可以得到具有多语义和情感信息的上下文‑情感词向量。并用Tree‑LSTM组合上下文‑情感词向量,将句法成分结构信息融入到向量表示中,最后可以得到具有语义、情感和结构特征的句子向量用于情感分类。

Description

基于上下文-情感词向量的文本情感分析系统
技术领域
本发明涉及的是一种语义处理领域的技术,具体是一种基于上下文-情感词向量和Tree-LSTM的文本情感分析系统。
背景技术
基于深度学习的文本情感分析系统通常采用预训练模型(如word2vec,glove)来得到词向量(word embedding),再将词向量输入到下游模型(如RNN,CNN)得到句子向量,最后利用分类器得到句子的情感极性类别(如积极,中立,消极)。上述词向量预训练模型存在以下问题:一方面word2vec只能捕获到静态词向量,即每个单词在不同上下文中的表示是相同的。而现实中单词的语义是与上下文紧密相关的。另一方面word2vec词向量只能表示单词通用的语义,不能捕获到情感极性信息,例如good和bad的情感词性相反,但其词向量很相似。
近年来,ELMO、GPT、BERT等预训练模型可以得到上下文相关的词向量,并依赖于微调(fine-tune)技术来调整模型。对于情感分析任务,这样捕获到的上下文词向量仍会缺乏部分情感信息。
情感词典是一个包含单词及其情感值的词典,以情感词典作为辅助信息细化词向量可以得到具有情感信息的词向量。此方法仅曾被用于调整静态词向量,未被尝试用于上下文词向量。
发明内容
本发明针对现有技术存在的上述不足,提出一种基于上下文-情感词向量的文本情感分析系统。
本发明是通过以下技术方案实现的:
本发明包括:预处理单元、词向量单元、预训练单元、情感细化单元和情感分类器单元,其中:预处理单元通过概率上下文无关文解析(Standford-Parser,PCFG)方法跟据输入句子的单词分析得到句子的句法结构分析树用于对句子分词,并通过字符词典对组成每个单词的字符的转换成字符对应的索引号(ID);词向量单元采用基于字符卷积神经网络和长短时记忆网络的适用于大规模语料的语言模型(CNN-BIG-LSTM),根据组成单词的字符的索引号,通过多个过滤器对字符嵌入卷积得到该单词的上下文无关词向量;预训练单元采用经过通用语料预训练的两层BiLSTM的语言模型,根据上下文无关词向量得到BiLSTM神经元的隐状态,即上下文词向量;情感细化单元通过情感词典调整上下文无关词向量得到情感词向量,并将预训练单元的上下文词向量和情感词向量组合得到上下文-情感词向量;情感分类器单元跟据预处理单元的句法结构分析树构建树状LSTM模型,并根据上下文-情感词向量得到句子的情感分类结果。
所述的字符词典是指一个包含文本单词中所有可能出现的字符,如26个英文字母。字符词典中每个字符对应一个唯一的索引号(ID)。假设词典的大小为|O|。
所述的情感词典中每一行存储单词及其对应的情感值(Valence)和激励值(Arousal),其中情感值的取值范围在1-9之间,值越大表示越积极。
所述的情感词向量是指:通过情感词典的分数值调整上下文词向量,使其与情感值相近的单词的词向量更相似,而远离情感值相反的单词的词向量。
所述的树状LSTM模型兼具LSTM在处理序列数据上的优点且树状结构符合句子语法,可以捕捉到短语信息。
本发明涉及一种根据上述系统的上下文-情感词向量和Tree-LSTM的文本情感分类方法,通过对语言模型进行通用语料预训练再用于对输入的句子进行处理得到上下文词向量,再用Standford-Parser解析句子得到句法结构分析树,然后对上下文无关词向量进行情感细化得到情感词向量,并学习权重对上下文词向量和情感词向量的线性组合,进而得到上下文-情感词向量以联合表示单词的语义和情感,再将上下文-情感词向量输入Tree-LSTM中,根据句法结构分析树组合单词得到句子的向量表示,最后通过softmax分类后得到输入的句子的情感分类。
所述的语言模型为CNN-BIG-LSTM,该模型根据输入的句子输出其概率分布,即给定一个长度为n的句子,语言模型建模关于整个句子在通用语料中出现的概率分布P(w1,w2,…wn)。
所述的通用语料预训练是指:将通用语料(如维基百科,百度百科,新闻等无标签文本)输入到预处理单元,得到单词的字符ID表示oi;将字符ID表示oi输入词向量单元,得到单词的上下文无关词向量表示ei;将词向量表示ei输入预训练单元,以语言模型为任务训练两层BiLSTM,用Adam算法优化模型参数,直到收敛。
技术效果
与现有技术相比,本发明实现了通用语料预训练模型得到的上下文词向量与目标语料情感词向量的结合,可以得到具有多语义和情感信息的上下文-情感词向量。并用Tree-LSTM组合上下文-情感词向量,将句法成分结构信息融入到向量表示中,最后可以得到具有语义、情感和结构特征的句子向量用于情感分类。
附图说明
图1为本发明结构流程示意图;
图2为本发明词向量单元CNN-BIG-LSTM模型图;
图3为本发明预训练单元两层biLSTM模型图;
图4为本发明情感分类器单元Tree-LSTM模型图。
具体实施方式
如图1所示,本发明包括:预处理单元、词向量单元、预训练单元、情感细化单元和情感分类器单元,其中:预处理单元通过概率上下文无关文解析(Standford-Parser,PCFG)方法跟据输入句子的单词分析得到句子的句法结构分析树用于对句子分词,并通过字符词典对组成每个单词的字符的转换成字符对应的索引号(ID);词向量单元采用基于字符卷积神经网络和长短时记忆网络的适用于大规模语料的语言模型(CNN-BIG-LSTM),根据组成单词的字符的索引号,通过多个过滤器对字符嵌入卷积得到该单词的上下文无关词向量;预训练单元采用经过通用语料预训练的两层BiLSTM的语言模型,根据上下文无关词向量得到BiLSTM神经元的隐状态,即上下文词向量;情感细化单元通过情感词典调整上下文无关词向量得到情感词向量,并将预训练单元的上下文词向量和情感词向量组合得到上下文-情感词向量;情感分类器单元跟据预处理单元的句法结构分析树构建树状LSTM模型,并根据上下文-情感词向量得到句子的情感分类结果。
所述的输入的句子包括:通用语料和任务语料文本,当单词vi由[c1,…,ck]的字符序列组成,字符集为O,则单词vi的字符ID表示第j列表示第j个字符的ID表示,预处理单元将句法结构分析输出到情感分类器单元,将字符ID表示oi输出到词向量单元;所述的预处理单元包括:句法分析模块、字符映射模块其中:句法分析模块用Stanford-Parser处理句子输出句法分析树,字符映射模块利用字符词典将句子的每个单词的字符映射成对应的ID。
所述的词向量单元包括:字符嵌入模块和字符CNN模块,其中:字符嵌入模块利用字符嵌入矩阵Q处理字符ID,输出单词字符嵌入表示。字符CNN模块与字符嵌入相连并输出单词的上下文无关向量。
如图2所示,所述的词向量单元采用CNN-BIG-LSTM模型得到每个单词的上下文无关词向量:当句子s=[v1,…vi…,vm]的每个单词vi(i=1,…,m)经过预处理单元处理得到的字符ID表示(k表示vi的字符个数),字符嵌入模块中有字符嵌入矩阵Q,当每个字符的嵌入表示维度等于d,那么(|O|为字符字典的大小),则对于给定单词vi,通过查看Q可以得到vi的字符嵌入表示为第j行表示第j个字符的嵌入表示。这里,|O|设置为262,d设置为16。
为了得到词向量,需要对每个单词的字符嵌入使用2048个n元(n-gram)卷积过滤器来提取特征。当一个过滤器fi的大小等于那么卷积得到结果为然后用最大池化提取重要特征,得到特征维度为再用Tanh函数对特征进行非线性变换。最后将每个经过卷积池化的特征连接在一起,经过2个highway层和1个512维的线性投影层,得到每个单词的上下文无关向量表示ei
如图3所示,所述的预训练单元是基于MatthewE.Peters等人提出的ELMO模型,它是一个两层双向BiLSTM,通过大规模通用语料以无监督方式训练两层BiLSTM语言模型。
所述的预训练单元包括:前向LSTM模块、后向LSTM模块和softmax模块,其中:前向LSTM模块处理上下文无关词向量输出前向隐状态,后向LSTM模块处理上下文无关词向量输出后向隐状态,softmax模块与前向LSTM模块和后向LSTM模块相连输出单词的概率分布。
所述的预训练单元依次进行通用语料预训练和获取目标语料上下文向量,具体包括:
①将通用语料经过词向量单元得到的上下文无关词向量E输入两层BiLSTM结构的语言模型进行训练:当输入的文本s=[v1,…,vm]包含m个单词,前向语言模型计算给定前t-1个单词(v1,…,vt-1)的条件下,第t个单词vt的概率分布:p(vt|v1,…,vt-1)。则文本s的概率为:
后向语言模型则是根据vt后面的单词来预测其概率分布:单词vi的上下文无关向量为ei,将ei传递给biLSTM模型,则会在每个biLSTM层得到得到vi的隐状态表示其中:j=1,2;是前向LSTM计算得到的单词vi的上文相关表示,是后向LSTM计算得到的vi的下文相关表示。vi的概率分布根据softmax函数计算得到:其中:Θs为模型参数,前后向LSTM的神经元个数均设置为512。
所述的biLSTM模型的损失函数为: 其中:分别表示前向和后向LSTM层的参数。使用大规模通用语料训练此预训练模型,并用Adam算法优化模型参数,直到收敛。
②将目标语料经过词向量单元得到的上下文无关词向量E输入预训练单元中已训练好的biLSTM模型。对于从biLSTM模型中获得其上下文相关表示(j=1,2),然后连接成一个向量当j=0时,hi,0=ei;否则,然后预处理单元输出R={R1,…,Rm}。
所述的情感细化单元基于词向量细化方法,利用情感词典(比如英文情感词典E-ANEW)对词向量单元输出的词向量进行情感细化调整,然后输出调整后的词向量。情感词典中的每个单词有对应的情感值Valence和激励值Arousal。Valence的取值范围在1-9之间,值越大表示越积极。
所述的情感细化单元包括:相似度计算模块和词向量细化模块,其中:相似度计算模块处理上下文无关词向量并选择与其最相似的k个词向量,词向量细化模块与相似度计算模块相连并输出细化后的词向量。
所述的情感细化具体是指:首先将情感词典的单词经过预处理后输入词向量单元,获得情感词典中每个单词对应的词向量,记为集合S;然后将目标语料经过词向量单元得到的上下文无关词向量E输入情感细化单元,若ei∈S,则计算ei与S中其他词的相似度并按降序排序;前k个相似度最高的单词组成集合Si;本实施例中k为10,计算ei与s的情感值Valence的绝对值差,并按升序排序;调整ei词向量,得到e′i,使得e′i与其k个邻近单词的距离最小化,并且e′i与ei的距离最小化;即目标函数为: 其中:dist(x,y)是计算x与y相似度的相似度函数,α与β是控制向量e′i移动的两个超参数,这里α,β均设置为0.1;令目标函数对ei求导结果等于0,可以求解得到情感词向量e′i,多次迭代直到收敛,则e′i=ei
如图4所示,所述的情感分类器单元是基于Tree-LSTM模型的分类器,该情感分类器单元包括:词向量组合模块、Tree-LSTM模块以及softmax模块,其中:词向量组合模块处理上下文词向量和情感词向量与Tree-LSTM模块相连并传输上下文-情感词向量,Tree-LSTM模块根据句法结构处理上下文-情感词向量与softmax模块相连并输出隐状态,softmax模块处理隐状态并输出句子的类别信息。
所述的情感分类具体是指:首先将预训练单元输出的上下文词向量Ri与情感词向量e′i连接在一起,得到:当j=3时,hi,3=ei;然后学习一个关于[Ri;e′i]的线性组合函数:上下文-情感词向量其中:Θz=[γ;sj],sj是经过softmax归一化的权重参数,表示上下文词向量和情感词向量分别占的比重,γ是一个缩放因子;然后将Zi输入到Tree-LSTM中,根据句法结构建Tree-LSTM模型,最上层LSTM输出的隐状态h经过softmax函数后计算得到句子的情感分类结果目标函数为负对数似然函数:其中:Ei表示文本E中第i个句子,yi表示第i个句子的情感标签,表示Tree-LSTM的预测分类结果,Θ=[Θz;Θtree-lstm;W]是情感分类器单元的参数,°符号表示element-wise乘法;通过随机梯度下降优化模型直到参数收敛。
与现有技术相比,本发明实现了通用语料预训练模型得到的上下文词向量与目标语料情感细化词向量的结合,可以得到具有多语义和情感信息的上下文-情感词向量。并用Tree-LSTM组合词向量,将句法成分结构信息融入到向量表示中,最后可以得到具有语义、情感和结构特征的句子向量用于情感分类。其中,情感分类器单元中的词向量组合模块是关键技术体现。在多分类情感分析任务中,模型评估效果主要以分类准确率为主。与现有方法做对比,本发明的分类准确率提高约3%。
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

Claims (10)

1.一种基于上下文-情感词向量的文本情感分析系统,其特征在于,包括:预处理单元、词向量单元、预训练单元、情感细化单元和情感分类器单元,其中:预处理单元通过概率上下文无关文解析方法跟据输入句子的单词分析得到句子的句法结构分析树用于对句子分词,并通过字符词典对组成每个单词的字符的转换成字符对应的索引号;词向量单元采用基于字符卷积神经网络和长短时记忆网络的适用于大规模语料的语言模型,根据组成单词的字符的索引号,通过多个过滤器对字符嵌入卷积得到该单词的上下文无关词向量;预训练单元采用经过通用语料预训练的两层BiLSTM的语言模型,根据上下文无关词向量得到BiLSTM神经元的隐状态,即上下文词向量;情感细化单元通过情感词典调整上下文无关词向量得到情感词向量,并将预训练单元的上下文词向量和情感词向量组合得到上下文-情感词向量;情感分类器单元跟据预处理单元的句法结构分析树构建树状LSTM模型,并根据上下文-情感词向量得到句子的情感分类结果。
2.根据权利要求1所述的系统,其特征是,所述的情感词典中每一行存储单词及其对应的情感值和激励值,其中情感值的取值范围在1-9之间,值越大表示越积极;
所述的情感词向量是指:通过情感词典的分数值调整上下文词向量,使其与情感值相近的单词的词向量更相似,而远离情感值相反的单词的词向量。
3.根据权利要求1所述的系统,其特征是,所述的词向量单元包括:字符嵌入模块和字符CNN模块,其中:字符嵌入模块利用字符嵌入矩阵Q处理字符ID,输出单词字符嵌入表示,字符CNN模块与字符嵌入相连并输出单词的上下文无关向量;
所述的词向量单元采用CNN-BIG-LSTM模型得到每个单词的上下文无关词向量:当句子s=[v1,...vi...,vm]的每个单词vi,i=1,...,m经过预处理单元处理得到的字符ID表示,k表示vi的字符个数,字符嵌入模块中有字符嵌入矩阵Q,当每个字符的嵌入表示维度等于d,那么|O|为字符字典的大小,则对于给定单词vi,通过查看Q可以得到vi的字符嵌入表示为第j行表示第j个字符的嵌入表示。
4.根据权利要求1所述的系统,其特征是,所述的预训练单元包括:前向LSTM模块、后向LSTM模块和softmax模块,其中:前向LSTM模块处理上下文无关词向量输出前向隐状态,后向LSTM模块处理上下文无关词向量输出后向隐状态,softmax模块与前向LSTM模块和后向LSTM模块相连输出单词的概率分布。
5.根据权利要求1或4所述的系统,其特征是,所述的预训练单元依次进行通用语料预训练和获取目标语料上下文向量,具体包括:
①将通用语料经过词向量单元得到的上下文无关词向量E输入两层BiLSTM结构的语言模型进行训练:当输入的文本s=[v1,...,vm]包含m个单词,前向语言模型计算给定前t-1个单词(v1,...,vt-1)的条件下,第t个单词vt的概率分布:p(vt|v1,...,vt-1);则文本s的概率为:
后向语言模型则是根据vt后面的单词来预测其概率分布:单词vi的上下文无关向量为ei,将ei传递给biLSTM模型,则会在每个biLSTM层得到得到vi的隐状态表示其中:j=1,2;是前向LSTM计算得到的单词vi的上文相关表示,是后向LSTM计算得到的vi的下文相关表示;vi的概率分布根据softmax函数计算得到:其中:Θs为模型参数;
②将目标语料经过词向量单元得到的上下文无关词向量E输入预训练单元中已训练好的biLSTM模型;对于从biLSTM模型中获得其上下文相关表示(j=1,2),然后连接成一个向量当j=0时,hi,0=ei;否则,然后预处理单元输出R={R1,...,Rm}。
6.根据权利要求1所述的系统,其特征是,所述的情感细化单元包括:相似度计算模块和词向量细化模块,其中:相似度计算模块处理上下文无关词向量并选择与其最相似的k个词向量,词向量细化模块与相似度计算模块相连并输出细化后的词向量。
7.根据权利要求6所述的系统,其特征是,所述的情感细化具体是指:首先将情感词典的单词经过预处理后输入词向量单元,获得情感词典中每个单词对应的词向量,记为集合s;然后将目标语料经过词向量单元得到的上下文无关词向量E输入情感细化单元,若ei∈S,则计算ei与S中其他词的相似度并按降序排序;前k个相似度最高的单词组成集合Si;本实施例中k为10,计算ei与s的情感值Valence的绝对值差,并按升序排序;调整ei词向量,得到e′i,使得e′i与其k个邻近单词的距离最小化,并且e′i与ei的距离最小化;即目标函数为:argmine′ 其中:dist(x,y)是计算x与y相似度的相似度函数,α与β是控制向量e′i移动的两个超参数,这里α,β均设置为0.1;令目标函数对ei求导结果等于0,得到情感词向量e′i,多次迭代直到收敛,则e′i=ei
8.根据权利要求1所述的系统,其特征是,所述的情感分类器单元包括:词向量组合模块、Tree-LSTM模块以及softmax模块,其中:词向量组合模块处理上下文词向量和情感词向量与Tree-LSTM模块相连并传输上下文-情感词向量,Tree-LSTM模块根据句法结构处理上下文-情感词向量与softmax模块相连并输出隐状态,softmax模块处理隐状态并输出句子的类别信息。
9.根据权利要求8所述的系统,其特征是,所述的情感分类具体是指:首先将预训练单元输出的上下文词向量Ri与情感词向量e′i连接在一起,得到:当j=3时,hi,3=ei;然后学习一个关于[Ri;e′i]的线性组合函数:上下文-情感词向量其中:Θz=[γ;sj],sj是经过softmax归一化的权重参数,表示上下文词向量和情感词向量分别占的比重,Y是一个缩放因子;然后将Zi输入到Tree-LSTM中,根据句法结构建Tree-LSTM模型,最上层LSTM输出的隐状态h经过softmax函数后计算得到句子的情感分类结果目标函数为负对数似然函数:其中:Ei表示文本E中第i个句子,yi表示第i个句子的情感标签,表示Tree-LSTM的预测分类结果,Θ=[Θz;Θtree-lstm;W]是情感分类器单元的参数,ο符号表示element-wise乘法;通过随机梯度下降优化模型直到参数收敛。
10.一种根据上述任一权利要求所述系统的上下文-情感词向量和Tree-LSTM的文本情感分类方法,其特征在于,通过对语言模型进行通用语料预训练再用于对输入的句子进行处理得到上下文词向量,再用Standford-Parser解析句子得到句法结构分析树,然后对上下文无关词向量进行情感细化得到情感词向量,并学习权重对上下文词向量和情感词向量的线性组合,进而得到上下文-情感词向量以联合表示单词的语义和情感,再将上下文-情感词向量输入Tree-LSTM中,根据句法结构分析树组合单词得到句子的向量表示,最后通过softmax分类后得到输入的句子的情感分类。
CN201910207069.4A 2019-03-19 2019-03-19 基于上下文-情感词向量的文本情感分析系统 Active CN109933795B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910207069.4A CN109933795B (zh) 2019-03-19 2019-03-19 基于上下文-情感词向量的文本情感分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910207069.4A CN109933795B (zh) 2019-03-19 2019-03-19 基于上下文-情感词向量的文本情感分析系统

Publications (2)

Publication Number Publication Date
CN109933795A true CN109933795A (zh) 2019-06-25
CN109933795B CN109933795B (zh) 2023-07-28

Family

ID=66987619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910207069.4A Active CN109933795B (zh) 2019-03-19 2019-03-19 基于上下文-情感词向量的文本情感分析系统

Country Status (1)

Country Link
CN (1) CN109933795B (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309308A (zh) * 2019-06-27 2019-10-08 北京金山安全软件有限公司 一种文字信息的分类方法、装置及电子设备
CN110321563A (zh) * 2019-06-28 2019-10-11 浙江大学 基于混合监督模型的文本情感分析方法
CN110347836A (zh) * 2019-07-15 2019-10-18 昆明理工大学 融入观点句特征的汉越双语新闻情感分类方法
CN110377739A (zh) * 2019-07-19 2019-10-25 出门问问(苏州)信息科技有限公司 文本情感分类方法、可读存储介质和电子设备
CN110442717A (zh) * 2019-08-08 2019-11-12 深巨科技(北京)有限公司 一种适应性情感分析系统及其方法
CN110472244A (zh) * 2019-08-14 2019-11-19 山东大学 一种基于Tree-LSTM和情感信息的短文本情感分类方法
CN110489555A (zh) * 2019-08-21 2019-11-22 创新工场(广州)人工智能研究有限公司 一种结合类词信息的语言模型预训练方法
CN110569508A (zh) * 2019-09-10 2019-12-13 重庆邮电大学 融合词性和自注意力机制的情感倾向性分类方法及系统
CN110609899A (zh) * 2019-08-29 2019-12-24 成都信息工程大学 一种基于改进bert模型的特定目标情感分类方法
CN110909167A (zh) * 2019-11-29 2020-03-24 重庆邮电大学 一种微博文本分类系统
CN111008527A (zh) * 2019-12-18 2020-04-14 成都迪普曼林信息技术有限公司 一种情感分析系统及方法
CN111241819A (zh) * 2020-01-07 2020-06-05 北京百度网讯科技有限公司 词向量生成方法、装置及电子设备
CN111414452A (zh) * 2020-02-29 2020-07-14 平安国际智慧城市科技股份有限公司 搜索词匹配方法、装置、电子设备及可读存储介质
CN111523301A (zh) * 2020-06-05 2020-08-11 泰康保险集团股份有限公司 合同文档合规性检查方法及装置
CN112036184A (zh) * 2020-08-31 2020-12-04 湖南星汉数智科技有限公司 基于BiLSTM网络模型及CRF模型的实体识别方法、装置、计算机装置及存储介质
CN112100388A (zh) * 2020-11-18 2020-12-18 南京华苏科技有限公司 一种长文本新闻舆情的情感极性的分析方法
CN112183076A (zh) * 2020-08-28 2021-01-05 北京望石智慧科技有限公司 一种物质名称提取方法、装置及存储介质
CN112541364A (zh) * 2020-12-03 2021-03-23 昆明理工大学 融合多层次语言特征知识的汉越神经机器翻译的方法
CN112926344A (zh) * 2021-03-13 2021-06-08 中国科学院新疆理化技术研究所 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质
CN113158644A (zh) * 2021-05-13 2021-07-23 山西大学 一种基于多任务学习的修辞格及隐式情绪识别方法
CN113192484A (zh) * 2021-05-26 2021-07-30 腾讯音乐娱乐科技(深圳)有限公司 基于文本生成音频的方法、设备和存储介质
CN113254590A (zh) * 2021-06-15 2021-08-13 北京建筑大学 一种基于多核双层卷积神经网络的中文文本情绪分类方法
CN113362858A (zh) * 2021-07-27 2021-09-07 中国平安人寿保险股份有限公司 语音情感分类方法、装置、设备及介质
CN113553435A (zh) * 2021-09-22 2021-10-26 北京北大软件工程股份有限公司 智能标签的确定方法、装置、设备及存储介质
CN115017899A (zh) * 2022-04-19 2022-09-06 北京三快在线科技有限公司 一种缩略语生成方法、装置、设备及存储介质
CN115774993A (zh) * 2022-12-29 2023-03-10 广东南方网络信息科技有限公司 一种基于句法分析的条件类错误识别方法及装置
WO2024087297A1 (zh) * 2022-10-27 2024-05-02 苏州思萃人工智能研究所有限公司 文本情感分析方法、装置、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012134180A2 (ko) * 2011-03-28 2012-10-04 가톨릭대학교 산학협력단 문장에 내재한 감정 분석을 위한 감정 분류 방법 및 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법
US20130218555A1 (en) * 2012-02-16 2013-08-22 International Business Machines Corporation Device for analyzing text documents
US20160350646A1 (en) * 2015-05-29 2016-12-01 Sas Institute Inc. Normalizing electronic communications using a neural network
CN106599933A (zh) * 2016-12-26 2017-04-26 哈尔滨工业大学 一种基于联合深度学习模型的文本情感分类方法
CN107092596A (zh) * 2017-04-24 2017-08-25 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107145483A (zh) * 2017-04-24 2017-09-08 北京邮电大学 一种基于嵌入式表示的自适应中文分词方法
CN107301171A (zh) * 2017-08-18 2017-10-27 武汉红茶数据技术有限公司 一种基于情感词典学习的文本情感分析方法和系统
CN108133038A (zh) * 2018-01-10 2018-06-08 重庆邮电大学 一种基于动态记忆网络的实体级别情感分类系统及方法
CN108733653A (zh) * 2018-05-18 2018-11-02 华中科技大学 一种基于融合词性和语义信息的Skip-gram模型的情感分析方法
CN108875021A (zh) * 2017-11-10 2018-11-23 云南大学 一种基于区域cnn-lstm的情感分析方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012134180A2 (ko) * 2011-03-28 2012-10-04 가톨릭대학교 산학협력단 문장에 내재한 감정 분석을 위한 감정 분류 방법 및 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법
US20130218555A1 (en) * 2012-02-16 2013-08-22 International Business Machines Corporation Device for analyzing text documents
US20160350646A1 (en) * 2015-05-29 2016-12-01 Sas Institute Inc. Normalizing electronic communications using a neural network
CN106599933A (zh) * 2016-12-26 2017-04-26 哈尔滨工业大学 一种基于联合深度学习模型的文本情感分类方法
CN107092596A (zh) * 2017-04-24 2017-08-25 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107145483A (zh) * 2017-04-24 2017-09-08 北京邮电大学 一种基于嵌入式表示的自适应中文分词方法
CN107301171A (zh) * 2017-08-18 2017-10-27 武汉红茶数据技术有限公司 一种基于情感词典学习的文本情感分析方法和系统
CN108875021A (zh) * 2017-11-10 2018-11-23 云南大学 一种基于区域cnn-lstm的情感分析方法
CN108133038A (zh) * 2018-01-10 2018-06-08 重庆邮电大学 一种基于动态记忆网络的实体级别情感分类系统及方法
CN108733653A (zh) * 2018-05-18 2018-11-02 华中科技大学 一种基于融合词性和语义信息的Skip-gram模型的情感分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
相若晨等: "基于词向量与句法树的中文句子情感分析", 《计算机与现代化》 *
胡朝举等: "基于词向量技术和混合神经网络的情感分析", 《计算机应用研究》 *
陈雪等: "哈萨克语句法分析辅助特征提取研究", 《中文信息学报》 *

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309308A (zh) * 2019-06-27 2019-10-08 北京金山安全软件有限公司 一种文字信息的分类方法、装置及电子设备
CN110321563A (zh) * 2019-06-28 2019-10-11 浙江大学 基于混合监督模型的文本情感分析方法
CN110347836A (zh) * 2019-07-15 2019-10-18 昆明理工大学 融入观点句特征的汉越双语新闻情感分类方法
CN110377739A (zh) * 2019-07-19 2019-10-25 出门问问(苏州)信息科技有限公司 文本情感分类方法、可读存储介质和电子设备
CN110442717A (zh) * 2019-08-08 2019-11-12 深巨科技(北京)有限公司 一种适应性情感分析系统及其方法
CN110472244A (zh) * 2019-08-14 2019-11-19 山东大学 一种基于Tree-LSTM和情感信息的短文本情感分类方法
CN110472244B (zh) * 2019-08-14 2020-05-29 山东大学 一种基于Tree-LSTM和情感信息的短文本情感分类方法
CN110489555B (zh) * 2019-08-21 2022-03-08 创新工场(广州)人工智能研究有限公司 一种结合类词信息的语言模型预训练方法
CN110489555A (zh) * 2019-08-21 2019-11-22 创新工场(广州)人工智能研究有限公司 一种结合类词信息的语言模型预训练方法
CN110609899A (zh) * 2019-08-29 2019-12-24 成都信息工程大学 一种基于改进bert模型的特定目标情感分类方法
CN110609899B (zh) * 2019-08-29 2022-04-19 成都信息工程大学 一种基于改进bert模型的特定目标情感分类方法
CN110569508A (zh) * 2019-09-10 2019-12-13 重庆邮电大学 融合词性和自注意力机制的情感倾向性分类方法及系统
CN110909167A (zh) * 2019-11-29 2020-03-24 重庆邮电大学 一种微博文本分类系统
CN110909167B (zh) * 2019-11-29 2022-07-01 重庆邮电大学 一种微博文本分类系统
CN111008527A (zh) * 2019-12-18 2020-04-14 成都迪普曼林信息技术有限公司 一种情感分析系统及方法
CN111241819A (zh) * 2020-01-07 2020-06-05 北京百度网讯科技有限公司 词向量生成方法、装置及电子设备
CN111414452A (zh) * 2020-02-29 2020-07-14 平安国际智慧城市科技股份有限公司 搜索词匹配方法、装置、电子设备及可读存储介质
CN111523301A (zh) * 2020-06-05 2020-08-11 泰康保险集团股份有限公司 合同文档合规性检查方法及装置
CN112183076A (zh) * 2020-08-28 2021-01-05 北京望石智慧科技有限公司 一种物质名称提取方法、装置及存储介质
CN112036184A (zh) * 2020-08-31 2020-12-04 湖南星汉数智科技有限公司 基于BiLSTM网络模型及CRF模型的实体识别方法、装置、计算机装置及存储介质
CN112100388A (zh) * 2020-11-18 2020-12-18 南京华苏科技有限公司 一种长文本新闻舆情的情感极性的分析方法
CN112541364A (zh) * 2020-12-03 2021-03-23 昆明理工大学 融合多层次语言特征知识的汉越神经机器翻译的方法
CN112926344A (zh) * 2021-03-13 2021-06-08 中国科学院新疆理化技术研究所 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质
CN112926344B (zh) * 2021-03-13 2023-11-17 中国科学院新疆理化技术研究所 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质
CN113158644B (zh) * 2021-05-13 2022-09-20 山西大学 一种基于多任务学习的修辞格及隐式情绪识别方法
CN113158644A (zh) * 2021-05-13 2021-07-23 山西大学 一种基于多任务学习的修辞格及隐式情绪识别方法
CN113192484A (zh) * 2021-05-26 2021-07-30 腾讯音乐娱乐科技(深圳)有限公司 基于文本生成音频的方法、设备和存储介质
CN113254590B (zh) * 2021-06-15 2021-11-09 北京建筑大学 一种基于多核双层卷积神经网络的中文文本情绪分类方法
CN113254590A (zh) * 2021-06-15 2021-08-13 北京建筑大学 一种基于多核双层卷积神经网络的中文文本情绪分类方法
CN113362858A (zh) * 2021-07-27 2021-09-07 中国平安人寿保险股份有限公司 语音情感分类方法、装置、设备及介质
CN113362858B (zh) * 2021-07-27 2023-10-31 中国平安人寿保险股份有限公司 语音情感分类方法、装置、设备及介质
CN113553435B (zh) * 2021-09-22 2021-12-24 北京北大软件工程股份有限公司 智能标签的确定方法、装置、设备及存储介质
CN113553435A (zh) * 2021-09-22 2021-10-26 北京北大软件工程股份有限公司 智能标签的确定方法、装置、设备及存储介质
CN115017899A (zh) * 2022-04-19 2022-09-06 北京三快在线科技有限公司 一种缩略语生成方法、装置、设备及存储介质
WO2024087297A1 (zh) * 2022-10-27 2024-05-02 苏州思萃人工智能研究所有限公司 文本情感分析方法、装置、电子设备及存储介质
CN115774993A (zh) * 2022-12-29 2023-03-10 广东南方网络信息科技有限公司 一种基于句法分析的条件类错误识别方法及装置
CN115774993B (zh) * 2022-12-29 2023-09-08 广东南方网络信息科技有限公司 一种基于句法分析的条件类错误识别方法及装置

Also Published As

Publication number Publication date
CN109933795B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN109933795A (zh) 基于上下文-情感词向量的文本情感分析系统
CN110866117B (zh) 一种基于语义增强与多层次标签嵌入的短文本分类方法
CN109241255B (zh) 一种基于深度学习的意图识别方法
CN108763326B (zh) 一种基于特征多样化的卷积神经网络的情感分析模型构建方法
CN107729309B (zh) 一种基于深度学习的中文语义分析的方法及装置
Vateekul et al. A study of sentiment analysis using deep learning techniques on Thai Twitter data
CN112818861B (zh) 一种基于多模态上下文语义特征的情感分类方法及系统
CN110287323B (zh) 一种面向目标的情感分类方法
CN106569998A (zh) 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN111859912A (zh) 基于pcnn模型的带有实体感知的远程监督关系抽取方法
CN111078833B (zh) 一种基于神经网络的文本分类方法
CN112732916A (zh) 一种基于bert的多特征融合模糊文本分类模型
CN108154156B (zh) 基于神经主题模型的图像集成分类方法及装置
CN112989830B (zh) 一种基于多元特征和机器学习的命名实体识别方法
CN110297986A (zh) 一种微博热点话题的情感倾向分析方法
CN112988970A (zh) 一种服务于智能问答系统的文本匹配算法
CN108647705A (zh) 基于图像和文本语义相似度的图像语义消歧方法和装置
CN112100212A (zh) 一种基于机器学习和规则匹配的案件情节抽取方法
Luo et al. Research on Text Sentiment Analysis Based on Neural Network and Ensemble Learning.
Dwivedi et al. A Novel deep learning model for accurate prediction of image captions in fashion industry
CN113569553A (zh) 基于改进Adaboost算法的句子相似性判断方法
CN113159071B (zh) 一种跨模态图像-文本关联异常检测方法
Phan et al. Little flower at memotion 2.0 2022: Ensemble of multi-modal model using attention mechanism in memotion analysis
CN111737467A (zh) 一种基于分段卷积神经网络的对象级情感分类方法
Liu et al. A study of Chinese Text Classification based on a new type of BERT pre-training

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant