CN109933795B - 基于上下文-情感词向量的文本情感分析系统 - Google Patents

基于上下文-情感词向量的文本情感分析系统 Download PDF

Info

Publication number
CN109933795B
CN109933795B CN201910207069.4A CN201910207069A CN109933795B CN 109933795 B CN109933795 B CN 109933795B CN 201910207069 A CN201910207069 A CN 201910207069A CN 109933795 B CN109933795 B CN 109933795B
Authority
CN
China
Prior art keywords
emotion
word
context
word vector
lstm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910207069.4A
Other languages
English (en)
Other versions
CN109933795A (zh
Inventor
金悦媛
饶若楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201910207069.4A priority Critical patent/CN109933795B/zh
Publication of CN109933795A publication Critical patent/CN109933795A/zh
Application granted granted Critical
Publication of CN109933795B publication Critical patent/CN109933795B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

一种基于上下文‑情感词向量的文本情感分析系统,包括:预处理单元、词向量单元、预训练单元、情感细化单元和情感分类器单元,本发明实现了通用语料预训练模型得到的上下文词向量与目标语料情感词向量的结合,可以得到具有多语义和情感信息的上下文‑情感词向量。并用Tree‑LSTM组合上下文‑情感词向量,将句法成分结构信息融入到向量表示中,最后可以得到具有语义、情感和结构特征的句子向量用于情感分类。

Description

基于上下文-情感词向量的文本情感分析系统
技术领域
本发明涉及的是一种语义处理领域的技术,具体是一种基于上下文-情感词向量和Tree-LSTM的文本情感分析系统。
背景技术
基于深度学习的文本情感分析系统通常采用预训练模型(如word2vec,glove)来得到词向量(word embedding),再将词向量输入到下游模型(如RNN,CNN)得到句子向量,最后利用分类器得到句子的情感极性类别(如积极,中立,消极)。上述词向量预训练模型存在以下问题:一方面word2vec只能捕获到静态词向量,即每个单词在不同上下文中的表示是相同的。而现实中单词的语义是与上下文紧密相关的。另一方面word2vec词向量只能表示单词通用的语义,不能捕获到情感极性信息,例如good和bad的情感词性相反,但其词向量很相似。
近年来,ELMO、GPT、BERT等预训练模型可以得到上下文相关的词向量,并依赖于微调(fine-tune)技术来调整模型。对于情感分析任务,这样捕获到的上下文词向量仍会缺乏部分情感信息。
情感词典是一个包含单词及其情感值的词典,以情感词典作为辅助信息细化词向量可以得到具有情感信息的词向量。此方法仅曾被用于调整静态词向量,未被尝试用于上下文词向量。
发明内容
本发明针对现有技术存在的上述不足,提出一种基于上下文-情感词向量的文本情感分析系统。
本发明是通过以下技术方案实现的:
本发明包括:预处理单元、词向量单元、预训练单元、情感细化单元和情感分类器单元,其中:预处理单元通过概率上下文无关文解析(Standford-Parser,PCFG)方法跟据输入句子的单词分析得到句子的句法结构分析树用于对句子分词,并通过字符词典对组成每个单词的字符的转换成字符对应的索引号(ID);词向量单元采用基于字符卷积神经网络和长短时记忆网络的适用于大规模语料的语言模型(CNN-BIG-LSTM),根据组成单词的字符的索引号,通过多个过滤器对字符嵌入卷积得到该单词的上下文无关词向量;预训练单元采用经过通用语料预训练的两层BiLSTM的语言模型,根据上下文无关词向量得到BiLSTM神经元的隐状态,即上下文词向量;情感细化单元通过情感词典调整上下文无关词向量得到情感词向量,并将预训练单元的上下文词向量和情感词向量组合得到上下文-情感词向量;情感分类器单元跟据预处理单元的句法结构分析树构建树状LSTM模型,并根据上下文-情感词向量得到句子的情感分类结果。
所述的字符词典是指一个包含文本单词中所有可能出现的字符,如26个英文字母。字符词典中每个字符对应一个唯一的索引号(ID)。假设词典的大小为|O|。
所述的情感词典中每一行存储单词及其对应的情感值(Valence)和激励值(Arousal),其中情感值的取值范围在1-9之间,值越大表示越积极。
所述的情感词向量是指:通过情感词典的分数值调整上下文词向量,使其与情感值相近的单词的词向量更相似,而远离情感值相反的单词的词向量。
所述的树状LSTM模型兼具LSTM在处理序列数据上的优点且树状结构符合句子语法,可以捕捉到短语信息。
本发明涉及一种根据上述系统的上下文-情感词向量和Tree-LSTM的文本情感分类方法,通过对语言模型进行通用语料预训练再用于对输入的句子进行处理得到上下文词向量,再用Standford-Parser解析句子得到句法结构分析树,然后对上下文无关词向量进行情感细化得到情感词向量,并学习权重对上下文词向量和情感词向量的线性组合,进而得到上下文-情感词向量以联合表示单词的语义和情感,再将上下文-情感词向量输入Tree-LSTM中,根据句法结构分析树组合单词得到句子的向量表示,最后通过softmax分类后得到输入的句子的情感分类。
所述的语言模型为CNN-BIG-LSTM,该模型根据输入的句子输出其概率分布,即给定一个长度为n的句子,语言模型建模关于整个句子在通用语料中出现的概率分布P(w1,w2,…wn)。
所述的通用语料预训练是指:将通用语料(如维基百科,百度百科,新闻等无标签文本)输入到预处理单元,得到单词的字符ID表示oi;将字符ID表示oi输入词向量单元,得到单词的上下文无关词向量表示ei;将词向量表示ei输入预训练单元,以语言模型为任务训练两层BiLSTM,用Adam算法优化模型参数,直到收敛。
技术效果
与现有技术相比,本发明实现了通用语料预训练模型得到的上下文词向量与目标语料情感词向量的结合,可以得到具有多语义和情感信息的上下文-情感词向量。并用Tree-LSTM组合上下文-情感词向量,将句法成分结构信息融入到向量表示中,最后可以得到具有语义、情感和结构特征的句子向量用于情感分类。
附图说明
图1为本发明结构流程示意图;
图2为本发明词向量单元CNN-BIG-LSTM模型图;
图3为本发明预训练单元两层biLSTM模型图;
图4为本发明情感分类器单元Tree-LSTM模型图。
具体实施方式
如图1所示,本发明包括:预处理单元、词向量单元、预训练单元、情感细化单元和情感分类器单元,其中:预处理单元通过概率上下文无关文解析(Standford-Parser,PCFG)方法跟据输入句子的单词分析得到句子的句法结构分析树用于对句子分词,并通过字符词典对组成每个单词的字符的转换成字符对应的索引号(ID);词向量单元采用基于字符卷积神经网络和长短时记忆网络的适用于大规模语料的语言模型(CNN-BIG-LSTM),根据组成单词的字符的索引号,通过多个过滤器对字符嵌入卷积得到该单词的上下文无关词向量;预训练单元采用经过通用语料预训练的两层BiLSTM的语言模型,根据上下文无关词向量得到BiLSTM神经元的隐状态,即上下文词向量;情感细化单元通过情感词典调整上下文无关词向量得到情感词向量,并将预训练单元的上下文词向量和情感词向量组合得到上下文-情感词向量;情感分类器单元跟据预处理单元的句法结构分析树构建树状LSTM模型,并根据上下文-情感词向量得到句子的情感分类结果。
所述的输入的句子包括:通用语料和任务语料文本,当单词vi由[c1,…,ck]的字符序列组成,字符集为O,则单词vi的字符ID表示第j列表示第j个字符的ID表示,预处理单元将句法结构分析输出到情感分类器单元,将字符ID表示oi输出到词向量单元;所述的预处理单元包括:句法分析模块、字符映射模块其中:句法分析模块用Stanford-Parser处理句子输出句法分析树,字符映射模块利用字符词典将句子的每个单词的字符映射成对应的ID。
所述的词向量单元包括:字符嵌入模块和字符CNN模块,其中:字符嵌入模块利用字符嵌入矩阵Q处理字符ID,输出单词字符嵌入表示。字符CNN模块与字符嵌入相连并输出单词的上下文无关向量。
如图2所示,所述的词向量单元采用CNN-BIG-LSTM模型得到每个单词的上下文无关词向量:当句子s=[v1,…vi…,vm]的每个单词vi(i=1,…,m)经过预处理单元处理得到的字符ID表示(k表示vi的字符个数),字符嵌入模块中有字符嵌入矩阵Q,当每个字符的嵌入表示维度等于d,那么/>(|O|为字符字典的大小),则对于给定单词vi,通过查看Q可以得到vi的字符嵌入表示为/>第j行表示第j个字符的嵌入表示。这里,|O|设置为262,d设置为16。
为了得到词向量,需要对每个单词的字符嵌入使用2048个n元(n-gram)卷积过滤器来提取特征。当一个过滤器fi的大小等于/>那么卷积得到结果为然后用最大池化提取重要特征,得到特征维度为/>再用Tanh函数对特征进行非线性变换。最后将每个经过卷积池化的特征连接在一起,经过2个highway层和1个512维的线性投影层,得到每个单词的上下文无关向量表示ei,/>
如图3所示,所述的预训练单元是基于MatthewE.Peters等人提出的ELMO模型,它是一个两层双向BiLSTM,通过大规模通用语料以无监督方式训练两层BiLSTM语言模型。
所述的预训练单元包括:前向LSTM模块、后向LSTM模块和softmax模块,其中:前向LSTM模块处理上下文无关词向量输出前向隐状态,后向LSTM模块处理上下文无关词向量输出后向隐状态,softmax模块与前向LSTM模块和后向LSTM模块相连输出单词的概率分布。
所述的预训练单元依次进行通用语料预训练和获取目标语料上下文向量,具体包括:
①将通用语料经过词向量单元得到的上下文无关词向量E输入两层BiLSTM结构的语言模型进行训练:当输入的文本s=[v1,…,vm]包含m个单词,前向语言模型计算给定前t-1个单词(v1,…,vt-1)的条件下,第t个单词vt的概率分布:p(vt|v1,…,vt-1)。则文本s的概率为:
后向语言模型则是根据vt后面的单词来预测其概率分布:单词vi的上下文无关向量为ei,将ei传递给biLSTM模型,则会在每个biLSTM层得到得到vi的隐状态表示/>和/>其中:j=1,2;/>是前向LSTM计算得到的单词vi的上文相关表示,/>是后向LSTM计算得到的vi的下文相关表示。vi的概率分布根据softmax函数计算得到:/>其中:Θs为模型参数,前后向LSTM的神经元个数均设置为512。
所述的biLSTM模型的损失函数为: 其中:/>和/>分别表示前向和后向LSTM层的参数。使用大规模通用语料训练此预训练模型,并用Adam算法优化模型参数,直到收敛。
②将目标语料经过词向量单元得到的上下文无关词向量E输入预训练单元中已训练好的biLSTM模型。对于从biLSTM模型中获得其上下文相关表示/>和/>(j=1,2),然后连接成一个向量/>当j=0时,hi,0=ei;否则,然后预处理单元输出R={R1,…,Rm}。
所述的情感细化单元基于词向量细化方法,利用情感词典(比如英文情感词典E-ANEW)对词向量单元输出的词向量进行情感细化调整,然后输出调整后的词向量。情感词典中的每个单词有对应的情感值Valence和激励值Arousal。Valence的取值范围在1-9之间,值越大表示越积极。
所述的情感细化单元包括:相似度计算模块和词向量细化模块,其中:相似度计算模块处理上下文无关词向量并选择与其最相似的k个词向量,词向量细化模块与相似度计算模块相连并输出细化后的词向量。
所述的情感细化具体是指:首先将情感词典的单词经过预处理后输入词向量单元,获得情感词典中每个单词对应的词向量,记为集合S;然后将目标语料经过词向量单元得到的上下文无关词向量E输入情感细化单元,若ei∈S,则计算ei与S中其他词的相似度并按降序排序;前k个相似度最高的单词组成集合Si;本实施例中k为10,/>计算ei与s的情感值Valence的绝对值差,并按升序排序;调整ei词向量,得到e′i,使得e′i与其k个邻近单词的距离最小化,并且e′i与ei的距离最小化;即目标函数为: 其中:dist(x,y)是计算x与y相似度的相似度函数,α与β是控制向量e′i移动的两个超参数,这里α,β均设置为0.1;令目标函数对ei求导结果等于0,可以求解得到情感词向量e′i,多次迭代直到收敛,/>若/>则e′i=ei
如图4所示,所述的情感分类器单元是基于Tree-LSTM模型的分类器,该情感分类器单元包括:词向量组合模块、Tree-LSTM模块以及softmax模块,其中:词向量组合模块处理上下文词向量和情感词向量与Tree-LSTM模块相连并传输上下文-情感词向量,Tree-LSTM模块根据句法结构处理上下文-情感词向量与softmax模块相连并输出隐状态,softmax模块处理隐状态并输出句子的类别信息。
所述的情感分类具体是指:首先将预训练单元输出的上下文词向量Ri与情感词向量e′i连接在一起,得到:当j=3时,hi,3=ei;然后学习一个关于[Ri;e′i]的线性组合函数:上下文-情感词向量其中:Θz=[γ;sj],sj是经过softmax归一化的权重参数,表示上下文词向量和情感词向量分别占的比重,γ是一个缩放因子;然后将Zi输入到Tree-LSTM中,根据句法结构建Tree-LSTM模型,最上层LSTM输出的隐状态h经过softmax函数后计算得到句子的情感分类结果/>目标函数为负对数似然函数:其中:Ei表示文本E中第i个句子,yi表示第i个句子的情感标签,/>表示Tree-LSTM的预测分类结果,Θ=[Θz;Θtree-lstm;W]是情感分类器单元的参数,°符号表示element-wise乘法;通过随机梯度下降优化模型直到参数收敛。
与现有技术相比,本发明实现了通用语料预训练模型得到的上下文词向量与目标语料情感细化词向量的结合,可以得到具有多语义和情感信息的上下文-情感词向量。并用Tree-LSTM组合词向量,将句法成分结构信息融入到向量表示中,最后可以得到具有语义、情感和结构特征的句子向量用于情感分类。其中,情感分类器单元中的词向量组合模块是关键技术体现。在多分类情感分析任务中,模型评估效果主要以分类准确率为主。与现有方法做对比,本发明的分类准确率提高约3%。
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

Claims (2)

1.一种基于上下文-情感词向量的文本情感分析系统,其特征在于,包括:预处理单元、词向量单元、预训练单元、情感细化单元和情感分类器单元,其中:预处理单元通过概率上下文无关文解析方法跟据输入句子的单词分析得到句子的句法结构分析树用于对句子分词,并通过字符词典对组成每个单词的字符的转换成字符对应的索引号;词向量单元采用基于字符卷积神经网络和长短时记忆网络的适用于大规模语料的语言模型,根据组成单词的字符的索引号,通过多个过滤器对字符嵌入卷积得到该单词的上下文无关词向量;预训练单元采用经过通用语料预训练的两层BiLSTM的语言模型,根据上下文无关词向量得到BiLSTM神经元的隐状态,即上下文词向量;情感细化单元通过情感词典调整上下文无关词向量得到情感词向量,并将预训练单元的上下文词向量和情感词向量组合得到上下文-情感词向量;情感分类器单元跟据预处理单元的句法结构分析树构建树状LSTM模型,并根据上下文-情感词向量得到句子的情感分类结果;
所述的情感词典中每一行存储单词及其对应的情感值和激励值,其中情感值的取值范围在1-9之间,值越大表示越积极;
所述的情感词向量是指:通过情感词典的分数值调整上下文无关词向量,使其与情感值相近的单词的词向量更相似,而远离情感值相反的单词的词向量;
所述的词向量单元包括:字符嵌入模块和字符CNN模块,其中:字符嵌入模块利用字符嵌入矩阵Q处理字符ID,输出单词字符嵌入表示,字符CNN模块与字符嵌入相连并输出单词的上下文无关词向量;
所述的词向量单元采用CNN-BIG-LSTM模型得到每个单词的上下文无关词向量:当句子s=[v1,...vi...,vm]的每个单词vi,i=1,...,m经过预处理单元处理得到的字符ID表示,k表示vi的字符个数,字符嵌入模块中有字符嵌入矩阵Q,当每个字符的嵌入表示维度等于d,那么/>|O|为字符字典的大小,则对于给定单词vi,通过查看Q得到vi的字符嵌入表示为/>第i行表示第i个字符的嵌入表示;
所述的预训练单元包括:前向LSTM模块、后向LSTM模块和softmax模块,其中:前向LSTM模块处理上下文无关词向量输出前向隐状态,后向LSTM模块处理上下文无关词向量输出后向隐状态,softmax模块与前向LSTM模块和后向LSTM模块相连输出单词的概率分布;
所述的预训练单元依次进行通用语料预训练和获取目标语料上下文词向量,具体包括:
①将通用语料经过词向量单元得到的上下文无关词向量E输入两层BiLSTM结构的语言模型进行训练:当输入的文本s=[v1,...,vm]包含m个单词,前向语言模型计算给定前t-1个单词(v1,...,vt-1)的条件下,第t个单词vt的概率分布:p(vt|v1,...,vt-1);则文本s的概率为:
后向语言模型则是根据vt后面的单词来预测其概率分布: 单词vi的上下文无关词向量为ei,将ei传递给biLSTM模型,则会在每个biLSTM层得到得到vi的隐状态表示/>和/>其中:j=1,2;/>是前向LSTM计算得到的单词vi的上文相关表示,/>是后向LSTM计算得到的vi的下文相关表示;vi的概率分布根据softmax函数计算得到:/>其中:Θs为模型参数;
②将目标语料经过词向量单元得到的上下文无关词向量E输入预训练单元中已训练好的biLSTM模型;对于从biLSTM模型中获得其上下文相关表示/>和/>然后连接成一个向量/>当j=0时,hi,0=ei;否则,/> 然后预处理单元输出R={R1,...,Rm};
所述的情感细化单元包括:相似度计算模块和词向量细化模块,其中:相似度计算模块处理上下文无关词向量并选择与其最相似的k个词向量,词向量细化模块与相似度计算模块相连并输出细化后的词向量;
所述的情感细化具体是指:首先将情感词典的单词经过预处理后输入词向量单元,获得情感词典中每个单词对应的词向量,记为集合S;然后将目标语料经过词向量单元得到的上下文无关词向量E输入情感细化单元,若ei∈S,则计算ei与S中其他词的相似度并按降序排序;前k个相似度最高的单词组成集合Si;k为10,/>计算ei与s的情感值Valence的绝对值差,并按升序排序;调整ei词向量,得到e′i,使得e′i与其k个邻近单词的距离最小化,并且e′i与ei的距离最小化;即目标函数为:其中:dist(x,y)是计算x与y相似度的相似度函数,α与β是控制向量e′i移动的两个超参数,这里α,β均设置为0.1;令目标函数对ei求导结果等于0,得到情感词向量e′i,多次迭代直到收敛,/>若/>则e′i=ei
所述的情感分类器单元包括:词向量组合模块、Tree-LSTM模块以及softmax模块,其中:词向量组合模块处理上下文词向量和情感词向量与Tree-LSTM模块相连并传输上下文-情感词向量,Tree-LSTM模块根据句法结构处理上下文-情感词向量与softmax模块相连并输出隐状态,softmax模块处理隐状态并输出句子的类别信息;
所述的情感分类具体是指:首先将预训练单元输出的上下文词向量Ri与情感词向量e′i连接在一起,得到:当j=3时,hi,3=ei;然后学习一个关于[Ri;e′i]的线性组合函数:上下文-情感词向量/>其中:Θz=[γ;sj],sj是经过softmax归一化的权重参数,表示上下文词向量和情感词向量分别占的比重,γ是一个缩放因子;然后将Zi输入到Tree-LSTM中,根据句法结构建Tree-LSTM模型,最上层LSTM输出的隐状态h经过softmax函数后计算得到句子的情感分类结果/> 目标函数为负对数似然函数:/>其中:Ei表示文本E中第i个句子,yi表示第i个句子的情感标签,/>表示Tree-LSTM的预测分类结果,Θ=[Θz;Θtree-lstm;W]是情感分类器单元的参数,/>符号表示element-wise乘法,通过随机梯度下降优化模型直到参数收敛。
2.一种根据权利要求1所述系统的上下文-情感词向量和Tree-LSTM的文本情感分类方法,其特征在于,通过对语言模型进行通用语料预训练再用于对输入的句子进行处理得到上下文词向量,再用Standford-Parser解析句子得到句法结构分析树,然后对上下文无关词向量进行情感细化得到情感词向量,并学习权重对上下文词向量和情感词向量的线性组合,进而得到上下文-情感词向量以联合表示单词的语义和情感,再将上下文-情感词向量输入Tree-LSTM中,根据句法结构分析树组合单词得到句子的向量表示,最后通过softmax分类后得到输入的句子的情感分类。
CN201910207069.4A 2019-03-19 2019-03-19 基于上下文-情感词向量的文本情感分析系统 Active CN109933795B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910207069.4A CN109933795B (zh) 2019-03-19 2019-03-19 基于上下文-情感词向量的文本情感分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910207069.4A CN109933795B (zh) 2019-03-19 2019-03-19 基于上下文-情感词向量的文本情感分析系统

Publications (2)

Publication Number Publication Date
CN109933795A CN109933795A (zh) 2019-06-25
CN109933795B true CN109933795B (zh) 2023-07-28

Family

ID=66987619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910207069.4A Active CN109933795B (zh) 2019-03-19 2019-03-19 基于上下文-情感词向量的文本情感分析系统

Country Status (1)

Country Link
CN (1) CN109933795B (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309308A (zh) * 2019-06-27 2019-10-08 北京金山安全软件有限公司 一种文字信息的分类方法、装置及电子设备
CN110321563B (zh) * 2019-06-28 2021-05-11 浙江大学 基于混合监督模型的文本情感分析方法
CN110347836B (zh) * 2019-07-15 2021-07-09 昆明理工大学 融入观点句特征的汉越双语新闻情感分类方法
CN110377739B (zh) * 2019-07-19 2022-03-04 出门问问(苏州)信息科技有限公司 文本情感分类方法、可读存储介质和电子设备
CN110442717A (zh) * 2019-08-08 2019-11-12 深巨科技(北京)有限公司 一种适应性情感分析系统及其方法
CN110472244B (zh) * 2019-08-14 2020-05-29 山东大学 一种基于Tree-LSTM和情感信息的短文本情感分类方法
CN110489555B (zh) * 2019-08-21 2022-03-08 创新工场(广州)人工智能研究有限公司 一种结合类词信息的语言模型预训练方法
CN110609899B (zh) * 2019-08-29 2022-04-19 成都信息工程大学 一种基于改进bert模型的特定目标情感分类方法
CN110569508A (zh) * 2019-09-10 2019-12-13 重庆邮电大学 融合词性和自注意力机制的情感倾向性分类方法及系统
CN110909167B (zh) * 2019-11-29 2022-07-01 重庆邮电大学 一种微博文本分类系统
CN111008527A (zh) * 2019-12-18 2020-04-14 成都迪普曼林信息技术有限公司 一种情感分析系统及方法
CN111241819B (zh) * 2020-01-07 2023-03-14 北京百度网讯科技有限公司 词向量生成方法、装置及电子设备
CN111414452B (zh) * 2020-02-29 2024-07-02 平安国际智慧城市科技股份有限公司 搜索词匹配方法、装置、电子设备及可读存储介质
CN111523301B (zh) * 2020-06-05 2023-05-05 泰康保险集团股份有限公司 合同文档合规性检查方法及装置
CN112183076A (zh) * 2020-08-28 2021-01-05 北京望石智慧科技有限公司 一种物质名称提取方法、装置及存储介质
CN112036184A (zh) * 2020-08-31 2020-12-04 湖南星汉数智科技有限公司 基于BiLSTM网络模型及CRF模型的实体识别方法、装置、计算机装置及存储介质
CN112100388B (zh) * 2020-11-18 2021-02-23 南京华苏科技有限公司 一种长文本新闻舆情的情感极性的分析方法
CN112541364A (zh) * 2020-12-03 2021-03-23 昆明理工大学 融合多层次语言特征知识的汉越神经机器翻译的方法
CN112926344B (zh) * 2021-03-13 2023-11-17 中国科学院新疆理化技术研究所 基于词向量替换数据增强的机器翻译模型训练方法、装置、电子设备及存储介质
CN113158644B (zh) * 2021-05-13 2022-09-20 山西大学 一种基于多任务学习的修辞格及隐式情绪识别方法
CN113254590B (zh) * 2021-06-15 2021-11-09 北京建筑大学 一种基于多核双层卷积神经网络的中文文本情绪分类方法
CN113362858B (zh) * 2021-07-27 2023-10-31 中国平安人寿保险股份有限公司 语音情感分类方法、装置、设备及介质
CN113553435B (zh) * 2021-09-22 2021-12-24 北京北大软件工程股份有限公司 智能标签的确定方法、装置、设备及存储介质
CN115017899B (zh) * 2022-04-19 2023-03-31 北京三快在线科技有限公司 一种缩略语生成方法、装置、设备及存储介质
CN115510860A (zh) * 2022-10-27 2022-12-23 苏州思萃人工智能研究所有限公司 一种文本情感分析方法、装置、电子设备及存储介质
CN115774993B (zh) * 2022-12-29 2023-09-08 广东南方网络信息科技有限公司 一种基于句法分析的条件类错误识别方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012134180A2 (ko) * 2011-03-28 2012-10-04 가톨릭대학교 산학협력단 문장에 내재한 감정 분석을 위한 감정 분류 방법 및 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법
CN106599933A (zh) * 2016-12-26 2017-04-26 哈尔滨工业大学 一种基于联合深度学习模型的文本情感分类方法
CN107092596A (zh) * 2017-04-24 2017-08-25 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107145483A (zh) * 2017-04-24 2017-09-08 北京邮电大学 一种基于嵌入式表示的自适应中文分词方法
CN107301171A (zh) * 2017-08-18 2017-10-27 武汉红茶数据技术有限公司 一种基于情感词典学习的文本情感分析方法和系统
CN108133038A (zh) * 2018-01-10 2018-06-08 重庆邮电大学 一种基于动态记忆网络的实体级别情感分类系统及方法
CN108733653A (zh) * 2018-05-18 2018-11-02 华中科技大学 一种基于融合词性和语义信息的Skip-gram模型的情感分析方法
CN108875021A (zh) * 2017-11-10 2018-11-23 云南大学 一种基于区域cnn-lstm的情感分析方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2511015A (en) * 2012-02-16 2014-08-20 Ibm Apparatus for analyzing text document, program, and method
US9595002B2 (en) * 2015-05-29 2017-03-14 Sas Institute Inc. Normalizing electronic communications using a vector having a repeating substring as input for a neural network

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012134180A2 (ko) * 2011-03-28 2012-10-04 가톨릭대학교 산학협력단 문장에 내재한 감정 분석을 위한 감정 분류 방법 및 컨텍스트 정보를 이용한 다중 문장으로부터의 감정 분류 방법
CN106599933A (zh) * 2016-12-26 2017-04-26 哈尔滨工业大学 一种基于联合深度学习模型的文本情感分类方法
CN107092596A (zh) * 2017-04-24 2017-08-25 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107145483A (zh) * 2017-04-24 2017-09-08 北京邮电大学 一种基于嵌入式表示的自适应中文分词方法
CN107301171A (zh) * 2017-08-18 2017-10-27 武汉红茶数据技术有限公司 一种基于情感词典学习的文本情感分析方法和系统
CN108875021A (zh) * 2017-11-10 2018-11-23 云南大学 一种基于区域cnn-lstm的情感分析方法
CN108133038A (zh) * 2018-01-10 2018-06-08 重庆邮电大学 一种基于动态记忆网络的实体级别情感分类系统及方法
CN108733653A (zh) * 2018-05-18 2018-11-02 华中科技大学 一种基于融合词性和语义信息的Skip-gram模型的情感分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
哈萨克语句法分析辅助特征提取研究;陈雪等;《中文信息学报》;20180815(第08期);全文 *
基于词向量与句法树的中文句子情感分析;相若晨等;《计算机与现代化》;20160812(第08期);全文 *
基于词向量技术和混合神经网络的情感分析;胡朝举等;《计算机应用研究》;20171212(第12期);全文 *

Also Published As

Publication number Publication date
CN109933795A (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
CN109933795B (zh) 基于上下文-情感词向量的文本情感分析系统
CN109284506B (zh) 一种基于注意力卷积神经网络的用户评论情感分析系统及方法
CN110609891B (zh) 一种基于上下文感知图神经网络的视觉对话生成方法
CN110162636B (zh) 基于d-lstm的情绪原因识别方法
CN110377903B (zh) 一种句子级实体和关系联合抽取方法
WO2018028077A1 (zh) 一种基于深度学习的中文语义分析的方法及装置
CN106599032B (zh) 一种结合稀疏编码和结构感知机的文本事件抽取方法
CN108549658B (zh) 一种基于语法分析树上注意力机制的深度学习视频问答方法及系统
CN110287320A (zh) 一种结合注意力机制的深度学习多分类情感分析模型
CN107025284A (zh) 网络评论文本情感倾向的识别方法及卷积神经网络模型
CN115329779B (zh) 一种多人对话情感识别方法
CN107797987B (zh) 一种基于Bi-LSTM-CNN的混合语料命名实体识别方法
CN112667818A (zh) 融合gcn与多粒度注意力的用户评论情感分析方法及系统
CN113268974B (zh) 多音字发音标注方法、装置、设备及存储介质
CN111400494A (zh) 一种基于GCN-Attention的情感分析方法
Madhfar et al. Effective deep learning models for automatic diacritization of Arabic text
CN110297986A (zh) 一种微博热点话题的情感倾向分析方法
CN113569553A (zh) 基于改进Adaboost算法的句子相似性判断方法
CN114722835A (zh) 基于lda和bert融合改进模型的文本情感识别方法
CN114254645A (zh) 一种人工智能辅助写作系统
Hidayatullah et al. Attention-based cnn-bilstm for dialect identification on javanese text
CN111353032B (zh) 面向社区问答的问题分类方法及系统
CN112560440A (zh) 一种基于深度学习的面向方面级情感分析的句法依赖方法
CN115906824A (zh) 一种文本细粒度情感分析方法、系统、介质和计算设备
CN115659981A (zh) 一种基于神经网络模型的命名实体识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant