CN108664632B - 一种基于卷积神经网络和注意力机制的文本情感分类算法 - Google Patents

一种基于卷积神经网络和注意力机制的文本情感分类算法 Download PDF

Info

Publication number
CN108664632B
CN108664632B CN201810459139.0A CN201810459139A CN108664632B CN 108664632 B CN108664632 B CN 108664632B CN 201810459139 A CN201810459139 A CN 201810459139A CN 108664632 B CN108664632 B CN 108664632B
Authority
CN
China
Prior art keywords
attention mechanism
vector
output
convolution
word vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810459139.0A
Other languages
English (en)
Other versions
CN108664632A (zh
Inventor
董敏
汤雪
毕盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201810459139.0A priority Critical patent/CN108664632B/zh
Publication of CN108664632A publication Critical patent/CN108664632A/zh
Application granted granted Critical
Publication of CN108664632B publication Critical patent/CN108664632B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于卷积神经网络和注意力机制的文本情感分类算法,包括步骤:1)建立包含多种卷积和池化的卷积神经网络,使用情感分类文本进行训练,得到第一个模型;2)建立加入残差连接和非线性的多头点积注意力机制,使用情感分类文本进行训练,得到第二个模型;3)对两个模型进行模型融合,得到文本的情感分类。本发明将多粒度、多种卷积、多种池化融入到卷积神经网络中,将残差连接和非线性引进注意力机制,并计算多次注意力,得到两个文本情感分类模型,通过Bagging模型融合方法,获得融合模型,对文本进行分类,能够结合卷积神经网络能较好地捕获局部特征和注意力机制能较好捕获全局信息的优点,得到更全面的文本情感分类模型。

Description

一种基于卷积神经网络和注意力机制的文本情感分类算法
技术领域
本发明涉及自然语言处理的文本分类领域,尤其是指一种基于卷积神经网络和注意力机制的文本情感分类算法。
背景技术
文本分类有多种应用,例如情感极性分类、主题分类等。针对文本分类,有多种常用的方法,例如基于词典和规则的无监督方法,基于机器学习的有监督方法。基于词典的方法,利用权威的词典,依照经验人工构造特征,模型准确率较高,但由于词典覆盖率较低,导致模型召回率较低。基于机器学习的有监督方法,利用SVM、最大熵模型、朴素贝叶斯、KNN等机器学习方法建模。这些机器学习方法较成熟,理论基础较为坚实,应用广泛,分类效果较好,但受限于文本规模。因为基于机器学习方法需要有类别标签的文本作为训练的输入,而文本的标签需要花费大量的人力物力,因此数据规模一般较小。最近,基于深度学习的方法引起广大学者的重视。基于深度学习的方法只需要少量标识文本和大量未标识文本即可。与传统的机器学习方法不同,基于深度学习的方法不需要手动构造特征,而是通过层次结构自动学习特征,高层的特征通过底层特征的不同组合方式构建,得到的特征具有更丰富的抽象表达能力。
获取输入文本句子的句向量的方法可以分成两类,一种方法是基于词向量的方法,通过不同的组合方式构造句向量,称为组合法。另一种是不通过词向量,直接训练句子得到句向量,称为分布法。
组合法中,可使用不同的神经网络结构组合句向量,例如卷积神经网络、循环神经网络等。卷积神经网络是一种经典的神经网络结构,具有局部感知和共享参数的特点,能够较好捕获到局部特征。但普通的卷积神经网络设定固定的过滤器和池化操作类型,捕获到的局部信息粒度固定、较为死板,缺少多样性。注意力机制是最近被提出用于机器翻译对齐问题的模型。注意力机制模拟人脑中的注意力机制,对重要的部分投放更多注意力,对不重要的部分投放更少注意力。在应用中,注意力机制一般作为卷积层或者循环层的下一层,与卷积神经网络和循环神经网络相结合使用。注意力机制能对句子上所有词语都分别计算权重,线性加权求和后得到句子表达特征,能提取较好的全局特征。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于卷积神经网络和注意力机制的文本情感分类算法,使用卷积神经网络和注意力机制两种模型进行模型融合,提高模型分类效果;另外,对卷积神经网络结构进行改造,引进多种卷积和池化,得到包含多粒度的局部隐含信息的文本特征表达。对于注意力机制,加入残差连接,再对其进行非线性变换,增加非线性。使用改造后的注意力机制建立多头注意力机制。所谓多头注意力机制就是并行地做多次注意力,每个注意力的线性变换权重不同,对所有注意力结果进行连接,得到最终的多头注意力结果。多头注意力能在不同的表示子空间里学习到不同的相关信息。最后,通过Bagging的模型融合方式融合两种模型,得到融合模型,对文本进行分类。
为实现上述目的,本发明所提供的技术方案为:一种基于卷积神经网络和注意力机制的文本情感分类算法,包括以下步骤:
1)建立包含多种卷积和池化的卷积神经网络,使用情感分类文本进行训练,得到第一个模型;
2)建立加入残差连接和非线性的多头点积注意力机制,使用情感分类文本进行训练,得到第二个模型;
3)对两个模型进行模型融合,得到文本的情感分类。
在步骤1)中,建立包含多种卷积和池化的卷积神经网络,包含以下步骤:
1.1)建立两种不同类型的卷积,第一种卷积的卷积核为整体卷积核,匹配整个词向量,第二种卷积的卷积核为单维卷积核,就是在词向量的每一维上进行匹配;假设句子输入sent∈Rlen×Dim是len个词语序列,每一个词语由Dim维词向量表示,senti∈RDim代表词语序列中第i个词向量,senti:j代表第i到j个包括第j个词向量的连接,
Figure BDA0001660444330000031
代表第i个词向量的第k维,
Figure BDA0001660444330000032
代表第i到j个包括第j个词向量的第k维;假设一个整体卷积核为w∈Rws ×Dim,其滑窗宽度为ws,b∈R为偏置,h为激活函数;当卷积核w应用于输入词语序列sent,w和sent内每一个长度为ws的词向量窗口进行内积,加上偏置值b,应用激活函数h,得到第一种卷积的输出向量c1∈R1+len-ws,其中第i项等于c1[i]=h(w⊙senti:i+ws-1+b),i∈[1,1+len-ws],⊙表示内积;假设一个应用于词向量的第k维的单维卷积核为单维卷积wk,wk∈Rws×1,ws为滑窗宽度,bk为偏置,h为激活函数;卷积核wk的输出向量ck∈R1+len-ws,其中第i项等于
Figure BDA0001660444330000033
合并词向量所有维度的输出向量,得到第二种卷积的最终输出c2=[c1,c2,...,cDim];
1.2)对卷积层两种卷积的输出c1和c2分别进行最大池化和平均池化;假设第一种卷积的输出向量c1∈R1+len-ws最大池化后的输出为
Figure BDA0001660444330000034
平均池化后的输出为
Figure BDA0001660444330000035
假设对第二种卷积的输出矩阵c2∈R(1+len-ws)×Dim的第j个词向量维度上的向量c2[j]∈R1 +len-ws进行最大池化后的结果为
Figure BDA0001660444330000036
平均池化后的结果为
Figure BDA0001660444330000037
对这两个值进行按位相减,再进行绝对值操作,
Figure BDA0001660444330000038
abs表示绝对值操作,得到输出为pj;合并所有维度的结果,得到输出向量为p∈RDim;假设对p进行最大池化,得到第二种卷积的最大池化后的最终输出为
Figure BDA0001660444330000039
平均池化后的最终输出为
Figure BDA00016604443300000310
连接两种卷积的四个池化输出值
Figure BDA00016604443300000311
Figure BDA0001660444330000041
Figure BDA0001660444330000042
得到池化层的最终输出向量
Figure BDA0001660444330000043
Figure BDA0001660444330000044
表示连接操作;
1.3)在卷积层使用不同滑窗宽度ws的卷积核。
在步骤2)中,所述多头点积注意力机制由多头注意力机制和点积注意力机制组成,所述多头注意力机制是指并性地做多次注意力,所述点积注意力机制是指使用点积计算输入每个时刻的注意力权重的注意力机制,建立加入残差连接和非线性的多头点积注意力机制,包括以下步骤:
2.1)建立加入残差连接和非线性的点积注意力机制;假设句子输入s∈Rlen×Dim是len个词语序列,每一个词语由Dim维词向量表示,si∈RDim代表词语序列中第i个词向量;假设第i个词向量的输入向量si的权重为w,对其进行内积,wi=w⊙si,⊙表示内积;获得每个词向量的注意力权重wi后,对其进行归一化,αi=softmax(wi),αi表示归一化后的第i个词向量的注意力权重;得到归一化的注意力概率后,加入残差连接,vi=αisi+si,即将权重αi与输入si相乘后,再加上输入si本身;再进行非线性变换,得到第i个词向量的输出向量vi=relu(vi),relu(x)表示非线性relu函数;最后,对所有词向量的输出向量进行求和,得到最终的点积注意力机制输出向量
Figure BDA0001660444330000045
其中v∈RDim
2.2)并性地做多次注意力;根据步骤2.1),多次建立加入残差连接和非线性的点积注意力机制,假设第j个注意力机制的权重为wj,其输出向量为vj,对所有注意力机制的输出向量进行连接,得到多头点积注意力机制的最终输出向量
Figure BDA0001660444330000046
Figure BDA0001660444330000047
表示连接操作,其中h表示多头注意力机制中的注意力个数,即并行地做多次注意力的次数。
在步骤3)中,对两个模型进行模型融合,得到文本最终的情感分类,其具体如下:
使用Bagging的模型融合方法,对两个模型进行模型融合,得到文本的最终类别; 假定数据集的类别数目为K,对于特定的样本x,第一个模型预测样本x属于各个类别的概率 为p1=[p1,p2,...,pK],其融合权重为λ1;第二个模型预测样本x属于各个类别的概率为p2= [p1,p2,...,pK],其融合权重为λ2;对于特定的样本x,其最终的预测属于各个类别的概率为 p=λ1p12p2;对于特定的样本x,其最终预测类别为预测其属于各个类别的概率向量p中最 大值对应的索引值
Figure BDA0001660444330000051
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明使用包含多种卷积和池化的卷积神经网络,引进多种卷积和池化操作,得到第一个文本分类模型,其能够捕获更全面的多粒度局部信息。
2、本发明使用的点积注意力机制,增加残差连接和非线性,并且并行地做多次注意力机制,得到第二个文本分类模型,其能提取整个句子较丰富全局信息。
3、本发明分别使用卷积神经网络和注意力机制建立文本情感分类模型,通过Bagging融合方法进行模型融合,结合了改造卷积神经网络能较好捕获丰富的局部特征和改造注意力机制能较好捕获丰富的全局特征的优点。
4、本发明通过模型融合方式,融合两种不同的文本情感分类模型,得到分类效果更好的融合模型。
附图说明
图1为本发明算法的基本流程图。
图2是本文使用的卷积神经网络的结构图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
参见图1和图2所示,本实施例所提供的基于卷积神经网络和注意力机制的文本情感分类算法,包括以下步骤:
1)建立包含多种卷积和池化的卷积神经网络,使用情感分类文本进行训练,得到第一个模型;其中,建立包含多种卷积和池化的卷积神经网络,包含以下步骤:
1.1)建立两种不同类型的卷积,第一种卷积的卷积核为整体卷积核,匹配整个词向量,第二种卷积的卷积核为单维卷积核,就是在词向量的每一维上进行匹配。假设句子输入sent∈Rlen×Dim是len个词语序列,每一个词语由Dim维词向量表示,senti∈RDim代表词语序列中第i个词向量,senti:j代表第i到j个包括第j个词向量的连接,
Figure BDA0001660444330000061
代表第i个词向量的第k维,
Figure BDA0001660444330000062
代表第i到j个包括第j个词向量的第k维。假设一个整体卷积核为w∈Rws ×Dim,其滑窗宽度为ws,b∈R为偏置,h为激活函数。当卷积核w应用于输入词语序列sent,w和sent内每一个长度为ws的词向量窗口进行内积,加上偏置值b,应用激活函数h,得到第一种卷积的输出向量c1∈R1+len-ws,其中第i项等于c1[i]=h(w⊙senti:i+ws-1+b),其中i∈[1,1+len-ws],⊙表示内积。假设一个应用于词向量的第k维的单维卷积核为单维卷积wk,wk∈Rws ×1,ws为滑窗宽度,bk为偏置,h为激活函数。卷积核wk的输出向量ck∈R1+len-ws,其中第i项等于
Figure BDA0001660444330000063
合并词向量所有维度的输出向量,得到第二种卷积的最终输出c2=[c1,c2,...,cDim];
1.2)对卷积层两种卷积的输出c1和c2分别进行最大池化和平均池化。假设第一种卷积的输出向量c1∈R1+len-ws最大池化后的输出为
Figure BDA0001660444330000064
平均池化后的输出为
Figure BDA0001660444330000065
假设对第二种卷积的输出矩阵c2∈R(1+len-ws)×Dim的第j个词向量维度上的向量c2[j]∈R1 +len-ws进行最大池化后的结果为
Figure BDA0001660444330000066
平均池化后的结果为
Figure BDA0001660444330000071
对这两个值进行按位相减,再进行绝对值操作,
Figure BDA0001660444330000072
abs表示绝对值操作,得到输出为pj。合并所有维度的结果,得到输出向量为p∈RDim。假设对p进行最大池化,得到第二种卷积的最大池化后的最终输出为
Figure BDA0001660444330000073
平均池化后的最终输出为
Figure BDA0001660444330000074
连接两种卷积的四个池化输出值
Figure BDA0001660444330000075
Figure BDA0001660444330000076
Figure BDA0001660444330000077
得到池化层的最终输出向量
Figure BDA0001660444330000078
Figure BDA0001660444330000079
表示连接操作;
1.3)在卷积层使用不同滑窗宽度ws的卷积核。
2)建立加入残差连接和非线性的多头点积注意力机制,使用情感分类文本进行训练,得到第二个模型;其中,所述多头点积注意力机制由多头注意力机制和点积注意力机制组成,所述多头注意力机制是指并性地做多次注意力,所述点积注意力机制是指使用点积计算输入每个时刻的注意力权重的注意力机制,建立加入残差连接和非线性的多头点积注意力机制,包括以下步骤:
2.1)建立加入残差连接和非线性的点积注意力机制。假设句子输入s∈Rlen×Dim是len个词语序列,每一个词语由Dim维词向量表示,si∈RDim代表词语序列中第i个词向量。假设第i个词向量的输入向量si的权重为w,对其进行内积,wi=w⊙si,⊙表示内积。获得每个词向量的注意力权重wi后,对其进行归一化,αi=softmax(wi),αi表示归一化后的第i个词向量的注意力权重。得到归一化的注意力概率后,加入残差连接,vi=αisi+si,即将权重αi与输入si相乘后,再加上输入si本身。再对进行非线性变换,得到第i个词向量的输出向量vi=relu(vi),relu(x)表示非线性relu函数。最后,对所有词向量的输出向量进行求和,得到最终的点积注意力机制输出向量
Figure BDA00016604443300000710
其中v∈RDim
2.2)并性地做多次注意力。根据步骤2.1)多次建立加入残差连接和非线性的点积注意力机制,假设第j个注意力机制的权重为wj,其输出向量为vj,对所有注意力机制的输出向量进行连接,得到多头点积注意力机制的最终输出向量
Figure BDA0001660444330000081
Figure BDA0001660444330000082
表示连接操作,其中h表示多头注意力机制中的注意力个数,即并行地做多次注意力的次数。
3)对两个模型进行模型融合,得到文本的情感分类,具体如下:
使用Bagging的模型融合方法,对步骤1)和2)得到的两个模型进行模型融合,得到文本的最终类别。假定数据集的类别数目为K,对于特定的样本x,第一个模型预测样本x属于各个类别的概率为p1=[p1,p2,...,pK],其融合权重为λ1。第二个模型预测样本x属于各个类别的概率为p2=[p1,p2,...,pK],其融合权重为λ2。对于特定的样本x,其最终的预测属于各个类别的概率为p=λ1p12p2。对于特定的样本x,其最终预测类别为预测其属于各个类别的概率向量p中最大值对应的索引值
Figure BDA0001660444330000083
综上所述,在采用以上方案后,本发明为基于深度学习的文本情感分类方法提供了新的分类思路,将多粒度、多种卷积、多种池化融入到卷积神经网络中,将残差连接和非线性引进注意力机制,并计算多次注意力,得到两个文本情感分类模型,通过Bagging模型融合方法,获得融合模型,对文本进行分类。本发明通过融合两种不同的模型,能够结合卷积神经网络能较好地捕获局部特征和注意力机制能较好捕获全局信息的优点,得到更全面的文本情感分类模型,提高分类效果,值得推广。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (3)

1.一种基于卷积神经网络和注意力机制的文本情感分类算法,其特征在于,包括以下步骤:
1)建立包含多种卷积和池化的卷积神经网络,使用情感分类文本进行训练,得到第一个模型;
2)建立加入残差连接和非线性的多头点积注意力机制,使用情感分类文本进行训练,得到第二个模型;
3)对两个模型进行模型融合,得到文本最终的情感分类,其具体如下:
使用Bagging的模型融合方法,对两个模型进行模型融合,得到文本的最终类别;假定数据集的类别数目为K,对于特定的样本x,第一个模型预测样本x属于各个类别的概率为p1=[p1,p2,...,pK],其融合权重为λ1;第二个模型预测样本x属于各个类别的概率为p2=[p1,p2,...,pK],其融合权重为λ2;对于特定的样本x,其最终的预测属于各个类别的概率为p=λ1p12p2;对于特定的样本x,其最终预测类别为预测其属于各个类别的概率向量p中最大值对应的索引值
Figure FDA0003121547160000011
2.根据权利要求1所述的一种基于卷积神经网络和注意力机制的文本情感分类算法,其特征在于:在步骤1)中,建立包含多种卷积和池化的卷积神经网络,包含以下步骤:
1.1)建立两种不同类型的卷积,第一种卷积的卷积核为整体卷积核,匹配整个词向量,第二种卷积的卷积核为单维卷积核,就是在词向量的每一维上进行匹配;假设句子输入sent∈Rlen×Dim是len个词语序列,每一个词语由Dim维词向量表示,senti∈RDim代表词语序列中第i个词向量,senti:j代表第i到j个包括第j个词向量的连接,
Figure FDA0003121547160000012
代表第i个词向量的第k维,
Figure FDA0003121547160000013
代表第i到j个包括第j个词向量的第k维;假设一个整体卷积核为w∈Rws ×Dim,其滑窗宽度为ws,b∈R为偏置,h为激活函数;当卷积核w应用于输入词语序列sent,w和sent内每一个长度为ws的词向量窗口进行内积,加上偏置值b,应用激活函数h,得到第一种卷积的输出向量c1∈R1+len-ws,其中第i项等于c1[i]=h(w⊙senti:i+ws-1+b),i∈[1,1+len-ws],⊙表示内积;假设一个应用于词向量的第k维的单维卷积核为单维卷积wk,wk∈Rws×1,ws为滑窗宽度,bk为偏置,h为激活函数;卷积核wk的输出向量ck∈R1+len-ws,其中第i项等于
Figure FDA0003121547160000021
合并词向量所有维度的输出向量,得到第二种卷积的最终输出c2=[c1,c2,...,cDim];
1.2)对卷积层两种卷积的输出c1和c2分别进行最大池化和平均池化;假设第一种卷积的输出向量c1∈R1+len-ws最大池化后的输出为
Figure FDA0003121547160000022
平均池化后的输出为
Figure FDA0003121547160000023
假设对第二种卷积的输出矩阵c2∈R(1+len-ws)×Dim的第j个词向量维度上的向量c2[j]∈R1+len-ws进行最大池化后的结果为
Figure FDA0003121547160000024
平均池化后的结果为
Figure FDA0003121547160000025
对这两个值进行按位相减,再进行绝对值操作,
Figure FDA0003121547160000026
abs表示绝对值操作,得到输出为pj;合并所有维度的结果,得到输出向量为p∈RDim;假设对p进行最大池化,得到第二种卷积的最大池化后的最终输出为
Figure FDA0003121547160000027
平均池化后的最终输出为
Figure FDA0003121547160000028
连接两种卷积的四个池化输出值
Figure FDA0003121547160000029
Figure FDA00031215471600000210
Figure FDA00031215471600000211
得到池化层的最终输出向量
Figure FDA00031215471600000212
Figure FDA00031215471600000213
表示连接操作;
1.3)在卷积层使用不同滑窗宽度ws的卷积核。
3.根据权利要求1所述的一种基于卷积神经网络和注意力机制的文本情感分类算法,其特征在于:在步骤2)中,所述多头点积注意力机制由多头注意力机制和点积注意力机制组成,所述多头注意力机制是指并性地做多次注意力,所述点积注意力机制是指使用点积计算输入每个时刻的注意力权重的注意力机制,建立加入残差连接和非线性的多头点积注意力机制,包括以下步骤:
2.1)建立加入残差连接和非线性的点积注意力机制;假设句子输入s∈Rlen×Dim是len个词语序列,每一个词语由Dim维词向量表示,si∈RDim代表词语序列中第i个词向量;假设第i个词向量的输入向量si的权重为w,对其进行内积,wi=w⊙si,⊙表示内积;获得每个词向量的注意力权重wi后,对其进行归一化,αi=softmax(wi),αi表示归一化后的第i个词向量的注意力权重;得到归一化的注意力概率后,加入残差连接,第i个词向量的输出向量vi=αisi+si,即将权重αi与输入si相乘后,再加上输入si本身;再进行非线性变换,得到第i个词向量的输出向量vi=relu(vi),relu(x)表示非线性relu函数;最后,对所有词向量的输出向量进行求和,得到最终的点积注意力机制输出向量
Figure FDA0003121547160000031
其中v∈RDim
2.2)并性地做多次注意力;根据步骤2.1),多次建立加入残差连接和非线性的点积注意力机制,假设第j个注意力机制的权重为wj,其输出向量为vj,对所有注意力机制的输出向量进行连接,得到多头点积注意力机制的最终输出向量
Figure FDA0003121547160000032
Figure FDA0003121547160000033
表示连接操作,其中h表示多头注意力机制中的注意力个数,即并行地做多次注意力的次数。
CN201810459139.0A 2018-05-15 2018-05-15 一种基于卷积神经网络和注意力机制的文本情感分类算法 Expired - Fee Related CN108664632B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810459139.0A CN108664632B (zh) 2018-05-15 2018-05-15 一种基于卷积神经网络和注意力机制的文本情感分类算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810459139.0A CN108664632B (zh) 2018-05-15 2018-05-15 一种基于卷积神经网络和注意力机制的文本情感分类算法

Publications (2)

Publication Number Publication Date
CN108664632A CN108664632A (zh) 2018-10-16
CN108664632B true CN108664632B (zh) 2021-09-21

Family

ID=63779409

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810459139.0A Expired - Fee Related CN108664632B (zh) 2018-05-15 2018-05-15 一种基于卷积神经网络和注意力机制的文本情感分类算法

Country Status (1)

Country Link
CN (1) CN108664632B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220335217A1 (en) * 2021-04-19 2022-10-20 International Business Machines Corporation Detecting contextual bias in text

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110612536B (zh) * 2017-05-19 2024-01-26 谷歌有限责任公司 神经机器翻译的逐深度可分离卷积
CN109257622A (zh) * 2018-11-01 2019-01-22 广州市百果园信息技术有限公司 一种音视频处理方法、装置、设备及介质
CN109447008B (zh) * 2018-11-02 2022-02-15 中山大学 基于注意力机制和可变形卷积神经网络的人群分析方法
CN109376246B (zh) * 2018-11-07 2022-07-08 中山大学 一种基于卷积神经网络和局部注意力机制的句子分类方法
CN109543180B (zh) * 2018-11-08 2020-12-04 中山大学 一种基于注意力机制的文本情感分析方法
CN109710800B (zh) * 2018-11-08 2021-05-25 北京奇艺世纪科技有限公司 模型生成方法、视频分类方法、装置、终端及存储介质
CN110162799B (zh) * 2018-11-28 2023-08-04 腾讯科技(深圳)有限公司 模型训练方法、机器翻译方法以及相关装置和设备
CN109284506B (zh) * 2018-11-29 2023-09-29 重庆邮电大学 一种基于注意力卷积神经网络的用户评论情感分析系统及方法
CN109801637A (zh) * 2018-12-03 2019-05-24 厦门快商通信息技术有限公司 基于隐藏因素的模型融合方法及系统
CN109446331B (zh) * 2018-12-07 2021-03-26 华中科技大学 一种文本情绪分类模型建立方法及文本情绪分类方法
CN109657246B (zh) * 2018-12-19 2020-10-16 中山大学 一种基于深度学习的抽取式机器阅读理解模型的建立方法
CN109886090B (zh) * 2019-01-07 2020-12-04 北京大学 一种基于多时间尺度卷积神经网络的视频行人再识别方法
CN109918630B (zh) * 2019-01-23 2023-08-04 平安科技(深圳)有限公司 文本生成方法、装置、计算机设备及存储介质
CN109829926B (zh) * 2019-01-30 2021-10-01 杭州鸿泉物联网技术股份有限公司 道路场景语义分割方法及装置
CN109902293B (zh) * 2019-01-30 2020-11-24 华南理工大学 一种基于局部与全局互注意力机制的文本分类方法
CN110134757B (zh) * 2019-04-19 2020-04-07 杭州电子科技大学 一种基于多头注意力机制的事件论元角色抽取方法
CN110084299B (zh) * 2019-04-24 2021-08-06 中国人民解放军国防科技大学 基于多头融合注意力的目标检测方法和装置
CN110083705B (zh) * 2019-05-06 2021-11-02 电子科技大学 一种用于目标情感分类的多跳注意力深度模型、方法、存储介质和终端
CN110263122B (zh) * 2019-05-08 2022-05-17 北京奇艺世纪科技有限公司 一种关键词获取方法、装置及计算机可读存储介质
CN110222149B (zh) * 2019-05-17 2021-07-27 华中科技大学 一种基于新闻舆情的时间序列预测方法
CN110196946B (zh) * 2019-05-29 2021-03-30 华南理工大学 一种基于深度学习的个性化推荐方法
CN110276082B (zh) * 2019-06-06 2023-06-30 百度在线网络技术(北京)有限公司 基于动态窗口的翻译处理方法和装置
CN110211685B (zh) * 2019-06-10 2020-08-28 珠海上工医信科技有限公司 基于完全关注机制的糖网筛查网络结构模型
CN110263280B (zh) * 2019-06-11 2021-03-23 浙江工业大学 一种基于多视图的动态链路预测深度模型及应用
CN110209824B (zh) * 2019-06-13 2021-06-22 中国科学院自动化研究所 基于组合模型的文本情感分析方法、系统、装置
CN110287969B (zh) * 2019-06-14 2022-09-16 大连理工大学 基于图残差注意力网络的摩尔文本图像二值化系统
CN110349676B (zh) * 2019-06-14 2021-10-29 华南师范大学 时序生理数据分类方法、装置、存储介质和处理器
CN110378335B (zh) * 2019-06-17 2021-11-19 杭州电子科技大学 一种基于神经网络的信息分析方法及模型
CN112446201A (zh) * 2019-08-12 2021-03-05 北京国双科技有限公司 文本的评论性质确定方法及装置
CN110393519B (zh) * 2019-08-19 2022-06-24 广州视源电子科技股份有限公司 心电信号的分析方法、装置、存储介质和处理器
CN110543569A (zh) * 2019-09-06 2019-12-06 四川长虹电器股份有限公司 用于短文本意图识别的网络层结构及短文本意图识别方法
CN111079532B (zh) * 2019-11-13 2021-07-13 杭州电子科技大学 一种基于文本自编码器的视频内容描述方法
CN110888944B (zh) * 2019-11-20 2023-04-28 中山大学 基于多卷积窗尺寸注意力卷积神经网络实体关系抽取方法
CN110874392B (zh) * 2019-11-20 2023-10-24 中山大学 基于深度双向注意力机制的文本网络信息融合嵌入方法
CN111080541B (zh) * 2019-12-06 2020-10-30 广东启迪图卫科技股份有限公司 基于比特分层和注意力融合机制的彩色图像去噪方法
CN111259142B (zh) * 2020-01-14 2020-12-25 华南师范大学 基于注意力编码和图卷积网络的特定目标情感分类方法
CN111259666A (zh) * 2020-01-15 2020-06-09 上海勃池信息技术有限公司 一种结合多头自注意力机制的cnn文本分类方法
CN111475642A (zh) * 2020-02-29 2020-07-31 新华三大数据技术有限公司 一种文本分类方法、装置及模型训练方法
CN111737467B (zh) * 2020-06-22 2023-05-23 华南师范大学 一种基于分段卷积神经网络的对象级情感分类方法
CN111858221A (zh) * 2020-07-28 2020-10-30 中国科学院微电子研究所 基于神经网络的高效指令测试序列生成方法及装置
CN112347150B (zh) * 2020-11-23 2021-08-31 北京智谱华章科技有限公司 一种学者学术标签标注方法、装置和电子设备
CN112434514B (zh) * 2020-11-25 2022-06-21 重庆邮电大学 基于多粒度多通道的神经网络的语义匹配方法、装置及计算机设备
CN112463924B (zh) * 2020-11-27 2022-07-05 齐鲁工业大学 面向智能问答基于内部相关性编码的文本意图匹配方法
CN112597764B (zh) * 2020-12-23 2023-07-25 青岛海尔科技有限公司 文本分类方法及装置、存储介质、电子装置
CN112651242B (zh) * 2021-01-20 2024-04-26 重庆大学 一种基于内外注意力机制和可变尺度卷积的文本分类方法
CN112818035B (zh) * 2021-01-29 2022-05-17 湖北工业大学 一种网络故障预测方法及终端设备及存储介质
CN113204640B (zh) * 2021-04-02 2023-05-30 南京邮电大学 一种基于注意力机制的文本分类方法
CN113297380A (zh) * 2021-05-27 2021-08-24 长春工业大学 基于自注意力机制和卷积神经网络的文本分类算法
CN113312452B (zh) * 2021-06-16 2022-05-27 哈尔滨工业大学 基于多任务学习的篇章级文本连贯性分类方法
CN113450830B (zh) * 2021-06-23 2024-03-08 东南大学 具有多重注意机制的卷积循环神经网络的语音情感识别方法
CN113453065A (zh) * 2021-07-01 2021-09-28 深圳市中科网威科技有限公司 一种基于深度学习的视频分段方法、系统、终端及介质
CN113641789B (zh) * 2021-08-11 2023-08-04 福州大学 基于分层融合多头注意力网络和卷积网络的观点检索方法及系统
CN113807470B (zh) * 2021-11-17 2022-02-25 腾讯科技(深圳)有限公司 一种车辆行驶状态确定方法和相关装置
CN114579743B (zh) * 2022-03-04 2024-06-14 合众新能源汽车股份有限公司 基于注意力的文本分类方法、装置及计算机可读介质
CN114648031A (zh) * 2022-03-30 2022-06-21 重庆邮电大学 基于双向lstm和多头注意力机制的文本方面级情感识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999516A (zh) * 2011-09-15 2013-03-27 北京百度网讯科技有限公司 一种文本分类的方法及装置
CN103049436A (zh) * 2011-10-12 2013-04-17 北京百度网讯科技有限公司 获取语料的方法及装置、生成翻译模型的方法及系统、机器翻译的方法及系统
CN105975478A (zh) * 2016-04-09 2016-09-28 北京交通大学 一种基于词向量分析的网络文章所属事件的检测方法和装置
CN107943967A (zh) * 2017-11-28 2018-04-20 华南理工大学 基于多角度卷积神经网络与循环神经网络的文本分类算法
CN107092596B (zh) * 2017-04-24 2020-08-04 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999516A (zh) * 2011-09-15 2013-03-27 北京百度网讯科技有限公司 一种文本分类的方法及装置
CN103049436A (zh) * 2011-10-12 2013-04-17 北京百度网讯科技有限公司 获取语料的方法及装置、生成翻译模型的方法及系统、机器翻译的方法及系统
CN105975478A (zh) * 2016-04-09 2016-09-28 北京交通大学 一种基于词向量分析的网络文章所属事件的检测方法和装置
CN107092596B (zh) * 2017-04-24 2020-08-04 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107943967A (zh) * 2017-11-28 2018-04-20 华南理工大学 基于多角度卷积神经网络与循环神经网络的文本分类算法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220335217A1 (en) * 2021-04-19 2022-10-20 International Business Machines Corporation Detecting contextual bias in text

Also Published As

Publication number Publication date
CN108664632A (zh) 2018-10-16

Similar Documents

Publication Publication Date Title
CN108664632B (zh) 一种基于卷积神经网络和注意力机制的文本情感分类算法
CN112487143B (zh) 一种基于舆情大数据分析的多标签文本分类方法
CN107943967B (zh) 基于多角度卷积神经网络与循环神经网络的文本分类算法
CN109284506B (zh) 一种基于注意力卷积神经网络的用户评论情感分析系统及方法
CN109271522B (zh) 基于深度混合模型迁移学习的评论情感分类方法及系统
CN110609899B (zh) 一种基于改进bert模型的特定目标情感分类方法
CN107562784A (zh) 基于ResLCNN模型的短文本分类方法
CN111881262B (zh) 基于多通道神经网络的文本情感分析方法
CN109189925A (zh) 基于点互信息的词向量模型和基于cnn的文本分类方法
CN112818861A (zh) 一种基于多模态上下文语义特征的情感分类方法及系统
CN112328767A (zh) 基于bert模型和比较聚合框架的问答匹配方法
CN113626589B (zh) 一种基于混合注意力机制的多标签文本分类方法
CN112732921B (zh) 一种虚假用户评论检测方法及系统
CN110866542A (zh) 一种基于特征可控融合的深度表示学习方法
CN112199504B (zh) 一种融合外部知识与交互注意力机制的视角级文本情感分类方法及系统
CN112699222B (zh) 基于量子启发式神经网络的文本分类方法及邮件分类方法
CN111723874A (zh) 一种基于宽度和深度神经网络的声场景分类方法
CN113591728A (zh) 基于集成深度学习的电能质量扰动分类方法
CN113254675B (zh) 基于自适应少样本关系抽取的知识图谱构建方法
CN114925205B (zh) 基于对比学习的gcn-gru文本分类方法
CN115526236A (zh) 一种基于多模态对比学习的文本网络图分类方法
CN113255366A (zh) 一种基于异构图神经网络的方面级文本情感分析方法
CN116976505A (zh) 基于信息共享的解耦注意网络的点击率预测方法
CN107944468A (zh) 基于隐空间编码的零样本学习分类方法
CN115032602A (zh) 一种基于多尺度卷积胶囊网络的雷达目标识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210921

CF01 Termination of patent right due to non-payment of annual fee