CN105740349A - 一种结合Doc2vec和卷积神经网络的情感分类方法 - Google Patents

一种结合Doc2vec和卷积神经网络的情感分类方法 Download PDF

Info

Publication number
CN105740349A
CN105740349A CN201610049581.7A CN201610049581A CN105740349A CN 105740349 A CN105740349 A CN 105740349A CN 201610049581 A CN201610049581 A CN 201610049581A CN 105740349 A CN105740349 A CN 105740349A
Authority
CN
China
Prior art keywords
text
word
dictionary
classification
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610049581.7A
Other languages
English (en)
Other versions
CN105740349B (zh
Inventor
唐贤伦
周冲
周家林
刘庆
张娜
张毅
郭飞
刘想德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201610049581.7A priority Critical patent/CN105740349B/zh
Publication of CN105740349A publication Critical patent/CN105740349A/zh
Application granted granted Critical
Publication of CN105740349B publication Critical patent/CN105740349B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本发明请求保护一种结合Doc2vec和卷积神经网络的情感分类方法,该方法将Doc2vec和CNN进行有效的结合。该结合方法对于特征的表示,不但考虑到了词与词之间的语义关系,并且解决了维数灾难,还考虑到了词与词之间的顺序问题。CNN可以通过学习一种深层的非线性的网络结构来弥补浅层特征学习方法的不足,采用分布式表示输入数据的表征,展现了强大的特征学习能力,特征提取和模式分类可以同时进行,CNN模型的稀疏连接和权重共享两个特点可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强。结合Doc2vec和CNN来处理情感分类问题可显著提高情感分类的准确率。

Description

一种结合Doc2vec和卷积神经网络的情感分类方法
技术领域
本发明属于涉及情感分类方法领域,尤其涉及一种结合Doc2vec和卷积神经网络的情感分类方法。
背景技术
情感分析是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中。情感分类已经有很多有用的实践,比如企业分析消费者对产品的反馈信息,或者检测在线评论中的差评信息。常见的情感分类方法主要有支持向量机,最大熵以及随机游走等浅层学习方法。这些方法在建模的过程中使用的函数简单,计算方法也比较简单,容易实现而且计算量较小,在有限的样本和计算单元的条件下导致其对复杂函数的表达能力受到限制,同时对于复杂的分类问题,这些方法的泛化能力也在一定程度上受到制约。卷积神经网络(CNN)属于深层网络,深层网络可以通过学习一种深层的非线性的网络结构来弥补这一约束,深层网络采用分布式表示输入数据的表征,与此同时,深层网络也展现了它强大的特征学习能力,即其可以从少量的样本集中抓取到数据的本质特征。CNN不仅包含了深层网络的这些优点,并且可以特征提取和模式分类同时进行,而且CNN的模型有稀疏连接和权重共享这两个特点,可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强。
情感文本的向量表示一般有两种表达方式,One-hotRepresentation和DistributedRepresentation。One-hotRepresentation最大的问题是无法分析词与词之间的语义关系,此外这种方法还容易发生维数灾难。DistributedRepresentation方法则很好地克服了这些缺点,其中word2vec就是DistributedRepresentation的典型代表。虽然word2vec很好的分析了词与词之间的语义关系并且解决了维数灾难问题,但是没有考虑到词与词之间的顺序问题,因此不同的句子可能会有相同的表示,从而导致误判率较高。Doc2vec跟word2vec很相似,Doc2vec在word2vec的模型的基础上增加了一个段落向量(ParagraphId)。Doc2vec不但考虑到了词与词之间的语义关系,并且解决了维数灾难,还考虑到了词与词之间的顺序问题。所以,相对于其它方法,结合Doc2vec和卷积神经网络来处理情感分类问题可显著提高情感分类的准确率。
发明内容
针对以上现有技术的不足,提出了一种可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强、可显著提高情感分类的准确率的结合Doc2vec和卷积神经网络的情感分类方法。。本发明的技术方案如下:一种结合Doc2vec和卷积神经网络的情感分类方法,,其包括以下步骤:
步骤1:从网上搜集情感文本语料集,标记类别,将文本里的数据表示成一个句子,并将情感文本语料分为训练集语料和测试集语料;
步骤2:从网上搜集情感词典,并采用基于词典逆向最大匹配算法和统计分词策略相结合的中文分词算法对步骤1中的训练集语料和测试集语料进行分词处理,然后去除停用词;
步骤3:采用Doc2vec对步骤2中分词处理并去除停用词后的训练集语料和测试集语料训练出词向量模型并得到文本向量;
步骤4:将步骤3中的语料中的训练集语料的文本向量输入卷积神经网络CNN训练出情感分类模型;
步骤5:将步骤3中的测试集语料的文本向量输入卷积神经网络CNN,根据步骤4中已经训练好的情感分类模型进行情感类别分类并计算出情感分类的准确率。
进一步的,所述步骤1进行标记类别采用人工标记类别,将情感表现为积极情绪的文本标签设定为1,将情感表现为消极情绪的文本标签设定为2。并且去除文本的首尾空格。
进一步的,所述步骤2的情感词典分为正面情感词词典和负面情感词词典,分词处理包括分级构造分词词典,由核心词典和临时词典两部分构成分词词典集合;采用二级哈希结构存储构造核心词典,选取情感词典作为临时词典加载的语料,分词词典初步构成后,分词系统进入步骤3。
进一步的,对情感文本进行分词时,如果临时词典中有新统计的词,该词的词频加一,否则将该新词重新加入临时词典;累计词频后判断词频是否满足设定阈值,若满足则移到核心词典中,并在临时词典中清空该词条。统计记录学习情感文本的数量,若大于预定值,则清空临时词典;采用更新后的核心词典中的词条作为分词依据。
进一步的,步骤3使用Doc2vec中基于HierarchicalSoftmax算法的PV-DM模型,将步骤2中处理好的的语料输入模型中,把每个长度可变段落和对应段落中的每个词分别映射成唯一的段落向量和唯一的词向量,将所有文本向量和所有对应的词向量累加或者连接起来,作为输出层Softmax的输入。构建目标函数,在训练过程中保持文本向量不变,使用随机梯度上升法进行词向量更新,在预测阶段保持已经更新好的词向量和输出层Softmax的参数不变,重新利用随机梯度上升法训练待预测的文本,得到最终的文本向量并将这些文本向量处理成可以使用CNN的数据格式。
进一步的,所述步骤4具体为:首先构建完整的6层CNN网络,分别为文本向量层,卷积层,子采样层,卷积层,子采样层和全连接的softmax层;然后将步骤3中的语料中的训练集的文本向量输入到已经搭建好的卷积神经网络CNN模型中进行训练,训练分为两个阶段:首先是向前传播阶段,将样本输入卷积神经网络CNN网络,计算相应的实际输出Op;然后是向后传播阶段,计算出实际输出Op与相应的理想输出Yp的误差,再按极小化误差的方法反向传播调整权矩阵。经过两个阶段的训练后即得到训练好的情感分类模型。
进一步的,所述步骤5具体为:将步骤3中的语料中的测试集的文本向量输入CNN,根据步骤4中已经训练好的模型进行情感类别分类,如果实际输出文本的标签等于1,判定该文本表现的是积极情绪,如果实际输出文本的标签不等于1,即标签等于2,判定该文本表现的是消极情绪,统计实际输出文本的标签与期望输出文本的标签之间不同的个数,计算情感分类的准确率。
本发明的优点及有益效果如下:
本发明选用Doc2vec来表示特征,选用CNN来训练特征并完成分类。该两种方法相结合不仅解决了特征表示时词与词之间的语义关系问题,词与词之间的顺序问题和维数灾难问题,还考虑到了选用CNN来训练特征可以弥补浅层特征学习方法的不足。并且可以特征提取和模式分类同时进行,CNN模型的稀疏连接和权重共享两个特点可以减少网络的训练参数,使神经网络结构变得更简单,适应性更强。结合Doc2vec和CNN来处理情感分类问题可显著提高情感分类的准确率。
附图说明
图1是本发明提供优选实施例结合Doc2vec和卷积神经网络的情感分类方法。
具体实施方式
以下结合附图,对本发明作进一步说明:
如图1所示,如图1所示,本发明结合Doc2vec和CNN的情感分类方法的具体步骤是:
步骤1:搜集情感文本语料集,人工标记类别,如情感表现为积极情绪的文本标签为1,情感表现为消极情绪的文本标签为2。并且去除文本的首尾空格,将文本里的数据表示成一个句子,这样方便后续的处理工作。并将语料集分为训练集和测试集。训练集用来训练情感分类的模型,测试集用来测试模型分类的效果。
步骤2:首先搜集情感词典,情感词典是文本情感分析的基础资源,实际就是情感词的集合。从广义上讲,指包含感情倾向性的短语或者句子;从狭义上讲,指包含有感情倾向性的词语集合。情感词典一般包含两个部分,正面情感词词典和负面情感词词典。
然后对步骤1中的语料集进行中文分词,本文使用的分词方法是基于词典逆向最大匹配算法和统计分词策略相结合的中文分词算法。分级构造分词词典,由核心词典和临时词典两部分构成分词词典集合。统计出权威性的词条语料,采用二级哈希结构存储构造核心词典。选取情感词典作为临时词典加载的语料。分词词典初步构成后,分词系统进入自主学习的阶段,对情感文本进行分词时,如果临时词典中有新统计的词,该词的词频加一,否则将该新词重新加入临时词典。累计词频后判断词频是否满足设定阈值,若满足则移到核心词典中,并在临时词典中清空该词条。统计记录学习情感文本的数量,若大于预定值,则清空临时词典。采用更新后的核心词典中的词条作为分词依据,采用逆向最大匹配算法进行情感文本的分词。
分完词后,每个文本是由以空格隔开的单词组成的文本语料。然后搜集停用词表,人工删除停用词表中对实验有用的词汇,并根据停用词表去除分完词后的语料中的停用词。去除停用词是为了节省存储空间和提高效率。
步骤3:采用Doc2vec对步骤2中的语料训练出词向量模型并得到文本向量。Doc2vec是用来得到词和文本深层特征的浅层模型,它不但考虑到了各词之间的语义关系,而且也考虑到了词与词之间的顺序,能够很好的表示出词与文本的特征。Doc2vec用到两个重要的模型——PV-DBOW和PV-DM模型,针对PV-DBOW和PV-DM两种模型又给出了两套算法——HierarchicalSoftmax和NegativeSampling。本文使用基于HierarchicalSoftmax算法的PV-DM模型。PV-DM模型的输入是一个长度可变的段落(ParagraphId)和该段落中的所有单词(Words),本文中的ParagraphId代表的是情感文本。输出是根据ParagraphId和Words预测出的单词。
PV-DM模型的训练过程:
将每个ParagraphId和Words分别映射成唯一的段落向量(ParagraphVector)和唯一的词向量(WordVector),并且将所有ParagraphVector按列放入矩阵D和所有WordVector按列放入矩阵W中。将ParagraphVector和WordVector累加或者连接起来,作为输出层Softmax的输入。输出层Softmax是以ParagraphId中的词条作为叶子结点,词条在文本语料中出现的次数当作权值,构造的哈弗曼(Huffman)树。建立目标函数:
1 T Σ t = k T - k l o g p ( w t | w t - k , ... , w t + k ) - - - ( 1 )
其中T代表词向量的个数,wt,wt-k等代表每个词向量。
p ( w t | , w t - k , ... , w t + k ) = e y w t Σ i e y i - - - ( 2 )
每个yi是每个词向量i的未规范化对数概率,yi的计算公式为:
y=b+Uh(wt-k,...,wt+k;W,D)(3)其中U,b是Softmax的参数,h是由从D和W矩阵中提取的ParagraphVector和WordVector累加或者连接构成的。
在训练过程中,ParagraphId保持不变,文本中的所有单词共享着同一个ParagraphVector,相当于每次在预测单词的概率时,都利用了整个文本的语义。对这个目标函数进行优化,从而求得最优的词的向量表示。利用随机梯度上升法对上式的目标函数进行优化,得到迭代过程中词u的向量θu的更新公式为:
θ u = θ u + η [ L x ( u ) - σ ( w ( x ~ ) T θ u ) ] w ( x ~ ) - - - ( 4 )
的更新公式为:
θu∈Rn表示词u对应的一个辅助向量,Lx(u)表示词u的标签,表示词对应的向量,σ是一个逻辑回归函数,表示词的标签,η表示学习率。在迭代过程中词u的向量θu和词的向量都在原来的基础上进行了更新,使得向量对词的表达能力更强,向量随着更新而不断进化,向量的表示质量也随着提升。
在预测阶段,给待预测的文本重新分配一个ParagraphId,词向量和输出层Softmax的参数保持训练阶段得到的参数不变,重新利用随机梯度上升法训练待预测的文本。待收敛后,最终得到了文本的ParagraphVector。并将这些ParagraphVector处理成可以使用CNN的数据格式。
步骤4:将步骤3中的语料中的训练集的文本向量输入到CNN训练出情感分类模型。
首先需要构建完整的CNN网络。CNN与传统的神经网络有所不同,在CNN中,层与层之间的神经元节点不再是全连接形式,CNN利用层与层之间局部空间相关性,相邻每一层的神经元节点只与和它相近的上层神经元节点连接,这样大大降低了神经网络架构的参数规模。本文所用的CNN一共有6层:第一层为文本向量层,由于本文所训练的文本向量为100维,当文本向量映射到文本向量层时相当于生成一张10*10的图像。第二层是卷积层,多个卷积滤波器作用于文本向量层,每一个卷积滤波器共享相同的参数,包括相同的权重矩阵和偏置项,不同卷积滤波器生成不同的局部特征(featuremap)。共享权重的好处是在对图像进行特征提取时不用考虑局部特征的位置并且使CNN模型参数数量大大降低。在一个卷积层,上一层的特征maps被一个可学习的卷积核进行卷积,然后通过一个激活函数,就可以得到输出特征map。每一个输出map可能是组合卷积多个输入maps的值:
X j l = f ( Σ i ∈ M j X i l - 1 * k i j l + b j l ) - - - ( 6 )
这里表示第l层的j特征map,表示第l-1层的i特征map,Mj表示选择的输入maps的集合,为卷积核,是每一层唯一的偏移,f表示一个激活函数。第三层是子采样层,对于子采样层来说,有N个输入maps,就有N个输出maps,只是每个输出map都变小了。
X j l = f ( β j l d o w n ( X j l - 1 ) + b j l ) - - - ( 7 )
down(.)表示一个下采样函数,f表示一个激活函数,表示第l层的j特征map,表示第l-1层的i特征map,这里对输入文本的不同n*n的块的进行求和。因此输出文本在两个维度上都缩小了n倍。每个输出map都对应一个属于自己的乘性偏置β和一个加性偏置b。第四层和第五层依然是分别是卷积层和子采样层。第六层是一个全连接的Softmax层,得到每个类目的概率输出。
然后进行训练:训练分为两个阶段:向前传播阶段和向后传播阶段。
第一阶段,向前传播阶段:从样本集中取一个样本(X,Yp),将X输入网络,计算相应的实际输出Op。在此阶段,信息从输入层经过逐级的变换,传送到输出层。这个过程也是网络在完成训练后正常运行时执行的过程。在此过程中,网络执行的是计算(实际上就是输入与每层的权值矩阵相点乘,得到最后的输出结果):
Op=Fn(...(F2(F1(XpW(1))W(2))...)W(3))(8)
Fn代表CNN的第n层,W(n)表示第n层的权值。
第二阶段,向后传播阶段:计算实际输出Op与相应的理想输出Yp的差,
E N = 1 2 Σ n = 1 N Σ k = 1 c ( t k n - y k n ) 2 - - - ( 9 )
其中表示第n个样本对应的标签的第k维,表示第n个样本对应的网络输出的第k个输出,N表示训练样本的个数,c表示类别的个数(本文为两类)。按极小化误差的方法反向传播调整权矩阵。也就是通过对应的标签用BP算法来得到实际输出Op与相应的理想输出Yp的误差对网络权值的导数,然后再通过权值更新方法去更新权值。
ΔW l = - η ∂ E ∂ W l - - - ( 10 )
其中Wl代表l层的权值,η表示学习率,E表示误差。经过两个阶段的训练后即得到训练好的情感分类模型。
步骤5:将步骤3中的语料中的测试集的文本向量输入CNN,根据步骤4中已经训练好的模型进行情感类别分类,如果实际输出文本的标签等于1,判定该文本表现的是积极情绪,如果实际输出文本的标签不等于1(即标签等于2),判定该文本表现的是消极情绪,统计实际输出文本的标签与期望输出文本的标签之间不同的个数,计算情感分类的准确率。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

Claims (7)

1.一种结合Doc2vec和卷积神经网络的情感分类方法,其特征在于,包括以下步骤:
步骤1:从网上搜集情感文本语料集,标记类别,将文本里的数据表示成一个句子,并将情感文本语料分为训练集语料和测试集语料;
步骤2:从网上搜集情感词典,并采用基于词典逆向最大匹配算法和统计分词策略相结合的中文分词算法对步骤1中的训练集语料和测试集语料进行分词处理,然后去除停用词;
步骤3:采用Doc2vec对步骤2中分词处理并去除停用词后的训练集语料和测试集语料训练出词向量模型并得到文本向量;
步骤4:将步骤3中的语料中的训练集语料的文本向量输入卷积神经网络CNN训练出情感分类模型;
步骤5:将步骤3中的测试集语料的文本向量输入卷积神经网络CNN,根据步骤4中已经训练好的情感分类模型进行情感类别分类并计算出情感分类的准确率。
2.根据权利要求1所述的结合Doc2vec和卷积神经网络的情感分类方法,其特征在于,所述步骤1进行标记类别采用人工标记类别,将情感表现为积极情绪的文本标签设定为1,将情感表现为消极情绪的文本标签设定为2。并且去除文本的首尾空格。
3.根据权利要求1或2所述的结合Doc2vec和卷积神经网络的情感分类方法,,其特征在于,所述步骤2的情感词典分为正面情感词词典和负面情感词词典,分词处理包括分级构造分词词典,由核心词典和临时词典两部分构成分词词典集合;采用二级哈希结构存储构造核心词典,选取情感词典作为临时词典加载的语料,分词词典初步构成后,分词系统进入步骤3。
4.根据权利要求3所述的结合Doc2vec和卷积神经网络的情感分类方法,,其特征在于,对情感文本进行分词时,如果临时词典中有新统计的词,该词的词频加一,否则将该新词重新加入临时词典;累计词频后判断词频是否满足设定阈值,若满足则移到核心词典中,并在临时词典中清空该词条。统计记录学习情感文本的数量,若大于预定值,则清空临时词典;采用更新后的核心词典中的词条作为分词依据。
5.根据权利要求1所述的结合Doc2vec和卷积神经网络的情感分类方法,,其特征在于,步骤3使用Doc2vec中基于Hierarchical-Softmax算法的PV-DM模型,将步骤2中处理好的的语料输入模型中,把每个长度可变段落和对应段落中的每个词分别映射成唯一的段落向量和唯一的词向量,将所有文本向量和所有对应的词向量累加或者连接起来,作为输出层Softmax的输入。构建目标函数,在训练过程中保持文本向量不变,使用随机梯度上升法进行词向量更新,在预测阶段保持已经更新好的词向量和输出层Softmax的参数不变,重新利用随机梯度上升法训练待预测的文本,得到最终的文本向量并将这些文本向量处理成可以使用CNN的数据格式。
6.根据权利要求5所述的结合Doc2vec和卷积神经网络的情感分类方法,,其特征在于,所述步骤4具体为:首先构建完整的6层CNN网络,分别为文本向量层,卷积层,子采样层,卷积层,子采样层和全连接的softmax层;然后将步骤3中的语料中的训练集的文本向量输入到已经搭建好的卷积神经网络CNN模型中进行训练,训练分为两个阶段:首先是向前传播阶段,将样本输入卷积神经网络CNN网络,计算相应的实际输出Op;然后是向后传播阶段,计算出实际输出Op与相应的理想输出Yp的误差,再按极小化误差的方法反向传播调整权矩阵。经过两个阶段的训练后即得到训练好的情感分类模型。
7.根据权利要求5所述的结合Doc2vec和卷积神经网络的情感分类方法,,其特征在于,所述步骤5具体为:将步骤3中的语料中的测试集的文本向量输入CNN,根据步骤4中已经训练好的模型进行情感类别分类,如果实际输出文本的标签等于1,判定该文本表现的是积极情绪,如果实际输出文本的标签不等于1,即标签等于2,判定该文本表现的是消极情绪,统计实际输出文本的标签与期望输出文本的标签之间不同的个数,计算情感分类的准确率。
CN201610049581.7A 2016-01-25 2016-01-25 一种结合Doc2vec和卷积神经网络的情感分类方法 Active CN105740349B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610049581.7A CN105740349B (zh) 2016-01-25 2016-01-25 一种结合Doc2vec和卷积神经网络的情感分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610049581.7A CN105740349B (zh) 2016-01-25 2016-01-25 一种结合Doc2vec和卷积神经网络的情感分类方法

Publications (2)

Publication Number Publication Date
CN105740349A true CN105740349A (zh) 2016-07-06
CN105740349B CN105740349B (zh) 2019-03-08

Family

ID=56246561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610049581.7A Active CN105740349B (zh) 2016-01-25 2016-01-25 一种结合Doc2vec和卷积神经网络的情感分类方法

Country Status (1)

Country Link
CN (1) CN105740349B (zh)

Cited By (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095746A (zh) * 2016-06-01 2016-11-09 竹间智能科技(上海)有限公司 文字情感辨识系统及方法
CN106202044A (zh) * 2016-07-07 2016-12-07 武汉理工大学 一种基于深度神经网络的实体关系抽取方法
CN106339718A (zh) * 2016-08-18 2017-01-18 苏州大学 一种基于神经网络的分类方法及装置
CN106547885A (zh) * 2016-10-27 2017-03-29 桂林电子科技大学 一种文本分类系统及方法
CN106649276A (zh) * 2016-12-29 2017-05-10 北京京东尚科信息技术有限公司 标题中核心产品词的识别方法以及装置
CN106802888A (zh) * 2017-01-12 2017-06-06 北京航空航天大学 词向量训练方法和装置
TWI587156B (zh) * 2016-07-25 2017-06-11 元智大學 有效評估文章整體權重的方法及其系統
CN106844765A (zh) * 2017-02-22 2017-06-13 中国科学院自动化研究所 基于卷积神经网络的显著信息检测方法及装置
CN107025284A (zh) * 2017-04-06 2017-08-08 中南大学 网络评论文本情感倾向的识别方法及卷积神经网络模型
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法
CN107066446A (zh) * 2017-04-13 2017-08-18 广东工业大学 一种嵌入逻辑规则的循环神经网络文本情感分析方法
CN107085733A (zh) * 2017-05-15 2017-08-22 山东工商学院 基于cnn深度学习的近岸红外舰船识别方法
CN107092596A (zh) * 2017-04-24 2017-08-25 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107145503A (zh) * 2017-03-20 2017-09-08 中国农业大学 基于word2vec的远监督非分类关系提取方法及系统
CN107203511A (zh) * 2017-05-27 2017-09-26 中国矿业大学 一种基于神经网络概率消歧的网络文本命名实体识别方法
CN107229610A (zh) * 2017-03-17 2017-10-03 咪咕数字传媒有限公司 一种情感数据的分析方法及装置
CN107391483A (zh) * 2017-07-13 2017-11-24 武汉大学 一种基于卷积神经网络的商品评论数据情感分类方法
CN107526785A (zh) * 2017-07-31 2017-12-29 广州市香港科大霍英东研究院 文本分类方法及装置
CN107578092A (zh) * 2017-09-01 2018-01-12 广州智慧城市发展研究院 一种基于情绪和意见挖掘的情感复合分析方法及系统
CN107705806A (zh) * 2017-08-22 2018-02-16 北京联合大学 一种使用谱图和深卷积神经网络进行语音情感识别的方法
CN107807919A (zh) * 2017-11-15 2018-03-16 浙江大学 一种利用循环随机游走网络进行微博情感分类预测的方法
CN107862620A (zh) * 2017-12-11 2018-03-30 四川新网银行股份有限公司 一种基于社交数据的相似用户挖掘方法
CN107870964A (zh) * 2017-07-28 2018-04-03 北京中科汇联科技股份有限公司 一种应用于答案融合系统的语句排序方法及系统
CN107894994A (zh) * 2017-10-18 2018-04-10 北京京东尚科信息技术有限公司 一种检测热点话题类别的方法和装置
CN107967258A (zh) * 2017-11-23 2018-04-27 广州艾媒数聚信息咨询股份有限公司 文本信息的情感分析方法和系统
CN107992941A (zh) * 2017-12-28 2018-05-04 武汉璞华大数据技术有限公司 一种合同条款分类方法
CN108090070A (zh) * 2016-11-22 2018-05-29 北京高地信息技术有限公司 一种中文实体属性抽取方法
CN108108351A (zh) * 2017-12-05 2018-06-01 华南理工大学 一种基于深度学习组合模型的文本情感分类方法
CN108205522A (zh) * 2016-12-16 2018-06-26 北京酷我科技有限公司 情感标注的方法及其系统
CN108334605A (zh) * 2018-02-01 2018-07-27 腾讯科技(深圳)有限公司 文本分类方法、装置、计算机设备及存储介质
CN108345580A (zh) * 2017-01-22 2018-07-31 阿里巴巴集团控股有限公司 一种词向量处理方法及装置
CN108388651A (zh) * 2018-02-28 2018-08-10 北京理工大学 一种基于图核和卷积神经网络的文本分类方法
CN108446275A (zh) * 2018-03-21 2018-08-24 北京理工大学 基于注意力双层lstm的长文本情感倾向性分析方法
CN108491208A (zh) * 2018-01-31 2018-09-04 中山大学 一种基于神经网络模型的代码注释分类方法
CN108536781A (zh) * 2018-03-29 2018-09-14 武汉大学 一种社交网络情绪焦点的挖掘方法及系统
CN108595568A (zh) * 2018-04-13 2018-09-28 重庆邮电大学 一种基于极大无关多元逻辑回归的文本情感分类方法
CN108595429A (zh) * 2018-04-25 2018-09-28 杭州闪捷信息科技股份有限公司 基于深度卷积神经网络进行文本特征提取的方法
CN108804512A (zh) * 2018-04-20 2018-11-13 平安科技(深圳)有限公司 文本分类模型的生成装置、方法及计算机可读存储介质
CN108959924A (zh) * 2018-06-12 2018-12-07 浙江工业大学 一种基于词向量和深度神经网络的Android恶意代码检测方法
CN109003678A (zh) * 2018-06-12 2018-12-14 清华大学 一种仿真文本病历的生成方法及系统
CN109271493A (zh) * 2018-11-26 2019-01-25 腾讯科技(深圳)有限公司 一种语言文本处理方法、装置和存储介质
CN109375497A (zh) * 2018-12-29 2019-02-22 北京工业大学 基于卷积神经网络的可检测情绪变化的无线充电式智能手表
CN109492091A (zh) * 2018-09-28 2019-03-19 科大国创软件股份有限公司 一种基于卷积神经网络的投诉工单智能分类方法
CN109543176A (zh) * 2018-10-17 2019-03-29 中山大学 一种基于图向量表征的丰富短文本语义方法及装置
CN109710770A (zh) * 2019-01-31 2019-05-03 北京牡丹电子集团有限责任公司数字电视技术中心 一种基于迁移学习的文本分类方法及装置
CN109726268A (zh) * 2018-08-29 2019-05-07 中国人民解放军国防科技大学 基于分层神经网络的文本表示方法和装置
CN109783640A (zh) * 2018-12-20 2019-05-21 广州恒巨信息科技有限公司 一种类案推荐方法、系统及装置
CN109948665A (zh) * 2019-02-28 2019-06-28 中国地质大学(武汉) 基于长短时记忆神经网络的人体活动类型分类方法及系统
CN110046223A (zh) * 2019-03-13 2019-07-23 重庆邮电大学 基于改进型卷积神经网络模型的影评情感分析方法
CN110059181A (zh) * 2019-03-18 2019-07-26 中国科学院自动化研究所 面向大规模分类体系的短文本标签方法、系统、装置
CN110083700A (zh) * 2019-03-19 2019-08-02 北京中兴通网络科技股份有限公司 一种基于卷积神经网络的企业舆情情感分类方法及系统
CN110134720A (zh) * 2019-05-17 2019-08-16 苏州大学 融合局部特征与深度学习的事件联合抽取方法
CN110209815A (zh) * 2019-05-23 2019-09-06 国家计算机网络与信息安全管理中心 一种卷积神经网络的新闻用户兴趣挖掘方法
CN110232153A (zh) * 2019-05-29 2019-09-13 华南理工大学 一种基于内容的跨领域推荐方法
CN110261749A (zh) * 2019-07-24 2019-09-20 广东电网有限责任公司 一种gis局部放电故障识别模型构建方法、装置及故障识别方法
CN110413319A (zh) * 2019-08-01 2019-11-05 北京理工大学 一种基于深度语义的代码函数味道检测方法
CN110852060A (zh) * 2018-07-24 2020-02-28 中国科学院声学研究所 一种基于外部知识的情感迁移方法
CN111316281A (zh) * 2017-07-26 2020-06-19 舒辅医疗 基于机器学习的自然语言情境中数值数据的语义分类
CN111651597A (zh) * 2020-05-27 2020-09-11 福建博思软件股份有限公司 一种基于Doc2Vec和卷积神经网络的多源异构商品信息分类方法
CN111667192A (zh) * 2020-06-12 2020-09-15 北京卓越讯通科技有限公司 一种基于nlp大数据的安全生产风险评估方法
CN111813894A (zh) * 2020-06-30 2020-10-23 郑州信大先进技术研究院 一种基于深度学习的自然语言情感识别方法
CN112527966A (zh) * 2020-12-18 2021-03-19 重庆邮电大学 基于Bi-GRU神经网络和自注意力机制的网络文本情感分析方法
US10997403B1 (en) 2018-12-19 2021-05-04 First American Financial Corporation System and method for automated selection of best description from descriptions extracted from a plurality of data sources using numeric comparison and textual centrality measure
CN112988975A (zh) * 2021-04-09 2021-06-18 北京语言大学 一种基于albert和知识蒸馏的观点挖掘方法
US11048711B1 (en) 2018-12-19 2021-06-29 First American Financial Corporation System and method for automated classification of structured property description extracted from data source using numeric representation and keyword search

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127042A (zh) * 2007-09-21 2008-02-20 浙江大学 一种基于语言模型的情感分类方法
CN103530286A (zh) * 2013-10-31 2014-01-22 苏州大学 一种跨语言情感分类方法
US20150088894A1 (en) * 2013-09-20 2015-03-26 Oracle International Corporation Producing sentiment-aware results from a search query
CN104794212A (zh) * 2015-04-27 2015-07-22 清华大学 基于用户评论文本的上下文情感分类方法及分类系统
CN105045812A (zh) * 2015-06-18 2015-11-11 上海高欣计算机系统有限公司 文本主题的分类方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127042A (zh) * 2007-09-21 2008-02-20 浙江大学 一种基于语言模型的情感分类方法
US20150088894A1 (en) * 2013-09-20 2015-03-26 Oracle International Corporation Producing sentiment-aware results from a search query
CN103530286A (zh) * 2013-10-31 2014-01-22 苏州大学 一种跨语言情感分类方法
CN104794212A (zh) * 2015-04-27 2015-07-22 清华大学 基于用户评论文本的上下文情感分类方法及分类系统
CN105045812A (zh) * 2015-06-18 2015-11-11 上海高欣计算机系统有限公司 文本主题的分类方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韦航等: "基于主题的中文微博情感分析", 《计算机工程》 *

Cited By (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095746A (zh) * 2016-06-01 2016-11-09 竹间智能科技(上海)有限公司 文字情感辨识系统及方法
CN106202044A (zh) * 2016-07-07 2016-12-07 武汉理工大学 一种基于深度神经网络的实体关系抽取方法
TWI587156B (zh) * 2016-07-25 2017-06-11 元智大學 有效評估文章整體權重的方法及其系統
CN106339718A (zh) * 2016-08-18 2017-01-18 苏州大学 一种基于神经网络的分类方法及装置
CN106547885A (zh) * 2016-10-27 2017-03-29 桂林电子科技大学 一种文本分类系统及方法
CN106547885B (zh) * 2016-10-27 2020-04-10 桂林电子科技大学 一种文本分类系统及方法
CN108090070B (zh) * 2016-11-22 2021-08-24 湖南四方天箭信息科技有限公司 一种中文实体属性抽取方法
CN108090070A (zh) * 2016-11-22 2018-05-29 北京高地信息技术有限公司 一种中文实体属性抽取方法
CN108205522A (zh) * 2016-12-16 2018-06-26 北京酷我科技有限公司 情感标注的方法及其系统
CN106649276A (zh) * 2016-12-29 2017-05-10 北京京东尚科信息技术有限公司 标题中核心产品词的识别方法以及装置
CN106649276B (zh) * 2016-12-29 2019-02-26 北京京东尚科信息技术有限公司 标题中核心产品词的识别方法以及装置
CN106802888A (zh) * 2017-01-12 2017-06-06 北京航空航天大学 词向量训练方法和装置
US10878199B2 (en) 2017-01-22 2020-12-29 Advanced New Technologies Co., Ltd. Word vector processing for foreign languages
CN108345580B (zh) * 2017-01-22 2020-05-15 创新先进技术有限公司 一种词向量处理方法及装置
CN108345580A (zh) * 2017-01-22 2018-07-31 阿里巴巴集团控股有限公司 一种词向量处理方法及装置
CN106844765A (zh) * 2017-02-22 2017-06-13 中国科学院自动化研究所 基于卷积神经网络的显著信息检测方法及装置
CN106844765B (zh) * 2017-02-22 2019-12-20 中国科学院自动化研究所 基于卷积神经网络的显著信息检测方法及装置
CN107229610B (zh) * 2017-03-17 2019-06-21 咪咕数字传媒有限公司 一种情感数据的分析方法及装置
CN107229610A (zh) * 2017-03-17 2017-10-03 咪咕数字传媒有限公司 一种情感数据的分析方法及装置
CN107145503A (zh) * 2017-03-20 2017-09-08 中国农业大学 基于word2vec的远监督非分类关系提取方法及系统
CN107025284B (zh) * 2017-04-06 2020-10-27 中南大学 网络评论文本情感倾向的识别方法及卷积神经网络模型
CN107025284A (zh) * 2017-04-06 2017-08-08 中南大学 网络评论文本情感倾向的识别方法及卷积神经网络模型
CN107066446A (zh) * 2017-04-13 2017-08-18 广东工业大学 一种嵌入逻辑规则的循环神经网络文本情感分析方法
CN107092596A (zh) * 2017-04-24 2017-08-25 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107092596B (zh) * 2017-04-24 2020-08-04 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法
CN107085733A (zh) * 2017-05-15 2017-08-22 山东工商学院 基于cnn深度学习的近岸红外舰船识别方法
CN107203511B (zh) * 2017-05-27 2020-07-17 中国矿业大学 一种基于神经网络概率消歧的网络文本命名实体识别方法
CN107203511A (zh) * 2017-05-27 2017-09-26 中国矿业大学 一种基于神经网络概率消歧的网络文本命名实体识别方法
CN107391483A (zh) * 2017-07-13 2017-11-24 武汉大学 一种基于卷积神经网络的商品评论数据情感分类方法
CN111316281A (zh) * 2017-07-26 2020-06-19 舒辅医疗 基于机器学习的自然语言情境中数值数据的语义分类
CN111316281B (zh) * 2017-07-26 2024-01-23 舒辅医疗 基于机器学习的自然语言情境中数值数据的语义分类方法以及系统
CN107870964B (zh) * 2017-07-28 2021-04-09 北京中科汇联科技股份有限公司 一种应用于答案融合系统的语句排序方法及系统
CN107870964A (zh) * 2017-07-28 2018-04-03 北京中科汇联科技股份有限公司 一种应用于答案融合系统的语句排序方法及系统
CN107526785B (zh) * 2017-07-31 2020-07-17 广州市香港科大霍英东研究院 文本分类方法及装置
CN107526785A (zh) * 2017-07-31 2017-12-29 广州市香港科大霍英东研究院 文本分类方法及装置
CN107705806A (zh) * 2017-08-22 2018-02-16 北京联合大学 一种使用谱图和深卷积神经网络进行语音情感识别的方法
CN107578092A (zh) * 2017-09-01 2018-01-12 广州智慧城市发展研究院 一种基于情绪和意见挖掘的情感复合分析方法及系统
CN107894994A (zh) * 2017-10-18 2018-04-10 北京京东尚科信息技术有限公司 一种检测热点话题类别的方法和装置
CN107807919A (zh) * 2017-11-15 2018-03-16 浙江大学 一种利用循环随机游走网络进行微博情感分类预测的方法
CN107967258A (zh) * 2017-11-23 2018-04-27 广州艾媒数聚信息咨询股份有限公司 文本信息的情感分析方法和系统
CN108108351A (zh) * 2017-12-05 2018-06-01 华南理工大学 一种基于深度学习组合模型的文本情感分类方法
CN108108351B (zh) * 2017-12-05 2020-05-22 华南理工大学 一种基于深度学习组合模型的文本情感分类方法
CN107862620A (zh) * 2017-12-11 2018-03-30 四川新网银行股份有限公司 一种基于社交数据的相似用户挖掘方法
CN107992941A (zh) * 2017-12-28 2018-05-04 武汉璞华大数据技术有限公司 一种合同条款分类方法
CN108491208A (zh) * 2018-01-31 2018-09-04 中山大学 一种基于神经网络模型的代码注释分类方法
US11562145B2 (en) 2018-02-01 2023-01-24 Tencent Technology (Shenzhen) Company Limited Text classification method, computer device, and storage medium
WO2019149200A1 (zh) * 2018-02-01 2019-08-08 腾讯科技(深圳)有限公司 文本分类方法、计算机设备及存储介质
CN108334605A (zh) * 2018-02-01 2018-07-27 腾讯科技(深圳)有限公司 文本分类方法、装置、计算机设备及存储介质
CN108388651B (zh) * 2018-02-28 2021-09-28 北京理工大学 一种基于图核和卷积神经网络的文本分类方法
CN108388651A (zh) * 2018-02-28 2018-08-10 北京理工大学 一种基于图核和卷积神经网络的文本分类方法
CN108446275A (zh) * 2018-03-21 2018-08-24 北京理工大学 基于注意力双层lstm的长文本情感倾向性分析方法
CN108536781A (zh) * 2018-03-29 2018-09-14 武汉大学 一种社交网络情绪焦点的挖掘方法及系统
CN108536781B (zh) * 2018-03-29 2022-04-01 武汉大学 一种社交网络情绪焦点的挖掘方法及系统
CN108595568A (zh) * 2018-04-13 2018-09-28 重庆邮电大学 一种基于极大无关多元逻辑回归的文本情感分类方法
CN108595568B (zh) * 2018-04-13 2022-05-17 重庆邮电大学 一种基于极大无关多元逻辑回归的文本情感分类方法
CN108804512A (zh) * 2018-04-20 2018-11-13 平安科技(深圳)有限公司 文本分类模型的生成装置、方法及计算机可读存储介质
CN108804512B (zh) * 2018-04-20 2020-11-24 平安科技(深圳)有限公司 文本分类模型的生成装置、方法及计算机可读存储介质
CN108595429A (zh) * 2018-04-25 2018-09-28 杭州闪捷信息科技股份有限公司 基于深度卷积神经网络进行文本特征提取的方法
CN109003678A (zh) * 2018-06-12 2018-12-14 清华大学 一种仿真文本病历的生成方法及系统
CN108959924A (zh) * 2018-06-12 2018-12-07 浙江工业大学 一种基于词向量和深度神经网络的Android恶意代码检测方法
CN109003678B (zh) * 2018-06-12 2021-04-30 清华大学 一种仿真文本病历的生成方法及系统
CN110852060A (zh) * 2018-07-24 2020-02-28 中国科学院声学研究所 一种基于外部知识的情感迁移方法
CN110852060B (zh) * 2018-07-24 2021-05-18 中国科学院声学研究所 一种基于外部知识的情感迁移方法
CN109726268A (zh) * 2018-08-29 2019-05-07 中国人民解放军国防科技大学 基于分层神经网络的文本表示方法和装置
CN109492091A (zh) * 2018-09-28 2019-03-19 科大国创软件股份有限公司 一种基于卷积神经网络的投诉工单智能分类方法
CN109543176B (zh) * 2018-10-17 2023-01-20 中山大学 一种基于图向量表征的丰富短文本语义方法及装置
CN109543176A (zh) * 2018-10-17 2019-03-29 中山大学 一种基于图向量表征的丰富短文本语义方法及装置
CN109271493A (zh) * 2018-11-26 2019-01-25 腾讯科技(深圳)有限公司 一种语言文本处理方法、装置和存储介质
CN109271493B (zh) * 2018-11-26 2021-10-08 腾讯科技(深圳)有限公司 一种语言文本处理方法、装置和存储介质
US10997403B1 (en) 2018-12-19 2021-05-04 First American Financial Corporation System and method for automated selection of best description from descriptions extracted from a plurality of data sources using numeric comparison and textual centrality measure
US11790680B1 (en) 2018-12-19 2023-10-17 First American Financial Corporation System and method for automated selection of best description from descriptions extracted from a plurality of data sources using numeric comparison and textual centrality measure
US11232114B1 (en) 2018-12-19 2022-01-25 First American Financial Corporation System and method for automated classification of structured property description extracted from data source using numeric representation and keyword search
US11048711B1 (en) 2018-12-19 2021-06-29 First American Financial Corporation System and method for automated classification of structured property description extracted from data source using numeric representation and keyword search
CN109783640A (zh) * 2018-12-20 2019-05-21 广州恒巨信息科技有限公司 一种类案推荐方法、系统及装置
CN109375497A (zh) * 2018-12-29 2019-02-22 北京工业大学 基于卷积神经网络的可检测情绪变化的无线充电式智能手表
CN109710770A (zh) * 2019-01-31 2019-05-03 北京牡丹电子集团有限责任公司数字电视技术中心 一种基于迁移学习的文本分类方法及装置
CN109948665A (zh) * 2019-02-28 2019-06-28 中国地质大学(武汉) 基于长短时记忆神经网络的人体活动类型分类方法及系统
CN110046223B (zh) * 2019-03-13 2021-05-18 重庆邮电大学 基于改进型卷积神经网络模型的影评情感分析方法
CN110046223A (zh) * 2019-03-13 2019-07-23 重庆邮电大学 基于改进型卷积神经网络模型的影评情感分析方法
CN110059181A (zh) * 2019-03-18 2019-07-26 中国科学院自动化研究所 面向大规模分类体系的短文本标签方法、系统、装置
CN110059181B (zh) * 2019-03-18 2021-06-25 中国科学院自动化研究所 面向大规模分类体系的短文本标签方法、系统、装置
CN110083700A (zh) * 2019-03-19 2019-08-02 北京中兴通网络科技股份有限公司 一种基于卷积神经网络的企业舆情情感分类方法及系统
CN110134720A (zh) * 2019-05-17 2019-08-16 苏州大学 融合局部特征与深度学习的事件联合抽取方法
CN110209815A (zh) * 2019-05-23 2019-09-06 国家计算机网络与信息安全管理中心 一种卷积神经网络的新闻用户兴趣挖掘方法
CN110232153A (zh) * 2019-05-29 2019-09-13 华南理工大学 一种基于内容的跨领域推荐方法
CN110261749A (zh) * 2019-07-24 2019-09-20 广东电网有限责任公司 一种gis局部放电故障识别模型构建方法、装置及故障识别方法
CN110413319A (zh) * 2019-08-01 2019-11-05 北京理工大学 一种基于深度语义的代码函数味道检测方法
CN111651597A (zh) * 2020-05-27 2020-09-11 福建博思软件股份有限公司 一种基于Doc2Vec和卷积神经网络的多源异构商品信息分类方法
CN111667192A (zh) * 2020-06-12 2020-09-15 北京卓越讯通科技有限公司 一种基于nlp大数据的安全生产风险评估方法
CN111813894A (zh) * 2020-06-30 2020-10-23 郑州信大先进技术研究院 一种基于深度学习的自然语言情感识别方法
CN112527966A (zh) * 2020-12-18 2021-03-19 重庆邮电大学 基于Bi-GRU神经网络和自注意力机制的网络文本情感分析方法
CN112527966B (zh) * 2020-12-18 2022-09-20 重庆邮电大学 基于Bi-GRU神经网络和自注意力机制的网络文本情感分析方法
CN112988975A (zh) * 2021-04-09 2021-06-18 北京语言大学 一种基于albert和知识蒸馏的观点挖掘方法

Also Published As

Publication number Publication date
CN105740349B (zh) 2019-03-08

Similar Documents

Publication Publication Date Title
CN105740349A (zh) 一种结合Doc2vec和卷积神经网络的情感分类方法
CN105824922B (zh) 一种融合深层特征和浅层特征的情感分类方法
CN110020438B (zh) 基于序列识别的企业或组织中文名称实体消歧方法和装置
CN113239186B (zh) 一种基于多依存关系表示机制的图卷积网络关系抽取方法
CN108733837B (zh) 一种病历文本的自然语言结构化方法及装置
CN110516245A (zh) 细粒度情感分析方法、装置、计算机设备及存储介质
CN112199608B (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
CN110110080A (zh) 文本分类模型训练方法、装置、计算机设备及存储介质
Li et al. Improving convolutional neural network for text classification by recursive data pruning
CN111767725B (zh) 一种基于情感极性分析模型的数据处理方法及装置
CN110222188A (zh) 一种多任务学习的公司公告处理方法及服务端
CN108197294A (zh) 一种基于深度学习的文本自动生成方法
CN111881677A (zh) 基于深度学习模型的地址匹配算法
CN110929034A (zh) 一种基于改进lstm的商品评论细粒度情感分类方法
CN109359297A (zh) 一种关系抽取方法及系统
CN106682089A (zh) 一种基于RNNs的短信自动安全审核的方法
CN109101584A (zh) 一种将深度学习与数学分析相结合的句子分类改进方法
CN103324954A (zh) 一种基于树结构的图像分类方法及其系统
CN108920446A (zh) 一种工程文本的处理方法
CN112347245A (zh) 面向投融资领域机构的观点挖掘方法、装置和电子设备
CN107291837A (zh) 一种基于领域适应性的网络文本的分词方法
CN110245682A (zh) 一种基于话题的网络表示学习方法
Indra et al. Modeling of optimal deep learning based flood forecasting model using twitter data
CN112241785B (zh) 一种基于深度强化学习的图书采访方法
CN111666375B (zh) 文本相似度的匹配方法、电子设备和计算机可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant