CN108536870A - 一种融合情感特征和语义特征的文本情感分类方法 - Google Patents

一种融合情感特征和语义特征的文本情感分类方法 Download PDF

Info

Publication number
CN108536870A
CN108536870A CN201810385091.3A CN201810385091A CN108536870A CN 108536870 A CN108536870 A CN 108536870A CN 201810385091 A CN201810385091 A CN 201810385091A CN 108536870 A CN108536870 A CN 108536870A
Authority
CN
China
Prior art keywords
text
emotion
ith
feature vector
computer text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810385091.3A
Other languages
English (en)
Other versions
CN108536870B (zh
Inventor
吴钟强
商琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201810385091.3A priority Critical patent/CN108536870B/zh
Publication of CN108536870A publication Critical patent/CN108536870A/zh
Application granted granted Critical
Publication of CN108536870B publication Critical patent/CN108536870B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种融合情感特征和语义特征的文本情感分类方法,包括:利用主题模型得到文本数据的主题概率分布,得到文本数据的语义特征,构建一种神经网络模型,训练神经网络,得到文本数据的情感特征,并利用文本的情感特征结合文本的语义特征进行文本情感倾向性的判别。对比现有的文本情感倾向性分析方法,本方法突出考虑了带有情感标签文本的情感特征和语义特征关系,并且能同时利用这两种信息进行情感倾向性的判别。在具体的数据集实验当中,可以得到更高的情感分类精度。

Description

一种融合情感特征和语义特征的文本情感分类方法
技术领域
本发明属于文本挖掘领域,尤其涉及一种融合情感特征和语义特征的文本情感分类方法。
背景技术
神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。作为机器学习中一种基于对数据进行表征学习的方法,已经在各个领域都取得了显著成功。可以自动进行特征提取工作,从而避免了大量特征工程的工作。由于其高效性,也已经成功地应用在自然语言处理等各个任务当中,如:机器翻译、序列标注、机器问答文本分类、情感分类等。
潜在狄利克雷分布是一种主题模型。已经广泛应用于在自然语言处理各个领域。通过图模型对文本进行建模,可以自动发现文本当中的潜在主题。潜在狄利克雷分布是一种无监督的模型,可以自动对文本的主题进行建模,从而捕捉文档当中的语义信息。
虽然使用神经网络模型对于情感分类已经获取了不错的效果,但目前大多数的方法都是直接使用带有情感类标的数据集,却忽略了不使用情感类标的语义信息。
发明内容
发明目的:本发明的目的是针对现有的神经网络用于情感分类没有考虑语义之间的特征,提出一种融合情感特征和语义特征的文本情感分类方法。
为实现上述目的,本发明公开了一种融合情感特征和语义特征的文本情感分类方法,包括以下步骤:
步骤一,使用无监督的方法处理计算机文本:使用主题模型潜在狄利克雷分布分别得到计算机文本的主题分布,获得文本的语义特征向量;
步骤二,使用神经网络的方法处理计算机文本:由神经网络模型训练带有情感标签的计算机文本,每一个计算机文本包含一个情感类标,情感类标为人工标注的文本情感类别,从而获得文本的情感特征向量;
步骤三,通过神经网络模型中的全连接层,将步骤一中的语义特征向量和步骤二中的情感特征向量进行拼接,得到拼接后的向量;
步骤四,将步骤三得到的拼接后的向量作为文本的新特征向量进行分类。
步骤一包括:
通过无监督的主题模型学习计算机文本集合D={d1,d2,…,dn}的主题分布,其中di表示计算机文本集合中的第i个文本,di=w1,w2,…,wm,其中wj表示计算机文本di中的第j个词,j=1,2,…,m,m表示第i个计算机文本di的总词数,对于第i个计算机文本、第k个主题的分布按照吉布斯采样的方式得到:
其中,为第i个计算机文本中除去第j个词之后属于第k个主题的词的数量,αk为狄利克雷分布的超参数,K为计算机文本的主题数;
通过上述公式学习得到第i个计算机文本的主题分布
其中,即为第i个计算机文本的语义特征向量,αk∈(0,1)表示第i个计算机文本中第k个主题的概率,且k∈[1,K]。
步骤二包括:
所用的神经网络模型为一个函数f(参考文献:Kim Y.Convolutional NeuralNetworks for Sentence Classification[J].Eprint Arxiv,2014.),则第i个计算机文本di的情感特征向量为Xi=f(di)=(xi1,xi2,…,xiT),其中T为情感特征向量的维度,xit为第i个计算机文本di情感特征向量的第t维,是一个浮点数,t取值为1~T。
步骤三包括以下步骤:
将第i个文本di的情感特征向量Xi和语义特征向量拼接得到文本的新特征向量X':
X'=(x1,x2,…,xT,a1,a2,…,aK)。
其中xi为第i个计算机文本的情感特征向量,且1≤i≤T。
步骤四包括:
根据文本的新特征向量X'=(x1,x2,…,xT,a1,a2,…,aK),经过神经网络模型中的全连接层,获得情感类标,神经网络模型中的类神经元的数量等于情感类标的数量,得到向量:(d1,d2,…,dC),其中di表示第i类的权重,C为情感类标的数量,且1≤i≤C,然后使用softmax函数进行归一化:
y’i为经过softmax函数归一化后的概率值,y’i表示计算机文本属于第i个情感类标的概率,e为自然常数,然后将y’i和真实的情感类标yi进行比较,计算损失函数,目标函数为:
其中为损失函数,min代表优化的目标是尽可能地最小化该损失函数。
根据最终训练的分类器模型,可以预测新的文本预测其情感类标。
本发明针对于现有的深度学习方法的不足,提出了一种融合语义特征的情感分类方法,从而提高文本情感分类的精度。因利用深度学习通过训练可以捕获不同情感标签的特征,这样的特征称之为情感特征向量。由于主题模型潜在狄利克雷分布(LatentDirichlet Allocation,LDA)方法的特点,可以在无监督的情况下捕捉语义信息,称之为语义特征。为了使得对一个文档特征的解读更加多样,本发明提出一种融合LDA语义特征和深度学习情感特征的情感分类方法。最后将融合的特征作为文本的新特征进行情感分类。
有益效果:本发明除了利用了深度学习模型抽取的情感特征,同时利用无监督主题模型LDA提取的语义特征,可以增加所提取特征的丰富性。而由于主题模型LDA是无监督模型,所以为较少的标注样本的情况下学习成为了可能。由于结合了情感特征和语义特征,可以增加模型的泛化性能与鲁棒性。在具体实施效果中,表现为提高文本情感分类的精度。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1是本发明方法的总体结构图。
图2是本发明方法中的潜在狄利克雷分布的图模型。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
如图1和图2(图2中,N表示文本数据集合中的文本数目。M表示文本数据集合中的词数目。K表示该主题模型所设的主题数目。wn,m代表观测变量,即文本数据当中的词,θn表示第n个文本数据的主题分布,zn,m表示第n个文本数据的第m个词所属的主题,表示第k个主题下的所有词,α和β为模型的超参数)所示,本发明公开了一种融合情感特征和语义特征的文本情感分类方法,包括以下步骤:
步骤一,使用无监督的方法处理计算机文本:使用主题模型潜在狄利克雷分布分别得到计算机文本的主题分布,获得文本的语义特征向量;
步骤二,使用神经网络的方法处理计算机文本:由神经网络模型训练带有情感标签的计算机文本,每一个计算机文本包含一个情感类标,情感类标为人工标注的文本情感类别,从而获得文本的情感特征向量;
步骤三,通过神经网络模型中的全连接层,将步骤一中的语义特征向量和步骤二中的情感特征向量进行拼接,得到拼接后的向量;
步骤四,将步骤三得到的拼接后的向量作为文本的新特征向量进行分类。
步骤一包括:
通过无监督的主题模型学习计算机文本集合D={d1,d2,…,dn}的主题分布,其中di表示计算机文本集合中的第i个文本,di=w1,w2,…,wm,其中wj表示计算机文本di中的第j个词,j=1,2,…,m,m表示第i个计算机文本di的总词数,对于第i个计算机文本、第k个主题的分布按照吉布斯采样的方式得到:
其中,为第i个计算机文本中除去第j个词之后属于第k个主题的词的数量,αk为狄利克雷分布的超参数,K为计算机文本的主题数;
通过上述公式学习得到第i个计算机文本的主题分布
其中,即为第i个计算机文本的语义特征向量,αk∈(0,1)表示第i个计算机文本中第k个主题的概率,且k∈[1,K]。
步骤二包括:
所用的神经网络模型为一个函数f(参考文献:Kim Y.Convolutional NeuralNetworks for Sentence Classification[J].Eprint Arxiv,2014.),则第i个计算机文本di的情感特征向量为Xi=f(di)=(xi1,xi2,…,xiT),其中T为情感特征向量的维度,xit为第i个计算机文本di情感特征向量的第t维,是一个浮点数,t取值为1~T。
步骤三包括以下步骤:
将第i个文本di的情感特征向量Xi和语义特征向量拼接得到文本的新特征向量X':
X'=(x1,x2,…,xT,a1,a2,…,aK)。
其中xi为第i个计算机文本的情感特征向量,且1≤i≤T。
步骤四包括:
根据文本的新特征向量X'=(x1,x2,…,xT,a1,a2,…,aK),经过神经网络模型中的全连接层,获得情感类标,神经网络模型中的类神经元的数量等于情感类标的数量,得到向量:(d1,d2,…,dC),其中di表示第i类的权重,C为情感类标的数量,且1≤i≤C,然后使用softmax函数进行归一化:
y’i为经过softmax函数归一化后的概率值,y’i表示计算机文本属于第i个情感类标的概率,然后将y’i和真实的情感类标yi进行比较,计算损失函数,目标函数为:
其中为损失函数,min代表优化的目标是尽可能地最小化该损失函数。
实施例:
本实例中选取IMDB影评部分数据集,利用本发明方法来说明流程及效果。
对于句子“I really enjoyed this movie。”(大意:我真的喜欢这部电影),其情感类标为正类。去除停用词和标点符号变为di=w1,w2,…,wm:d1={I,really,enjoyed,movie}。
对应上面的步骤:
1.利用如图2所示的主题模型LDA训练得到文档的主题分布即为第1个文本的语义特征向量。αk∈(0,1)表示该文本中第k个主题的概率,且k∈[1,K]。
2.使用神经网络模型训练上述带有情感类标的句子,取神经网络模型最后的全连接层得到该文本的情感特征向量X1=(x11,x12,…,x1T),其中T为情感特征向量的维度,x1t为改文本d1情感特征向量的第t维,是一个浮点数。
3.将文本d1的情感特征向量Xi和语义特征向量拼接得到该文本的新特征向量X':
X'=(x1,x2,…,xT,a1,a2,…,aK)。
4.根据该文本的新特征向量X'=(x1,x2,…,xT,a1,a2,…,aK),经过神经网络模型中的全连接层,获得情感类标,神经网络模型中的类神经元的数量等同于情感类标的数量。可以得到浮点数的值:(d1,d2,…,dC),其中di表示第i类的权重,C为情感类标的数量,且1≤i≤C。然后使用softmax函数进行归一化:
y’i为经过softmax函数归一化后的概率值,表示该文本属于第i个情感类标的概率。归一化后该文本的类别概率y’=(0.82,0.18),第一维度表示正类,第二维表示负类。由于正类的概率值大于负类的概率值,所以模型会将该样本归为正类情感类标。
实验所用的数据集如表1(数据集描述)所示。IMDB数据集来自文献(Maas A L,Daly R E,Pham P T,et al.Learning word vectors for sentiment analysis[C]//ACL,2011:142-150),Rotten Tomatoes数据集来自文献(Pang B,Lee L.Seeing stars:exploiting class relationships for sentiment categorization with respect torating scales[C]//ACL,2005:115-124.)。
表1
本文采用的基准模型为文本分类中常用的神经网络模型CNN(KimY.Convolutional Neural Networks for Sentence Classification[J].Eprint Arxiv,2014.)和LSTM(Hochreiter S,Schmidhuber J.Long Short-Term Memory[J].NeuralComputation,1997,9(8):1735-1780.)。实验结果如表2(不同方法的情感分类性能比较)所示,加粗的模型是本文提出的一种融合情感特征和语义特征的文本情感分类方法,从实验结果可以看出在融合了语义特征之后的模型分类精度都有所提升。
表2
本发明提供了一种融合情感特征和语义特征的文本情感分类方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (5)

1.一种融合情感特征和语义特征的文本情感分类方法,其特征在于,包括以下步骤:
步骤一,使用无监督的方法处理计算机文本:使用主题模型潜在狄利克雷分布得到计算机文本的主题分布,获得文本的语义特征向量;
步骤二,使用神经网络的方法处理计算机文本:由神经网络模型训练带有情感标签的计算机文本,每一个计算机文本包含一个情感类标,情感类标为人工标注的文本情感类别,从而获得文本的情感特征向量;
步骤三,通过神经网络模型中的全连接层,将步骤一中的语义特征向量和步骤二中的情感特征向量进行拼接,得到拼接后的向量;
步骤四,将步骤三得到的拼接后的向量作为文本的新特征向量进行分类。
2.根据权利要求1所述的方法,其特征在于,步骤一包括:
通过无监督的主题模型学习计算机文本集合D={d1,d2,…,dn}的主题分布,其中di表示计算机文本集合中的第i个文本,di=w1,w2,…,wm,其中wj表示第i个计算机文本di中的第j个词,j=1,2,…,m,m表示第i个计算机文本di的总词数,对于第i个计算机文本、第k个主题的分布按照吉布斯采样的方式得到:
其中,为第i个计算机文本中除去第j个词之后属于第k个主题的词的数量,αk为狄利克雷分布的超参数,K为计算机文本的主题数;
通过上述公式学习得到第i个计算机文本的主题分布
其中,即为第i个计算机文本的语义特征向量,αk∈(0,1)表示第i个计算机文本中第k个主题的概率,且k∈[1,K]。
3.根据权利要求2所述的方法,其特征在于,步骤二包括:
所用的神经网络模型为一个函数f,则第i个计算机文本di的情感特征向量为Xi=f(di)=(xi1,xi2,…,xiT),其中T为情感特征向量的维度,xit为第i个计算机文本di情感特征向量的第t维,是一个浮点数,t取值为1~T。
4.根据权利要求3所述的方法,其特征在于,步骤三包括以下步骤:
将第i个文本di的情感特征向量Xi和语义特征向量拼接得到文本的新特征向量X':
X′=(x1,x2,…,xT,a1,a2,…,aK),
其中xi为第i个计算机文本的情感特征向量,且1≤i≤T。
5.根据权利要求4所述的方法,其特征在于,步骤四包括:
根据文本的新特征向量X'=(x1,x2,…,xT,a1,a2,…,aK),经过神经网络模型中的全连接层,获得情感类标,神经网络模型中的类神经元的数量等于情感类标的数量,得到向量:(d1,d2,…,dC),其中di表示第i类的权重,C为情感类标的数量,且1≤i≤C,然后使用softmax函数进行归一化:
y’i为经过softmax函数归一化后的概率值,y’i表示计算机文本属于第i个情感类标的概率,e为自然常数,然后将y’i和真实的情感类标yi进行比较,计算损失函数,目标函数为:
其中为损失函数,min代表优化的目标是尽可能地最小化该损失函数。
CN201810385091.3A 2018-04-26 2018-04-26 一种融合情感特征和语义特征的文本情感分类方法 Active CN108536870B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810385091.3A CN108536870B (zh) 2018-04-26 2018-04-26 一种融合情感特征和语义特征的文本情感分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810385091.3A CN108536870B (zh) 2018-04-26 2018-04-26 一种融合情感特征和语义特征的文本情感分类方法

Publications (2)

Publication Number Publication Date
CN108536870A true CN108536870A (zh) 2018-09-14
CN108536870B CN108536870B (zh) 2022-06-07

Family

ID=63478190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810385091.3A Active CN108536870B (zh) 2018-04-26 2018-04-26 一种融合情感特征和语义特征的文本情感分类方法

Country Status (1)

Country Link
CN (1) CN108536870B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492101A (zh) * 2018-11-01 2019-03-19 山东大学 基于标签信息与文本特征的文本分类方法、系统及介质
CN109684478A (zh) * 2018-12-18 2019-04-26 腾讯科技(深圳)有限公司 分类模型训练方法、分类方法及装置、设备和介质
CN109697232A (zh) * 2018-12-28 2019-04-30 四川新网银行股份有限公司 一种基于深度学习的中文文本情感分析方法
CN109933664A (zh) * 2019-03-12 2019-06-25 中南大学 一种基于情感词嵌入的细粒度情绪分析改进方法
CN110162787A (zh) * 2019-05-05 2019-08-23 西安交通大学 一种基于主题信息的类别预测方法及装置
CN111159335A (zh) * 2019-12-12 2020-05-15 中国电子科技集团公司第七研究所 基于金字塔池化与lda主题模型的短文本分类方法
CN111160037A (zh) * 2019-12-02 2020-05-15 广州大学 一种支持跨语言迁移的细粒度情感分析方法
CN111339305A (zh) * 2020-03-20 2020-06-26 北京中科模识科技有限公司 文本分类方法、装置、电子设备及存储介质
CN111563167A (zh) * 2020-07-15 2020-08-21 智者四海(北京)技术有限公司 文本分类系统及方法
CN111859979A (zh) * 2020-06-16 2020-10-30 中国科学院自动化研究所 讽刺文本协同识别方法、装置、设备及计算机可读介质
CN112434166A (zh) * 2020-12-17 2021-03-02 网易传媒科技(北京)有限公司 基于时效性的文本分类方法、装置、设备及存储介质
CN112445898A (zh) * 2019-08-16 2021-03-05 阿里巴巴集团控股有限公司 对话情感分析方法及装置、存储介质及处理器
CN112560495A (zh) * 2020-12-09 2021-03-26 新疆师范大学 一种基于情感分析的微博谣言检测方法
CN113449099A (zh) * 2020-03-25 2021-09-28 瑞典爱立信有限公司 文本分类方法和文本分类设备
CN113792142A (zh) * 2021-09-07 2021-12-14 中国船舶重工集团公司第七0九研究所 基于多语义因素与特征聚合的目标用户隐性关系分类方法
CN113901208A (zh) * 2021-09-15 2022-01-07 昆明理工大学 融入主题特征的中越跨语言评论情感倾向性分析方法
CN118277575A (zh) * 2024-06-04 2024-07-02 湖南工商大学 一种用于文本情感分析的集成对比方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120253792A1 (en) * 2011-03-30 2012-10-04 Nec Laboratories America, Inc. Sentiment Classification Based on Supervised Latent N-Gram Analysis
CN103440235A (zh) * 2013-08-20 2013-12-11 中国科学院自动化研究所 一种基于认知结构模型的文本情感类型识别方法及装置
CN104794212A (zh) * 2015-04-27 2015-07-22 清华大学 基于用户评论文本的上下文情感分类方法及分类系统
US20150278195A1 (en) * 2014-03-31 2015-10-01 Abbyy Infopoisk Llc Text data sentiment analysis method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120253792A1 (en) * 2011-03-30 2012-10-04 Nec Laboratories America, Inc. Sentiment Classification Based on Supervised Latent N-Gram Analysis
CN103440235A (zh) * 2013-08-20 2013-12-11 中国科学院自动化研究所 一种基于认知结构模型的文本情感类型识别方法及装置
US20150278195A1 (en) * 2014-03-31 2015-10-01 Abbyy Infopoisk Llc Text data sentiment analysis method
CN104794212A (zh) * 2015-04-27 2015-07-22 清华大学 基于用户评论文本的上下文情感分类方法及分类系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NA FAN等: "Research on the Model of Multiple Levels for Determining Sentiment of Text", 《2008 IEEE PACIFIC-ASIA WORKSHOP ON COMPUTATIONAL INTELLIGENCE AND INDUSTRIAL APPLICATION》 *
彭云等: "基于语义约束LDA的商品特征和情感词提取", 《软件学报》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492101B (zh) * 2018-11-01 2020-11-17 山东大学 基于标签信息与文本特征的文本分类方法、系统及介质
CN109492101A (zh) * 2018-11-01 2019-03-19 山东大学 基于标签信息与文本特征的文本分类方法、系统及介质
US11853704B2 (en) 2018-12-18 2023-12-26 Tencent Technology (Shenzhen) Company Limited Classification model training method, classification method, device, and medium
CN109684478A (zh) * 2018-12-18 2019-04-26 腾讯科技(深圳)有限公司 分类模型训练方法、分类方法及装置、设备和介质
CN111339306B (zh) * 2018-12-18 2023-05-12 腾讯科技(深圳)有限公司 分类模型训练方法、分类方法及装置、设备和介质
WO2020125445A1 (zh) * 2018-12-18 2020-06-25 腾讯科技(深圳)有限公司 分类模型训练方法、分类方法、设备及介质
CN111339306A (zh) * 2018-12-18 2020-06-26 腾讯科技(深圳)有限公司 分类模型训练方法、分类方法及装置、设备和介质
CN109697232A (zh) * 2018-12-28 2019-04-30 四川新网银行股份有限公司 一种基于深度学习的中文文本情感分析方法
CN109697232B (zh) * 2018-12-28 2020-12-11 四川新网银行股份有限公司 一种基于深度学习的中文文本情感分析方法
CN109933664A (zh) * 2019-03-12 2019-06-25 中南大学 一种基于情感词嵌入的细粒度情绪分析改进方法
CN110162787A (zh) * 2019-05-05 2019-08-23 西安交通大学 一种基于主题信息的类别预测方法及装置
CN112445898A (zh) * 2019-08-16 2021-03-05 阿里巴巴集团控股有限公司 对话情感分析方法及装置、存储介质及处理器
CN111160037A (zh) * 2019-12-02 2020-05-15 广州大学 一种支持跨语言迁移的细粒度情感分析方法
CN111159335A (zh) * 2019-12-12 2020-05-15 中国电子科技集团公司第七研究所 基于金字塔池化与lda主题模型的短文本分类方法
CN111339305B (zh) * 2020-03-20 2023-04-14 北京中科模识科技有限公司 文本分类方法、装置、电子设备及存储介质
CN111339305A (zh) * 2020-03-20 2020-06-26 北京中科模识科技有限公司 文本分类方法、装置、电子设备及存储介质
CN113449099B (zh) * 2020-03-25 2024-02-23 瑞典爱立信有限公司 文本分类方法和文本分类设备
CN113449099A (zh) * 2020-03-25 2021-09-28 瑞典爱立信有限公司 文本分类方法和文本分类设备
CN111859979A (zh) * 2020-06-16 2020-10-30 中国科学院自动化研究所 讽刺文本协同识别方法、装置、设备及计算机可读介质
CN111563167A (zh) * 2020-07-15 2020-08-21 智者四海(北京)技术有限公司 文本分类系统及方法
CN112560495A (zh) * 2020-12-09 2021-03-26 新疆师范大学 一种基于情感分析的微博谣言检测方法
CN112560495B (zh) * 2020-12-09 2024-03-15 新疆师范大学 一种基于情感分析的微博谣言检测方法
CN112434166A (zh) * 2020-12-17 2021-03-02 网易传媒科技(北京)有限公司 基于时效性的文本分类方法、装置、设备及存储介质
CN113792142A (zh) * 2021-09-07 2021-12-14 中国船舶重工集团公司第七0九研究所 基于多语义因素与特征聚合的目标用户隐性关系分类方法
CN113792142B (zh) * 2021-09-07 2024-02-27 中国船舶重工集团公司第七0九研究所 基于多语义因素与特征聚合的目标用户隐性关系分类方法
CN113901208A (zh) * 2021-09-15 2022-01-07 昆明理工大学 融入主题特征的中越跨语言评论情感倾向性分析方法
CN113901208B (zh) * 2021-09-15 2022-07-29 昆明理工大学 融入主题特征的中越跨语言评论情感倾向性分析方法
CN118277575A (zh) * 2024-06-04 2024-07-02 湖南工商大学 一种用于文本情感分析的集成对比方法及装置

Also Published As

Publication number Publication date
CN108536870B (zh) 2022-06-07

Similar Documents

Publication Publication Date Title
CN108536870B (zh) 一种融合情感特征和语义特征的文本情感分类方法
Neculoiu et al. Learning text similarity with siamese recurrent networks
CN109753566B (zh) 基于卷积神经网络的跨领域情感分析的模型训练方法
CN111160037B (zh) 一种支持跨语言迁移的细粒度情感分析方法
CN106886580B (zh) 一种基于深度学习的图片情感极性分析方法
CN107590177B (zh) 一种结合监督学习的中文文本分类方法
CN106919673A (zh) 基于深度学习的文本情绪分析系统
CN108959305A (zh) 一种基于互联网大数据的事件抽取方法及系统
CN106294344A (zh) 视频检索方法和装置
US11366989B2 (en) Negative sampling algorithm for enhanced image classification
CN109086265A (zh) 一种语义训练方法、短文本中多语义词消歧方法
CN111222318A (zh) 基于双通道双向lstm-crf网络的触发词识别方法
CN114417851B (zh) 一种基于关键词加权信息的情感分析方法
CN112434164A (zh) 一种兼顾话题发现和情感分析的网络舆情分析方法及系统
Yirtici et al. Regional-CNN-based enhanced Turkish sign language recognition
Nguyen et al. Manga-mmtl: Multimodal multitask transfer learning for manga character analysis
CN113486143A (zh) 一种基于多层级文本表示及模型融合的用户画像生成方法
CN115563311B (zh) 一种文档标注和知识库管理方法及知识库管理系统
Tang et al. NITE: A neural inductive teaching framework for domain specific NER
Bjerva et al. Back to the future–temporal adaptation of text representations
Bjerva et al. Back to the future–sequential alignment of text representations
Dachapally et al. In-depth question classification using convolutional neural networks
CN115827871A (zh) 互联网企业分类的方法、装置和系统
CN115934936A (zh) 一种基于自然语言处理的智能交通文本分析方法
CN115906824A (zh) 一种文本细粒度情感分析方法、系统、介质和计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant