CN108536870A - 一种融合情感特征和语义特征的文本情感分类方法 - Google Patents
一种融合情感特征和语义特征的文本情感分类方法 Download PDFInfo
- Publication number
- CN108536870A CN108536870A CN201810385091.3A CN201810385091A CN108536870A CN 108536870 A CN108536870 A CN 108536870A CN 201810385091 A CN201810385091 A CN 201810385091A CN 108536870 A CN108536870 A CN 108536870A
- Authority
- CN
- China
- Prior art keywords
- text
- emotion
- ith
- feature vector
- computer text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000004927 fusion Effects 0.000 title abstract 2
- 230000008451 emotion Effects 0.000 claims abstract description 69
- 230000002996 emotional effect Effects 0.000 claims abstract description 23
- 238000003062 neural network model Methods 0.000 claims abstract description 22
- 238000013528 artificial neural network Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 61
- 230000006870 function Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 6
- 210000002569 neuron Anatomy 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 abstract description 2
- 230000004069 differentiation Effects 0.000 abstract 2
- 238000013135 deep learning Methods 0.000 description 3
- 238000005034 decoration Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000518 effect on emotion Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种融合情感特征和语义特征的文本情感分类方法,包括:利用主题模型得到文本数据的主题概率分布,得到文本数据的语义特征,构建一种神经网络模型,训练神经网络,得到文本数据的情感特征,并利用文本的情感特征结合文本的语义特征进行文本情感倾向性的判别。对比现有的文本情感倾向性分析方法,本方法突出考虑了带有情感标签文本的情感特征和语义特征关系,并且能同时利用这两种信息进行情感倾向性的判别。在具体的数据集实验当中,可以得到更高的情感分类精度。
Description
技术领域
本发明属于文本挖掘领域,尤其涉及一种融合情感特征和语义特征的文本情感分类方法。
背景技术
神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。作为机器学习中一种基于对数据进行表征学习的方法,已经在各个领域都取得了显著成功。可以自动进行特征提取工作,从而避免了大量特征工程的工作。由于其高效性,也已经成功地应用在自然语言处理等各个任务当中,如:机器翻译、序列标注、机器问答文本分类、情感分类等。
潜在狄利克雷分布是一种主题模型。已经广泛应用于在自然语言处理各个领域。通过图模型对文本进行建模,可以自动发现文本当中的潜在主题。潜在狄利克雷分布是一种无监督的模型,可以自动对文本的主题进行建模,从而捕捉文档当中的语义信息。
虽然使用神经网络模型对于情感分类已经获取了不错的效果,但目前大多数的方法都是直接使用带有情感类标的数据集,却忽略了不使用情感类标的语义信息。
发明内容
发明目的:本发明的目的是针对现有的神经网络用于情感分类没有考虑语义之间的特征,提出一种融合情感特征和语义特征的文本情感分类方法。
为实现上述目的,本发明公开了一种融合情感特征和语义特征的文本情感分类方法,包括以下步骤:
步骤一,使用无监督的方法处理计算机文本:使用主题模型潜在狄利克雷分布分别得到计算机文本的主题分布,获得文本的语义特征向量;
步骤二,使用神经网络的方法处理计算机文本:由神经网络模型训练带有情感标签的计算机文本,每一个计算机文本包含一个情感类标,情感类标为人工标注的文本情感类别,从而获得文本的情感特征向量;
步骤三,通过神经网络模型中的全连接层,将步骤一中的语义特征向量和步骤二中的情感特征向量进行拼接,得到拼接后的向量;
步骤四,将步骤三得到的拼接后的向量作为文本的新特征向量进行分类。
步骤一包括:
通过无监督的主题模型学习计算机文本集合D={d1,d2,…,dn}的主题分布,其中di表示计算机文本集合中的第i个文本,di=w1,w2,…,wm,其中wj表示计算机文本di中的第j个词,j=1,2,…,m,m表示第i个计算机文本di的总词数,对于第i个计算机文本、第k个主题的分布按照吉布斯采样的方式得到:
其中,为第i个计算机文本中除去第j个词之后属于第k个主题的词的数量,αk为狄利克雷分布的超参数,K为计算机文本的主题数;
通过上述公式学习得到第i个计算机文本的主题分布
其中,即为第i个计算机文本的语义特征向量,αk∈(0,1)表示第i个计算机文本中第k个主题的概率,且k∈[1,K]。
步骤二包括:
所用的神经网络模型为一个函数f(参考文献:Kim Y.Convolutional NeuralNetworks for Sentence Classification[J].Eprint Arxiv,2014.),则第i个计算机文本di的情感特征向量为Xi=f(di)=(xi1,xi2,…,xiT),其中T为情感特征向量的维度,xit为第i个计算机文本di情感特征向量的第t维,是一个浮点数,t取值为1~T。
步骤三包括以下步骤:
将第i个文本di的情感特征向量Xi和语义特征向量拼接得到文本的新特征向量X':
X'=(x1,x2,…,xT,a1,a2,…,aK)。
其中xi为第i个计算机文本的情感特征向量,且1≤i≤T。
步骤四包括:
根据文本的新特征向量X'=(x1,x2,…,xT,a1,a2,…,aK),经过神经网络模型中的全连接层,获得情感类标,神经网络模型中的类神经元的数量等于情感类标的数量,得到向量:(d1,d2,…,dC),其中di表示第i类的权重,C为情感类标的数量,且1≤i≤C,然后使用softmax函数进行归一化:
y’i为经过softmax函数归一化后的概率值,y’i表示计算机文本属于第i个情感类标的概率,e为自然常数,然后将y’i和真实的情感类标yi进行比较,计算损失函数,目标函数为:
其中为损失函数,min代表优化的目标是尽可能地最小化该损失函数。
根据最终训练的分类器模型,可以预测新的文本预测其情感类标。
本发明针对于现有的深度学习方法的不足,提出了一种融合语义特征的情感分类方法,从而提高文本情感分类的精度。因利用深度学习通过训练可以捕获不同情感标签的特征,这样的特征称之为情感特征向量。由于主题模型潜在狄利克雷分布(LatentDirichlet Allocation,LDA)方法的特点,可以在无监督的情况下捕捉语义信息,称之为语义特征。为了使得对一个文档特征的解读更加多样,本发明提出一种融合LDA语义特征和深度学习情感特征的情感分类方法。最后将融合的特征作为文本的新特征进行情感分类。
有益效果:本发明除了利用了深度学习模型抽取的情感特征,同时利用无监督主题模型LDA提取的语义特征,可以增加所提取特征的丰富性。而由于主题模型LDA是无监督模型,所以为较少的标注样本的情况下学习成为了可能。由于结合了情感特征和语义特征,可以增加模型的泛化性能与鲁棒性。在具体实施效果中,表现为提高文本情感分类的精度。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1是本发明方法的总体结构图。
图2是本发明方法中的潜在狄利克雷分布的图模型。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
如图1和图2(图2中,N表示文本数据集合中的文本数目。M表示文本数据集合中的词数目。K表示该主题模型所设的主题数目。wn,m代表观测变量,即文本数据当中的词,θn表示第n个文本数据的主题分布,zn,m表示第n个文本数据的第m个词所属的主题,表示第k个主题下的所有词,α和β为模型的超参数)所示,本发明公开了一种融合情感特征和语义特征的文本情感分类方法,包括以下步骤:
步骤一,使用无监督的方法处理计算机文本:使用主题模型潜在狄利克雷分布分别得到计算机文本的主题分布,获得文本的语义特征向量;
步骤二,使用神经网络的方法处理计算机文本:由神经网络模型训练带有情感标签的计算机文本,每一个计算机文本包含一个情感类标,情感类标为人工标注的文本情感类别,从而获得文本的情感特征向量;
步骤三,通过神经网络模型中的全连接层,将步骤一中的语义特征向量和步骤二中的情感特征向量进行拼接,得到拼接后的向量;
步骤四,将步骤三得到的拼接后的向量作为文本的新特征向量进行分类。
步骤一包括:
通过无监督的主题模型学习计算机文本集合D={d1,d2,…,dn}的主题分布,其中di表示计算机文本集合中的第i个文本,di=w1,w2,…,wm,其中wj表示计算机文本di中的第j个词,j=1,2,…,m,m表示第i个计算机文本di的总词数,对于第i个计算机文本、第k个主题的分布按照吉布斯采样的方式得到:
其中,为第i个计算机文本中除去第j个词之后属于第k个主题的词的数量,αk为狄利克雷分布的超参数,K为计算机文本的主题数;
通过上述公式学习得到第i个计算机文本的主题分布
其中,即为第i个计算机文本的语义特征向量,αk∈(0,1)表示第i个计算机文本中第k个主题的概率,且k∈[1,K]。
步骤二包括:
所用的神经网络模型为一个函数f(参考文献:Kim Y.Convolutional NeuralNetworks for Sentence Classification[J].Eprint Arxiv,2014.),则第i个计算机文本di的情感特征向量为Xi=f(di)=(xi1,xi2,…,xiT),其中T为情感特征向量的维度,xit为第i个计算机文本di情感特征向量的第t维,是一个浮点数,t取值为1~T。
步骤三包括以下步骤:
将第i个文本di的情感特征向量Xi和语义特征向量拼接得到文本的新特征向量X':
X'=(x1,x2,…,xT,a1,a2,…,aK)。
其中xi为第i个计算机文本的情感特征向量,且1≤i≤T。
步骤四包括:
根据文本的新特征向量X'=(x1,x2,…,xT,a1,a2,…,aK),经过神经网络模型中的全连接层,获得情感类标,神经网络模型中的类神经元的数量等于情感类标的数量,得到向量:(d1,d2,…,dC),其中di表示第i类的权重,C为情感类标的数量,且1≤i≤C,然后使用softmax函数进行归一化:
y’i为经过softmax函数归一化后的概率值,y’i表示计算机文本属于第i个情感类标的概率,然后将y’i和真实的情感类标yi进行比较,计算损失函数,目标函数为:
其中为损失函数,min代表优化的目标是尽可能地最小化该损失函数。
实施例:
本实例中选取IMDB影评部分数据集,利用本发明方法来说明流程及效果。
对于句子“I really enjoyed this movie。”(大意:我真的喜欢这部电影),其情感类标为正类。去除停用词和标点符号变为di=w1,w2,…,wm:d1={I,really,enjoyed,movie}。
对应上面的步骤:
1.利用如图2所示的主题模型LDA训练得到文档的主题分布即为第1个文本的语义特征向量。αk∈(0,1)表示该文本中第k个主题的概率,且k∈[1,K]。
2.使用神经网络模型训练上述带有情感类标的句子,取神经网络模型最后的全连接层得到该文本的情感特征向量X1=(x11,x12,…,x1T),其中T为情感特征向量的维度,x1t为改文本d1情感特征向量的第t维,是一个浮点数。
3.将文本d1的情感特征向量Xi和语义特征向量拼接得到该文本的新特征向量X':
X'=(x1,x2,…,xT,a1,a2,…,aK)。
4.根据该文本的新特征向量X'=(x1,x2,…,xT,a1,a2,…,aK),经过神经网络模型中的全连接层,获得情感类标,神经网络模型中的类神经元的数量等同于情感类标的数量。可以得到浮点数的值:(d1,d2,…,dC),其中di表示第i类的权重,C为情感类标的数量,且1≤i≤C。然后使用softmax函数进行归一化:
y’i为经过softmax函数归一化后的概率值,表示该文本属于第i个情感类标的概率。归一化后该文本的类别概率y’=(0.82,0.18),第一维度表示正类,第二维表示负类。由于正类的概率值大于负类的概率值,所以模型会将该样本归为正类情感类标。
实验所用的数据集如表1(数据集描述)所示。IMDB数据集来自文献(Maas A L,Daly R E,Pham P T,et al.Learning word vectors for sentiment analysis[C]//ACL,2011:142-150),Rotten Tomatoes数据集来自文献(Pang B,Lee L.Seeing stars:exploiting class relationships for sentiment categorization with respect torating scales[C]//ACL,2005:115-124.)。
表1
本文采用的基准模型为文本分类中常用的神经网络模型CNN(KimY.Convolutional Neural Networks for Sentence Classification[J].Eprint Arxiv,2014.)和LSTM(Hochreiter S,Schmidhuber J.Long Short-Term Memory[J].NeuralComputation,1997,9(8):1735-1780.)。实验结果如表2(不同方法的情感分类性能比较)所示,加粗的模型是本文提出的一种融合情感特征和语义特征的文本情感分类方法,从实验结果可以看出在融合了语义特征之后的模型分类精度都有所提升。
表2
本发明提供了一种融合情感特征和语义特征的文本情感分类方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (5)
1.一种融合情感特征和语义特征的文本情感分类方法,其特征在于,包括以下步骤:
步骤一,使用无监督的方法处理计算机文本:使用主题模型潜在狄利克雷分布得到计算机文本的主题分布,获得文本的语义特征向量;
步骤二,使用神经网络的方法处理计算机文本:由神经网络模型训练带有情感标签的计算机文本,每一个计算机文本包含一个情感类标,情感类标为人工标注的文本情感类别,从而获得文本的情感特征向量;
步骤三,通过神经网络模型中的全连接层,将步骤一中的语义特征向量和步骤二中的情感特征向量进行拼接,得到拼接后的向量;
步骤四,将步骤三得到的拼接后的向量作为文本的新特征向量进行分类。
2.根据权利要求1所述的方法,其特征在于,步骤一包括:
通过无监督的主题模型学习计算机文本集合D={d1,d2,…,dn}的主题分布,其中di表示计算机文本集合中的第i个文本,di=w1,w2,…,wm,其中wj表示第i个计算机文本di中的第j个词,j=1,2,…,m,m表示第i个计算机文本di的总词数,对于第i个计算机文本、第k个主题的分布按照吉布斯采样的方式得到:
其中,为第i个计算机文本中除去第j个词之后属于第k个主题的词的数量,αk为狄利克雷分布的超参数,K为计算机文本的主题数;
通过上述公式学习得到第i个计算机文本的主题分布
其中,即为第i个计算机文本的语义特征向量,αk∈(0,1)表示第i个计算机文本中第k个主题的概率,且k∈[1,K]。
3.根据权利要求2所述的方法,其特征在于,步骤二包括:
所用的神经网络模型为一个函数f,则第i个计算机文本di的情感特征向量为Xi=f(di)=(xi1,xi2,…,xiT),其中T为情感特征向量的维度,xit为第i个计算机文本di情感特征向量的第t维,是一个浮点数,t取值为1~T。
4.根据权利要求3所述的方法,其特征在于,步骤三包括以下步骤:
将第i个文本di的情感特征向量Xi和语义特征向量拼接得到文本的新特征向量X':
X′=(x1,x2,…,xT,a1,a2,…,aK),
其中xi为第i个计算机文本的情感特征向量,且1≤i≤T。
5.根据权利要求4所述的方法,其特征在于,步骤四包括:
根据文本的新特征向量X'=(x1,x2,…,xT,a1,a2,…,aK),经过神经网络模型中的全连接层,获得情感类标,神经网络模型中的类神经元的数量等于情感类标的数量,得到向量:(d1,d2,…,dC),其中di表示第i类的权重,C为情感类标的数量,且1≤i≤C,然后使用softmax函数进行归一化:
y’i为经过softmax函数归一化后的概率值,y’i表示计算机文本属于第i个情感类标的概率,e为自然常数,然后将y’i和真实的情感类标yi进行比较,计算损失函数,目标函数为:
其中为损失函数,min代表优化的目标是尽可能地最小化该损失函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810385091.3A CN108536870B (zh) | 2018-04-26 | 2018-04-26 | 一种融合情感特征和语义特征的文本情感分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810385091.3A CN108536870B (zh) | 2018-04-26 | 2018-04-26 | 一种融合情感特征和语义特征的文本情感分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108536870A true CN108536870A (zh) | 2018-09-14 |
CN108536870B CN108536870B (zh) | 2022-06-07 |
Family
ID=63478190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810385091.3A Active CN108536870B (zh) | 2018-04-26 | 2018-04-26 | 一种融合情感特征和语义特征的文本情感分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108536870B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492101A (zh) * | 2018-11-01 | 2019-03-19 | 山东大学 | 基于标签信息与文本特征的文本分类方法、系统及介质 |
CN109684478A (zh) * | 2018-12-18 | 2019-04-26 | 腾讯科技(深圳)有限公司 | 分类模型训练方法、分类方法及装置、设备和介质 |
CN109697232A (zh) * | 2018-12-28 | 2019-04-30 | 四川新网银行股份有限公司 | 一种基于深度学习的中文文本情感分析方法 |
CN109933664A (zh) * | 2019-03-12 | 2019-06-25 | 中南大学 | 一种基于情感词嵌入的细粒度情绪分析改进方法 |
CN110162787A (zh) * | 2019-05-05 | 2019-08-23 | 西安交通大学 | 一种基于主题信息的类别预测方法及装置 |
CN111159335A (zh) * | 2019-12-12 | 2020-05-15 | 中国电子科技集团公司第七研究所 | 基于金字塔池化与lda主题模型的短文本分类方法 |
CN111160037A (zh) * | 2019-12-02 | 2020-05-15 | 广州大学 | 一种支持跨语言迁移的细粒度情感分析方法 |
CN111339305A (zh) * | 2020-03-20 | 2020-06-26 | 北京中科模识科技有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN111563167A (zh) * | 2020-07-15 | 2020-08-21 | 智者四海(北京)技术有限公司 | 文本分类系统及方法 |
CN111859979A (zh) * | 2020-06-16 | 2020-10-30 | 中国科学院自动化研究所 | 讽刺文本协同识别方法、装置、设备及计算机可读介质 |
CN112434166A (zh) * | 2020-12-17 | 2021-03-02 | 网易传媒科技(北京)有限公司 | 基于时效性的文本分类方法、装置、设备及存储介质 |
CN112445898A (zh) * | 2019-08-16 | 2021-03-05 | 阿里巴巴集团控股有限公司 | 对话情感分析方法及装置、存储介质及处理器 |
CN112560495A (zh) * | 2020-12-09 | 2021-03-26 | 新疆师范大学 | 一种基于情感分析的微博谣言检测方法 |
CN113449099A (zh) * | 2020-03-25 | 2021-09-28 | 瑞典爱立信有限公司 | 文本分类方法和文本分类设备 |
CN113792142A (zh) * | 2021-09-07 | 2021-12-14 | 中国船舶重工集团公司第七0九研究所 | 基于多语义因素与特征聚合的目标用户隐性关系分类方法 |
CN113901208A (zh) * | 2021-09-15 | 2022-01-07 | 昆明理工大学 | 融入主题特征的中越跨语言评论情感倾向性分析方法 |
CN118277575A (zh) * | 2024-06-04 | 2024-07-02 | 湖南工商大学 | 一种用于文本情感分析的集成对比方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120253792A1 (en) * | 2011-03-30 | 2012-10-04 | Nec Laboratories America, Inc. | Sentiment Classification Based on Supervised Latent N-Gram Analysis |
CN103440235A (zh) * | 2013-08-20 | 2013-12-11 | 中国科学院自动化研究所 | 一种基于认知结构模型的文本情感类型识别方法及装置 |
CN104794212A (zh) * | 2015-04-27 | 2015-07-22 | 清华大学 | 基于用户评论文本的上下文情感分类方法及分类系统 |
US20150278195A1 (en) * | 2014-03-31 | 2015-10-01 | Abbyy Infopoisk Llc | Text data sentiment analysis method |
-
2018
- 2018-04-26 CN CN201810385091.3A patent/CN108536870B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120253792A1 (en) * | 2011-03-30 | 2012-10-04 | Nec Laboratories America, Inc. | Sentiment Classification Based on Supervised Latent N-Gram Analysis |
CN103440235A (zh) * | 2013-08-20 | 2013-12-11 | 中国科学院自动化研究所 | 一种基于认知结构模型的文本情感类型识别方法及装置 |
US20150278195A1 (en) * | 2014-03-31 | 2015-10-01 | Abbyy Infopoisk Llc | Text data sentiment analysis method |
CN104794212A (zh) * | 2015-04-27 | 2015-07-22 | 清华大学 | 基于用户评论文本的上下文情感分类方法及分类系统 |
Non-Patent Citations (2)
Title |
---|
NA FAN等: "Research on the Model of Multiple Levels for Determining Sentiment of Text", 《2008 IEEE PACIFIC-ASIA WORKSHOP ON COMPUTATIONAL INTELLIGENCE AND INDUSTRIAL APPLICATION》 * |
彭云等: "基于语义约束LDA的商品特征和情感词提取", 《软件学报》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492101B (zh) * | 2018-11-01 | 2020-11-17 | 山东大学 | 基于标签信息与文本特征的文本分类方法、系统及介质 |
CN109492101A (zh) * | 2018-11-01 | 2019-03-19 | 山东大学 | 基于标签信息与文本特征的文本分类方法、系统及介质 |
US11853704B2 (en) | 2018-12-18 | 2023-12-26 | Tencent Technology (Shenzhen) Company Limited | Classification model training method, classification method, device, and medium |
CN109684478A (zh) * | 2018-12-18 | 2019-04-26 | 腾讯科技(深圳)有限公司 | 分类模型训练方法、分类方法及装置、设备和介质 |
CN111339306B (zh) * | 2018-12-18 | 2023-05-12 | 腾讯科技(深圳)有限公司 | 分类模型训练方法、分类方法及装置、设备和介质 |
WO2020125445A1 (zh) * | 2018-12-18 | 2020-06-25 | 腾讯科技(深圳)有限公司 | 分类模型训练方法、分类方法、设备及介质 |
CN111339306A (zh) * | 2018-12-18 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 分类模型训练方法、分类方法及装置、设备和介质 |
CN109697232A (zh) * | 2018-12-28 | 2019-04-30 | 四川新网银行股份有限公司 | 一种基于深度学习的中文文本情感分析方法 |
CN109697232B (zh) * | 2018-12-28 | 2020-12-11 | 四川新网银行股份有限公司 | 一种基于深度学习的中文文本情感分析方法 |
CN109933664A (zh) * | 2019-03-12 | 2019-06-25 | 中南大学 | 一种基于情感词嵌入的细粒度情绪分析改进方法 |
CN110162787A (zh) * | 2019-05-05 | 2019-08-23 | 西安交通大学 | 一种基于主题信息的类别预测方法及装置 |
CN112445898A (zh) * | 2019-08-16 | 2021-03-05 | 阿里巴巴集团控股有限公司 | 对话情感分析方法及装置、存储介质及处理器 |
CN111160037A (zh) * | 2019-12-02 | 2020-05-15 | 广州大学 | 一种支持跨语言迁移的细粒度情感分析方法 |
CN111159335A (zh) * | 2019-12-12 | 2020-05-15 | 中国电子科技集团公司第七研究所 | 基于金字塔池化与lda主题模型的短文本分类方法 |
CN111339305B (zh) * | 2020-03-20 | 2023-04-14 | 北京中科模识科技有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN111339305A (zh) * | 2020-03-20 | 2020-06-26 | 北京中科模识科技有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN113449099B (zh) * | 2020-03-25 | 2024-02-23 | 瑞典爱立信有限公司 | 文本分类方法和文本分类设备 |
CN113449099A (zh) * | 2020-03-25 | 2021-09-28 | 瑞典爱立信有限公司 | 文本分类方法和文本分类设备 |
CN111859979A (zh) * | 2020-06-16 | 2020-10-30 | 中国科学院自动化研究所 | 讽刺文本协同识别方法、装置、设备及计算机可读介质 |
CN111563167A (zh) * | 2020-07-15 | 2020-08-21 | 智者四海(北京)技术有限公司 | 文本分类系统及方法 |
CN112560495A (zh) * | 2020-12-09 | 2021-03-26 | 新疆师范大学 | 一种基于情感分析的微博谣言检测方法 |
CN112560495B (zh) * | 2020-12-09 | 2024-03-15 | 新疆师范大学 | 一种基于情感分析的微博谣言检测方法 |
CN112434166A (zh) * | 2020-12-17 | 2021-03-02 | 网易传媒科技(北京)有限公司 | 基于时效性的文本分类方法、装置、设备及存储介质 |
CN113792142A (zh) * | 2021-09-07 | 2021-12-14 | 中国船舶重工集团公司第七0九研究所 | 基于多语义因素与特征聚合的目标用户隐性关系分类方法 |
CN113792142B (zh) * | 2021-09-07 | 2024-02-27 | 中国船舶重工集团公司第七0九研究所 | 基于多语义因素与特征聚合的目标用户隐性关系分类方法 |
CN113901208A (zh) * | 2021-09-15 | 2022-01-07 | 昆明理工大学 | 融入主题特征的中越跨语言评论情感倾向性分析方法 |
CN113901208B (zh) * | 2021-09-15 | 2022-07-29 | 昆明理工大学 | 融入主题特征的中越跨语言评论情感倾向性分析方法 |
CN118277575A (zh) * | 2024-06-04 | 2024-07-02 | 湖南工商大学 | 一种用于文本情感分析的集成对比方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108536870B (zh) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108536870B (zh) | 一种融合情感特征和语义特征的文本情感分类方法 | |
Neculoiu et al. | Learning text similarity with siamese recurrent networks | |
CN109753566B (zh) | 基于卷积神经网络的跨领域情感分析的模型训练方法 | |
CN111160037B (zh) | 一种支持跨语言迁移的细粒度情感分析方法 | |
CN106886580B (zh) | 一种基于深度学习的图片情感极性分析方法 | |
CN107590177B (zh) | 一种结合监督学习的中文文本分类方法 | |
CN106919673A (zh) | 基于深度学习的文本情绪分析系统 | |
CN108959305A (zh) | 一种基于互联网大数据的事件抽取方法及系统 | |
CN106294344A (zh) | 视频检索方法和装置 | |
US11366989B2 (en) | Negative sampling algorithm for enhanced image classification | |
CN109086265A (zh) | 一种语义训练方法、短文本中多语义词消歧方法 | |
CN111222318A (zh) | 基于双通道双向lstm-crf网络的触发词识别方法 | |
CN114417851B (zh) | 一种基于关键词加权信息的情感分析方法 | |
CN112434164A (zh) | 一种兼顾话题发现和情感分析的网络舆情分析方法及系统 | |
Yirtici et al. | Regional-CNN-based enhanced Turkish sign language recognition | |
Nguyen et al. | Manga-mmtl: Multimodal multitask transfer learning for manga character analysis | |
CN113486143A (zh) | 一种基于多层级文本表示及模型融合的用户画像生成方法 | |
CN115563311B (zh) | 一种文档标注和知识库管理方法及知识库管理系统 | |
Tang et al. | NITE: A neural inductive teaching framework for domain specific NER | |
Bjerva et al. | Back to the future–temporal adaptation of text representations | |
Bjerva et al. | Back to the future–sequential alignment of text representations | |
Dachapally et al. | In-depth question classification using convolutional neural networks | |
CN115827871A (zh) | 互联网企业分类的方法、装置和系统 | |
CN115934936A (zh) | 一种基于自然语言处理的智能交通文本分析方法 | |
CN115906824A (zh) | 一种文本细粒度情感分析方法、系统、介质和计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |