CN108509629A - 一种基于情感词典和支持向量机的文本情感分析方法 - Google Patents
一种基于情感词典和支持向量机的文本情感分析方法 Download PDFInfo
- Publication number
- CN108509629A CN108509629A CN201810311156.XA CN201810311156A CN108509629A CN 108509629 A CN108509629 A CN 108509629A CN 201810311156 A CN201810311156 A CN 201810311156A CN 108509629 A CN108509629 A CN 108509629A
- Authority
- CN
- China
- Prior art keywords
- news
- word
- newsletter archive
- sentiment
- emotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 58
- 238000004458 analytical method Methods 0.000 title claims abstract description 27
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 10
- 238000012360 testing method Methods 0.000 claims abstract description 10
- 238000013145 classification model Methods 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 57
- 238000013480 data collection Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000002996 emotional effect Effects 0.000 abstract description 9
- 230000002349 favourable effect Effects 0.000 abstract 1
- 238000002372 labelling Methods 0.000 abstract 1
- 238000013507 mapping Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000009514 concussion Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于情感词典和支持向量机的文本情感分析方法。所述基于情感词典和支持向量机的文本情感分析方法包括如下步骤:将新闻文本数据向量化,对训练新闻数据进行类别和情感倾向标注;对新闻文本的不同类别建立分类模型;根据新闻类别和对应的情感词典来提取新闻文本中的情感词特征数据;对添加了情感词特征数据的不同类别的新闻文本建立情感倾向分类模型;将测试新闻文本数据向量化并通过类别分类器进行分类,然后提取情感词特征,最后在对应的情感分类模型上计算得到新闻的情感倾向信息。所述基于情感词典和支持向量机的文本情感分析方法在对新闻文本进行学习的过程中加入了情感特征信息,有利于提高新闻情感分析的准确度。
Description
技术领域
本发明属于计算机技术领域,具体地涉及一种基于情感词典和支持向量机的文本情感分析方法。
背景技术
随着移动互联网的快速发展,新闻咨询类的信息也呈现几何式的增长,如何快速的了解某个领域的新闻的整体观点趋势是值得研究的话题,以财经类新闻为例,财经新闻很多时候体现了官方或者机构对某个事件或者行业等的认识,相对用户的观点来说更加客观且可靠,通过分析某个行业板块的新闻的情绪倾向,对于研究者和投资者进行行业分析及投资计划可以做出重要的辅助决策。同时,对于新闻内容的情感分析也可以更加有效的对新闻进行监控和管制,是值得研究的一个方向。
近年来自然语言处理一直是人工智能领域的一个重要的方向,当进行自然语言处理的时候,往往需要将文本信息数值化,向量化。比较传统的词向量方法有one-hot向量表示法,但是one-hot向量表示法虽然很简单,但是有明显的缺点,第一,由于巨大的语言词汇量,导致用one-hot向量表示法转换的词向量的维度非常高,对于计算机来说难以获得高效的存储和计算性能;第二,用one-hot向量表示法转换的词向量无法用距离来衡量词与词之间的关系,这样会丢失很多词中隐含的信息。在2013年,google推出了一款将词表征为实数值向量的高效工具-word2vec,word2vec通过对语料数据的训练,可以将文本内容处理为k维向量,而且向量空间上的相似度可以用来表示文本语义上的相似性。因此,word2vec向量化方法弥补了one-hot向量表示法的缺点,在自然语言处理方面有着不错的性能和效果。
发明内容
本发明的目的在于针对现有技术的缺陷或问题,提供一种基于情感词典和支持向量机的文本情感分析方法,将情感词信息与机器学习相结合,提升了情感分析的准确率。
本发明的技术方案如下:一种基于情感词典和支持向量机的文本情感分析方法包括如下步骤:
步骤1:将新闻文本数据向量化,对训练新闻数据进行类别和情感倾向标注;
步骤2:对新闻文本的不同类别建立分类模型;
步骤3:根据新闻类别和对应的情感词典来提取新闻文本中的的情感词特征数据;
步骤4:对添加了情感词特征数据的不同类别的新闻文本建立情感倾向分类模型;
步骤5:将测试新闻文本数据向量化并通过类别分类器进行分类,然后提取情感词特征,最后在对应的情感分类模型上计算得到新闻的情感倾向信息。
优选地,步骤1对新闻文本进行向量化和情感标注,包括:
步骤1-1:对训练数据集中的每篇新闻进行人工标注,标注主要有两个维度,第一个维度是新闻类别,另一个维度是情感倾向;
步骤1-2:对新闻文本进行分词操作,加载停用词词典,剔除其中的停用词;
步骤1-3:对新闻文本的分词结果构建语料库,每篇新闻占据一行,每行文本中的每次词语以空格作为分隔符分割;
步骤1-4:将处理好的中文语料数据集输入到word2vec中,对中文语料数据集训练word2vec模型;
步骤1-5:利用textrank算法计算新闻中各个词的权重,并将每个词输入word2vec模型中计算出词向量,最后将每个词的词向量和它的权重加权得到新闻文本的向量化表示。
优选地,步骤2对新闻文本建立类别分类模型,包括:
步骤2-1:将新闻的类别标签数值化,将数值化标签和新闻文本的数值化向量构建成新闻类别分类训练数据集;
步骤2-2:在新闻类别分类训练数据集上训练svm分类模型。
优选地,步骤3提取情感指数,包括:
步骤3-1:对于训练数据集中的每篇新闻文本,根据该文本对应的新闻类别,调用相应类别的情感词典,检索文本中存在于情感词典中的情感词;
步骤3-2:对于检索到的情感词,向前检测1-2位,判断前面是否是程度词,然后将情感词和其程度词进行加权计算,得到正向和负向的情感词指数;
步骤3-3:将情感词指数加入到新闻文本的数值化向量中得到新的新闻向量表示。
优选地,步骤4建立情感倾向分类模型,包括:
步骤4-1:将新闻的情感倾向标签数值化,将数值化标签和新闻文本的数值化向量构建成训练数据集;
步骤4-2:将训练数据集按照不同的新闻类别划分成多个训练数据集;
步骤4-3:对每个不同新闻类别的训练数据集训练相应类别下的svm情感倾向分类模型。
优选地,步骤5对未处理的新闻进行情感分析,包括:
步骤5-1:将未处理的新闻文本按照步骤1中的方法向量化;
步骤5-2:将新闻文本的数值化向量输入到类别分类模型中,计算得到新闻文本的类别;
步骤5-3:根据新闻文本的类别采用相应的情感词典来提取情感指数;
步骤5-4:将新闻文本的数值化向量和其情感指数结合得到新的测试样本,然后将测试样本输入到对应类别的情感倾向分类器中,计算得到新闻的情感倾向值。
本发明提供的技术方案具有如下有益效果:
所述基于情感词典和支持向量机的文本情感分析方法可以对新闻文本数据实现自动的新闻类别分类和情感倾向分析,对不同类别的新闻利用不同的情感词典进行情感词特征提取,提高了情感词特征提取的精度,在对新闻文本进行学习的过程中加入了情感特征信息,有利于提高新闻情感分析的准确度。
附图说明
图1是本发明实施的基于情感词典和支持向量机的文本情感分析方法的总体流程图;
图2是本发明实施的基于情感词典和支持向量机的文本情感分析方法的具体流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
除非上下文另有特定清楚的描述,本发明中的元件和组件,数量既可以单个的形式存在,也可以多个的形式存在,本发明并不对此进行限定。本发明中的步骤虽然用标号进行了排列,但并不用于限定步骤的先后次序,除非明确说明了步骤的次序或者某步骤的执行需要其他步骤作为基础,否则步骤的相对次序是可以调整的。可以理解,本文中所使用的术语“和/或”涉及且涵盖相关联的所列项目中的一者或一者以上的任何和所有可能的组合。
如图1和图2所示,一种基于情感词典和支持向量机的文本情感分析方法,包括如下步骤:
1、对训练数据集进行人工标注(包括新闻行业类别及情感倾向),将训练数据进行分词、去停用词,然后通过word2vec将词转换词向量,最后将新闻文本数据向量化为Dj;
2、根据新闻文本数据向量及其对应的新闻类别标签,训练SVM分类模型,得到新闻类别分类器modeln;
3、对于不同类别的训练数据,调用对应类别的情感词典,分析新闻文本情感词指数e,并将情感词指数e作为特征加到新闻文本数据向量Dj的尾部,构成新的向量D′j;
4、对每个不同类别的新闻训练数据及其对应的情感倾向标签,训练SVM分类模型,得到指定新闻类别的情感倾向分类器modelc;
5、对测试数据按照步骤(1)构建新闻文本数据向量Dj,将数据向量Dj输入到步骤(2)中训练的新闻类别分类器modeln中,计算得到新闻的类别c,然后按照步骤(3)构建含有情感词数据特征的新向量D′j,最后将数据向量D′j输入到对应新闻类别的情感倾向分类器modelc中,计算得到该新闻的情感倾向。
具体地,在上述步骤1中具体包括如下步骤为:
1.1、对训练数据集中的每篇新闻进行人工标注,标注主要有两个维度,第一个维度是新闻类别,例如,社会、国际、国内、娱乐、体育、财经等,第二个维度是情感倾向,主要有正向、中立、负向三个类别;
1.2、对新闻文本进行分词操作,加载停用词词典,剔除其中的停用词;
1.3、对新闻文本的分词结果构建语料库,每篇新闻占据一行,每行文本中的每次词语以空格作为分隔符分割,例如文本“曝韩知名经纪公司高层被中国股东开除员工欲罢工”处理之后的形式是”曝韩知名经纪公司高层中国股东开出员工罢工”;
1.4、将处理好的中文语料数据集输入到开源深度学习模型word2vec中,对中文语料数据集训练word2vec模型,并将word2vec模型存储在文件中;
1.5、对于步骤1.2中处理后所得的每篇新闻,利用textrank算法计算新闻中各个词的权重,并对权重进行线性归一化处理,即
这里,wi表示第i个词的权重,wmin表示这篇新闻中权重最小词的权重值,wmax表示这篇新闻中权重最大词的权重值;
1.6、将每篇新闻中的词输入步骤1.4中训练的word2vec模型中,计算得到每个词的词向量,词向量Li的形式如下:
Li=[f1,f2,f3,f4,f5……fn]
然后通过将词向量以相应的权重进行加权,从而得到每篇新闻的向量表示Dj,
这里的Li表示第j篇新闻中的第i个词的向量,这里的fn表示词向量的第n维特征,wi表示第j篇新闻中的第i个词的向量的权重,Dj表示第j篇新闻的向量表示。
具体地,上述步骤2具体包括如下步骤:
2.1、将类别标签数值化,即将社会、国际、国内等标签数值化为1,2,3这样的数值标签,并将中文标签与数值标签的映射关系存储在类别标签数值映射表中;
2.2、将新闻向量表示Dj及其对应的数值标签整理成libsvm的格式,libsvm是如下的一种数据格式:
[4:0:-0.017954927 1:-0.025385361 2:0.01635078 3:0.025482753……200:0.005489663
11:0:0.016520487 1:0.006882766 2:0.042029403 3:0.0124441115……200:-0.0299489
1:0:-0.06207244 1:-0.014859878 2:-0.01074764 3:0.014099672……200:0.0029262288
3:0:-0.023108354 1:-0.027343191 2:0.031550214 3:0.027644191……200:0.00894014]
Libsvm的每一行都是以[ti:0:f01:f12:f2……n:fn]形式存在,每一行是以ti开头,这里的ti表示该行样本的标签,例如,第一行样本的是以4开头,所以第一行的类别标签是4。数值标签后面的每一对n:fn,n表示这是样本的第n维特征,fn表示第n维特征的值;
2.3、将整理好的libsvm格式的训练数据输入到svm中,训练svm分类模型,得到新闻类别分类器modelc。
具体地,上述步骤3具体包括如下步骤:
3.1、对于训练数据集中的每篇新闻文本,根据该文本对应的新闻类别,调用相应类别的情感词典,检索文本中存在于情感词典中的情感词ci,负向的例如社会新闻中的打斗、火灾,损坏,财经新闻中的震荡、受挫,下跌等等;正向的例如政治新闻的廉洁,改革,进步,体育新闻中的夺冠,破纪录,金牌等等;
3.2、加载程度词及其权重di,对于(3-1)中检测的每个情感词ci,检测ci前面的1-2个词是否属于程度词,例如“我很开心”,“开心”是属于正向情感词,“很”是属于程度词。根据情感词ci及其前面的程度词的权重di计算该新闻的情感词指数e,并且进行归一化。具体的:
这里的en表示负向情感指数,ep表示正向情感指数,分别表示第i个负向词和正向词的权重,默认为1,di表示情感词前面的程度词的权重,如果没有程度词,则di=1;
3.3、将步骤3.2中计算得到的情感词指数e(en,ep)添加到步骤1.6中得到的新闻向量表示Dj的尾部作为额外的特征,从而得到新的新闻向量表示D′j,D′j的具体的向量形式如下:
D′j=[f1,f2,f3,f4,f5……fn,en,ep]
具体地,上述步骤4具体包括如下步骤:
4.1、将训练数据集dataset按照新闻类别划分成多个数据集(dataset社会,dataset财经,dataset体育等等);
4.2、将情感倾向类别标签数值化,即将正向,负向,中立标签数值化为1,2,3这样的数值标签,并将中文标签与数值标签的映射关系存储在情感标签数值映射表中;
4.3、对每个类别的数据集dataset类别,将其数据集中的新闻向量表示D′j及其对应的情感倾向数值标签整理成libsvm的格式,具体格式如步骤2.2中所示;
4.4、对每个类别的数据集dataset类别,将整理好的libsvm格式的训练数据输入到svm中,训练svm分类模型,分别得到model社会,model财经,model体育等具体新闻类别的情感分类模型。
具体地,上述步骤5具体包括如下步骤:
5.1、对测试新闻数据集进行处理,对新闻文本进行分词操作,加载停用词词典,剔除其中的停用词。对每篇新闻的分词集,按照步骤1.5中的方法计算每个词的权重。加载步骤1.4中生成的word2vec模型,将分好的词输入word2vec模型中计算得到每个词的词向量Li。然后通过将词向量以相应的权重进行加权,从而得到每篇新闻的向量表示Dj:
在下面,将会以新闻呢的向量表示来表示该新闻;
5.2、加载步骤2.3中训练得到的新闻类别分类器modeln,将向量化的新闻数据Dj输入到modeln中,计算得到新闻Dj的数值化分类标签,然后根据步骤2.1中得到的类别标签数值映射表得到新闻Dj的类别c;
5.3、根据步骤3.1、3.2和3.3中的方法,按不同的分类类别计算新闻的情感词指数e(en,ep),并将情感词指数e(en,ep)作为特征添加到向量Dj中得到新的新闻向量表示D′j;
5.4、根据新闻D′j的类别c,选择步骤4.4中训练好的对应的情感倾向分类器modelc,将D′j输入到分类器modelc中,计算得到新闻D′j的数值化情感倾向标签,最后根据步骤4.2中得到的情感标签数值映射表得到新闻的情感倾向。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (6)
1.一种基于情感词典和支持向量机的文本情感分析方法,其特征在于:包括如下步骤:
步骤1:将新闻文本数据向量化,对训练新闻数据进行类别和情感倾向标注;
步骤2:对新闻文本的不同类别建立分类模型;
步骤3:根据新闻类别和对应的情感词典来提取新闻文本中的情感词特征数据;
步骤4:对添加了情感词特征数据的不同类别的新闻文本建立情感倾向分类模型;
步骤5:将测试新闻文本数据向量化并通过类别分类器进行分类,然后提取情感词特征,最后在对应的情感分类模型上计算得到新闻的情感倾向信息。
2.根据权利要求1所述的一种基于情感词典和支持向量机的文本情感分析方法,其特征在于,步骤1对新闻文本进行向量化和情感标注,包括:
步骤1-1:对训练数据集中的每篇新闻进行人工标注,标注主要有两个维度,第一个维度是新闻类别,另一个维度是情感倾向;
步骤1-2:对新闻文本进行分词操作,加载停用词词典,剔除其中的停用词;
步骤1-3:对新闻文本的分词结果构建语料库,每篇新闻占据一行,每行文本中的每次词语以空格作为分隔符分割;
步骤1-4:将处理好的中文语料数据集输入到word2vec中,对中文语料数据集训练word2vec模型;
步骤1-5:利用textrank算法计算新闻中各个词的权重,并将每个词输入word2vec模型中计算出词向量,最后将每个词的词向量和它的权重加权得到新闻文本的向量化表示。
3.根据权利要求1所述的一种基于情感词典和支持向量机的文本情感分析方法,其特征在于,步骤2对新闻文本建立类别分类模型,包括:
步骤2-1:将新闻的类别标签数值化,将数值化标签和新闻文本的数值化向量构建成新闻类别分类训练数据集;
步骤2-2:在新闻类别分类训练数据集上训练svm分类模型。
4.根据权利要求1所述的一种基于情感词典和支持向量机的文本情感分析方法,其特征在于,步骤3提取情感指数,包括:
步骤3-1:对于训练数据集中的每篇新闻文本,根据该文本对应的新闻类别,调用相应类别的情感词典,检索文本中存在于情感词典中的情感词;
步骤3-2:对于检索到的情感词,向前检测1-2位,判断前面是否是程度词,然后将情感词和其程度词进行加权计算,得到正向和负向的情感词指数;
步骤3-3:将情感词指数加入到新闻文本的数值化向量中得到新的新闻向量表示。
5.根据权利要求1所述的一种基于情感词典和支持向量机的文本情感分析方法,其特征在于,步骤4建立情感倾向分类模型,包括:
步骤4-1:将新闻的情感倾向标签数值化,将数值化标签和新闻文本的数值化向量构建成训练数据集;
步骤4-2:将训练数据集按照不同的新闻类别划分成多个训练数据集;
步骤4-3:对每个不同新闻类别的训练数据集训练相应类别下的svm情感倾向分类模型。
6.根据权利要求1所述的一种基于情感词典和支持向量机的文本情感分析方法,其特征在于,步骤5对未处理的新闻进行情感分析,包括:
步骤5-1:将未处理的新闻文本按照步骤1中的方法向量化;
步骤5-2:将新闻文本的数值化向量输入到类别分类模型中,计算得到新闻文本的类别;
步骤5-3:根据新闻文本的类别采用相应的情感词典来提取情感指数;
步骤5-4:将新闻文本的数值化向量和其情感指数结合得到新的测试样本,然后将测试样本输入到对应类别的情感倾向分类器中,计算得到新闻的情感倾向值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810311156.XA CN108509629B (zh) | 2018-04-09 | 2018-04-09 | 一种基于情感词典和支持向量机的文本情感分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810311156.XA CN108509629B (zh) | 2018-04-09 | 2018-04-09 | 一种基于情感词典和支持向量机的文本情感分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108509629A true CN108509629A (zh) | 2018-09-07 |
CN108509629B CN108509629B (zh) | 2022-05-13 |
Family
ID=63380853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810311156.XA Active CN108509629B (zh) | 2018-04-09 | 2018-04-09 | 一种基于情感词典和支持向量机的文本情感分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108509629B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284376A (zh) * | 2018-09-10 | 2019-01-29 | 成都信息工程大学 | 基于领域自适应的跨领域新闻数据情感分析方法 |
CN109376956A (zh) * | 2018-11-29 | 2019-02-22 | 西安电子科技大学 | 社交网络中公共危机信息的预测方法 |
CN109657057A (zh) * | 2018-11-22 | 2019-04-19 | 天津大学 | 一种结合svm和文档向量的短文本情感分类方法 |
CN109783800A (zh) * | 2018-12-13 | 2019-05-21 | 北京百度网讯科技有限公司 | 情感关键词的获取方法、装置、设备及存储介质 |
CN109815334A (zh) * | 2019-01-25 | 2019-05-28 | 武汉斗鱼鱼乐网络科技有限公司 | 一种弹幕文本分类方法、存储介质、设备及系统 |
CN111813937A (zh) * | 2020-07-07 | 2020-10-23 | 新华智云科技有限公司 | 基于正能量词典正能量新闻分类方法 |
CN112015989A (zh) * | 2020-08-31 | 2020-12-01 | 北京百度网讯科技有限公司 | 用于推送信息的方法和装置 |
CN112101033A (zh) * | 2020-09-01 | 2020-12-18 | 广州威尔森信息科技有限公司 | 一种汽车口碑的情感分析方法和装置 |
CN112231470A (zh) * | 2019-06-28 | 2021-01-15 | 上海智臻智能网络科技股份有限公司 | 话题挖掘方法及装置、存储介质、终端 |
CN112380366A (zh) * | 2020-11-20 | 2021-02-19 | 北京达佳互联信息技术有限公司 | 情绪识别方法、装置、电子设备、系统及存储介质 |
CN113128207A (zh) * | 2021-05-10 | 2021-07-16 | 安徽博约信息科技股份有限公司 | 基于大数据的新闻话语权评估及预测方法 |
CN113326374A (zh) * | 2021-05-25 | 2021-08-31 | 成都信息工程大学 | 基于特征增强的短文本情感分类方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776581A (zh) * | 2017-02-21 | 2017-05-31 | 浙江工商大学 | 基于深度学习的主观性文本情感分析方法 |
CN107301171A (zh) * | 2017-08-18 | 2017-10-27 | 武汉红茶数据技术有限公司 | 一种基于情感词典学习的文本情感分析方法和系统 |
CN107315797A (zh) * | 2017-06-19 | 2017-11-03 | 江西洪都航空工业集团有限责任公司 | 一种网络新闻获取及文本情感预测系统 |
-
2018
- 2018-04-09 CN CN201810311156.XA patent/CN108509629B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106776581A (zh) * | 2017-02-21 | 2017-05-31 | 浙江工商大学 | 基于深度学习的主观性文本情感分析方法 |
CN107315797A (zh) * | 2017-06-19 | 2017-11-03 | 江西洪都航空工业集团有限责任公司 | 一种网络新闻获取及文本情感预测系统 |
CN107301171A (zh) * | 2017-08-18 | 2017-10-27 | 武汉红茶数据技术有限公司 | 一种基于情感词典学习的文本情感分析方法和系统 |
Non-Patent Citations (1)
Title |
---|
苏增才: "基于word2vec和SVMperf的网络中文文本评论信息情感分类研究", 《中国优秀硕士论文全文数据库》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284376A (zh) * | 2018-09-10 | 2019-01-29 | 成都信息工程大学 | 基于领域自适应的跨领域新闻数据情感分析方法 |
CN109657057A (zh) * | 2018-11-22 | 2019-04-19 | 天津大学 | 一种结合svm和文档向量的短文本情感分类方法 |
CN109376956A (zh) * | 2018-11-29 | 2019-02-22 | 西安电子科技大学 | 社交网络中公共危机信息的预测方法 |
CN109783800A (zh) * | 2018-12-13 | 2019-05-21 | 北京百度网讯科技有限公司 | 情感关键词的获取方法、装置、设备及存储介质 |
CN109783800B (zh) * | 2018-12-13 | 2024-04-12 | 北京百度网讯科技有限公司 | 情感关键词的获取方法、装置、设备及存储介质 |
CN109815334A (zh) * | 2019-01-25 | 2019-05-28 | 武汉斗鱼鱼乐网络科技有限公司 | 一种弹幕文本分类方法、存储介质、设备及系统 |
CN112231470A (zh) * | 2019-06-28 | 2021-01-15 | 上海智臻智能网络科技股份有限公司 | 话题挖掘方法及装置、存储介质、终端 |
CN111813937A (zh) * | 2020-07-07 | 2020-10-23 | 新华智云科技有限公司 | 基于正能量词典正能量新闻分类方法 |
CN112015989A (zh) * | 2020-08-31 | 2020-12-01 | 北京百度网讯科技有限公司 | 用于推送信息的方法和装置 |
CN112101033A (zh) * | 2020-09-01 | 2020-12-18 | 广州威尔森信息科技有限公司 | 一种汽车口碑的情感分析方法和装置 |
CN112101033B (zh) * | 2020-09-01 | 2021-06-15 | 广州威尔森信息科技有限公司 | 一种汽车口碑的情感分析方法和装置 |
CN112380366A (zh) * | 2020-11-20 | 2021-02-19 | 北京达佳互联信息技术有限公司 | 情绪识别方法、装置、电子设备、系统及存储介质 |
CN113128207A (zh) * | 2021-05-10 | 2021-07-16 | 安徽博约信息科技股份有限公司 | 基于大数据的新闻话语权评估及预测方法 |
CN113128207B (zh) * | 2021-05-10 | 2024-03-29 | 安徽博约信息科技股份有限公司 | 基于大数据的新闻话语权评估及预测方法 |
CN113326374A (zh) * | 2021-05-25 | 2021-08-31 | 成都信息工程大学 | 基于特征增强的短文本情感分类方法及系统 |
CN113326374B (zh) * | 2021-05-25 | 2022-12-20 | 成都信息工程大学 | 基于特征增强的短文本情感分类方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108509629B (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509629A (zh) | 一种基于情感词典和支持向量机的文本情感分析方法 | |
CN109829159B (zh) | 一种古汉语文本的一体化自动词法分析方法及系统 | |
CN105808526B (zh) | 商品短文本核心词提取方法和装置 | |
CN106919673A (zh) | 基于深度学习的文本情绪分析系统 | |
CN109960799B (zh) | 一种面向短文本的优化分类方法 | |
CN106776581A (zh) | 基于深度学习的主观性文本情感分析方法 | |
CN107330011A (zh) | 多策略融合的命名实体的识别方法及装置 | |
CN107169001A (zh) | 一种基于众包反馈和主动学习的文本分类模型优化方法 | |
CN111767741A (zh) | 一种基于深度学习和tfidf算法的文本情感分析方法 | |
CN107229610A (zh) | 一种情感数据的分析方法及装置 | |
CN109241530A (zh) | 一种基于N-gram向量和卷积神经网络的中文文本多分类方法 | |
CN106095753B (zh) | 一种基于信息熵和术语可信度的金融领域术语识别方法 | |
CN107729309A (zh) | 一种基于深度学习的中文语义分析的方法及装置 | |
CN108090099B (zh) | 一种文本处理方法及装置 | |
CN103020167B (zh) | 一种计算机中文文本分类方法 | |
CN109002473A (zh) | 一种基于词向量与词性的情感分析方法 | |
CN109740164B (zh) | 基于深度语义匹配的电力缺陷等级识别方法 | |
CN110674296B (zh) | 一种基于关键词的资讯摘要提取方法及系统 | |
CN109858034A (zh) | 一种基于注意力模型和情感词典的文本情感分类方法 | |
CN109508374A (zh) | 基于遗传算法的文本数据半监督聚类方法 | |
CN108446334A (zh) | 一种无监督对抗训练的基于内容的图像检索方法 | |
CN109522544A (zh) | 基于卡方检验的句向量计算方法、文本分类方法及系统 | |
CN107818173B (zh) | 一种基于向量空间模型的中文虚假评论过滤方法 | |
CN111259147B (zh) | 基于自适应注意力机制的句子级情感预测方法及系统 | |
CN114428854A (zh) | 一种基于长度归一化和主动学习的变长文本分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |