CN106503049A - 一种基于svm融合多种情感资源的微博情感分类方法 - Google Patents

一种基于svm融合多种情感资源的微博情感分类方法 Download PDF

Info

Publication number
CN106503049A
CN106503049A CN201610841650.8A CN201610841650A CN106503049A CN 106503049 A CN106503049 A CN 106503049A CN 201610841650 A CN201610841650 A CN 201610841650A CN 106503049 A CN106503049 A CN 106503049A
Authority
CN
China
Prior art keywords
word
dictionary
emotion
negative
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610841650.8A
Other languages
English (en)
Inventor
陈芬
杨爽
何源
陈佩帆
王鹏鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201610841650.8A priority Critical patent/CN106503049A/zh
Publication of CN106503049A publication Critical patent/CN106503049A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于SVM融合多种情感资源的微博情感分类方法,步骤如下:构建相关词典,包括情感词典、否定词典、程度副词词典;将不同的语料进行预处理,对语料进行分词和词性标注,并进行句法分析;将分词后的词语与正、负面词典比对得到初始词语极性,再将情感词前的词语与词语程度级别词典和否定词词典比对得到修饰词权重,把初始词语极性和修饰词权重相乘得出每条微博的情感分数;从词性特征、情感特征、句式特征、语义特征四个方面,提取名词、动词、形容词、正负情感词、程度副词权重、情感得分、否定词、特殊符号等特征;将提取的特征输入Libsvm进行模型训练,得出训练模型。本发明方法对微博实现情感5级分类,能够准确、全面地获取网民们的情感倾向。

Description

一种基于SVM融合多种情感资源的微博情感分类方法
技术领域
本发明属于自然语言处理技术领域,特别是一种基于SVM融合多种情感资源的微博情感分类方法。
背景技术
在微博中潜藏着广大网民极为丰富的主观情感信息。通过对微博进行情感分类,获取广大网民们的情感倾向,可以迅速、准确地了解广大网民的诉求,为网络舆情分析提供可靠依据。目前,已有许多学者对微博情感分类进行研究,主要采用基于情感词典的方法和机器学习的方法,将情感分为正面、负面或者正面、中性和负面三类。基于情感词典的方法是通过构建情感词典,然后通过特定的算法模型进行情感倾向值的计算,进而根据情感倾向值对文本进行极性分析。如通过构建情感词典、否定词典、程度副词词典或在此基础上增加领域词典、网络词典等,通过特定算法对文本进行极性判断,将文本分为正、负两类或者正、负以及中立三类。(2.Shen Yang,Li Shuchen,Zheng Jing,et al.Emotion MiningResearch on Micro-blog[C].In:Web Society,2009.SWS’09.1st IEEE Symposium,2009:71-75 3.韩忠明,张玉沙,张慧,等.有效的中文微博短文本倾向性分类算法[J].计算机应用与软件,2012,29(10):89-93 4.张成功,刘培玉,朱振方,等.一种基于极性词典的情感分析方法[J].山东大学学报(理学版),2012,(3):47-50)。以机器学习的方法是将情感分类看作一种特殊的文本分类,通过机器学习算法训练标注好的训练集得到分类模型,再由分类模型来确定文本的倾向性(张阳,刘晓霞,孙凯龙,等.基于情感描述项的文本倾向性识别研究[J].计算机工程与应用,2015,51(4))。如使用SVM模型、KNN模型、朴素贝叶斯模型等对文本进行两级、或三级分类。(5.Borbosa L,Feng J.Robust sentiment detection onTwitter from biased and noisy data[C].In:Proceedings of the 23rdInternational Conference on Computational Linguistics.Beijing:TsinghuaUniversity Press,2010:36-44.6.Davidov D,Tsur O,Rappoport A.Enhanced sentimentlearning using twitter hashtags and smileys[C].In:Proceedings of the 23rdinternational conference on computational linguistics:posters.Association forComputational Linguistics,2010:241-249.7.林江豪,阳爱民,周咏梅,等.一种基于朴素贝叶斯的微博情感分类[J].计算机工程与科学,2012,34(9):160-165.)
通过以上的研究分析发现,无论是基于情感词典的方法还是基于机器学习的方法,对情感分类的研究多以三级分类为主,然而这种划分方法并不能精确的反映网民们的情感立场(1.王雪猛,王玉平.基于情感倾向分析的突发事件网络舆情预警研究[J].西南科技大学学报:哲学社会科学版,2016,33(1):63-66)。在网络舆情中,部分网民会表达自己对某事件的绝对立场,他们很难受其他言论的影响。而有的网民表现的立场并不稳定,他们只是暂时性的受到某些言论的影响,表现出倾向性的立场。所以,将情感划分为三种过于绝对化,不能准确、全面地获取网民们的情感倾向。
发明内容
本发明的目的在于提供一种基于SVM融合多种情感资源的微博情感分类方法,对微博实现情感5级分类,从而准确、全面地获取网民们的情感倾向。
实现本发明目的的技术解决方案为:一种基于SVM融合多种情感资源的微博情感分类方法,包括以下步骤:
步骤1、构建相关词典,完善情感词典和程度副词词典,并对程度副词中所有词进行权重赋值;
步骤2、文本预处理,将不同的语料预先进行断句、格式处理,利用ICTCLAS对语料进行分词和词性标注,利用Stanford Parser对语料进行句法分析;
步骤3、情感得分计算,将分词后的词语与正、负面词典比对得到初始词语极性,再将情感词前的词语与词语程度级别词典和否定词词典比对得到修饰词权重,把初始词语极性和修饰词权重相乘得出每条微博的情感分数;
步骤4、特征提取,词性特征提取名词、动词、形容词作为特征,情感特征提取正面情感词、负面情感词、程度副词权重、情感得分作为特征,句式特征提取否定词、感叹号、问号作为特征,语义特征提取Stanford Parser句式分析后的四种语义关系nsubj、advmod、amod、neg作为特征;
步骤5、模型训练,将提取的特征输入Libsvm进行模型训练,得出训练模型,最后利用训练模型对测试语料进行分类。
进一步地,步骤1中所述构建相关词典,完善情感词典和程度副词词典,并对程度副词中所有词进行权重赋值,具体步骤如下:
步骤1-1、以《知网》情感分析用词语集为基本词汇来源,将其中的《正面评价词语(中文)》与《正面情感词语(中文)》合并得到正面词词典;同样,《负面评价词语(中文)》加上《负面情感词语(中文)》得到负面词词典;同时,利用Word2Vec模型实现网络情感新词发现;
步骤1-2、否定词以《中国现代语法》中给出的否定词为基础,并对否定词词典进一步扩展,最终得到20个否定词;
步骤1-3、程度副词以HowNet情感词典中的程度副词词典为基础,又通过人工收集,最终得到256个程度副词;对不同语气强度的程度副词,分别赋予0.5、1.0、1.5、2.0的权重。
进一步地,步骤2中所述文本预处理步骤如下:
步骤2-1、对微博语料进行数据清洗,去除无用信息;
步骤2-2、使用中科院计算技术研究所研制的汉语词法分析系统ICTCLAS,实现语料的中文分词及词性标注;
步骤2-3、使用Stanford Parser句法分析器,实现语料的句法分析。
进一步地,步骤3中所述把初始词语极性和修饰词权重相乘得出每条微博的情感分数,公式如下:
其中,Score为情感分数,n是一条微博中的句子数,rawscorei是第i个句子中情感词的基本分数,rawscore为+1、-1或0;Intensei是第i个句子的修饰词程度权重或否定词权重。
进一步地,步骤4所述特征提取的步骤如下:
步骤4-1、步骤2-2对语料中每条微博进行了中文分词及词性标注后,统计每条微博中文分词结果中正面情感词、负面情感词、否定词、程度副词的数量以及词性标注结果为动词、名词、形容词的数量;
步骤4-2、统计语料中每条微博!和?的数量;
步骤4-3、步骤2-3对语料中每条微博进行了句法分析,统计每条微博句法分析结果为nsubj、advmod、admod、neg的数量;
进一步地,步骤5所述模型训练的步骤如下:
步骤5-1、用步骤3和步骤4提取的每一个特征值来表示一条微博,之后依照LibSVM工具所需要的数据格式对微博文本进行特征转换;
步骤5-2、将提取的特征80%作为训练集,20%作为测试集,导入Libsvm,进行模型训练,得出情感分类模型。
步骤5-3、利用得出的情感分类模型对测试语料进行分类。
本发明与现有技术相比,其显著优点为:(1)利用word2vec扩充情感词典,对程度副词赋予权重,并将情感得分、程度副词的权重作为分类特征,科学合理;(2)采用句法分析等方法来挖掘微博的语义特征,提高了模型5级分类的准确性;(3)本发明融合多种情感资源,利用SVM模型对微博语料实现了5级分类,能够准确、全面地获取网民们的情感倾向。
下面结合附图对本发明作进一步详细描述。
附图说明
图1是本发明基于SVM融合多种情感资源的微博情感分类方法的流程图。
图2是微博特征转换后的格式示意图。
图3是使用分类模型对测试语料自动分类的结果图。
具体实施方式
结合图1,本发明基于SVM融合多种情感资源的微博情感分类方法,包括以下步骤:
步骤1、构建相关词典,完善情感词典和程度副词词典,并对程度副词中所有词进行权重赋值,具体步骤如下:
步骤1-1、根据《知网》的“《知网》情感分析用词语集”这一基本的词汇来源,将其中的《正面评价词语(中文)》与《正面情感词语(中文)》合并得到正面词词典;同样,《负面评价词语(中文)》加上《负面情感词语(中文)》得到负面词词典;同时,利用Word2Vec模型实现网络情感新词发现;
表1情感词典示例
名称 示例 个数
正面情感词 爱、赞赏、快乐、表扬、称心如意…… 5161
负面情感词 哀伤、沮丧、鄙视、后悔、失落…… 5962
步骤1-2、否定词以《中国现代语法》中给出的否定词为基础,并对否定词词典进一步扩展,最终得到20个否定词;
表2否定词词典示例
步骤1-3、程度副词以HowNet情感词典中的程度副词词典为基础,又通过人工收集,最终得到256个程度副词;对不同语气强度的程度副词,分别赋予0.5、1.0、1.5、2.0的权重。
表3程度副词词典示例
步骤2、文本预处理,将不同的语料预先进行断句、格式处理,利用中科院计算技术研究所研制的汉语词法分析系统(Institute of Computing Technology,ChineseLexical Analysis System,ICTCLAS),对语料进行分词和词性标注,利用Stanford Parser对语料进行句法分析;
所述文本预处理步骤如下:
步骤2-1、由于微博语料含有大量URL、#话题#、@信息,会产生大量噪声,所以首先对微博语料进行数据清洗,去除无用信息;
步骤2-2、使用中科院计算技术研究所研制的汉语词法分析系统ICTCLAS,实现语料的中文分词及词性标注;
步骤2-3、使用Stanford Parser句法分析器,实现语料的句法分析。
步骤3、情感得分计算,将分词后的词语与正、负面词典比对得到初始词语极性,再将情感词前的词语与词语程度级别词典和否定词词典比对得到修饰词权重,把初始词语极性和修饰词权重相乘得出每条微博的情感分数,公式如下:
其中,Score为情感分数,n是一条微博中的句子数,rawscorei是第i个句子中情感词的分数,rawscore为+1、-1或0,+1是正面情感词分数、-1是负面情感词分数、0代表句子中没有情感词;Intensei是第i个句子情感词前面的程度副词权重或否定词权重。
步骤4、特征提取,词性特征提取名词、动词、形容词作为特征,情感特征提取正面情感词、负面情感词、程度副词权重、情感得分作为特征,句式特征提取否定词、感叹号、问号作为特征,语义特征提取Stanford Parser句式分析后的四种语义关系nsubj、advmod、amod、neg作为特征;
所述特征提取的步骤如下:
步骤4-1、步骤2-2对语料中每条微博进行了中文分词及词性标注后,统计每条微博中文分词结果中正面情感词、负面情感词、否定词、程度副词的数量以及词性标注结果为动词、名词、形容词的数量;
步骤4-2、统计语料中每条微博“!”和“?”的数量;
步骤4-3、步骤2-3对语料中每条微博进行了句法分析,统计每条微博句法分析结果为nsubj(名词性主语)、advmod(副词性修饰语)、admod(形容词修饰语)、neg(否定修饰词)的数量;
步骤5、模型训练,将提取的特征输入Libsvm进行模型训练,得出训练模型,最后利用训练模型对测试语料进行分类;
所述模型训练的步骤如下:
步骤5-1、用步骤3和步骤4提取的每一个特征值来表示一条微博,之后依照LibSVM工具所需要的数据格式对微博文本进行特征转换;
步骤5-2、将提取的特征80%作为训练集,20%作为测试集,导入Libsvm,进行模型训练,得出情感分类模型。
步骤5-3、利用得出的情感分类模型对测试语料进行分类。
实施例1
结合图1,本发明基于SVM融合多种情感资源的微博情感5级分类方法,包括以下步骤:
第一步,构建相关词典,完善情感词典和程度副词词典,并对程度副词中所有词进行权重赋值。部分程度副词及其权重如表1所示。
第二步,对语料进行预处理,将不同的语料预先进行断句、格式处理、分词和词性标注;
(1)由于微博语料含有#话题#、URL和@用户等无用信息,这些信息并不包含用户的观点,还可能影响下一步分词和词性标注的效果。因此在分词之前,首先滤掉微博中的#话题#、URL和@用户等无用信息,然后再对过滤后的语料进行下一步的处理。
(2)使用中科院计算技术研究所研制的汉语词法分析系统(Institute ofComputing Technology,Chinese Lexical Analysis System,ICTCLAS),实现语料的中文分词及词性标注。
例如,“诺基亚lumia新款win8系统,用起来很流畅哦,很好用”这句话的分词结果(带词性标注)是:诺基亚/nz lumia/x新款/n win8/x系统/n,/w用/v起来/v很/d流畅/a哦/o,/w很/d好/a用/v。
第三步,情感得分计算,将分词后的词语与正、负面词典比对得到初始词语极性,再将情感词前的词语与词语程度级别词典和否定词词典比对得到修饰词权重,把二者相乘得出每条微博的情感分数;计算公式如下:
其中,n是一条微博中的句子数,rawscore是第i个句子中情感词的分数,rawscore为+1、-1或0,+1是正面情感词分数、-1是负面情感词分数、0代表句子中没有情感词;Intense是第i个句子的修饰词程度权重或否定词权重。
第四步,特征提取,词性特征提取名词、动词、形容词作为特征,情感特征提取正、负面情感词、程度副词权重、情感得分作为特征,句式特征提取否定词、感叹号、问号作为特征,语义特征提取Stanford Parser句式分析后的四种语义关系nsubj、advmod、amod、neg作为特征,如表4所示。
表4特征类型及含义
第五步,模型训练,将提取的特征按照LibSVM工具所需要的数据格式对微博文本进行特征转换如图2所示,然后输入Libsvm进行模型训练,得出训练模型;再利用训练模型对测试语料进行分类,分类结果如图3所示。实验数据使用部分COAE2014微博评测语料,人工对这些语料分“非常正面”,“正面”、“中立”,“负面”、“非常负面”5个情感级别进行标注。标注工作由课题组成员完成,共标注5000条语料。标注结果如表5所示。
表5实验数据分布
实验结果采用准确率、召回率和F1值作为评价标准。为了验证本专利方法的有效性,将本专利方法与Ding(Ding Shenchun,Jiang Ting,Wen Neng.Research on sentimentorientation ofproduct reviews in Chinese based on cascaded CRFs models[C].In:Proceeding of the 2012 International Conference on Machine Learning andCybernetics(ICMLC 2012),Xian:IEEE,2012:1993-1999.)提出的方法进行对比。该方法采用层叠CRFs模型,首先对文本进行3级分类,然后结合合词特征、评价词特征、连词特征以及极性特征(即3级分类的结果),在COAE2008的任务3上,取得了很好的效果,准确率最高达到83.75%,是一种典型的文本倾向性5分类算法。本专利使用该方法在本专利语料集上进行实验,与本专利的方法进行对比,结果如表6所示。
表6实验结果
由表4可以看出,本专利提出的方法在5级分类的正确率为82.4%,相较于层叠CRFs(75.2%)方法,准确率有较大的提高。召回率为81.9%,相较于层叠CRFs方法,有小幅度提升。F值综合考虑了精确率和召回率,本专利方法的F值为82.1%,与层叠CRFs(74.3%)相比,提升了7.8%。Ding的层叠CRFs方法所提取的特征主要针对中长文本,对于微博短文本并不适用,所以准确率有所下降。本专利充分考虑微博短文本的特性,选择词性特征、情感特征、句式特征和语义特征,并且利用word2vec对情感词典进行了扩充,使得在对微博进行情感5级分类中取得较高的准确率。

Claims (6)

1.一种基于SVM融合多种情感资源的微博情感分类方法,其特征在于,包括以下步骤:
步骤1、构建相关词典,完善情感词典和程度副词词典,并对程度副词中所有词进行权重赋值;
步骤2、文本预处理,将不同的语料预先进行断句、格式处理,利用ICTCLAS对语料进行分词和词性标注,利用Stanford Parser对语料进行句法分析;
步骤3、情感得分计算,将分词后的词语与正、负面词典比对得到初始词语极性,再将情感词前的词语与词语程度级别词典和否定词词典比对得到修饰词权重,把初始词语极性和修饰词权重相乘得出每条微博的情感分数;
步骤4、特征提取,词性特征提取名词、动词、形容词作为特征,情感特征提取正面情感词、负面情感词、程度副词权重、情感得分作为特征,句式特征提取否定词、感叹号、问号作为特征,语义特征提取Stanford Parser句式分析后的四种语义关系nsubj、advmod、amod、neg作为特征;
步骤5、模型训练,将提取的特征输入Libsvm进行模型训练,得出训练模型,最后利用训练模型对测试语料进行分类。
2.根据权利要求1所述的基于SVM融合多种情感资源的微博情感分类方法,其特征在于,步骤1中所述构建相关词典,完善情感词典和程度副词词典,并对程度副词中所有词进行权重赋值,具体步骤如下:
步骤1-1、以《知网》情感分析用词语集为基本词汇来源,将其中的《正面评价词语(中文)》与《正面情感词语(中文)》合并得到正面词词典;同样,《负面评价词语(中文)》加上《负面情感词语(中文)》得到负面词词典;同时,利用Word2Vec模型实现网络情感新词发现;
步骤1-2、否定词以《中国现代语法》中给出的否定词为基础,并对否定词词典进一步扩展,最终得到20个否定词;
步骤1-3、程度副词以HowNet情感词典中的程度副词词典为基础,又通过人工收集,最终得到256个程度副词;对不同语气强度的程度副词,分别赋予0.5、1.0、1.5、2的权重。
3.根据权利要求2所述的基于SVM融合多种情感资源的微博情感分类方法,其特征在于,步骤2中所述文本预处理步骤如下:
步骤2-1、对微博语料进行数据清洗,去除无用信息;
步骤2-2、使用中科院计算技术研究所研制的汉语词法分析系统ICTCLAS,实现语料的中文分词及词性标注;
步骤2-3、使用Stanford Parser句法分析器,实现语料的句法分析。
4.根据权利要求3所述的基于SVM融合多种情感资源的微博情感分类方法,其特征在于,步骤3中所述把初始词语极性和修饰词权重相乘得出每条微博的情感分数,公式如下:
其中,Score为情感分数,n是一条微博中的句子数,rawscorei是第i个句子中情感词的分数,rawscore为+1、-1或0,+1是正面情感词分数、-1是负面情感词分数、0代表句子中没有情感词;Intensei是第i个句子中情感词前面的程度副词权重或否定词权重。
5.根据权利要求4所述的基于SVM融合多种情感资源的微博情感分类方法,其特征在于,步骤4所述特征提取步骤如下:
步骤4-1、步骤2-2对语料进行了中文分词及词性标注后,统计每条微博中文分词结果中正面情感词、负面情感词、否定词、程度副词的数量以及词性标注结果为动词、名词、形容词的数量;
步骤4-2、统计语料中每条微博!和?的数量;
步骤4-3、步骤2-3对语料中每条微博进行了句法分析,统计每条微博句法分析结果为nsubj、advmod、admod、neg的数量。
6.根据权利要求5所述的基于SVM融合多种情感资源的微博情感分类方法,其特征在于,步骤5所述模型训练的步骤如下:
步骤5-1、用步骤3和步骤4提取的每一个特征值来表示一条微博,之后依照LibSVM工具所需要的数据格式对微博文本进行特征转换;
步骤5-2、将提取的特征80%作为训练集,20%作为测试集,导入Libsvm,进行模型训练,得出情感分类模型;
步骤5-3、利用得出的情感分类模型对测试语料进行分类。
CN201610841650.8A 2016-09-22 2016-09-22 一种基于svm融合多种情感资源的微博情感分类方法 Pending CN106503049A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610841650.8A CN106503049A (zh) 2016-09-22 2016-09-22 一种基于svm融合多种情感资源的微博情感分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610841650.8A CN106503049A (zh) 2016-09-22 2016-09-22 一种基于svm融合多种情感资源的微博情感分类方法

Publications (1)

Publication Number Publication Date
CN106503049A true CN106503049A (zh) 2017-03-15

Family

ID=58290688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610841650.8A Pending CN106503049A (zh) 2016-09-22 2016-09-22 一种基于svm融合多种情感资源的微博情感分类方法

Country Status (1)

Country Link
CN (1) CN106503049A (zh)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402917A (zh) * 2017-07-28 2017-11-28 中央民族大学 藏文短文本情感分析方法及装置
CN107590134A (zh) * 2017-10-26 2018-01-16 福建亿榕信息技术有限公司 文本情感分类方法、存储介质及计算机
CN107729374A (zh) * 2017-09-13 2018-02-23 厦门快商通科技股份有限公司 一种情感词典的扩充方法及文本情感识别方法
CN107798622A (zh) * 2017-10-18 2018-03-13 北京京东尚科信息技术有限公司 一种识别用户意图的方法和装置
CN107862087A (zh) * 2017-12-01 2018-03-30 广州简亦迅信息科技有限公司 基于大数据和深度学习的情感分析方法、装置和存储介质
CN108108433A (zh) * 2017-12-19 2018-06-01 杭州电子科技大学 一种基于规则和数据网络融合的情感分析方法
CN108108468A (zh) * 2017-12-29 2018-06-01 华中科技大学鄂州工业技术研究院 一种基于概念和文本情感的短文本情感分析方法和装置
CN108133014A (zh) * 2017-12-22 2018-06-08 广州数说故事信息科技有限公司 基于句法分析和聚类的三元组生成方法、装置及用户终端
CN108563630A (zh) * 2018-03-21 2018-09-21 上海蔚界信息科技有限公司 一种文本分析知识库的构建方法
CN108595440A (zh) * 2018-05-11 2018-09-28 厦门市美亚柏科信息股份有限公司 短文本内容分类方法和系统
CN109002473A (zh) * 2018-06-13 2018-12-14 天津大学 一种基于词向量与词性的情感分析方法
CN109325860A (zh) * 2018-08-29 2019-02-12 中国科学院自动化研究所 用于海外投资风险预警的网络舆情检测方法及系统
CN109376239A (zh) * 2018-09-29 2019-02-22 山西大学 一种用于中文微博情感分类的特定情感词典的生成方法
CN109376251A (zh) * 2018-09-25 2019-02-22 南京大学 一种基于词向量学习模型的微博中文情感词典构建方法
CN109446330A (zh) * 2018-11-13 2019-03-08 广州虎牙科技有限公司 网络服务平台情感倾向识别方法、装置、设备和存储介质
CN109684647A (zh) * 2019-02-19 2019-04-26 东北林业大学 电影评论情感分析方法及装置
CN109840328A (zh) * 2019-02-28 2019-06-04 上海理工大学 深度学习商品评论文本情感倾向分析方法
CN109948139A (zh) * 2017-12-19 2019-06-28 优酷网络技术(北京)有限公司 一种语义倾向分析方法及系统
CN110232124A (zh) * 2019-06-03 2019-09-13 安徽智侒信信息技术有限公司 一种情感分析系统
CN110472020A (zh) * 2018-05-09 2019-11-19 北京京东尚科信息技术有限公司 提取修饰词的方法和装置
CN110489553A (zh) * 2019-07-26 2019-11-22 湖南大学 一种基于多源信息融合的情感分类方法
CN110728131A (zh) * 2018-06-29 2020-01-24 北京京东尚科信息技术有限公司 一种分析文本属性的方法和装置
CN111104515A (zh) * 2019-12-24 2020-05-05 山东众志电子有限公司 一种情感词语文本信息分类方法
CN111221962A (zh) * 2019-11-18 2020-06-02 重庆邮电大学 一种基于新词扩展与复杂句式扩展的文本情感分析方法
CN111522913A (zh) * 2020-04-16 2020-08-11 山东贝赛信息科技有限公司 一种适用于长文本和短文本的情感分类方法
CN112364167A (zh) * 2020-11-20 2021-02-12 携程计算机技术(上海)有限公司 基于深度学习的意图识别方法、系统、设备及存储介质
CN112380346A (zh) * 2020-11-23 2021-02-19 宁波深擎信息科技有限公司 金融新闻情感分析方法、装置、计算机设备及存储介质
CN112417892A (zh) * 2020-12-08 2021-02-26 珠海横琴博易数据技术有限公司 一种语义情感识别方法
CN112767969A (zh) * 2021-01-29 2021-05-07 苏州思必驰信息科技有限公司 用于语音信息的情感倾向性确定方法及系统
CN112861541A (zh) * 2020-12-15 2021-05-28 哈尔滨工程大学 一种基于多特征融合的商品评论情感分析方法
CN113095068A (zh) * 2021-04-30 2021-07-09 平安国际智慧城市科技股份有限公司 基于权重字典的情感分析方法、系统、装置及存储介质
CN113792142A (zh) * 2021-09-07 2021-12-14 中国船舶重工集团公司第七0九研究所 基于多语义因素与特征聚合的目标用户隐性关系分类方法
US11630957B2 (en) 2017-09-04 2023-04-18 Huawei Technologies Co., Ltd. Natural language processing method and apparatus
CN115982473A (zh) * 2023-03-21 2023-04-18 环球数科集团有限公司 一种基于aigc的舆情分析编排系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034626A (zh) * 2012-12-26 2013-04-10 上海交通大学 情感分析系统及方法
US20130103667A1 (en) * 2011-10-17 2013-04-25 Metavana, Inc. Sentiment and Influence Analysis of Twitter Tweets
CN104731770A (zh) * 2015-03-23 2015-06-24 中国科学技术大学苏州研究院 基于规则和统计模型的中文微博情感分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130103667A1 (en) * 2011-10-17 2013-04-25 Metavana, Inc. Sentiment and Influence Analysis of Twitter Tweets
CN103034626A (zh) * 2012-12-26 2013-04-10 上海交通大学 情感分析系统及方法
CN104731770A (zh) * 2015-03-23 2015-06-24 中国科学技术大学苏州研究院 基于规则和统计模型的中文微博情感分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
丁晟春 等: "基于SVM的中文微博情绪分析研究", 《情报资料工作》 *
彭玥: "基于文本倾向性分析的网络意见领袖识别", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
杨爽 等: "基于SVM多特征融合的微博情感多级分类研究", 《数据分析与知识发现》 *

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402917A (zh) * 2017-07-28 2017-11-28 中央民族大学 藏文短文本情感分析方法及装置
US11630957B2 (en) 2017-09-04 2023-04-18 Huawei Technologies Co., Ltd. Natural language processing method and apparatus
CN107729374A (zh) * 2017-09-13 2018-02-23 厦门快商通科技股份有限公司 一种情感词典的扩充方法及文本情感识别方法
CN107798622B (zh) * 2017-10-18 2021-06-29 北京京东尚科信息技术有限公司 一种识别用户意图的方法和装置
CN107798622A (zh) * 2017-10-18 2018-03-13 北京京东尚科信息技术有限公司 一种识别用户意图的方法和装置
CN107590134A (zh) * 2017-10-26 2018-01-16 福建亿榕信息技术有限公司 文本情感分类方法、存储介质及计算机
CN107862087A (zh) * 2017-12-01 2018-03-30 广州简亦迅信息科技有限公司 基于大数据和深度学习的情感分析方法、装置和存储介质
CN108108433A (zh) * 2017-12-19 2018-06-01 杭州电子科技大学 一种基于规则和数据网络融合的情感分析方法
CN109948139A (zh) * 2017-12-19 2019-06-28 优酷网络技术(北京)有限公司 一种语义倾向分析方法及系统
CN108133014A (zh) * 2017-12-22 2018-06-08 广州数说故事信息科技有限公司 基于句法分析和聚类的三元组生成方法、装置及用户终端
CN108108468A (zh) * 2017-12-29 2018-06-01 华中科技大学鄂州工业技术研究院 一种基于概念和文本情感的短文本情感分析方法和装置
CN108563630A (zh) * 2018-03-21 2018-09-21 上海蔚界信息科技有限公司 一种文本分析知识库的构建方法
CN110472020A (zh) * 2018-05-09 2019-11-19 北京京东尚科信息技术有限公司 提取修饰词的方法和装置
CN108595440A (zh) * 2018-05-11 2018-09-28 厦门市美亚柏科信息股份有限公司 短文本内容分类方法和系统
CN108595440B (zh) * 2018-05-11 2022-03-18 厦门市美亚柏科信息股份有限公司 短文本内容分类方法和系统
CN109002473A (zh) * 2018-06-13 2018-12-14 天津大学 一种基于词向量与词性的情感分析方法
CN109002473B (zh) * 2018-06-13 2022-02-11 天津大学 一种基于词向量与词性的情感分析方法
CN110728131A (zh) * 2018-06-29 2020-01-24 北京京东尚科信息技术有限公司 一种分析文本属性的方法和装置
CN109325860A (zh) * 2018-08-29 2019-02-12 中国科学院自动化研究所 用于海外投资风险预警的网络舆情检测方法及系统
CN109376251A (zh) * 2018-09-25 2019-02-22 南京大学 一种基于词向量学习模型的微博中文情感词典构建方法
CN109376239B (zh) * 2018-09-29 2021-07-30 山西大学 一种用于中文微博情感分类的特定情感词典的生成方法
CN109376239A (zh) * 2018-09-29 2019-02-22 山西大学 一种用于中文微博情感分类的特定情感词典的生成方法
CN109446330A (zh) * 2018-11-13 2019-03-08 广州虎牙科技有限公司 网络服务平台情感倾向识别方法、装置、设备和存储介质
CN109684647A (zh) * 2019-02-19 2019-04-26 东北林业大学 电影评论情感分析方法及装置
CN109684647B (zh) * 2019-02-19 2020-07-24 东北林业大学 电影评论情感分析方法及装置
CN109840328B (zh) * 2019-02-28 2022-12-27 上海理工大学 深度学习商品评论文本情感倾向分析方法
CN109840328A (zh) * 2019-02-28 2019-06-04 上海理工大学 深度学习商品评论文本情感倾向分析方法
CN110232124A (zh) * 2019-06-03 2019-09-13 安徽智侒信信息技术有限公司 一种情感分析系统
CN110489553B (zh) * 2019-07-26 2022-07-05 湖南大学 一种基于多源信息融合的情感分类方法
CN110489553A (zh) * 2019-07-26 2019-11-22 湖南大学 一种基于多源信息融合的情感分类方法
CN111221962B (zh) * 2019-11-18 2023-05-26 重庆邮电大学 一种基于新词扩展与复杂句式扩展的文本情感分析方法
CN111221962A (zh) * 2019-11-18 2020-06-02 重庆邮电大学 一种基于新词扩展与复杂句式扩展的文本情感分析方法
CN111104515A (zh) * 2019-12-24 2020-05-05 山东众志电子有限公司 一种情感词语文本信息分类方法
CN111522913A (zh) * 2020-04-16 2020-08-11 山东贝赛信息科技有限公司 一种适用于长文本和短文本的情感分类方法
CN112364167A (zh) * 2020-11-20 2021-02-12 携程计算机技术(上海)有限公司 基于深度学习的意图识别方法、系统、设备及存储介质
CN112380346A (zh) * 2020-11-23 2021-02-19 宁波深擎信息科技有限公司 金融新闻情感分析方法、装置、计算机设备及存储介质
CN112380346B (zh) * 2020-11-23 2023-04-25 宁波深擎信息科技有限公司 金融新闻情感分析方法、装置、计算机设备及存储介质
CN112417892A (zh) * 2020-12-08 2021-02-26 珠海横琴博易数据技术有限公司 一种语义情感识别方法
CN112861541A (zh) * 2020-12-15 2021-05-28 哈尔滨工程大学 一种基于多特征融合的商品评论情感分析方法
CN112861541B (zh) * 2020-12-15 2022-06-17 哈尔滨工程大学 一种基于多特征融合的商品评论情感分析方法
CN112767969A (zh) * 2021-01-29 2021-05-07 苏州思必驰信息科技有限公司 用于语音信息的情感倾向性确定方法及系统
CN113095068A (zh) * 2021-04-30 2021-07-09 平安国际智慧城市科技股份有限公司 基于权重字典的情感分析方法、系统、装置及存储介质
CN113792142A (zh) * 2021-09-07 2021-12-14 中国船舶重工集团公司第七0九研究所 基于多语义因素与特征聚合的目标用户隐性关系分类方法
CN113792142B (zh) * 2021-09-07 2024-02-27 中国船舶重工集团公司第七0九研究所 基于多语义因素与特征聚合的目标用户隐性关系分类方法
CN115982473A (zh) * 2023-03-21 2023-04-18 环球数科集团有限公司 一种基于aigc的舆情分析编排系统

Similar Documents

Publication Publication Date Title
CN106503049A (zh) 一种基于svm融合多种情感资源的微博情感分类方法
CN106598944B (zh) 一种民航安保舆情情感分析方法
CN107092596B (zh) 基于attention CNNs和CCR的文本情感分析方法
Ghosh et al. Fracking sarcasm using neural network
CN103699626B (zh) 一种微博用户个性化情感倾向分析方法及系统
CN104933027B (zh) 一种利用依存分析的开放式中文实体关系抽取方法
Shen et al. Emotion mining research on micro-blog
CN107193801A (zh) 一种基于深度信念网络的短文本特征优化及情感分析方法
CN104731770A (zh) 基于规则和统计模型的中文微博情感分析方法
CN107305539A (zh) 一种基于Word2Vec网络情感新词发现的文本倾向性分析方法
Sharma et al. Nlp and machine learning techniques for detecting insulting comments on social networking platforms
CN104268197A (zh) 一种行业评论数据细粒度情感分析方法
Godsay The process of sentiment analysis: a study
CN104636425A (zh) 一种网络个体或群体情绪认知能力预测与可视化方法
CN104063399B (zh) 一种自动识别文本所承载的情感概率的方法及系统
CN104881402A (zh) 中文网络话题评论文本语义倾向分析的方法及装置
CN102682120B (zh) 一种网络评论精华文本的获取方法和装置
CN103744953A (zh) 一种基于中文文本情感识别的网络热点挖掘方法
CN102945268A (zh) 产品特征评论挖掘方法及系统
CN105095430A (zh) 构建词语网络及抽取关键词的方法和装置
Agarwal et al. Sentiment classification of review documents using phrase patterns
Van Hee et al. Monday mornings are my fave:)# not exploring the automatic recognition of irony in english tweets
CN106528533A (zh) 一种基于动态情感词和特殊修饰词的文本情感分析方法
CN103744838A (zh) 一种用于度量主流情感信息的中文情感文摘系统及方法
Pandey et al. Sentiment analysis using lexicon based approach

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination