CN103678278A - 一种中文文本情感识别方法 - Google Patents

一种中文文本情感识别方法 Download PDF

Info

Publication number
CN103678278A
CN103678278A CN201310690318.2A CN201310690318A CN103678278A CN 103678278 A CN103678278 A CN 103678278A CN 201310690318 A CN201310690318 A CN 201310690318A CN 103678278 A CN103678278 A CN 103678278A
Authority
CN
China
Prior art keywords
word
sentence
emotion
degree
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310690318.2A
Other languages
English (en)
Inventor
崔现鹏
汪海燕
黎建辉
崔建业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Network Information Center of CAS
Original Assignee
Computer Network Information Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Network Information Center of CAS filed Critical Computer Network Information Center of CAS
Priority to CN201310690318.2A priority Critical patent/CN103678278A/zh
Publication of CN103678278A publication Critical patent/CN103678278A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种中文文本情感识别方法。本方法为:1)分别构建褒贬义词典、程度词典、否定词典;2)对待处理语料文本的句子进行分词处理,得到词语的依存关系和词频;3)根据词频选取主题词,将包含主题词的语句标为主题句;4)对句子中的每一词语,判断其是否出现在该褒贬义词典中确定该词语的情感初值,并根据词语的依存关系确定出该词语的修饰程度词语和否定词语,然后根据修饰程度词语在程度词典的取值确定该词语的权重、根据否定词语数目确定极性,得到该词语的情感值;然后对该句子所有词语的情感值求和得到该句子的情感值;5)将该文本中的所有句子的情感值进行求和,得到该文本的情感状态。本发明大大提高文章情感识别的准确率。

Description

一种中文文本情感识别方法
技术领域
本发明属于信息技术领域,涉及一种文本情感分析的方法,主要应用于自然语言处理、数据挖掘、信息检索等领域。
背景技术
随着互联网的迅猛发展,用户数目的急剧增加,越来越多的用户乐于在网上分享自己对某事件或产品等的观点或者评价,因此网络之中涌现了大量带有主观情感的信息,获取信息中的观点并加以分析利用以及及时监控网络舆情成为最近的研究重点。对于互联网中海量的中文文本信息,单纯依靠人工处理的方法已经无法达到要求也难以做到及时响应,迫切需要计算机来实现快速获取和分析处理信息,情感分析技术应运而生。
当前情感分析也取得了很大的发展,按照处理文本的粒度的不同分为词语级、语句级和篇章级,按照处理文本的类别不同可分为基于新闻评论的情感分析和基于产品评论的情感分析。Wiebe和Bruce将某些词类(如代词、形容词等)、标点和句子的位置关系作为特征值,设计了针对句子级别的
Figure BDA0000439145910000011
分类器。Wiebe在上述基础之上又将某些词性和基于词典语义项作为特征项,显著提高了分类器的分类效果。A.Hassan和D.Radev提出了基于马尔科夫随机游走模型的情感词分析方法,首先构建种子集合,通过语义相似构建候选词和种子词网络,然后通过模型判断候选词的情感极性。该方法融合了词汇之间的语义关系,但是需要构建种子词的集合,并且依赖语义资源。董喜双等人使用HowNet扩展同义词作为特征,借助最大熵模型来预测候选词情感极性,然后采用最小割模型来优化极性判定结果,由于最小割解的不唯一性,难以确定最优解。尽管当前研究取得了较大的成果,由于中文词语词义的多样性以及起步较晚的特点,中文情感分析还存在很大的不足。
发明内容
本发明提出了一种文本情感识别方法,用于解决当前中文文本情感分析准确率不高的问题。通过计算文章的情感权值来判断情感极性,若情感值>0,则文章反映的是正向的情感;若情感值<0,则为负向的情感;若情感值=0,则为中立客观的情感。
本发明的技术方案为:
一种中文文本情感识别方法,其步骤为:
1)分别构建包含正向词语和负向词语的褒贬义词典,构建修饰程度词语的程度词典,构建用于确定否定词语的否定词典;
2)利用语法分析工具对待处理语料文本的句子进行分词处理,得到词语的依存关系并统计每个词语的词频;
3)根据词频对分词所得词语排序,选取指定数目的词语作为主题词,将包含主题词的语句标为主题句;
4)对句子中的每一词语,判断其是否出现在该褒贬义词典中确定该词语的情感初值,并根据词语的依存关系确定出该词语的修饰程度词语和否定词语,然后根据确定出的修饰程度词语在所述程度词典的取值确定该词语的权重系数、根据确定出的否定词语数目确定该词语的极性,从而得到该词语的情感值;然后对该句子所有词语的情感值求和得到该句子的情感值;
5)将该待处理语料文本中的所有句子的情感值进行求和,得到该待处理语料文本的情感状态。
进一步的,对该待处理语料文本中的每一句子,根据其在文中的位置赋予一权值系数,将每一句子的情感权值与对应的权值系数相乘,然后求和得到该待处理语料文本的情感状态。
进一步的,句子中的每个词语根据其在句子中的位置设置该词语的位置系数,如果该句子中词语的数目为L,则该句子中第一个词语和最后一个词语的位置系数为2/L,中间的词语为1/L;将词语的位置系数与该词语的当前权重系数之和作为该词语新的权重系数。
进一步的,标题句的权值系数>尾段中句子的权值系数>首段中句子的权值系数>中间段中句子的权值系数。
进一步的,计算每个主题句与标题句的相似度,如果相似度大于设定阈值,则增加该句子的权值系数。
进一步的,计算所述相似度的公式为:
Sim ( S , T ) = cos &theta; = &Sigma; k = 1 n w k ( S ) &times; w k ( T ) &Sigma; k = 1 n w k 2 ( S ) &Sigma; k = 1 n w k 2 ( T )
其中S表示当前处理的句子,T表示标题句,wk(S)表示句子S中主题词特征值,wk(T)表示标题句中主题词的特征值。
进一步的,利用语法分析工具识别每一句是否为感叹句,如果句子为感叹句,则增加该句子的权值系数。
进一步的,所述程度词典包括修饰程度为极度、高度、中度和低度的修饰程度词语,每一级的修饰程度词语对应一权重系数。
本发明的方法步骤如下所示。
步骤1:语料预处理
读入待分析的语料文本,进行分段、分句,借助语法分析工具进行句法分析,对分句后的内容做分词处理。统计每个词语出现的次数,计算词频。
步骤2:构建词典
分别构建包含正向词语和负向词语的词典,构建修饰程度为极度、高度、中度和低度的程度词典,构建包含否定词语的否定词典。
步骤3:确定主题句
对于所有的词语根据其词频由高到低排序,选取指定数目的词语作为主题词,包含主题词的语句称为主题句。
步骤4:计算主题句的情感值
对于句子中的每一个词语,判断词语是否出现在正负向词典中,对句子进行句法分析,判断词语之前是否存在修饰程度词语以及否定词语,获取每一个词语的情感权值,对所有词语的情感权值求和获取整个句子的情感值。
步骤5:计算文章的情感值
对于所有的句子,根据其在文章中的重要性赋予一定的权值系数,获取整个文章的权值,通过权值判断文章的情感状态。
与现有技术相比,本发明的积极效果为:
为了验证本方法的性能,从新浪网、腾讯网、凤凰网等网站上获取到1000篇测试语料,内容涉及经济、体育、科技和食品安全领域,分别采用KNN、SVM、
Figure BDA0000439145910000034
以及本方法进行测试,测试结果如表1所示。其中公式定义:
Figure BDA0000439145910000031
Figure BDA0000439145910000032
准确率与召回率在一定程度上是相互制约的关系,需要一个合适的量度来作为两者之间的平衡点,在此选取F-Measure作为综合度量指标。
F - Measure = 2 pr ( p + r )
公式中p是准确率,r是召回率。
表1为本发明与现有方法对比表
本发明采用由细粒度到粗粒度的方式获取文章的情感状态,先基于构建的正负向词典赋予词语基础权值,然后根据句法分析的结果判断当前词语之前是否存在修饰词语以及否定词语,赋予情感值系数,之后根据词语在句子中的先后顺序赋予词语位置权值系数,最终获取词语所在句子的情感值。对于每一个句子,根据句子类型的不同赋予不同的权重,计算所有句子的权值,获取文章的情感值,最终得到文章的情感状态,本发明能够大大提高文章情感识别的准确率。
附图说明
图1语料预处理流程图。
图2计算词语情感值流程图。
图3计算句子情感值流程图。
具体实施方式
下面结合图示详细说明本发明的实现步骤。
1.语料预处理
批量读入需要处理的文本,以篇章为单位进行分段处理,标记每一段的序号以及每一段的文本内容。对于每一段的文本进行分句处理,记录每一句的段序号、句序号,采用语法分析工具进行句法分析,获取句子中词语之间的依存关系。对于每一句的内容进行分词处理,获取每一个词语。借助词性标注工具,识别每一个词语的词性,统计每一个词语在文章中出现的次数,计算每一个词语的词频。
2.构建词典
首先构建包含褒贬义词语的词典,以HowNet中提供的正负向词典为基础,将《汉语褒贬义词语用法词典》中的词语与之合并去除重复词语得到基础词典,借助互联网搜索词库,从基础词典中获取高频词语以及情感鲜明的词语作为种子词语,同时去除掉基础词典中的低频词语。以种子词语为基础,采用SVM进行机器学习扩展种子词语,并将种子词语加入到基础词典中,之后将网络流行词语加入其中,得到最终的褒贬义词典。搜集词语构建包含否定词语的词典。搜集程度修饰词语并构建程度修饰词典,将修饰词语根据修饰的程度划分为极度、高度、中度、轻度四类,极度修饰词如极其、非常,高度修饰词如格外、分外、太,中度修饰词如更加、较为,低度修饰词如稍微、略微等。
3.确定主题句
对篇章中的所有词语根据其词频由高到低排序,通过词性标注结果,只选取名词或者名词性短语,过滤掉停用词,选取一定数目的高频词语作为主题词,包含主题词语的句子称为主题句。
4.计算句子的情感值
对于句子的情感状态采用情感值来判断,遍历句子中的每一个词语判断是否出现在正负向情感词典中,如果出现在正向的情感词典中则词语的权值为+1,如果出现在负向的情感词典中则词语的权值为-1,否则处理下一个词语。获取语料预处理阶段生成的句法结构,判断词语的依存关系,若依存关系中存在程度修饰词语,则根据程度修饰级别赋予权值系数。权值系数是经过前期大量文本的测试而确定,极度修饰词系数为2,高度修饰词系数为1.75,中度修饰词系数为1.5,轻度修饰词系数为0.75。判断当前词语依存关系中是否存在否定词语,若存在则计算否定词语的数目,数目为奇数则情感值的极性取反。经过上述步骤,计算当前词语最终的情感值。句子中每个情感词语因其先后顺序不同,对句子整体的情感值贡献也不同,在此引入词语的位置系数,如果词语的数目为L,则首尾词语的位置系数为2/L,其余词语的位置系数为1/L,即句子第一个词语和最后一个词语的位置系数为2/L,中间的为1/L,计算所有词语的权值之和,获取句子的情感值。
5.计算文章的情感值
文章中的句子因其位置的不同、与主题的紧密程度不同,其重要性也不相同,在计算文章的情感值时需要综合考虑句子的重要性,赋予合适的比例系数。标题句是文章思想的浓缩,首先判断句子是否是标题句,如果是则赋予比例系数2。段首尾中的内容是对文章进行的引领和总结,若句子所在段落是段首,则赋予比例系数1.5,若为段尾,则比例系数为1.75。所有包含主题词语的句子称为主题句,若句子为主题句则赋予比例系数1.5。与标题内容具有较高相似度的句子也需要提升比例系数,需要计算每个主题句与标题句的相似度,在此采用余弦相似度来判断。每个句子以主题词语作为特征属性,对应的词频作为特征值,每一个句子表示为向量空间中的一个向量。计算公式如下所示。
Sim ( S , T ) = cos &theta; = &Sigma; k = 1 n w k ( S ) &times; w k ( T ) &Sigma; k = 1 n w k 2 ( S ) &Sigma; k = 1 n w k 2 ( T )
其中S表示当前处理的句子,T表示标题句,Wk(S)表示句子S中主题词特征值,wk(T)表示标题句中主题词的特征值。在此规定相似度的阈值为0.8,即若句子与标题的相似度余弦值>=0.8则赋予比例系数1.5。
感叹句表示较为强烈的情感色彩,如果句子为感叹句,则赋予比例系数1.75。
计算所有句子最终的情感值之和,获取文章的情感值,如果文章的情感值>0,则文章中体现的是正向积极的情感;如果情感值<0,则文章体现的是负向消极的情感;如果情感值为0,则表示文章中的情感是客观中立的。
本方法在计算语句情感值时充分考虑了词语所处的语言环境、词语之间的依存关系,更符合中文的语法语境,识别结果更加合理。在计算篇章的情感值时充分考虑了句子的重要性,不同类型的语句所表达的情感重要性也不同,前期经过大量的测试,合理的选择了不同语句的情感值系数,情感分析结果更加准确、合理。

Claims (8)

1.一种中文文本情感识别方法,其步骤为:
1)分别构建包含正向词语和负向词语的褒贬义词典,构建修饰程度词语的程度词典,构建用于确定否定词语的否定词典;
2)利用语法分析工具对待处理语料文本的句子进行分词处理,得到词语的依存关系并统计每个词语的词频;
3)根据词频对分词所得词语排序,选取指定数目的词语作为主题词,将包含主题词的语句标为主题句;
4)对句子中的每一词语,判断其是否出现在该褒贬义词典中确定该词语的情感初值,并根据词语的依存关系确定出该词语的修饰程度词语和否定词语,然后根据确定出的修饰程度词语在所述程度词典的取值确定该词语的权重系数、根据确定出的否定词语数目确定该词语的极性,从而得到该词语的情感值;然后对该句子所有词语的情感值求和得到该句子的情感值;
5)将该待处理语料文本中的所有句子的情感值进行求和,得到该待处理语料文本的情感状态。
2.如权利要求1所述的方法,其特征在于对该待处理语料文本中的每一句子,根据其在文中的位置赋予一权值系数,将每一句子的情感权值与对应的权值系数相乘,然后求和得到该待处理语料文本的情感状态。
3.如权利要求2所述的方法,其特征在于句子中的每个词语根据其在句子中的位置设置该词语的位置系数,如果该句子中词语的数目为L,则该句子中第一个词语和最后一个词语的位置系数为2/L,中间的词语为1/L;将词语的位置系数与该词语的当前权重系数之和作为该词语新的权重系数。
4.如权利要求2所述的方法,其特征在于标题句的权值系数>尾段中句子的权值系数>首段中句子的权值系数>中间段中句子的权值系数。
5.如权利要求1或2或3或4所述的方法,其特征在于计算每个主题句与标题句的相似度,如果相似度大于设定阈值,则增加该句子的权值系数。
6.如权利要求5所述的方法,其特征在于计算所述相似度的公式为:
Sim ( S , T ) = cos &theta; = &Sigma; k = 1 n w k ( S ) &times; w k ( T ) &Sigma; k = 1 n w k 2 ( S ) &Sigma; k = 1 n w k 2 ( T )
其中S表示当前处理的句子,T表示标题句,wk(S)表示句子S中主题词特征值,wk(T)表示标题句中主题词的特征值。
7.如权利要求1所述的方法,其特征在于利用语法分析工具识别每一句是否为感叹句,如果句子为感叹句,则增加该句子的权值系数。
8.如权利要求1所述的方法,其特征在于所述程度词典包括修饰程度为极度、高度、中度和低度的修饰程度词语,每一级的修饰程度词语对应一权重系数。
CN201310690318.2A 2013-12-16 2013-12-16 一种中文文本情感识别方法 Pending CN103678278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310690318.2A CN103678278A (zh) 2013-12-16 2013-12-16 一种中文文本情感识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310690318.2A CN103678278A (zh) 2013-12-16 2013-12-16 一种中文文本情感识别方法

Publications (1)

Publication Number Publication Date
CN103678278A true CN103678278A (zh) 2014-03-26

Family

ID=50315887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310690318.2A Pending CN103678278A (zh) 2013-12-16 2013-12-16 一种中文文本情感识别方法

Country Status (1)

Country Link
CN (1) CN103678278A (zh)

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008091A (zh) * 2014-05-26 2014-08-27 上海大学 一种基于情感值的网络文本情感分析方法
US20150019208A1 (en) * 2012-02-09 2015-01-15 Minning Essential Method for identifying a set of sentences in a digital document, method for generating a digital document, and associated device
CN104408035A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 词语情感类型的分析方法和装置
CN104462065A (zh) * 2014-12-15 2015-03-25 北京国双科技有限公司 事件情感类型的分析方法和装置
WO2015103695A1 (en) * 2014-01-10 2015-07-16 Cluep Inc. Systems, devices, and methods for automatic detection of feelings in text
CN104915335A (zh) * 2015-06-12 2015-09-16 百度在线网络技术(北京)有限公司 为主题文档集生成摘要的方法和装置
CN105069021A (zh) * 2015-07-15 2015-11-18 广东石油化工学院 基于领域的中文短文本情感分类方法
WO2016085409A1 (en) * 2014-11-24 2016-06-02 Agency For Science, Technology And Research A method and system for sentiment classification and emotion classification
CN106202200A (zh) * 2016-06-28 2016-12-07 昆明理工大学 一种基于固定主题的文本情感倾向性分类方法
CN106294312A (zh) * 2015-06-29 2017-01-04 北京大学 信息处理方法和信息处理系统
CN106325537A (zh) * 2015-06-23 2017-01-11 腾讯科技(深圳)有限公司 信息输入方法及装置
CN106547740A (zh) * 2016-11-24 2017-03-29 四川无声信息技术有限公司 文本信息处理方法及装置
CN106776686A (zh) * 2016-11-09 2017-05-31 武汉泰迪智慧科技有限公司 基于多领的中文域短文本理解方法及系统
CN106776551A (zh) * 2016-12-06 2017-05-31 桂林电子科技大学 一种英语作文情感观点的分析方法
CN103995803B (zh) * 2014-04-25 2017-07-04 西北工业大学 一种细粒度文本情感分析方法
CN107038249A (zh) * 2017-04-28 2017-08-11 安徽博约信息科技股份有限公司 基于词典的网络舆情信息情感分类方法
CN107045497A (zh) * 2017-05-04 2017-08-15 成都华栖云科技有限公司 一种快速的新闻文本内容情感分析系统及方法
CN107229612A (zh) * 2017-05-24 2017-10-03 重庆誉存大数据科技有限公司 一种网络信息语义倾向分析方法及系统
CN107229610A (zh) * 2017-03-17 2017-10-03 咪咕数字传媒有限公司 一种情感数据的分析方法及装置
CN108062300A (zh) * 2016-11-08 2018-05-22 中移(苏州)软件技术有限公司 一种基于中文文本进行情感倾向分析的方法及装置
CN108319588A (zh) * 2018-02-13 2018-07-24 北京易真学思教育科技有限公司 文本情感分析系统及方法、存储介质
CN108536671A (zh) * 2018-03-07 2018-09-14 世纪龙信息网络有限责任公司 文本数据的情感指数识别方法和系统
CN109213989A (zh) * 2017-07-01 2019-01-15 武汉斗鱼网络科技有限公司 分析语言的弹幕分发方法、存储介质、电子设备及系统
CN109284499A (zh) * 2018-08-01 2019-01-29 数据地平线(广州)科技有限公司 一种行业文本情感获取方法、装置及存储介质
WO2019034956A1 (en) * 2017-08-17 2019-02-21 International Business Machines Corporation LEXICAL ANALYSIS SPECIFIC TO A DOMAIN
CN109614551A (zh) * 2018-12-12 2019-04-12 上海优扬新媒信息技术有限公司 一种负面舆情判断方法和装置
CN110096696A (zh) * 2018-06-11 2019-08-06 电子科技大学 一种中文长文本情感分析方法
CN110309506A (zh) * 2019-05-28 2019-10-08 北京三快在线科技有限公司 语句分析方法、装置、电子设备及可读存储介质
CN110334182A (zh) * 2019-06-24 2019-10-15 中国南方电网有限责任公司 具有语音情感识别的在线服务方法
US10445423B2 (en) 2017-08-17 2019-10-15 International Business Machines Corporation Domain-specific lexically-driven pre-parser
CN110362679A (zh) * 2019-06-05 2019-10-22 北京大学(天津滨海)新一代信息技术研究院 一种基于情感词典的金融领域评论情感分类方法及系统
CN110609996A (zh) * 2018-06-15 2019-12-24 阿里巴巴集团控股有限公司 文本情绪识别方法、装置及电子设备
US10546064B2 (en) * 2014-02-04 2020-01-28 Intelligent Voice Limited System and method for contextualising a stream of unstructured text representative of spoken word
CN110826317A (zh) * 2019-11-07 2020-02-21 成都国腾实业集团有限公司 基于词典与规则的文本情感分析方法
CN111241847A (zh) * 2020-01-15 2020-06-05 深圳前海微众银行股份有限公司 一种识别对话情感原因的方法及装置
CN112182332A (zh) * 2020-09-25 2021-01-05 科大国创云网科技有限公司 一种基于爬虫采集的情感分类方法及系统
WO2021147298A1 (zh) * 2020-01-21 2021-07-29 中国银联股份有限公司 情感词典构建方法和系统、情感识别方法和系统以及存储介质
CN113240425A (zh) * 2021-04-27 2021-08-10 湖南大学 基于深度学习的金融反洗钱交易方法、设备及存储介质
CN117393003A (zh) * 2023-12-13 2024-01-12 广州云趣信息科技有限公司 一种基于语义理解的情绪识别方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620596A (zh) * 2008-06-30 2010-01-06 东北大学 一种面向查询的多文档自动摘要方法
CN101727487A (zh) * 2009-12-04 2010-06-09 中国人民解放军信息工程大学 一种面向网络评论的观点主题识别方法和系统
CN102122297A (zh) * 2011-03-04 2011-07-13 北京航空航天大学 一种基于语义的汉语网络文本情感提取方法
CN103235818A (zh) * 2013-04-27 2013-08-07 北京百度网讯科技有限公司 一种基于网页情感倾向性的信息推送方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620596A (zh) * 2008-06-30 2010-01-06 东北大学 一种面向查询的多文档自动摘要方法
CN101727487A (zh) * 2009-12-04 2010-06-09 中国人民解放军信息工程大学 一种面向网络评论的观点主题识别方法和系统
CN102122297A (zh) * 2011-03-04 2011-07-13 北京航空航天大学 一种基于语义的汉语网络文本情感提取方法
CN103235818A (zh) * 2013-04-27 2013-08-07 北京百度网讯科技有限公司 一种基于网页情感倾向性的信息推送方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SONGBO TAN,JIN ZHANG: "An empirical study of sentiment analysis for chinese documents", 《EXPERT SYSTEMS WITH APPLICATIONS》 *
刘倩: "基于本体的话题情感分析研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
喻琦: "中文微博情感分析技术研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
王洪伟,郑丽娟,尹裴,何绍义: "基于句子级情感的中文网络评论的情感极性分类", 《管理科学学报》 *

Cited By (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150019208A1 (en) * 2012-02-09 2015-01-15 Minning Essential Method for identifying a set of sentences in a digital document, method for generating a digital document, and associated device
US20160321243A1 (en) * 2014-01-10 2016-11-03 Cluep Inc. Systems, devices, and methods for automatic detection of feelings in text
US10073830B2 (en) * 2014-01-10 2018-09-11 Cluep Inc. Systems, devices, and methods for automatic detection of feelings in text
WO2015103695A1 (en) * 2014-01-10 2015-07-16 Cluep Inc. Systems, devices, and methods for automatic detection of feelings in text
US10546064B2 (en) * 2014-02-04 2020-01-28 Intelligent Voice Limited System and method for contextualising a stream of unstructured text representative of spoken word
CN103995803B (zh) * 2014-04-25 2017-07-04 西北工业大学 一种细粒度文本情感分析方法
CN104008091A (zh) * 2014-05-26 2014-08-27 上海大学 一种基于情感值的网络文本情感分析方法
CN104008091B (zh) * 2014-05-26 2017-03-15 上海大学 一种基于情感值的网络文本情感分析方法
WO2016085409A1 (en) * 2014-11-24 2016-06-02 Agency For Science, Technology And Research A method and system for sentiment classification and emotion classification
CN104462065B (zh) * 2014-12-15 2017-10-27 北京国双科技有限公司 事件情感类型的分析方法和装置
CN104408035B (zh) * 2014-12-15 2018-04-03 北京国双科技有限公司 词语情感类型的分析方法和装置
CN104462065A (zh) * 2014-12-15 2015-03-25 北京国双科技有限公司 事件情感类型的分析方法和装置
CN104408035A (zh) * 2014-12-15 2015-03-11 北京国双科技有限公司 词语情感类型的分析方法和装置
CN104915335A (zh) * 2015-06-12 2015-09-16 百度在线网络技术(北京)有限公司 为主题文档集生成摘要的方法和装置
CN106325537A (zh) * 2015-06-23 2017-01-11 腾讯科技(深圳)有限公司 信息输入方法及装置
CN106294312A (zh) * 2015-06-29 2017-01-04 北京大学 信息处理方法和信息处理系统
CN106294312B (zh) * 2015-06-29 2019-02-26 北京大学 信息处理方法和信息处理系统
CN105069021A (zh) * 2015-07-15 2015-11-18 广东石油化工学院 基于领域的中文短文本情感分类方法
CN105069021B (zh) * 2015-07-15 2018-04-20 广东石油化工学院 基于领域的中文短文本情感分类方法
CN106202200B (zh) * 2016-06-28 2019-09-27 昆明理工大学 一种基于固定主题的文本情感倾向性分类方法
CN106202200A (zh) * 2016-06-28 2016-12-07 昆明理工大学 一种基于固定主题的文本情感倾向性分类方法
CN108062300A (zh) * 2016-11-08 2018-05-22 中移(苏州)软件技术有限公司 一种基于中文文本进行情感倾向分析的方法及装置
CN106776686A (zh) * 2016-11-09 2017-05-31 武汉泰迪智慧科技有限公司 基于多领的中文域短文本理解方法及系统
CN106547740A (zh) * 2016-11-24 2017-03-29 四川无声信息技术有限公司 文本信息处理方法及装置
CN106776551B (zh) * 2016-12-06 2020-05-08 桂林电子科技大学 一种英语作文情感观点的分析方法
CN106776551A (zh) * 2016-12-06 2017-05-31 桂林电子科技大学 一种英语作文情感观点的分析方法
CN107229610A (zh) * 2017-03-17 2017-10-03 咪咕数字传媒有限公司 一种情感数据的分析方法及装置
CN107038249A (zh) * 2017-04-28 2017-08-11 安徽博约信息科技股份有限公司 基于词典的网络舆情信息情感分类方法
CN107045497A (zh) * 2017-05-04 2017-08-15 成都华栖云科技有限公司 一种快速的新闻文本内容情感分析系统及方法
CN107229612A (zh) * 2017-05-24 2017-10-03 重庆誉存大数据科技有限公司 一种网络信息语义倾向分析方法及系统
CN107229612B (zh) * 2017-05-24 2021-01-08 重庆电信系统集成有限公司 一种网络信息语义倾向分析方法及系统
CN109213989A (zh) * 2017-07-01 2019-01-15 武汉斗鱼网络科技有限公司 分析语言的弹幕分发方法、存储介质、电子设备及系统
CN110998587A (zh) * 2017-08-17 2020-04-10 国际商业机器公司 域特定的词汇分析
WO2019034956A1 (en) * 2017-08-17 2019-02-21 International Business Machines Corporation LEXICAL ANALYSIS SPECIFIC TO A DOMAIN
CN110998587B (zh) * 2017-08-17 2023-10-31 国际商业机器公司 用于域特定的词汇分析的方法和系统
US10769375B2 (en) 2017-08-17 2020-09-08 International Business Machines Corporation Domain-specific lexical analysis
US10769376B2 (en) 2017-08-17 2020-09-08 International Business Machines Corporation Domain-specific lexical analysis
US10445423B2 (en) 2017-08-17 2019-10-15 International Business Machines Corporation Domain-specific lexically-driven pre-parser
GB2579326A (en) * 2017-08-17 2020-06-17 Ibm Domain-specific lexical analysis
US10496744B2 (en) 2017-08-17 2019-12-03 International Business Machines Corporation Domain-specific lexically-driven pre-parser
CN108319588B (zh) * 2018-02-13 2021-02-02 北京世纪好未来教育科技有限公司 文本情感分析系统及方法、存储介质
CN108319588A (zh) * 2018-02-13 2018-07-24 北京易真学思教育科技有限公司 文本情感分析系统及方法、存储介质
CN108536671A (zh) * 2018-03-07 2018-09-14 世纪龙信息网络有限责任公司 文本数据的情感指数识别方法和系统
CN110096696A (zh) * 2018-06-11 2019-08-06 电子科技大学 一种中文长文本情感分析方法
CN110609996B (zh) * 2018-06-15 2023-05-02 阿里巴巴集团控股有限公司 文本情绪识别方法、装置及电子设备
CN110609996A (zh) * 2018-06-15 2019-12-24 阿里巴巴集团控股有限公司 文本情绪识别方法、装置及电子设备
CN109284499A (zh) * 2018-08-01 2019-01-29 数据地平线(广州)科技有限公司 一种行业文本情感获取方法、装置及存储介质
CN109614551A (zh) * 2018-12-12 2019-04-12 上海优扬新媒信息技术有限公司 一种负面舆情判断方法和装置
CN110309506A (zh) * 2019-05-28 2019-10-08 北京三快在线科技有限公司 语句分析方法、装置、电子设备及可读存储介质
CN110309506B (zh) * 2019-05-28 2021-04-27 北京三快在线科技有限公司 语句分析方法、装置、电子设备及可读存储介质
CN110362679A (zh) * 2019-06-05 2019-10-22 北京大学(天津滨海)新一代信息技术研究院 一种基于情感词典的金融领域评论情感分类方法及系统
CN110334182A (zh) * 2019-06-24 2019-10-15 中国南方电网有限责任公司 具有语音情感识别的在线服务方法
CN110826317A (zh) * 2019-11-07 2020-02-21 成都国腾实业集团有限公司 基于词典与规则的文本情感分析方法
CN111241847A (zh) * 2020-01-15 2020-06-05 深圳前海微众银行股份有限公司 一种识别对话情感原因的方法及装置
WO2021147298A1 (zh) * 2020-01-21 2021-07-29 中国银联股份有限公司 情感词典构建方法和系统、情感识别方法和系统以及存储介质
CN112182332A (zh) * 2020-09-25 2021-01-05 科大国创云网科技有限公司 一种基于爬虫采集的情感分类方法及系统
CN113240425A (zh) * 2021-04-27 2021-08-10 湖南大学 基于深度学习的金融反洗钱交易方法、设备及存储介质
CN117393003A (zh) * 2023-12-13 2024-01-12 广州云趣信息科技有限公司 一种基于语义理解的情绪识别方法及系统
CN117393003B (zh) * 2023-12-13 2024-03-15 广州云趣信息科技有限公司 一种基于语义理解的情绪识别方法及系统

Similar Documents

Publication Publication Date Title
CN103678278A (zh) 一种中文文本情感识别方法
CN103744953A (zh) 一种基于中文文本情感识别的网络热点挖掘方法
CN111767741B (zh) 一种基于深度学习和tfidf算法的文本情感分析方法
CN102663139B (zh) 一种情感词典构建方法及系统
CN106598944B (zh) 一种民航安保舆情情感分析方法
Stamatatos et al. Automatic text categorization in terms of genre and author
Seroussi et al. Authorship attribution with latent Dirichlet allocation
CN103235772B (zh) 一种文本集人物关系自动提取方法
CN107239439A (zh) 基于word2vec的舆情倾向性分析方法
CN108108433A (zh) 一种基于规则和数据网络融合的情感分析方法
CN108549634A (zh) 一种中文专利文本相似度计算方法
CN107229610A (zh) 一种情感数据的分析方法及装置
Chang et al. Research on detection methods based on Doc2vec abnormal comments
CN105138577B (zh) 一种基于大数据的事件演化分析方法
CN105205124A (zh) 一种基于随机特征子空间的半监督文本情感分类方法
US11893537B2 (en) Linguistic analysis of seed documents and peer groups
Bruno Text mining and sentiment extraction in central bank documents
CN108073571A (zh) 一种多语言文本质量评估方法及系统、智能文本处理系统
CN104462408A (zh) 一种基于主题建模的多粒度情感分析方法
Kerz et al. Automated classification of written proficiency levels on the CEFR-scale through complexity contours and RNNs
Wang et al. Fiction popularity prediction based on emotion analysis
Song et al. Improving embedding-based unsupervised keyphrase extraction by incorporating structural information
Siregar Application of the Naive Bayes classifier method in the sentiment analysis of Twitter user about the capital city relocation
Feng et al. Product feature extraction via topic model and synonym recognition approach
Shanthi et al. Suicidal Ideation Prediction Using Machine Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140326