CN101609459A - 一种情感特征词提取系统 - Google Patents
一种情感特征词提取系统 Download PDFInfo
- Publication number
- CN101609459A CN101609459A CNA200910089711XA CN200910089711A CN101609459A CN 101609459 A CN101609459 A CN 101609459A CN A200910089711X A CNA200910089711X A CN A200910089711XA CN 200910089711 A CN200910089711 A CN 200910089711A CN 101609459 A CN101609459 A CN 101609459A
- Authority
- CN
- China
- Prior art keywords
- affective
- speech
- characteristic words
- candidate
- drops
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及一种情感特征词提取系统,其特征在于:它包括特征选取模块、特征验证模块、关系提取模块、广义情感特征词表和狭义情感特征词表;特征选取模块利用评论所针对的文章集合中的文章内容和评论集合中的评论内容,分别提取评论内容全体的候选情感特征词和分类的候选情感特征词;关系提取模块根据文章内容,通过模板构建一个词与词的语义关系图;通过全体的候选情感特征词和语义关系图建立广义情感特征词表;通过分类的候选情感特征词和语义关系图建立狭义情感特征词表。本发明获取情感特征词的方法既适用于较大主题的通用情感分析,也能在细化的主题中进行更加深入的情感分析。本发明的情感特征词提取系统可广泛应用于对新闻、论坛和博客等评论进行情感分析。
Description
技术主题
本发明涉及一种特征提取系统,特别是关于一种情感特征词提取系统。
背景技术
随着网络的普及,网络上的数据以指数级的速度增长。特别是Web2.0的兴起和发展,网络上用户生成内容越来越多,比如博客、评论、论坛帖子等,它们在网络中占据越来越重要的地位。用户生成的内容中除了包含很多事实性的内容之外,也包含大量与情感因素相关的内容,并且后者的影响也越来越大。比如用户在购买商品时会很自然的去网上搜索其要购买商品的相关信息,其他用户对于该商品的评论信息很可能直接影响到用户的购买。因此厂家也越来越关注于消费者对其商品的反馈,利用这些反馈信息可以用来理解用户需求和满意度,从而改善产品质量以及提高服务质量。此外,政府机关、政治团体也越来越关注网络平台的作用,例如政府会关注其政策法规在网络中的反响,关注网上的舆情信息,特别是热点事件的舆情信息。
传统的网络信息处理主要是基于事实性的文本进行处理,比如基于关键字的检索,文本的分类、聚类等,很少关注其中包含的情感信息。与传统文本处理方式不同的是,情感分析主要用来分析和挖掘用户的情感倾向,来弥补传统搜索引擎等工具的不足。在情感分析工作中,情感的特征选取不仅是进行情感分类的主要基础,还是影响情感分析结果的重要因素。与传统的分类方法不同的是,情感分析很难采用传统的基于词频等简单的统计信息来提取特征,因为情感分类所需的特征最好应该是能够直接代表情感特征词的词;而且不同主题有不同的情感特征词,比如“布什是中国人民的老朋友”和“老布什越老越糊涂”。“老”这个词在这三个地方中有三种不同的情感特征词。由于情感特征词分析的特殊性,传统文本分析方法不能满足其要求。
在情感分析中,特征选取的方法是其中的最重要的一个部分,其效果直接决定了情感分析的效果。目前的研究发现,利用机器学习的方法比直接进行人工选取的方法还要有效。现在情感的特征提取方式主要有:手动选取情感特征词,基于搜索引擎来计算少量的其它特征词和选定特征词的逐点互信息量值(Pointwise Mutual Information,PMI)来确定;在大规模语料中,找出同义共现的模式去匹配;使用更多的种子词,使用对数似然率(log likelihood ratio,LLR);基于字典的方法,从一些核心词典出发,利用WordNet(英文),HowNet(中文)提供的关系去扩展。但是这些方法对评论的召回率都存在着偏低的现象,即很多评论没有对应的情感特征词去分析其情感倾向。
发明内容
针对上述问题,本发明的目的是提供一种能有效改进评论语句少、评论对象相对分散内容的情感分析效果,并且能在细化的主题中进行细致情感分析的情感特征词提取系统。
为实现上述目的,本发明采取以下技术方案:一种情感特征词提取系统,其特征在于:它包括特征选取模块、特征验证模块、关系提取模块、广义情感特征词表和狭义情感特征词表;所述特征选取模块利用文章集合中的文章内容和评论集合中的评论内容,分别提取评论内容全体的候选情感特征词和分类的候选情感特征词;所述关系提取模块根据所述文章内容,通过模板构建一个词与词的语义关系图;通过所述全体的候选情感特征词和语义关系图建立广义情感特征词表;通过所述分类的候选情感特征词和语义关系图建立狭义情感特征词表。
所述特征选取模块中候选情感特征词的提取方法为:利用评论集合与文章集合的词频信息差异,用打分法选取候选情感特征词,计算方程为:
Score1(Term)=(R_DF(Term)/(N_DF(Term)+1) (1)
Score2(Term)=(R_TF(Term)/(N_TF(Term)+1) (2)
其中Score1表示通过方程(1)计算得到的分值,Score2表示通过方程(2)计算得到的分值;Term表示词;R_DF(Term)表示词出现在所述评论集合的不同评论内容中的次数;N_DF(Term)表示词出现在所述文章集合的不同文章内容中的次数;R_TF(Term)表示词在所述评论集合中出现的总次数;N_TF(Term)表示词在所述文章集合中出现的总次数;之后按分值对词进行排序,选取一定数目得分较高的词作为候选情感特征词;排序规则是先按Score1进行比较,如果Score1一样,再按Score2进行比较。
建立所述广义情感特征词表时,在所述特征验证模块中,在全体的候选情感特征词中选取部分进行正负向标注,形成基础情感特征词表,所述基础情感特征词表根据其中的词性,分为正向表和负向表两部分;在所述语义关系图中找出基础情感特征词表中已标注的情感特征词的所有的同位词,将这些同位词扩充入所述基础情感特征词表中的正向表和负向表中;最后结合所述语义关系图,使用半监督学习的方法对扩充的同位词进行倾向标注和过滤,得到所述广义情感特征词表。
建立所述狭义情感特征词表时,在所述特征验证模块中,针对所有的分类的候选情感特征词,结合所述扩充后的正向表和负向表,对各类候选情感特征词进行半监督学习的正负向判定。
所述半监督学习方法为:在语义关系图中寻找某个词的同位词,如果某个词的同位词落在正向表中的数目大于落在负向表中的数目,并且落在正向表中的同位词数目超过预先设定的最小阈值,那么该词的词性就标识为正向;如果某个词的同位词落在负向表中的数目大于落在正向表中的数目,并且落在负向表中的同位词数目超过预先设定的最小阈值,那么该词就标识为负向;如果某个词的同位词落在正向表和落在负向表中的数目均达不到预先设定的最小阈值,则过滤掉该词。
本发明由于采取以上技术方案,其具有以下优点:1、本发明的系统由于使用评论对象和评论之间差异获取情感特征词的方法,对于评论语句少、评论对象相对分散的新闻、论坛和博客等评论,进行情感分析的效果有较大的改进。2、本发明获取情感特征词的方法既适用于较大主题的通用情感分析,也能在细化的主题中进行更加深入的情感分析,在通用的情感分析中,评论的情感分析召回率提高了34.8%~40.9%;在特定类别的情感分析中,召回率提高了91%~105%。本发明的情感特征词提取系统可广泛应用于对新闻、论坛和博客等评论进行情感分析。
附图说明
图1是本发明产生广义情感特征词表的流程示意图
图2是本发明产生狭义情感特征词表的流程示意图
图3是本发明系统应用于新闻评论情感分析的流程示意图
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
如图1所示,本发明基于多层次的情感特征词提取系统,通过评论与评论所针对的文章之间的用词差异性进行建模,按词与词的层次关系找出评论内容中常用的情感特征词,以及特定领域的情感特征词。本发明的系统包括:特征选取模块1、特征验证模块2、关系提取模块3、广义情感特征词表4和狭义情感特征词表5。一方面,在特征选取模块1中分别计算评论集合R中的评论内容及其针对的文章集合N中的文章内容的统计信息,再利用评论内容的词的特征信息与评论内容所针对的文章内容的特征信息的差异信息,来得出评论内容的候选情感特征词。在特征验证模块2中,根据评论集合R所针对的文章集合N的文章内容中的词与词的同位关系和词性信息,先采用人工方法或人机混合方法对候选情感特征词进行初步正负向判定和有效性过滤,得出部分候选情感特征词的正负向词性,建立有标号的情感特征词组成的基础情感特征词库。在关系提取模块3中根据评论集合R所针对的文章集合N中的文章内容构建一个词与词的语义关系图,包括“上位,同位,下位”三种关系。基础情感特征词库结合语义关系图,对候选情感特征词通过半监督学习方法进行情感倾向标注和扩充,得出由标注后的情感特征词组成的广义情感特征词表4,用于对一般的评论内容进行通用情感分析。
如图2所示,本发明的系统为了改善对具体针对某个类别主题评论的情感分析效果,特别是针对热点主题的评论内容的情感分析,本发明提出一种狭义情感特征词表5的提取方法:在评论集合R所针对的文章集合N中根据文章内容进行聚类,按聚类的数目的多少确定出热点主题作为我们关注的具体类别,如类别1、类别2,……,类别n。在特征选取模块1中通过分别对类别1、类别2,……,类别n的主题和对应的评论内容进行对比,获得分别属于类别1、类别2,……,类别n的候选情感特征词。然后在特征验证模块2中对该类别下的候选情感特征进行情感倾向标注,最终得到属于各类的狭义情感特征词表5。综上所述,本发明基于多层次的情感特征词提取系统不仅可以构建出通用的情感分析所用的情感特征词,也可以从细化的特定领域中找出与领域相关的情感特征词。比如既可以与产品相关的情感候选通用特征,也可以找到某一类产品,甚至某一种具体产品,具体产品的具体型号的相关情感特征词。
本发明的基于多层次的情感特征词提取系统建立步骤为:
1、提取候选情感特征词
1)在特征选取模块1中文章集合N中的文章内容和评论集合R中的评论内容的词频信息,词频信息包括词的TF值,即词出现的总的次数;DF值,即包含该词的文章数。
2)利用评论集合R与文章集合N的词频信息差异,用打分法选取候选情感特征词,计算方程为:
Score1(Term)=(R_DF(Term)/(N_DF(Term)+1)(1)
Score2(Term)=(R_TF(Term)/(N_TF(Term)+1)(2)
其中Score1表示通过方程(1)计算得到的分值,Score2表示通过方程(2)计算得到的分值;Term表示词;R_DF(Term)表示词出现在评论集合R的不同评论内容中的次数;N_DF(Term)表示词出现在评论集合所针对的文章集合N的不同文章内容中的次数;R_TF(Term)表示词在评论集合R中出现的总次数;N_TF(Term)表示词在文章集合N中出现的总次数。
3)利用方程(1)和方程(2)对评论集合R中出现的词进行打分,然后按分值对词进行排序,选取一定数目得分较高的词作为候选情感特征词。排序规则是先按Score1进行比较,如果Score1一样,再按Score2进行比较。
4)对评论所针对的文章集合N进行逐层细分,得到在每一层的候选情感特征词。对评论所针对的文章集合N采用的细分方法是,对文章集合N中的文章内容进行聚类,把那些包含文章内容数目较多的集合对应的内容主题当作热点主题,每一个热点主题作为一个层次。在热点主题对应的文章内容中,又可以进一步聚类成多个子热点主题,因此就可以得到一个根据热点主题和子热点主题之间的包含关系构建的层次化树形结构,之后在每一个层次上利用方程(1)和方程(2)得到该层次对应的候选情感特征词。这样不仅可以构建出分类粒度较大的广义情感分析所用的候选情感特征词,及根据它们建立的广义情感特征词表4;也可以得到分类粒度较小的狭义情感分析所用的候选情感特征词,及根据它们建立的类别相关的狭义情感特征词表5。
2、建立广义情感特征词表4和狭义情感特征词表5
在关系提取模块3中,根据评论所针对的文章集合N中的词与词的同位关系和词性信息,对步骤1中的候选情感特征词进行正负向判定和过滤,进而生成广义情感特征词表4和狭义情感特征词表5。这里同位关系是指词与词之间的在语句中的地位相同,比如汽车,丰田,宝马这三个词,丰田和保密是同位关系;情续,高兴,悲伤这三个词,高兴和悲伤时同位关系。词性信息是指根据词的词性进行过滤,只保留名词,动词,形容词和副词这些词性的词,其他如叹词,拟声词等词性的词都会被过滤掉。
i)在关系提取模块3中基于评论所针对的文章集合N,通过模板构建一个词与词的语义关系图,语义关系指词与词之间存在着同位的关系。
ii)在构建评论集合R的广义情感特征词表4时,在特征验证模块2中,首先选取部分候选情感特征词进行正负向标注,形成基础情感特征词表,基础情感特征词表根据其中的词性,分为正向表和负向表两部分。之后在语义关系图中找出基础情感特征词表已标注的情感特征词的所有同位词,将这些同位词扩充入的正向表和负向表中。最后利用语义关系图验证正向表和负向表中未标注词的词性,在语义关系图中寻找正向表和负向表中未标注词的同位词,如果某个未标注词的同位词落在正向表中的数目大于落在负向表中的数目,并且落在正向表中的同位词数目超过预先设定的最小阈值,那么该未标注词的词性就标识为正向,加到广义情感特征词表4中去;如果某个未标注词的同位词落在负向表中的数目大于落在正向表中的数目,并且落在负向表中的同位词数目超过预先设定的最小阈值,那么该未标注词就标识为负向,加到广义情感特征词表4中去;如果某个未标注词的同位词落在正向表和落在负向表中的数目均达不到预先设定的最小阈值,则过滤掉该未标注词。
iii)在构建狭义情感特征词表5时,利用在步骤4)中得到的依层次划分的候选情感特征词以及热点主题内实体之间的相互关系,来确定候选情感特征词中词的正负倾向和是否需要过滤。在特征验证模块2中,针对每个类别的候选情感特征词,根据基础情感特征词表中的已标注的情感特征词,对各类候选情感特征词进行半监督学习的正负向判定。首先在语义关系图中寻找已标注的情感特征词的所有同位词,加上基础情感特征词表中的已标注情感特征词,根据其中词性分为正向表和负向表两部分。其次分别对各类别的候选情感特征词进行判断,在语义关系图中寻找某类候选情感特征词的词的同位词,如果某个候选情感特征词的同位词落在正向表中的数目大于落在负向表中的数目,并且落在正向表中的同位词数目超过预先设定的最小阈值,那么该候选情感特征词的词性就标识为正向,加到狭义情感特征词表5中去;如果某个候选情感特征词的同位词落在负向表中的数目大于落在正向表中的数目,并且落在负向表中的同位词数目超过预先设定的最小阈值,那么该候选情感特征词就标识为负向,加到狭义情感特征词表5中去;如果该候选情感特征词的同位词落在正向表和落在负向表中的数目均达不到预先设定的最小阈值,则过滤掉该候选情感特征词。与步骤ii)的不同之处在于,对狭义情感特征词表5不再进行扩充,而且这些情感特征词需要与实体存在修饰的关系。
如图3所示,通过对某则新闻的评论进行情感分析为实施例,说明本发明系统的工作过程,其中新闻集合N中的新闻内容,对新闻主题的新闻评论对应评论集合R中的评论内容。
I)将新闻集合N及其对应的评论集合R输入特征选取模块1,利用方程(1)和方程(2)对比新闻集合N和评论集合R的词频信息,得到评论内容的候选情感特征词。
II)在特征验证模块2中对候选情感特征词进行初步的筛选和倾向标注,得到基础情感特征词表。
III)在关系提取模块3中通过模板根据新闻集合N构建一个词与词的语义关系图。
VI)对情感特征词结合语义关系图进行情感特征词的扩充和验证,得到广义情感特征词表4和狭义情感特征词表5。
V)通用的情感分析中利用广义情感特征词表4进行分析,在特定类别的情感分析中,利用狭义情感特征词表5进行分析。
综上所述,在经过以上步骤之后,可以得到了广义情感特征词表4和狭义情感特征词表5。在对新闻评论进行情感分析时,首先判断新闻评论是否属于某个具体类别下,如果能找出新闻评论的类别,则利用该类别的狭义情感特征词表5结合一些经过否定、转折等句法分析得到的评论特征,对新闻评论进行情感倾向性判定。而如果没有找到具体类别,就利用广义情感特征词表4对新闻评论进行判定。进行情感倾向性判定的方法:在广义情感特征词表4或狭义情感特征词表5中定位情感特征词,如果情感特征词前有否定前缀,则将其情感倾向取反;如果情感特征词处于转折语句中,在转折前的分句中有情感特征词,则舍弃转折后的分句;否则看转折后的分句有无情感特征词,有的话将其情感倾向取反;最后统计所有的情感特征词的情感倾向,如果为正,则认为整个评论的情感倾向为正。
本发明的系统既适用于较大主题的通用情感分析,也能在细化的主题中进行更加深入的情感分析。在通用的情感分析中,评论的情感分析召回率提高了34.8%-40.9%;在特定类别的情感分析中,召回率提高了91%~105%。
Claims (7)
1、一种情感特征词提取系统,其特征在于:它包括特征选取模块、特征验证模块、关系提取模块、广义情感特征词表和狭义情感特征词表;所述特征选取模块利用文章集合中的文章内容和评论集合中的评论内容,分别提取评论内容全体的候选情感特征词和分类的候选情感特征词;所述关系提取模块根据所述文章内容,通过模板构建一个词与词的语义关系图;通过所述全体的候选情感特征词和语义关系图建立广义情感特征词表;通过所述分类的候选情感特征词和语义关系图建立狭义情感特征词表。
2、如权利要求1所述的一种情感特征词提取系统,其特征在于:所述特征选取模块中候选情感特征词的提取方法为:利用评论集合与文章集合的词频信息差异,用打分法选取候选情感特征词,计算方程为:
Score1(Term)=(R_DF(Term)/(N_DF(Term)+1) (1)
Score2(Term)=(R_TF(Term)/(N_TF(Term)+1) (2)
其中Score1表示通过方程(1)计算得到的分值,Score2表示通过方程(2)计算得到的分值;Term表示词;R_DF(Term)表示词出现在所述评论集合的不同评论内容中的次数;N_DF(Term)表示词出现在所述文章集合的不同文章内容中的次数;R_TF(Term)表示词在所述评论集合中出现的总次数;N_TF(Term)表示词在所述文章集合中出现的总次数;之后按分值对词进行排序,选取一定数目得分较高的词作为候选情感特征词;排序规则是先按Score1进行比较,如果Score1一样,再按Score2进行比较。
3、如权利要求1所述的一种情感特征词提取系统,其特征在于:建立所述广义情感特征词表时,在所述特征验证模块中,在全体的候选情感特征词中选取部分进行正负向标注,形成基础情感特征词表,所述基础情感特征词表根据其中的词性,分为正向表和负向表两部分;在所述语义关系图中找出基础情感特征词表中已标注的情感特征词的所有的同位词,将这些同位词扩充入所述基础情感特征词表中的正向表和负向表中;最后结合所述语义关系图,使用半监督学习的方法对扩充的同位词进行倾向标注和过滤,得到所述广义情感特征词表。
4、如权利要求2所述的一种情感特征词提取系统,其特征在于:建立所述广义情感特征词表时,在所述特征验证模块中,在所述全体的候选情感特征词中选取部分进行正负向标注,形成基础情感特征词表,所述基础情感特征词表根据其中的词性,分为正向表和负向表两部分;在所述语义关系图中找出基础情感特征词表中已标注的情感特征词的所有的同位词,将这些同位词扩充入所述基础情感特征词表中的正向表和负向表中;最后结合所述语义关系图,使用半监督学习的方法对扩充后的正向表和负向表进行倾向标注和过滤,形成所述广义情感特征词表。
5、如权利要求1或2或3或4所述的一种情感特征词提取系统,其特征在于:建立所述狭义情感特征词表时,在所述特征验证模块中,针对所有的分类的候选情感特征词,结合所述扩充后的正向表和负向表,对各类候选情感特征词进行半监督学习的正负向判定。
6、如权利要求1或2或3或4所述的一种情感特征词提取系统,其特征在于:所述半监督学习方法为:在语义关系图中寻找某个词的同位词,如果某个词的同位词落在正向表中的数目大于落在负向表中的数目,并且落在正向表中的同位词数目超过预先设定的最小阈值,那么该词的词性就标识为正向;如果某个词的同位词落在负向表中的数目大于落在正向表中的数目,并且落在负向表中的同位词数目超过预先设定的最小阈值,那么该词就标识为负向;如果某个词的同位词落在正向表和落在负向表中的数目均达不到预先设定的最小阈值,则过滤掉该词。
7、如权利要求5所述的一种情感特征词提取系统,其特征在于:所述半监督学习方法为:在语义关系图中寻找某个词的同位词,如果某个词的同位词落在正向表中的数目大于落在负向表中的数目,并且落在正向表中的同位词数目超过预先设定的最小阈值,那么该词的词性就标识为正向;如果某个词的同位词落在负向表中的数目大于落在正向表中的数目,并且落在负向表中的同位词数目超过预先设定的最小阈值,那么该词就标识为负向;如果某个词的同位词落在正向表和落在负向表中的数目均达不到预先设定的最小阈值,则过滤掉该词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200910089711XA CN101609459A (zh) | 2009-07-21 | 2009-07-21 | 一种情感特征词提取系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200910089711XA CN101609459A (zh) | 2009-07-21 | 2009-07-21 | 一种情感特征词提取系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101609459A true CN101609459A (zh) | 2009-12-23 |
Family
ID=41483216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200910089711XA Pending CN101609459A (zh) | 2009-07-21 | 2009-07-21 | 一种情感特征词提取系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101609459A (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236650A (zh) * | 2010-04-20 | 2011-11-09 | 日电(中国)有限公司 | 用于修正和/或扩展情感词典的方法和装置 |
CN102279890A (zh) * | 2011-09-02 | 2011-12-14 | 苏州大学 | 基于微博的情感词提取收集方法 |
CN102930042A (zh) * | 2012-11-13 | 2013-02-13 | 五邑大学 | 一种倾向性文本自动分类系统及其实现方法 |
CN102945268A (zh) * | 2012-10-25 | 2013-02-27 | 北京腾逸科技发展有限公司 | 产品特征评论挖掘方法及系统 |
CN103123633A (zh) * | 2011-11-21 | 2013-05-29 | 阿里巴巴集团控股有限公司 | 评价参数的生成方法以及基于评价参数的信息搜索方法 |
CN103150367A (zh) * | 2013-03-07 | 2013-06-12 | 宁波成电泰克电子信息技术发展有限公司 | 一种中文微博的情感倾向分析方法 |
CN103493040A (zh) * | 2011-04-21 | 2014-01-01 | 索尼公司 | 从文本中确定情感的方法 |
CN103559174A (zh) * | 2013-09-30 | 2014-02-05 | 东软集团股份有限公司 | 语义情感分类特征值提取方法及系统 |
CN103593431A (zh) * | 2013-11-11 | 2014-02-19 | 北京锐安科技有限公司 | 网络舆情分析方法和装置 |
CN103631874A (zh) * | 2013-11-07 | 2014-03-12 | 微梦创科网络科技(中国)有限公司 | 社交平台的ugc标签类别确定方法和装置 |
CN103927321A (zh) * | 2013-01-15 | 2014-07-16 | 国际商业机器公司 | 使用众包改进情感分析的方法和系统 |
CN104268197A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN104408035A (zh) * | 2014-12-15 | 2015-03-11 | 北京国双科技有限公司 | 词语情感类型的分析方法和装置 |
CN104537080A (zh) * | 2014-12-31 | 2015-04-22 | 北京畅游天下网络技术有限公司 | 资讯推荐方法和系统 |
CN104572877A (zh) * | 2014-12-22 | 2015-04-29 | 网易(杭州)网络有限公司 | 游戏舆情的检测方法及系统 |
CN105205043A (zh) * | 2015-08-26 | 2015-12-30 | 苏州大学张家港工业技术研究院 | 一种新闻读者情绪的分类方法与系统 |
US9275041B2 (en) | 2011-10-24 | 2016-03-01 | Hewlett Packard Enterprise Development Lp | Performing sentiment analysis on microblogging data, including identifying a new opinion term therein |
WO2016197577A1 (zh) * | 2015-06-12 | 2016-12-15 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法、装置和计算机设备 |
CN106599063A (zh) * | 2016-11-15 | 2017-04-26 | 武汉璞华大数据技术有限公司 | 基于主题情感语义提取的细粒度观点挖掘方法 |
CN107704763A (zh) * | 2017-09-04 | 2018-02-16 | 中国移动通信集团广东有限公司 | 多源异构漏洞情报去重方法、分级方法及装置 |
CN108509555A (zh) * | 2018-03-22 | 2018-09-07 | 武汉斗鱼网络科技有限公司 | 搜索词确定方法、装置、设备及存储介质 |
CN109492214A (zh) * | 2017-09-11 | 2019-03-19 | 苏州大学 | 属性词识别及其层次构建方法、装置、设备及存储介质 |
CN109858034A (zh) * | 2019-02-25 | 2019-06-07 | 武汉大学 | 一种基于注意力模型和情感词典的文本情感分类方法 |
CN112835990A (zh) * | 2019-11-22 | 2021-05-25 | 北京沃东天骏信息技术有限公司 | 一种识别方法和装置 |
-
2009
- 2009-07-21 CN CNA200910089711XA patent/CN101609459A/zh active Pending
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102236650B (zh) * | 2010-04-20 | 2014-06-04 | 日电(中国)有限公司 | 用于修正和/或扩展情感词典的方法和装置 |
CN102236650A (zh) * | 2010-04-20 | 2011-11-09 | 日电(中国)有限公司 | 用于修正和/或扩展情感词典的方法和装置 |
CN103493040A (zh) * | 2011-04-21 | 2014-01-01 | 索尼公司 | 从文本中确定情感的方法 |
US9965443B2 (en) | 2011-04-21 | 2018-05-08 | Sony Corporation | Method for determining a sentiment from a text |
CN102279890A (zh) * | 2011-09-02 | 2011-12-14 | 苏州大学 | 基于微博的情感词提取收集方法 |
US9275041B2 (en) | 2011-10-24 | 2016-03-01 | Hewlett Packard Enterprise Development Lp | Performing sentiment analysis on microblogging data, including identifying a new opinion term therein |
CN103123633A (zh) * | 2011-11-21 | 2013-05-29 | 阿里巴巴集团控股有限公司 | 评价参数的生成方法以及基于评价参数的信息搜索方法 |
CN102945268A (zh) * | 2012-10-25 | 2013-02-27 | 北京腾逸科技发展有限公司 | 产品特征评论挖掘方法及系统 |
CN102930042A (zh) * | 2012-11-13 | 2013-02-13 | 五邑大学 | 一种倾向性文本自动分类系统及其实现方法 |
CN103927321B (zh) * | 2013-01-15 | 2018-07-03 | 国际商业机器公司 | 使用众包改进情感分析的方法和系统 |
CN103927321A (zh) * | 2013-01-15 | 2014-07-16 | 国际商业机器公司 | 使用众包改进情感分析的方法和系统 |
CN103150367B (zh) * | 2013-03-07 | 2016-01-20 | 宁波成电泰克电子信息技术发展有限公司 | 一种中文微博的情感倾向分析方法 |
CN103150367A (zh) * | 2013-03-07 | 2013-06-12 | 宁波成电泰克电子信息技术发展有限公司 | 一种中文微博的情感倾向分析方法 |
CN104268197A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN104268197B (zh) * | 2013-09-22 | 2017-11-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN103559174A (zh) * | 2013-09-30 | 2014-02-05 | 东软集团股份有限公司 | 语义情感分类特征值提取方法及系统 |
CN103559174B (zh) * | 2013-09-30 | 2016-03-09 | 东软集团股份有限公司 | 语义情感分类特征值提取方法及系统 |
CN103631874A (zh) * | 2013-11-07 | 2014-03-12 | 微梦创科网络科技(中国)有限公司 | 社交平台的ugc标签类别确定方法和装置 |
CN103631874B (zh) * | 2013-11-07 | 2017-01-18 | 微梦创科网络科技(中国)有限公司 | 社交平台的ugc标签类别确定方法和装置 |
CN103593431A (zh) * | 2013-11-11 | 2014-02-19 | 北京锐安科技有限公司 | 网络舆情分析方法和装置 |
CN104408035B (zh) * | 2014-12-15 | 2018-04-03 | 北京国双科技有限公司 | 词语情感类型的分析方法和装置 |
CN104408035A (zh) * | 2014-12-15 | 2015-03-11 | 北京国双科技有限公司 | 词语情感类型的分析方法和装置 |
CN104572877A (zh) * | 2014-12-22 | 2015-04-29 | 网易(杭州)网络有限公司 | 游戏舆情的检测方法及系统 |
CN104537080A (zh) * | 2014-12-31 | 2015-04-22 | 北京畅游天下网络技术有限公司 | 资讯推荐方法和系统 |
CN104537080B (zh) * | 2014-12-31 | 2018-08-07 | 北京畅游天下网络技术有限公司 | 资讯推荐方法和系统 |
WO2016197577A1 (zh) * | 2015-06-12 | 2016-12-15 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法、装置和计算机设备 |
CN105205043A (zh) * | 2015-08-26 | 2015-12-30 | 苏州大学张家港工业技术研究院 | 一种新闻读者情绪的分类方法与系统 |
CN106599063A (zh) * | 2016-11-15 | 2017-04-26 | 武汉璞华大数据技术有限公司 | 基于主题情感语义提取的细粒度观点挖掘方法 |
CN107704763A (zh) * | 2017-09-04 | 2018-02-16 | 中国移动通信集团广东有限公司 | 多源异构漏洞情报去重方法、分级方法及装置 |
CN109492214A (zh) * | 2017-09-11 | 2019-03-19 | 苏州大学 | 属性词识别及其层次构建方法、装置、设备及存储介质 |
CN109492214B (zh) * | 2017-09-11 | 2023-09-19 | 苏州大学 | 属性词识别及其层次构建方法、装置、设备及存储介质 |
CN108509555A (zh) * | 2018-03-22 | 2018-09-07 | 武汉斗鱼网络科技有限公司 | 搜索词确定方法、装置、设备及存储介质 |
CN109858034A (zh) * | 2019-02-25 | 2019-06-07 | 武汉大学 | 一种基于注意力模型和情感词典的文本情感分类方法 |
CN109858034B (zh) * | 2019-02-25 | 2023-02-03 | 武汉大学 | 一种基于注意力模型和情感词典的文本情感分类方法 |
CN112835990A (zh) * | 2019-11-22 | 2021-05-25 | 北京沃东天骏信息技术有限公司 | 一种识别方法和装置 |
CN112835990B (zh) * | 2019-11-22 | 2024-09-20 | 北京沃东天骏信息技术有限公司 | 一种识别方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101609459A (zh) | 一种情感特征词提取系统 | |
CN102929873B (zh) | 一种基于情境搜索提取搜索价值词的方法及装置 | |
KR101536520B1 (ko) | 토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버 | |
CN103699626B (zh) | 一种微博用户个性化情感倾向分析方法及系统 | |
CN102737039B (zh) | 索引建立方法、搜索方法和搜索结果排序方法及对应装置 | |
CN101609450A (zh) | 基于训练集的网页分类方法 | |
CN107153658A (zh) | 一种基于关键字加权算法的舆情热词发现方法 | |
CN106294425A (zh) | 商品相关网络文章之自动图文摘要方法及系统 | |
CN103729359A (zh) | 一种推荐搜索词的方法及系统 | |
CN105068991A (zh) | 一种基于大数据的舆情发现方法 | |
CN104778209A (zh) | 一种针对千万级规模新闻评论的观点挖掘方法 | |
CN103678564A (zh) | 一种基于数据挖掘的互联网产品调研系统 | |
Mihalcea et al. | What men say, what women hear: Finding gender-specific meaning shades | |
CN103488648A (zh) | 一种多语种混合检索方法和系统 | |
CN104881402A (zh) | 中文网络话题评论文本语义倾向分析的方法及装置 | |
CN104268130B (zh) | 一种面向Twitter的社交广告可投放性分析方法 | |
CN109101551B (zh) | 一种问答知识库的构建方法及装置 | |
CN104965823A (zh) | 一种基于大数据的观点抽取方法 | |
CN107943909A (zh) | 基于评论数据的用户需求趋势挖掘方法及装置、存储介质 | |
CN104915443B (zh) | 一种中文微博评价对象的抽取方法 | |
CN105630768A (zh) | 一种基于层叠条件随机场的产品名识别方法及装置 | |
CN102236650A (zh) | 用于修正和/或扩展情感词典的方法和装置 | |
CN103123624A (zh) | 确定中心词的方法及装置、搜索方法及装置 | |
CN105095430A (zh) | 构建词语网络及抽取关键词的方法和装置 | |
CN101923556B (zh) | 根据句子序列号进行网页搜索的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Open date: 20091223 |