CN103365867B - 一种对用户评价进行情感分析的方法和装置 - Google Patents

一种对用户评价进行情感分析的方法和装置 Download PDF

Info

Publication number
CN103365867B
CN103365867B CN201210087681.0A CN201210087681A CN103365867B CN 103365867 B CN103365867 B CN 103365867B CN 201210087681 A CN201210087681 A CN 201210087681A CN 103365867 B CN103365867 B CN 103365867B
Authority
CN
China
Prior art keywords
user
sentiment analysis
text
field
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210087681.0A
Other languages
English (en)
Other versions
CN103365867A (zh
Inventor
刘怀军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210087681.0A priority Critical patent/CN103365867B/zh
Publication of CN103365867A publication Critical patent/CN103365867A/zh
Application granted granted Critical
Publication of CN103365867B publication Critical patent/CN103365867B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施方式提出了一种对用户评价进行情感分析的方法和装置。方法包括:按照领域对用户评价文本进行划分,得到领域划分结果;基于领域划分结果,对用户评价文本进行建模,得到建模结果;基于建模结果,分别对用户评价文本进行通用情感分析和领域情感分析,以得到通用情感分析结果和领域情感分析结果;综合通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果。本发明实施方式实现了对用户评价文本进行自动情感分析,综合了用户短文本的领域划分以及结合了通用情感分析和领域情感分析,实现了高精度的自动情感分析,提高了情感分析结果的准确度。

Description

一种对用户评价进行情感分析的方法和装置
技术领域
本发明实施方式涉及情感分析技术领域,更具体地,涉及一种对用户评价进行情感分析的方法和装置。
背景技术
随着计算机技术和网络技术的飞速发展,互联网(Internet)在人们的日常生活、学习和工作中发挥的作用也越来越大。而且,随着移动互联网的发展,互联网也在向移动化发展。
用户通常会在互联网上对各种新闻、产品或服务等做出自己的主观评论。对产品的评价通常带有丰富的情感色彩和主观性,对这些评论中的用户情感进行分析,是实现智能和情景搜索的一个重要维度。比如:用户对iPhone的评价“外观很美用起来舒服”,表达了用户对iPhone产品的好评;用户评价“经常死机,质量太差了”,表达了用户对iPhone产品的差评;用户评价“差不多吧,没啥明显的特点,用着还可以”,表达了用户对产品的中评。
情感分析在当今互联网的各种产品中,起着越来越重要的作用。例如:随着SNS尤其微博的发展,很多企业的微博上进行产品推广和用户反馈收集。那么对这些用户反馈的自动情感分析,将有助于商家对产品的改进。另外,互联网舆论监控和舆情控制越来越重要,例如在热门敏感的新闻,微博事件中,用户的评论是否违反了相关法律,是否不利社会和谐,通过相应算法的自动情感分析和舆情监测,能有效地实现网络舆论的监管。
在现有技术中,在产品的评论页面直接分类出好评、中评和差评,让用户按类型进行填写。然而,在这种方式中,用户在填写评论时,大多数不认真填写,填写的好评、中评、差评很多是应付性质的语句,并不是真实的使用感受,对产品改进价值有限,甚至会引入改进误区。同时,商家也有可能删除差评,给用户错误的引导,造成很多作弊的机会。
在另外一种技术中,由专门人工编辑团队进行用户评价情感分析和筛选。然而在这种基于人工编辑的审阅方式中,一方面审核量大、无法实时处理,尤其热门敏感的新闻,耗费人力多;另一方面人工编辑带有强烈的主观色彩,情感分析结果的准确度不高。
发明内容
本发明实施方式提出一种对用户评价进行情感分析的方法,以提高情感分析结果的准确度。
本发明实施方式还提出一种对用户评价进行情感分析的装置,以提高情感分析结果的准确度。
本发明实施方式的具体方案如下:
一种对用户评价进行情感分析的方法,该方法包括:
按照领域对用户评价文本进行划分,得到领域划分结果;
基于所述领域划分结果,对用户评价文本进行建模,得到建模结果;
基于所述建模结果,分别对用户评价文本进行通用情感分析和领域情感分析,以得到通用情感分析结果和领域情感分析结果;
综合所述通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果。
一种对用户评价进行情感分析的装置,该装置包括领域划分单元、文本建模单元、通用情感分析单元、领域情感分析单元和用户评价情感分析单元,其中:
领域划分单元,用于按照领域对用户评价文本进行划分,得到领域划分结果;
文本建模单元,用于基于所述领域划分结果,对用户评价文本进行建模,得到建模结果;
通用情感分析单元,用于基于所述建模结果对用户评价文本进行通用情感分析,以得到通用情感分析结果;
领域情感分析单元,用于基于所述建模结果对用户评价文本进行领域情感分析,以得到领域情感分析结果;
用户评价情感分析单元,用于综合所述通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果。
从上述技术方案可以看出,在本发明实施方式中,按照领域对用户评价文本进行划分,得到领域划分结果;基于领域划分结果,对用户评价文本进行建模,得到建模结果;基于建模结果,分别对用户评价文本进行通用情感分析和领域情感分析,以得到通用情感分析结果和领域情感分析结果;综合通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果。由此可见,应用本发明实施方式以后,实现了对用户评价文本进行自动情感分析,综合了用户短文本的领域划分以及结合了通用情感分析和领域情感分析,实现了高精度的自动情感分析,提高了情感分析结果的准确度。
附图说明
图1为根据本发明实施方式的对用户评价进行情感分析的方法流程图;
图2为根据本发明实施方式的领域划分流程图;
图3为根据本发明实施方式的基于二元搭配模型扩展特征词示意图;
图4为根据本发明实施方式基于关联词图模型扩展特征词示意图;
图5为根据本发明实施方式通用情感分析流程图;
图6为根据本发明实施方式句子的语义分析结果图;
图7为根据本发明实施方式领域物品的属性词和情感词示例关系图模型示意图;
图8为根据本发明实施方式用户评价文本情感分析结果图;
图9为根据本发明实施方式对用户评价进行情感分析的装置结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
在本发明实施方式中,从自然语言处理和机器学习算法方面,对现有实现方案进行改进。
在一个实施方式中,本发明实施方式可以包括几个步骤:
1.领域划分:先对用户评论文本进行领域划分,划分为手机、汽车,美食等垂直领域,便于精准建立领域的情感分析模型。
2.文本建模:抽取用户评论文本中主体,抽取主体对应的各种属性,抽取属性描述情感词,并抽取语义转换词,形成情感信息的描述结构。
3.执行通用情感分析:基于Bayes概率模型,通过评论的情感概率分布和语义转换分布,实现通用情感分析。
4.执行领域情感分析:为了进一步提高精度,在不同领域,根据领域特性和主体-属性的搭配和评价的关系图网络算法,优化分析效果。
5.情感倾向输出:综合通用情感分析和领域情感分析的结果,输出单一评论的情感角度,以及产品的批量用户评价的情感类型统计报告输出。
图1为根据本发明实施方式的对用户评价进行情感分析的方法流程图。
如图1所示,该方法包括:
步骤101:按照领域对用户评价文本进行划分,得到领域划分结果。
步骤102:基于领域划分结果,对用户评价文本进行建模,得到建模结果。
步骤103:基于建模结果,分别对用户评价文本进行通用情感分析和领域情感分析,以得到通用情感分析结果和领域情感分析结果。
步骤104:综合通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果。
在一个实施方式中,按照领域对用户评价文本进行划分具体可以包括:对用户评价文本进行词法分析,并提取用户评价文本的特征,以得到用户评价文本的特征向量;基于用户评价文本的特征向量,采用概率投票方式并结合贝叶斯算法对所述用户评价文本进行领域划分。
在一个实施方式中,所述基于所述领域划分结果,对用户评价文本进行建模具体可以包括:从4个维度对用户评价文本进行结构化信息抽取,以得到该4个维度的信息结构向量;其中所述4个维度包括:通用情感词、基于所述领域划分结果所确定的领域情感词、语气变化词和对象-属性词。
在一个实施方式中,基于建模结果,对用户评价文本进行通用情感分析具体可以包括:对用户评价文本进行分句;根据建模结果中的通用情感词和语气变化词,对每个句子进行通用情感分析;综合各个句子的通用情感分析结果,得到用户评价文本的通用情感分析结果。
在一个实施方式中,基于建模结果,对用户评价文本进行领域情感分析具体可以包括:根据建模结果中基于所述领域划分结果所确定的领域情感词和对象-属性词,对用户评价文本进行领域情感分析。
下面结合具体实例,对本发明实施方式的算法进行更详细的说明。
在对用户评价文本进行自动情感分析时,其中一个难点就是语言的表达问题。在不同领域、场景中,表达用户情感的词汇和方式可能会有不同。例如:对“衣服”的好评“穿着舒服”,对“笔记本”的好评“速度很快”,对“新闻事件”的好评“真是好人啊,可歌可泣”。
这样,在进行基于语义理解进行情感建模时,为了保证很高的准确率,需要对不同领域进行相应特征提取和建模。
因此,本发明实施方式首先对用户评价文本进行领域划分。
图2为根据本发明实施方式领域划分流程图。
如图2所示,该方法包括:
步骤201:输入用户评价文本。
步骤202:对用户评价文本进行词法分析。
在这里,词法分析主要包括评价文本进行分词和实体识别。
步骤203:领域词提取。
在这里,主要包括提取表征待分类领域的特征词,比如产品词汇、属性词汇等。对提取的特征词,建立评价内容的基本特征向量,比如可以表示为:FVecbase={wd1,wd2,...,wdn};其中,FVecbase表示抽取好的特征词的基本特征向量;wd1到wdn分别表示对应的特征词。
步骤204:对用户评价文本按照领域进行分类。
跟传统媒体文本分类相比,对互联网上的用户评价文本进行分类难点在于:互联网上的用户评价文本具有较多的口语化词汇,并且文本很短,信息表达不充分。
本发明实施方式提出一种特征扩展的方法,来解决该问题。
首先,基于二元搭配(BiClc)进行扩展。对词法分析的结果,抽取语义相关、语序固定、并且文本距离在指定窗口范围内的词汇搭配,作为特征词。
图3为根据本发明实施方式的基于二元搭配模型扩展特征词示意图。比如:词法分析结果如图3所示,抽取到的二元搭配特征词集合是“苹果速度”和“速度很快”。
该特征向量表示为:FVecBiClc={Bi1,Bi2,...,Bin}。其中FVecBiClc表示搭配词构成的特征向量;Bi1...Bin表示对应的搭配词特征。
另外,再基于语义关联词(SenAss)进行特征扩展。具体扩展步骤包括:先对每个特征词,通过语义扩展方法,得到关联词;然后,取多个特征词的公共关联词作为扩展特征集合。
图4为根据本发明实施方式基于关联词图模型扩展特征词示意图。
如图4的关联词图模型中,取入度超过一定阈值的关联词作为特征词,如“手机”,“性能”。该特征向量表示为:FVecSenAss={Sen1,Sen2,...,Senn};其中FVec表示关联词构成的特征向量,Sen1...Senn分别表示对应的关联词特征。
对用户评价文本进行特征提取和扩展后,得到表示文本的特征向量。接下来,采用改进的Bayes概率投票分类器(Voted-Bayes)进行领域分类。跟传统Bayes算法相比,本发明实施方式通过概率投票的方式,结合Bayes算法和特征词算法,实现了一种适用于短文本的用户数据(UGC)的分类算法。在该算法中:首先,训练分类Bayes模型。对每个特征词和扩展特征词,作为一个独立Term,计算每个term与各个领域的Bayes后验概率。为了优化数据不均衡引起的分类偏差,这里假设各类别先验符合均匀分布。并进行归一化后,得到相应后验概率为
其中Ci表示第i个类别,term表示一个特征词,P(ci/term)表示该term属于类别Ci的概率,P(term/ci)表示类别Ci中该term出现的概率。
然后,对当前用户评价内容(Doc),进行特征提取扩展后得到FVecBase,FVecBiClc,FVecSenAss;实现概率投票模型。
第一步,计算基本特征的概率投票分类结果。取后验概率超过一定阈值的特征词参与投票,并进行频次的加强,得到:
其中Tf表示term在文档doc中出现频次
这样,归一化后,就得到基于基本特征的领域概率:
第二步,对两种扩展特征,建立概率投票模型。跟基本特征相比,扩展特征的模型中,引入了关联词和文本中原词的语义相关度,这样可以避免由于扩展过度,导致主题漂移,分类不准确的问题。
具体计算方法如下:
其中,Relation(termj,wdx)是当前扩展词和对应原词的相关度。
综合上述特征的计算结果,综合得到最后的领域分类结果为:
P(ci/doc)=α*PBase(ci/doc)+β*PBiClc(ci/doc)+(1-α-β)*PSenAss(ci/doc);
这样,该评价内容所属领域类型为:
ci=Argmax(P(ci/doc))
步骤205:输出领域类型。
至此,详细描述了根据本发明实施方式的领域划分步骤。
下面对用户评价文本进行建模进行详细说明。对用户评价文本进行建模包括从文本中抽取结构化信息。
本发明实施方式可以从4个维度进行结构化信息的抽取,包括:通用情感词,领域情感词,语气变化词,对象-属性词。
通用情感词:在各个领域、场景,都表达明确情感类型的词。例如:不错,喜欢,太烂了,一般,反对等。
领域情感词:在对应领域,描述领域产品、对象情感类型的词。例如:“手机”领域有“正品,反应慢,上网快”,“汽车”领域有“油耗少,耐撞”等。
语气变化词:表示语气转折、否定等语气变化的词汇。例如:不,但是,不过,很等。
对象-属性词:描述对象和其属性特征的词汇。例如:“手机”对象,属性“外观,信号,操作系统”等。
情感分析就是要确定用户情感类型,可以将情感类型预先定义为3类:好,表示褒义;中,表示中立;差,表示贬义。
这样,情感向量表示为:EmotVec={g,c,b},其中:g表示好,c表示中,b表示差。
在本发明实施方式中,对用户评价内容进行信息抽取,可以得到4个维度的信息结构向量,分别表示为InfoVecCom,InfoVecDomain,InfoVecTone,InfoVecProp。其中:
InfoVecCom表示通用的信息结构向量;InfoVecDomain表示领域的信息结构向量;InfoVecTone表示语气的信息结构向量;InfoVecProp表示属性的信息结构向量。
其中,每个情感词需要赋予属于各个情感类型的概率EmotProbInvoVec×EmotVec。每个语气词赋予语气程度ToneProbterm∈{-1,1},正值表示语气加强,负值表示语气反转。
下面再对图1的步骤103中通用情感分析的详细过程进行说明。
通用情感分析,就是实现一个基础的情感模型和方案,对各个领域都适用,并得到用户评价的基础情感类型。本发明实施方式可以采用基于情感概率模型算法,综合情感模型和语气模型,来计算用户评价的基础情感类型。
图5为根据本发明实施方式通用情感分析流程图。
如图5所示,首先把用户输入的用户评价文本进行分句,然后对每个句子进行情感计算,最后整合所有句子的计算结果,以得到整个评价内容的情感类型。
其中,对每个句子进行情感建模是该领域的难点,下面进行详细阐述。
第一步,首先对每个句子进行语义分析,得到句子主体、情感描述、语气描述部分,以及语义依赖关系。图6为根据本发明实施方式句子的语义分析结果图。
第二步,对每个句子中,跟评价主体语义相关的情感词(EmotWdk),建立概率情感模型。基于独立性假设,得到每个句子(Senti)对应各种情感类型(Emotj),并进行归一化得到相应概率,如下:
第三步,对句中语气变化词(ToneWdk),建立相应的语气模型。
用户在描述对一件事物的情感时,往往会增加一些语气词进行情感加强、反转、削弱等。例如:“这个苹果很好吃”,通过“很”对褒义情感进行加强;“这个苹果不好吃”,通过“不”把褒义反转成贬义;“这个苹果不怎么好吃”,通过“不怎么”把褒义反转贬义后,又进行了语气削弱。基于语言的这种变化,建立如下概率模型:
最后,对整个评价的所有句子分析结果,综合情感建模和语气建模,进行基础情感类型计算。通过直接情感和语气的变化分布,得到最后的结果为:
其中,λi是对每个句子的调权系数。
通过上述建模方法,就得到用户评价文本的基本情感类型Emotj为:
Emotj=Argmax(EmotBase(Emotj))
概率最大的类型即为最后结果,相应置信度为EmotBase(Emotj)。
通用情感模型的不足是:没有充分使用不同领域中,对事物评价采用不同表达方式的丰富信息。同时,领域的用户评价,有时没有明显的情感词,需要进行语义层面的分析,才能理解用户的情感类型,例如:“iphone的电池很持久”。这样,就需要建立一个领域的情感模型,对事物的不同领域属性,进行深入语义挖掘,计算其情感类型。
下面对领域情感分析的详细步骤进行说明。
在领域情感分析中,按照文本建模的结果,抽取描述对象的领域属性,对应的领域情感词和语气词,得到InfoVecCom,InfoVecDomain,InfoVecTone,InfoVecProp这些信息向量。
领域中对物品的不同属性,采用不同的评价词汇以表达相应的情感类型。因此,对属性词和情感领域词建立一个语义描述关系的图模型(Graphic Model),从而用户能够更精准、从语义层次挖掘评价内容的情感。
优选地,对物品的每个属性词(PropWdk),对描述该属性的不同领域情感词汇(DEmotWdk)进行融合,建立相应的情感模型。
例如:描述“智能手机”的模型中,“结实”是描述“触屏”的褒义词汇;“耐用”是描述“触屏”和“电池”的褒义词汇。对每个属性的描述词有很多,综合得到该属性评价内容的情感类型:
其中:Degree(PropWdk)表示图模型中对应属性词的度。
得到物品各个属性的情感类型后,进行综合就可以得到,从各个属性角度进行评价,整体的情感类型。
其中,Score(PropWdk)表示对应属性的重要性指标,满足归一化条件
经过上述对领域属性进行拆解分析,然后合并的方法,就从领域性和语义层面得到用户评价的情感类型。
就得到评价内容的最终领域情感类型Emotj为:
Emotj=Arg max(EmotDomain(Emotj))
概率最大的类型即为最后结果,相应置信度为EmotDomain(Emotj)。
然后,就可以综合通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果。
本发明实施方式结合通用情感和领域情感两方面进行评价,得到整个评价内容的情感类型如下:
Emotj=Arg max(λ*EmotBase(Emotj)+(1-λ)*EmotDomain(Emotj))
图8为根据本发明实施方式用户评价文本情感分析结果图。如图8所示,应用本发明实施方式之后,就可以从两个维度对用户评价进行情感分析。
第一个维度,直接对评价进行分析,得到情感类型。例如:“诺基亚电池不耐用,反应太慢了,并且,价格还贵”,表达用户对“诺基亚”产品的贬义情感,即差评。
第二个维度,可以对一个产品的批量评价进行分析,得到该产品的用户反馈统计数据。例如对“诺基亚”相关所以微博评论数据的情感分析结果为
基于上述详细分析,本发明实施方式还提出了一种对用户评价进行情感分析的装置。
图9为根据本发明实施方式对用户评价进行情感分析的装置结构图。如图9所示,该装置包括:领域划分单元901、文本建模单元902、通用情感分析单元903、领域情感分析单元904和用户评价情感分析单元905,其中:
领域划分单元901,用于按照领域对用户评价文本进行划分,得到领域划分结果;
文本建模单元902,用于基于所述领域划分结果,对用户评价文本进行建模,得到建模结果;
通用情感分析单元903,用于基于所述建模结果对用户评价文本进行通用情感分析,以得到通用情感分析结果;
领域情感分析单元904,用于基于所述建模结果对用户评价文本进行领域情感分析,以得到领域情感分析结果;
用户评价情感分析单元,用于综合所述通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果。
在一个实施方式中,领域划分单元901,用于对用户评价文本进行词法分析,并提取用户评价文本的特征,以得到用户评价文本的特征向量;并基于所述用户评价文本的特征向量,采用概率投票方式并结合贝叶斯算法对所述用户评价文本进行领域划分。
在另一个实施方式中,文本建模单元902,用于从4个维度对用户评价文本进行结构化信息抽取,以得到所述4个维度的信息结构向量;其中所述4个维度包括:通用情感词、基于所述领域划分结果所确定的领域情感词、语气变化词和对象-属性词。
在另一个实施方式中,通用情感分析单元904,用于对用户评价文本进行分句;根据所述建模结果中的通用情感词和语气变化词,对每个句子进行通用情感分析;并综合各个句子的通用情感分析结果,得到用户评价文本的通用情感分析结果。
在另一个实施方式中,领域情感分析单元904,用于根据所述建模结果中基于所述领域划分结果所确定的领域情感词和对象-属性词,对用户评价文本进行领域情感分析。
综上所述,在本发明实施方式中,按照领域对用户评价文本进行划分,得到领域划分结果;基于领域划分结果,对用户评价文本进行建模,得到建模结果;基于建模结果,分别对用户评价文本进行通用情感分析和领域情感分析,以得到通用情感分析结果和领域情感分析结果;最后综合通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果。
由此可见,应用本发明实施方式以后,实现了对用户评价文本进行自动情感分析,综合了用户短文本的领域划分以及结合了通用情感分析和领域情感分析,实现了高精度的自动情感分析,提高了情感分析结果的准确度。
而且,本发明实施方式可以应用中在情景搜索中,以作为实现智能搜索引擎的一个重要技术。用户想购买产品,查询产品用户评价时,可以通过本发明实施方式的自动情感分析方法,实现结果的智能分析和展示。
另外,本发明还能够应用在内容广告系统中,结合关键词匹配技术和情感分析技术,提高广告推荐的精准度。例如,用户内容表示对某个产品的贬义和厌恶,则不应该推荐该产品广告给用户。这样,可以极大提高用户体验和CTR。
不仅与此,本发明实施方式在舆情分析和舆论监控中都可以有着重要的应用。将本发明实施方式的自动情感分析技术应用在新闻评论、博客、微博等SNS产品中,进行舆情的监控,能有助产品的健康发展和社会和谐。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种对用户评价进行情感分析的方法,其特征在于,该方法包括:
按照领域对用户评价文本进行划分,得到领域划分结果;
基于所述领域划分结果,对用户评价文本进行建模,得到建模结果;
基于所述建模结果,分别对用户评价文本进行通用情感分析和领域情感分析,以得到通用情感分析结果和领域情感分析结果;
综合所述通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果;
所述基于所述领域划分结果,对用户评价文本进行建模包括:从4个维度对用户评价文本进行结构化信息抽取,以得到所述4个维度的信息结构向量;其中所述4个维度包括:通用情感词、基于所述领域划分结果所确定的领域情感词、语气变化词和对象-属性词。
2.根据权利要求1所述的对用户评价进行情感分析的方法,其特征在于,所述按照领域对用户评价文本进行划分包括:
对用户评价文本进行词法分析,并提取用户评价文本的特征,以得到用户评价文本的特征向量;
基于所述用户评价文本的特征向量,采用概率投票方式并结合贝叶斯算法对所述用户评价文本进行领域划分。
3.根据权利要求1所述的对用户评价进行情感分析的方法,其特征在于,所述基于所述建模结果,对用户评价文本进行通用情感分析包括:
对用户评价文本进行分句;
根据所述建模结果中的通用情感词和语气变化词,对每个句子进行通用情感分析;
综合各个句子的通用情感分析结果,得到用户评价文本的通用情感分析结果。
4.根据权利要求1所述的对用户评价进行情感分析的方法,其特征在于,所述基于所述建模结果,对用户评价文本进行领域情感分析包括:
根据所述建模结果中基于所述领域划分结果所确定的领域情感词和对象-属性词,对用户评价文本进行领域情感分析。
5.一种对用户评价进行情感分析的装置,其特征在于,该装置包括领域划分单元、文本建模单元、通用情感分析单元、领域情感分析单元和用户评价情感分析单元,其中:
领域划分单元,用于按照领域对用户评价文本进行划分,得到领域划分结果;
文本建模单元,用于基于所述领域划分结果,对用户评价文本进行建模,得到建模结果;所述基于所述领域划分结果,对用户评价文本进行建模包括:从4个维度对用户评价文本进行结构化信息抽取,以得到所述4个维度的信息结构向量;其中所述4个维度包括:通用情感词、基于所述领域划分结果所确定的领域情感词、语气变化词和对象-属性词;
通用情感分析单元,用于基于所述建模结果对用户评价文本进行通用情感分析,以得到通用情感分析结果;
领域情感分析单元,用于基于所述建模结果对用户评价文本进行领域情感分析,以得到领域情感分析结果;
用户评价情感分析单元,用于综合所述通用情感分析结果和领域情感分析结果,得到用户评价情感分析结果。
6.根据权利要求5所述的对用户评价进行情感分析的装置,其特征在于,
领域划分单元,用于对用户评价文本进行词法分析,并提取用户评价文本的特征,以得到用户评价文本的特征向量;并基于所述用户评价文本的特征向量,采用概率投票方式并结合贝叶斯算法对所述用户评价文本进行领域划分。
7.根据权利要求5所述的对用户评价进行情感分析的装置,其特征在于,
通用情感分析单元,用于对用户评价文本进行分句;根据所述建模结果中的通用情感词和语气变化词,对每个句子进行通用情感分析;并综合各个句子的通用情感分析结果,得到用户评价文本的通用情感分析结果。
8.根据权利要求5所述的对用户评价进行情感分析的装置,其特征在于,领域情感分析单元,用于根据所述建模结果中基于所述领域划分结果所确定的领域情感词和对象-属性词,对用户评价文本进行领域情感分析。
CN201210087681.0A 2012-03-29 2012-03-29 一种对用户评价进行情感分析的方法和装置 Active CN103365867B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210087681.0A CN103365867B (zh) 2012-03-29 2012-03-29 一种对用户评价进行情感分析的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210087681.0A CN103365867B (zh) 2012-03-29 2012-03-29 一种对用户评价进行情感分析的方法和装置

Publications (2)

Publication Number Publication Date
CN103365867A CN103365867A (zh) 2013-10-23
CN103365867B true CN103365867B (zh) 2017-07-21

Family

ID=49367237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210087681.0A Active CN103365867B (zh) 2012-03-29 2012-03-29 一种对用户评价进行情感分析的方法和装置

Country Status (1)

Country Link
CN (1) CN103365867B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI813958B (zh) * 2021-02-26 2023-09-01 新加坡商鴻運科股份有限公司 廣告投放方法及相關設備

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103729456B (zh) * 2014-01-07 2016-09-28 合肥工业大学 一种基于微博群环境的微博多模态情感分析方法
CN104915361A (zh) * 2014-03-14 2015-09-16 腾讯科技(深圳)有限公司 一种数据信息的展示方法及装置
WO2016066228A1 (en) * 2014-10-31 2016-05-06 Longsand Limited Focused sentiment classification
CN104462363B (zh) * 2014-12-08 2018-10-23 百度在线网络技术(北京)有限公司 评论点的展现方法和装置
CN104504032B (zh) * 2014-12-12 2019-03-01 北京智谷睿拓技术服务有限公司 基于用户情感倾向提供服务的方法和设备
CN104572899A (zh) * 2014-12-25 2015-04-29 北京锐安科技有限公司 处理文章的方法和装置
CN104715047B (zh) * 2015-03-26 2017-11-21 浪潮集团有限公司 一种社交网络数据采集与分析系统
CN106294355A (zh) * 2015-05-14 2017-01-04 阿里巴巴集团控股有限公司 一种业务对象属性的确定方法及设备
CN105069021B (zh) * 2015-07-15 2018-04-20 广东石油化工学院 基于领域的中文短文本情感分类方法
CN105023214B (zh) * 2015-07-17 2019-03-26 蓝舰信息科技南京有限公司 一种题目知识点智能推荐方法
CN105068988B (zh) * 2015-07-21 2018-01-30 中国科学院自动化研究所 多维度和多粒度情感分析方法
CN105354183A (zh) * 2015-10-19 2016-02-24 Tcl集团股份有限公司 一种家电产品互联网评论的分析方法、装置及系统
CN105825408A (zh) * 2016-05-16 2016-08-03 刘冰 一种广告投放处理方法
CN106127507A (zh) * 2016-06-13 2016-11-16 四川长虹电器股份有限公司 一种基于用户评价信息的商品舆情分析方法及系统
CN106296288A (zh) * 2016-08-10 2017-01-04 常州大学 一种网络评价文本引导下的商品性能评价方法
CN107807914A (zh) * 2016-09-09 2018-03-16 阿里巴巴集团控股有限公司 情感倾向的识别方法、对象分类方法及数据处理系统
CN106372236A (zh) * 2016-09-13 2017-02-01 东软集团股份有限公司 评论数据的处理方法和装置
CN106649270A (zh) * 2016-12-19 2017-05-10 四川长虹电器股份有限公司 舆情监测分析方法
CN106886770A (zh) * 2017-03-07 2017-06-23 佛山市融信通企业咨询服务有限公司 一种视频通讯情感分析辅助方法
CN107194739B (zh) * 2017-05-25 2018-10-26 广州百奕信息科技有限公司 一种基于大数据的智能推荐系统
CN107958322B (zh) * 2017-10-09 2021-08-10 中国电子科技集团公司第二十八研究所 一种城市网络空间综合治理系统
CN108874992B (zh) * 2018-06-12 2021-03-19 深圳华讯网络科技有限公司 舆情分析方法、系统、计算机设备和存储介质
CN108959479B (zh) * 2018-06-21 2022-03-25 成都睿码科技有限责任公司 一种基于文本相似度的事件情感分类方法
CN110245266B (zh) * 2019-06-17 2022-11-01 百度在线网络技术(北京)有限公司 视频评价记录方法和装置以及视频查询方法和装置
CN110929528B (zh) * 2019-11-21 2023-09-05 腾讯科技(深圳)有限公司 对语句情感分析的方法、装置、服务器及存储介质
CN113742576B (zh) * 2021-08-10 2024-04-26 深圳市东信时代信息技术有限公司 基于跨平台的内容推荐方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894102A (zh) * 2010-07-16 2010-11-24 浙江工商大学 一种主观性文本情感倾向性分析方法和装置
CN102023967A (zh) * 2010-11-11 2011-04-20 清华大学 一种面向股票领域的文本情感分类方法
CN102385579A (zh) * 2010-08-30 2012-03-21 腾讯科技(深圳)有限公司 互联网信息分类方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894102A (zh) * 2010-07-16 2010-11-24 浙江工商大学 一种主观性文本情感倾向性分析方法和装置
CN102385579A (zh) * 2010-08-30 2012-03-21 腾讯科技(深圳)有限公司 互联网信息分类方法和系统
CN102023967A (zh) * 2010-11-11 2011-04-20 清华大学 一种面向股票领域的文本情感分类方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI813958B (zh) * 2021-02-26 2023-09-01 新加坡商鴻運科股份有限公司 廣告投放方法及相關設備

Also Published As

Publication number Publication date
CN103365867A (zh) 2013-10-23

Similar Documents

Publication Publication Date Title
CN103365867B (zh) 一种对用户评价进行情感分析的方法和装置
CN108363753B (zh) 评论文本情感分类模型训练与情感分类方法、装置及设备
CN107391760B (zh) 用户兴趣识别方法、装置及计算机可读存储介质
Wang et al. Multiple affective attribute classification of online customer product reviews: A heuristic deep learning method for supporting Kansei engineering
Guo et al. Consumer preference analysis: A data-driven multiple criteria approach integrating online information
CN103678564B (zh) 一种基于数据挖掘的互联网产品调研系统
CN103617230B (zh) 一种基于微博的广告推荐方法及系统
EP2866421B1 (en) Method and apparatus for identifying a same user in multiple social networks
CN103207913B (zh) 商品细粒度语义关系的获取方法和系统
CN108363790A (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN108038725A (zh) 一种基于机器学习的电商产品客户满意度分析方法
CN105183717B (zh) 一种基于随机森林和用户关系的osn用户情感分析方法
CN103116637A (zh) 一种面向中文Web评论的文本情感分类方法
CN107577782B (zh) 一种基于异质数据的人物相似度刻画方法
CN108460010A (zh) 一种基于情感分析的综合评分模型实现方法
Peng et al. Human–machine dialogue modelling with the fusion of word-and sentence-level emotions
CN109271634A (zh) 一种基于用户情感倾向感知的微博文本情感极性分析方法
CN107944911A (zh) 一种基于文本分析的推荐系统的推荐方法
CN108509421A (zh) 基于随机游走和粗糙决策置信度的文本情感分类方法
CN107688870A (zh) 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置
CN110134799A (zh) 一种基于bm25算法的文本语料库的搭建和优化方法
CN105869058B (zh) 一种多层潜变量模型用户画像提取的方法
CN108920521A (zh) 基于伪本体的用户画像-项目推荐系统及方法
CN111125360A (zh) 游戏领域的情感分析方法、装置及其模型训练方法、装置
CN111538841B (zh) 基于知识互蒸馏的评论情感分析方法、装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant