CN105095179A - 对用户评价进行处理的方法及装置 - Google Patents

对用户评价进行处理的方法及装置 Download PDF

Info

Publication number
CN105095179A
CN105095179A CN201410204224.4A CN201410204224A CN105095179A CN 105095179 A CN105095179 A CN 105095179A CN 201410204224 A CN201410204224 A CN 201410204224A CN 105095179 A CN105095179 A CN 105095179A
Authority
CN
China
Prior art keywords
word
public praise
dictionary
matched
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410204224.4A
Other languages
English (en)
Other versions
CN105095179B (zh
Inventor
吕虹
陈妍
梁璟彪
骆玘
黄利贤
樊中一
温春龙
刘敏
黎博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410204224.4A priority Critical patent/CN105095179B/zh
Publication of CN105095179A publication Critical patent/CN105095179A/zh
Application granted granted Critical
Publication of CN105095179B publication Critical patent/CN105095179B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明实施例提供一种对用户评价进行处理的方法及装置。该方法包括:根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,根据所述待匹配词的词频,得到所述口碑词的词频;根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息。本发明实施例实现了对用户评价进行自动分析,无需耗费人力。

Description

对用户评价进行处理的方法及装置
技术领域
本发明实施例涉及互联网应用技术,尤其涉及一种对用户评价进行处理的方法及装置。
背景技术
随着计算机技术和网络技术的飞速发展,互联网在人们的日常生活、学习和工作中发挥的作用越来越大。
用户通常会在互联网上对各种新闻、产品或服务等作出自己的主观评论。比如用户对“手机QQ音乐”软件的评价“界面操作方便”,表达了用户对“手机QQ音乐”软件的好评;用户评价“播放不流畅”,表达了用户对“手机QQ音乐”的差评。
在现有技术中,主要通过人工对用户评价进行情感分析,确定用户的情感倾向,再根据用户的情感倾向,对产品等进行改进。然而,在这种基于人工实现的对用户评价进行处理的方式,不仅无法对用户评价进行定量分析,还审核量大、耗费人力多、效率低下,特别是在在大数据情况下,不利于对用户评价进行处理。
发明内容
本发明实施例提供一种对用户评价进行处理的方法及装置,以实现对用户评价进行定量分析,并克服人工对用户评价进行处理审核量大,耗费人力、效率低的问题,在大数据情况下,利于对用户评价进行处理。
第一方面,本发明实施例提供一种对用户评价进行处理的方法,包括:
根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;
将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,根据所述待匹配词的词频,得到所述口碑词的词频;
根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息。
第二方面,本发明实施例提供一种对用户评价进行处理的装置,包括:
分词模块,用于根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;
匹配模块,用于将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,所述评价属性为正面评价或负面评价,根据所述待匹配词的词频,得到所述口碑词的词频;
处理模块,用于根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息。
本发明实施例提供的对用户评价进行处理的方法及装置,该方法根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,所述评价属性为正面评价或负面评价,根据所述待匹配词的词频,得到所述口碑词的词频;根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息,能够对用户评价进行定量分析,实现了对用户评价进行自动分析,无需耗费人力,提高了处理效率,特别在大数据情况下,利于对用户评价进行处理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明对用户评价进行处理的方法实施例一的流程图;
图2为本发明实施例对用户评价进行分词的过程示意图;
图3A和图3B为本发明实施例口碑词语评价属性示意图;
图4为本发明对用户评价进行处理的方法实施例二的流程图;
图5为本发明实施例新词发现结果示意图;
图6为本发明口碑词库结构示意图;
图7为本发明对用户评价进行处理的方法实施例三的流程图;
图8为对用户评价进行处理的结果示意图;
图9为本发明对用户评价进行处理的装置实施例一的结构示意图;
图10为本发明对用户评价进行处理的装置实施例二的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明对用户评价进行处理的方法实施例一的流程图。本实施例的执行主体为对用户评价进行处理的装置,该装置可由任意的软件和/或硬件实现。如图1所示,本实施例的方法可以包括:
步骤101、根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;
步骤102、将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,根据所述待匹配词的词频,得到所述口碑词的词频;
步骤103、根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息。
在具体实现过程中,情感分析在当今互联网的各种产品中,起着越来越重要的作用。很多企业通过互联网进行产品推广和用户评价进行收集。对用户评价收集,将有助于对产品的改进。
在步骤101中,在互联网上获取到用户评价之后,根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及待匹配词的词频。具体地,分词词库中包括了各种词语,以及词语的词性。用户评价具体可以为一个句子,或者简单的描述。根据分词词库中包括的词语,对用户评价进行分词处理,得到多个待匹配词,并计算各待匹配词在用户评价中的词频。
进一步地,分词的初步结果会包含多种词性,存在标点符号等大量杂质,根据预设词性选取形容词、名词、动词等几种最有可能包含口碑词的待匹配词。
图2为本发明实施例对用户评价进行分词的过程示意图。图2的左边,示意出根据分词词库对用户评价进行分词,得到的初步分词结果。由图2可知,该分词结果包括待匹配词,词性以及词频。图2的右边,为满足预设词性的待匹配词及词频。
在步骤102中,将待匹配词与口碑词库进行匹配,得到与口碑词库匹配的口碑词及口碑词的评价属性。具体地,口碑词库中包括口碑词及口碑词的评价属性。待匹配词与口碑词库匹配成功是指,待匹配词与口碑词库中的词语一致,此时,待匹配词即为口碑词,可根据待匹配词的词频,得到口碑词的词频。同时在口碑词库中获取到该口碑词的评价属性。口碑词的评价属性为正面评价或负面评价。
图3A和图3B为本发明实施例口碑词语评价属性示意图。在图3A中,当正面数据列的取值为1时,说明该口碑词为正面评价,在图3B中,当负面数据列的取值为1时,说明该口碑词为负面评价。本领域技术人员可以理解,本实施例中涉及的口碑词库,可以为根据经验确定的预设词库,同时还可在使用过程中,时时进行更新。
在步骤103中,根据口碑词的词频和评价属性,确定与用户评价对应的情感倾向信息。具体地,情感倾向信息包括用户对产品的好评或差评等。好评度=正面评价词频总和/(正面评价词频总和+负面评价词频总和)*100。好评度值越高,说明用户对产品满意;好评度值越低,说明用户对产品不满意,此时需要对产品做出改进。通过使用口碑词的词频和评价属性,实现了定性与定量相结合的方式,对用户评价进行处理,利于从整体了解用户的情感倾向信息。
本发明实施例提供的对用户评价进行处理的方法,通过根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,所述评价属性为正面评价或负面评价,根据所述待匹配词的词频,得到所述口碑词的词频;根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息,能够对用户评价进行定量分析,实现了对用户评价进行自动分析,无需耗费人力,提高了处理效率,特别在大数据情况下,由于本方法能够实现自动分析,因此利用对用户评价进行处理。
图4为本发明对用户评价进行处理的方法实施例二的流程图。本实施例在图1实施例的基础上实现,该方法包括:
步骤401、根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;
步骤402、针对所述分词词库,根据新词发现算法确定所述用户评价中是否包括新词及所述新词的词性属性,当包括新词时,将所述新词及所述新词的词性属性添加到所述分词词库中;
步骤403、将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,根据所述待匹配词的词频,得到所述口碑词的词频;
其中,所述评价属性为正面评价或负面评价。
步骤404、向用户输出与所述口碑词库未匹配的待匹配词;
步骤405、获取所述用户输入的所述未匹配的待匹配词的评价属性,将所述未匹配的待匹配词及所述未匹配的待匹配词的评价属性添加到所述口碑词库中;
步骤406、根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息;
步骤407、根据所述口碑词与近义词或同义词的映射关系进行近义词或同义词归类,得到归类结果;
步骤408、根据所述归类结果与所述口碑关注信息的对应关系,获取与所述归类结果对应的口碑关注信息。
本实施例中的步骤401与图1中的步骤101类似,步骤403与图1中的步骤102类似,步骤406与图1中的步骤103类似,本实施例此处不再赘述。
在步骤402中,由于分词误差(未收录进分词词库中或用户评价字数太长被分成多个词)未被统计出来,因此,针对分词词库,通过新词发现算法,确定未出现在分词词库中的新词。目前新词发现算法主要有基于规则的方法、基于统计的方法和两者相结合的方法。例如,在“手机QQ音乐”的用户评价中,通过新词发现算法发现以下新词:“闪退”、“自动退出”、“乱码”、“下载失败”等。新词发现结果具体可如图5所示,图5为本发明实施例新词发现结果示意图。当用户评价中包括新词时,将新词及新词的词性属性添加到分词词库中。本步骤保证了分词词库能够实时更新,并且随着时间的延长,分词词库的实用性更强。
在步骤404中,获取与口碑词库未匹配的待匹配词,即口碑词库中不包括该待匹配词,将该未匹配的待匹配词显示给用户,用户在看到该未匹配的待匹配词时,判断该待匹配词的评价属性,当该待匹配词既不是正面评价,也不是负面评价时,用户不进行任何操作,当该待匹配词表示正面评价或负面评价时,用户输入该待匹配词的评价属性。本领域技术人员可以理解,该未匹配的待匹配词为疑似口碑词,即,可能是口碑词,也可能不是口碑词。由于未匹配的待匹配词的数量很少,所以显示给用户,由用户确定这些待匹配词是否具有评价属性,即确定该待匹配词是否为口碑词。
在步骤405中,获取用户输入的未匹配的待匹配词的评价属性,将未匹配的待匹配词及未匹配的待匹配词的评价属性添加到口碑词库中。本领域技术人员可以理解,在获取到用户输入的未匹配的待匹配词的评价属性之后,该未匹配的待匹配词也成为了口碑词,还可以根据待匹配词的词频,获取该口碑词的词频。在步骤406中,根据口碑词的词频和评价属性,确定用户评价对应的情感倾向信息的时候,包括步骤403和步骤405中确定的口碑词。本步骤不仅包括了情感倾向信息的准确性,还保证了口碑词库能够实时更新,并且随着时间的延长,口碑词库的实用性更强。
当口碑词库中包括口碑词的评价属性,口碑词与近义词或同义词的映射关系,归类结果与口碑关注信息的对应关系时,在步骤407中,根据所述口碑词与近义词或同义词的映射关系进行近义词或同义词归类,得到归类结果。在具体实现过程中,得到口碑词之后,有些口碑词虽然不同,但是用户表达的意思相近。根据口碑词库对口碑词进行近义词或同义词归类,使口碑词的词义更集中。例如,“不好看”、“难看”、“不漂亮”等词,都是用户对产品外观方面的评价,根据口碑词与近义词或同义词的映射关系,将口碑词进行近义词或同义词归类,得到的归来结果为“不好看”。
在步骤408中,根据归类结果与口碑关注信息的对应关系,获取口碑关注信息。在具体实现过程中,根据归类结果与口碑关注信息的对应关系,获取与归类结果对应的口碑关注信息。口碑关注信息包括多个维度,例如“整体评价、功能、设计、性能、内容资源、活动和广告”等。
图6为本发明口碑词库结构示意图。下面结合图6,对根据口碑词库进行近义词或同义词归类,得到归类结果,再根据归类结果与口碑关注信息的对应关系,获取口碑关注信息进行详细说明。如图6所示,口碑词库中包括口碑词,口碑词与近义词或同义词的映射关系,以及归类结果与口碑关注信息的对应关系。口碑词库中还包括口碑词的评价属性,图6中未示出。
在图6中,“难看”、“不好看”、“不漂亮”映射到“不好看”,对应的归类结果为“不好看”;“掉线”、“掉机”映射到“掉线”,对应的归类结果为“掉线”;“卡”、“慢”映射到“卡”,对应的归类结果为“卡”;“上不去”、“进不去”、“进不了”映射到“上不去”,对应的归类结果为“上不去”;“被盗”、“盗号”映射到“被盗”,对应的归类结果为“被盗”,“不好使”、“不好用”、“难用”、“不易用”映射到“不好用”,对应的归类结果为“不好用”;“找不到”、“搜不到”映射到“找不到”,对应的归类结果为“找不到”。“不好看”对应的口碑关注信息为“设计”;“掉线”、“卡”、“上不去”对应的口碑关注信息为“性能”;“被盗”对应的口碑关注信息为“安全”;“不好用”,“找不到”对应的口碑关注信息为“操作”。
进一步地,当口碑词为负面评价对应的口碑关注信息,则向产品设计者提出提醒,以使产品设计者定位产品问题,从全局把握产品问题点,利于产品版本间的问题对比,并对产品进行改进。
本发明实施例提供的对用户评价进行处理的方法,还可自动归纳出用户的口碑关注信息,使得产品设计者不需要通过人工进行分析,节省了人力。
图7为本发明对用户评价进行处理的方法实施例三的流程图。本实施例从确定有效口碑词,近义词或同义词归来,获取口碑关注信息三大实现方面,对本发明实施例进行详细说明。下面结合图8进行详细说明,其中,图8为对用户评价进行处理的结果示意图。
首先,确定有效口碑词的过程。在该过程中,先获取用户评价,对用户评价进行分词统计。由于分词统计的初步结果会包含多种词性,存在大量杂质,因此根据分词词库进行筛选,选取形容词、名词、动词等几种最有可能包含口碑词的词性进行筛选。在分词词库中,包括了各种不同词性的词语,在对用户评价进行分词之后,可以得到多个词语,将该多个词语与分词词库中的词语进行匹配,用户评价对应的词语与分词词语中的词语一致时,认为匹配成功,得到分词统计的结果以及词性。同时,由于分词误差(未收录进分词词库中或用户评价字数太长被分成多个词)未被统计出来,因此,针对分词词库,通过新词发现算法,确定未出现在分词词库中的新词,并将新词及该新词的词性添加到分词词库中,得到的新词如图8所示的新词发现对应的词语。
在得到分词统计结果之后,其中,分词统计结果包括满足预设词性的待匹配词及待匹配词的词频,将分词统计结果中的待匹配词与口碑词库进行匹配,完成口碑词筛选的过程。口碑词筛选完成之后,得到与口碑词库匹配的有效口碑词及该有效口碑词的评价属性,得到的有效口碑词如图8所示的口碑词筛选对应的口碑词。在口碑词筛选过程中,若分词统计结果中的待匹配词没有出现在口碑词库中,则通过文本反查方式,确定该待匹配词的评价属性,当该带匹配词的评价属性为正面评价或负面评价时,将该待匹配词作为疑似口碑词,得到的疑似口碑词如图8所示的疑似口碑词对应的词语,并存储在口碑词库中。例如,新词发现得到的“闪退”、“乱码”,在不存在于口碑词库中,通过文本回查方式之后,确定“闪退”、“乱码”为负面评价,因此,“闪退”、“乱码”也为疑似口碑词,可加入口碑词库中。可选地,根据有效口碑词的评价属性及该有效口碑词的词频,确定用户评价对应的情感倾向信息。
其次,筛选出有效口碑词后,有些有效口碑词虽然不同,但用户表达的意思相近,还可将该些有效口碑词经过近义词或同义词词库筛选,做同义词或近义词归类,以使有效口碑词的词义更集中。
最后,获取口碑关注信息。用户对产品的用户评论为不同维度,如“整体评价、功能、设计、性能、内容资源、活动和广告”等。对于上述的大维度可能又可分为更细二级维度,通过不同的口碑词去表达,如“掉线、卡、上不去、闪退、死机/黑屏”等。将该些词与口碑关注信息库中的口碑关注信息进行匹配,得出该些口碑词匹配用户对产品“性能”方面的评价,因此可将该些口碑词归类到“性能”这一类中,以便于定位产品问题,从全局把握产品问题点,利于产品版本间的问题对比。
图9为本发明对用户评价进行处理的装置实施例一的结构示意图。如图9所示,本发明实施例提供的对用户评价进行处理的装置90,包括:分词模块901、匹配模块902和处理模块903。
分词模块901,用于根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;
匹配模块902,用于将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,根据所述待匹配词的词频,得到所述口碑词的词频;
处理模块903,用于根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息。
本发明实施例提供的对用户评价进行处理的装置,可用于执行上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
图10为本发明对用户评价进行处理的装置实施例二的结构示意图。如图10所示,本实施例在图9实施例的基础上实现,具体如下:
可选地,还包括:获取模块904,用于在所述匹配模块将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性之后,
向用户输出与所述口碑词库未匹配的待匹配词;
获取所述用户输入的所述未匹配的待匹配词的评价属性,将所述未匹配的待匹配词及所述未匹配的待匹配词的评价属性添加到所述口碑词库中。
可选地,还包括:判断模块905,用于在所述分词模块根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频之后,针对所述分词词库,根据新词发现算法确定所述用户评价中是否包括新词及所述新词的词性属性,当包括新词时,将所述新词及所述新词的词性属性添加到所述分词词库中。
可选地,还包括:归类模块906,用于在所述处理模块根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息之后,
根据所述口碑词库对所述口碑词进行近义词或同义词归类,得到归类结果;
根据所述口碑词库,获取与所述归类结果对应的口碑关注信息。
可选地,所述口碑词库中包括所述口碑词的评价属性,所述口碑词与近义词或同义词的映射关系,所述归类结果与所述口碑关注信息的对应关系;
所述归类模块906具体用于:根据所述口碑词与近义词或同义词的映射关系对所述口碑词进行近义词或同义词归类,得到归类结果;
根据所述归类结果与所述口碑关注信息的对应关系,获取与所述归类结果对应的口碑关注信息。
本发明实施例提供的对用户评价进行处理的装置,可用于执行上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种对用户评价进行处理的方法,其特征在于,包括:
根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;
将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,根据所述待匹配词的词频,得到所述口碑词的词频;
根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性之后,还包括:
向用户输出与所述口碑词库未匹配的待匹配词;
获取所述用户输入的所述未匹配的待匹配词的评价属性,将所述未匹配的待匹配词及所述未匹配的待匹配词的评价属性添加到所述口碑词库中。
3.根据权利要求1或2所述的方法,其特征在于,所述根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频之后,还包括:
针对所述分词词库,根据新词发现算法确定所述用户评价中是否包括新词及所述新词的词性属性,当包括新词时,将所述新词及所述新词的词性属性添加到所述分词词库中。
4.根据权利要求3所述的方法,其特征在于,所述根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息之后,还包括:
根据所述口碑词库对所述口碑词进行近义词或同义词归类,得到归类结果;
根据所述口碑词库,获取与所述归类结果对应的口碑关注信息。
5.根据权利要求4所述的方法,其特征在于,所述口碑词库中包括所述口碑词的评价属性,所述口碑词与近义词或同义词的映射关系,所述归类结果与所述口碑关注信息的对应关系;
所述根据所述口碑词库对所述口碑词进行近义词或同义词归类,得到归类结果,包括:
根据所述口碑词与近义词或同义词的映射关系对所述口碑词进行近义词或同义词归类,得到归类结果;
所述根据所述口碑词库,获取与所述归类结果对应的口碑关注信息,包括:
根据所述归类结果与所述口碑关注信息的对应关系,获取与所述归类结果对应的口碑关注信息。
6.一种对用户评价进行处理的装置,其特征在于,包括:
分词模块,用于根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频;
匹配模块,用于将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性,根据所述待匹配词的词频,得到所述口碑词的词频;
处理模块,用于根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息。
7.根据权利要求6所述的装置,其特征在于,还包括:获取模块,用于在所述匹配模块将所述待匹配词与口碑词库进行匹配,得到与所述口碑词库匹配成功的口碑词及所述口碑词的评价属性之后,
向用户输出与所述口碑词库未匹配的待匹配词;
获取所述用户输入的所述未匹配的待匹配词的评价属性,将所述未匹配的待匹配词及所述未匹配的待匹配词的评价属性添加到所述口碑词库中。
8.根据权利要求6或7所述的装置,其特征在于,还包括:判断模块,用于在所述分词模块根据分词词库对用户评价进行分词,得到满足预设词性的待匹配词及所述待匹配词的词频之后,针对所述分词词库,根据新词发现算法确定所述用户评价中是否包括新词及所述新词的词性属性,当包括新词时,将所述新词及所述新词的词性属性添加到所述分词词库中。
9.根据权利要求8所述的装置,其特征在于,还包括:归类模块,用于在所述处理模块根据所述口碑词的词频和评价属性,确定与所述用户评价对应的情感倾向信息之后,
根据所述口碑词库对所述口碑词进行近义词或同义词归类,得到归类结果;
根据所述口碑词库,获取与所述归类结果对应的口碑关注信息。
10.根据权利要求9所述的装置,其特征在于,所述口碑词库中包括所述口碑词的评价属性,所述口碑词与近义词或同义词的映射关系,所述归类结果与所述口碑关注信息的对应关系;
所述归类模块具体用于:根据所述口碑词与近义词或同义词的映射关系对所述口碑词进行近义词或同义词归类,得到归类结果;
根据所述归类结果与所述口碑关注信息的对应关系,获取与所述归类结果对应的口碑关注信息。
CN201410204224.4A 2014-05-14 2014-05-14 对用户评价进行处理的方法及装置 Active CN105095179B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410204224.4A CN105095179B (zh) 2014-05-14 2014-05-14 对用户评价进行处理的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410204224.4A CN105095179B (zh) 2014-05-14 2014-05-14 对用户评价进行处理的方法及装置

Publications (2)

Publication Number Publication Date
CN105095179A true CN105095179A (zh) 2015-11-25
CN105095179B CN105095179B (zh) 2019-03-26

Family

ID=54575653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410204224.4A Active CN105095179B (zh) 2014-05-14 2014-05-14 对用户评价进行处理的方法及装置

Country Status (1)

Country Link
CN (1) CN105095179B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528410A (zh) * 2015-12-05 2016-04-27 浙江大学 一种对医院的在线评论进行归纳和分类的方法
CN107180021A (zh) * 2016-03-09 2017-09-19 北京京东尚科信息技术有限公司 一种数据处理方法、系统及其服务器
CN107918606A (zh) * 2017-11-29 2018-04-17 北京小米移动软件有限公司 具象名词识别方法及装置
CN108108350A (zh) * 2017-11-29 2018-06-01 北京小米移动软件有限公司 名词识别方法及装置
CN108153856A (zh) * 2017-12-22 2018-06-12 北京百度网讯科技有限公司 用于输出信息的方法和装置
WO2019162967A1 (en) * 2018-02-23 2019-08-29 Atlas Intelligence Private Limited User attributes evaluation system
CN110232181A (zh) * 2018-03-06 2019-09-13 优酷网络技术(北京)有限公司 评论分析方法及装置
CN111209465A (zh) * 2020-01-03 2020-05-29 精硕科技(北京)股份有限公司 舆情告警方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050102619A1 (en) * 2003-11-12 2005-05-12 Osaka University Document processing device, method and program for summarizing evaluation comments using social relationships
CN102236636A (zh) * 2010-04-26 2011-11-09 富士通株式会社 情感倾向性分析方法和装置
CN102890707A (zh) * 2012-08-28 2013-01-23 华南理工大学 一种基于条件随机场的网络短评论情感倾向性挖掘系统
CN103679462A (zh) * 2012-08-31 2014-03-26 阿里巴巴集团控股有限公司 一种评论数据处理方法和装置、一种搜索方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050102619A1 (en) * 2003-11-12 2005-05-12 Osaka University Document processing device, method and program for summarizing evaluation comments using social relationships
CN102236636A (zh) * 2010-04-26 2011-11-09 富士通株式会社 情感倾向性分析方法和装置
CN102890707A (zh) * 2012-08-28 2013-01-23 华南理工大学 一种基于条件随机场的网络短评论情感倾向性挖掘系统
CN103679462A (zh) * 2012-08-31 2014-03-26 阿里巴巴集团控股有限公司 一种评论数据处理方法和装置、一种搜索方法和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
孙莹: "基于Web文本挖掘的企业口碑情感分类模型研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
方明: "基于Web的评论文本倾向性分析技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
朱圣代: "细颗粒度情感分析若干技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528410B (zh) * 2015-12-05 2019-03-26 浙江大学 一种对医院的在线评论进行归纳和分类的方法
CN105528410A (zh) * 2015-12-05 2016-04-27 浙江大学 一种对医院的在线评论进行归纳和分类的方法
CN107180021A (zh) * 2016-03-09 2017-09-19 北京京东尚科信息技术有限公司 一种数据处理方法、系统及其服务器
CN107918606B (zh) * 2017-11-29 2021-02-09 北京小米移动软件有限公司 具象名词识别方法、装置及计算机可读存储介质
CN108108350A (zh) * 2017-11-29 2018-06-01 北京小米移动软件有限公司 名词识别方法及装置
CN107918606A (zh) * 2017-11-29 2018-04-17 北京小米移动软件有限公司 具象名词识别方法及装置
CN108153856A (zh) * 2017-12-22 2018-06-12 北京百度网讯科技有限公司 用于输出信息的方法和装置
CN108153856B (zh) * 2017-12-22 2022-09-06 北京百度网讯科技有限公司 用于输出信息的方法和装置
WO2019162967A1 (en) * 2018-02-23 2019-08-29 Atlas Intelligence Private Limited User attributes evaluation system
CN110232181A (zh) * 2018-03-06 2019-09-13 优酷网络技术(北京)有限公司 评论分析方法及装置
CN110232181B (zh) * 2018-03-06 2022-09-23 阿里巴巴(中国)有限公司 评论分析方法及装置
CN111209465A (zh) * 2020-01-03 2020-05-29 精硕科技(北京)股份有限公司 舆情告警方法、装置和电子设备
CN111209465B (zh) * 2020-01-03 2023-11-07 北京秒针人工智能科技有限公司 舆情告警方法、装置和电子设备

Also Published As

Publication number Publication date
CN105095179B (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN105095179A (zh) 对用户评价进行处理的方法及装置
Johann et al. Safe: A simple approach for feature extraction from app descriptions and app reviews
CN109522556B (zh) 一种意图识别方法及装置
CN108364199B (zh) 一种基于互联网用户评论的数据分析方法及系统
Venugopalan et al. Exploring sentiment analysis on twitter data
CN107391493B (zh) 一种舆情信息提取方法、装置、终端设备及存储介质
CN109325121B (zh) 用于确定文本的关键词的方法和装置
CN105095288B (zh) 数据分析方法及数据分析装置
CN105389307A (zh) 语句意图类别识别方法及装置
CN108733675B (zh) 基于大量样本数据的情感评价方法及装置
CN110334268B (zh) 一种区块链项目热词生成方法以及装置
CN104834651A (zh) 一种提供高频问题回答的方法和装置
CN105512104A (zh) 词典降维方法及装置、信息分类方法及装置
CN115186780B (zh) 学科知识点分类模型训练方法、系统、存储介质及设备
CN104778184A (zh) 一种确定反馈关键词的方法和装置
CN104573030A (zh) 一种文本情绪预测方法及装置
US20210133212A1 (en) Data archiving method and computing device implementing same
CN109657043B (zh) 自动生成文章的方法、装置、设备及存储介质
CN104699819A (zh) 一种义原的分类方法及装置
CN112052154A (zh) 一种测试用例的处理方法、装置
KR101727686B1 (ko) 시맨틱 엔티티 토픽 추출 방법
CN103345525B (zh) 文本分类方法、装置及处理器
CN108287819A (zh) 一种实现财经新闻自动关联到股票的方法
CN117313736A (zh) 评论文本的隐式需求识别方法及装置
Rodrigues et al. Mining online product reviews and extracting product features using unsupervised method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant