CN105354183A - 一种家电产品互联网评论的分析方法、装置及系统 - Google Patents
一种家电产品互联网评论的分析方法、装置及系统 Download PDFInfo
- Publication number
- CN105354183A CN105354183A CN201510680008.1A CN201510680008A CN105354183A CN 105354183 A CN105354183 A CN 105354183A CN 201510680008 A CN201510680008 A CN 201510680008A CN 105354183 A CN105354183 A CN 105354183A
- Authority
- CN
- China
- Prior art keywords
- word
- attribute
- dictionary
- emotion
- comment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Abstract
本发明公开了一种家电产品互联网评论分析方法及装置,该方法包括:获取家电产品评论语料库,将其中的评论语句进行分词,根据预置的情感词典及属性词典分别定位进行分词处理后的情感词和属性词,通过情感词和属性词互相发现新的属性词和新的情感词,并据此更新属性词典和情感词典,根据属性词典、情感词典、预先构建语法规则库,提取评论语句中的情感信息以及属性信息,并生成分析结果。本发明可减少人工干预,降低成本,提高获得属性词和情感词对应关系的效率和准确率,提高对家电产品评论的分析结果的准确率。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种家电产品互联网评论的分析方法及装置。
背景技术
随着互联网以及电子商务的发展,越来越多的客户选择网上购物。其中家电产品价格较贵重,客户对其价格,质量,品牌,体验等都有较高的要求,因此,已购买客户对家电产品的评价,往往直接影响后来的客户的购物选择。网上家电商品的网络评论,往往具有数据量大,描述特征相对集中,且包含明显的主观情感等特点,这些特点给产品评论进行情感分析提供了便利。对产品评价信息进行情感分析挖掘,不仅能够帮助公司获知自身产品在市场的口碑,也能及时了解自身产品的不足,进而采取改进措施,同时能够为商家及时了解顾客的需求,对新产品开发等提供决策支持。
现有技术中,对于商品评论情感分析的方法是基于情感词典的方法,需要构建质量较好的情感词典,目前中文的情感词典主要有知网整理的Hownet和台湾大学的NTUSD情感词典。一般由于构建词典往往会由于人力的因素,使得词典构建成本较大,并且方法移植性不高。同时,对于家电产品评价分析,商家和客户往往不仅关心产品整体评价的好坏,更多的关心产品相关特征的评价。例如,评价1:这款智能电视整体不错;评价2:屏幕很大,看起来很舒服。因而提取“屏幕”等的信息也显得尤为重要,而获取这些属性特征,也是一大难点。现有技术中构建的情感词典中针对家电产品的评价的句式规则库整理不够充分,且对于一些含有隐式属性的评论信息获取率不高。
发明内容
本发明提供一种家电产品互联网评论的分析方法及装置,用以通过情感词和属性词彼此互相发现的方式更新家电产品评论分析的属性词典和情感词典,减少人工干预,降低成本,以及根据该属性词典和该情感词典以及构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息,提高了获得属性词和情感词对应关系的效率和准确率,从而提高了对家电产品评论的分析结果的准确率。
本发明提供一种家电产品互联网评论的分析方法,包括:
获取家电产品评论语料库;将所述语料库中的家电产品评论语句进行分词,并对各分词分别标注词性;根据预置的情感词典定位进行分词处理后的情感词,以及,根据预置的属性词典,定位进行分词处理后的属性词;通过定位的情感词发现新的属性词,并根据所述新的属性词更新所述属性词典,以及,通过定位的属性词发现新的情感词,并根据所述新的情感词更新所述情感词典;根据所述更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息;将所述情感信息按照情感倾向进行分类,并结合所述属性信息生成分析结果。
本发明提供一种家电产品互联网评论的分析装置,包括:
获取模块,用于获取家电产品评论语料库;分词模块,用于将所述语料库中的家电产品评论语句进行分词,并对各分词分别标注词性;定位模块,用于根据预置的情感词典定位进行分词处理后的情感词,以及,根据预置的属性词典,定位进行分词处理后的属性词;更新模块,用于通过定位的情感词发现新的属性词,并根据所述新的属性词更新所述属性词典,以及,通过定位的属性词发现新的情感词,并根据所述新的情感词更新所述情感词典;提取模块,用于根据所述更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息;生成模块,用于将所述情感信息按照情感倾向进行分类,并结合所述属性信息生成分析结果。
从上述本发明实施例可知,本发明通过情感词和属性词彼此互相发现,迭代挖掘并更新家电产品评论分析的属性词典和情感词典,以及,根据该属性词典和该情感词典以及构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息,并根据该情感信息及该属性信息得到对家电产品评论的分析结果,在构建词典和规则库时减少人力支出,从而降低成本,且构建方法具有强移植性,并且提高了获得属性词和情感词对应关系的效率和准确率,从而提高了对家电产品评论的分析结果的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例提供的家电产品互联网评论的分析方法的实现流程示意图;
图2是本发明第二实施例提供的家电产品互联网评论的分析方法的实现流程示意图;
图3是同义词词林的相似度算法的层级体系示意图;
图4是本发明第三实施例提供的家电产品互联网评论的分析装置的结构示意图;
图5是本发明第四实施例提供的家电产品互联网评论的分析装置的结构示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1是本发明第一实施例提供的家电产品互联网评论的分析方法流程示意图,该方法包括以下步骤:
S101、获取家电产品评论语料库;
语料库指经科学取样和加工的大规模电子文本库。
语料库有以下特征:语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库;语料库是承载语言知识的基础资源,但并不等于语言知识;真实语料需要经过分析和处理,才能成为有用的资源。
家电产品评论语料库,是指关于家电产品评论语句的电子文本库。其中,家电产品评论语句是用户对家电产品购买以及使用过程中的体验,例如,对家电产品中的智能电视的产品评论:屏幕很大,高清,音质也很好,送货超快第二天就到了。性价比高值得购买。
家电产品评价语句有许多获取途径,包括通过用户问卷调查,互联网论坛,电商网站的评价等。目前家电产品的网络销售主要集中在各大型购物网站,考虑到网站上家电产品评价信息的集中性,以及可实时跟踪等方面因素,可以针对这些购物网站的家电产品评论集中获取。
S102、将该语料库中的家电产品评论语句进行分词,并对各分词分别标注词性;
对于各类评论信息的情感分析,根据评论文本量的大小,可以分为词语级,短语级,句子级,篇章级。同时按照分析粒度不同,也可以分为细粒度(词语,短语级)和粗粒度(句子级,篇章级)。通过大量的家电产品评论语料库总结分析,发现针对家电产品的评论大多简短明了,90%的评论字数在70字以内,80%的评论字数在50字以内,因而可以将家电产品的评论看作属于词语或短语级,故可以采用细粒度的情感分析。
分词,是将一个汉字序列切分成一个一个单独的词,是将连续的字序列按照一定的规范重新组合成词序列的过程。将该语料库中的产品评论信息进行分词处理,并将处理后的各词分别标注词性,词性包括名词,形容词,动词等。
S103、根据预置的情感词典定位进行分词处理后的情感词,以及,根据预置的属性词典,定位进行分词处理后的属性词;
情感词典中收录了与人类情感相关的情感词,例如:喜欢,好看,给力等。按照其中收录的情感词,定位对家电产品评论语句进行分词处理后得到的情感词,即确定这些词中的情感词有哪些。
属性词典中收录了与家电产品属性相关的属性词,例如:尺寸、清晰度、支架等。按照其中收录的属性词,定位分词处理后得到的属性词,即确定这些词中的属性词有哪些。
S104、通过定位的情感词发现新的属性词,并根据该新的属性词更新该属性词典,以及,通过定位的属性词发现新的情感词,并根据该新的情感词更新该情感词典;
将发现的新的属性词收录入该属性词典,以更新该属性词典,还可更新该新的属性词的词频信息,词频是指该新的属性词在家电产品评论语句中出现的频率。
将发现的新的情感词收录入该属性词典,以更新该情感词典,还可更新该新的情感词的词频信息,词频是指该新的情感词在家电产品评论语句中出现的频率。
S105、根据更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息;
通过对大量家电产品评论语料库中属性词和情感词的相对位置统计,可获取的评论语句的语法规则,该语法规则表明家电产品评论语句的组成顺序结构。
根据更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,可提取家电产品评论语句中的情感信息以及属性信息,其中,情感信息是带有感情倾向的词语,表明个人好恶。
例如,一个语法规则为:(属性词)+(否定词)+(程度副词)+情感词,表明若一个家电产品评论语句的组成顺序符合此规则,那么更新后的属性词典、情感词典可确认其中的属性词和情感词,而该语法规则又确认在属性词和情感词之间顺序包括了一个否定词和一个程度副词,这样,更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,便可分析一句家电产品评论语句,从中提取情感信息以及属性信息。
又例如,一个语法规则为:(属性词)+(程度副词)+(否定词)+情感词,则表明一个家电产品评论语句的组成顺序是在属性词和情感词之间顺序包括了一个程度副词和一个否定词,与上一个例子不同之处在于程度副词和否定词的词序。
S106、将该情感信息按照情感倾向进行分类,并结合该属性信息生成分析结果。
将该情感信息按照情感倾向进行分类,情感倾向可分为正面倾向和负面倾向,正面倾向包括喜爱、满意等情感,负面倾向包括厌恶、不满等情感。结合该情感信息对应的属性信息生成对评论指向的家电产品的用户体验分析结果。该分析结果可集中体现一件家电产品给用户的印象,以及用户今后的购买倾向。家电生产及销售公司能够较准确地获取家电行业的产品评价口碑,及时获取并分析自身产品(如电视,冰箱等)网上评价,以及具体产品属性的评价和反响,对产品营销,设计改进提供相关依据。同时,也可以获知同业竞品的相关口碑,通过与自身产品分析比较,进一步改进自身产品,提高自身竞争力。
本发明实施例中,通过情感词和属性词彼此互相发现,迭代挖掘并更新家电产品评论分析的属性词典和情感词典,以及,根据该属性词典和该情感词典以及构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息,并根据该情感信息及该属性信息得到对家电产品评论的分析结果,在构建词典和规则库时减少人力支出,从而降低成本,且构建方法具有强移植性,并且提高了获得属性词和情感词对应关系的效率和准确率,提高了对家电产品评论的分析结果的准确率。
请参阅图2,图2是本发明第二实施例提供的家电产品互联网评论的分析方法流程示意图,该方法包括以下步骤:
S201、获取家电产品评论语料库;
家电产品评论语料库,是指关于家电产品评论语句的电子文本库。
家电产品评价语句有许多获取途径,包括通过用户问卷调查,互联网论坛,电商网站的评价等。目前家电产品的网络销售主要集中在各大型购物网站,考虑到网站上家电产品评价信息的集中性,以及可实时跟踪等方面因素,可以针对这些购物网站的家电产品评论集中进行爬虫获取。
S202、过滤该语料库中的无效评论信息;
初始获取的家电产品评论语料库中,往往含有无效的评论信息,例如以下评论:可以啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊。此评论中的“啊”出现频率较高,然而却为无效信息,如果不进行处理可能会对分析造成干扰,所以需要对该语料库进行无效信息的过滤,即对无效信息可以予以清洗、剔除。关于其他类型无效的评论信息,例如重复评价、无关评价等都可以过滤掉,保持该预料库中收集的评论信息的有效性,以及提高分析评论信息的准确性。
S203、将该语料库中的家电产品评论语句进行分词,并对各分词分别标注词性;
将该语料库中的产品评论信息进行分词处理,并将分出来的各词分别标注词性,词性包括名词,形容词,动词等。本实施例采用汉语词法分析系统(ICTCLAS,InstituteofComputingTechnology,ChineseLexicalAnalysisSystem)完成上述分词及标注过程。
S204、根据预置的情感词典定位进行分词处理后的情感词,以及,根据预置的属性词典,定位进行分词处理后的属性词;
情感词典中收录了与人类情感相关的情感词,按照其中记载的情感词,定位分词处理后的家电产品评论中的情感词,即根据情感词典中已经收录的情感词来确定分词后的家电产品评论中的情感词。
属性词典中收录了与家电产品属性相关的属性词,按照其中记载的属性词,定位分词处理后的家电产品评论中的属性词,即根据属性词典中已经收录的属性词来确定分词后的家电产品评论中的属性词。
S205、通过定位的情感词发现新的属性词,并根据该新的属性词更新该属性词典,以及,通过定位的属性词发现新的情感词,并根据该新的情感词更新该情感词典;
更新该属性词典的具体方式为:
搜索定位的情感词前后预置数量的第一词性的词作为新的属性词收录入该属性词典,以及,将该新的属性词的词频收录入该属性词典,然后将该属性词典中的属性词按照词频高低排序,并将排序在前的预置数量的属性词作为新的属性词典,迭代重复执行上述步骤,直至最新生成的属性词典中的属性词与前一次生成属性词典中的属性词不同的数量小于预置数值,即,认为本次迭代后得到的属性词典与前一次得到的属性词典的内容变化不大,则认为更新完成。
更新该情感词典的具体方式为:
搜索定位的属性词前后预置数量的第二词性的词作为新的情感词收录入该情感词典,以及,将该新的情感词的词频收录入该情感词典,然后将该情感词典中的情感词按照词频高低排序,并将排序在前的预置数量的情感词作为新的情感词典,迭代重复执行上述步骤,直至最新生成的情感词典中的情感词与前一次生成情感词典中的情感词不同的数量小于预置数值,即,认为本次迭代后得到的情感词典与前一次得到的情感词典的内容变化不大,则认为更新完成。
上述更新该属性词典和该情感词典的过程可以同时进行,同时完成更新。或者,可以选择其中一个词典先执行更新过程,当完成更新后,另一个词典以该更新后的词典作为初始词典,而不是以其预置的词典作为初始词典来定位进行分词处理后的词,即,在更为全面的一个词典基础上进行另一个词典的更新,这样得到的结果更全面更准确。例如,先选择情感词典执行更新过程,当完成对情感词典的更新后,以更新后的情感词典为基础,定位进行分词处理后的情感词,然后按照定位的情感词发现属性词,进一步更新属性词典。
通过定位的情感词发现新的属性词,并将发现的新的属性词加入该属性词典,通过定位的属性词发现新的情感词,并将该新的情感词加入该情感词典。同时将该新的属性词或该新的情感词出现的词频一并收录入对应的词典中,对于重复出现的词,则只需要累计词频即可。
更新后的词典格式如下:
具体地,该第一预置词性是与属性词同词性的词,例如名词。该第二预置词性是与情感词同词性的词,例如形容词、副词等。
例如,家电产品评论语句1:快递速度很快哦;
家电评论信息2:很给力的快递,安装也方便。
其中,家电产品评论语句1中的“快”、“给力”等是存在于情感词典中的情感词,那么,对情感词“快”通过向前搜索得到名词“快递”,对家电产品评论语句2中的情感词“给力”向后搜索也得到名词“快递”,“快递”的出现频率较高,将该词和词频收录入该初始属性词典。如果该初始属性词典已有“快递”,则将累计词频。
需要说明的是,通过属性词发现新的情感词,并将发现的该新的情感词加入该情感词典的过程与上述通过情感词发现新的属性词,并将发现的该新的属性词加入该属性词典的过程同理,此处不再赘述。
进一步地,通过同义词词林的相似度算法扩充词典中新的属性词和新的情感词的同义词。具体地,通过分同义词词林的相似度算法别查找该新的属性词的同义词以及该新的情感词的同义词,并将查找到的同义词收录入该属性词典以及该情感词典;
通过同义词词林的相似度算法,分别查找该新的属性词的同义词以及该新的情感词的同义词。同义词词林的相似度算法是以《同义词词林》为基础,利用该词林的编排以及语义特点计算词语相似度。《同义词词林》是梅家驹等人于1983年编纂而成,这本词典中不仅包括了一个词语的同义词,也包含了一定数量的同类词,即这里的同义词为广义的相关词。
具体地,《同义词词林》按照树状的层次结构把所有收录的词条组织到一起,把词汇分成大、中、小三类,大类有12个,中类有97个,小类有1400个。每个小类里都有很多的词,这些词又根据词义的远近和相关性分成了若干个词群。词典《同义词词林》分类采用层级体系,具备5层结构,结构图请参见图3。随着级别的递增,词义刻画越来越细,到了第5层,每个分类里词语数量已经不大,很多只有一个词语,已经不可再分,称为原子词群、原子类或原子节点。同一行的词语要么词义相同(有的词义十分接近),要么词义有很强的相关性,词语相应的编码如下。
上表中的编码位是按照从左到右的顺序排列。第8位的标记有3种,分别是“=”、“#”、“”。其中“=”代表相等、同义;“#”代表不等、同类,属于相关词语;“”代表自我封闭、独立,它在词典中既没有同义词,也没有相关词。
词语相似度是个数值,一般取值范围在[0,1]之间。一个词语与其本身的语义相似度为1,如果两个词语在任何上下文中都不可替换,则其相似度为0。
本算法给出两个词word1和word2的相似度(sim)度量公式为:
其中n是分支层的节点总数;k是两个分支间的距离;N为最大分支层节点总数;β2、β3、β4、β5为调节每层的权重,且0<β2,β3,β4,β5<1,l为两个词所在的分支层,I为示性函数。
例如,得到
0<sim(word1,word2)<1
两个词的sim值越大,则其相关性越大,获取相关性较大的词作为候选同义词,可进一步通过人工筛选同义词以提高录入精度。将查找到的同义词收录入该属性词典以及该情感词典,以扩充该属性词典和该感情词典中收录的词,提高后续对家电产品评论信息分析结果的精确度。
S206、根据更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息;
通过对大量家电产品评论语料库中属性词和情感词的相对位置统计,可获取评论语句主要的语法规则。对于否定词和程度副词,由于数量较少,可以通过人工收集整理。否定词如“不”、“不是”、“非”等词,程度副词如“特别”、“十分”、“很”等词。
构建语法规则库,其中包含语法规则以及相关例句,该语法规则库的格式如下:
规则 | 例句 |
情感词(类) | 给力!!!! |
属性词+情感词(类) | 安装方法简单 |
属性词+否定词+情感词(类) | 电视不是高清的 |
属性词+程度副词+情感词(类) | 尺寸没有想象的那么大 |
属性词+否定词+程度副词+情感词(类) | 遥控操作不是很方便 |
属性词+程度副词+否定词+情感词(类) | 售后服务特别不行 |
… | … |
大部分的家电产品评论语句都能归结于上述语法规则库中的语法规则,对于其他特殊句式,如反问句,并列句,转折句等则另外建立特殊语法规则库。
根据更新后的情感词典和属性词典,以及构建的语法规则库,提取家电评论语句中的情感信息以及属性信息,其中,情感信息是带有感情倾向的词语,表明个人好恶。
例如,家电产品评论为“物流挺快,第二天就到了,很流畅,就是应用比较少,视频资源并不是那么多”,根据该情感词典和该属性词典,以及符合的语法规则,提取家电评论语句中的情感信息以及属性信息的结果为:
物流---挺---快
[]---很---流畅
应用---比较---少
视频资源---不是---那么--多
结果中“[]”表示该家电产品评论中被隐藏的、没有明确指出的属性词。通过所提取的属性信息以及情感信息,便能够获知该家电产品来自用户的口碑。
S207、通过支持向量机分类方法对隐式属性词进行挖掘;
隐式属性词是指在家电产品评论语句中被隐藏的属性词,即被省略的属性词,但是根据上下文可推断出该属性词。例如,评论语句为“很流畅”,根据情感词典、属性词典、语法规则提取到该家电评论语句中的属性信息是:“[]---很---流畅”,没有直接属性词,评论信息不完整,但是可推测,该评论语句的潜在完整评论为:
[系统或画面]---很---流畅。
对于涉及到隐式属性词的评论语句,可以利用至支持向量机(SVM,SupportVectorMachine)分类方法来处理,SVM是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。
具体地,首先通过人工总结包含隐式属性词的家电产品评论语句,构建反映隐式属性词与评论语句之间的对应关系的语料库,并预置于设备中,该语料库的格式如下:
隐式属性词 | 评论语句 |
价格 | 很实惠 |
价格 | 经济 |
... | ... |
画质 | 不清晰 |
系统 | 反应慢 |
物流 | 配送快 |
... | ... |
获取预置的隐式属性词评论语料库,该隐式属性词评论语料库包含隐式属性词及其对应的评论语句。将该语料库作为训练样本“training”,通过用SVM方法对该训练样本进行训练,得到预测模型SVM_MODEL,该预测模型对新的评价语句进行属性分类预测,得到家电产品评论语句中的隐式属性词,例如:
Predict(“很流畅”,SVM_MODEL)=系统
于是得到提取结果:
系统---很---流畅。
进一步可得到整体完整的分析结果:
若家电产品评论语句为:“物流挺快,第二天就到了,很流畅,就是应用比较少,视频资源并不是那么多”。
则得到提取结果:
物流---挺---快
[系统]---很---流畅
应用---比较---少
视频资源---不是---那么--多
S208、将该情感信息按照情感倾向进行分类,并结合该属性信息生成分析结果。
将该情感信息按照情感倾向进行分类,情感倾向可分为正面倾向和负面倾向,正面倾向包括喜爱、满意等情感,负面倾向包括厌恶、不满等情感。结合该情感信息对应的属性信息生成对评论指向的家电产品的用户体验分析结果。
该分析结果格式如下:
该分析结果可集中体现一件家电产品给用户的印象,以及用户今后的购买倾向。家电生产及销售公司能够较准确地获取家电行业的产品评价口碑,及时获取并分析自身产品(如电视,冰箱等)网上评价,以及具体产品属性的评价和反响,对产品营销,设计改进提供相关依据。同时,也可以获知同业竞品的相关口碑,通过与自身产品分析比较,进一步改进自身产品,提高自身竞争力。
本发明实施例中,通过情感词和属性词彼此互相发现,迭代挖掘并更新家电产品评论分析的属性词典和情感词典,以及,根据该属性词典和该情感词典以及构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息,并根据该情感信息及该属性信息得到对家电产品评论的分析结果,在构建词典和规则库时减少人力支出,从而降低成本,且构建方法具有强移植性,并且提高了获得属性词和情感词对应关系的效率和准确率,提高了对家电产品评论的分析结果的准确率。以及,通过支持向量机挖掘隐式属性词,可提高分析效率,并进一步提高分析结果的准确率。
请参阅图4,图4是本发明第三实施例提供的家电产品互联网评论分析装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。该装置主要包括:获取模块401、分词模块402、定位模块403、更新模块404、提取模块405以及生成模块406。
其中,获取模块401,用于获取家电产品评论语料库;
分词模块402,用于将该语料库中的家电产品评论语句进行分词,并对各分词分别标注词性;
定位模块403,用于根据预置的情感词典定位进行分词处理后的情感词,以及,根据预置的属性词典,定位进行分词处理后的属性词;
更新模块404,用于通过定位的情感词发现新的属性词,并根据该新的属性词更新该属性词典,以及,通过定位的属性词发现新的情感词,并根据该新的情感词更新该情感词典;
提取模块405,用于根据该更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息;
生成模块406,用于将该情感信息按照情感倾向进行分类,并结合该属性信息生成分析结果。
需要说明的是,以上图4示例的家电产品互联网评论分析装置的实施方式中,各功能模块的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将该访问装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成。本说明书提供的各个实施例都可应用上述描述原则。未尽细节请参见前述图1及图2所示实施例的描述。
本实施例提供的家电产品互联网评论分析装置,通过情感词和属性词彼此互相发现,迭代挖掘并更新家电产品评论分析的属性词典和情感词典,以及,根据该属性词典和该情感词典以及构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息,并根据该情感信息及该属性信息得到对家电产品评论的分析结果,在构建词典和规则库时减少人力支出,从而降低成本,且构建方法具有强移植性,并且提高了获得属性词和情感词对应关系的效率和准确率,提高了对家电产品评论的分析结果的准确率。
请参阅图5,图5是本发明第四实施例提供的家电产品互联网评论分析装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。该装置主要包括:获取模块501、分词模块502、定位模块503、更新模块504、第一搜索模块5041、第一录入模块5042、第一排序模块5043、第二搜索模块5044、第二录入模块5045、第二排序模块5046、提取模块505、生成模块506、查找模块507、第三录入模块508以及挖掘模块509。
其中,获取模块501,用于获取家电产品评论语料库;
分词模块502,用于将该语料库中的家电产品评论语句进行分词,并对各分词分别标注词性;
定位模块503,用于根据预置的情感词典定位进行分词处理后的情感词,以及,根据预置的属性词典,定位进行分词处理后的属性词;
更新模块504,用于通过定位的情感词发现新的属性词,并根据该新的属性词更新该属性词典,以及,通过定位的属性词发现新的情感词,并根据该新的情感词更新该情感词典;
提取模块505,用于根据该更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息;
生成模块506,用于将该情感信息按照情感倾向进行分类,并结合该属性信息生成分析结果。
进一步地,更新模块504还可以包括:
第一搜索模块5041,用于搜索定位的情感词前后预置数量的第一词性的词作为新的属性词;
第一录入模块5042,用于将该新的属性词收录入所述属性词典;
第一录入模块5042,还用于将该新的属性词的词频收录入该属性词典;
第一排序模块5043,用于将该属性词典中的属性词按照词频高低排序,并将排序在前的预置数量的属性词作为新的属性词典。
第一搜索模块5041、第一录入模块5042以及第一排序模块5043各子模块迭代执行各自功能,直至最新生成的属性词典中的属性词与前一次生成属性词典中的属性词不同的数量小于预置数值。
进一步地,更新模块504还可以包括:
第二搜索模块5044,用于搜索定位的属性词前后预置数量的第二词性的词作为新的情感词;
第二录入模块5045,用于将该新的情感词收录入该情感词典;
第二录入模块5045,还用于将该新的情感词的词频收录入该情感词典;
第二排序模块5046,用于将该情感词典中的情感词按照词频高低排序,并将排序在前的预置数量的情感词作为新的情感词典;
第二搜索模块5044、第二录入模块5045以及第二排序模块5046各子模块迭代执行各自功能,直至最新生成的情感词典中的情感词与前一次生成情感词典中的情感词不同的数量小于预置数值。
该装置还可以进一步包括:
查找模块507,用于通过同义词词林的相似度算法,分别查找该新的属性词的同义词以及该新的情感词的同义词。
第三录入模块508,用于将查找到的同义词收录入该属性词典以及该情感词典。
该装置还可以进一步包括:
挖掘模块509,用于通过支持向量机分类方法对隐式属性词进行挖掘。
进一步地,挖掘模块509包括:
获取子模块5091,用于获取预置的隐式属性词评论语料库,该隐式属性词评论语料库包含隐式属性词及其对应的评论语句;
训练模块5092,用于将该隐式属性词评论语料库作为训练样本,通过支持向量机训练该训练样本得到预测模型;
预测模块5093,用于根据该预测模型进行属性分类预测得到家电产品评论语句中的隐式属性词,该隐式属性词为在家电产品评论语句中被隐藏的属性词。
该装置还可以进一步包括:
过滤模块510,用于过滤该语料库中的无效评论信息。
需要说明的是,以上图5示例的家电产品互联网评论分析装置的实施方式中,各功能模块的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将该访问装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成。本说明书提供的各个实施例都可应用上述描述原则。未尽细节请参见前述图1及图2所示实施例的描述。
本实施例提供的家电产品互联网评论分析装置,通过情感词和属性词彼此互相发现,迭代挖掘并更新家电产品评论分析的属性词典和情感词典,以及,根据该属性词典和该情感词典以及构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息,并根据该情感信息及该属性信息得到对家电产品评论的分析结果,在构建词典和规则库时减少人力支出,从而降低成本,且构建方法具有强移植性,并且提高了获得属性词和情感词对应关系的效率和准确率,提高了对家电产品评论的分析结果的准确率。以及,通过支持向量机挖掘隐式属性词,可提高分析效率,并进一步提高分析结果的准确率。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上为对本发明所提供的一种家电产品互联网评论分析方法及装置的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
Claims (14)
1.一种家电产品互联网评论的分析方法,其特征在于,所述方法包括:
获取家电产品评论语料库;
将所述语料库中的家电产品评论语句进行分词,并对各分词分别标注词性;
根据预置的情感词典定位进行分词处理后的情感词,以及,根据预置的属性词典,定位进行分词处理后的属性词;
通过定位的情感词发现新的属性词,并根据所述新的属性词更新所述属性词典,以及,通过定位的属性词发现新的情感词,并根据所述新的情感词更新所述情感词典;
根据所述更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息;
将所述情感信息按照情感倾向进行分类,并结合所述属性信息生成分析结果。
2.根据权利要求1所述的方法,其特征在于,所述通过定位的情感词发现新的属性词,并根据所述新的属性词更新所述属性词典包括:
搜索定位的情感词前后预置数量的第一词性的词作为新的属性词收录入所述属性词典;
将所述新的属性词的词频收录入所述属性词典;
将所述属性词典中的属性词按照词频高低排序,并将排序在前的预置数量的属性词作为新的属性词典;
迭代执行上述步骤,直至最新生成的属性词典中的属性词与前一次生成属性词典中的属性词不同的数量小于预置数值。
3.根据权利要求1所述的方法,其特征在于,所述通过定位的属性词发现新的情感词,并根据所述新的情感词更新所述情感词典还包括:
搜索定位的属性词前后预置数量的第二词性的词作为新的情感词收录入所述情感词典;
将所述新的情感词的词频收录入所述情感词典;
将所述情感词典中的情感词按照词频高低排序,并将排序在前的预置数量的情感词作为新的情感词典;
迭代执行上述步骤,直至最新生成的情感词典中的情感词与前一次生成情感词典中的情感词不同的数量小于预置数值。
4.根据权利要求2或3所述的方法,其特征在于,所述通过定位的属性词发现新的情感词,并根据所述新的情感词更新所述情感词典之后包括:
通过同义词词林的相似度算法,分别查找所述新的属性词的同义词以及所述新的情感词的同义词,并将查找到的同义词收录入所述属性词典以及所述情感词典。
5.根据权利要求4所述的方法,其特征在于,所述根据所述更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息之后包括:通过支持向量机分类方法对隐式属性词进行挖掘。
6.根据权利要求5所述的方法,其特征在于,所述通过支持向量机分类方法对隐式属性词进行挖掘包括:
获取预置的隐式属性词评论语料库,所述隐式属性词评论语料库包含隐式属性词及其对应的评论语句;
将所述隐式属性词评论语料库作为训练样本,通过支持向量机训练所述训练样本得到预测模型;
根据所述预测模型进行属性分类预测得到家电产品评论语句中的隐式属性词,所述隐式属性词为在家电产品评论语句中被隐藏的属性词。
7.根据权利要求1所述的方法,其特征在于,所述获取家电产品评论语料库之后包括:
过滤所述语料库中的无效评论信息。
8.一种家电产品互联网评论的分析装置,其特征在于,所述装置包括:
获取模块,用于获取家电产品评论语料库;
分词模块,用于将所述语料库中的家电产品评论语句进行分词,并对各分词分别标注词性;
定位模块,用于根据预置的情感词典定位进行分词处理后的情感词,以及,根据预置的属性词典,定位进行分词处理后的属性词;
更新模块,用于通过定位的情感词发现新的属性词,并根据所述新的属性词更新所述属性词典,以及,通过定位的属性词发现新的情感词,并根据所述新的情感词更新所述情感词典;
提取模块,用于根据所述更新后的属性词典、情感词典,以及预先构建的家电产品评论语法规则库,提取家电产品评论语句中的情感信息以及属性信息;
生成模块,用于将所述情感信息按照情感倾向进行分类,并结合所述属性信息生成分析结果。
9.根据权利要求8所述的装置,其特征在于,所述更新模块包括:
第一搜索模块,用于搜索定位的情感词前后预置数量的第一词性的词作为新的属性词;
第一录入模块,用于将所述新的属性词收录入所述属性词典;
所述第一录入模块,还用于将所述新的属性词的词频收录入所述属性词典;
第一排序模块,用于将所述属性词典中的属性词按照词频高低排序,并将排序在前的预置数量的属性词作为新的属性词典。
10.根据权利要求8所述的装置,其特征在于,所述更新模块还包括:
第二搜索模块,用于搜索定位的属性词前后预置数量的第二词性的词作为新的情感词;
第二录入模块,用于将所述新的情感词收录入所述情感词典;
所述第二录入模块,还用于将所述新的情感词的词频收录入所述情感词典;
第二排序模块,用于将所述情感词典中的情感词按照词频高低排序,并将排序在前的预置数量的情感词作为新的情感词典。
11.根据权利要求8至10任一项所述的装置,其特征在于,所述装置还包括:
查找模块,用于通过同义词词林的相似度算法,分别查找所述新的属性词的同义词以及所述新的情感词的同义词;
第三录入模块,用于将查找到的同义词收录入所述属性词典以及所述情感词典。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
挖掘模块,用于通过支持向量机分类方法对隐式属性词进行挖掘。
13.根据权利要求12所述的装置,其特征在于,所述挖掘模块包括:
获取子模块,用于获取预置的隐式属性词评论语料库,所述隐式属性词评论语料库包含隐式属性词及其对应的评论语句;
训练模块,用于将所述隐式属性词评论语料库作为训练样本,通过支持向量机训练所述训练样本得到预测模型;
预测模块,用于根据所述预测模型进行属性分类预测得到家电产品评论语句中的隐式属性词,所述隐式属性词为在家电产品评论语句中被隐藏的属性词。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
过滤模块,用于过滤所述语料库中的无效评论信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510680008.1A CN105354183A (zh) | 2015-10-19 | 2015-10-19 | 一种家电产品互联网评论的分析方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510680008.1A CN105354183A (zh) | 2015-10-19 | 2015-10-19 | 一种家电产品互联网评论的分析方法、装置及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105354183A true CN105354183A (zh) | 2016-02-24 |
Family
ID=55330157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510680008.1A Pending CN105354183A (zh) | 2015-10-19 | 2015-10-19 | 一种家电产品互联网评论的分析方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105354183A (zh) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824898A (zh) * | 2016-03-14 | 2016-08-03 | 苏州大学 | 一种网络评论的标签提取方法和装置 |
CN106445912A (zh) * | 2016-08-31 | 2017-02-22 | 五八同城信息技术有限公司 | 处理评价信息的方法及装置 |
CN106649260A (zh) * | 2016-10-19 | 2017-05-10 | 中国计量大学 | 基于评论文本挖掘的产品特征结构树构建方法 |
CN106844632A (zh) * | 2017-01-20 | 2017-06-13 | 清华大学 | 基于改进支持向量机的产品评论情感分类方法及装置 |
CN107133209A (zh) * | 2017-03-29 | 2017-09-05 | 北京百度网讯科技有限公司 | 基于人工智能的评论生成方法及装置、设备与可读介质 |
CN107169091A (zh) * | 2017-05-12 | 2017-09-15 | 北京奇艺世纪科技有限公司 | 一种数据分析方法及装置 |
CN107193836A (zh) * | 2016-03-15 | 2017-09-22 | 腾讯科技(深圳)有限公司 | 一种识别方法及装置 |
CN107229636A (zh) * | 2016-03-24 | 2017-10-03 | 腾讯科技(深圳)有限公司 | 一种词语分类的方法及装置 |
CN107491531A (zh) * | 2017-08-18 | 2017-12-19 | 华南师范大学 | 基于集成学习框架的中文网络评论情感分类方法 |
CN107835231A (zh) * | 2017-10-19 | 2018-03-23 | 平安科技(深圳)有限公司 | 反馈信息的处理方法及终端设备 |
WO2018068648A1 (zh) * | 2016-10-11 | 2018-04-19 | 阿里巴巴集团控股有限公司 | 一种信息匹配方法及相关装置 |
CN108170685A (zh) * | 2018-01-29 | 2018-06-15 | 浙江省公众信息产业有限公司 | 文本情感分析方法、装置和计算机可读存储介质 |
CN108319586A (zh) * | 2018-01-31 | 2018-07-24 | 天闻数媒科技(北京)有限公司 | 一种信息提取规则的生成和语义解析方法及装置 |
CN108763226A (zh) * | 2016-06-28 | 2018-11-06 | 大连民族大学 | 商品评论要素的抽取方法 |
WO2019037391A1 (zh) * | 2017-08-24 | 2019-02-28 | 平安科技(深圳)有限公司 | 客户购买意向的预测方法、装置、电子设备及介质 |
CN109829033A (zh) * | 2017-11-23 | 2019-05-31 | 阿里巴巴集团控股有限公司 | 数据展示方法和终端设备 |
WO2019201024A1 (zh) * | 2018-04-17 | 2019-10-24 | 百度在线网络技术(北京)有限公司 | 用于更新模型参数的方法、装置、设备和存储介质 |
CN110728131A (zh) * | 2018-06-29 | 2020-01-24 | 北京京东尚科信息技术有限公司 | 一种分析文本属性的方法和装置 |
CN110825876A (zh) * | 2019-11-07 | 2020-02-21 | 上海德拓信息技术股份有限公司 | 电影评论观点情感倾向性分析方法 |
CN111126046A (zh) * | 2019-12-06 | 2020-05-08 | 腾讯云计算(北京)有限责任公司 | 语句特征的处理方法和装置、存储介质 |
CN111126035A (zh) * | 2019-12-24 | 2020-05-08 | 深圳视界信息技术有限公司 | 一种电商评论分析场景下细粒度属性分析方法 |
CN111144507A (zh) * | 2019-12-30 | 2020-05-12 | 北京百度网讯科技有限公司 | 情感分析模型预训练方法、装置及电子设备 |
CN111144108A (zh) * | 2019-12-26 | 2020-05-12 | 北京百度网讯科技有限公司 | 情感倾向性分析模型的建模方法、装置和电子设备 |
CN111310455A (zh) * | 2020-02-11 | 2020-06-19 | 安徽理工大学 | 一种面向网购评论的新情感词极性计算方法 |
CN113010593A (zh) * | 2021-04-02 | 2021-06-22 | 北京智通云联科技有限公司 | 非结构化文本的事件抽取方法、系统及装置 |
CN113837531A (zh) * | 2016-05-30 | 2021-12-24 | 中国计量大学 | 一种基于网络评论的产品质量问题发现及风险评估方法 |
CN115269852A (zh) * | 2022-08-08 | 2022-11-01 | 浙江浙蕨科技有限公司 | 一种舆情分析方法、系统及存储介质 |
CN115659961A (zh) * | 2022-11-01 | 2023-01-31 | 广东美云智数科技有限公司 | 用于提取文本观点的方法、装置以及计算机存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2066499A1 (en) * | 2006-09-27 | 2009-06-10 | Powis-Parker, Inc. | Apparatus and method for binding thick sheets including photographs |
CN103365867A (zh) * | 2012-03-29 | 2013-10-23 | 腾讯科技(深圳)有限公司 | 一种对用户评价进行情感分析的方法和装置 |
CN103679462A (zh) * | 2012-08-31 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种评论数据处理方法和装置、一种搜索方法和系统 |
CN104699766A (zh) * | 2015-02-15 | 2015-06-10 | 浙江理工大学 | 一种融合词语关联关系和上下文语境推断的隐式属性挖掘方法 |
CN104731770A (zh) * | 2015-03-23 | 2015-06-24 | 中国科学技术大学苏州研究院 | 基于规则和统计模型的中文微博情感分析方法 |
-
2015
- 2015-10-19 CN CN201510680008.1A patent/CN105354183A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2066499A1 (en) * | 2006-09-27 | 2009-06-10 | Powis-Parker, Inc. | Apparatus and method for binding thick sheets including photographs |
CN103365867A (zh) * | 2012-03-29 | 2013-10-23 | 腾讯科技(深圳)有限公司 | 一种对用户评价进行情感分析的方法和装置 |
CN103679462A (zh) * | 2012-08-31 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种评论数据处理方法和装置、一种搜索方法和系统 |
CN104699766A (zh) * | 2015-02-15 | 2015-06-10 | 浙江理工大学 | 一种融合词语关联关系和上下文语境推断的隐式属性挖掘方法 |
CN104731770A (zh) * | 2015-03-23 | 2015-06-24 | 中国科学技术大学苏州研究院 | 基于规则和统计模型的中文微博情感分析方法 |
Cited By (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105824898A (zh) * | 2016-03-14 | 2016-08-03 | 苏州大学 | 一种网络评论的标签提取方法和装置 |
CN107193836B (zh) * | 2016-03-15 | 2021-08-10 | 腾讯科技(深圳)有限公司 | 一种识别方法及装置 |
CN107193836A (zh) * | 2016-03-15 | 2017-09-22 | 腾讯科技(深圳)有限公司 | 一种识别方法及装置 |
CN107229636A (zh) * | 2016-03-24 | 2017-10-03 | 腾讯科技(深圳)有限公司 | 一种词语分类的方法及装置 |
CN113837531A (zh) * | 2016-05-30 | 2021-12-24 | 中国计量大学 | 一种基于网络评论的产品质量问题发现及风险评估方法 |
CN108763226A (zh) * | 2016-06-28 | 2018-11-06 | 大连民族大学 | 商品评论要素的抽取方法 |
CN106445912A (zh) * | 2016-08-31 | 2017-02-22 | 五八同城信息技术有限公司 | 处理评价信息的方法及装置 |
WO2018068648A1 (zh) * | 2016-10-11 | 2018-04-19 | 阿里巴巴集团控股有限公司 | 一种信息匹配方法及相关装置 |
CN106649260A (zh) * | 2016-10-19 | 2017-05-10 | 中国计量大学 | 基于评论文本挖掘的产品特征结构树构建方法 |
CN106649260B (zh) * | 2016-10-19 | 2022-01-25 | 中国计量大学 | 基于评论文本挖掘的产品特征结构树构建方法 |
CN106844632A (zh) * | 2017-01-20 | 2017-06-13 | 清华大学 | 基于改进支持向量机的产品评论情感分类方法及装置 |
CN106844632B (zh) * | 2017-01-20 | 2020-02-21 | 清华大学 | 基于改进支持向量机的产品评论情感分类方法及装置 |
CN107133209A (zh) * | 2017-03-29 | 2017-09-05 | 北京百度网讯科技有限公司 | 基于人工智能的评论生成方法及装置、设备与可读介质 |
CN107169091A (zh) * | 2017-05-12 | 2017-09-15 | 北京奇艺世纪科技有限公司 | 一种数据分析方法及装置 |
CN107491531B (zh) * | 2017-08-18 | 2019-05-17 | 华南师范大学 | 基于集成学习框架的中文网络评论情感分类方法 |
CN107491531A (zh) * | 2017-08-18 | 2017-12-19 | 华南师范大学 | 基于集成学习框架的中文网络评论情感分类方法 |
WO2019037391A1 (zh) * | 2017-08-24 | 2019-02-28 | 平安科技(深圳)有限公司 | 客户购买意向的预测方法、装置、电子设备及介质 |
CN107835231B (zh) * | 2017-10-19 | 2020-01-03 | 平安科技(深圳)有限公司 | 反馈信息的处理方法及终端设备 |
CN107835231A (zh) * | 2017-10-19 | 2018-03-23 | 平安科技(深圳)有限公司 | 反馈信息的处理方法及终端设备 |
CN109829033A (zh) * | 2017-11-23 | 2019-05-31 | 阿里巴巴集团控股有限公司 | 数据展示方法和终端设备 |
CN109829033B (zh) * | 2017-11-23 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 数据展示方法和终端设备 |
CN108170685A (zh) * | 2018-01-29 | 2018-06-15 | 浙江省公众信息产业有限公司 | 文本情感分析方法、装置和计算机可读存储介质 |
CN108319586A (zh) * | 2018-01-31 | 2018-07-24 | 天闻数媒科技(北京)有限公司 | 一种信息提取规则的生成和语义解析方法及装置 |
CN108319586B (zh) * | 2018-01-31 | 2021-09-24 | 天闻数媒科技(北京)有限公司 | 一种信息提取规则的生成和语义解析方法及装置 |
WO2019201024A1 (zh) * | 2018-04-17 | 2019-10-24 | 百度在线网络技术(北京)有限公司 | 用于更新模型参数的方法、装置、设备和存储介质 |
CN110728131A (zh) * | 2018-06-29 | 2020-01-24 | 北京京东尚科信息技术有限公司 | 一种分析文本属性的方法和装置 |
CN110825876A (zh) * | 2019-11-07 | 2020-02-21 | 上海德拓信息技术股份有限公司 | 电影评论观点情感倾向性分析方法 |
CN111126046B (zh) * | 2019-12-06 | 2023-07-14 | 腾讯云计算(北京)有限责任公司 | 语句特征的处理方法和装置、存储介质 |
CN111126046A (zh) * | 2019-12-06 | 2020-05-08 | 腾讯云计算(北京)有限责任公司 | 语句特征的处理方法和装置、存储介质 |
CN111126035A (zh) * | 2019-12-24 | 2020-05-08 | 深圳视界信息技术有限公司 | 一种电商评论分析场景下细粒度属性分析方法 |
CN111144108A (zh) * | 2019-12-26 | 2020-05-12 | 北京百度网讯科技有限公司 | 情感倾向性分析模型的建模方法、装置和电子设备 |
CN111144108B (zh) * | 2019-12-26 | 2023-06-27 | 北京百度网讯科技有限公司 | 情感倾向性分析模型的建模方法、装置和电子设备 |
US11537792B2 (en) | 2019-12-30 | 2022-12-27 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Pre-training method for sentiment analysis model, and electronic device |
JP2021111323A (ja) * | 2019-12-30 | 2021-08-02 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 感情分析モデルの事前トレーニング方法、装置及び電子機器 |
JP7149993B2 (ja) | 2019-12-30 | 2022-10-07 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 感情分析モデルの事前トレーニング方法、装置及び電子機器 |
KR102472708B1 (ko) | 2019-12-30 | 2022-11-30 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 감정 분석 모델을 사전 트레이닝하는 방법, 장치 및 전자 기기 |
KR20210086940A (ko) * | 2019-12-30 | 2021-07-09 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 감정 분석 모델을 사전 트레이닝하는 방법, 장치 및 전자 기기 |
CN111144507A (zh) * | 2019-12-30 | 2020-05-12 | 北京百度网讯科技有限公司 | 情感分析模型预训练方法、装置及电子设备 |
CN111310455A (zh) * | 2020-02-11 | 2020-06-19 | 安徽理工大学 | 一种面向网购评论的新情感词极性计算方法 |
CN113010593A (zh) * | 2021-04-02 | 2021-06-22 | 北京智通云联科技有限公司 | 非结构化文本的事件抽取方法、系统及装置 |
CN113010593B (zh) * | 2021-04-02 | 2024-02-13 | 北京智通云联科技有限公司 | 非结构化文本的事件抽取方法、系统及装置 |
CN115269852A (zh) * | 2022-08-08 | 2022-11-01 | 浙江浙蕨科技有限公司 | 一种舆情分析方法、系统及存储介质 |
CN115659961A (zh) * | 2022-11-01 | 2023-01-31 | 广东美云智数科技有限公司 | 用于提取文本观点的方法、装置以及计算机存储介质 |
CN115659961B (zh) * | 2022-11-01 | 2023-08-04 | 美云智数科技有限公司 | 用于提取文本观点的方法、装置以及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105354183A (zh) | 一种家电产品互联网评论的分析方法、装置及系统 | |
CN102831184B (zh) | 根据对社会事件的文字描述来预测社会情感的方法及系统 | |
CN108563620A (zh) | 文本自动写作方法和系统 | |
CN108875059B (zh) | 用于生成文档标签的方法、装置、电子设备和存储介质 | |
CN103870000A (zh) | 一种对输入法所产生的候选项进行排序的方法及装置 | |
CN104933081A (zh) | 一种搜索建议提供方法及装置 | |
CN103123633A (zh) | 评价参数的生成方法以及基于评价参数的信息搜索方法 | |
CN106682192A (zh) | 一种基于搜索关键词训练回答意图分类模型的方法和装置 | |
CN109948121A (zh) | 文章相似度挖掘方法、系统、设备及存储介质 | |
CN105608166A (zh) | 一种标签提取方法及装置 | |
CN111368548A (zh) | 语义识别方法及装置、电子设备和计算机可读存储介质 | |
CN103870001A (zh) | 一种生成输入法候选项的方法及电子装置 | |
US10127304B1 (en) | Analysis and visualization tool with combined processing of structured and unstructured service event data | |
CN109684627A (zh) | 一种文本分类方法及装置 | |
CN101833560A (zh) | 基于互联网的厂商口碑自动排序系统 | |
Yeole et al. | Opinion mining for emotions determination | |
Thomaidou et al. | Automated snippet generation for online advertising | |
CN110334268B (zh) | 一种区块链项目热词生成方法以及装置 | |
CN103869999A (zh) | 对输入法所产生的候选项进行排序的方法及装置 | |
CN112528153A (zh) | 内容推荐方法、装置、设备、存储介质以及程序产品 | |
CN114579104A (zh) | 数据分析场景的生成方法、装置、设备及存储介质 | |
CN110399479A (zh) | 搜索数据处理方法、装置、电子设备及计算机可读介质 | |
CN111221881B (zh) | 用户特征数据合成方法、装置及电子设备 | |
CN102982025A (zh) | 一种搜索需求识别方法及装置 | |
CN105809465A (zh) | 一种信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160224 |
|
RJ01 | Rejection of invention patent application after publication |