CN111814483B - 用于分析情感的方法和装置 - Google Patents
用于分析情感的方法和装置 Download PDFInfo
- Publication number
- CN111814483B CN111814483B CN201910505075.8A CN201910505075A CN111814483B CN 111814483 B CN111814483 B CN 111814483B CN 201910505075 A CN201910505075 A CN 201910505075A CN 111814483 B CN111814483 B CN 111814483B
- Authority
- CN
- China
- Prior art keywords
- target
- emotion
- feature vector
- words
- vocabulary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 307
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000011218 segmentation Effects 0.000 claims abstract description 65
- 239000013598 vector Substances 0.000 claims description 344
- 239000011159 matrix material Substances 0.000 claims description 46
- 238000000605 extraction Methods 0.000 claims description 22
- 238000003062 neural network model Methods 0.000 claims description 17
- 230000002457 bidirectional effect Effects 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 11
- 230000008909 emotion recognition Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开的实施例公开了用于分析情感的方法和装置。该方法的一具体实施方式包括:响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合;将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合;基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合;基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合;向与目标物品相关联的第一终端设备发送评论关联信息集合。该实施方式可以实现得到评论文本所表达的情感。
Description
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于分析情感的方法和装置。
背景技术
随着互联网技术以及电子商务的飞速发展,网络购物在人们的日常生活已十分普遍。目前,网络购物平台中的物品种类繁多,数目巨大。为了获得满意的物品,在下单之前,人们通常会先搜索到很多物品,然后逐个查看各物品的评论信息,最后基于所查看的评论信息所表现出的情感(如,正面情感、负面情感等),对某一个或某几个物品下单。
相关技术中,存在对物品的评论信息进行情感分析的需要。
发明内容
本公开的实施例提出了用于分析情感的方法和装置。
第一方面,本公开的实施例提供了一种用于分析情感的方法,该方法包括:响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合;将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合;基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合;基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合;向与目标物品相关联的第一终端设备发送评论关联信息集合。
在一些实施例中,基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合包括:基于目标词汇集合对应的向量集合,确定第一特征向量集合,以及基于非目标词汇集合对应的向量集合,确定第二特征向量集合;遍历第一特征向量集合中的第一特征向量,以及在访问当前第一特征向量时,执行以下情感确定步骤:基于第二特征向量集合生成对应于当前第一特征向量的特征矩阵;将所生成的特征矩阵输入预先训练的情感识别模型,得到对应于所生成的特征矩阵的情感类型信息;将所得到的情感类型信息与当前第一特征向量所对应的目标词汇关联后存入情感信息集合。
在一些实施例中,基于目标词汇集合对应的向量集合,确定第一特征向量集合包括:将目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于目标词汇集合的特征向量集合,将所得到的特征向量集合作为第一特征向量集合,其中,特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系;以及基于非目标词汇集合对应的向量集合,确定第二特征向量集合包括:将非目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于非目标词汇集合的特征向量集合,将所得到的特征向量集合作为第二特征向量集合,其中,特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系。
在一些实施例中,基于第二特征向量集合生成对应于当前第一特征向量的特征矩阵包括:遍历第二特征向量集合中的第二特征向量,以及在访问当前第二特征向量时,执行以下权重确定步骤:确定当前第二特征向量与当前第一特征向量的权重值;根据所确定的权重值,得到对应于当前第二特征向量的权重向量,存入权重向量集合;根据权重向量集合生成特征矩阵。
在一些实施例中,基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合包括:提取针对目标物品的至少一个情感信息集合,以及提取至少一个情感信息集合中的目标词汇,将提取的目标词汇作为待分析词汇,存入待分析词汇集合;遍历待分析词汇集合中的待分析词汇,在访问当前待分析词汇时,执行如下汇总步骤:从至少一个情感信息集合中提取与当前待分析词汇相匹配的至少一类情感类型信息;确定所提取的各类情感类型信息的出现次数;将当前待分析词汇对应的目标词汇、所提取的至少一类情感类型信息以及所提取的各类情感类型信息的出现次数,关联后存入对应于物品的评论关联信息集合。
在一些实施例中,该方法还包括:响应于接收到第二终端设备发送的查询请求,查询请求包括待查询词汇;从多个物品所对应的多个评论关联信息集合中,确定存在与待查询词汇相匹配的目标词汇的评论关联信息集合;根据所确定的评论关联信息集合中的相匹配的目标词汇的各类情感类型信息的出现次数,筛选所确定的评论关联信息集合,将筛选后的评论关联信息集合所对应的物品的物品信息推送给第二终端设备。
第二方面,本公开的实施例提供了一种用于分析情感的装置,该装置包括:文本切分单元,被配置成响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合;词汇分类单元,被配置成将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合;情感确定单元,被配置成基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合;第一确定单元,被配置成基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合;第一推送单元,被配置成向与目标物品相关联的第一终端设备发送评论关联信息集合。
在一些实施例中,情感确定单元,被进一步配置成:基于目标词汇集合对应的向量集合,确定第一特征向量集合,以及基于非目标词汇集合对应的向量集合,确定第二特征向量集合;遍历第一特征向量集合中的第一特征向量,以及在访问当前第一特征向量时,执行以下情感确定步骤:基于第二特征向量集合生成对应于当前第一特征向量的特征矩阵;将所生成的特征矩阵输入预先训练的情感识别模型,得到对应于所生成的特征矩阵的情感类型信息;将所得到的情感类型信息与当前第一特征向量所对应的目标词汇关联后存入情感信息集合。
在一些实施例中,基于目标词汇集合对应的向量集合,确定第一特征向量集合包括:将目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于目标词汇集合的特征向量集合,将所得到的特征向量集合作为第一特征向量集合,其中,特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系;以及基于非目标词汇集合对应的向量集合,确定第二特征向量集合包括:将非目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于非目标词汇集合的特征向量集合,将所得到的特征向量集合作为第二特征向量集合,其中,特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系。
在一些实施例中,基于第二特征向量集合生成对应于当前第一特征向量的特征矩阵包括:遍历第二特征向量集合中的第二特征向量,以及在访问当前第二特征向量时,执行以下权重确定步骤:确定当前第二特征向量与当前第一特征向量的权重值;根据所确定的权重值,得到对应于当前第二特征向量的权重向量,存入权重向量集合;根据权重向量集合生成特征矩阵。
在一些实施例中,第一确定单元被进一步配置成:提取针对目标物品的至少一个情感信息集合,以及提取至少一个情感信息集合中的目标词汇,将提取的目标词汇作为待分析词汇,存入待分析词汇集合;遍历待分析词汇集合中的待分析词汇,在访问当前待分析词汇时,执行如下汇总步骤:从至少一个情感信息集合中提取与当前待分析词汇相匹配的至少一类情感类型信息;确定所提取的各类情感类型信息的出现次数;将当前待分析词汇对应的目标词汇、所提取的至少一类情感类型信息以及所提取的各类情感类型信息的出现次数,关联后存入对应于物品的评论关联信息集合。
在一些实施例中,该装置还包括:查询接收单元,被配置成响应于接收到第二终端设备发送的查询请求,查询请求包括待查询词汇;第二确定单元,被配置成从多个物品所对应的多个评论关联信息集合中,确定存在与待查询词汇相匹配的目标词汇的评论关联信息集合;第二推送单元,被配置成根据所确定的评论关联信息集合中的相匹配的目标词汇的各类情感类型信息的出现次数,筛选所确定的评论关联信息集合,将筛选后的评论关联信息集合所对应的物品的物品信息推送给第二终端设备。
第三方面,本公开的实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当该一个或多个程序被该一个或多个处理器执行,使得该一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的实施例提供的用于分析情感的方法和装置,可以响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合。然后,将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合。之后,基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合。接着,基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合。最后,向与目标物品相关联的第一终端设备发送评论关联信息集合。本公开的实施例提供的方法和装置,可以通过分析对应于评论文本的目标词汇集合和非目标词汇集合,得到对应于评论文本的情感信息集合,实现得到评论文本所表达的情感。与现有技术中将评论文本作为整体来获取评论文本所表达的情感相比,从各个目标词汇的角度来获取评论文本所表达的情感,可以获取到评论文本的更加准确、细致的感情信息,有助于提高所获取的情感信息的准确度。另外,将对目标物品进行整体评价的评论关联信息集合,发送给与目标物品关联的第一终端设备,可以实现目标物品的售卖方及时获取到购买方针对目标物品的评价情况,有助于实现信息的有针对性发送,有助于节约网络流量。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的用于分析情感的方法的一个实施例的流程图;
图3是根据本公开的实施例的用于分析情感的方法的一个应用场景的示意图;
图4是根据本公开的用于分析情感的方法的又一个实施例的流程图;
图5是根据本公开的用于分析情感的装置的一个实施例的结构示意图;
图6是适于用来实现本公开的实施例的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。本领域技术人员还将理解的是,虽然本文中可使用用语“第一”、“第二”等来描述各种特征向量、终端设备、推送单元等,但是这些特征向量、终端设备、推送单元不应被这些用语限制。这些用语仅用于将一个特征向量、终端设备、推送单元与其它特征向量、终端设备、推送单元区分开。
图1示出了可以应用本公开的实施例的用于分析情感的方法或用于分析情感的装置的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103可以通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如购物类应用、搜索类应用、查错类应用等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持评论文本输入的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。终端设备101、102、103可以将所输入的评论文本发送至服务器105中。
服务器105可以是提供各种服务的服务器,例如对从终端设备101、102、103上所获取的评论文本进行情感分析的服务器。服务器可以在获取到终端设备101、102、103发送的评论文本时,对评论文本进行切分,得到对应于评论文本的切分词集合。然后,将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合。之后,基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合。接着基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合。最后,向与目标物品相关联的第一终端设备发送评论关联信息集合。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本公开的实施例所提供的用于分析情感的方法一般由服务器105执行,相应地,用于分析情感的装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开的用于分析情感的方法的一个实施例的流程200。该用于分析情感的方法包括以下步骤:
步骤201,响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合。
在本实施例中,用于分析情感的方法的执行主体(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式,从通信连接的终端设备获取到针对目标物品的评论文本。其中,上述评论文本通常是用于对物品进行评论的信息。作为示例,上述评论文本可以是“这款手机的质量没得说”,也可以是“The resolution of the phone is veryhigh”。上述目标物品可以是指定物品信息所指示的物品。上述指定物品信息可以是技术人员预先指定的应用(如,购物类应用)中的物品信息。
在获取到评论文本后,执行主体可以采用现有技术或未来发展的技术中用于切分评论文本的技术对上述评论文本进行切分,本申请对此不做限定。例如,执行主体可以采用最短路径分词法(N-Short Path)对上述评论文本进行切分。再例如,执行主体也可以采用最大概率分词法(Maximum Probability)对上述评论文本进行切分。再例如,执行主体还可以采用最大匹配法(Maximum Matching)对上述评论文本进行切分。这里,执行主体对上述评论文本进行切分之后,可以得到对应于该评论文本的切分词集合。其中,上述切分词为对该评论文本进行切分后得到的词。举例来说,若评论文本为:“分辨率很高”,对该评论文本进行切分后,得到的切分词可以为:“分辨率”、“很高”。
步骤202,将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合。
其中,上述预设词汇集合中的预设词汇可以是技术人员预先设定的用于描述物品的属性的词汇。作为示例,上述词汇可以是“分辨率”、“价格”、“质量”等。
在本实施例中,执行主体可以将所得到的切分词集合中的每个切分词,与预设词汇集合中的预设词汇进行比较,以确定预设词汇集合中是否存在与切分词匹配的预设词汇。具体地,对于切分词集合中的任一切分词,可以将该切分词与预设词汇集合中的各预设词汇进行逐一比较。若预设词汇集合中存在某一预设词汇与该切分词相匹配,则可以将该切分词确定为目标词汇。反之,则可以将该切分词确定为非目标词汇。
需要指出的是,预设词汇与切分词相匹配,可以是指二者相同,也可以是指二者相应。作为示例,若预设词汇是“价格”,切分词是“价钱”,则可以认为预设词汇与切分词相应。此时,预设词汇与切分词相匹配。
在本实施例中,切分词集合中的所有被确定为目标词汇的切分词,可以组合成目标词汇集合。切分词集合中的所有被确定为非目标词汇的切分词,可以组合成非目标词汇集合。
步骤203,基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合。
在本实施例中,上述执行主体可以通过如下步骤确定对应于上述评论文本的情感信息集合:首先,将目标词汇的向量、上述评论文本中位于该目标词汇与下一目标词汇之间的非目标词汇的向量,组合形成新向量。然后,将新向量输入预先训练的、用于确定向量的情感信息的神经网络模型,得到针对该目标词汇的情感信息,存入情感信息集合。
作为示例,若评论文本为“价格实惠,但是质量不好”,可以得到切分词集合为{价格,实惠,但是,质量,不好},目标词汇集合为{价格,质量},非目标词汇集合为{实惠,但是,不好}。若“价格”的向量为V1,“实惠”的向量为V2,“但是”的向量为V3,“质量”的向量为V4,“不好”的向量为V5。此时,可以将V1、V2和V3组合成新向量,输入预先训练的、用于确定向量的情感信息的神经网络模型,得到针对“价格”的情感信息。以及可以将V4和V5组合成新向量,输入预先训练的、用于确定向量的情感信息的神经网络模型,得到针对“质量”的情感信息。
其中,由目标词汇的向量和非目标词汇的向量所组合成的新向量,可以是具有指定维度的向量。作为示例,若目标词汇的向量为(1,1,1),非目标词汇的向量为(1,1,0),新向量的指定维度为8,则组合成的新向量可以为(1,1,1,1,1,0,0,0)。
在本实施例中,评论文本对应的目标词汇集合中的每个目标词汇,具有情感信息,且目标词汇集合中的目标词汇的数目,与情感信息集合中的情感信息的数目一致。另外,与将评论文本作为整体来获取该评论文本所表达的情感相比,本实施例从各个目标词汇的角度来获取该评论文本所表达的情感,可以获取到更加准确细致的感情信息。
在本实施例中,执行主体可以采用预先制定的对应关系表来确定各目标词汇的向量。其中,上述对应关系表可以是技术人员基于对大量的目标词汇和向量统计而预先制定的、存储有多个目标词汇与向量的对应关系的对应关系表。另外,执行主体还可以采用word2vec模型确定各目标词汇分别对应的向量。其中,word2vec模型用于表征词与对应于词的向量的对应关系。另外,非目标词汇的向量的确定方式与目标词汇的向量的确定方式基本相同,这里不做赘述。
在本实施例中,每一个评论文本对应一个情感信息集合。执行主体在得到评论文本的情感信息集合后,会将所得到的情感信息集合进行存储。
步骤204,基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合。
在本实施例中,针对一个目标物品,通常有至少一个评论文本,针对每个评论文本可以得到一个情感信息集合。情感信息集合中的每条情感信息包括:目标词汇和与该目标词汇关联的情感类型信息。
这里,执行主体可以通过如下方式确定目标物品的评论关联信息集合:将每个情感信息集合中的情感信息,作为评论关联信息,以及将评论关联信息,按照对应评论文本所产生的时间先后顺序存入对应于目标物品的评论关联信息集合。
步骤205,向与目标物品相关联的第一终端设备发送评论关联信息集合。
在本实施例中,执行主体可以通过有线连接方式或者无线连接方式,将评论关联信息集合发送给与上述目标物品相关联的第一终端设备。其中,上述与物品相关联通常是指与物品的物品信息相关联。物品的物品信息可以是用于描述物品的各种信息。其中,上述第一终端设备通常关联于售卖方身份标识。
需要指出的是,将针对物品的评论关联信息集合发送给与物品相关联的第一终端设备,可以实现将信息有针对性地推送,有助于节约网络流量。同时可以实现售卖方通过第一终端设备,查看到其所售卖的物品的多个角度的评论情感,从而实现售卖方可以结合所查看到的评论情感,有针对性地对所售卖的物品进行改进。举例来说,若售卖方通过第一终端设备发现针对其所售卖的手机的分辨率的评论关联信息中,对应于极负向情感的第一类型的情感类型信息的出现频率很高,则可以针对所售卖的手机的分辨率进行改进。
在本公开的各个实施例的可选的实现方式中,上述执行主体还可以通过如下步骤确定对应于上述评论文本的情感信息集合:
第一步:基于目标词汇集合对应的向量集合,确定第一特征向量集合,以及基于非目标词汇集合对应的向量集合,确定第二特征向量集合。
其中,上述第一特征向量通常是用于描述目标词汇的特征的向量。一个目标词汇对应一个第一特征向量。上述第二特征向量通常是用于描述非目标词汇的特征的向量。一个非目标词汇对应一个第二特征向量。其中,上述目标词汇集合对应的向量集合,为目标词汇集合中的各目标词汇的向量所组成的集合。上述非目标词汇集合对应的向量集合,为非目标词汇集合中的各非目标词汇的向量所组成的集合。
本实现方式中,执行主体可以采用如下方式,实现基于目标词汇集合对应的向量集合,确定第一特征向量集合:执行主体可以采用目标词汇的向量,从向量-特征向量对应关系表中,查找到对应于目标词汇的向量的特征向量,将所查找到的特征向量作为第一特征向量。其中,上述向量-特征向量对应关系表,可以是执行主体预先建立的、存储有向量和对应于向量的特征向量的对应关系的对应关系表。
可选地,执行主体还可以通过如下方式实现基于目标词汇集合对应的向量集合,确定第一特征向量集合:将目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于目标词汇集合的特征向量集合,将所得到的特征向量集合作为第一特征向量集合。其中,特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系。
作为示例,上述双向神经网络模型,可以为双向长短时记忆循环神经网络模型(简称,Bi-LSTM模型)。
需要指出的是,采用双向神经网络模型将目标词汇集合对应的向量集合转换成第一特征向量集合,可以对目标词汇的上下文进行分析,可以得到对目标词汇进行准确描述的特征向量。有助于提高后续所获取的针对目标词汇的情感信息的准确性。
需要指出的是,基于非目标词汇集合对应的向量集合,确定第二特征向量集合的方式,与上述基于目标词汇集合对应的向量集合,确定第一特征向量集合的方式基本相同,这里不做赘述。
第二步,遍历第一特征向量集合中的第一特征向量,以及在访问当前第一特征向量时,执行以下情感确定步骤:首先,基于第二特征向量集合生成对应于当前第一特征向量的特征矩阵。然后,将所生成的特征矩阵输入预先训练的情感识别模型,得到对应于所生成的特征矩阵的情感类型信息。最后,将所得到的情感类型信息与当前第一特征向量所对应的目标词汇关联后存入情感信息集合。
其中,上述特征矩阵可以是用于描述第一特征向量所对应的目标词汇的特征的矩阵。上述特征矩阵的情感类型信息,可以是用于描述特征矩阵所对应的目标词汇的情感的类型的信息。可选地,上述情感的类型可以是以下一者:用于表征极负向情感的第一类型,用于表征负向情感的第二类型,用于表征中性情感的第三类型,用于表征正向情感的第四类型,用于表征极正向情感的第五类型。
本实现方式中,执行主体可以对第一特征向量集合中的每个第一特征向量执行情感确定步骤。这里,情感确定步骤包括如下的步骤一、步骤二和步骤三。
步骤一,基于第二特征向量集合生成对应于当前第一特征向量的特征矩阵。
这里,执行主体可以将当前第一特征向量与第二特征向量集合中的全部或部分第二特征向量,组合成对应于当前第一特征向量的特征矩阵。作为示例,若当前第一特征向量为A,第二特征向量集合为{B,C,D,E}。此时,可以将A与B,C,D,E一起组合成对应于A的特征矩阵[A,B,C,D,E]。
可选地,执行主体还可以通过如下方式,生成对应于当前第一特征向量的特征矩阵:
首先,遍历第二特征向量集合中的第二特征向量,以及在访问当前第二特征向量时,执行以下权重确定步骤:先确定当前第二特征向量与当前第一特征向量的权重值。再根据所确定的权重值,得到对应于当前第二特征向量的权重向量,存入权重向量集合。
这里,执行主体可以采用权重值计算公式,计算当前第二特征向量与当前第一特征向量的权重值。
可选地,上述权重值计算公式可以为:
其中,为第i个第一特征向量,hj为第j个第二特征向量,×为内积运算符,e为自然指数,÷为除号,∑为求和符号,N为第二特征向量集合中的第二特征向量的总数目。hk为第k个第二特征向量,k的取值范围为(1,N)。score(hj)为第j个第二特征向量与第i个第一特征向量之间的权重值。其中,i的取值范围为(1,M),j的取值范围为(1,N)。M为第一特征向量集合中的第一特征向量的总数目。
可选地,上述权重值计算公式还可以为:
其中,mj为第j个第二特征向量所对应的切分词在评论文本中的序号,mi为第i个第一特征向量所对应的切分词在评论文本中的序号,-为减号,C为预先设定的常数,δ为第二特征向量集合中的所有第二特征向量对应的所有序号的标准差。e为自然指数。score(hj)为第j个第二特征向量与第i个第一特征向量之间的权重值。其中,i的取值范围为(1,M),j的取值范围为(1,N)。M为第一特征向量集合中的第一特征向量的总数目,N为第二特征向量集合中的第二特征向量的总数目。
在采用权重值计算公式得到当前第二特征向量与当前第一特征向量的权重值之后,执行主体可以采用所得到的权重值和当前第二特征向量,计算得到对应于当前第二特征向量的权重向量。作为示例,上述执行主体可以采用所得到的权重值乘以当前第二特征向量,以得到对应于当前第二特征向量的权重向量。之后,执行主体可以将所得到的对应于当前第二特征向量的权重向量,存入权重向量集合。
然后,根据权重向量集合生成特征矩阵。
这里,执行主体可以直接将权重向量集合中的权重向量组合成矩阵,作为上述特征矩阵。执行主体也可以将权重向量集合中的权重向量组合成指定维度的矩阵,作为上述特征矩阵。上述指定维度可以是技术人员预先设定的数据值。
作为示例,若权重向量集合为{A,B,C},此时可以将权重向量集合中的所有权重向量组合成矩阵[A,B,C]。若预先指定有矩阵的指定维度为4,此时,也可以将权重向量集合中的所有权重向量组合成[A,B,C,0]。
需要指出的是,针对每个第一特征向量,计算该第一特征向量与第二特征向量集合中的每个第二特征向量的权重值,可以得到针对同一第一特征向量的多个权重值。由于一个目标词汇对应一个第一特征向量,一个非目标词汇对应一个第二特征向量。第一特征向量与第二特征向量之间的权重值,可以反映相应的目标词汇和非目标词汇之间的影响情况。对应于权重值的权重向量,可以反映非目标词汇对目标词汇的影响情况。由权重向量集合所生成的特征矩阵,可以实现通过评论文本中的所有非目标词汇分别对某一目标词汇的影响情况,确定该目标词汇在评论文本中的更真实的情感。有助于提高后续所获取的针对目标词汇的情感信息的准确性。
步骤二,将所生成的特征矩阵输入预先训练的情感识别模型,得到对应于所生成的特征矩阵的情感类型信息。
其中,上述情感识别模型可以用于表征特征矩阵与对应于特征矩阵的情感类型信息的对应关系。
具体的,情感识别模型可以是基于对大量特征矩阵和情感类型信息进行统计而生成的、存储有多个特征矩阵与情感类型信息的对应关系的对应关系表,也可以是基于训练样本,利用机器学习方法,对初始模型(例如卷积神经网络(Convolutional NeuralNetwork,CNN)、残差网络(ResNet)等)进行训练后得到的模型。
步骤三,将所得到的情感类型信息与当前第一特征向量所对应的目标词汇关联后存入情感信息集合。
这里,执行主体可以将所得到的情感类型信息与当前第一特征向量所对应的目标词汇进行关联,以及将关联后的情感类型信息和目标词汇存入情感信息集合。需要指出的是,上述情感信息集合在缺省情况下为空集。
需要指出的是,本实现方式通过获取每个目标词汇对应的特征矩阵,从而将所获得的特征矩阵输入情感识别模型,以得到目标词汇的情感类型信息。这样,针对每个评论文本的目标词汇集合中的每个目标词汇,可以得到一个对应的情感类型信息。与将评论文本作为整体来获取该评论文本所表达的情感相比,本实施例从各个目标词汇的角度来获取该评论文本所表达的情感,可以获取到该评论文本的更加准确细致的感情信息。
在本公开的各个实施例的可选的实现方式中,执行主体还可以通过如下方式确定目标物品的评论关联信息集合:
第一步,提取针对目标物品的至少一个情感信息集合,以及提取至少一个情感信息集合中的目标词汇,将提取的目标词汇作为待分析词汇,存入待分析词汇集合。
本实现方式中,针对同一物品,通常可以具有多个评论文本。每个评论文本可以具有情感信息集合。情感信息集合中存储有多条关联的目标词汇和对应于目标词汇的情感类型信息。
执行主体可以提取出针对目标物品的多个情感信息集合。然后提取出多个情感信息集合中的所有的目标词汇,这样,可以得到针对上述目标物品的待分析词汇集合。
作为示例,若针对目标物品,具有3个评论文本,则可以提取到对应于3个评论文本的3个情感信息集合。若3个情感信息集合中,第一个情感信息集合中存储有目标词汇甲和对应于甲的情感类型信息A,以及存储有目标词汇乙和对应于乙的情感类型信息B。第二个情感信息集合中存储有目标词汇甲和对应于甲的情感类型信息A。第三个情感信息集合中存储有目标词汇乙和对应于乙的情感类型信息C,存储有目标词汇丙和对应于丙的情感类型信息C,以及存储有目标词汇丁和对应于丁的情感类型信息D。则可以从3个情感信息集合中提取到目标词汇甲、乙、丙、丁。此时,待分析词汇集合为{甲,乙,丙,丁}。
第二步,遍历待分析词汇集合中的待分析词汇,在访问当前待分析词汇时,执行如下汇总步骤:从至少一个情感信息集合中提取与当前待分析词汇相匹配的至少一类情感类型信息;确定所提取的各类情感类型信息的出现次数;将关联后的当前待分析词汇对应的目标词汇、所提取的至少一类情感类型信息以及所提取的各类情感类型信息的出现次数,作为评论关联信息,存入对应于物品的评论关联信息集合。
本实现方式中,执行主体可以针对每个待分析词汇,执行如下汇总步骤。
首先,从多个情感信息集合中提取与当前待分析词汇相匹配的至少一类情感类型信息。这里,执行主体可以采用当前待分析词汇,从每个情感信息集合中查找与当前待分析词汇相同或相应的目标词汇,以及将所查找到的目标词汇所关联的情感类型信息提取出。
然后,确定所提取的各类情感类型信息的出现次数。这里,执行主体可以在提取到与当前待分析词汇相匹配的至少一类情感类型信息后,计算各类情感类型信息的出现次数。
作为示例,若当前待分析词汇为乙。具有3个情感信息集合,第一个情感信息集合中存储有目标词汇甲和对应于甲的情感类型信息A,以及存储有目标词汇乙和对应于乙的情感类型信息B。第二个情感信息集合中存储有目标词汇甲和对应于甲的情感类型信息A。第三个情感信息集合中存储有目标词汇乙和对应于乙的情感类型信息C,存储有目标词汇丙和对应于丙的情感类型信息C,以及存储有目标词汇丁和对应于丁的情感类型信息D。则可以从3个情感信息集合中提取到针对当前待分析词汇乙的两类情感类型信息,分别为B和C。此时,可以得到所提取的B类情感类型信息的出现次数为1,以及C类情感类型信息的出现次数为1。
最后,将当前待分析词汇对应的目标词汇、所提取的至少一类情感类型信息以及所提取的各类情感类型信息的出现次数,关联后存入对应于目标物品的评论关联信息集合。这里,执行主体可以将当前待分析词汇对应的目标词汇、所提取的至少一类情感类型信息、所提取的各类情感类型信息的出现次数,进行关联,以及将关联后的目标词汇、所提取的至少一类情感类型信息、所提取的各类情感类型信息的出现次数,作为评论关联信息,存入对应于目标物品的评论关联信息集合。需要指出的是,上述评论关联信息集合在缺省情况下为空集。
作为示例,若当前待分析词汇为乙,当前待分析词汇为乙对应目标词汇乙,提取到了两类情感类型信息,分别为B和C,且B类情感类型信息的出现次数为1,以及C类情感类型信息的出现次数为1。则此时,存入评论关联信息集合中的信息可以为:乙:B类情感类型信息1条,C类情感类型信息1条。
需要指出的是,本实现方式对多个情感信息集合中所存储的每个目标词汇,统计该目标词汇的每类情感类型信息的出现次数,从而将目标词汇、目标词汇的情感类型、该类情感类型的出现次数关联后,作为评论关联信息,存入对应于目标物品的评论关联信息集合。与直接将多个情感信息集合中的每个情感信息作为评论关联信息,存入对应于目标物品的评论关联信息集合相比,前者所得到的评论关联信息集合的大小,要远小于后者所得到的评论关联信息集合大小。由于本实现方式能够实现得到较小的评论关联信息集合,故而可以在将评论关联信息集合发送给第一终端设备时,节省网络流量的消耗。
继续参见图3,图3是根据本实施例的用于分析情感的方法的应用场景300的一个示意图。在图3的应用场景中,用户301向终端设备302输入了针对某一手机的评论:“价格实惠,但是质量不好”。此时,终端设备302可以将用户所输入的“价格实惠,但是质量不好”,作为针对上述手机的评论文本,发送至服务器303。这样,服务器303可以接收到评论文本“价格实惠,但是质量不好”。
首先,服务器303可以对评论文本进行切分,得到切分词集合{价格,实惠,但是,质量,不好}。
然后,服务器303可以将切分词集合{价格,实惠,但是,质量,不好}与预设词汇集合{价格,质量,分辨率,售后,快递}进行比较,得到与预设词汇集合{价格,质量,分辨率,售后,快递}相匹配的“价格”和“质量”。此时,可以得到目标词汇集合{价格,质量},以及得到非目标词汇集合{实惠,但是,不好}。
之后,服务器303可以基于目标词汇集合{价格,质量}和非目标词汇集合{实惠,但是,不好},得到针对目标词汇“价格”的情感信息Q1,以及得到针对目标词汇“质量”的情感信息Q2。此时,针对目标词汇“价格”的情感信息和针对目标词汇“质量”的情感信息,可以组合成对应于评论文本“价格实惠,但是质量不好”的情感信息集合{Q1,Q2}。
接着,基于上述手机所对应的情感信息集合{Q1,Q2},提取出已得到的针对上述手机的另外两个情感信息集合{Q3}和情感信息集合{Q4,Q5,Q6},得到该手机的评论关联信息集合{Q1,Q2,Q3,Q4,Q5,Q6}。
最后,将评论关联信息集合{Q1,Q2,Q3,Q4,Q5,Q6}发送给与上述手机相关联的第一终端设备304,以通过第一终端设备304实现将针对上述手机的评论关联信息集合{Q1,Q2,Q3,Q4,Q5,Q6},呈现给该手机的售卖方305。
本公开的上述实施例提供的用于分析情感的方法,可以响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合。然后,将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合。之后,基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合。接着,基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合。最后,向与目标物品相关联的第一终端设备发送评论关联信息集合。本实施例的方法,通过分析对应于评论文本的目标词汇集合和非目标词汇集合,得到对应于评论文本的情感信息集合,实现得到评论文本所表达的情感。另外,将对目标物品进行整体评价的评论关联信息集合,发送给与目标物品关联的第一终端设备,可以实现目标物品的售卖方及时获取到购买方针对目标物品的评价情况,有助于实现信息的有针对性发送,有助于节约网络流量。
进一步参考图4,其示出了用于分析情感的方法的又一个实施例的流程400。该用于分析情感的方法的流程400包括以下步骤:
步骤401,响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合。
步骤402,将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合。
步骤403,基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合。
步骤404,基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合。
步骤405,向与目标物品相关联的第一终端设备发送评论关联信息集合。
在本实施例中,步骤401-405的具体操作与图2所示的实施例中步骤201-205的操作基本相同,在此不再赘述。
步骤406,响应于接收到第二终端设备发送的查询请求,查询请求包括待查询词汇。
在本实施例中,执行主体可以通过有线连接方式或者无线连接方式,接收到第二终端设备发送的查询请求。其中,查询请求包括待查询词汇。其中,上述第二终端设备通常是关联于购买方身份标识的终端设备。
步骤407,从多个物品所对应的多个评论关联信息集合中,确定存在与待查询词汇相匹配的目标词汇的评论关联信息集合。
在本实施例中,针对同一物品,通常可以具有多个评论文本。每个评论文本可以具有情感信息集合。情感信息集合中的每条情感信息包括:目标词汇和与该目标词汇关联的情感类型信息。该物品的多个情感信息集合中的所有情感信息汇总后,可以得到该物品的评论关联信息集合。每个物品对应一个评论关联信息集合。
执行主体可以从多个物品所对应的多个评论关联信息集合中,筛选出存在与待查询词汇相匹配的目标词汇的评论关联信息集合。其中,上述与待查询词汇相匹配,可以是二者相同,也可以是二者相应。
作为示例,若待查询词汇为“质量”,有3个评论关联信息集合,第一个评论关联信息集合中存在“质量”这一目标词汇,第二个评论关联信息集合中也存在“质量”这一目标词汇,且第三个评论关联信息集合中不存在“质量”这一目标词汇。此时,可以筛选得到第一个评论关联信息集合和第二个评论关联信息集合。
步骤408,根据所确定的评论关联信息集合中的相匹配的目标词汇的各类情感类型信息的出现次数,筛选所确定的评论关联信息集合,将筛选后的评论关联信息集合所对应的物品的物品信息推送给第二终端设备。
在本实施例中,执行主体可以从第二步中得到经过第一轮筛选后得到的一个或多个评论关联信息集合。然后,可以从所得到的一个或多个评论关联信息集合中,根据各评论关联信息集合中的相匹配的目标词汇的各类情感类型信息的出现次数,对经过第一轮筛选后得到的一个或多个评论关联信息集合进行第二轮筛选。
作为示例,第二轮筛选过程中,执行主体可以从各评论关联信息集合中,筛选出某一类情感类型信息的出现次数最多的评论关联信息集合。举例来说,若待查询词汇为“质量”,经过第一轮筛选后得到了两个评论关联信息集合,第一个评论关联信息集合中,针对“质量”这一目标词汇的各类情感类型信息中,对应于极正向情感的第五类型的情感类型信息的出现次数为2482。第二个评论关联信息集合中,针对“质量”这一目标词汇的各类情感类型信息中,对应于极正向情感的第五类型的情感类型信息的出现次数为1377。此时,执行主体可以筛选得到第一个评论关联信息集合。
作为另一示例,执行主体也可以从各评论关联信息集合中,筛选出某一类情感类型信息的出现次数最少的评论关联信息集合。还可以从各评论关联信息集合中,筛选出某一类情感类型信息的出现次数大于某个次数阈值的评论关联信息集合。
之后,执行主体可以通过有线连接方式或者无线连接方式,将经过二次筛选得到的评论关联信息集合所关联的物品的物品信息,推送给上述第二终端设备。
从图4中可以看出,与图2对应的实施例相比,本实施例中的用于分析情感的方法的流程400突出了向第二终端设备推送针对待查询词汇的物品信息的步骤。由此,本实施例描述的方案,通过将针对待查询词汇的物品信息推送给第一终端设备,可以实现将信息有针对性地推送。同时,由于向第二终端设备推送的物品信息为经过两次筛选所得到的物品信息,所推送的物品信息的数目更少且更加准确,有助于提高信息推送的准确率,且有助于减少推送信息所消耗的网络流量。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了一种用于分析情感的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于分析情感的装置500包括:文本切分单元501,被配置成响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合;词汇分类单元502,被配置成将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合;情感确定单元503,被配置成基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合;第一确定单元504,被配置成基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合;第一推送单元505,被配置成向与目标物品相关联的第一终端设备发送评论关联信息集合。
在本实施例的一些可选的实现方式中,上述情感确定单元,可以被进一步配置成:第一步,基于目标词汇集合对应的向量集合,确定第一特征向量集合,以及基于非目标词汇集合对应的向量集合,确定第二特征向量集合。第二步,遍历第一特征向量集合中的第一特征向量,以及在访问当前第一特征向量时,执行以下情感确定步骤:首先,基于第二特征向量集合生成对应于当前第一特征向量的特征矩阵。然后,将所生成的特征矩阵输入预先训练的情感识别模型,得到对应于所生成的特征矩阵的情感类型信息。最后,将所得到的情感类型信息与当前第一特征向量所对应的目标词汇关联后存入情感信息集合。
在本实施例的一些可选的实现方式中,基于目标词汇集合对应的向量集合,确定第一特征向量集合包括:将目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于目标词汇集合的特征向量集合,将所得到的特征向量集合作为第一特征向量集合。其中,特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系。以及基于非目标词汇集合对应的向量集合,确定第二特征向量集合包括:将非目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于非目标词汇集合的特征向量集合,将所得到的特征向量集合作为第二特征向量集合。其中,特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系。
在本实施例的一些可选的实现方式中,基于第二特征向量集合生成对应于当前第一特征向量的特征矩阵包括:第一步,遍历第二特征向量集合中的第二特征向量,以及在访问当前第二特征向量时,执行以下权重确定步骤:首先,确定当前第二特征向量与当前第一特征向量的权重值。然后,根据所确定的权重值,得到对应于当前第二特征向量的权重向量,存入权重向量集合。第二步,根据权重向量集合生成特征矩阵。
在本实施例的一些可选的实现方式中,第一确定单元504可以被进一步配置成:第一步,提取针对目标物品的至少一个情感信息集合,以及提取至少一个情感信息集合中的目标词汇,将提取的目标词汇作为待分析词汇,存入待分析词汇集合。第二步,遍历待分析词汇集合中的待分析词汇,在访问当前待分析词汇时,执行如下汇总步骤:首先,从至少一个情感信息集合中提取与当前待分析词汇相匹配的至少一类情感类型信息。然后,确定所提取的各类情感类型信息的出现次数。最后,将当前待分析词汇对应的目标词汇、所提取的至少一类情感类型信息以及所提取的各类情感类型信息的出现次数,关联后存入对应于物品的评论关联信息集合。
在本实施例的一些可选的实现方式中,上述装置还可以包括查询接收单元、第二确定单元和第二推送单元(图中未示出)。其中,查询接收单元,可以被配置成响应于接收到第二终端设备发送的查询请求,查询请求包括待查询词汇。第二确定单元,可以被配置成从多个物品所对应的多个评论关联信息集合中,确定存在与待查询词汇相匹配的目标词汇的评论关联信息集合。第二推送单元,可以被配置成根据所确定的评论关联信息集合中的相匹配的目标词汇的各类情感类型信息的出现次数,筛选所确定的评论关联信息集合,将筛选后的评论关联信息集合所对应的物品的物品信息推送给第二终端设备。
本公开的上述实施例提供的装置,文本切分单元501响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合。然后,词汇分类单元502将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合。之后,情感确定单元503基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合。接着,第一确定单元504基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合。最后,第一推送单元505向与目标物品相关联的第一终端设备发送评论关联信息集合。本实施例的装置,通过分析对应于评论文本的目标词汇集合和非目标词汇集合,得到对应于评论文本的情感信息集合,实现得到评论文本所表达的情感。另外,将对目标物品进行整体评价的评论关联信息集合,发送给与目标物品关联的第一终端设备,可以实现目标物品的售卖方及时获取到购买方针对目标物品的评价情况,有助于实现信息的有针对性发送,有助于节约网络流量。
下面参考图6,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的服务器)600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600可以包括处理装置(例如中央处理单元(CPU)、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合;将切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合;基于目标词汇集合和非目标词汇集合,确定对应于评论文本的情感信息集合;基于目标物品所对应的至少一个情感信息集合,确定目标物品的评论关联信息集合;向与目标物品相关联的第一终端设备发送评论关联信息集合。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括文本切分单元、词汇分类单元、情感确定单元、第一确定单元和第一推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,文本切分单元还可以被描述为“响应于获取到针对目标物品的评论文本,对评论文本进行切分,得到对应于评论文本的切分词集合的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种用于分析情感的方法,其中,所述方法包括:
响应于获取到针对目标物品的评论文本,对所述评论文本进行切分,得到对应于所述评论文本的切分词集合;
将所述切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将所述切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合;
基于目标词汇集合对应的向量集合,确定第一特征向量集合,以及基于非目标词汇集合对应的向量集合,确定第二特征向量集合;遍历所述第一特征向量集合中的第一特征向量,以及在访问当前第一特征向量时,执行以下情感确定步骤:遍历所述第二特征向量集合中的第二特征向量,以及在访问当前第二特征向量时,执行以下权重确定步骤:确定当前第二特征向量与当前第一特征向量的权重值;根据所确定的权重值乘以当前第二特征向量,得到对应于当前第二特征向量的权重向量,存入权重向量集合;根据权重向量集合生成特征矩阵;将所生成的特征矩阵输入预先训练的情感识别模型,得到对应于所生成的特征矩阵的情感类型信息;将所得到的情感类型信息与当前第一特征向量所对应的目标词汇关联后存入情感信息集合;
其中,权重值为:根据当前第二特征向量所对应的切分词在评论文本中的序号,当前第一特征向量所对应的切分词在评论文本中的序号,第二特征向量集合中的所有第二特征向量对应的所有序号的标准差,以及预先设定的常数所确定;
基于所述目标物品所对应的至少一个情感信息集合,确定所述目标物品的评论关联信息集合;
向与所述目标物品相关联的第一终端设备发送评论关联信息集合。
2.根据权利要求1所述的方法,其中,所述基于目标词汇集合对应的向量集合,确定第一特征向量集合包括:
将目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于目标词汇集合的特征向量集合,将所得到的特征向量集合作为第一特征向量集合,其中,所述特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系;以及
所述基于非目标词汇集合对应的向量集合,确定第二特征向量集合包括:将非目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于非目标词汇集合的特征向量集合,将所得到的特征向量集合作为第二特征向量集合,其中,所述特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系。
3.根据权利要求2所述的方法,其中,所述基于所述目标物品所对应的至少一个情感信息集合,确定所述目标物品的评论关联信息集合,包括:
提取针对所述目标物品的至少一个情感信息集合,以及提取所述至少一个情感信息集合中的目标词汇,将提取的目标词汇作为待分析词汇,存入待分析词汇集合;
遍历所述待分析词汇集合中的待分析词汇,在访问当前待分析词汇时,执行如下汇总步骤:从所述至少一个情感信息集合中提取与当前待分析词汇相匹配的至少一类情感类型信息;确定所提取的各类情感类型信息的出现次数;将当前待分析词汇对应的目标词汇、所提取的至少一类情感类型信息以及所提取的各类情感类型信息的出现次数,关联后存入对应于所述物品的评论关联信息集合。
4.根据权利要求3所述的方法,其中,所述方法还包括:
响应于接收到第二终端设备发送的查询请求,所述查询请求包括待查询词汇;
从多个物品所对应的多个评论关联信息集合中,确定存在与所述待查询词汇相匹配的目标词汇的评论关联信息集合;
根据所确定的评论关联信息集合中的相匹配的目标词汇的各类情感类型信息的出现次数,筛选所确定的评论关联信息集合,将筛选后的评论关联信息集合所对应的物品的物品信息推送给所述第二终端设备。
5.一种用于分析情感的装置,其中,所述装置包括:
文本切分单元,被配置成响应于获取到针对目标物品的评论文本,对所述评论文本进行切分,得到对应于所述评论文本的切分词集合;
词汇分类单元,被配置成将所述切分词集合中与预设词汇集合中的预设词汇相匹配的切分词确定为目标词汇,得到目标词汇集合,以及将所述切分词集合中除目标词汇之外的切分词确定为非目标词汇,得到非目标词汇集合;
情感确定单元,被配置成基于目标词汇集合对应的向量集合,确定第一特征向量集合,以及基于非目标词汇集合对应的向量集合,确定第二特征向量集合;遍历所述第一特征向量集合中的第一特征向量,以及在访问当前第一特征向量时,执行以下情感确定步骤:遍历所述第二特征向量集合中的第二特征向量,以及在访问当前第二特征向量时,执行以下权重确定步骤:确定当前第二特征向量与当前第一特征向量的权重值;根据所确定的权重值,得到对应于当前第二特征向量的权重向量,存入权重向量集合;根据权重向量集合生成特征矩阵;将所生成的特征矩阵输入预先训练的情感识别模型,得到对应于所生成的特征矩阵的情感类型信息;将所得到的情感类型信息与当前第一特征向量所对应的目标词汇关联后存入情感信息集合;
其中,权重值为:根据当前第二特征向量所对应的切分词在评论文本中的序号,当前第一特征向量所对应的切分词在评论文本中的序号,第二特征向量集合中的所有第二特征向量对应的所有序号的标准差,以及预先设定的常数所确定;
第一确定单元,被配置成基于所述目标物品所对应的至少一个情感信息集合,确定所述目标物品的评论关联信息集合;
第一推送单元,被配置成向与所述目标物品相关联的第一终端设备发送评论关联信息集合。
6.根据权利要求5所述的装置,其中,所述基于目标词汇集合对应的向量集合,确定第一特征向量集合包括:
将目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于目标词汇集合的特征向量集合,将所得到的特征向量集合作为第一特征向量集合,其中,所述特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系;以及
所述基于非目标词汇集合对应的向量集合,确定第二特征向量集合包括:将非目标词汇集合对应的向量集合,输入预先构建的特征提取模型,得到对应于非目标词汇集合的特征向量集合,将所得到的特征向量集合作为第二特征向量集合,其中,所述特征提取模型为双向神经网络模型,用于表征向量集合与对应于向量集合的特征向量集合的对应关系。
7.根据权利要求5所述的装置,其中,所述第一确定单元被进一步配置成:
提取针对所述目标物品的至少一个情感信息集合,以及提取所述至少一个情感信息集合中的目标词汇,将提取的目标词汇作为待分析词汇,存入待分析词汇集合;
遍历所述待分析词汇集合中的待分析词汇,在访问当前待分析词汇时,执行如下汇总步骤:从所述至少一个情感信息集合中提取与当前待分析词汇相匹配的至少一类情感类型信息;确定所提取的各类情感类型信息的出现次数;将当前待分析词汇对应的目标词汇、所提取的至少一类情感类型信息以及所提取的各类情感类型信息的出现次数,关联后存入对应于所述物品的评论关联信息集合。
8.根据权利要求7所述的装置,其中,所述装置还包括:
查询接收单元,被配置成响应于接收到第二终端设备发送的查询请求,所述查询请求包括待查询词汇;
第二确定单元,被配置成从多个物品所对应的多个评论关联信息集合中,确定存在与所述待查询词汇相匹配的目标词汇的评论关联信息集合;
第二推送单元,被配置成根据所确定的评论关联信息集合中的相匹配的目标词汇的各类情感类型信息的出现次数,筛选所确定的评论关联信息集合,将筛选后的评论关联信息集合所对应的物品的物品信息推送给所述第二终端设备。
9.一种电子设备包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-4中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910505075.8A CN111814483B (zh) | 2019-06-12 | 2019-06-12 | 用于分析情感的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910505075.8A CN111814483B (zh) | 2019-06-12 | 2019-06-12 | 用于分析情感的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111814483A CN111814483A (zh) | 2020-10-23 |
CN111814483B true CN111814483B (zh) | 2024-04-12 |
Family
ID=72844621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910505075.8A Active CN111814483B (zh) | 2019-06-12 | 2019-06-12 | 用于分析情感的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111814483B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107066449A (zh) * | 2017-05-09 | 2017-08-18 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
CN108153856A (zh) * | 2017-12-22 | 2018-06-12 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN108427670A (zh) * | 2018-04-08 | 2018-08-21 | 重庆邮电大学 | 一种基于语境词向量和深度学习的情感分析方法 |
CN109271627A (zh) * | 2018-09-03 | 2019-01-25 | 深圳市腾讯网络信息技术有限公司 | 文本分析方法、装置、计算机设备和存储介质 |
CN109271512A (zh) * | 2018-08-29 | 2019-01-25 | 中国平安保险(集团)股份有限公司 | 舆情评论信息的情感分析方法、装置及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10810472B2 (en) * | 2017-05-26 | 2020-10-20 | Oracle International Corporation | Techniques for sentiment analysis of data using a convolutional neural network and a co-occurrence network |
-
2019
- 2019-06-12 CN CN201910505075.8A patent/CN111814483B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107066449A (zh) * | 2017-05-09 | 2017-08-18 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
CN108153856A (zh) * | 2017-12-22 | 2018-06-12 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN108427670A (zh) * | 2018-04-08 | 2018-08-21 | 重庆邮电大学 | 一种基于语境词向量和深度学习的情感分析方法 |
CN109271512A (zh) * | 2018-08-29 | 2019-01-25 | 中国平安保险(集团)股份有限公司 | 舆情评论信息的情感分析方法、装置及存储介质 |
CN109271627A (zh) * | 2018-09-03 | 2019-01-25 | 深圳市腾讯网络信息技术有限公司 | 文本分析方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
基于情感词向量和BLSTM的评论文本情感倾向分析;邓楠;余本功;;计算机应用研究;20171212(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111814483A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108776787B (zh) | 图像处理方法及装置、电子设备、存储介质 | |
US20210232761A1 (en) | Methods and systems for improving machine learning performance | |
CN107679211B (zh) | 用于推送信息的方法和装置 | |
CN106951484B (zh) | 图片检索方法及装置、计算机设备及计算机可读介质 | |
CN107590255B (zh) | 信息推送方法和装置 | |
US11741094B2 (en) | Method and system for identifying core product terms | |
CN111061881A (zh) | 文本分类方法、设备及存储介质 | |
CN110084658B (zh) | 物品匹配的方法和装置 | |
CN111538837A (zh) | 用于分析企业经营范围信息的方法和装置 | |
CN111078842A (zh) | 查询结果的确定方法、装置、服务器及存储介质 | |
CN107291774B (zh) | 错误样本识别方法和装置 | |
CN111105294A (zh) | 一种vr导览方法、系统、客户端、服务器及其存储介质 | |
CN111078849B (zh) | 用于输出信息的方法和装置 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN110929499B (zh) | 文本相似度获取方法、装置、介质及电子设备 | |
CN111949837A (zh) | 信息处理方法、装置、电子设备以及存储介质 | |
CN111625619B (zh) | 查询省略方法、装置、计算机可读介质及电子设备 | |
CN111814483B (zh) | 用于分析情感的方法和装置 | |
CN113360672B (zh) | 用于生成知识图谱的方法、装置、设备、介质和产品 | |
CN110827101A (zh) | 一种店铺推荐的方法和装置 | |
CN109857838B (zh) | 用于生成信息的方法和装置 | |
CN114297380A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN112148751B (zh) | 用于查询数据的方法和装置 | |
CN110377824B (zh) | 信息推送方法、装置、计算机可读存储介质及电子设备 | |
CN111274383B (zh) | 一种应用于报价的分类对象方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |