CN105718543B - 语句的展示方法和装置 - Google Patents

语句的展示方法和装置 Download PDF

Info

Publication number
CN105718543B
CN105718543B CN201610031469.0A CN201610031469A CN105718543B CN 105718543 B CN105718543 B CN 105718543B CN 201610031469 A CN201610031469 A CN 201610031469A CN 105718543 B CN105718543 B CN 105718543B
Authority
CN
China
Prior art keywords
word
sentence
dimension
affective style
emotion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610031469.0A
Other languages
English (en)
Other versions
CN105718543A (zh
Inventor
辛愿
方亮
张得俊
孙大伟
荆彦青
张俊峰
姚鼎
巩宁宁
胡京茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610031469.0A priority Critical patent/CN105718543B/zh
Publication of CN105718543A publication Critical patent/CN105718543A/zh
Application granted granted Critical
Publication of CN105718543B publication Critical patent/CN105718543B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Abstract

本发明公开了一种语句的展示方法和装置。该方法包括:获取待处理语句中具有修饰关系的词语对,其中,词语对包括被修饰词语和修饰词语;从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性;以及将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为待处理语句的语义信息进行展示。本发明解决了相关技术针对语句中包含多个实体对象,且每个实体对象的情感极性不相同的情况,无法针对每个实体对象的情感极性进行分析判断,导致降低语句语义分析准确度的技术问题。

Description

语句的展示方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种语句的展示方法和装置。
背景技术
随着互联网技术的快速发展,网络评论已经成为用户表达观点和情感的主要方式,对用户的网络评论进行情感分析能够获知用户的情感极性。情感分析具有多方面的应用,比如,利用情感分析可以快速地了解用户对某款产品的评价,并发现产品的缺点和问题;利用情感分析可以快速地了解市场对某个企业或者某个行业的看法和评价。情感分析在社会公共安全、商务智能或者社会舆情等领域具有十分重要的应用价值。
但是,相关技术中的情感分析方法大多只能分析一条语句、一段文本或者一篇文章的整体情感分值,对于一条语句、一段文本或者一篇文章中包含多个实体对象,且每个实体对象的情感极性不相同的情况,无法针对每个实体对象的情感极性进行分析判断,大大降低了语句的语义分析的准确度。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语句的展示方法和装置,以至少解决相关技术针对语句中包含多个实体对象,且每个实体对象的情感极性不相同的情况,无法针对每个实体对象的情感极性进行分析判断,导致降低语句语义分析准确度的技术问题。
根据本发明实施例的一个方面,提供了一种语句的展示方法,包括:获取待处理语句中具有修饰关系的词语对,其中,词语对包括被修饰词语和修饰词语;从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性,其中,维度库中包括至少一个实体维度词,每个实体维度词表示一个维度,情感词库中包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感;以及将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为待处理语句的语义信息进行展示。
根据本发明实施例的另一方面,还提供了一种语句的展示装置,包括:第一获取模块,用于获取待处理语句中具有修饰关系的词语对,其中,词语对包括被修饰词语和修饰词语;查找模块,用于从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性,其中,维度库中包括至少一个实体维度词,每个实体维度词表示一个维度,情感词库中包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感;以及展示模块,用于将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为待处理语句的语义信息进行展示。
在本发明实施例中,采用获取待处理语句中具有修饰关系的词语对,其中,词语对包括被修饰词语和修饰词语;从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性,其中,维度库中包括至少一个实体维度词,每个实体维度词表示一个维度,情感词库中包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感;以及将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为待处理语句的语义信息进行展示的方式,通过语句中的修饰关系获取语句中的多个维度实体,分别对每个维度实体的情感极性进行分析,达到了多方面多维度分析情感极性的目的,从而实现了提高情感分析准确度的技术效果,进而解决了相关技术针对语句中包含多个实体对象,且每个实体对象的情感极性不相同的情况,无法针对每个实体对象的情感极性进行分析判断,导致降低语句语义分析准确度的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种语句的展示方法的计算机终端的硬件结构框图;
图2是根据本发明实施例的语句的展示方法的流程图;
图3是根据本发明实施例的维度库与情感词库之间对应关系的示意图;
图4是根据本发明实施例的语句的展示方法应用于分析游戏评论的展示效果的示意图;
图5是根据本发明实施例的一种可选地语句的展示方法的流程图;
图6是根据本发明实施例的另一种可选地语句的展示方法的流程图;
图7是根据本发明实施例的另一种可选地语句的展示方法的流程图;
图8是根据本发明实施例的另一种可选地语句的展示方法的流程图;
图9是根据本发明实施例的游戏口碑分析方法的流程图;
图10是根据本发明实施例的语句的展示装置的示意图;
图11是根据本发明实施例的一种可选地语句的展示装置的示意图;
图12是根据本发明实施例的另一种可选地语句的展示装置的示意图;
图13是根据本发明实施例的另一种可选地语句的展示装置的示意图;
图14是根据本发明实施例的另一种可选地语句的展示装置的示意图;
图15是根据本发明实施例的另一种可选地语句的展示装置的示意图;以及
图16是根据本发明实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,还提供了一种语句的展示方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种语句的展示方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的语句的展示方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的语句的展示方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的语句的展示方法。图2是根据本发明实施例的语句的展示方法的流程图。
如图2所示,该实施例的语句的展示方法可以包括以下步骤:
步骤S12,获取待处理语句中具有修饰关系的词语对,其中,词语对包括被修饰词语和修饰词语。
在步骤S12提供的技术方案中,待处理语句中可以包括至少一个具有修饰关系的词语对,具有修饰关系的词语对中可以包括被修饰词语和修饰词语。比如,待处理语句为“画面好看,音效差”,则待处理语句中包括两个具有修饰关系的词语对,分别为“画面好看”和“音效差”,其中,词语对“画面好看”中的被修饰词语为“画面”,修饰词语为“好看”,词语对“音效差”中的被修饰词语为“音效”,修饰词语为“差”。
需要说明的是,本发明实施例并不对待处理语句中具有修饰关系的词语对的个数作限定,可以是一个,也可以是多个。上述举例中的词语对的个数为两个。
作为一种可选地实施例,本发明实施例中的待处理语句可以为与游戏应用相关的语句,待处理语句可以为针对某款游戏应用(比如使命召唤)的评论语句,可以包括关于使命召唤某个角色的攻击力的评论语句,关于使命召唤游戏规则的评论语句,关于使用召唤开发商的评论语句,或者其他与使命召唤相关的评论语句。可选地,获取处理语句可以通过从与该游戏应用相关的网页中提取出与该游戏应用相关的语句,其中,与该游戏应用相关的网页包括贴吧、社交媒体等,从与该游戏应用相关的网页中提取到的语句通常数量较多,可能会含有一些与该游戏应用不相关的语句,比如广告语句,该实施例优选地对从与该游戏应用相关的网页中提取出大量语句进行过滤处理,过滤处理可以包括语句去重处理、与游戏应用不相关语句的删除处理等。可选地,过滤处理可以按照与游戏应用相关的关键字进行条件筛选,保留包含与游戏应用相关的关键字的语句,丢弃不包含与游戏相关的关键字的语句。可选地,过滤处理还可以按照语句字数进行条件筛选,比如丢弃语句中包含与游戏应用相关的关键字,但语句中字数多于预设阈值的语句。这样能够保障待处理语句均与该游戏应用相关,进而能够提高待处理语句情感分析的准确度,进而提高了对游戏应用性能评价的准确度。
比如,从与使命召唤相关的网页中提取到的与使命召唤相关的语句有:“使命召唤中剑魔皮肤难看”,“AK47攻击力强”,“贴吧中有好多广告贴”,“使命召唤的游戏环境差”,“使命召唤游戏画面好”,“剑魔攻击力强”,假设过滤处理依据的关键字包括使命召唤,使命召唤中角色名称、使命召唤中武器装备名称,则得到的与使命召唤这一游戏应用相关的语句为:“使命召唤中剑魔皮肤难看”,“AK47攻击力强”,“使命召唤的游戏环境差”,“使命召唤游戏画面好”,“剑魔攻击力强”,而“贴吧中有好多广告贴”由于未包含上述关键字被丢弃。
需要说明的是,本发明实施例并未限定待处理语句为与游戏应用相关的语句,待处理语句还可以为与其他对象相关的语句,比如某个产品、某个人物等。此处以待处理语句为与游戏应用相关的语句为例对本发明实施例进行介绍。
可选地,获取待处理语句中具有修饰关系的词语对可以采用按照标点符号对待处理语句划分为一个或者多个子语句,分别对每个子语句进行分词处理,得到多个词语,并确定每个词语的词性,依据语句中的每个词语的词性和依存关系得到至少一个具有修饰关系的词语对。本发明实施例还可以采用其他方式获取待处理语句中具有修饰关系的词语对,此处不再一一举例说明。
步骤S14,从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性。
在步骤S14提供的技术方案中,维度库中可以包括至少一个实体维度词,每个实体维度词表示一个维度,每个维度对应至少一个实体词。比如,维度库中包括两个实体维度词,分别为“角色”和“装备”,“角色”表示一个维度,且该维度对应的实体词包括“太阳神”、“剑魔”、“小仙女”,“装备”表示一个维度,且该维度对应的实体词包括“刀”、“AK47”、“魔剑”、“魔法棒”。本发明并不对维度库中实体维度词的个数作限定,可以是一个,也可以是多个,上述举例中只列举了两个实体维度词。
需要说明的是,维度库中的实体维度词可以是属于同一维度的多个实体词的上位概念,也可以是人工对属于同一维度的多个实体词标注的标识。维度库中各个实体维度词均不相同,该实施例采用不同的实体维度词以达到明确区分不同的维度的目的。
在步骤S14提供的技术方案中,情感词库中可以包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感,每个情感类型词对应至少一个情感词。比如,情感词库中包括两个个情感类型词,分别为“口味”和“外观”。“口味”表示一类情感类型,“口味”的情感极性可以为正面情感或负面情感,该类情感类型对应的情感词包括“好吃”和“难吃”,其中,“好吃”为正面情感,“难吃”为负面情感。“外观”表示一类情感类型,“外观”的情感极性可以为正面情感或负面情感,该类情感类型对应的情感词包括“漂亮”、“好看”以及“难看”,其中,“漂亮”和“好看”为正面情感,“难看”为负面情感。本发明并不对情感词库中情感类型词的个数作限定,可以是一个,也可以是多个,上述举例中只列举了两个情感类型词。
需要说明的是,情感词库中的情感类型词可以是属于同一情感类型的多个情感词的上位概念,也可以是人工对属于同一情感类型的多个情感词标注的标识。情感词库中各个情感类型词均不相同,该实施例采用不同的情感类型词以达到明确区分不同的情感类型的目的。
步骤S14中的维度库和情感词库可以基于训练语句集合进行建立,其中,训练语句集合中包括至少一个训练语句。具体建立过程可以包括:首先分别对每个训练语句进行分词处理,得到多个词语以及每个词语的词性,根据每个词语的词性确定具有修饰关系的词语对,包括被修饰词语和修饰词语;然后将每个词语转化为词向量,再将每个训练语句转化为句向量。通过句向量聚类可以得到至少一个实体维度词,再建立训练语句中属于该实体维度词表示的维度的被修饰词语(实体词)与该实体维度词的对应关系,这样可以建立维度库。通过对词向量聚类可以得到至少一个情感类型词,再建立训练语句中属于该情感类型词表示的情感类型的修饰词语(情感词)与该情感类型词的对应关系,这样可以建立情感词库。
需要说明的是,在建立维度库和情感词库的同时,该实施例根据句向量还可以建立实体词、实体维度词、情感类型词、情感词以及情感极性的对应关系。图3是根据本发明实施例的维度库与情感词库之间对应关系的示意图,如图3所示,维度库中可以包括一个或者多个实体维度词,图3所示的维度库包括两个实体维度词,分别为维度1和维度2,每个实体维度词可以包括一个或者多个实体词,该一个或者多个实体词可以作为与其相对应的实体维度词的实体词库,维度1对应实体库1,维度2对应实体库2。维度库中的实体维度词可以对应有一个或者多个情感词库中的情感类型词,情感词库中可以包括一个或者多个情感类型词,图3所示的情感类型词库包括三个情感类型词,分别为情感类型1、情感类型2以及情感类型3,且维度1对应情感类型1和情感类型2,维度2对应情感类型3。情感词库中的每个情感类型词均对应有正面情感和负面情感。每个情感类型词可以对应有一个或者多个情感词,每个情感词具有正面情感或者负面情感,与该情感类型词对应的一个或者多个具有正面情感的情感词可以组成正面情感词库,与该情感类型词对应的一个或者多个具有负面情感的情感词可以组成负面情感词库。需要说明的是,在分析情感词的情感极性时,该实施例在进行词法分析和句法分析时考虑了语句中的情感翻转词和情感归零词,比如,“高”为正面情感,“并不高”则为负面情感,则“并不”则为情感翻转词。
本发明实施例可以采用paragraph2vec算法将训练语句转化为句向量,可以采用word2vec算法将训练语句中的每个词语转化为词向量。需要说明的是,本发明实施例还可以利用其他算法得到每个训练语句的句向量以及每个词语的词向量,paragraph2vec算法和word2vec算法属于比较成熟的技术,本发明并不对其进行保护。
下面举例说明维度库和情感词库的具体建立过程:
假设针对某款游戏的用户评论有“剑魔攻击力强,但长相差”、“太阳神皮肤难看”、“AK47攻击力弱”、“太阳神攻击力弱”、“小仙女好看,且声音动听”,首先对上述评论按照语法关系进行语句划分,得到训练语句集合,其中,训练语句集合中包括七个训练语句,分别为“剑魔攻击力好强”、“剑魔长相差”、“太阳神皮肤难看”、“AK47攻击力太弱”、“太阳神攻击力弱”、“小仙女好看”以及“小仙女声音动听”。分别对每个训练语句进行分词处理,获取多个具有修饰关系的词语对,包括“剑魔长相差”等,其中,“剑魔”是被修饰词语,“长相差”是修饰词语,此处不再一一举例。然后将上述每个训练语句转化为句向量,将每个训练语句中的每个词语转化为词向量,通过对句向量进行聚类可以得到维度库中包括的实体维度词分别为“角色”、“装备”,其中,“角色”对应的实体词包括“剑魔”、“太阳神”以及“小仙女”;“装备”对应的实体词包括“AK47”。通过对词向量进行聚类可以得到情感词库中包括的情感类型词分别为“攻击力”、“外观”、“声音”,其中,“攻击力”的情感极性分别为正面情感和负面情感,对应的情感词包括“攻击力好强”、“攻击力太弱”以及“攻击力弱”,“太强”对应正面情感,“太弱”和“弱”对应负面情感;“外观”的情感极性分别为正面情感和负面情感,对应的情感词包括“长相差”、“皮肤难看”以及“好看”,“好看”对应正面情感,“长相差”和“皮肤难看”对应负面情感;“声音”的情感极性分别为正面情感和负面情感,对应的情感词包括“声音动听”,“声音动听”对应正面情感。
通过上述方法建立的维度库如表1所示,情感词库如表2所示,维度库和情感词库的对应关系如表3所示:
表1
实体维度词 实体词
角色 剑魔、太阳神、小仙女
装备 AK47
表2
表3
实体词 实体维度词 情感类型词 情感词 情感极性
剑魔 角色 攻击力 攻击力好强 正面情感
剑魔 角色 外观 长相差 负面情感
太阳神 角色 外观 皮肤难看 负面情感
AK47 装备 攻击力 攻击力太弱 负面情感
太阳神 角色 攻击力 攻击力弱 负面情感
小仙女 角色 外观 好看 正面情感
小仙女 角色 声音 声音动听 正面情感
在按照上述方式建立维度库和情感词库后,执行步骤S14,从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性。
可选地,从维度库中查找与被修饰词语匹配的实体维度词可以采用首先从维度库查找与被修饰词语匹配的实体词,其中,匹配可以是相同,也可以是同属于一个维度,在查找到存在与被修饰词语匹配的实体词的情况下,根据维度库中实体维度词与实体词的对应关系,便可以将该实体词所属的维度对应的实体维度词确定与被修饰词语匹配的实体维度词。
可选地,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性可以采用首先从情感词库查找与修饰词语匹配的情感词,其中,匹配可以是相同,也可以是同属于一个维度,在查找到存在与修饰词语匹配的情感词的情况下,判断该情感词所述情感类型对应的情感类型词是否与上述查找到的实体维度词存在对应关系,若存在对应关系,则可以按照实体词、实体维度词、情感类型词、情感词以及情感极性的对应关系,将该情感词所属的情感类型对应的情感类型词确定为与修饰词语匹配的情感类型词。
上述方式只是本发明实施例的一种优选地实施方式,本发明实施例还可以采用其他查找方式从维度库和情感词库中分别查找与被修饰词与和修饰词语匹配的实体维度词和情感类型词,此处不再一一举例说明。
需要说明的是,维度库和情感词库支持实时更新,每分析一条待处理语句,便会将该待处理语句对应的实体词、实体维度词、情感类型词、情感词以及情感极性分别相应地添加至维度库和情感词库中。这样能够扩充维度库和情感词库的数据量,使得利用维度库和情感词库进行情感分析时能够极大地提高情感分析的准确度。
步骤S16,将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为待处理语句的语义信息进行展示。
在步骤S16提供的方案中,经过情感分析后得到的待处理语句的语义信息包括:与被修饰词语相匹配的实体维度词、与修饰词语相匹配的情感类型词以及该情感类型词的情感极性。比如,待处理语句为“剑魔发型好看”,被修饰词语为“剑魔”,修饰词语为“发型好看”,根据步骤S14查找到的与“剑魔”匹配的实体维度词为“角色”,与“发型好看”匹配的情感类型词为“外观”,情感极性为正面情感。则“剑魔发型好看”对应的语义信息为“角色外观正面情感”。
可选地,该实施例在获取待处理语句的语义信息之后,可以根据实际需求统计具体某个维度、或者某个情感类型、或者某个情感极性对应的语句数量,以达到进一步地分析针对某种产品或者某种事件用户的观点和情感。
可选地,该实施例在获取待处理语句的语义信息之后,可以将该语义信息进行展示,其展示类型可以为文本类型、柱状图类型或者折线图类型等。需要说明的是,展示待处理语句的语义信息时可以以符合要求的语句数量或者词语对数量作为数据依据。
该实施例的语句的展示方法预先构建维度库和情感词库,其中,维度库中包括至少一个实体维度词,每个实体维度词表示一个维度,情感词库中包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感,通过从维度库中查找与待处理语句中具有修饰关系的词语对中的被修饰词语匹配的实体维度词,从情感词库中查找与待处理语句中具有修饰关系的词语对中的修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性,解决了相关技术针对语句中包含多个实体对象,且每个实体对象的情感极性不相同的情况,无法针对每个实体对象的情感极性进行分析判断,导致降低语句语义分析准确度的技术问题,实现了从多方面多维度分析情感极性的目的,从而达到了提高情感分析准确度的技术效果。
作为一种可选地实施例,步骤S16中展示待处理语句的语义信息可以包括:按照所有待处理语句中与查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性匹配的词语对的数量,展示查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性。图4是根据本发明实施例的语句的展示方法应用于分析游戏评论的展示效果的示意图,如图4所示,该游戏图标的周围围绕有多个评论语句,利用本发明实施例的语句的展示方法可以分别对其情感极性进行分析,并将具有正面情感的语句与具有负面情感的语句用不同的展示方法区分开,图4中使用不同评论框进行区分,具有正面情感的语句用圆形表示,具有负面情感的语句用于矩形表示。可选地,该实施例可以用圆形或者矩形的大小表示具有相同语义信息,即相同的实体维度词、情感类型词以及情感极性的语句数量或者词语对数量,如图4所示,语义信息为“网络延迟高”的语句数量或者词语对数量高于语义信息为“角色弱”的语句数量或者词语对数量。可选地,该实施例还可以统计具有正面的语句或者词语对所占比例以及具有负面的语句或者词语对所占比例,如图4所示,可以将正面情感和负面情感的比例用比例图方式展示,也可以在游戏图标周围设置比例进度条,通过比例图或者比例进度条可以直观地获取正面情感和负面情感所占的比例。
作为另一种可选地实施例,步骤S16中展示待处理语句的语义信息可以包括:展示多个信息块,每个信息块对应具有关联关系的一个实体维度词、一个情感类型词以及一个情感类型词的情感极性,其中,每个信息块可以对应一个游戏应用的属性。需要说明的是,一个游戏应用可以包括多个属性,相应地,展示与该游戏应用相关的语句的情感分析结果时包括多个信息块。比如图4中的游戏应用可以是使命召唤,“角色弱”对应的信息块对应使命召唤的一个属性,此属性为“角色”,该信息块中具有关联关系的实体维度词为“角色”,情感类型词为“弱”,情感极性为负面情感。“武器厉害”对应的信息块对应使命召唤的另外一个属性,此属性为“武器”,该信息块中具有关联关系的实体维度词为“武器”,情感类型词为“厉害”,情感极性为正面情感。可选地,该实施例可以对游戏应用属性进一步划分,比如同一个实体维度词不同的情感类型词可以对应游戏应用的不同属性,比如“角色弱”和“角色丑”两个信息块的实体维度词相同,但情感类型词不同,则它们可以对应使命召唤的两个属性,一个属性为“角色攻击力”,另外一个属性为“角色外观”。该实施例采用以信息块区分游戏应用不同属性的展示方式,能够便于直观清楚地掌握游戏应用的属性分类,便于用户针对游戏应用具体某个属性进行分析评价,极大地提高了用户的使用体验。
作为一种可选地实施例,步骤S14中从维度库中查找与被修饰词语匹配的实体维度词可以包括:从维度库中查找与被修饰词语匹配的实体词;若查找到实体词,则将实体词所属的维度所对应的实体维度词作为查找到的实体维度词,其中,维度库中的每个实体维度词表示的维度对应至少一个实体词。
该实施例维度库中可以包括至少一个实体维度词,每个实体维度词表示一个维度,每个实体维度词表示的维度对应有至少一个实体词。如果从维度库中查找到与被修饰词语匹配的实体词,则可以确定该被修饰词语的实体维度词为查找到的实体词所属的维度对应的实体维度词。需要说明的是,相匹配可以是相同或者相似,或者同属于一个类别,本发明实施例并未对相匹配的条件做具体限定,匹配条件可以根据具体情况调整。
比如,从表1所示的维度库中查找与被修饰词语“太阳神”匹配的实体维度词,按照表3所示的对应关系可以确定与该被修饰词语相匹配的实体维度词为“角色”。该举例中被修饰词语与实体词相同,如果被修饰词语为“精灵”,通过比较被修饰词语的词向量与各个实体词的词向量,可以得到该被修饰词语与“剑魔”、“太阳神”或“小仙女”相关度较高,也可以得到与该被修饰词语相匹配的实体维度词为“角色”。
作为一种可选地实施例,步骤S14中从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性可以包括:从情感词库中查找与修饰词语匹配的情感词;若查找到情感词,判断情感词所属的情感类型所对应的情感类型词是否与查找到的实体维度词匹配;若与查找到的实体维度词匹配,则将情感词所属的情感类型所对应的情感类型词作为查找到的情感类型词,并将与查找到的情感词匹配的情感类型词的情感极性作为查找到的情感类型词的情感极性。
情感词库中可以包括至少一个情感类型词,每个情感类型词的情感极性包括正面情感和负面情感,每个情感类型词表示一个情感类型,每个情感类型对应至少一个情感词。由于在建立维度库和情感词库的同时,建立了实体词、实体维度词、情感类型词、情感词以及情感极性的对应关系,故在查找与修饰词语相匹配的情感类型词时,只需从情感词库中查找与修饰词语匹配的情感词,如果查找到与修饰词语匹配的情感词,还要考虑是否与查找到的实体维度词匹配,这样能够保障该查找到的情感类型词是词语对中被修饰词语对应的情感类型,能够提高词语对情感分析的准确度。如果查找到的与修饰词语匹配的情感词与上述查找到的与被修饰词语相匹配的实体维度词匹配,则可以确定该情感词所属的情感类型对应的情感类型词为与修饰词语匹配的情感类型词,以及该情感词所属的情感类型对应的情感类型词的情感极性为该词语对的情感极性。
比如,被修饰词语为“剑魔”,修饰词语为“攻击力强”,从表2所示的情感词库中可以确定与修饰词语为“攻击力强”相匹配的情感词为“攻击力好强”,对应的情感类型词为“攻击力”,情感极性为正面情感,按照表3所示的对应关系,该情感词与上述查找到的实体维度词“角色”匹配,则可以得到与修饰词语匹配的情感类型词为“攻击力”,情感极性为“正面情感”。
本发明实施例通过预先建立维度库、情感词库以及维度库与情感词库的对应关系,能够便于从中快速查找与词语对相匹配的实体维度词和情感类型词,缩短了词语对情感分析时间,提高了词语对情感分析效率。
作为一种可选地实施例,图5是根据本发明实施例的一种可选地语句的展示方法的流程图,如图5所示,在步骤S14之前,该实施例的语句的展示方法还可以包括以下步骤:
步骤S131,获取训练语句集合,其中,训练语句集合中包括至少一个训练语句。
在步骤S131提供的技术方案中,该实施例的训练语句集合中至少包括一个至少包括两个具有修饰关系的词语对的训练语句,该实施例设置至少一个训练语句,使其包括至少两个具有修饰关系的词语对,且词语对中的被修饰词语或者修饰词语对应不同的实体维度词或者情感类型词。该实施例选取具备上述特点的训练语句集合,能够增加训练语句的多样性,进而达到提高情感分析准确度的效果。
步骤S133,将每个训练语句转化为句向量。
在步骤S133提供的技术方案中,该实施例采用paragraph2vec算法将训练语句转化为句向量。需要说明的是,本发明实施例还可以利用其他算法得到每个训练语句的句向量,paragraph2vec算法属于比较成熟的技术,本发明并不对其进行保护。该实施例将每个训练语句转化为句向量,目的是为了获取每个训练语句之间的相关性,按照该相关性对训练语句进行聚类。
步骤S135,对句向量进行聚类,得到维度库中的至少一个实体维度词。
在步骤S135提供的技术方案中,分析每个训练语句的句向量可以得到训练语句之间的相关性,将具备相关性的训练语句聚类为一个维度,并为该维度分配实体维度词,该实体维度词表示该维度。对训练语句集合中的训练样本进行聚类,可以得到一个或者多个维度,相应地实体维度词可以是一个或者多个,当实体维度词为多个时,优选地使多个实体维度词不相同,以达到清楚地区分不同维度的目的。
该实施例基于大量的训练语句进行聚类,增加了训练语句维度的多样性,更加符合实际情况,进而为利用维度库对语句进行情感分析的准确度。
作为一种可选地实施例,图6是根据本发明实施例的另一种可选地语句的展示方法的流程图,如图6所示,在步骤S135之后,该实施例的语句的展示方法还可以包括以下步骤:
步骤S137,获取训练语句中具有修饰关系的训练词语对,其中,训练词语对包括作为被修饰词语的实体词和作为修饰词语的情感词。
在步骤S137提供的技术方案中,每个训练语句中至少包括一个具有修饰关系的训练词语对,且训练词语对包括作为被修饰词语的实体词和作为修饰词语的情感词。其中,实体维度词所表示的维度对应至少一个实体词,为了建立准确度维度库。该实施例通过对训练语句进行分词处理,获取每个词语和每个词语的词性,然后根据词语之间的依存关系能够获取训练语句中具有修饰关系的训练词语对。该实施例通过步骤S131至步骤S135获取至少一个实体维度词之后,为每个实体维度词添加与其对应的实体词,并建立实体维度词与实体词的对应关系。
步骤S139,根据训练词语对包括的实体词在训练语句中出现的次数,建立训练词语对包括的实体词与至少一个实体维度词之间的对应关系,其中,至少一个实体维度词中的每个实体维度词所表示的维度包括训练词语对包括的至少一个实体词。
在步骤S139提供的技术方案中,该实施例通过统计训练词语对包括的实体词在训练语句中出现的次数,将实体维度词对应的实体词按照出现次数进行排序,优选地将出现次数较高的实体词作为该实体维度词对应的实体词。该实施例可以按照训练词语对包括的实体词在训练语句中出现的次数建立训练词语对包括的实体词与至少一个实体维度词之间的对应关系,也可以按照其他条件建立训练词语对包括的实体词与至少一个实体维度词之间的对应关系。该实施例通过建立训练词语对包括的实体词与至少一个实体维度词之间的对应关系,可以实现通过从维度库中查找与被修饰词语匹配的实体词,进而可以方便快速地确定与被修饰词语匹配的实体维度词。
该实施例在建立维度库的过程中通过对训练语句进行聚类,能够得到至少一个实体维度词,分别为每个实体维度词添加对应的实体词,建立实体维度词与实体词的对应关系,为利用维度库查找与被修饰词语匹配的实体维度词提供了数据支持和便捷方式。
作为一种可选地实施例,图7是根据本发明实施例的另一种可选地语句的展示方法的流程图,如图7所示,在步骤S131之后,该实施例的语句的展示方法还可以包括:
步骤S1322,将训练语句集合中的每个训练语句中的词语转化为词向量。
在步骤S1322提供的技术方案中,该实施例采用word2vec算法将训练语句中的每个词语转化为词向量。需要说明的是,本发明实施例还可以利用其他算法得到每个词语的词向量,word2vec算法属于比较成熟的技术,本发明并不对其进行保护。该实施例将每个词语转化为词向量,目的是为了获取每个词语之间的相关性,按照该相关性对词语进行聚类。
步骤S1324,对词向量进行聚类,得到情感词库中的至少一个情感类型词。
在步骤S1324提供的技术方案中,分析每个词语的词向量可以得到词语之间的相关性,将具备相关性的修饰词语进行聚类,并为每类分配情感类型词,该情感类型词表示该类修饰词语所代表的情感类型。对修饰词语进行聚类,可以得到一个或者多个情感类型,相应地情感类型词可以是一个或者多个,当情感类型词为多个时,优选地使多个情感类型词不相同,以达到清楚地区分不同情感类型的目的。
步骤S1326,根据训练词语对包括的情感词在训练语句中出现的次数,建立训练词语对包括的情感词、训练词语对包括的情感词所属的情感类型词、所属的情感类型词的情感极性、与至少一个实体维度词之间的对应关系,其中,每个情感类型词所表示的情感类型对应训练词语对包括的至少一个情感词。
在步骤S1326提供的技术方案中,该实施例可以将训练词语对包括的情感词在训练语句中出现的次数较高的实体词和与其对应的情感类型词建立对应关系,在建立情感词和情感类型词之间的对应关系的同时,该实施例还可以情感词、情感类型词、情感类型词的情感极性以及实体维度词之间的对应关系。该实施例通过建立上述对应关系,可以实现通过从维度库中查找与被修饰词语匹配的实体词,或者从情感词库中查找与修饰词语匹配的情感词,进而可以方便快速地对该词语对进行情感分析,为利用维度库和情感词库分析待处理语句的语义信息提供了数据支持和便捷方式。
作为一种可选地实施例,图8是根据本发明实施例的另一种可选地语句的展示方法的流程图,如图8所示,步骤S12可以包括以下步骤:
步骤S122,对待处理语句进行词法处理,获得待处理语句中的词语以及每个词语的词性。
在步骤S122提供的技术方案中,对待处理语句进行词法处理可以包括对待处理语句进行分词,并获取每个词语的词性。
步骤S124,对待处理语句中的词语以及每个词语的词性进行句法处理,获取待处理语句中词语之间的修饰关系。
在步骤S124提供的技术方案中,对待处理语句中的词语以及每个词语的词性进行句法处理可以包括将每个待处理语句按照标点进行分句,得到多个子句,分别分析每个子句中多个词语之间的修饰关系,其中,分析词语之间的修饰关系可以依据每个词语的词性和每个词语的位置。
步骤S126,获取待处理语句中具有修饰关系的词语对。
在步骤S126提供的技术方案中,按照词语之间的修饰关系可以获取待处理语句中包含的至少一个具有修饰关系的词语对,没有具有修饰关系的词语对中包括被修饰词语和修饰词语,其中,被修饰词语对应维度库中的实体词,修饰词语对应情感词库中的情感词。
需要说明的是,该实施例针对每个语句,包括待处理语句和训练语句,均进行词法分析和句法分析,以获取每个语句中具有修饰关系的词语对。该实施例将对语句的情感分析问题转化为对语句中各个具有修饰关系的词语对的情感分析,通过降低情感分析的粒度,实现了对语句中不同维度情感极性的分析,进而达到了提高语句情感分析准确度的效果。
作为一种可选地实施例,该实施例中的待处理语句中至少有一个待处理语句包括至少两个具有修饰关系的词语对,每个词语对中的被修饰词或者修饰词对应不同的实体维度词或者情感类型词。本发明实施例能够对包括多个修饰关系的词语对的语句进行情感分析,多个修饰关系的词语对中的被修饰词语代表多个维度,多个修饰关系的词语对中的修饰词语代表多种情感类型,该实施例从多个维度分析语句的情感类型和情感极性,提高了对语句情感分析的准确度。
本发明实施例的语句的展示方法可以应用于游戏口碑分析,也可以应用于其他评论分析方面。图9是根据本发明实施例的游戏口碑分析方法的流程图,如图9所示,该游戏口碑的分析方法可以包括以下步骤:
步骤S21,爬虫获取用户评论。利用爬虫可以获取各个数据渠道和社交媒体上的用户评论,用户评论主要是针对该游戏的评论,比如对使命召唤OL的评论。在获取用户评论之后,该方法包括两个过程,分别为离线和实时过程,其中离线过程包括步骤S22至步骤S27,主要用于建立维度库和情感词库;实时过程包括步骤S28至步骤S31,主要用于利用通过离线过程建立的维度库和情感词库对用于评论进行情感分析,具体地:
步骤S22,获取历史评论数据。该实施例结合大量的历史评论数据建立维度库和情感词库,有利于提高维度库和情感词库的准确度。
步骤S23,训练paragraph2vec模型,即采用paragraph2vec算法将评论语句转化为句向量,其中,通过分析每个语句的句向量可以得到语句之间的相关度。
步骤S24,训练word2vec模型,即采用word2vec算法将评论语句中的词语转化为词向量,其中,通过分析每个词语的词向量可以得到词语之间的相关度。
步骤S25,分别对句向量和词向量进行聚类。对句向量聚类依据语句之间的相关度,对词向量聚类依据词语之间的相关度。
步骤S26,建立维度库。对句向量聚类得到至少一个实体维度词,每个实体维度词表示一个维度,每个维度对应至少一个实体词。需要说明的是,实体词对应语句中具有修饰关系的词语对中的被修饰词语。
步骤S27,建立情感词库。对词向量聚类得到至少一个情感类型词,每个情感类型词的情感极性包括正面情感和负面情感,每个情感类型词表示一类情感类型,每类情感类型对应至少一个情感词。需要说明的是,情感词对应语句中具有修饰关系的词语对中的修饰词语。
步骤S28,垃圾贴过滤、去重。由于步骤S21获取的用户评论中可能掺杂有与该游戏无关的一些评论,故通过步骤S28可以对与该游戏无关的评论进行过滤和去重,以达到提高评论语句情感分析准确度的目的。
步骤S29,对评论语句进行词法分析。词法分析可以包括对评论语句进行分词,获取多个词语以及每个词语的词性。
步骤S30,对评论语句进行句法分析。句法分析可以包括根据每个词语的词性获取词语之间的修饰关系,获取具有修饰关系的词语对。需要说明的是,步骤S23和步骤S24也可以包括对语句进行词法和句法分析。
步骤S31,进行针对维度的口碑分析。利用维度库和情感词库对评论语句进行多维度的情感分析,包括分析每个维度对应的情感类型和情感极性。
该实施例的评论数据经过实时采集后,实时请求各个分析服务,分别进行垃圾过滤、词法分析、句法分析和多维度情感分析,并将结果入库。每次分析结果会维护新的版本号,如果任意分析环节进行了算法或模型更新,都会触发版本升级。此时,回朔服务会重新从原始库中拉取近三个月的历史数据,重新执行数据分析的全部流程。此时,原有分析流程对于新采集到的数据保持继续分析,而回朔服务完成后,会将升级后的版本置为有效态,用户将看到升级版本后的分析结果,新数据的分析将切换到更新后的版本号入库。
以具体的应用场景为例,某游戏研发团队为了能够及时获得玩具对游戏质量的反馈,提前在平台上为游戏配置了贴吧、应用商店、各大论坛等数据源,并通过了审核。在10月23号该游戏的首发版本上线后,利用舆情平台的风向标功能,即本发明实施例的语句的展示方法对应实现的功能,连续三天对用户来自各个渠道的各方面评论进行了持续地分析和跟踪。由于舆情风向标功能实现了针对近100个各个游戏领域的专业维度进行的高覆盖分析,因而该游戏团队迅速的在次日发现某一维度负面评价的持续上升。
得到这一结果后,该游戏研发团队迅速对游戏的同步心跳机制进行了深入的分析,并确定该系统存在问题,会在用户处于基站切换的时候造成游戏中断。这一现象在通常的测试流程中难以复现,然而利用舆情风向标这一功能,该游戏及时进行了研发调整,避免了因技术问题而导致的更大损失。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述语句的展示方法的语句的展示装置。可选地,该实施例的语句的展示装置可以应用于如图1所示的硬件环境中,其中,硬件环境包括网络环境。
图10是根据本发明实施例的语句的展示装置的示意图,如图10所示,该装置可以包括:
获取模块22,用于获取待处理语句中具有修饰关系的词语对,其中,词语对包括被修饰词语和修饰词语;查找模块24,用于从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性,其中,维度库中包括至少一个实体维度词,每个实体维度词对应一个维度,情感词库中包括至少一个情感类型词,每个情感类型词对应一类情感类型,每个情感类型词的情感极性为正面情感或负面情感;以及展示模块26,用于将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为待处理语句的语义信息进行展示。
需要说明的是,该实施例中的获取模块22可以用于执行本申请实施例一中的步骤S12,该实施例中的查找模块24可以用于执行本申请实施例一中的步骤S14,该实施例中的展示模块26可以用于执行本申请实施例一中的步骤S16。上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
作为一种可选地实施例,本发明实施例中的待处理语句可以为与游戏应用相关的语句,其中,第一获取模块可以包括:提取模块,用于从与游戏应用相关的网页中提取出与游戏应用相关的语句。
作为一种可选地实施例,展示模块26可以包括:第一子展示模块,用于按照所有待处理语句中与查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性匹配的词语对的数量,展示查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性。
作为另一种可选地实施例,展示模块26可以包括:第二子展示模块,用于展示多个信息块,其中,每个信息块对应具有关联关系的一个查找到的实体维度词、一个查找到的情感类型词以及一个查找到的情感类型词的情感极性,一个查找到的实体维度词对应于所述游戏应用的一个属性。
作为一种可选地实施例,图11是根据本发明实施例的一种可选地语句的展示装置的示意图,如图11所示,查找模块24可以包括:第一查找单元242,用于从维度库中查找与被修饰词语匹配的实体维度词,第二查找单元244,用于从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性,其中,第一查找单元242可以包括:第一子查找模块2422,用于从维度库中查找与被修饰词语匹配的实体词;第一确定模块2424,用于在查找到实体词时,将实体词所属的维度所对应的实体维度词作为查找到的实体维度词,其中,维度库中的每个实体维度词表示的维度对应至少一个实体词。第二查找单元244可以包括:第二子查找模块2442,用于从情感词库中查找与修饰词语匹配的情感词;第二确定模块2444,用于在与查找到的实体维度词匹配时,将情感词所属的情感类型所对应的情感类型词作为查找到的情感类型词,并将与查找到的情感词匹配的情感类型词的情感极性作为查找到的情感类型词的情感极性。
本发明实施例通过预先建立维度库、情感词库以及维度库与情感词库的对应关系,能够便于从中快速查找与词语对相匹配的实体维度词和情感类型词,缩短了词语对情感分析时间,提高了词语对情感分析效率。
作为一种可选地实施例,图12是根据本发明实施例的另一种可选地语句的展示装置的示意图,如图12所示,该实施例的语句的展示装置还可以包括:第二获取模块231,用于获取训练语句集合,其中,训练语句集合中包括至少一个训练语句;第一转化模块233,用于将每个训练语句转化为句向量;第一聚类模块235,用于对句向量进行聚类,得到维度库中的至少一个实体维度词。
需要说明的是,该实施例中的第二获取模块231可以用于执行本申请实施例一中的步骤S131,该实施例中的第一转化模块233可以用于执行本申请实施例一中的步骤S133,该实施例中的第一聚类模块235可以用于执行本申请实施例一中的步骤S135。上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。
作为一种可选地实施例,图13是根据本发明实施例的另一种可选地语句的展示装置的示意图,如图13所示,该实施例的语句的展示装置还可以包括:第三获取模块237,用于获取训练语句中具有修饰关系的训练词语对,其中,训练词语对包括作为被修饰词语的实体词和作为修饰词语的情感词;第一建立模块239,用于根据训练词语对包括的实体词在训练语句中出现的次数,建立训练词语对包括的实体词与至少一个实体维度词之间的对应关系,其中,至少一个实体维度词中的每个实体维度词所表示的维度包括训练词语对包括的至少一个实体词。
需要说明的是,该实施例中的第三获取模块237可以用于执行本申请实施例一中的步骤S137,该实施例中的第一建立模块239可以用于执行本申请实施例一中的步骤S139。上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。
作为一种可选地实施例,图14是根据本发明实施例的另一种可选地语句的展示装置的示意图,如图14所示,该实施例的语句的展示装置还可以包括:第二转化模块2322,用于将训练语句集合中的每个训练语句中的词语转化为词向量;第二聚类模块2324,用于对词向量进行聚类,得到情感词库中的至少一个情感类型词;第二建立模块2326,用于根据训练词语对包括的情感词在训练语句中出现的次数,建立训练词语对包括的情感词、训练词语对包括的情感词所属的情感类型词、所属的情感类型词的情感极性、与至少一个实体维度词之间的对应关系,其中,每个情感类型词所表示的情感类型对应训练词语对包括的至少一个情感词。
需要说明的是,该实施例中的第二转化模块2322可以用于执行本申请实施例一中的步骤S1322,该实施例中的第二聚类模块2324可以用于执行本申请实施例一中的步骤S1324,该实施例中的第二建立模块2326可以用于执行本申请实施例一中的步骤S1326。上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。
作为一种可选地实施例,图15是根据本发明实施例的另一种可选地语句的展示装置的示意图,如图15所示,第一获取模块22可以包括:第一处理模块222,用于对待处理语句进行词法处理,获得待处理语句中的词语以及每个词语的词性;第二处理模块224,用于对待处理语句中的词语以及每个词语的词性进行句法处理,获取待处理语句中词语之间的修饰关系;以及第一子获取模块226,用于获取待处理语句中具有修饰关系的词语对。
需要说明的是,该实施例中的第一处理模块222可以用于执行本申请实施例一中的步骤S122,该实施例中的第二处理模块224可以用于执行本申请实施例一中的步骤S124,该实施例中的第一子获取模块226可以用于执行本申请实施例一中的步骤S126。上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。
实施例3
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的漏洞检测方法中以下步骤的程序代码:获取待处理语句中具有修饰关系的词语对,其中,词语对包括被修饰词语和修饰词语;从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性,其中,维度库中包括至少一个实体维度词,每个实体维度词表示一个维度,情感词库中包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感;以及将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为待处理语句的语义信息进行展示。
可选地,图16是根据本发明实施例的一种计算机终端的结构框图。如图16所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器51、存储器53、以及传输装置55。
其中,存储器53可用于存储软件程序以及模块,如本发明实施例中的语句的展示方法和装置对应的程序指令/模块,处理器51通过运行存储在存储器53内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的语句的展示方法。存储器53可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器53可进一步包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置55用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置55包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置55为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器53用于存储预设动作条件和预设权限用户的信息、以及应用程序。
处理器51可以通过传输装置调用存储器53存储的信息及应用程序,以执行下述步骤:按照所有待处理语句中与查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性匹配的词语对的数量,展示查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性。
可选的,上述处理器51还可以执行如下步骤的程序代码:从维度库中查找与被修饰词语匹配的实体词;若查找到实体词,则将实体词所属的维度所对应的实体维度词作为查找到的实体维度词,其中,维度库中的每个实体维度词表示的维度对应至少一个实体词;从情感词库中查找与修饰词语匹配的情感词;若查找到情感词,判断情感词所属的情感类型所对应的情感类型词是否与查找到的实体维度词匹配;若与查找到的实体维度词匹配,则将情感词所属的情感类型所对应的情感类型词作为查找到的情感类型词,并将与查找到的情感词匹配的情感类型词的情感极性作为查找到的情感类型词的情感极性。
可选的,上述处理器51还可以执行如下步骤的程序代码:获取训练语句集合,其中,训练语句集合中包括至少一个训练语句;将每个训练语句转化为句向量;对句向量进行聚类,得到维度库中的至少一个实体维度词。
可选的,上述处理器51还可以执行如下步骤的程序代码:获取训练语句中具有修饰关系的训练词语对,其中,训练词语对包括作为被修饰词语的实体词和作为修饰词语的情感词;根据训练词语对包括的实体词在训练语句中出现的次数,建立训练词语对包括的实体词与至少一个实体维度词之间的对应关系,其中,至少一个实体维度词中的每个实体维度词所表示的维度包括训练词语对包括的至少一个实体词。
可选的,上述处理器51还可以执行如下步骤的程序代码:将训练语句集合中的每个训练语句中的词语转化为词向量;对词向量进行聚类,得到情感词库中的至少一个情感类型词;根据训练词语对包括的情感词在训练语句中出现的次数,建立训练词语对包括的情感词、训练词语对包括的情感词所属的情感类型词、所属的情感类型词的情感极性、与至少一个实体维度词之间的对应关系,其中,每个情感类型词所表示的情感类型对应训练词语对包括的至少一个情感词。
可选的,上述处理器51还可以执行如下步骤的程序代码:对待处理语句进行词法处理,获得待处理语句中的词语以及每个词语的词性;对待处理语句中的词语以及每个词语的词性进行句法处理,获取待处理语句中词语之间的修饰关系;以及获取待处理语句中具有修饰关系的词语对。
可选的,上述处理器51还可以执行如下步骤的程序代码:从与游戏应用相关的网页中提取出与游戏应用相关的语句。
可选的,上述处理器51还可以执行如下步骤的程序代码:展示多个信息块,其中,每个信息块对应具有关联关系的一个查找到的实体维度词、一个查找到的情感类型词以及一个查找到的情感类型词的情感极性,一个查找到的实体维度词对应于所述游戏应用的一个属性。
采用本发明实施例,提供了一种语句的展示方法和装置的方案。通过获取待处理语句中具有修饰关系的词语对,其中,词语对包括被修饰词语和修饰词语;从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性,其中,维度库中包括至少一个实体维度词,每个实体维度词表示一个维度,情感词库中包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感;以及将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为待处理语句的语义信息进行展示,从而达到了从多个维度多个方面分析情感极性的目的,进而解决了相关技术针对语句中包含多个实体对象,且每个实体对象的情感极性不相同的情况,无法针对每个实体对象的情感极性进行分析判断,导致降低语句语义分析准确度的技术问题,达到了提高情感分析准确度的效果。
本领域普通技术人员可以理解,图16所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图16其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图16中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图16所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的语句的展示方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,获取待处理语句中具有修饰关系的词语对,其中,词语对包括被修饰词语和修饰词语;
S2,从维度库中查找与被修饰词语匹配的实体维度词,从情感词库中查找与修饰词语和实体维度词匹配的情感类型词和情感类型词的情感极性,其中,维度库中包括至少一个实体维度词,每个实体维度词表示一个维度,情感词库中包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感;
S3,将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为待处理语句的语义信息进行展示。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:按照所有待处理语句中与查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性匹配的词语对的数量,展示查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:从维度库中查找与被修饰词语匹配的实体词;若查找到实体词,则将实体词所属的维度所对应的实体维度词作为查找到的实体维度词,其中,维度库中的每个实体维度词表示的维度对应至少一个实体词;从情感词库中查找与修饰词语匹配的情感词;若查找到情感词,判断情感词所属的情感类型所对应的情感类型词是否与查找到的实体维度词匹配;若与查找到的实体维度词匹配,则将情感词所属的情感类型所对应的情感类型词作为查找到的情感类型词,并将与查找到的情感词匹配的情感类型词的情感极性作为查找到的情感类型词的情感极性。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取训练语句集合,其中,训练语句集合中包括至少一个训练语句;将每个训练语句转化为句向量;对句向量进行聚类,得到维度库中的至少一个实体维度词。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取训练语句中具有修饰关系的训练词语对,其中,训练词语对包括作为被修饰词语的实体词和作为修饰词语的情感词;根据训练词语对包括的实体词在训练语句中出现的次数,建立训练词语对包括的实体词与至少一个实体维度词之间的对应关系,其中,至少一个实体维度词中的每个实体维度词所表示的维度包括训练词语对包括的至少一个实体词。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:将训练语句集合中的每个训练语句中的词语转化为词向量;对词向量进行聚类,得到情感词库中的至少一个情感类型词;根据训练词语对包括的情感词在训练语句中出现的次数,建立训练词语对包括的情感词、训练词语对包括的情感词所属的情感类型词、所属的情感类型词的情感极性、与至少一个实体维度词之间的对应关系,其中,每个情感类型词所表示的情感类型对应训练词语对包括的至少一个情感词。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:对待处理语句进行词法处理,获得待处理语句中的词语以及每个词语的词性;对待处理语句中的词语以及每个词语的词性进行句法处理,获取待处理语句中词语之间的修饰关系;以及获取待处理语句中具有修饰关系的词语对。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:从与游戏应用相关的网页中提取出与游戏应用相关的语句。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:展示多个信息块,其中,每个信息块对应具有关联关系的一个查找到的实体维度词、一个查找到的情感类型词以及一个查找到的情感类型词的情感极性,一个查找到的实体维度词对应于所述游戏应用的一个属性。
此处需要说明的是,上述计算机终端群中的任意一个可以与网站服务器和扫描器建立通信关系,扫描器可以扫描计算机终端上php执行的web应用程序的值命令。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (16)

1.一种语句的展示方法,其特征在于,包括:
获取待处理语句中具有修饰关系的词语对,其中,所述词语对包括被修饰词语和修饰词语;
从维度库中查找与所述被修饰词语匹配的实体维度词,从情感词库中查找与所述修饰词语和所述实体维度词匹配的情感类型词和所述情感类型词的情感极性,其中,所述维度库中包括至少一个实体维度词,每个实体维度词表示一个维度,所述情感词库中包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感;以及
将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为所述待处理语句的语义信息进行展示;
其中,所述将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为所述待处理语句的语义信息进行展示包括:按照所有所述待处理语句中与所述查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性匹配的词语对的数量,展示所述查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性。
2.根据权利要求1所述的方法,其特征在于,从所述维度库中查找与所述被修饰词语匹配的实体维度词包括:
从所述维度库中查找与所述被修饰词语匹配的实体词;
若查找到所述实体词,则将所述实体词所属的维度所对应的实体维度词作为查找到的实体维度词,其中,所述维度库中的每个实体维度词表示的维度对应至少一个实体词。
3.根据权利要求2所述的方法,其特征在于,从所述情感词库中查找与所述修饰词语和所述实体维度词匹配的情感类型词和所述情感类型词的情感极性包括:
从所述情感词库中查找与所述修饰词语匹配的情感词;
若查找到所述情感词,将所述情感词所属的情感类型所对应的、且与查找到的所述实体词匹配的情感类型词作为查找到的所述情感类型词,并将与查找到的所述情感词匹配的所述情感类型词的情感极性作为查找到的所述情感类型词的情感极性。
4.根据权利要求1所述的方法,其特征在于,在从维度库中查找与所述被修饰词语匹配的实体维度词,从情感词库中查找与所述修饰词语和所述实体维度词匹配的情感类型词和所述情感类型词的情感极性之前,所述方法还包括:
获取训练语句集合,其中,所述训练语句集合中包括至少一个训练语句;
将每个所述训练语句转化为句向量;
对所述句向量进行聚类,得到所述维度库中的所述至少一个实体维度词。
5.根据权利要求4所述的方法,其特征在于,在对所述句向量进行聚类,得到所述维度库中的所述至少一个实体维度词之后,所述方法还包括:
获取所述训练语句中具有修饰关系的训练词语对,其中,所述训练词语对包括作为被修饰词语的实体词和作为修饰词语的情感词;
根据所述训练词语对包括的实体词在所述训练语句中出现的次数,建立所述训练词语对包括的实体词与所述至少一个实体维度词之间的对应关系,其中,所述至少一个实体维度词中的每个实体维度词所表示的维度包括所述训练词语对包括的至少一个实体词。
6.根据权利要求5所述的方法,其特征在于,在获取训练语句集合之后,所述方法还包括:
将所述训练语句集合中的每个训练语句中的词语转化为词向量;
对所述词向量进行聚类,得到所述情感词库中的所述至少一个情感类型词;
根据所述训练词语对包括的情感词在所述训练语句中出现的次数,建立所述训练词语对包括的情感词、所述训练词语对包括的情感词所属的情感类型词、所属的情感类型词的情感极性、与所述至少一个实体维度词之间的对应关系,其中,每个所述情感类型词所表示的情感类型对应所述训练词语对包括的至少一个情感词。
7.根据权利要求1所述的方法,其特征在于,所述获取待处理语句中具有修饰关系的词语对包括:
对所述待处理语句进行词法处理,获得所述待处理语句中的词语以及每个词语的词性;
对所述待处理语句中的词语以及每个词语的词性进行句法处理,获取所述待处理语句中词语之间的修饰关系;以及
获取所述待处理语句中具有所述修饰关系的词语对。
8.根据权利要求1至7任一项所述的方法,其特征在于,所述待处理语句中至少有一个待处理语句包括至少两个具有修饰关系的词语对,每个词语对中的被修饰词或者修饰词对应不同的实体维度词或者情感类型词。
9.根据权利要求1所述的方法,其特征在于,所述待处理语句为与游戏应用相关的语句,其中,获取所述待处理语句包括:
从与所述游戏应用相关的网页中提取出与所述游戏应用相关的语句。
10.根据权利要求9所述的方法,其特征在于,将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为所述待处理语句的语义信息进行展示包括:
展示多个信息块,其中,每个信息块对应具有关联关系的一个所述查找到的实体维度词、一个所述查找到的情感类型词以及一个所述查找到的情感类型词的情感极性,所述查找到的实体维度词对应于所述游戏应用的一个属性。
11.一种语句的展示装置,其特征在于,包括:
第一获取模块,用于获取待处理语句中具有修饰关系的词语对,其中,所述词语对包括被修饰词语和修饰词语;
查找模块,用于从维度库中查找与所述被修饰词语匹配的实体维度词,从情感词库中查找与所述修饰词语和所述实体维度词匹配的情感类型词和所述情感类型词的情感极性,其中,所述维度库中包括至少一个实体维度词,每个实体维度词表示一个维度,所述情感词库中包括至少一个情感类型词,每个情感类型词表示一类情感类型,每个情感类型词的情感极性为正面情感或负面情感;以及
展示模块,用于将查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性作为所述待处理语句的语义信息进行展示;
所述展示模块包括:第一子展示模块,用于按照所有所述待处理语句中与所述查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性匹配的词语对的数量,展示所述查找到的实体维度词、查找到的情感类型词、以及查找到的情感类型词的情感极性。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取训练语句集合,其中,所述训练语句集合中包括至少一个训练语句;
第一转化模块,用于将所述每个训练语句转化为句向量;
第一聚类模块,用于对所述句向量进行聚类,得到所述维度库中的所述至少一个实体维度词。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第三获取模块,用于获取所述训练语句中具有修饰关系的训练词语对,其中,所述训练词语对包括作为被修饰词语的实体词和作为修饰词语的情感词;
第一建立模块,用于根据所述训练词语对包括的实体词在所述训练语句中出现的次数,建立所述训练词语对包括的实体词与所述至少一个实体维度词之间的对应关系,其中,所述至少一个实体维度词中的每个实体维度词所表示的维度包括所述训练词语对包括的至少一个实体词。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
第二转化模块,用于将所述训练语句集合中的每个训练语句中的词语转化为词向量;
第二聚类模块,用于对所述词向量进行聚类,得到所述情感词库中的所述至少一个情感类型词;
第二建立模块,用于根据所述训练词语对包括的情感词在所述训练语句中出现的次数,建立所述训练词语对包括的情感词、所述训练词语对包括的情感词所属的情感类型词、所属的情感类型词的情感极性、与所述至少一个实体维度词之间的对应关系,其中,每个所述情感类型词所表示的情感类型对应所述训练词语对包括的至少一个情感词。
15.根据权利要求11所述的装置,其特征在于,所述待处理语句为与游戏应用相关的语句,其中,所述第一获取模块包括:
提取模块,用于从与所述游戏应用相关的网页中提取出与所述游戏应用相关的语句。
16.根据权利要求15所述的装置,其特征在于,所述展示模块包括:
第二子展示模块,用于展示多个信息块,其中,每个信息块对应具有关联关系的一个所述查找到的实体维度词、一个所述查找到的情感类型词以及一个所述查找到的情感类型词的情感极性,所述查找到的实体维度词对应于所述游戏应用的一个属性。
CN201610031469.0A 2016-01-18 2016-01-18 语句的展示方法和装置 Active CN105718543B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610031469.0A CN105718543B (zh) 2016-01-18 2016-01-18 语句的展示方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610031469.0A CN105718543B (zh) 2016-01-18 2016-01-18 语句的展示方法和装置

Publications (2)

Publication Number Publication Date
CN105718543A CN105718543A (zh) 2016-06-29
CN105718543B true CN105718543B (zh) 2019-05-24

Family

ID=56147199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610031469.0A Active CN105718543B (zh) 2016-01-18 2016-01-18 语句的展示方法和装置

Country Status (1)

Country Link
CN (1) CN105718543B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108255803B (zh) * 2016-12-29 2022-03-01 北京国双科技有限公司 文档情感的判断方法和装置
CN106919794B (zh) * 2017-02-24 2019-12-06 黑龙江特士信息技术有限公司 面向多数据源的药品类实体识别方法及装置
CN110019681B (zh) * 2017-12-19 2022-05-17 阿里巴巴(中国)有限公司 一种评论内容过滤方法及系统
CN108564429A (zh) * 2018-03-09 2018-09-21 杭州鸟瞰智能科技股份有限公司 一种基于深度学习的美食门店推荐方法
CN108959531B (zh) * 2018-06-29 2020-12-22 北京百度网讯科技有限公司 信息搜索方法、装置、设备及存储介质
CN109190118A (zh) * 2018-08-16 2019-01-11 云南大学 基于流水线式神经网络的短语层次情感强度预测方法
CN110378725A (zh) * 2019-06-28 2019-10-25 联想(北京)有限公司 一种信息处理方法、终端和存储介质
CN110866405A (zh) * 2019-11-14 2020-03-06 电子科技大学 一种基于语句信息的方面级情感分类方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049435A (zh) * 2013-01-04 2013-04-17 浙江工商大学 文本细粒度情感分析方法及装置
CN103885933A (zh) * 2012-12-21 2014-06-25 富士通株式会社 用于评价文本的情感度的方法和设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8949211B2 (en) * 2011-01-31 2015-02-03 Hewlett-Packard Development Company, L.P. Objective-function based sentiment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885933A (zh) * 2012-12-21 2014-06-25 富士通株式会社 用于评价文本的情感度的方法和设备
CN103049435A (zh) * 2013-01-04 2013-04-17 浙江工商大学 文本细粒度情感分析方法及装置

Also Published As

Publication number Publication date
CN105718543A (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
CN105718543B (zh) 语句的展示方法和装置
CN106407178B (zh) 一种会话摘要生成方法、装置、服务器设备以及终端设备
CN104484339B (zh) 一种相关实体推荐方法和系统
CN104331417B (zh) 一种用户个人服饰的搭配方法
CN108769823A (zh) 直播间显示方法、装置、设备及存储介质
CN108509465A (zh) 一种视频数据的推荐方法、装置和服务器
CN108062304A (zh) 一种基于机器学习的商品评论数据的情感分析方法
CN110019725A (zh) 人机交互方法、系统及其电子设备
CN108281139A (zh) 语音转写方法和装置、机器人
CN105824898A (zh) 一种网络评论的标签提取方法和装置
CN103365904B (zh) 一种广告信息搜索方法和系统
CN110364146A (zh) 语音识别方法、装置、语音识别设备及存储介质
CN108536414A (zh) 语音处理方法、装置和系统、移动终端
CN108319888B (zh) 视频类型的识别方法及装置、计算机终端
CN108959531A (zh) 信息搜索方法、装置、设备及存储介质
CN109508427A (zh) 一种信息推荐方法及服务器、语音交互终端
CN110335596A (zh) 基于语音识别的产品推荐方法、装置、设备和存储介质
CN106411683B (zh) 一种关键社交信息的确定方法及装置
CN113392641A (zh) 文本处理方法、装置、存储介质和设备
CN108920649A (zh) 一种信息推荐方法、装置、设备和介质
CN106339898A (zh) 一种基于互联网大数据的产品创新方法
CN106569996B (zh) 一种面向中文微博的情感倾向分析方法
CN112019871B (zh) 一种基于大数据的直播电商内容智能管理平台
CN106356056B (zh) 语音识别方法和装置
CN109299463B (zh) 一种情感得分的计算方法以及相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant