CN111832313B - 文本中情感搭配集合的生成方法、装置、设备和介质 - Google Patents
文本中情感搭配集合的生成方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN111832313B CN111832313B CN202010519614.6A CN202010519614A CN111832313B CN 111832313 B CN111832313 B CN 111832313B CN 202010519614 A CN202010519614 A CN 202010519614A CN 111832313 B CN111832313 B CN 111832313B
- Authority
- CN
- China
- Prior art keywords
- emotion matching
- emotion
- candidate
- matching
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 477
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000011156 evaluation Methods 0.000 claims description 58
- 239000013598 vector Substances 0.000 claims description 30
- 230000015654 memory Effects 0.000 claims description 19
- 230000011218 segmentation Effects 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 239000013604 expression vector Substances 0.000 claims description 3
- 230000003190 augmentative effect Effects 0.000 claims 1
- 238000005065 mining Methods 0.000 abstract description 38
- 230000008569 process Effects 0.000 abstract description 8
- 238000013135 deep learning Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract description 6
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000001914 filtration Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 235000015278 beef Nutrition 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 241000238565 lobster Species 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 101100481876 Danio rerio pbk gene Proteins 0.000 description 1
- 101100481878 Mus musculus Pbk gene Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了文本中情感搭配集合的生成方法、装置、设备和介质,涉及自然语言处理和深度学习技术领域。具体实现方案为:在对评论文本中进行情感搭配挖掘的过程中,在通过词性搭配规则的方式从评论文本中准确挖掘出第一情感搭配词组后,通过评论文本对第一情感搭配词组进行扩充,并结合第一情感搭配词组和扩充的情感搭配词组,生成该评论文本的目标情感搭配结果,从而在保证情感挖掘的准确性的条件下,提升了情感挖掘的召回率,提高了评论文本中情感搭配集合的生成的整体效果。
Description
技术领域
本申请涉及计算机技术领域,具体涉及自然语言处理和深度学习技术领域,尤其涉及文本中情感搭配集合的生成方法、装置、设备和介质。
背景技术
情感搭配通常指主观评论文本中能够表达用户评论观点的标签。情感搭配对于用户观点分析、特定商品的舆情分析、用户建模都具有重要的作用。情感搭配挖掘结果的精确程度将直接影响用户观点分析、特定商品的舆情分析、用户建模等业务的效果。因此,如何从评论文本中既准确又全面的挖掘出情感搭配是亟需解决的一个问题。
发明内容
本申请提供了一种文本中情感搭配集合的生成方法、装置、设备和介质。
根据本申请的一方面,提供了一种文本中情感搭配集合的生成方法,包括:获取评论文本;根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合。
根据本申请的另一方面,提供了一种文本中情感搭配集合的生成装置,包括:第一获取模块,用于获取评论文本;第一情感搭配分析模块,根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;扩充模块,用于根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及生成模块,用于将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合。
根据本申请的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请的文本中情感搭配集合的生成方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请实施例公开的文本中情感搭配集合的生成方法。
根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现执行本申请实施例公开的文本中情感搭配集合的生成方法。
上述申请中的一个实施例具有如下优点或有益效果:在对评论文本中进行情感搭配挖掘的过程中,先结合词性搭配规则对评论文本进行情感搭配分析,以得到评论文本的情感搭配集合,然后,基于原始文本,对于情感搭配集合中的第一情感搭配词组进行扩充,以得到每个第一情感搭配词组的情感搭配扩充集合,最后,对将情感搭配集合和每个第一情感搭配词组的情感搭配扩充集合进行合并,以得到评论文本的目标情感搭配集合。由此,在对评论文本中进行情感搭配挖掘的过程中,在通过词性搭配规则的方式从评论文本中准确挖掘出第一情感搭配词组后,通过评论文本对第一情感搭配词组进行扩充,并结合第一情感搭配词组和扩充的情感搭配词组,生成该评论文本的目标情感搭配结果,从而在保证情感挖掘的准确性的条件下,提升了情感挖掘的召回率,保证了情感挖掘的准确率和召回率的兼顾,提高了评论文本中情感搭配集合的生成的整体效果。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请一个实施例的文本中情感搭配集合的生成方法的流程示意图;
图2是根据本申请一个实施例的步骤103的细化流程图;
图3是根据本申请一个实施例的步骤203的细化流程图;
图4是根据本申请一个实施例的步骤202的细化流程图一;
图5是根据本申请一个实施例的步骤202的细化流程图二;
图6是根据本申请一个实施例的步骤102的细化流程图;
图7是结合规则的挖掘方法和基于DNN的挖掘方法对文本进行情感挖掘的示意图。
图8是根据本申请一个施例的文本中情感搭配集合的生成装置的结构示意图;
图9是根据本申请另一个施例的文本中情感搭配集合的生成装置的结构示意图;
图10是用来实现本申请实施例的文本中情感搭配集合的生成方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面参考附图描述本申请实施例的文本中情感搭配集合的生成方法、装置、设备和介质。
图1是根据本申请一个实施例的文本中情感搭配集合的生成方法的流程示意图。其中,需要说明的是,本实施例的文本中情感搭配集合的生成方法的执行主体为文本中情感搭配集合的生成装置,文本中情感搭配集合的生成装置可以由软件和/或硬件的方式实现,该实施例中的文本中情感搭配集合的生成装置可以配置在电子设备或者服务器中,该实施例对不作具体限定。
如图1所示,该文本中情感搭配集合的生成方法可以包括:
步骤101,获取评论文本。
其中,本实施中的评论文本可以是通用领域中任意一个领域或者多个领域混合的评论文本,例如,评论文本可以为“美食”领域的评论文本,或者,评论文本可以为“汽车”领域的评论文本,或者,评论文本还可以由“美食”领域的评论文本和“旅游”领域的评论文本组成的。
步骤102,根据预设的词性搭配规则对评论文本进行情感搭配分析,以获取评论文本的情感搭配集合,其中,情感搭配集合包括多个第一情感搭配词组。
其中,第一情感搭配词组包括评价词和纬度词,例如,评论文本为“个人觉得不错,外观漂亮年轻”,对应的第一情感搭配词组为“外观漂亮”、“外观年轻”等,其中,“外观”为第一情感搭配词组“外观漂亮”的纬度词,“漂亮”为第一情感搭配词组“外观漂亮”的评价词,“外观”为第一情感搭配词组“外观年轻”的纬度词,“年轻”为第一情感搭配词组“外观年轻”的评价词。
步骤103,根据评论文本对每个第一情感搭配词组进行扩充,以生成多个第一情感搭配词组对应的多个情感搭配扩充集合。
在本申请的一个实施例中,根据评论文本对每个第一情感搭配词组进行扩充,以得到多个第一情感搭配词组对应的多个情感搭配扩充集合的具体实现方式可以包括多种,例如:
作为一种示例性的实现方式,可基于传统的主题模型(Latent DirichletAllocation,LDA)对评论文本的分词结果集合中的每个分词进行向量表示,以得到每个分词的主题表示向量,然后,获取第一情感搭配词组中的维度词对应的标题表示向量,根据每个分词和纬度词对应的标题表示向量,确定纬度词和每个分词之间的标题相似度,然后,获取标题相似度排序在前的K个分词,并根据所获取的K个分词和第一情感搭配词组中的评价词进行组合,以得到第一情感搭配词组的情感搭配扩充集合。
作为另一种示例性的实现方式,可基于深度神经网络(Deep Neural Networks,DNN)的情感挖掘算法,利用评论文本,对每个第一情感搭配词组进行扩充,以得到多个第一情感搭配词组对应的多个情感搭配扩充集合。
具体而言,可获取评论文本的分词结果集合,并通过深度神经网络对分词结果集合中的每个分词进行语义向量表示,以得到每个分词的语义表示向量,然后,获取第一情感搭配词组中的维度词对应的语义表示向量,根据每个分词和纬度词对应的语义表示向量,确定纬度词和每个分词之间的语义相似度,然后,获取语义相似度排序在前的K个分词,并根据所获取的K个分词和第一情感搭配词组中的评价词进行组合,以得到第一情感搭配词组的情感搭配扩充集合。
其中,可通过计算每个分词和纬度词对应的语义表示向量之间的余弦相似度,来表示纬度词和每个分词之间的语义相似度。
也就是说,本实施例在根据预设的词性搭配规则对评论文本进行情感搭配分析,以获取评论文本的情感搭配集合后,将挖掘所得情感搭配集合中的第一情感搭配词组作为种子输入基于DNN的挖掘模块中,利用深度学习中更强的语义表示能力对第一情感搭配词组进行扩充,以得到第一情感搭配词组对应的情感搭配扩充集合。
例如,采用词性搭配规则对评论文本进行情感搭配分析,得到第一情感搭配词组<环境,不错>,对于该第一情感搭配词组,基于深度学习的Auto-Encoder模型,利用余弦相似度的方法对第一情感搭配词组进行扩充,与该第一情感搭配词组对应的K个相关的情感搭配结果可以为<大堂,不错>、<餐厅,不错>、<公共环境、不错>等,可将K个相关的情感搭配结果作为该第一情感搭配词组的情感搭配扩充集合。
其中,上述示例仅是步骤103的两种实现方式,关于步骤103的其他实现方式将在后续实施例中描述。
步骤104,将情感搭配集合和多个情感搭配扩充集合进行合并,以生成评论文本的情感搭配集合。
本申请实施例的文本中情感搭配集合的生成方法,在对评论文本中进行情感搭配挖掘的过程中,先结合词性搭配规则对评论文本进行情感搭配分析,以得到评论文本的情感搭配集合,然后,基于原始文本,对于情感搭配集合中的第一情感搭配词组进行扩充,以得到每个第一情感搭配词组的情感搭配扩充集合,最后,对将情感搭配集合和每个第一情感搭配词组的情感搭配扩充集合进行合并,以得到评论文本的目标情感搭配集合。由此,在对评论文本中进行情感搭配挖掘的过程中,在通过词性搭配规则的方式从评论文本中准确挖掘出第一情感搭配词组后,通过评论文本对第一情感搭配词组进行扩充,并结合第一情感搭配词组和扩充的情感搭配词组,生成该评论文本的目标情感搭配结果,从而在保证情感挖掘的准确性的条件下,提升了情感挖掘的召回率,保证了情感挖掘的准确率和召回率的兼顾,提高了评论文本中情感搭配集合的生成的整体效果。
基于上述实施例的基础上,在本申请的一个实施例中,为了提高最后所得到的评论文本的情感搭配集合,可在将情感搭配集合和多个情感搭配扩充集合进行合并,以生成评论文本的目标情感搭配集合之前,还可以结合评论文本和预设的过滤规则,对情感搭配扩充集合中的第二情感搭配词组进行过滤。
对应地,结合情感搭配集合和过滤后的情感搭配扩充集合生成该评论文本的最终情感搭配挖掘结果,并输出。
在本申请的一个实施例中,结合评论文本和预设的过滤规则,对情感搭配扩充集合中的第二情感搭配词组进行过滤的一种示例性的实现方式,可以为:获取情感搭配扩充集合中的第二情感搭配词组,然后,获取第二情感搭配词组中的维度词在评论文本中的第一位置;获取第二情感搭配词组中的评价词在评论文本中的第二位置;以及如果第一位置和第二位置之间的文本长度超过预设长度,则将情感搭配扩充集合中的第二情感搭配词组删除。
其中,预设长度可以是根据业务需求而预先设置的,例如,预设长度可以为3。
例如,对于情感搭配扩充集合中的第二情感搭配词组,如果该第二情感搭配词组中的纬度词和评价词在评论文本中,并且纬度和评价词两者间隔不超过3个字,则保留该第二情感搭配词组,如果两者超过3个字,则删除该第二情感搭配词组。
其中,上述仅是结合评论文本和预设的过滤规则,对情感搭配扩充集合中的第二情感搭配词组进行过滤的一种示例性的实现方式,在实际应用中,还可以采用其他实现方式,该实施例对结合评论文本和预设的过滤规则,对情感搭配扩充集合中的第二情感搭配词组进行过滤不作具体限定。
在本申请的一个实施例中,为了可以准确扩展出每个第一情感搭配词组的情感搭配扩充集合,可结合第一情感搭配词组中的评价词和评论文本扩充第一情感搭配词组的情感搭配扩充集合,下面结合图2对该实施例的步骤103的一种具体实现方式进行描述。
图2是根据本申请一个实施例的步骤103的细化流程图。
如图2所示,该步骤103可以包括:
步骤201,获取每个第一情感搭配词组中的评价词和维度词。
步骤202,根据评论文本和评价词,对维度词进行扩充,以生成第一情感搭配词组对应的维度词扩充集合,其中,维度词扩充集合之中包括多个扩充维度词。
步骤203,根据维度词扩充集合和评价词,生成第一情感搭配词组对应的情感搭配扩充集合。
例如,采用词性搭配规则对评论文本进行情感搭配分析,得到第一情感搭配词组<环境,不错>,对于该第一情感搭配词组,基于评论文本和第一情感搭配词组中的评价词“不错”进行扩充,与该第一情感搭配词组对应的K个相关的情感搭配结果可以为<大堂,不错>、<餐厅,不错>、<公共环境、不错>等,可将K个相关的情感搭配结果作为该第一情感搭配词组的情感搭配扩充集合。
本实施例,在对第一情感搭配词组进行情感搭配扩充时,结合评论文本和第一情感搭配词组中的评价词,对第一情感搭配词组纬度词进行扩充,并结合评价词和扩充得到的维度词扩充集合,生成第一情感搭配词组对应的情感搭配扩充集合。由此,准确实现了对第一情感搭配词组的扩充。
基于上述实施例的基础上,为了可以准确得到第一情感搭配词组对应的情感搭配扩充集合,本实施例可结合语义相似度来确定第一情感搭配词组对应的情感搭配扩充集合,下面结合图3对上述步骤203的具体实现方式进行进一步描述。
图3是根据本申请一个实施例的步骤203的细化流程图。
如图3所示,步骤203可以包括:
步骤301,将维度词扩充集合中的每个扩充维度词和评价词进行组合,以生成第一候选情感搭配集合,其中,第一候选情感搭配集合中包括多个第一候选情感搭配词组。
步骤302,生成第一情感搭配词组分别相对于多个第一候选情感搭配词组之间的多个语义相似度。
在本申请一个实施例中,上述步骤302的具体实现方式可以为:获取第一情感搭配词组的第一语义表示向量;分别获取多个第一候选情感搭配词组的多个第二语义表示向量;以及根据第一语义表示向量和多个第二语义表示向量,分别生成第一情感搭配词组相对于多个第一候选情感搭配词组之间的语义相似度。
本实施例,通过第一情感搭配词组和每个第一候选情感搭配词组的语义表示向量,快速确定出第一情感搭配词组和每个第一候选情感搭配词组的语义相似度。
具体而言,可将第一情感搭配词组输入到基于深度学习的Auto-Encoder模型,以得到第一情感搭配词组的语义表示向量。对应地,对于每个第一候选情感搭配词组,也可以通过基于深度学习的Auto-Encoder模型,得到对应第一候选情感搭配词组的语义表示向量。
步骤303,根据多个语义相似度对多个第一候选情感搭配词组进行排序,以生成排序结果。
步骤304,从排序结果中选择出排序在前的K个第一候选情感搭配词组,以生成情感搭配扩充集合,其中,K为大于或者等于1的整数。
其中,K为文本中情感搭配集合的生成装置中预先设置的值,可根据实际业务需求,设置K的取值,例如,K可以为6或者10等,该实施例对K的取值不作具体限定。
在本申请的一个实施例中,为了可以省去大量的人工标注成本,保证扩充的准确性,可结合第一情感搭配词组所属的目标短句的结构特征,对第一情感搭配词组进行扩充,以准确第一情感搭配词组的维度词扩充集合,为了使得本领域清楚地了解本申请,下面结合图4对上述步骤202进行进一步细化。
图4是根据本申请一个实施例的步骤202的细化流程图一。
如图4所示,步骤202可以包括:
步骤401,从评论文本中提取第一情感搭配词组所属的目标短句。
步骤402,获取目标短句的结构特征。
其中,本实施例中的结构特征用于表示目标短句的句子结构对应的特征。
步骤403,根据目标短句的结构特征从评论文本中获取与目标短句具有相同结构特征的候选短句。
其中,本实施例中的候选语句可以包括与第一情感搭配词组中的评价词相同的评价词。
步骤404,提取候选短句中的候选维度词。
例如,第一情感搭配词组中纬度词为“牛肉”,其所属的目标短句“牛肉很好吃”其对应的结构特征为“主语+形容词”,根据结构特征,所获取的候选短句为“波士顿大龙虾也很好吃”中,对该候选短句进行纬度词提取,候选维度词可以为“波士顿大龙虾”。
步骤405,根据候选维度词,生成第一情感搭配词组的候选维度词扩充集合。
步骤406,根据候选维度词扩充集合生成维度词扩充集合。
在本申请一个实施例中,为了可以准确确定生成第一情感搭配词组的维度词扩充集合,可结合短句的共性特征对第一情感搭配词组的纬度词进行扩充。如图5所示,上述步骤202的另一种实现方式,可以包括:
步骤501,从评论文本中提取第一情感搭配词组所属的目标短句。
步骤502,根据目标短句,获取维度词对应的共线维度词。
例如,第一情感搭配词为“动力不错”,对于其对应的目标短句“动力和操控性都很不错”,在目标短句中“动力和操控性都很不错”』中,可提取到共线纬度“操控性”。
步骤503,根据共线维度词,生成第一情感搭配词组的维度词扩充集合。
在本申请一个实施例中,为了准确生成评论文本的情感搭配集合,本实施例中的上述步骤102的具体实现方式,可以如图6所示,步骤102可以包括:
步骤601,对评论文本进行分词处理,以得到评论文本的多个分词。
步骤602,根据多个分词对应的词性和预设的词性搭配规则,对评论文本进行情感搭配抽取,以获取评论文本的第二候选情感搭配集合。
其中,词性搭配规则可以包括两个字的名词+两个子的形容词。
步骤603,根据第二候选情感搭配集合,生成评论文本的情感搭配集合。
在本申请的一个实施例中,为了提高所确定的第一情感搭配词组的准确性,第二候选情感搭配集合包括多个第二候选情感搭配词组,本实施例中的步骤603的具体实现方式可以为:
步骤a,根据每个第二候选情感搭配词组中的维度词的第一语义和评价词的第二语义,对具有相同第一语义和第二语义的第二候选情感搭配词组进行聚类,以得到多个第三候选情感搭配词组。
步骤b,根据每个第三候选情感搭配词组对应的第二候选情感搭配词组的数量,并按照数量从大到小的顺序进行排序,将排列在前预设数量的第三候选情感搭配词组作为评论文本的情感搭配集合。
为了使得本领域的技术人员可以清楚地了解本申请的技术方案,下面结合图7对该实施例的文本中情感搭配集合的生成方法进行描述。
基于规则的挖掘方法部分:首先对输入的无监督的评论文本进行文本预处理,包括分词、词性标注、依存分析等等。其次借助预先定义好的词性模板,抽取候选情感搭配。比如针对词性模板『两个字的名词+两个子的形容词』,可以得到候选情感搭配『环境不错』;在得到候选情感搭配之后,需要对挖掘结果进行初步的过滤,比如利用依存规则过滤、或是直接过滤掉一些特殊的句式。最后,按照情感搭配在评论文本中出现的频次,对情感搭配进行排序。注意,这里用到的基于规则的情感搭配挖掘方法并不一定限定于此,也可以使用其他的基于规则的方法。
采用DNN的挖掘部分,对第一步中挖掘得到的情感搭配集合进行扩充。首先无论是基于DNN的方法还是基于主题模型的方法,其基本思路都是对文本集合中的每个词学习得到一个向量表示(词向量或者主题向量);然后基于这些向量进行无监督聚类,或是直接基于向量之间的余弦相似度输出候选的情感搭配。这里借助步骤一中基于规则的方法挖掘到的情感搭配,利用余弦相似度的方法对于每个情感搭配输出其TopK个相关的情感搭配结果。注意,这里采用的基于无监督的情感搭配挖掘方法并不限于这里列举的LDA、Auto-Encoder等几种。这样对于每个情感搭配例如<环境,不错>都可以扩种出K个候选情感搭配结果,如<大堂,不错>、<餐厅,不错>、<公共环境、不错>等。之后需要对扩充的情感搭配集合进行过滤,这里基于一个基于共线特征的后验方式,即对于每个情感搭配候选,遍历原始的评论文本,假设其维度词和评价词曾在同一个评论文本中共线过,并且两者间隔不超过3个字。那么则该情感搭配可以被保留,否则直接舍弃。这里对每个候选情感搭配进行过滤的方法也不限定这一种。之后将基于规则的挖掘方法部分、DNN的挖掘部分输出的结果进行合并,即可作为最终的结果输出。
本实施例基于无监督的融合规则和深度神经网络的情感搭配挖掘方法,更好地利用了基于规则的挖掘方法中高准确率和基于深度神经网络的方法中高召回率的特点,从而最大程度上保证了准确率和召回率的兼顾,取得了很好的情感挖掘效果。
为了实现上述实施例,本申请实施例还提供一种文本中情感搭配集合的生成装置。
图8是根据本申请一个施例的文本中情感搭配集合的生成装置的结构示意图。
如图8所示,该生成装置100包括:第一获取模块110、第一情感搭配分析模块120、扩充模块130和生成模块140,其中:
第一获取模块110,用于获取评论文本。
第一情感搭配分析模块120,根据预设的词性搭配规则对评论文本进行情感搭配分析,以获取评论文本的情感搭配集合,其中,情感搭配集合包括多个第一情感搭配词组。
扩充模块130,用于根据评论文本对每个第一情感搭配词组进行扩充,以生成多个第一情感搭配词组对应的多个情感搭配扩充集合。以及
生成模块140,用于将情感搭配集合和多个情感搭配扩充集合进行合并,以生成评论文本的情感搭配集合。
在本申请的一个实施例中,扩充模块130可以包括:
获取子模块,用于获取每个第一情感搭配词组中的评价词和维度词。
扩充子模块,用于根据评论文本和评价词,对维度词进行扩充,以生成第一情感搭配词组对应的维度词扩充集合,其中,维度词扩充集合之中包括多个扩充维度词。
以及
第一生成子模块,用于根据维度词扩充集合和评价词,生成第一情感搭配词组对应的情感搭配扩充集合。
在本申请的一个实施例中,第一生成子模块,包括:
第一生成单元,用于将维度词扩充集合中的每个扩充维度词和评价词进行组合,以生成第一候选情感搭配集合,其中,第一候选情感搭配集合中包括多个第一候选情感搭配词组。
第二生成单元,用于生成第一情感搭配词组分别相对于多个第一候选情感搭配词组之间的多个语义相似度。
第三生成单元,用于根据多个语义相似度对多个第一候选情感搭配词组进行排序,以生成排序结果。以及
第四生成单元,用于从排序结果中选择出排序在前的K个第一候选情感搭配词组,以生成情感搭配扩充集合,其中,K为大于或者等于1的整数。
在本申请的一个实施例中,第二生成单元,包括:
第一获取子单元,用于获取第一情感搭配词组的第一语义表示向量。
第二获取子单元,用于分别获取多个第一候选情感搭配词组的多个第二语义表示向量。以及
第一生成子单元,用于根据第一语义表示向量和多个第二语义表示向量,分别生成第一情感搭配词组相对于多个第一候选情感搭配词组之间的语义相似度。
在本申请的一个实施例中,扩充子模块,包括:
第一提取单元,用于从评论文本中提取第一情感搭配词组所属的目标短句。
第一获取单元,用于获取目标短句的结构特征。
第二获取单元,用于根据目标短句的结构特征从评论文本中获取与目标短句具有相同结构特征的候选短句。
第二提取单元,用于提取候选短句中的候选维度词。
第五生成单元,用于根据候选维度词,生成第一情感搭配词组的候选维度词扩充集合。以及
第六生成单元,用于根据候选维度词扩充集合生成维度词扩充集合。
在本申请的一个实施例中,扩充子模块,包括:
第三提取单元,用于从评论文本中提取第一情感搭配词组所属的目标短句。
第三获取单元,用于根据目标短句,获取维度词对应的共线维度词。以及
第七生成单元,用于根据共线维度词,生成第一情感搭配词组的维度词扩充集合。
在本申请的一个实施例中,在图8所示的装置实施例的基础上,如图9所示,该装置还包括:
第二获取模150,用于获取情感搭配扩充集合中的第二情感搭配词组。
第三获取模块160,用于获取第二情感搭配词组中的维度词在评论文本中的第一位置。
第四获取模块170,用于获取第二情感搭配词组中的评价词在评论文本中的第二位置。以及
删除模块180,用于如果第一位置和第二位置之间的文本长度超过预设长度,则将情感搭配扩充集合中的第二情感搭配词组删除。
在本申请一个实施例中,第一情感搭配分析模块120可以包括:
分词子模块,用于对评论文本进行分词处理,以得到评论文本的多个分词。
抽取子模块,用于根据多个分词对应的词性和预设的词性搭配规则,对评论文本进行情感搭配抽取,以获取评论文本的第二候选情感搭配集合。以及
第二生成子模块,用于根据第二候选情感搭配集合,生成评论文本的情感搭配集合。
在本申请的一个实施例中,第二候选情感搭配集合包括多个第二候选情感搭配词组,第二生成子模块可以包括:聚类子单元,用于根据每个第二候选情感搭配词组中的维度词的第一语义和评价词的第二语义,对具有相同第一语义和第二语义的第二候选情感搭配词组进行聚类,以得到多个第三候选情感搭配词组。
第二生成子单元,用于根据每个第三候选情感搭配词组对应的第二候选情感搭配词组的数量,并按照数量从大到小的顺序进行排序,将排列在前预设数量的第三候选情感搭配词组作为评论文本的情感搭配集合。…
其中,需要说明的是,前述对文本中情感搭配集合的生成方法实施例的解释说明也适用于本实施例中的文本中情感搭配集合的生成装置,此处不再赘述。
本申请实施例的文本中情感搭配集合的生成装置,在对评论文本中进行情感搭配挖掘的过程中,先结合词性搭配规则对评论文本进行情感搭配分析,以得到评论文本的情感搭配集合,然后,基于原始文本,对于情感搭配集合中的第一情感搭配词组进行扩充,以得到每个第一情感搭配词组的情感搭配扩充集合,最后,对将情感搭配集合和每个第一情感搭配词组的情感搭配扩充集合进行合并,以得到评论文本的目标情感搭配集合。由此,在对评论文本中进行情感搭配挖掘的过程中,在通过词性搭配规则的方式从评论文本中准确挖掘出第一情感搭配词组后,通过评论文本对第一情感搭配词组进行扩充,并结合第一情感搭配词组和扩充的情感搭配词组,生成该评论文本的目标情感搭配结果,从而在保证情感挖掘的准确性的条件下,提升了情感挖掘的召回率,保证了情感挖掘的准确率和召回率的兼顾,提高了评论文本中情感搭配集合的生成的整体效果。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图10所示,是根据本申请实施例的文本中情感搭配集合的生成方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图10所示,该电子设备包括:一个或多个处理器1001、存储器1002,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图10中以一个处理器1001为例。
存储器1002即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的文本中情感搭配集合的生成方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的文本中情感搭配集合的生成方法。
存储器1002作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的文本中情感搭配集合的生成方法对应的程序指令/模块(例如,附图8所示的第一获取模块100、第一情感搭配分析模块120、扩充模块130和生成模块140)。处理器1001通过运行存储在存储器1002中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的文本中情感搭配集合的生成方法。
存储器1002可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据文本中情感搭配集合的生成的电子设备的使用所创建的数据等。此外,存储器1002可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1002可选包括相对于处理器1001远程设置的存储器,这些远程存储器可以通过网络连接至文本中情感搭配集合的生成的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
文本中情感搭配集合的生成的方法的电子设备还可以包括:输入装置1003和输出装置1004。处理器1001、存储器1002、输入装置1003和输出装置1004可以通过总线或者其他方式连接,图10中以通过总线连接为例。
输入装置1003可接收输入的数字或字符信息,以及产生与文本中情感搭配集合的生成的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1004可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (16)
1.一种文本中情感搭配集合的生成方法,包括:
获取评论文本;
根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;
根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及
将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合;
其中,所述根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合,包括:
获取每个所述第一情感搭配词组中的评价词和维度词;
根据所述评论文本和所述评价词,对所述维度词进行扩充,以生成所述第一情感搭配词组对应的维度词扩充集合,其中,所述维度词扩充集合之中包括多个扩充维度词;以及
根据所述维度词扩充集合和所述评价词,生成所述第一情感搭配词组对应的情感搭配扩充集合;
其中,所述根据所述维度词扩充集合和所述评价词,以生成所述第一情感搭配词组对应的情感搭配扩充集合,包括:
将所述维度词扩充集合中的每个所述扩充维度词和所述评价词进行组合,以生成第一候选情感搭配集合,其中,所述第一候选情感搭配集合中包括多个第一候选情感搭配词组;
生成所述第一情感搭配词组分别相对于所述多个第一候选情感搭配词组之间的多个语义相似度;
根据所述多个语义相似度对所述多个第一候选情感搭配词组进行排序,以生成排序结果;以及
从所述排序结果中选择出排序在前的K个第一候选情感搭配词组,以生成所述情感搭配扩充集合,其中,所述K为大于或者等于1的整数。
2.根据权利要求1所述的方法,其中,所述生成所述第一情感搭配词组分别相对于所述多个第一候选情感搭配词组之间的多个语义相似度,包括:
获取所述第一情感搭配词组的第一语义表示向量;
分别获取多个所述第一候选情感搭配词组的多个第二语义表示向量;以及
根据所述第一语义表示向量和多个所述第二语义表示向量,分别生成所述第一情感搭配词组相对于多个所述第一候选情感搭配词组之间的语义相似度。
3.根据权利要求1所述的方法,其中,所述根据所述评论文本和所述评价词,对所述维度词进行扩充,以得到所述第一情感搭配词组的维度词扩充集合,包括:
从所述评论文本中提取所述第一情感搭配词组所属的目标短句;
获取所述目标短句的结构特征;
根据所述目标短句的结构特征从所述评论文本中获取与所述目标短句具有相同结构特征的候选短句;
提取所述候选短句中的候选维度词;
根据所述候选维度词,生成所述第一情感搭配词组的候选维度词扩充集合;以及
根据所述候选维度词扩充集合生成所述维度词扩充集合。
4.根据权利要求1所述的方法,其中,所述根据所述评论文本和所述评价词生成所述第一情感搭配词组的维度词扩充集合,包括:
从所述评论文本中提取所述第一情感搭配词组所属的目标短句;
根据所述目标短句,获取所述维度词对应的共线维度词;以及
根据所述共线维度词,生成所述第一情感搭配词组的维度词扩充集合。
5.根据权利要求1所述的方法,其中,在所述将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的目标情感搭配集合之前,所述方法还包括:
获取所述情感搭配扩充集合中的第二情感搭配词组;
获取所述第二情感搭配词组中的维度词在所述评论文本中的第一位置;
获取所述第二情感搭配词组中的评价词在所述评论文本中的第二位置;以及
如果所述第一位置和所述第二位置之间的文本长度超过预设长度,则将所述情感搭配扩充集合中的所述第二情感搭配词组删除。
6.根据权利要求1所述的方法,其中,所述根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,包括:
对所述评论文本进行分词处理,以得到所述评论文本的多个分词;
根据所述多个分词对应的词性和所述预设的词性搭配规则,对所述评论文本进行情感搭配抽取,以获取所述评论文本的第二候选情感搭配集合;以及
根据所述第二候选情感搭配集合,生成所述评论文本的情感搭配集合。
7.根据权利要求6所述的方法,其中,所述第二候选情感搭配集合包括多个第二候选情感搭配词组,所述根据所述第二候选情感搭配集合,生成所述评论文本的情感搭配集合,包括:
根据每个所述第二候选情感搭配词组中的维度词的第一语义和评价词的第二语义,对具有相同第一语义和第二语义的第二候选情感搭配词组进行聚类,以得到多个第三候选情感搭配词组;
根据每个所述第三候选情感搭配词组对应的第二候选情感搭配词组的数量,并按照所述数量从大到小的顺序进行排序,将排列在前预设数量的第三候选情感搭配词组作为所述评论文本的情感搭配集合。
8.一种文本中情感搭配集合的生成装置,包括:
第一获取模块,用于获取评论文本;
第一情感搭配分析模块,根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;
扩充模块,用于根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及
生成模块,用于将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合;
其中,所述扩充模块,包括:
获取子模块,用于获取每个所述第一情感搭配词组中的评价词和维度词;
扩充子模块,用于根据所述评论文本和所述评价词,对所述维度词进行扩充,以生成所述第一情感搭配词组对应的维度词扩充集合,其中,所述维度词扩充集合之中包括多个扩充维度词;以及
第一生成子模块,用于根据所述维度词扩充集合和所述评价词,生成所述第一情感搭配词组对应的情感搭配扩充集合;
其中,所述第一生成子模块,包括:
第一生成单元,用于将所述维度词扩充集合中的每个所述扩充维度词和所述评价词进行组合,以生成第一候选情感搭配集合,其中,所述第一候选情感搭配集合中包括多个第一候选情感搭配词组;
第二生成单元,用于生成所述第一情感搭配词组分别相对于所述多个第一候选情感搭配词组之间的多个语义相似度;
第三生成单元,用于根据所述多个语义相似度对所述多个第一候选情感搭配词组进行排序,以生成排序结果;以及
第四生成单元,用于从所述排序结果中选择出排序在前的K个第一候选情感搭配词组,以生成所述情感搭配扩充集合,其中,所述K为大于或者等于1的整数。
9.根据权利要求8所述的装置,其中,所述第二生成单元,包括:
第一获取子单元,用于获取所述第一情感搭配词组的第一语义表示向量;
第二获取子单元,用于分别获取多个所述第一候选情感搭配词组的多个第二语义表示向量;以及
第一生成子单元,用于根据所述第一语义表示向量和多个所述第二语义表示向量,分别生成所述第一情感搭配词组相对于多个所述第一候选情感搭配词组之间的语义相似度。
10.根据权利要求8所述的装置,其中,所述扩充子模块,包括:
第一提取单元,用于从所述评论文本中提取所述第一情感搭配词组所属的目标短句;
第一获取单元,用于获取所述目标短句的结构特征;
第二获取单元,用于根据所述目标短句的结构特征从所述评论文本中获取与所述目标短句具有相同结构特征的候选短句;
第二提取单元,用于提取所述候选短句中的候选维度词;
第五生成单元,用于根据所述候选维度词,生成所述第一情感搭配词组的候选维度词扩充集合;以及
第六生成单元,用于根据所述候选维度词扩充集合生成所述维度词扩充集合。
11.根据权利要求8所述的装置,其中,所述扩充子模块,包括:
第三提取单元,用于从所述评论文本中提取所述第一情感搭配词组所属的目标短句;
第三获取单元,用于根据所述目标短句,获取所述维度词对应的共线维度词;以及
第七生成单元,用于根据所述共线维度词,生成所述第一情感搭配词组的维度词扩充集合。
12.根据权利要求8所述的装置,其中,所述装置还包括:
第二获取模块,用于获取所述情感搭配扩充集合中的第二情感搭配词组;
第三获取模块,用于获取所述第二情感搭配词组中的维度词在所述评论文本中的第一位置;
第四获取模块,用于获取所述第二情感搭配词组中的评价词在所述评论文本中的第二位置;以及
删除模块,用于如果所述第一位置和所述第二位置之间的文本长度超过预设长度,则将所述情感搭配扩充集合中的所述第二情感搭配词组删除。
13.根据权利要求8所述的装置,其中,所述第一情感搭配分析模块,包括:
分词子模块,用于对所述评论文本进行分词处理,以得到所述评论文本的多个分词;
抽取子模块,用于根据所述多个分词对应的词性和所述预设的词性搭配规则,对所述评论文本进行情感搭配抽取,以获取所述评论文本的第二候选情感搭配集合;以及
第二生成子模块,用于根据所述第二候选情感搭配集合,生成所述评论文本的情感搭配集合。
14.根据权利要求13所述的装置,其中,所述第二候选情感搭配集合包括多个第二候选情感搭配词组,所述第二生成子模块,包括:
聚类子单元,用于根据每个所述第二候选情感搭配词组中的维度词的第一语义和评价词的第二语义,对具有相同第一语义和第二语义的第二候选情感搭配词组进行聚类,以得到多个第三候选情感搭配词组;
第二生成子单元,用于根据每个所述第三候选情感搭配词组对应的第二候选情感搭配词组的数量,并按照所述数量从大到小的顺序进行排序,将排列在前预设数量的第三候选情感搭配词组作为所述评论文本的情感搭配集合。
15. 一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010519614.6A CN111832313B (zh) | 2020-06-09 | 2020-06-09 | 文本中情感搭配集合的生成方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010519614.6A CN111832313B (zh) | 2020-06-09 | 2020-06-09 | 文本中情感搭配集合的生成方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111832313A CN111832313A (zh) | 2020-10-27 |
CN111832313B true CN111832313B (zh) | 2023-07-25 |
Family
ID=72898589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010519614.6A Active CN111832313B (zh) | 2020-06-09 | 2020-06-09 | 文本中情感搭配集合的生成方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111832313B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114117042B (zh) * | 2021-11-15 | 2024-07-16 | 盐城天眼察微科技有限公司 | 舆情文本中企业实体的情感预测方法、装置、设备及介质 |
CN114239591B (zh) * | 2021-12-01 | 2023-08-18 | 马上消费金融股份有限公司 | 敏感词识别方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108153856A (zh) * | 2017-12-22 | 2018-06-12 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN109684647A (zh) * | 2019-02-19 | 2019-04-26 | 东北林业大学 | 电影评论情感分析方法及装置 |
CN109800418A (zh) * | 2018-12-17 | 2019-05-24 | 北京百度网讯科技有限公司 | 文本处理方法、装置和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11205103B2 (en) * | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
US10347244B2 (en) * | 2017-04-21 | 2019-07-09 | Go-Vivace Inc. | Dialogue system incorporating unique speech to text conversion method for meaningful dialogue response |
CN107153641B (zh) * | 2017-05-08 | 2021-01-12 | 北京百度网讯科技有限公司 | 评论信息确定方法、装置、服务器及存储介质 |
-
2020
- 2020-06-09 CN CN202010519614.6A patent/CN111832313B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108153856A (zh) * | 2017-12-22 | 2018-06-12 | 北京百度网讯科技有限公司 | 用于输出信息的方法和装置 |
CN109800418A (zh) * | 2018-12-17 | 2019-05-24 | 北京百度网讯科技有限公司 | 文本处理方法、装置和存储介质 |
CN109684647A (zh) * | 2019-02-19 | 2019-04-26 | 东北林业大学 | 电影评论情感分析方法及装置 |
Non-Patent Citations (2)
Title |
---|
电商评论情感挖掘模型;熊乐;饶泓;;南昌大学学报(理科版)(第01期);全文 * |
面向商品评论文本的情感分析与挖掘;李涵昱;钱力;周鹏飞;;情报科学(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111832313A (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110543574B (zh) | 一种知识图谱的构建方法、装置、设备及介质 | |
JP7223785B2 (ja) | 時系列ナレッジグラフ生成方法、装置、デバイス及び媒体 | |
CN111522994B (zh) | 用于生成信息的方法和装置 | |
CN111079442B (zh) | 文档的向量化表示方法、装置和计算机设备 | |
JP7264866B2 (ja) | イベント関係の生成方法、装置、電子機器及び記憶媒体 | |
CN112560479B (zh) | 摘要抽取模型训练方法、摘要抽取方法、装置和电子设备 | |
CN111680145B (zh) | 知识表示学习方法、装置、设备以及存储介质 | |
CN111859982B (zh) | 语言模型的训练方法、装置、电子设备及可读存储介质 | |
US20210216819A1 (en) | Method, electronic device, and storage medium for extracting spo triples | |
CN111967268A (zh) | 文本中的事件抽取方法、装置、电子设备和存储介质 | |
CN111488740B (zh) | 一种因果关系的判别方法、装置、电子设备及存储介质 | |
CN110674314B (zh) | 语句识别方法及装置 | |
CN111783468B (zh) | 文本处理方法、装置、设备和介质 | |
JP2022003537A (ja) | 対話意図の認識方法及び装置、電子機器並びに記憶媒体 | |
CN111078878B (zh) | 文本处理方法、装置、设备及计算机可读存储介质 | |
CN112541359B (zh) | 文档内容识别方法、装置、电子设备及介质 | |
CN111563385A (zh) | 语义处理方法、装置、电子设备和介质 | |
CN112528001B (zh) | 一种信息查询方法、装置及电子设备 | |
CN112330455A (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
CN113516491B (zh) | 推广信息展示方法、装置、电子设备及存储介质 | |
CN110532567A (zh) | 短语的提取方法、装置、电子设备及存储介质 | |
CN111832313B (zh) | 文本中情感搭配集合的生成方法、装置、设备和介质 | |
CN111984774B (zh) | 搜索方法、装置、设备以及存储介质 | |
US20210216710A1 (en) | Method and apparatus for performing word segmentation on text, device, and medium | |
CN112650919A (zh) | 实体资讯分析方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |