CN113656583B - 细粒度情感分析方法、装置、计算机设备及存储介质 - Google Patents
细粒度情感分析方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113656583B CN113656583B CN202110947670.4A CN202110947670A CN113656583B CN 113656583 B CN113656583 B CN 113656583B CN 202110947670 A CN202110947670 A CN 202110947670A CN 113656583 B CN113656583 B CN 113656583B
- Authority
- CN
- China
- Prior art keywords
- text
- attribute
- question
- target
- analyzed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了细粒度情感分析方法、装置、计算机设备及存储介质,涉及人工智能技术,先是对待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果,然后利用疑问句生成策略扩展生成属性疑问句文本以组成属性疑问句文本集,之后再根据疑问句选取策略从属性疑问句文本集中选取属性疑问句文本作为目标属性疑问句文本,最后以目标属性疑问句文本的待分析组合文本作为情感分析模型的输运进行运算得到情感分类结果。实现了基于任意文本进行细粒度情感分析时只需先获取所有实体和属性,然后在进行文本中某一实体的情感分析时充分考虑到其他实体和属性的影响,使得最终进行情感分析的结果更加准确,而且无需利用特殊的网络结构建模使得可扩展性强。
Description
技术领域
本发明涉及人工智能的智能决策技术领域,尤其涉及一种细粒度情感分析方法、装置、计算机设备及存储介质。
背景技术
细粒度情感分析(aspect based sentiment analysis,ABSA)是一个重要的NLP(即自然语言处理)任务,在情感极性分类的基础上,对情感针对的主体、属性进行更深一步的细粒度解读。此任务在舆情分析、对话系统等多个场景非常重要。目前是利用特殊的网络结构建模,细粒度分析输入的句子、针对的实体、具体的属性以及属性对应的情感极性。
这类方法与具体的任务、数据集高度绑定,可扩展性很差。此外,这类方法是分开处理具体对象和属性时,无法引入全局信息,忽略了待分析句子中的其他实体、属性以及属性间的关系,因此很容易引入误解和混淆。
发明内容
本发明实施例提供了一种细粒度情感分析方法、装置、计算机设备及存储介质,旨在解决现有技术中对文本进行细粒度情感分析时是利用特殊的网络结构建模,与具体的任务、数据集高度绑定,可扩展性很差的问题。
第一方面,本发明实施例提供了一种细粒度情感分析方法,其包括:
响应于细粒度情感分析指令,根据所述细粒度情感分析指令获取待分析文本,将所述待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果;
根据所述属性抽取结果中的每一个属性关系数据及所调用的疑问句生成策略,扩展生成属性疑问句文本,由每一个属性关系数据的属性疑问句文本组成属性疑问句文本集;
调用预设的疑问句选取策略,根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本;
获取所述目标属性疑问句文本的目标属性关系数据,由所述目标属性关系数据在所述待分析文本中筛选获取对应的分句,作为目标分句文本;
将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本;以及
调用预先训练的情感分析模型,将所述待分析组合文本输入至所述情感分析模型进行运算,得到与所述待分析组合文本对应的情感分类结果。
第二方面,本发明实施例提供了一种细粒度情感分析装置,其包括:
信息抽取单元,用于响应于细粒度情感分析指令,根据所述细粒度情感分析指令获取待分析文本,将所述待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果;
疑问句文本生成单元,用于根据所述属性抽取结果中的每一个属性关系数据及所调用的疑问句生成策略,扩展生成属性疑问句文本,由每一个属性关系数据的属性疑问句文本组成属性疑问句文本集;
目标文本获取单元,用于调用预设的疑问句选取策略,根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本;
目标分句获取单元,用于获取所述目标属性疑问句文本的目标属性关系数据,由所述目标属性关系数据在所述待分析文本中筛选获取对应的分句,作为目标分句文本;
组合文本获取单元,用于将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本;以及
情感分析单元,用于调用预先训练的情感分析模型,将所述待分析组合文本输入至所述情感分析模型进行运算,得到与所述待分析组合文本对应的情感分类结果。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的细粒度情感分析方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的细粒度情感分析方法。
本发明实施例提供了一种细粒度情感分析方法、装置、计算机设备及存储介质,先是对待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果,然后利用疑问句生成策略扩展生成属性疑问句文本以由每一个属性关系数据的属性疑问句文本组成属性疑问句文本集,之后再根据疑问句选取策略从属性疑问句文本集中选取属性疑问句文本作为目标属性疑问句文本,最后以目标属性疑问句文本的待分析组合文本作为情感分析模型的输运进行运算得到情感分类结果。实现了基于任意文本进行细粒度情感分析时只需先获取所有实体和属性,然后在进行文本中某一实体的情感分析时充分考虑到其他实体和属性的影响,使得最终进行情感分析的结果更加准确,而且无需利用特殊的网络结构建模使得可扩展性强。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的细粒度情感分析方法的应用场景示意图;
图2为本发明实施例提供的细粒度情感分析方法的流程示意图;
图3为本发明实施例提供的细粒度情感分析装置的示意性框图;
图4为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的细粒度情感分析方法的应用场景示意图;图2为本发明实施例提供的细粒度情感分析方法的流程示意图,该细粒度情感分析方法应用于服务器,该方法通过安装于服务器中的应用软件进行执行。
如图2所示,该方法包括步骤S101~S106。
S101、响应于细粒度情感分析指令,根据所述细粒度情感分析指令获取待分析文本,将所述待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果。
在本实施例中,为了更清楚的理解本申请的技术方案,下面对所涉及的执行主体进行详细介绍。本申请以服务器为执行主体描述技术方案。
服务器,其可以对任意用户端上传的待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果。而且还能基于实体抽取结果和属性抽取结果经过一定组合策略组成目标分句文本。而且在服务器中还存储有预先训练的情感分类模型(如BERT模型、RNN模型、LSTM模型等),将所得到的目标分句文本输入至情感分类模型中,即可得到对应的情感分类结果。
用户端,其为用户所使用的智能终端(如智能手机等),用户可操作用户端编辑或选定细粒度情感分析类型文本,将细粒度情感分析类型文本上传至服务器进行细粒度情感分析。
其中,所述实体抽取结果中包括多个实体,所述属性抽取结果中包括多个属性关系数据,每一属性关系数据中均对应一个实体。当服务器接收到用户端上传的待分析文本后,可以通过信息抽取方法获取与所述待分析文本对应的实体抽取结果和属性抽取结果。信息抽取方法(Information Extraction)可用于从自然语言文本中,抽取出特定的事件或事实信息。这些信息通常包括实体(entity)、关系(relation)、事件(event)。信息抽取主要包括三个子任务:关系抽取、命名实体识别、事件抽取。本申请中仅用到其中关系抽取、命名实体识别两个子任务。
在一实施例中,步骤S101包括:
通过实体抽取获取所述待分析文本的实体抽取结果;
通过关系抽取获取所述实体抽取结果中各实体之间的关系,得到三元组提取结果,由三元组提取结果对应组成属性抽取结果。
在本实施例中,与自动摘要相比,信息抽取更有目的性,并能将找到的信息以一定的框架展示。具体的,信息抽取主要包括三个子任务:
1)实体抽取与链指:也就是命名实体识别;
2)关系抽取:通常指的是三元组(triple)抽取,主要用于抽取实体间的关系;
3)事件抽取:相当于一种多元关系的抽取。
在进行关系抽取时,需要先完成实体抽取与链指,在识别出句子中的关键实体后,还需要抽取两个实体或多个实体之间的语义关系。语义关系通常用于连接两个实体,并与实体一起表达文本的主要含义。常见的关系抽取结果可以用SPO结构(即主谓宾结构)的三元组来表示,即(Subject,Predication,Object),如A的老师是B,对应提取的三元组表示为(A,老师,B)。
例如,用户端上传的待分析文本是“小王餐厅的食物很好,但是服务有待提高。小李餐厅虽然食物不咋的,但是位置还是很方便的”(这一待分析文本的原句可用Q1来表示),将所述待分析文本进行信息抽取,得到与所述待分析文本对应的实体抽取结果和属性抽取结果如下:
A1)实体抽取结果包括小王餐厅、小李餐厅;
A2)属性抽取结果包括食物-针对于-小王餐厅、服务-针对于-小王餐厅;食物-针对于-小李餐厅、位置-针对于-小李餐厅。
通过上述的信息抽取处理,对待分析文本包括的所有实体和属性进行了全局分析和获取,有利于后续进一步的文本处理。
S102、根据所述属性抽取结果中的每一个属性关系数据及所调用的疑问句生成策略,扩展生成属性疑问句文本,由每一个属性关系数据的属性疑问句文本组成属性疑问句文本集。
在本实施例中,例如上述示例中,针对原句Q1得到的属性抽取结果包括食物-针对于-小王餐厅、服务-针对于-小王餐厅、食物-针对于-小李餐厅、位置-针对于-小李餐厅,也就是一共包括4个属性关系数据。此时可以分别针对“食物-针对于-小王餐厅”“位置-针对于-小李餐厅”、“食物-针对于-小李餐厅”、“位置-针对于-小李餐厅”这4个属性关系数据调用疑问句生成策略(其中,疑问句生成策略用于以属性关系数据为核心内容生成疑问句,例如以属性关系数据为宾语填充至疑问句模板,这样既可根据属性关系数据扩展生成一个疑问句文本)各自对应生成一个属性疑问句文本,具体如针对“食物-针对于-小王餐厅”生成“你觉得小王餐厅的食物怎么样?”(可记为Q2)这一属性疑问句文本,针对“服务-针对于-小王餐厅”生成“你觉得小王餐厅的服务怎么样?”(可记为Q3)这一属性疑问句文本,针对“食物-针对于-小李餐厅”生成“你觉得小李餐厅的食物怎么样?”(可记为Q4)这一属性疑问句文本,针对“位置-针对于-小李餐厅”生成“你觉得小李餐厅的位置怎么样?”(可记为Q5)这一属性疑问句文本。基于所述属性抽取结果中的每一个属性关系数据,可以快速的扩展出属性疑问句文本。
在一实施例中,作为生成属性疑问句文本的第一实施例,步骤S102包括:
获取所述属性抽取结果中的第i号属性关系数据;其中,i的初始值为1,i的取值范围是[1,N],N表示所述属性抽取结果中属性关系数据的总个数;
调用所述疑问句生成策略对应的疑问句模板,将第i号属性关系数据按照实体及属性的顺序依次填充至疑问句模板,生成与第i号属性关系数据对应的第i号属性疑问句文本;
将i自增1更新i的取值;
若i未超出N,返回执行所述获取所述属性抽取结果中的第i号属性关系数据的步骤;
若i超出N,获取第1号属性关系数据至第N号属性关系数据组成属性疑问句文本集。
在本实施例中,预设的疑问句模板设置为“你觉得……的……怎么样?”,这样将每一属性关系数据按照实体及属性的顺序依次填充至疑问句模板,即可生成Q2为“你觉得小王餐厅的食物怎么样?”,Q3为“你觉得小王餐厅的服务怎么样?”,Q4为“你觉得小李餐厅的食物怎么样?”,Q5为“你觉得小李餐厅的位置怎么样?”,通过这一基于疑问句模板和属性关系数据的疑问句生成方式,迅速将将细粒度情感分析问题(ABSA)转换为问答模式(question answering,QA)。从而使得细粒度情感分析任务变成一个通用的分类任务,与任务本身的具体情况,针对的数据集无关,具有很强的可扩展性。
在一实施例中,作为生成属性疑问句文本的第二实施例,步骤S102包括:
获取所述属性抽取结果中的第i号属性关系数据;其中,i的初始值为1,i的取值范围是[1,N],N表示所述属性抽取结果中属性关系数据的总个数;
随机获取本地疑问句数据库中的其中一个疑问句作为当前选定疑问句文本,将当前选定疑问句文本中的实体及属性由第i号属性关系数据进行替换,生成与第i号属性关系数据对应的第i号属性疑问句文本;
将i自增1更新i的取值;
若i未超出N,返回执行所述获取所述属性抽取结果中的第i号属性关系数据的步骤;
若i超出N,获取第1号属性关系数据至第N号属性关系数据组成属性疑问句文本集。
在本实施例中,与生成属性疑问句文本的第一实施例的不同之处在于,此时并不是基于预设的疑问句模板来生成属性疑问句文本,例如在服务器的本地疑问句数据库中存储有多个疑问句式的样例,此时服务器可以随机选择其中一个疑问句作为当前选定疑问句文本,例如选定了“篮球比赛的精彩程度如何?”作为当前选定疑问句文本,此时以第1号属性关系数据(也即食物-针对于-小王餐厅)为例,将“篮球比赛的精彩程度如何?”中的篮球比赛这一实体及篮球比赛-精彩程度这一属性分别用由第1号属性关系数据进行替换,生成与第1号属性关系数据对应的第1号属性疑问句文本,即“小王餐厅的食物如何?”。通过这一方式,也能快速的基于所述属性抽取结果中的每一个属性关系数据,可以快速的扩展出属性疑问句文本。
S103、调用预设的疑问句选取策略,根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本。
在本实施例中,当获取了属性疑问句文本集,有效根据待分析文本生成了辅助句,此时可以将待分析文本与属性疑问句文本集相结合,由细粒度情感分析任务切换为问答模式。例如,可以根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本Q2作为目标属性疑问句文本,此时将Q2(如“你觉得小王餐厅的食物怎么样?”)与原句Q1中的第一句话“小王餐厅的食物很好”相结合,组成了一个问答文本,此时并不用急于原句Q1做每一句话的细粒度情感分析任务,而是明确的基于一个实体及关系生成一个问答文本,以该问答文本进行情感分析,这样使得情感分析的对象更明确,不会导致情感分析任务所针对的对象复杂化。
在一实施例中,所述疑问句选取策略是依序从所述属性疑问句文本集中选取属性疑问句文本,所述步骤S103包括:
获取所述属性疑问句文本集中的第j号属性疑问句文本;其中,j的初始值为1,j的取值范围是[1,M],M表示所述属性疑问句文本集中属性疑问句文本的总个数;
选定所述第j号属性疑问句文本,作为第j号目标属性疑问句文本;
将j自增1更新j的取值;
若j未超出M,返回执行所述获取所述属性疑问句文本集中的第j号属性疑问句文本的步骤;
若i超出M,获取第1号属性疑问句文本至第M号属性疑问句文本。
在本实施例中,若后续需要针对原句Q1中每一分句(例如以标点符号为划分符号,将原句拆分为多个分句)均转化为对应的问答文本后进情感分类分析,此时可以依序获取所述属性疑问句文本集中选取属性疑问句文本,将每一个属性疑问句文本都选中作为目标属性疑问句文本与对应的问句组合后得到对应的问答文本后进情感分类分析。通过这一方式,可满足针对待分析文本的全文每一分句均进行情感分类分析。
在一实施例中,所述疑问句选取策略是获取用户端根据属性疑问句文本集所选定的属性疑问句文本作为目标属性疑问句文本,所述步骤S103包括:
若检测到用户端根据属性疑问句文本集所选定的属性疑问句,从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本。
在本实施例中,当无需针对待分析文本中的全文每一分句均进行情感分类时,此时可以先将属性疑问句文本集发送至用户端,以提示用户从中选定一个属性疑问句文本作为目标属性疑问句文本,这样一旦在用户端中选定完成并反馈服务器后,服务器即检测到用户端根据属性疑问句文本集所选定的属性疑问句,从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本。通过这一方式,可满足针对待分析文本的目标分句进行情感分类分析。
S104、获取所述目标属性疑问句文本的目标属性关系数据,由所述目标属性关系数据在所述待分析文本中筛选获取对应的分句,作为目标分句文本。
在本实施例中,当选定了所述目标属性疑问句文本后,为了更加精确的分析其在原句中所对应的分句,可以获取所述目标属性疑问句文本对应的目标属性关系数据,这样再根据目标属性关系数据定位目标属性疑问句文本在原句中所对应的分句。
例如,目标属性疑问句文本是“你觉得小王餐厅的食物怎么样?”,其对应的目标属性关系数据是“食物-针对于-小王餐厅”,而“食物-针对于-小王餐厅”这一目标属性关系数据在所述待分析文本中对应的分句是“小王餐厅的食物很好”,故“小王餐厅的食物很好”作为最终的目标分句文本。
S105、将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。
在本实施例中,为了更快速的针对目标分句文本生成问答文本,此时可以直接将将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。例如,将“你觉得小王餐厅的食物怎么样?”这一目标属性疑问句文本与“小王餐厅的食物很好”这一目标分句文本进行组成,得到“你觉得小王餐厅的食物怎么样?小王餐厅的食物很好”这一待分析组合文本。通过这一方式,所抽取出来的待分析组合文本可进行更准确的情感分析,避免了误解和混淆的情况(因为原句中存在多个分句,每一分句均对应一个情感,若以原句为整体进行情感分类,导致分类结果极不准确),提供精准的细粒度情感分析结果。
在一实施例中,步骤S105包括:
若所述目标属性疑问句文本对应的文本个数大于1,将每一目标属性疑问句文本与对应的目标分句文本进行组合,得到每一目标属性疑问句文本的待分析组成子文本并组成待分析组合文本;
若所述目标属性疑问句文本对应的文本个数等于1,按照目标属性疑问句文本位于所述目标分句文本之前的顺序将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。
在本实施例中,通过上述判断是为了区分是针对某一分句进行情感分析,还是针对全文的每一分句均进行情感分析。若是针对某一分句进行情感分析,只需按照目标属性疑问句文本位于所述目标分句文本之前的顺序将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。若是需要针对待分析文本的全句进行细粒度情感分析,需要将每一目标属性疑问句文本与对应的目标分句文本按照目标属性疑问句文本位于所述目标分句文本之前的顺序进行组合,得到与每一目标属性疑问句文本分别对应的待分析组成子文本。
S106、调用预先训练的情感分析模型,将所述待分析组合文本输入至所述情感分析模型进行运算,得到与所述待分析组合文本对应的情感分类结果。
在本实施例中,由于抽取出待分析文本中所有的实体和属性,并且利用预设的策略将其组合起来,生成辅助句,把问题转换成了通用的QA任务,因此能够很自然地引入强大的预训练模型,如:BERT,ERNIE-baidu等,从而具备强大的理解能力和泛化性。例如,最终的情感分类结果为正面情感或负面情感。更具体如“你觉得小王餐厅的食物怎么样?小王餐厅的食物很好”这一待分析组合文本对应的情感分类结果是正面情感。将待分析组合文本输入至所述情感分析模型进行运算的过程是比较成熟的技术,此处不再赘述。
由于使用模型自动抽取文本中的全部实体和属性,并且利用规则,生成辅助句子,将细粒度情感分析(ABSA)任务转换为问答模型。此外,本发明创新地提供全局信息,利用辅助句子,明确告知模型其他实体和属性的存在,从而使得模型能够更好地处理误解和混淆等复杂的情况。
该方法实现了基于任意文本进行细粒度情感分析时只需先获取所有实体和属性,然后在进行文本中某一实体的情感分析时充分考虑到其他实体和属性的影响,使得最终进行情感分析的结果更加准确,而且无需利用特殊的网络结构建模使得可扩展性强。
本发明实施例还提供一种细粒度情感分析装置,该细粒度情感分析装置用于执行前述细粒度情感分析方法的任一实施例。具体地,请参阅图3,图3是本发明实施例提供的细粒度情感分析装置的示意性框图。该细粒度情感分析装置100可以配置于服务器中。
如图3所示,细粒度情感分析装置100包括:信息抽取单元101、疑问句文本生成单元102、目标文本获取单元103、目标分句获取单元104、组合文本获取单元105、情感分析单元106。
信息抽取单元101,用于响应于细粒度情感分析指令,根据所述细粒度情感分析指令获取待分析文本,将所述待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果。
在本实施例中,所述实体抽取结果中包括多个实体,所述属性抽取结果中包括多个属性关系数据,每一属性关系数据中均对应一个实体。当服务器接收到用户端上传的待分析文本后,可以通过信息抽取方法获取与所述待分析文本对应的实体抽取结果和属性抽取结果。信息抽取方法(Information Extraction)可用于从自然语言文本中,抽取出特定的事件或事实信息。这些信息通常包括实体(entity)、关系(relation)、事件(event)。信息抽取主要包括三个子任务:关系抽取、命名实体识别、事件抽取。本申请中仅用到其中关系抽取、命名实体识别两个子任务。
在一实施例中,步骤S101包括:
实体抽取单元,用于通过实体抽取获取所述待分析文本的实体抽取结果;
属性抽取单元,用于通过关系抽取获取所述实体抽取结果中各实体之间的关系,得到三元组提取结果,由三元组提取结果对应组成属性抽取结果。
在本实施例中,与自动摘要相比,信息抽取更有目的性,并能将找到的信息以一定的框架展示。具体的,信息抽取主要包括三个子任务:
1)实体抽取与链指:也就是命名实体识别;
2)关系抽取:通常指的是三元组(triple)抽取,主要用于抽取实体间的关系;
3)事件抽取:相当于一种多元关系的抽取。
在进行关系抽取时,需要先完成实体抽取与链指,在识别出句子中的关键实体后,还需要抽取两个实体或多个实体之间的语义关系。语义关系通常用于连接两个实体,并与实体一起表达文本的主要含义。常见的关系抽取结果可以用SPO结构(即主谓宾结构)的三元组来表示,即(Subject,Predication,Object),如A的老师是B,对应提取的三元组表示为(A,老师,B)。
例如,用户端上传的待分析文本是“小王餐厅的食物很好,但是服务有待提高。小李餐厅虽然食物不咋的,但是位置还是很方便的”(这一待分析文本的原句可用Q1来表示),将所述待分析文本进行信息抽取,得到与所述待分析文本对应的实体抽取结果和属性抽取结果如下:
A1)实体抽取结果包括小王餐厅、小李餐厅;
A2)属性抽取结果包括食物-针对于-小王餐厅、服务-针对于-小王餐厅;食物-针对于-小李餐厅、位置-针对于-小李餐厅。
通过上述的信息抽取处理,对待分析文本包括的所有实体和属性进行了全局分析和获取,有利于后续进一步的文本处理。
疑问句文本生成单元102,用于根据所述属性抽取结果中的每一个属性关系数据及所调用的疑问句生成策略,扩展生成属性疑问句文本,由每一个属性关系数据的属性疑问句文本组成属性疑问句文本集。
在本实施例中,例如上述示例中,针对原句Q1得到的属性抽取结果包括食物-针对于-小王餐厅、服务-针对于-小王餐厅、食物-针对于-小李餐厅、位置-针对于-小李餐厅,也就是一共包括4个属性关系数据。此时可以分别针对“食物-针对于-小王餐厅”“位置-针对于-小李餐厅”、“食物-针对于-小李餐厅”、“位置-针对于-小李餐厅”这4个属性关系数据调用疑问句生成策略(其中,疑问句生成策略用于以属性关系数据为核心内容生成疑问句,例如以属性关系数据为宾语填充至疑问句模板,这样既可根据属性关系数据扩展生成一个疑问句文本)各自对应生成一个属性疑问句文本,具体如针对“食物-针对于-小王餐厅”生成“你觉得小王餐厅的食物怎么样?”(可记为Q2)这一属性疑问句文本,针对“服务-针对于-小王餐厅”生成“你觉得小王餐厅的服务怎么样?”(可记为Q3)这一属性疑问句文本,针对“食物-针对于-小李餐厅”生成“你觉得小李餐厅的食物怎么样?”(可记为Q4)这一属性疑问句文本,针对“位置-针对于-小李餐厅”生成“你觉得小李餐厅的位置怎么样?”(可记为Q5)这一属性疑问句文本。基于所述属性抽取结果中的每一个属性关系数据,可以快速的扩展出属性疑问句文本。
在一实施例中,作为生成属性疑问句文本的第一实施例,疑问句文本生成单元102包括:
第一关系数据获取单元,用于获取所述属性抽取结果中的第i号属性关系数据;其中,i的初始值为1,i的取值范围是[1,N],N表示所述属性抽取结果中属性关系数据的总个数;
第一疑问句文本生成单元,用于调用所述疑问句生成策略对应的疑问句模板,将第i号属性关系数据按照实体及属性的顺序依次填充至疑问句模板,生成与第i号属性关系数据对应的第i号属性疑问句文本;
第一自增单元,用于将i自增1更新i的取值;
第一执行单元,用于若i未超出N,返回执行所述获取所述属性抽取结果中的第i号属性关系数据的步骤;
第二执行单元,用于若i超出N,获取第1号属性关系数据至第N号属性关系数据组成属性疑问句文本集。
在本实施例中,预设的疑问句模板设置为“你觉得……的……怎么样?”,这样将每一属性关系数据按照实体及属性的顺序依次填充至疑问句模板,即可生成Q2为“你觉得小王餐厅的食物怎么样?”,Q3为“你觉得小王餐厅的服务怎么样?”,Q4为“你觉得小李餐厅的食物怎么样?”,Q5为“你觉得小李餐厅的位置怎么样?”,通过这一基于疑问句模板和属性关系数据的疑问句生成方式,迅速将将细粒度情感分析问题(ABSA)转换为问答模式(question answering,QA)。从而使得细粒度情感分析任务变成一个通用的分类任务,与任务本身的具体情况,针对的数据集无关,具有很强的可扩展性。
在一实施例中,作为生成属性疑问句文本的第二实施例,疑问句文本生成单元102包括:
第二关系数据获取单元,用于获取所述属性抽取结果中的第i号属性关系数据;其中,i的初始值为1,i的取值范围是[1,N],N表示所述属性抽取结果中属性关系数据的总个数;
第二疑问句文本生成单元,用于随机获取本地疑问句数据库中的其中一个疑问句作为当前选定疑问句文本,将当前选定疑问句文本中的实体及属性由第i号属性关系数据进行替换,生成与第i号属性关系数据对应的第i号属性疑问句文本;
第二自增单元,用于将i自增1更新i的取值;
第三执行单元,用于若i未超出N,返回执行所述获取所述属性抽取结果中的第i号属性关系数据的步骤;
第四执行单元,用于若i超出N,获取第1号属性关系数据至第N号属性关系数据组成属性疑问句文本集。
在本实施例中,与生成属性疑问句文本的第一实施例的不同之处在于,此时并不是基于预设的疑问句模板来生成属性疑问句文本,例如在服务器的本地疑问句数据库中存储有多个疑问句式的样例,此时服务器可以随机选择其中一个疑问句作为当前选定疑问句文本,例如选定了“篮球比赛的精彩程度如何?”作为当前选定疑问句文本,此时以第1号属性关系数据(也即食物-针对于-小王餐厅)为例,将“篮球比赛的精彩程度如何?”中的篮球比赛这一实体及篮球比赛-精彩程度这一属性分别用由第1号属性关系数据进行替换,生成与第1号属性关系数据对应的第1号属性疑问句文本,即“小王餐厅的食物如何?”。通过这一方式,也能快速的基于所述属性抽取结果中的每一个属性关系数据,可以快速的扩展出属性疑问句文本。
目标文本获取单元103,用于调用预设的疑问句选取策略,根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本。
在本实施例中,当获取了属性疑问句文本集,有效根据待分析文本生成了辅助句,此时可以将待分析文本与属性疑问句文本集相结合,由细粒度情感分析任务切换为问答模式。例如,可以根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本Q2作为目标属性疑问句文本,此时将Q2(如“你觉得小王餐厅的食物怎么样?”)与原句Q1中的第一句话“小王餐厅的食物很好”相结合,组成了一个问答文本,此时并不用急于原句Q1做每一句话的细粒度情感分析任务,而是明确的基于一个实体及关系生成一个问答文本,以该问答文本进行情感分析,这样使得情感分析的对象更明确,不会导致情感分析任务所针对的对象复杂化。
在一实施例中,所述疑问句选取策略是依序从所述属性疑问句文本集中选取属性疑问句文本,所述目标文本获取单元103包括:
第一属性疑问句文本获取单元,用于获取所述属性疑问句文本集中的第j号属性疑问句文本;其中,j的初始值为1,j的取值范围是[1,M],M表示所述属性疑问句文本集中属性疑问句文本的总个数;
第三疑问句文本生成单元,用于选定所述第j号属性疑问句文本,作为第j号目标属性疑问句文本;
第三自增单元,用于将j自增1更新j的取值;
第五执行单元,用于若j未超出M,返回执行所述获取所述属性疑问句文本集中的第j号属性疑问句文本的步骤;
第六执行单元,用于若i超出M,获取第1号属性疑问句文本至第M号属性疑问句文本。
在本实施例中,若后续需要针对原句Q1中每一分句(例如以标点符号为划分符号,将原句拆分为多个分句)均转化为对应的问答文本后进情感分类分析,此时可以依序获取所述属性疑问句文本集中选取属性疑问句文本,将每一个属性疑问句文本都选中作为目标属性疑问句文本与对应的问句组合后得到对应的问答文本后进情感分类分析。通过这一方式,可满足针对待分析文本的全文每一分句均进行情感分类分析。
在一实施例中,所述疑问句选取策略是获取用户端根据属性疑问句文本集所选定的属性疑问句文本作为目标属性疑问句文本,所述目标文本获取单元103还用于:
若检测到用户端根据属性疑问句文本集所选定的属性疑问句,从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本。
在本实施例中,当无需针对待分析文本中的全文每一分句均进行情感分类时,此时可以先将属性疑问句文本集发送至用户端,以提示用户从中选定一个属性疑问句文本作为目标属性疑问句文本,这样一旦在用户端中选定完成并反馈服务器后,服务器即检测到用户端根据属性疑问句文本集所选定的属性疑问句,从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本。通过这一方式,可满足针对待分析文本的目标分句进行情感分类分析。
目标分句获取单元104,用于获取所述目标属性疑问句文本的目标属性关系数据,由所述目标属性关系数据在所述待分析文本中筛选获取对应的分句,作为目标分句文本。
在本实施例中,当选定了所述目标属性疑问句文本后,为了更加精确的分析其在原句中所对应的分句,可以获取所述目标属性疑问句文本对应的目标属性关系数据,这样再根据目标属性关系数据定位目标属性疑问句文本在原句中所对应的分句。
例如,目标属性疑问句文本是“你觉得小王餐厅的食物怎么样?”,其对应的目标属性关系数据是“食物-针对于-小王餐厅”,而“食物-针对于-小王餐厅”这一目标属性关系数据在所述待分析文本中对应的分句是“小王餐厅的食物很好”,故“小王餐厅的食物很好”作为最终的目标分句文本。
组合文本获取单元105,用于将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。
在本实施例中,为了更快速的针对目标分句文本生成问答文本,此时可以直接将将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。例如,将“你觉得小王餐厅的食物怎么样?”这一目标属性疑问句文本与“小王餐厅的食物很好”这一目标分句文本进行组成,得到“你觉得小王餐厅的食物怎么样?小王餐厅的食物很好”这一待分析组合文本。通过这一方式,所抽取出来的待分析组合文本可进行更准确的情感分析,避免了误解和混淆的情况(因为原句中存在多个分句,每一分句均对应一个情感,若以原句为整体进行情感分类,导致分类结果极不准确),提供精准的细粒度情感分析结果。
在一实施例中,组合文本获取单元105包括:
第一组合单元,用于若所述目标属性疑问句文本对应的文本个数大于1,将每一目标属性疑问句文本与对应的目标分句文本进行组合,得到每一目标属性疑问句文本的待分析组成子文本并组成待分析组合文本;
第二组合单元,用于若所述目标属性疑问句文本对应的文本个数等于1,按照目标属性疑问句文本位于所述目标分句文本之前的顺序将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。
在本实施例中,通过上述判断是为了区分是针对某一分句进行情感分析,还是针对全文的每一分句均进行情感分析。若是针对某一分句进行情感分析,只需按照目标属性疑问句文本位于所述目标分句文本之前的顺序将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。若是需要针对待分析文本的全句进行细粒度情感分析,需要将每一目标属性疑问句文本与对应的目标分句文本按照目标属性疑问句文本位于所述目标分句文本之前的顺序进行组合,得到与每一目标属性疑问句文本分别对应的待分析组成子文本。
情感分析单元106,用于调用预先训练的情感分析模型,将所述待分析组合文本输入至所述情感分析模型进行运算,得到与所述待分析组合文本对应的情感分类结果。
在本实施例中,由于抽取出待分析文本中所有的实体和属性,并且利用预设的策略将其组合起来,生成辅助句,把问题转换成了通用的QA任务,因此能够很自然地引入强大的预训练模型,如:BERT,ERNIE-baidu等,从而具备强大的理解能力和泛化性。例如,最终的情感分类结果为正面情感或负面情感。更具体如“你觉得小王餐厅的食物怎么样?小王餐厅的食物很好”这一待分析组合文本对应的情感分类结果是正面情感。将待分析组合文本输入至所述情感分析模型进行运算的过程是比较成熟的技术,此处不再赘述。
由于使用模型自动抽取文本中的全部实体和属性,并且利用规则,生成辅助句子,将细粒度情感分析(ABSA)任务转换为问答模型。此外,本发明创新地提供全局信息,利用辅助句子,明确告知模型其他实体和属性的存在,从而使得模型能够更好地处理误解和混淆等复杂的情况。
该装置实现了基于任意文本进行细粒度情感分析时只需先获取所有实体和属性,然后在进行文本中某一实体的情感分析时充分考虑到其他实体和属性的影响,使得最终进行情感分析的结果更加准确,而且无需利用特殊的网络结构建模使得可扩展性强。
上述细粒度情感分析装置可以实现为计算机程序的形式,该计算机程序可以在如图4所示的计算机设备上运行。
请参阅图4,图4是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图4,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括存储介质503和内存储器504。
该存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行细粒度情感分析方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行细粒度情感分析方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图4中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本发明实施例公开的细粒度情感分析方法。
本领域技术人员可以理解,图4中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图4所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质,也可以为易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本发明实施例公开的细粒度情感分析方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.一种细粒度情感分析方法,其特征在于,包括:
响应于细粒度情感分析指令,根据所述细粒度情感分析指令获取待分析文本,将所述待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果;
根据所述属性抽取结果中的每一个属性关系数据及所调用的疑问句生成策略,扩展生成属性疑问句文本,由每一个属性关系数据的属性疑问句文本组成属性疑问句文本集;
调用预设的疑问句选取策略,根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本;
获取所述目标属性疑问句文本的目标属性关系数据,由所述目标属性关系数据在所述待分析文本中筛选获取对应的分句,作为目标分句文本;
将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本;以及
调用预先训练的情感分析模型,将所述待分析组合文本输入至所述情感分析模型进行运算,得到与所述待分析组合文本对应的情感分类结果;
所述将所述待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果,包括:
通过实体抽取获取所述待分析文本的实体抽取结果;
通过关系抽取获取所述实体抽取结果中各实体之间的关系,得到三元组提取结果,由三元组提取结果对应组成属性抽取结果;
所述将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本,包括:
若所述目标属性疑问句文本对应的文本个数大于1,将每一目标属性疑问句文本与对应的目标分句文本进行组合,得到每一目标属性疑问句文本的待分析组成子文本并组成待分析组合文本;
若所述目标属性疑问句文本对应的文本个数等于1,按照目标属性疑问句文本位于所述目标分句文本之前的顺序将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。
2.根据权利要求1所述的细粒度情感分析方法,其特征在于,所述根据所述属性抽取结果中的每一个属性关系数据及所调用的疑问句生成策略,扩展生成属性疑问句文本,包括:
获取所述属性抽取结果中的第i号属性关系数据;其中,i的初始值为1,i的取值范围是[1,N],N表示所述属性抽取结果中属性关系数据的总个数;
调用所述疑问句生成策略对应的疑问句模板,将第i号属性关系数据按照实体及属性的顺序依次填充至疑问句模板,生成与第i号属性关系数据对应的第i号属性疑问句文本;
将i自增1更新i的取值;
若i未超出N,返回执行所述获取所述属性抽取结果中的第i号属性关系数据的步骤;
若i超出N,获取第1号属性关系数据至第N号属性关系数据组成属性疑问句文本集。
3.根据权利要求1所述的细粒度情感分析方法,其特征在于,所述根据所述属性抽取结果中的每一个属性关系数据及所调用的疑问句生成策略,扩展生成属性疑问句文本,包括:
获取所述属性抽取结果中的第i号属性关系数据;其中,i的初始值为1,i的取值范围是[1,N],N表示所述属性抽取结果中属性关系数据的总个数;
随机获取本地疑问句数据库中的其中一个疑问句作为当前选定疑问句文本,将当前选定疑问句文本中的实体及属性由第i号属性关系数据进行替换,生成与第i号属性关系数据对应的第i号属性疑问句文本;
将i自增1更新i的取值;
若i未超出N,返回执行所述获取所述属性抽取结果中的第i号属性关系数据的步骤;
若i超出N,获取第1号属性关系数据至第N号属性关系数据组成属性疑问句文本集。
4.根据权利要求1所述的细粒度情感分析方法,其特征在于,所述疑问句选取策略是依序从所述属性疑问句文本集中选取属性疑问句文本;
所述根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本,包括:
获取所述属性疑问句文本集中的第j号属性疑问句文本;其中,j的初始值为1,j的取值范围是[1,M],M表示所述属性疑问句文本集中属性疑问句文本的总个数;
选定所述第j号属性疑问句文本,作为第j号目标属性疑问句文本;
将j自增1更新j的取值;
若j未超出M,返回执行所述获取所述属性疑问句文本集中的第j号属性疑问句文本的步骤;
若i超出M,获取第1号属性疑问句文本至第M号属性疑问句文本。
5.根据权利要求1所述的细粒度情感分析方法,其特征在于,所述疑问句选取策略是获取用户端根据属性疑问句文本集所选定的属性疑问句文本作为目标属性疑问句文本;
所述根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本,包括:
若检测到用户端根据属性疑问句文本集所选定的属性疑问句,从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本。
6.一种细粒度情感分析装置,其特征在于,包括:
信息抽取单元,用于响应于细粒度情感分析指令,根据所述细粒度情感分析指令获取待分析文本,将所述待分析文本进行信息抽取,得到实体抽取结果和属性抽取结果;
疑问句文本生成单元,用于根据所述属性抽取结果中的每一个属性关系数据及所调用的疑问句生成策略,扩展生成属性疑问句文本,由每一个属性关系数据的属性疑问句文本组成属性疑问句文本集;
目标文本获取单元,用于调用预设的疑问句选取策略,根据所述疑问句选取策略从所述属性疑问句文本集中选取属性疑问句文本,作为目标属性疑问句文本;
目标分句获取单元,用于获取所述目标属性疑问句文本的目标属性关系数据,由所述目标属性关系数据在所述待分析文本中筛选获取对应的分句,作为目标分句文本;
组合文本获取单元,用于将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本;以及
情感分析单元,用于调用预先训练的情感分析模型,将所述待分析组合文本输入至所述情感分析模型进行运算,得到与所述待分析组合文本对应的情感分类结果;
所述信息抽取单元具体用于:
通过实体抽取获取所述待分析文本的实体抽取结果;
通过关系抽取获取所述实体抽取结果中各实体之间的关系,得到三元组提取结果,由三元组提取结果对应组成属性抽取结果;
所述组合文本获取单元具体用于:
若所述目标属性疑问句文本对应的文本个数大于1,将每一目标属性疑问句文本与对应的目标分句文本进行组合,得到每一目标属性疑问句文本的待分析组成子文本并组成待分析组合文本;
若所述目标属性疑问句文本对应的文本个数等于1,按照目标属性疑问句文本位于所述目标分句文本之前的顺序将所述目标属性疑问句文本与所述目标分句文本进行组合,得到待分析组合文本。
7.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的细粒度情感分析方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至5任一项所述的细粒度情感分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110947670.4A CN113656583B (zh) | 2021-08-18 | 2021-08-18 | 细粒度情感分析方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110947670.4A CN113656583B (zh) | 2021-08-18 | 2021-08-18 | 细粒度情感分析方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113656583A CN113656583A (zh) | 2021-11-16 |
CN113656583B true CN113656583B (zh) | 2023-08-08 |
Family
ID=78480868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110947670.4A Active CN113656583B (zh) | 2021-08-18 | 2021-08-18 | 细粒度情感分析方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113656583B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078881A (zh) * | 2019-12-09 | 2020-04-28 | 携程计算机技术(上海)有限公司 | 细粒度情感分析方法、系统、电子设备和存储介质 |
CN111309849A (zh) * | 2020-02-10 | 2020-06-19 | 南京大学 | 一种基于联合学习模型的细粒度数值信息抽取方法 |
CN111353042A (zh) * | 2020-02-27 | 2020-06-30 | 浙江大学 | 一种基于深度多任务学习的细粒度文本观点分析方法 |
CN111881291A (zh) * | 2020-06-19 | 2020-11-03 | 山东师范大学 | 一种文本情感分类方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150286627A1 (en) * | 2014-04-03 | 2015-10-08 | Adobe Systems Incorporated | Contextual sentiment text analysis |
-
2021
- 2021-08-18 CN CN202110947670.4A patent/CN113656583B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078881A (zh) * | 2019-12-09 | 2020-04-28 | 携程计算机技术(上海)有限公司 | 细粒度情感分析方法、系统、电子设备和存储介质 |
CN111309849A (zh) * | 2020-02-10 | 2020-06-19 | 南京大学 | 一种基于联合学习模型的细粒度数值信息抽取方法 |
CN111353042A (zh) * | 2020-02-27 | 2020-06-30 | 浙江大学 | 一种基于深度多任务学习的细粒度文本观点分析方法 |
CN111881291A (zh) * | 2020-06-19 | 2020-11-03 | 山东师范大学 | 一种文本情感分类方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113656583A (zh) | 2021-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020202601B2 (en) | Utilizing object attribute detection models to automatically select instances of detected objects in images | |
CN111046152B (zh) | Faq问答对自动构建方法、装置、计算机设备及存储介质 | |
CN111666401B (zh) | 基于图结构的公文推荐方法、装置、计算机设备及介质 | |
JP7557379B2 (ja) | 制限自然言語処理 | |
CN106534548B (zh) | 语音纠错方法和装置 | |
JP2018190188A (ja) | 要約生成装置、要約生成方法及びコンピュータプログラム | |
CN105511873B (zh) | 用户界面控件展示方法及装置 | |
DE102019000294A1 (de) | Erstellen unternehmensspezifischer Wissensgraphen | |
CN112417846B (zh) | 文本自动化生成方法、装置、电子设备及存储介质 | |
CN110309289A (zh) | 一种句子生成方法、句子生成装置及智能设备 | |
US20190050376A1 (en) | Automatic value formatting based on intrinsic structural semantics | |
CN108776677B (zh) | 平行语句库的创建方法、设备及计算机可读存储介质 | |
CN114757176A (zh) | 一种获取目标意图识别模型的方法以及意图识别方法 | |
CN113268971B (zh) | 演示报告智能生成方法、装置、计算机设备及存储介质 | |
CN111553138B (zh) | 用于规范内容结构文档的辅助写作方法及装置 | |
CN113836303A (zh) | 一种文本类别识别方法、装置、计算机设备及介质 | |
CN112115252A (zh) | 智能辅助写作处理方法、装置、电子设备及存储介质 | |
CN116974554A (zh) | 代码数据处理方法、装置、计算机设备和存储介质 | |
Kennington et al. | Situated incremental natural language understanding using Markov Logic Networks | |
CN113656583B (zh) | 细粒度情感分析方法、装置、计算机设备及存储介质 | |
CN117093460A (zh) | 评估方法、装置、电子设备及计算机可读存储介质 | |
CN116955406A (zh) | Sql语句生成方法、装置、电子设备及存储介质 | |
CN116681088A (zh) | 一种基于大模型的翻译系统、方法及储存介质 | |
JP7099254B2 (ja) | 学習方法、学習プログラム及び学習装置 | |
DE102023108430A1 (de) | Erzeugung von konversationellen erwiderungen unter verwendung von neuralen netzwerken |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |