CN117743518A - 一种基于多阶段归因的情绪原因对抽取方法及系统 - Google Patents
一种基于多阶段归因的情绪原因对抽取方法及系统 Download PDFInfo
- Publication number
- CN117743518A CN117743518A CN202410186656.0A CN202410186656A CN117743518A CN 117743518 A CN117743518 A CN 117743518A CN 202410186656 A CN202410186656 A CN 202410186656A CN 117743518 A CN117743518 A CN 117743518A
- Authority
- CN
- China
- Prior art keywords
- emotion
- clause
- reason
- self
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 372
- 238000000605 extraction Methods 0.000 title claims abstract description 51
- 238000004458 analytical method Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000012216 screening Methods 0.000 claims abstract description 15
- 230000002996 emotional effect Effects 0.000 claims description 44
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 230000036651 mood Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 2
- 238000012549 training Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 208000013875 Heart injury Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013542 behavioral therapy Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开了一种基于多阶段归因的情绪原因对抽取方法及系统。该方法包括如下步骤:基于大语言模型以及思维链将情绪‑原因对识别任务分解为两个阶段,每个阶段包含两个子任务;其中,第一个子任务为提取任务,用于在用户的自述文本中提取情绪关键词;第二子任务为定位任务,用于在自述文本中定位情绪子句;第三子任务为分析任务,用于找出对应于情绪子句的至少一个原因子句;第四子任务为筛选任务,用于针对情绪子句筛选出最合适的原因子句,并整理情绪‑原因对的文本输出形式,使其易读性更高。由此,利用该方法不仅能够避免情绪被过度解读,提高识别的准确率;而且,无需训练过程,规避了因位置偏差而导致的问题。
Description
技术领域
本发明涉及一种基于多阶段归因的情绪原因对抽取方法,同时也涉及相应的情绪原因对抽取系统,属于自然语言处理技术领域。
背景技术
近年来,智能对话系统在医疗、电商、娱乐等多个领域得到广泛的应用,如数字医生、智能客服等场景。在这些场景中,智能对话系统不仅需要理解用户的所要表达的意图,往往更需要识别用户情绪并找出情绪出现的原因,以提供更接近于真人的服务。由此需求发展出的情绪计算是人工智能领域专注于使机器理解人类情绪的研究方向,并且已在产品评价外挖掘、社交媒体挖掘以及基于网络的认知行为疗法上取得初步应用。
然而,现有的情绪原因识别大量依赖于人工情绪标注,这使得情绪原因识别在实际场景的应用大大受限。情绪原因对抽取(Emotion-Cause Pair Extraction)是近年来提出的一种在文本搜索中自动寻找情绪语句及找到其相应原因的自然语言处理方法。
在公开号为CN110162636A的中国发明专利中,公开了一种基于D-LSTM的文本情绪原因识别方法。该方法首先获取包含情绪描述和候选情绪原因和的文本;分别将情绪描述子句和候选情绪原因子句转化为词嵌入矩阵,然后使用双向长短期记忆网络Bi-LSTM编码子句上下文信息,将经过编码后的情绪描述子句表征与编码后的候选情绪原因子句表征分别拼接组成一个向量,在此基础上使用多层感知机网络MLP以分类的方式判定二者是否存在匹配关系。如果两者匹配则表明当前原因子句是给定的情绪描述子句的原因,即找到了一个情绪原因对。然而,该方法的缺点在于:需要事先给定文本中的情绪子句和候选原因子句集,在实际应用场景中,需要分析的文本通常并没有标注好情绪子句和原因子句,因此该方法的使用价值相对较低。
另外,在公开号为CN114817566A的中国发明专利中,公开了一种基于情绪嵌入的情绪原因对抽取方法。该方法通过词嵌入获得输入文本的词嵌入表征;通过情绪编码,获得情绪子句级特征表示;通过原因编码,获得原因子句级特征表示;然后利用情绪原因对编码,获得情绪原因对特征编码;将所有识别出的情绪子句和原因子句两两组合配对,将配对后的组合构成一个“子句对图”,在此基础上使用图卷积神经网络对图中的每个结点进行分类,判断其是否构成一个情绪原因对。然而,该方法的缺点在于需要先分别识别出情绪子句和原因子句,再穷举所有的组合并使用图卷积神经网络判断每个组合是否为情绪原因对。这种两阶段的方案会导致错误传递问题,即第一步识别情绪子句和原因子句带来的错误结果会影响第二步的分类结果。
发明内容
本发明所要解决的首要技术问题在于提供一种基于多阶段归因的情绪原因对抽取方法。
本发明所要解决的另一技术问题在于提供一种基于多阶段归因的情绪原因对抽取系统。
为实现上述技术目的,本发明采用以下的技术方案:
根据本发明实施例的第一方面,提供一种基于多阶段归因的情绪原因对抽取方法,包括如下步骤:
获取用户的自述文本;
利用大语言模型的第一子任务,基于第一预设程序识别所述自述文本包含的全部情绪关键词,形成情绪关键词集合;
利用大语言模型的第二子任务,基于第二预设程序在所述自述文本中定位与所述情绪关键词集合中的各个情绪关键词分别对应的情绪子句,形成情绪子句集合;其中,若任意一个所述情绪关键词在所述自述文本中无法定位到相应地情绪子句,则将该情绪关键词删除;
利用大语言模型的第三子任务,通过思维链原理并基于第三预设程序对所述情绪子句集合进行思维分析,以推导出各所述情绪子句的形成原因并判断所述形成原因是否能够被定位在所述自述文本的特定位置,形成原因子句集合;其中,若任意一个所述情绪子句无法推导出确切的形成原因,或任意一个所述形成原因无法被定位在所述自述文本的特定位置,则删除该情绪子句与其对应的情绪关键词的组合;
利用大语言模型的第四子任务,基于第四预设程序对所述原因子句集合进行筛选,以针对每一个所述情绪子句筛选出最合适的原因子句,从而输出最终的情绪-原因对。
其中较优地,所述情绪关键词集合通过以下方式形成:
对所述自述文本进行词语识别,以识别出所述自述文本中明确的情绪词;
对所述自述文本进行语义识别,以识别出所述自述文本中隐含的情绪词;
其中,所述明确的情绪词与所述隐含的情绪词共同构成所述情绪关键词集合。
其中较优地,所述情绪子句集合通过以下方式形成:
选定任意一个情绪关键词,判断所述自述文本中是否存在直接包含该情绪关键词的情绪子句;若存在,则将该情绪子句作为该情绪关键词的情绪子句;
若不存在,则通过所述第二预设程序对所述自述文本进行语义分析,以确定与该情绪关键词相对应的段落,并对段落中的每一个子句逐条进行分析语义,以判断各子句是否与情绪关键词相对应,直至找出与选定的情绪关键词相对应的情绪子句;
重复上述步骤,直至找出所有情绪关键词对应的情绪子句,以形成情绪子句集合。
其中较优地,所述思维分析过程具体包括:
基于思维链原理形成的思维分析链条对预定的情绪子句进行思维分析;
判断所述思维分析链条是否可以成功的推导出所述情绪子句的形成原因;
若推导成功,则进入下一步,若推导失败,则舍弃所述情绪子句及其对应的情绪关键词;
判断所述情绪子句的形成原因是否能够被定位在所述自述文本中的特定位置;
若能够定位,则将所定位的原因子句加入到原因子句集合中,若无法定位,则舍弃所述情绪子句及其对应的情绪关键词;
其中,所述思维分析链条ac={Reasoning(ec,D)|ec∈EC};
ac表示思维分析链条,ec表示预定的情绪子句,EC表示所有情绪子句的集合,D表示所述自述文本。
其中较优地,所述筛选过程具体包括:
选定待输出的情绪子句;
基于所述待输出的情绪子句,从所述原因子句集合中获取相对应的至少一个原因子句;
从所述至少一个原因子句中筛选出概率最大的原因子句;
基于所述待输出的情绪子句及筛选出的概率最大的原因子句输出情绪-原因对;
重复上述过程,直至输出全部的情绪-原因对;
其中,所述情绪-原因对通过下式进行表示:
Pairs表示输出值,输出值为情绪-原因对;ec表示待输出的情绪子句;EC表示待输出的所有情绪子句的集合;cc表示待输出的情绪子句的形成原因;表示待输出的情绪子句概率最大的形成原因,应使得的(cc|ec, ac)的概率P最大。
其中较优地,若所述第二子任务中,一个情绪关键词定位出多个对应的情绪子句;则各所述情绪子句与该情绪关键词的对应关系相互独立;
在所述第三子任务中,基于所述情绪关键词所对应的多个情绪子句分别进行独立的思维分析,以分别判断是否将思维分析结果加入所述原因子句集合。
其中较优地,若所述第二子任务中,多个情绪关键词定位同一个情绪子句,则各所述情绪关键词与所述情绪子句的对应关系相互独立;
在所述第三子任务中,基于所述情绪子句进行思维分析,并分别基于各所述情绪关键词进行原因子句的定位,以分别判断是否将思维分析结果加入所述原因子句集合。
其中较优地,所述情绪原因对抽取方法还包括:
额外使用一个分类器识别出每一个所述情绪子句对应的情绪类别;
根据所述情绪子句、对应的原因子句和对应的情绪类别,输出所述自述文本中所有的<情绪子句,原因子句,情绪类别>三元组。
根据本发明实施例的第二方面,提供一种基于多阶段归因的情绪原因对抽取系统,包括:
数据采集单元,用于获取自述文本;
模型识别单元,内置有大语言模型,并与所述数据采集单元连接,以用于对所述自述文本进行情绪原因对的抽取;
其中,所述大语言模型包括:
第一子任务模块,内置有第一预设程序并与所述数据采集单元连接,以用于识别所述自述文本包含的全部情绪关键词,形成情绪关键词集合;
第二子任务模块,内置有第二预设程序并与所述第一子任务模块连接,以用于在所述自述文本中定位与所述情绪关键词集合中的各个情绪关键词分别对应的情绪子句,形成情绪子句集合;其中,若任意一个所述情绪关键词在所述自述文本中无法定位到相应地情绪子句,则将该情绪关键词删除;
第三子任务模块,内置有第三预设程序并与所述第二子任务模块连接,以用于通过思维链原理对所述情绪子句集合进行思维分析,以推导出各所述情绪子句的形成原因并判断所述形成原因是否能够被定位在所述自述文本的特定位置,形成原因子句集合;其中,若任意一个所述情绪子句无法推导出确切的形成原因,或任意一个所述形成原因无法被定位在所述自述文本的特定位置,则删除该情绪子句与其对应的情绪关键词的组合;
第四子任务模块,内置有第四预设程序并与所述第三子任务模块连接,以用于对所述原因子句集合进行筛选,以针对每一个所述情绪子句筛选出最合适的原因子句,从而输出最终的情绪-原因对。
根据本发明实施例的第三方面,提供一种基于多阶段归因的情绪原因对抽取系统,包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行以下操作:
获取自述文本;
利用大语言模型的第一子任务,基于第一预设程序识别所述自述文本包含的全部情绪关键词,形成情绪关键词集合;
利用大语言模型的第二子任务,基于第二预设程序在所述自述文本中定位与所述情绪关键词集合中的各个情绪关键词分别对应的情绪子句,形成情绪子句集合;其中,若任意一个所述情绪关键词在所述自述文本中无法定位到相应地情绪子句,则将该情绪关键词删除;
利用大语言模型的第三子任务,通过思维链原理并基于第三预设程序对所述情绪子句集合进行思维分析,以推导出各所述情绪子句的形成原因并判断所述形成原因是否能够被定位在所述自述文本的特定位置,形成原因子句集合;其中,若任意一个所述情绪子句无法推导出确切的形成原因,或任意一个所述形成原因无法被定位在所述自述文本的特定位置,则删除该情绪子句与其对应的情绪关键词的组合;
利用大语言模型的第四子任务,基于第四预设程序对所述原因子句集合进行筛选,以针对每一个所述情绪子句筛选出最合适的原因子句,从而输出最终的情绪-原因对。
与现有技术相比较,本发明具有以下的技术效果:
1. 本发明实施例提供的情绪原因对抽取方法,为情绪原因识别任务设计了一个分解式多阶段的思维链框架,创造性的提出为情绪归因过程添加定位步骤,使得情绪避免被过度解读,有效提高了识别的准确率。
2. 本发明实施例提供的情绪原因对抽取方法基于大语言模型,无需训练过程,规避了现有方法中存在的位置偏差导致的问题。
附图说明
图1为本发明第一实施例提供的一种基于多阶段归因的情绪原因对抽取方法的整体流程图;
图2为利用本发明第一实施例方法实际抽取情绪原因对的案例示意图;
图3为本发明第二实施例提供的一种基于多阶段归因的情绪原因对抽取方法的整体流程图;
图4为本发明第三实施例提供的一种基于多阶段归因的情绪原因对抽取系统的结构图;
图5为本发明第四实施例提供的另一种基于多阶段归因的情绪原因对抽取系统的结构图。
具体实施方式
下面结合附图和具体实施例对本发明的技术内容进行详细具体的说明。
本发明实施例中,尝试将一种基于大语言模型(Large Language Model, 简写为LLM)的方法用于解决情绪-原因对识别任务。目前,大语言模型已经被广泛用于处理自然语言处理领域的很多任务,然而由于情绪-原因对识别任务的复杂性,直接使用大语言模型解决情绪-原因对识别任务往往效果不佳。在本发明的一个实施例中,基于大语言模型以及思维链(Chain of Thought)将情绪-原因对识别任务分解为两个阶段,每个阶段包含两个子任务,共计四个子任务。
第一阶段为情绪抽取(Emotion Extraction)阶段。第一阶段包含第一子任务和第二子任务。其中,第一个子任务为提取任务,在此任务中,会提示(Prompt)大语言模型在用户的自述文本中抽取直接和间接的带有情绪的表达。第二个子任务为定位任务,在此任务中,会提示大语言模型进行情绪子句的定位,并剪切掉部分噪声输出,使得进入到第三个子任务的情绪子句数据质量更高。
第二阶段为原因抽取(Cause Extraction)阶段。第二阶段包含第三子任务和第四子任务。其中,第三个子任务为分析任务,在此任务中,会给予大语言模型提示,找到相应的情绪原因,即:对应于情绪子句的至少一个原因子句。第四子任务为筛选任务。在此任务中,主要用于针对情绪子句筛选出最合适的原因子句,并整理情绪-原因对的文本输出形式,使其易读性更高。
第一实施例
如图1所示,本发明第一实施例提供的一种基于多阶段归因的情绪原因对抽取方法,具体包括步骤S1~S5:
S1:获取用户的自述文本。
具体的,当需要对用户进行情绪识别时,可让用户针对近期发生的事情发表一些看法,或基于某一现象发表自己的想法,从而形成用户待测试的自述文本。
可以理解的是,在本发明的一个实施例中,该自述文本的最终形式为一段带标点符号的文字,具体的获取方式可根据需要而定。例如:可以让用户口述一段语音,然后基于该语音转化为所需的文本信息;或者,直接让用户采用打字的方式进行文字输入,从而直接获取文本信息。
S2:识别情绪关键词,形成情绪关键词集合。
本实施例中,利用大语言模型的第一子任务,基于第一预设程序(本实施例中为预先编写好的代码脚本)识别自述文本包含的全部情绪关键词,形成情绪关键词集合。
具体的,包括步骤S21~S23:
S21:对自述文本进行词语识别,以识别出自述文本中明确的情绪词。例如:愤怒、开心、伤心、害怕等明显带有情绪色彩的词语。
S22:对自述文本进行语义识别,以识别出自述文本中隐含的情绪词。可以理解的是,该隐含的情绪词为大语言模型根据上下文语义自行理解出的情绪词,可能会存在过度理解的情况,因此,后续会进行数据的过滤(详见步骤S3)。
S23:利用明确的情绪词与隐含的情绪词共同构成情绪关键词集合。
S3:定位情绪子句,形成情绪子句集合。
当基于步骤S2形成情绪关键词集合后,将该情绪关键词集合的数据传输至大语言模型的第二子任务,以基于第二预设程序(本实施例中为预先编写好的代码脚本)在自述文本中定位与情绪关键词集合中的各个情绪关键词分别对应的情绪子句,形成情绪子句集合。其中,若任意一个情绪关键词在自述文本中无法定位到相应地情绪子句,则将该情绪关键词删除。
具体的,包括步骤S31~S33:
S31:选定任意一个情绪关键词,判断自述文本中是否存在直接包含该情绪关键词的情绪子句;若存在,则将该情绪子句作为该情绪关键词的情绪子句。
S32:若不存在,则通过第二预设程序对自述文本进行语义分析,以确定与该情绪关键词相对应的段落,并对段落中的每一个子句逐条进行分析语义,以判断各子句是否与情绪关键词相对应,直至找出与选定的情绪关键词相对应的情绪子句。
S33:重复上述步骤S31~S32,直至找出所有情绪关键词对应的情绪子句。
可以理解的是,在该步骤S3中,通过第二预设程序能够寻找情绪词在自述文本中的出处,并且,能够过滤掉由于大语言模型过度理解而输出的不恰当的情绪词。由此,可避免情绪被过度解读,可提高进入到第三子任务的情绪子句的数据质量,从而有效提高了情绪-原因对识别的准确率。
此外,在上述实施例中,若第二子任务中,一个情绪关键词定位出多个对应的情绪子句;则各情绪子句与该情绪关键词的对应关系相互独立。相应地,在第三子任务中,基于情绪关键词所对应的多个情绪子句分别进行独立的思维分析,以分别判断是否将思维分析结果加入原因子句集合。
类似的,在上述实施例中,若第二子任务中,多个情绪关键词定位同一个情绪子句,则各情绪关键词与情绪子句的对应关系相互独立。相应地,在第三子任务中,基于情绪子句进行思维分析,并分别基于各情绪关键词进行原因子句的定位,以分别判断是否将思维分析结果加入原因子句集合。
S4:思维分析,形成原因子句集合。
当基于步骤S3定位出情绪子句集合后,将该情绪子句集合的数据传输至大语言模型的第三子任务,以通过思维链原理并基于第三预设程序(本实施例中为预先编写好的代码脚本)对情绪子句集合进行思维分析,从而推导出各情绪子句的形成原因,并判断该形成原因是否能够被定位在自述文本的特定位置,从而形成原因子句集合。其中,若任意一个情绪子句无法推导出确切的形成原因,或任意一个形成原因无法被定位在自述文本的特定位置,则删除该情绪子句与其对应的情绪关键词的组合。
具体的,包括步骤S41~S45:
S41:基于思维链原理形成的思维分析链条对预定的情绪子句进行思维分析。
S42:判断思维分析链条是否可以成功的推导出预定的情绪子句的形成原因。
S43:若推导成功,则进入下一步,若推导失败,则舍弃预定的情绪子句及其对应的情绪关键词。
S44:判断预定的情绪子句的形成原因是否能够被定位在自述文本中的特定位置。
S45:若能够定位,则将所定位的原因子句加入到原因子句集合中,若无法定位,则舍弃预定的情绪子句及其对应的情绪关键词。
其中,思维分析链条ac={Reasoning(ec,D)|ec∈EC};
ac表示思维分析链条,ec表示情绪子句,EC表示所有情绪子句的集合,D表示所述自述文本。
S5:针对每一个情绪子句筛选出最合适的原因子句,以输出最终的情绪-原因对。
当基于步骤S4的分析形成原因子句集合后,将该原因子句集合的数据传输至大语言模型的第四子任务,以基于第四预设程序(本实施例中为预先编写好的代码脚本)对原因子句集合进行筛选,从而针对每一个情绪子句筛选出最合适的原因子句,输出最终的情绪-原因对。
具体的,包括步骤S51~S55:
S51:选定待输出的情绪子句。
S52:基于待输出的情绪子句,从原因子句集合中获取相对应的至少一个原因子句。
S53:从至少一个原因子句中筛选出概率最大的原因子句。
S54:基于待输出的情绪子句及筛选出的概率最大的原因子句输出情绪-原因对。
S55:重复上述过程S51~S54,直至输出全部的情绪-原因对。
其中,情绪-原因对通过下式进行表示:
Pairs表示输出值,输出值为情绪-原因对;ec表示待输出的情绪子句;EC表示待输出的所有情绪子句的集合;cc表示待输出的情绪子句的形成原因;表示待输出的情绪子句概率最大的形成原因,应使得的(cc|ec, ac)的概率P最大。
下面结合图2,通过一个实际案例对本发明第一实施例的具体步骤进行说明:
第一步,获取自述文本,即图2中的C1-C10。
第二步,通过大语言模型的第一子任务提取关键词,即图2中的E1悲哀、E2愤怒、E3担心和E4惊讶。
可以理解的是,“E1悲哀”和“E3担心”这两个情绪词直接出现在原始文本中,但是“E4惊讶”是大语言模型对文本进行总结归纳后的输出词。“E2愤怒”则可能是大语言模型因过度理解而输出的情绪词。
第三步,通过大语言模型的第二子任务定位情绪子句,即图2中的EC1、EC3和EC4。
可以理解的是,该步骤中,情绪词E1悲哀可以定位到原始文本C2中,此时称C2为情绪子句EC1。同理,可将情绪词E3担心和E4惊讶分别定位到原文相应的情绪子句EC3和EC4中。然而,情绪词E2愤怒无法在原文中找到相应的明显出处,因此,在这一步将E2愤怒过滤,不让其进入到第三个子任务中。
第四步,通过大语言模型的第三子任务找出情绪子句的形成原因,即图2中的AC1、AC3和AC4。
可以理解的是,由于“E1悲哀”无法在原文中找到具体的原因,所以被舍弃。因此,只有E3、E4、EC3和EC4进入到第四个子任务中。
第五步,通过大语言模型的第四子任务输出最终的情绪-原因对,即图2中的EC3-CC3情绪-原因对。
可以理解的是,由于E4惊讶无法锁定到一个具体的句子中,因此在此步骤被舍弃,最终的输出结果为EC3-CC3情绪-原因对。
综上可知,本发明第一实施例提供的基于多阶段归因的情绪原因对抽取方法,为情绪原因识别任务设计了一个分解式多阶段的思维链框架,创造性的提出为情绪归因过程添加定位步骤,使得情绪避免被过度解读,有效提高了识别的准确率。并且,基于大语言模型,无需训练过程,规避了现有方法中存在的位置偏差导致的问题。
第二实施例
如图3所示,在上述第一实施例的基础上,本发明第二实施例还提供一种基于多阶段归因的情绪原因对抽取方法,与第一实施例相比,该实施例的区别之处在于,还包括情绪类别的识别。
具体的,本实施例中,还包括:
S6:识别各情绪子句的情绪类别,输出自述文本中所有的<情绪子句,原因子句,情绪类别>三元组。
具体的,包括步骤S61~S62:
S61:额外使用一个分类器识别出每一个情绪子句对应的情绪类别。
具体的,在本发明的一个实施例中,预先定义情绪类别个数为K,采用一个基于softmax函数的K分类器作为情绪类别的分类器。
S62:根据情绪子句、对应的原因子句和对应的情绪类别,输出自述文本中所有的<情绪子句,原因子句,情绪类别>三元组。
S62:根据情绪子句、对应的原因子句和对应的情绪类别,输出自述文本中所有的<情绪子句,原因子句,情绪类别>三元组。
本实施例除上述区别之外,其余步骤与第一实施例均相同,在此不再赘述。
第三实施例
如图4所示,在上述第一实施例的基础上,本发明第三实施例还提供一种基于多阶段归因的情绪原因对抽取系统,包括数据采集单元10和模型识别单元20。其中,数据采集单元10用于获取自述文本;模型识别单元20内置有大语言模型,并与数据采集单元10连接,以用于对自述文本进行情绪原因对的抽取。
具体的,在本实施例中,大语言模型包括:
第一子任务模块201,内置有第一预设程序并与数据采集单元连接,以用于识别自述文本包含的全部情绪关键词,形成情绪关键词集合。
第二子任务模块202,内置有第二预设程序并与第一子任务模块201连接,以用于在自述文本中定位与情绪关键词集合中的各个情绪关键词分别对应的情绪子句,形成情绪子句集合。其中,若任意一个情绪关键词在自述文本中无法定位到相应地情绪子句,则将该情绪关键词删除。
第三子任务模块203,内置有第三预设程序并与第二子任务模块202连接,以用于通过思维链原理对情绪子句集合进行思维分析,以推导出各情绪子句的形成原因并判断形成原因是否能够被定位在自述文本的特定位置,形成原因子句集合。其中,若任意一个情绪子句无法推导出确切的形成原因,或任意一个形成原因无法被定位在自述文本的特定位置,则删除该情绪子句与其对应的情绪关键词的组合。
第四子任务模块204,内置有第四预设程序并与第三子任务模块203连接,以用于对原因子句集合进行筛选,以针对每一个情绪子句筛选出最合适的原因子句,从而输出最终的情绪-原因对。
第四实施例
如图5所示,在上述基于多阶段归因的情绪原因对抽取方法的基础上,本发明进一步提供一种基于多阶段归因的情绪原因对抽取系统。该情绪原因对抽取系统包括一个或多个处理器21和存储器22。其中,存储器22与处理器21耦接,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器21执行,使得所述一个或多个处理器21实现如上述实施例中的基于多阶段归因的情绪原因对抽取方法。
其中,处理器21用于控制该情绪原因对抽取系统的整体操作,以完成上述基于多阶段归因的情绪原因对抽取方法的全部或部分步骤。该处理器21可以是中央处理器(CPU)、图形处理器(GPU)、现场可编程逻辑门阵列(FPGA)、专用集成电路(ASIC)、数字信号处理(DSP)芯片等。存储器22用于存储各种类型的数据以支持在该情绪原因对抽取系统的操作,这些数据例如可以包括用于在该情绪原因对抽取系统上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器22可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、快闪存储器等。
在一个示例性实施例中,该情绪原因对抽取系统具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现,用于执行上述的基于多阶段归因的情绪原因对抽取方法,并达到如上述方法一致的技术效果。一种典型的实施例为计算机。具体地说,计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在另一个示例性实施例中,本发明还提供一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述任意一个实施例中的基于多阶段归因的情绪原因对抽取方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由情绪原因对抽取系统的处理器执行以完成上述的基于多阶段归因的情绪原因对抽取方法,并达到如上述方法一致的技术效果。
需要说明的是,上述多个实施例只是举例,各个实施例的技术方案之间可以进行组合,均在本发明的保护范围内。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
上面对本发明提供的基于多阶段归因的情绪原因对抽取方法及系统进行了详细的说明。对本领域的一般技术人员而言,在不背离本发明实质内容的前提下对它所做的任何显而易见的改动,都将构成对本发明专利权的侵犯,将承担相应的法律责任。
Claims (10)
1.一种基于多阶段归因的情绪原因对抽取方法,其特征在于包括:
获取用户的自述文本;
利用大语言模型的第一子任务,基于第一预设程序识别所述自述文本包含的全部情绪关键词,形成情绪关键词集合;
利用大语言模型的第二子任务,基于第二预设程序在所述自述文本中定位与所述情绪关键词集合中的各个情绪关键词分别对应的情绪子句,形成情绪子句集合;其中,若任意一个所述情绪关键词在所述自述文本中无法定位到相应地情绪子句,则将该情绪关键词删除;
利用大语言模型的第三子任务,通过思维链原理并基于第三预设程序对所述情绪子句集合进行思维分析,以推导出各所述情绪子句的形成原因并判断所述形成原因是否能够被定位在所述自述文本的特定位置,形成原因子句集合;其中,若任意一个所述情绪子句无法推导出确切的形成原因,或任意一个所述形成原因无法被定位在所述自述文本的特定位置,则删除该情绪子句与其对应的情绪关键词的组合;
利用大语言模型的第四子任务,基于第四预设程序对所述原因子句集合进行筛选,以针对每一个所述情绪子句筛选出最合适的原因子句,从而输出最终的情绪-原因对。
2.如权利要求1所述的情绪原因对抽取方法,其特征在于所述情绪关键词集合通过以下方式形成:
对所述自述文本进行词语识别,以识别出所述自述文本中明确的情绪词;
对所述自述文本进行语义识别,以识别出所述自述文本中隐含的情绪词;
其中,所述明确的情绪词与所述隐含的情绪词共同构成所述情绪关键词集合。
3.如权利要求1所述的情绪原因对抽取方法,其特征在于所述情绪子句集合通过以下方式形成:
选定任意一个情绪关键词,判断所述自述文本中是否存在直接包含该情绪关键词的情绪子句;若存在,则将该情绪子句作为该情绪关键词的情绪子句;
若不存在,则通过所述第二预设程序对所述自述文本进行语义分析,以确定与该情绪关键词相对应的段落,并对段落中的每一个子句逐条进行分析语义,以判断各子句是否与情绪关键词相对应,直至找出与选定的情绪关键词相对应的情绪子句;
重复上述步骤,直至找出所有情绪关键词对应的情绪子句,以形成情绪子句集合。
4.如权利要求1所述的情绪原因对抽取方法,其特征在于所述思维分析过程具体包括:
基于思维链原理形成的思维分析链条对预定的情绪子句进行思维分析;
判断所述思维分析链条是否可以成功的推导出所述情绪子句的形成原因;
若推导成功,则进入下一步,若推导失败,则舍弃所述情绪子句及其对应的情绪关键词;
判断所述情绪子句的形成原因是否能够被定位在所述自述文本中的特定位置;
若能够定位,则将所定位的原因子句加入到原因子句集合中,若无法定位,则舍弃所述情绪子句及其对应的情绪关键词;
其中,所述思维分析链条ac={Reasoning(ec,D)|ec∈EC};
ac表示思维分析链条,ec表示情绪子句,EC表示所有情绪子句的集合,D表示所述自述文本。
5.如权利要求4所述的情绪原因对抽取方法,其特征在于所述筛选过程具体包括:
选定待输出的情绪子句;
基于所述待输出的情绪子句,从所述原因子句集合中获取相对应的至少一个原因子句;
从所述至少一个原因子句中筛选出概率最大的原因子句;
基于所述待输出的情绪子句及筛选出的概率最大的原因子句输出情绪-原因对;
重复上述过程,直至输出全部的情绪-原因对;
其中,所述情绪-原因对通过下式进行表示:
Pairs表示输出值,输出值为情绪-原因对;ec表示待输出的情绪子句;EC表示待输出的所有情绪子句的集合;cc表示待输出的情绪子句的形成原因;表示待输出的情绪子句概率最大的形成原因,应使得的(cc|ec, ac)的概率P最大;ac表示思维分析链条。
6.如权利要求1所述的情绪原因对抽取方法,其特征在于:
若所述第二子任务中,一个情绪关键词定位出多个对应的情绪子句;则各所述情绪子句与该情绪关键词的对应关系相互独立;
在所述第三子任务中,基于所述情绪关键词所对应的多个情绪子句分别进行独立的思维分析,以分别判断是否将思维分析结果加入所述原因子句集合。
7.如权利要求1所述的情绪原因对抽取方法,其特征在于:
若所述第二子任务中,多个情绪关键词定位同一个情绪子句,则各所述情绪关键词与所述情绪子句的对应关系相互独立;
在所述第三子任务中,基于所述情绪子句进行思维分析,并分别基于各所述情绪关键词进行原因子句的定位,以分别判断是否将思维分析结果加入所述原因子句集合。
8.如权利要求1所述的情绪原因对抽取方法,其特征在于还包括:
额外使用一个分类器识别出每一个所述情绪子句对应的情绪类别;
根据所述情绪子句、对应的原因子句和对应的情绪类别,输出所述自述文本中所有的<情绪子句,原因子句,情绪类别>三元组。
9.一种基于多阶段归因的情绪原因对抽取系统,其特征在于包括:
数据采集单元,用于获取自述文本;
模型识别单元,内置有大语言模型,并与所述数据采集单元连接,以用于对所述自述文本进行情绪原因对的抽取;
其中,所述大语言模型包括:
第一子任务模块,内置有第一预设程序并与所述数据采集单元连接,以用于识别所述自述文本包含的全部情绪关键词,形成情绪关键词集合;
第二子任务模块,内置有第二预设程序并与所述第一子任务模块连接,以用于在所述自述文本中定位与所述情绪关键词集合中的各个情绪关键词分别对应的情绪子句,形成情绪子句集合;其中,若任意一个所述情绪关键词在所述自述文本中无法定位到相应地情绪子句,则将该情绪关键词删除;
第三子任务模块,内置有第三预设程序并与所述第二子任务模块连接,以用于通过思维链原理对所述情绪子句集合进行思维分析,以推导出各所述情绪子句的形成原因并判断所述形成原因是否能够被定位在所述自述文本的特定位置,形成原因子句集合;其中,若任意一个所述情绪子句无法推导出确切的形成原因,或任意一个所述形成原因无法被定位在所述自述文本的特定位置,则删除该情绪子句与其对应的情绪关键词的组合;
第四子任务模块,内置有第四预设程序并与所述第三子任务模块连接,以用于对所述原因子句集合进行筛选,以针对每一个所述情绪子句筛选出最合适的原因子句,从而输出最终的情绪-原因对。
10.一种基于多阶段归因的情绪原因对抽取系统,其特征在于包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行以下操作:
获取自述文本;
利用大语言模型的第一子任务,基于第一预设程序识别所述自述文本包含的全部情绪关键词,形成情绪关键词集合;
利用大语言模型的第二子任务,基于第二预设程序在所述自述文本中定位与所述情绪关键词集合中的各个情绪关键词分别对应的情绪子句,形成情绪子句集合;其中,若任意一个所述情绪关键词在所述自述文本中无法定位到相应地情绪子句,则将该情绪关键词删除;
利用大语言模型的第三子任务,通过思维链原理并基于第三预设程序对所述情绪子句集合进行思维分析,以推导出各所述情绪子句的形成原因并判断所述形成原因是否能够被定位在所述自述文本的特定位置,形成原因子句集合;其中,若任意一个所述情绪子句无法推导出确切的形成原因,或任意一个所述形成原因无法被定位在所述自述文本的特定位置,则删除该情绪子句与其对应的情绪关键词的组合;
利用大语言模型的第四子任务,基于第四预设程序对所述原因子句集合进行筛选,以针对每一个所述情绪子句筛选出最合适的原因子句,从而输出最终的情绪-原因对。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410186656.0A CN117743518A (zh) | 2024-02-20 | 2024-02-20 | 一种基于多阶段归因的情绪原因对抽取方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410186656.0A CN117743518A (zh) | 2024-02-20 | 2024-02-20 | 一种基于多阶段归因的情绪原因对抽取方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117743518A true CN117743518A (zh) | 2024-03-22 |
Family
ID=90280002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410186656.0A Withdrawn CN117743518A (zh) | 2024-02-20 | 2024-02-20 | 一种基于多阶段归因的情绪原因对抽取方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117743518A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111382565A (zh) * | 2020-03-09 | 2020-07-07 | 南京理工大学 | 基于多标签的情绪-原因对抽取方法及系统 |
CN117349402A (zh) * | 2023-09-07 | 2024-01-05 | 北京智精灵科技有限公司 | 一种基于机器阅读理解的情绪原因对识别方法及系统 |
-
2024
- 2024-02-20 CN CN202410186656.0A patent/CN117743518A/zh not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111382565A (zh) * | 2020-03-09 | 2020-07-07 | 南京理工大学 | 基于多标签的情绪-原因对抽取方法及系统 |
CN117349402A (zh) * | 2023-09-07 | 2024-01-05 | 北京智精灵科技有限公司 | 一种基于机器阅读理解的情绪原因对识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
HANGTIAN ZHAO 等: "Pipeline Chain-of-Thought: A prompt method for large language model relation extraction.", 2023 INTERNATIONAL CONFERENCE ON ASIAN LANGUAGE PROCESSING (IALP), 31 December 2023 (2023-12-31), pages 31 - 36 * |
JIALIANG WU 等: "Enhancing Large Language Model with Decomposed Reasoning for Emotion Cause Pair Extraction.", ARXIV:2401.17716V1 [CS.CL], 31 January 2024 (2024-01-31), pages 1 - 13 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111428044B (zh) | 多模态获取监管识别结果的方法、装置、设备及存储介质 | |
CN112215008B (zh) | 基于语义理解的实体识别方法、装置、计算机设备和介质 | |
US11288294B2 (en) | Natural language processing and artificial intelligence based search system | |
US20230056987A1 (en) | Semantic map generation using hierarchical clause structure | |
CN111401066A (zh) | 基于人工智能的词分类模型训练方法、词处理方法及装置 | |
CN111143884A (zh) | 数据脱敏方法与装置、电子设备及存储介质 | |
CN110033382B (zh) | 一种保险业务的处理方法、装置及设备 | |
CN111783450B (zh) | 语料文本中的短语提取方法、装置、存储介质及电子设备 | |
CN112528637A (zh) | 文本处理模型训练方法、装置、计算机设备和存储介质 | |
CN111667923B (zh) | 数据匹配方法、装置、计算机可读介质及电子设备 | |
CN117290478A (zh) | 一种知识图谱问答方法、装置、设备和存储介质 | |
US20230206007A1 (en) | Method for mining conversation content and method for generating conversation content evaluation model | |
CN115858776B (zh) | 一种变体文本分类识别方法、系统、存储介质和电子设备 | |
CN116561298A (zh) | 基于人工智能的标题生成方法、装置、设备及存储介质 | |
CN116127013A (zh) | 一种个人敏感信息知识图谱查询方法和装置 | |
CN117743518A (zh) | 一种基于多阶段归因的情绪原因对抽取方法及系统 | |
CN113836297B (zh) | 文本情感分析模型的训练方法及装置 | |
CN114218431A (zh) | 视频搜索方法、装置、电子设备以及存储介质 | |
CN111753548A (zh) | 信息获取方法及装置、计算机存储介质、电子设备 | |
CN117909505B (zh) | 事件论元的抽取方法及相关设备 | |
CN111783471B (zh) | 自然语言的语义识别方法、装置、设备及存储介质 | |
CN113887232B (zh) | 一种对话信息的命名实体识别方法、装置和电子设备 | |
CN113722496B (zh) | 一种三元组抽取方法、装置、可读存储介质及电子设备 | |
CN112733492B (zh) | 基于知识库的辅助设计方法、装置、终端和存储介质 | |
CN113127635B (zh) | 数据处理方法、装置及系统,存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20240322 |