CN115841119B - 一种基于图结构的情绪原因提取方法 - Google Patents
一种基于图结构的情绪原因提取方法 Download PDFInfo
- Publication number
- CN115841119B CN115841119B CN202310144042.1A CN202310144042A CN115841119B CN 115841119 B CN115841119 B CN 115841119B CN 202310144042 A CN202310144042 A CN 202310144042A CN 115841119 B CN115841119 B CN 115841119B
- Authority
- CN
- China
- Prior art keywords
- emotion
- cause
- sentence
- vector
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 130
- 238000000605 extraction Methods 0.000 title claims abstract description 24
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 9
- 238000010276 construction Methods 0.000 claims abstract description 7
- 238000013528 artificial neural network Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 76
- 238000000034 method Methods 0.000 claims description 43
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000004913 activation Effects 0.000 claims description 12
- 230000002996 emotional effect Effects 0.000 claims description 12
- 239000012634 fragment Substances 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 230000001364 causal effect Effects 0.000 claims description 6
- 230000036651 mood Effects 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims description 3
- 230000015654 memory Effects 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 abstract description 4
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及自然语言处理技术领域,公开了一种基于图结构的情绪原因提取方法;在图构建模块中,通过在情绪原因句子、情绪句子以及情绪之间构建边,有效构建起了他们之间的上下文和情绪信息之间的关系,并通过关系图卷积网络和注意力图卷积神经网络的建模有效利用了这些信息,从而提升了模型的性能;通过注意力图卷积神经网络模块计算注意力系数,对不同的上下文信息和情绪信息进行加权,实现了对不同信息的重要性的识别和利用,有效避免了这些信息中潜在的噪音对模型性能的影响。
Description
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种基于图结构的情绪原因提取方法。
背景技术
情绪原因提取旨在从对话中提取出导致目标情绪句子含有特定情绪的“情绪原因片段”。现有的方法把这个任务看作是抽取式问答任务,将情绪、情绪句子和单个情绪原因句子填入问题模板,并从情绪原因句子中抽取出情绪原因片段。
这种做法的局限性在于每次仅对一个情绪原因句子分析,忽略了句子之间的因果关系,可能造成情绪原因片段的遗漏。
本发明建立关于情绪原因句子、目标情绪句子和情绪的有向图模型,并将它们的相对位置关系引入到边上,从而全面地捕获情绪产生过程的因果关系,减少了由于忽略句子间因果关系造成的遗漏问题。
发明内容
为解决上述技术问题,本发明提供一种基于图结构的情绪原因提取方法。
为解决上述技术问题,本发明采用如下技术方案:
一种基于图结构的情绪原因提取方法,通过情绪原因提取模型从对话中提取出导致情绪句子含有特定情绪E的情绪原因片段,情绪原因片段所在的句子称为情绪原因句子;
对话记为,其中/>为对话的第i个句子,N为对话中的句子总数,/>为第i个句子的第j个词,/>为第i个句子中词的总数;情绪句子记为/>;为词/>的情绪原因抽取标签,当/>不属于情绪E的原因时,/>;当/>在情绪E的原因的开始位置时,/>;/>在情绪E的原因的中间时,/>;将情绪原因抽取标签/>和的词按顺序组合在一起即形成所述的情绪原因片段;
情绪原因提取模型包括编码器、多原因推测图网络和解码器;
情绪原因提取模型训练过程包括以下步骤:
步骤一、使用编码器为对话中的N个句子以及句子中的词进行编码,得到第i个句子的初始句子编码向量,第i个句子中第j个词的初始词编码向量/>;记情绪句子/>的初始情绪编码向量/>;将初始句子编码向量/>和初始情绪编码向量/>输入到双向长短期记忆网络后,得到句子编码向量/>和情绪编码向量/>;取句子/>中,存在情绪原因片段的情绪原因句子/>对应的句子编码向量,得到原因编码向量,n为情绪原因句子的总数;第c个情绪原因句子中第j个词的词编码向量为/>;
步骤三、使用解码器,对某个情绪原因句子的每个词的词编码向量/>与/>对应的原因增强隐向量/>进行粘连,生成增强词编码隐向量/>,即;将增强词编码隐向量/>通过全连接层得到最终输出词向量/>,即,/>和b分别为解码器矩阵和向量;其中/>每个维度的值表示对应维度的情绪标签得分,选择得分最高的情绪标签作为词/>的情绪原因抽取标签/>的预测结果。
进一步地,所述编码器为SpanBERT编码器。
步骤22:在图构建模块中,把情绪句子隐向量、情绪隐向量/>以及n个原因编码隐向量/>作为节点表征;记这n+2个节点表征为/>,/>为第k个节点,其中当/>时,/>;当/>时,/>;当/>时,/>;得到邻接矩阵和关系矩阵/>;其中/>表示为G中任意两个节点/>之间的有向边,/>,/>表示有向边/>所标记的值,反映了节点/>与节点/>之间的关系;对得到的n+2个节点/>使用有向异构图模型/>进行建模:即G中的每一对节点/>都能够映射到邻接矩阵A中的一个元素/>,而邻接矩阵A中的元素/>也能够映射为关系矩阵/>中的元素/>;
其中,是与节点/>有连接的其他节点的集合;/>是关系矩阵R中起始节点为/>的可能值的集合,/>;/>是用于自连接的矩阵,能够聚合自身的信息;/>是在关系r下用于提取节点/>信息的矩阵,/>和/>均为可训练参数;
与现有技术相比,本发明的有益技术效果是:
本发明在图构建模块中,通过在情绪原因句子、情绪句子/>以及情绪E之间构建边,有效构建起了他们之间的上下文和情绪信息之间的关系,并通过关系图卷积网络和注意力图卷积神经网络的建模有效利用了这些信息,从而提升了模型的性能。
本发明通过注意力图卷积神经网络模块计算注意力系数,对不同的上下文信息和情绪信息进行加权,实现了对不同信息的重要性的识别和利用,有效避免了这些信息中潜在的噪音对模型性能的影响。
附图说明
图1为本发明的整体模型结构图。
具体实施方式
下面结合附图对本发明的一种优选实施方式作详细的说明。
情绪原因提取方法,是通过情绪原因提取模型从对话中提取出导致情绪句子含有特定情绪E的情绪原因片段,情绪原因片段所在的句子称为情绪原因句子。
对话记为,其中/>为对话的第i个句子,N为对话中的句子总数,/>为第i个句子的第j个词,/>为第i个句子中词的总数;情绪句子记为/>;为词/>的情绪原因抽取标签,当/>不属于情绪E的原因时,/>;当/>在情绪E的原因的开始位置时,/>;/>在情绪E的原因的中间时,/>;将情绪原因抽取标签/>和的词按顺序组合在一起即形成情绪原因片段。
本发明中的情绪原因提取模型包括编码器、多原因推测图网络和解码器;
情绪原因提取模型训练过程包括以下步骤:
S1、使用编码器为对话中的N个句子以及句子中的词进行编码,得到第i个句子的初始句子编码向量,第i个句子中第j个词的初始词编码向量/>;记情绪句子/>的初始情绪编码向量/>;将初始句子编码向量/>和初始情绪编码向量/>输入到双向长短期记忆网络后,得到句子编码向量/>和情绪编码向量/>;由于情绪句子属于对话中所有句子的一部分,故将初始句子编码向量输入双向长短期记忆网络(BiLSTM)时,同时也会将初始情绪编码向量/>输入,但这里为了强调,故写做:将初始句子编码向量和初始情绪编码向量输入到双向长短期记忆网络。
S3、使用解码器,对某个情绪原因句子的每个词的词编码向量/>与/>对应的原因增强隐向量/>进行粘连,生成增强词编码隐向量/>,即;将增强词编码隐向量/>通过全连接层得到最终输出词向量/>,即,/>和b分别为解码器矩阵和向量;其中/>每个维度的值表示对应维度的情绪标签得分,选择得分最高的情绪标签(ECEC label)作为词/>的情绪原因抽取标签的预测结果。
本实施例,编码器为SpanBERT编码器。
S22:在图构建模块中,把情绪句子隐向量、情绪隐向量/>以及n个原因编码隐向量/>作为节点表征;记这n+2个节点表征为/>,/>为第k个节点,其中当时,/>;当/>时,/>;当/>时,/>;得到邻接矩阵和关系矩阵/>;为充分利用情绪原因句子/>、情绪句子/>,以及情绪E之间的关系,其中/>表示为G中任意两个节点/>之间的有向边,,/>表示有向边/>所标记的值,反映了节点/>与节点/>之间的关系;对得到的n+2个节点/>使用有向异构图模型/>进行建模:即G中的每一对节点/>都可映射到邻接矩阵A中的一个元素/>,而邻接矩阵A中的元素/>也可映射为关系矩阵/>中的元素/>。
对于类型“原因-原因”,根据有向节点对对应的情绪原因句子/>是否相邻,即{相邻,不相邻},以及情绪原因句子/>在对话中的顺序,即{未来,过去},组合后得到四种值{相邻-过去,相邻-未来,不相邻-过去,不相邻-未来}。
对于类型“原因-目标”,由于节点对应的情绪原因句子/>都在节点/>对应的情绪句子/>之前,所以“原因-目标”不考虑节点对应句子在对话中的顺序,即{未来,过去}。而/>与/>之间存在邻近与远离的情况,所以考虑是否相邻,即{相邻,不相邻}。同时考虑到,情绪句子/>有可能也是促使其情绪产生的原因,对于这种情况,引入“自身”表示。最终得到三种值{相邻,不相邻,自身}。
其中,是与节点/>有连接的其他节点的集合;/>是关系矩阵R中起始节点为/>的可能值的集合/>;/>是用于自连接的矩阵,能够聚合自身的信息;/>是在关系r下用于提取节点/>信息的矩阵,/>和/>均为可训练参数。
S24:在注意力图卷积神经网络模块中,使用注意力机制,对连接节点的异构信息进行动态的聚合,注意力机制可以是多头注意力,取其中的一个部分进行描述:对于节点,计算与/>连接的节点/>对应的注意力系数/>:
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立技术方案,说明书的这种叙述方式仅仅是为了清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (3)
1.一种基于图结构的情绪原因提取方法,其特征在于,通过情绪原因提取模型从对话中提取出导致情绪句子含有特定情绪E的情绪原因片段,情绪原因片段所在的句子称为情绪原因句子;
对话记为,其中/>为对话的第i个句子,N为对话中的句子总数,/>为第i个句子的第j个词,/>为第i个句子中词的总数;情绪句子记为/>;/>为词的情绪原因抽取标签,当/>不属于情绪E的原因时,/>;当/>在情绪E的原因的开始位置时,/>;/>在情绪E的原因的中间时,/>;将情绪原因抽取标签/>和/>的词按顺序组合在一起即形成所述的情绪原因片段;
情绪原因提取模型包括编码器、多原因推测图网络和解码器;
情绪原因提取模型训练过程包括以下步骤:
步骤一、使用编码器为对话中的N个句子以及句子中的词进行编码,得到第i个句子的初始句子编码向量,第i个句子中第j个词的初始词编码向量/>;记情绪句子/>的初始情绪编码向量/>;将初始句子编码向量/>和初始情绪编码向量/>输入到双向长短期记忆网络后,得到句子编码向量/>和情绪编码向量/>;取句子/>中,存在情绪原因片段的情绪原因句子/>对应的句子编码向量,得到原因编码向量,n为情绪原因句子的总数;第c个情绪原因句子中第j个词的词编码向量为/>;
2.根据权利要求1所述的基于图结构的情绪原因提取方法,其特征在于,所述编码器为SpanBERT编码器。
3.根据权利要求1所述的基于图结构的情绪原因提取方法,其特征在于,多原因推测图网络包括嵌入模块、图构建模块、关系图卷积神经网络模块和注意力图卷积神经网络模块;步骤二中,多原因推测图网络计算增强原因隐向量的过程如下:
步骤22:在图构建模块中,把情绪句子隐向量、情绪隐向量/>以及n个原因编码隐向量作为节点表征;记这n+2个节点表征为/>,/>为第k个节点,其中当时,/>;当/>时,/>;当/>时,/>;得到邻接矩阵和关系矩阵/>;其中/>表示为G中任意两个节点/>之间的有向边,/>,/>表示有向边/>所标记的值,反映了节点/>与节点/>之间的关系;对得到的n+2个节点/>使用有向异构图模型/>进行建模:即G中的每一对节点/>都能够映射到邻接矩阵A中的一个元素/>,而邻接矩阵A中的元素/>也能够映射为关系矩阵/>中的元素/>;
其中,是与节点/>有连接的其他节点的集合;/>是关系矩阵R中起始节点为/>的可能值的集合,/>;/>是用于自连接的矩阵,能够聚合自身的信息;/>是在关系r下用于提取节点/>信息的矩阵,/>和/>均为可训练参数;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310144042.1A CN115841119B (zh) | 2023-02-21 | 2023-02-21 | 一种基于图结构的情绪原因提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310144042.1A CN115841119B (zh) | 2023-02-21 | 2023-02-21 | 一种基于图结构的情绪原因提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115841119A CN115841119A (zh) | 2023-03-24 |
CN115841119B true CN115841119B (zh) | 2023-06-16 |
Family
ID=85579983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310144042.1A Active CN115841119B (zh) | 2023-02-21 | 2023-02-21 | 一种基于图结构的情绪原因提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115841119B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116258134B (zh) * | 2023-04-24 | 2023-08-29 | 中国科学技术大学 | 一种基于卷积联合模型的对话情感识别方法 |
CN116187419B (zh) * | 2023-04-25 | 2023-08-29 | 中国科学技术大学 | 一种基于文本组块的层级体系自动构建方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018097292A (ja) * | 2016-12-16 | 2018-06-21 | 日本電気株式会社 | 感情識別装置、感情識別方法および感情識別プログラム |
CN110162636A (zh) * | 2019-05-30 | 2019-08-23 | 中森云链(成都)科技有限责任公司 | 基于d-lstm的文本情绪原因识别方法 |
CN112100337A (zh) * | 2020-10-15 | 2020-12-18 | 平安科技(深圳)有限公司 | 交互对话中的情绪识别方法及装置 |
CN113505583A (zh) * | 2021-05-27 | 2021-10-15 | 山东交通学院 | 基于语义决策图神经网络的情感原因子句对提取方法 |
CN113535957A (zh) * | 2021-07-27 | 2021-10-22 | 哈尔滨工业大学 | 基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质 |
CN113926198A (zh) * | 2021-11-15 | 2022-01-14 | 网易(杭州)网络有限公司 | 情绪数据的识别方法、装置、存储介质及电子设备 |
CN113988048A (zh) * | 2021-10-13 | 2022-01-28 | 北京理工大学 | 基于多轮机器阅读理解的情感原因对抽取方法 |
CN113987179A (zh) * | 2021-10-27 | 2022-01-28 | 哈尔滨工业大学 | 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质 |
CN114911932A (zh) * | 2022-04-22 | 2022-08-16 | 南京信息工程大学 | 基于主题语义增强的异构图结构多会话者情感分析方法 |
CN115129818A (zh) * | 2022-07-10 | 2022-09-30 | 大连理工大学 | 基于知识驱动多分类的情绪原因对提取方法及系统 |
CN115329769A (zh) * | 2022-07-05 | 2022-11-11 | 中国电子科技集团公司电子科学研究院 | 基于语义增强网络的平台企业网络舆论情感分析方法 |
CN115510860A (zh) * | 2022-10-27 | 2022-12-23 | 苏州思萃人工智能研究所有限公司 | 一种文本情感分析方法、装置、电子设备及存储介质 |
-
2023
- 2023-02-21 CN CN202310144042.1A patent/CN115841119B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018097292A (ja) * | 2016-12-16 | 2018-06-21 | 日本電気株式会社 | 感情識別装置、感情識別方法および感情識別プログラム |
CN110162636A (zh) * | 2019-05-30 | 2019-08-23 | 中森云链(成都)科技有限责任公司 | 基于d-lstm的文本情绪原因识别方法 |
CN112100337A (zh) * | 2020-10-15 | 2020-12-18 | 平安科技(深圳)有限公司 | 交互对话中的情绪识别方法及装置 |
CN113505583A (zh) * | 2021-05-27 | 2021-10-15 | 山东交通学院 | 基于语义决策图神经网络的情感原因子句对提取方法 |
CN113535957A (zh) * | 2021-07-27 | 2021-10-22 | 哈尔滨工业大学 | 基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质 |
CN113988048A (zh) * | 2021-10-13 | 2022-01-28 | 北京理工大学 | 基于多轮机器阅读理解的情感原因对抽取方法 |
CN113987179A (zh) * | 2021-10-27 | 2022-01-28 | 哈尔滨工业大学 | 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质 |
CN113926198A (zh) * | 2021-11-15 | 2022-01-14 | 网易(杭州)网络有限公司 | 情绪数据的识别方法、装置、存储介质及电子设备 |
CN114911932A (zh) * | 2022-04-22 | 2022-08-16 | 南京信息工程大学 | 基于主题语义增强的异构图结构多会话者情感分析方法 |
CN115329769A (zh) * | 2022-07-05 | 2022-11-11 | 中国电子科技集团公司电子科学研究院 | 基于语义增强网络的平台企业网络舆论情感分析方法 |
CN115129818A (zh) * | 2022-07-10 | 2022-09-30 | 大连理工大学 | 基于知识驱动多分类的情绪原因对提取方法及系统 |
CN115510860A (zh) * | 2022-10-27 | 2022-12-23 | 苏州思萃人工智能研究所有限公司 | 一种文本情感分析方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115841119A (zh) | 2023-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115841119B (zh) | 一种基于图结构的情绪原因提取方法 | |
CN108875807B (zh) | 一种基于多注意力多尺度的图像描述方法 | |
CN109508462B (zh) | 一种基于编码器-解码器的神经网络蒙汉机器翻译方法 | |
Zhao et al. | Automatic assessment of depression from speech via a hierarchical attention transfer network and attention autoencoders | |
CN108363695B (zh) | 一种基于双向依赖语法树表征的用户评论属性抽取方法 | |
CN111382582A (zh) | 一种基于非自回归的神经机器翻译解码加速方法 | |
CN113987179A (zh) | 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质 | |
CN115964467A (zh) | 一种融合视觉情境的富语义对话生成方法 | |
CN113435211A (zh) | 一种结合外部知识的文本隐式情感分析方法 | |
CN114360502A (zh) | 语音识别模型的处理方法、语音识别方法及装置 | |
CN112560440A (zh) | 一种基于深度学习的面向方面级情感分析的句法依赖方法 | |
CN110717342A (zh) | 一种基于transformer的距离参量对齐翻译方法 | |
CN112464673B (zh) | 融合义原信息的语言含义理解方法 | |
CN113361505B (zh) | 基于对比解耦元学习的非特定人的手语翻译方法和系统 | |
CN114896969A (zh) | 一种基于深度学习的方面词提取方法 | |
CN115169363A (zh) | 一种融合知识的增量编码的对话情感识别方法 | |
CN113869059A (zh) | 基于注意力机制的自然语言文本三元组提取方法及系统 | |
CN114492458A (zh) | 一种基于多头注意力和词共现的方面级情感分析方法 | |
CN113077785B (zh) | 一种端到端的多语言连续语音流语音内容识别方法及系统 | |
JP7120064B2 (ja) | 言語モデルスコア計算装置、言語モデル作成装置、それらの方法、プログラム、および記録媒体 | |
CN113901758A (zh) | 一种面向知识图谱自动构建系统的关系抽取方法 | |
Sun et al. | Human-machine conversation based on hybrid neural network | |
CN117787224B (zh) | 一种基于多源异构特征融合的可控故事生成方法 | |
Zhou et al. | Multimodal emotion recognition based on multilevel acoustic and textual information | |
CN116258134B (zh) | 一种基于卷积联合模型的对话情感识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |