CN115841119A - 一种基于图结构的情绪原因提取方法 - Google Patents
一种基于图结构的情绪原因提取方法 Download PDFInfo
- Publication number
- CN115841119A CN115841119A CN202310144042.1A CN202310144042A CN115841119A CN 115841119 A CN115841119 A CN 115841119A CN 202310144042 A CN202310144042 A CN 202310144042A CN 115841119 A CN115841119 A CN 115841119A
- Authority
- CN
- China
- Prior art keywords
- emotion
- reason
- vector
- sentence
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 24
- 230000002996 emotional effect Effects 0.000 title claims description 37
- 230000008451 emotion Effects 0.000 claims abstract description 99
- 238000013528 artificial neural network Methods 0.000 claims abstract description 9
- 238000010276 construction Methods 0.000 claims abstract description 7
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 85
- 239000011159 matrix material Substances 0.000 claims description 28
- 230000004913 activation Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 11
- 238000000034 method Methods 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 5
- 230000001364 causal effect Effects 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 101150091111 ACAN gene Proteins 0.000 claims 1
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 239000000284 extract Substances 0.000 description 6
- 230000036651 mood Effects 0.000 description 4
- 239000012634 fragment Substances 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及自然语言处理技术领域,公开了一种基于图结构的情绪原因提取方法;在图构建模块中,通过在情绪原因句子、情绪句子以及情绪之间构建边,有效构建起了他们之间的上下文和情绪信息之间的关系,并通过关系图卷积网络和注意力图卷积神经网络的建模有效利用了这些信息,从而提升了模型的性能;通过注意力图卷积神经网络模块计算注意力系数,对不同的上下文信息和情绪信息进行加权,实现了对不同信息的重要性的识别和利用,有效避免了这些信息中潜在的噪音对模型性能的影响。
Description
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种基于图结构的情绪原因提取方法。
背景技术
情绪原因提取旨在从对话中提取出导致目标情绪句子含有特定情绪的“情绪原因片段”。现有的方法把这个任务看作是抽取式问答任务,将情绪、情绪句子和单个情绪原因句子填入问题模板,并从情绪原因句子中抽取出情绪原因片段。
这种做法的局限性在于每次仅对一个情绪原因句子分析,忽略了句子之间的因果关系,可能造成情绪原因片段的遗漏。
本发明建立关于情绪原因句子、目标情绪句子和情绪的有向图模型,并将它们的相对位置关系引入到边上,从而全面地捕获情绪产生过程的因果关系,减少了由于忽略句子间因果关系造成的遗漏问题。
发明内容
为解决上述技术问题,本发明提供一种基于图结构的情绪原因提取方法。
为解决上述技术问题,本发明采用如下技术方案:
一种基于图结构的情绪原因提取方法,通过情绪原因提取模型从对话中提取出导致情绪句子含有特定情绪E的情绪原因片段,情绪原因片段所在的句子称为情绪原因句子;
对话记为,其中为对话的第i个句子,N为对话中的句子总数,为第i个句子的第j个词,为第i个句子中词的总数;情绪句子记为;为词的情绪原因抽取标签,当不属于情绪E的原因时,;当在情绪E的原因的开始位置时,;在情绪E的原因的中间时,;将情绪原因抽取标签和的词按顺序组合在一起即形成所述的情绪原因片段;
情绪原因提取模型包括编码器、多原因推测图网络和解码器;
情绪原因提取模型训练过程包括以下步骤:
步骤一、使用编码器为对话中的N个句子以及句子中的词进行编码,得到第i个句子的初始句子编码向量,第i个句子中第j个词的初始词编码向量;记情绪句子的初始情绪编码向量;将初始句子编码向量和初始情绪编码向量输入到双向长短期记忆网络后,得到句子编码向量和情绪编码向量;取句子中,存在情绪原因片段的情绪原因句子对应的句子编码向量,得到原因编码向量,n为情绪原因句子的总数;第c个情绪原因句子中第j个词的词编码向量为;
步骤三、使用解码器,对某个情绪原因句子的每个词的词编码向量与对应的原因增强隐向量进行粘连,生成增强词编码隐向量,即;将增强词编码隐向量通过全连接层得到最终输出词向量,即,和b分别为解码器矩阵和向量;其中每个维度的值表示对应维度的情绪标签得分,选择得分最高的情绪标签作为词的情绪原因抽取标签的预测结果。
进一步地,所述编码器为SpanBERT编码器。
步骤22:在图构建模块中,把情绪句子隐向量、情绪隐向量以及n个原因编码隐向量作为节点表征;记这n+2个节点表征为,为第k个节点,其中当时,;当时,;当时,;得到邻接矩阵和关系矩阵;其中表示为G中任意两个节点之间的有向边,,表示有向边所标记的值,反映了节点与节点之间的关系;对得到的n+2个节点使用有向异构图模型进行建模:即G中的每一对节点都能够映射到邻接矩阵A中的一个元素,而邻接矩阵A中的元素也能够映射为关系矩阵中的元素;
与现有技术相比,本发明的有益技术效果是:
本发明在图构建模块中,通过在情绪原因句子、情绪句子以及情绪E之间构建边,有效构建起了他们之间的上下文和情绪信息之间的关系,并通过关系图卷积网络和注意力图卷积神经网络的建模有效利用了这些信息,从而提升了模型的性能。
本发明通过注意力图卷积神经网络模块计算注意力系数,对不同的上下文信息和情绪信息进行加权,实现了对不同信息的重要性的识别和利用,有效避免了这些信息中潜在的噪音对模型性能的影响。
附图说明
图1为本发明的整体模型结构图。
具体实施方式
下面结合附图对本发明的一种优选实施方式作详细的说明。
情绪原因提取方法,是通过情绪原因提取模型从对话中提取出导致情绪句子含有特定情绪E的情绪原因片段,情绪原因片段所在的句子称为情绪原因句子。
对话记为,其中为对话的第i个句子,N为对话中的句子总数,为第i个句子的第j个词,为第i个句子中词的总数;情绪句子记为;为词的情绪原因抽取标签,当不属于情绪E的原因时,;当在情绪E的原因的开始位置时,;在情绪E的原因的中间时,;将情绪原因抽取标签和的词按顺序组合在一起即形成情绪原因片段。
本发明中的情绪原因提取模型包括编码器、多原因推测图网络和解码器;
情绪原因提取模型训练过程包括以下步骤:
S1、使用编码器为对话中的N个句子以及句子中的词进行编码,得到第i个句子的初始句子编码向量,第i个句子中第j个词的初始词编码向量;记情绪句子的初始情绪编码向量;将初始句子编码向量和初始情绪编码向量输入到双向长短期记忆网络后,得到句子编码向量和情绪编码向量;由于情绪句子属于对话中所有句子的一部分,故将初始句子编码向量输入双向长短期记忆网络(BiLSTM)时,同时也会将初始情绪编码向量输入,但这里为了强调,故写做:将初始句子编码向量和初始情绪编码向量输入到双向长短期记忆网络。
S3、使用解码器,对某个情绪原因句子的每个词的词编码向量与对应的原因增强隐向量进行粘连,生成增强词编码隐向量,即;将增强词编码隐向量通过全连接层得到最终输出词向量,即,和b分别为解码器矩阵和向量;其中每个维度的值表示对应维度的情绪标签得分,选择得分最高的情绪标签(ECEClabel)作为词的情绪原因抽取标签的预测结果。
本实施例,编码器为SpanBERT编码器。
S22:在图构建模块中,把情绪句子隐向量、情绪隐向量以及n个原因编码隐向量作为节点表征;记这n+2个节点表征为,为第k个节点,其中当时,;当时,;当时,;得到邻接矩阵和关系矩阵;为充分利用情绪原因句子、情绪句子,以及情绪E之间的关系,其中表示为G中任意两个节点之间的有向边,,表示有向边所标记的值,反映了节点与节点之间的关系;对得到的n+2个节点使用有向异构图模型进行建模:即G中的每一对节点都可映射到邻接矩阵A中的一个元素,而邻接矩阵A中的元素也可映射为关系矩阵中的元素。
对于类型“原因-原因”,根据有向节点对对应的情绪原因句子是否相邻,即{相邻,不相邻},以及情绪原因句子在对话中的顺序,即{未来,过去},组合后得到四种值{相邻-过去,相邻-未来,不相邻-过去,不相邻-未来}。
对于类型“原因-目标”,由于节点对应的情绪原因句子都在节点对应的情绪句子之前,所以“原因-目标”不考虑节点对应句子在对话中的顺序,即{未来,过去}。而与之间存在邻近与远离的情况,所以考虑是否相邻,即{相邻,不相邻}。同时考虑到,情绪句子有可能也是促使其情绪产生的原因,对于这种情况,引入“自身”表示。最终得到三种值{相邻,不相邻,自身}。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立技术方案,说明书的这种叙述方式仅仅是为了清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (3)
1.一种基于图结构的情绪原因提取方法,其特征在于,通过情绪原因提取模型从对话中提取出导致情绪句子含有特定情绪E的情绪原因片段,情绪原因片段所在的句子称为情绪原因句子;
对话记为,其中为对话的第i个句子,N为对话中的句子总数,为第i个句子的第j个词,为第i个句子中词的总数;情绪句子记为;为词的情绪原因抽取标签,当不属于情绪E的原因时,;当在情绪E的原因的开始位置时,;在情绪E的原因的中间时,;将情绪原因抽取标签和的词按顺序组合在一起即形成所述的情绪原因片段;
情绪原因提取模型包括编码器、多原因推测图网络和解码器;
情绪原因提取模型训练过程包括以下步骤:
步骤一、使用编码器为对话中的N个句子以及句子中的词进行编码,得到第i个句子的初始句子编码向量,第i个句子中第j个词的初始词编码向量;记情绪句子的初始情绪编码向量;将初始句子编码向量和初始情绪编码向量输入到双向长短期记忆网络后,得到句子编码向量和情绪编码向量;取句子中,存在情绪原因片段的情绪原因句子对应的句子编码向量,得到原因编码向量,n为情绪原因句子的总数;第c个情绪原因句子中第j个词的词编码向量为;
2.根据权利要求1所述的基于图结构的情绪原因提取方法,其特征在于,所述编码器为SpanBERT编码器。
3.根据权利要求1所述的基于图结构的情绪原因提取方法,其特征在于,多原因推测图网络包括嵌入模块、图构建模块、关系图卷积神经网络模块和注意力图卷积神经网络模块;步骤二中,多原因推测图网络计算增强原因隐向量的过程如下:
步骤22:在图构建模块中,把情绪句子隐向量、情绪隐向量以及n个原因编码隐向量作为节点表征;记这n+2个节点表征为,为第k个节点,其中当时,;当时,;当时,;得到邻接矩阵和关系矩阵;其中表示为G中任意两个节点之间的有向边,,表示有向边所标记的值,反映了节点与节点之间的关系;对得到的n+2个节点使用有向异构图模型进行建模:即G中的每一对节点都能够映射到邻接矩阵A中的一个元素,而邻接矩阵A中的元素也能够映射为关系矩阵中的元素;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310144042.1A CN115841119B (zh) | 2023-02-21 | 2023-02-21 | 一种基于图结构的情绪原因提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310144042.1A CN115841119B (zh) | 2023-02-21 | 2023-02-21 | 一种基于图结构的情绪原因提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115841119A true CN115841119A (zh) | 2023-03-24 |
CN115841119B CN115841119B (zh) | 2023-06-16 |
Family
ID=85579983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310144042.1A Active CN115841119B (zh) | 2023-02-21 | 2023-02-21 | 一种基于图结构的情绪原因提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115841119B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116187419A (zh) * | 2023-04-25 | 2023-05-30 | 中国科学技术大学 | 一种基于文本组块的层级体系自动构建方法 |
CN116258134A (zh) * | 2023-04-24 | 2023-06-13 | 中国科学技术大学 | 一种基于卷积联合模型的对话情感识别方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018097292A (ja) * | 2016-12-16 | 2018-06-21 | 日本電気株式会社 | 感情識別装置、感情識別方法および感情識別プログラム |
CN110162636A (zh) * | 2019-05-30 | 2019-08-23 | 中森云链(成都)科技有限责任公司 | 基于d-lstm的文本情绪原因识别方法 |
CN112100337A (zh) * | 2020-10-15 | 2020-12-18 | 平安科技(深圳)有限公司 | 交互对话中的情绪识别方法及装置 |
CN113505583A (zh) * | 2021-05-27 | 2021-10-15 | 山东交通学院 | 基于语义决策图神经网络的情感原因子句对提取方法 |
CN113535957A (zh) * | 2021-07-27 | 2021-10-22 | 哈尔滨工业大学 | 基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质 |
CN113926198A (zh) * | 2021-11-15 | 2022-01-14 | 网易(杭州)网络有限公司 | 情绪数据的识别方法、装置、存储介质及电子设备 |
CN113987179A (zh) * | 2021-10-27 | 2022-01-28 | 哈尔滨工业大学 | 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质 |
CN113988048A (zh) * | 2021-10-13 | 2022-01-28 | 北京理工大学 | 基于多轮机器阅读理解的情感原因对抽取方法 |
CN114911932A (zh) * | 2022-04-22 | 2022-08-16 | 南京信息工程大学 | 基于主题语义增强的异构图结构多会话者情感分析方法 |
CN115129818A (zh) * | 2022-07-10 | 2022-09-30 | 大连理工大学 | 基于知识驱动多分类的情绪原因对提取方法及系统 |
CN115329769A (zh) * | 2022-07-05 | 2022-11-11 | 中国电子科技集团公司电子科学研究院 | 基于语义增强网络的平台企业网络舆论情感分析方法 |
CN115510860A (zh) * | 2022-10-27 | 2022-12-23 | 苏州思萃人工智能研究所有限公司 | 一种文本情感分析方法、装置、电子设备及存储介质 |
-
2023
- 2023-02-21 CN CN202310144042.1A patent/CN115841119B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018097292A (ja) * | 2016-12-16 | 2018-06-21 | 日本電気株式会社 | 感情識別装置、感情識別方法および感情識別プログラム |
CN110162636A (zh) * | 2019-05-30 | 2019-08-23 | 中森云链(成都)科技有限责任公司 | 基于d-lstm的文本情绪原因识别方法 |
CN112100337A (zh) * | 2020-10-15 | 2020-12-18 | 平安科技(深圳)有限公司 | 交互对话中的情绪识别方法及装置 |
CN113505583A (zh) * | 2021-05-27 | 2021-10-15 | 山东交通学院 | 基于语义决策图神经网络的情感原因子句对提取方法 |
CN113535957A (zh) * | 2021-07-27 | 2021-10-22 | 哈尔滨工业大学 | 基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质 |
CN113988048A (zh) * | 2021-10-13 | 2022-01-28 | 北京理工大学 | 基于多轮机器阅读理解的情感原因对抽取方法 |
CN113987179A (zh) * | 2021-10-27 | 2022-01-28 | 哈尔滨工业大学 | 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质 |
CN113926198A (zh) * | 2021-11-15 | 2022-01-14 | 网易(杭州)网络有限公司 | 情绪数据的识别方法、装置、存储介质及电子设备 |
CN114911932A (zh) * | 2022-04-22 | 2022-08-16 | 南京信息工程大学 | 基于主题语义增强的异构图结构多会话者情感分析方法 |
CN115329769A (zh) * | 2022-07-05 | 2022-11-11 | 中国电子科技集团公司电子科学研究院 | 基于语义增强网络的平台企业网络舆论情感分析方法 |
CN115129818A (zh) * | 2022-07-10 | 2022-09-30 | 大连理工大学 | 基于知识驱动多分类的情绪原因对提取方法及系统 |
CN115510860A (zh) * | 2022-10-27 | 2022-12-23 | 苏州思萃人工智能研究所有限公司 | 一种文本情感分析方法、装置、电子设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116258134A (zh) * | 2023-04-24 | 2023-06-13 | 中国科学技术大学 | 一种基于卷积联合模型的对话情感识别方法 |
CN116258134B (zh) * | 2023-04-24 | 2023-08-29 | 中国科学技术大学 | 一种基于卷积联合模型的对话情感识别方法 |
CN116187419A (zh) * | 2023-04-25 | 2023-05-30 | 中国科学技术大学 | 一种基于文本组块的层级体系自动构建方法 |
CN116187419B (zh) * | 2023-04-25 | 2023-08-29 | 中国科学技术大学 | 一种基于文本组块的层级体系自动构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115841119B (zh) | 2023-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110209801B (zh) | 一种基于自注意力网络的文本摘要自动生成方法 | |
CN110413785B (zh) | 一种基于bert和特征融合的文本自动分类方法 | |
CN111382582B (zh) | 一种基于非自回归的神经机器翻译解码加速方法 | |
CN115841119A (zh) | 一种基于图结构的情绪原因提取方法 | |
CN110348016A (zh) | 基于句子关联注意力机制的文本摘要生成方法 | |
CN109947912A (zh) | 一种基于段落内部推理和联合问题答案匹配的模型方法 | |
CN108960063B (zh) | 一种面向事件关系编码的视频中多事件自然语言描述方法 | |
CN107291836B (zh) | 一种基于语义相关度模型的中文文本摘要获取方法 | |
CN111079532A (zh) | 一种基于文本自编码器的视频内容描述方法 | |
CN111143563A (zh) | 基于bert与lstm及cnn融合的文本分类方法 | |
CN113627266B (zh) | 基于Transformer时空建模的视频行人重识别方法 | |
CN113806587A (zh) | 一种多模态特征融合的视频描述文本生成方法 | |
WO2023226292A1 (zh) | 从文本中进行关系抽取的方法、关系抽取模型及介质 | |
CN113051399A (zh) | 一种基于关系型图卷积网络的小样本细粒度实体分类方法 | |
CN114970517A (zh) | 一种基于多模态交互的上下文感知的面向视觉问答的方法 | |
CN111061951A (zh) | 一种基于双层自注意力评论建模的推荐模型 | |
CN117151223B (zh) | 一种基于可学习提示的多模态实体识别和关系抽取方法 | |
CN115906857A (zh) | 一种基于词汇增强的中医文本命名实体识别方法 | |
CN114004220A (zh) | 一种基于cpc-ann的文本情绪原因识别方法 | |
CN114360502A (zh) | 语音识别模型的处理方法、语音识别方法及装置 | |
CN116227428B (zh) | 一种基于迁移模式感知的文本风格迁移方法 | |
CN116861021A (zh) | 基于去噪和动量蒸馏的跨模态检索模型构建方法 | |
CN114925197B (zh) | 基于主题注意力的深度学习文本分类模型训练方法 | |
CN113361505B (zh) | 基于对比解耦元学习的非特定人的手语翻译方法和系统 | |
CN114662659A (zh) | 一种基于多阶段迁移学习策略综合的众包文本集成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |