CN115841119B - 一种基于图结构的情绪原因提取方法 - Google Patents

一种基于图结构的情绪原因提取方法 Download PDF

Info

Publication number
CN115841119B
CN115841119B CN202310144042.1A CN202310144042A CN115841119B CN 115841119 B CN115841119 B CN 115841119B CN 202310144042 A CN202310144042 A CN 202310144042A CN 115841119 B CN115841119 B CN 115841119B
Authority
CN
China
Prior art keywords
emotion
cause
sentence
vector
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310144042.1A
Other languages
English (en)
Other versions
CN115841119A (zh
Inventor
宋彦
田元贺
张勇东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN202310144042.1A priority Critical patent/CN115841119B/zh
Publication of CN115841119A publication Critical patent/CN115841119A/zh
Application granted granted Critical
Publication of CN115841119B publication Critical patent/CN115841119B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及自然语言处理技术领域,公开了一种基于图结构的情绪原因提取方法;在图构建模块中,通过在情绪原因句子、情绪句子以及情绪之间构建边,有效构建起了他们之间的上下文和情绪信息之间的关系,并通过关系图卷积网络和注意力图卷积神经网络的建模有效利用了这些信息,从而提升了模型的性能;通过注意力图卷积神经网络模块计算注意力系数,对不同的上下文信息和情绪信息进行加权,实现了对不同信息的重要性的识别和利用,有效避免了这些信息中潜在的噪音对模型性能的影响。

Description

一种基于图结构的情绪原因提取方法
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种基于图结构的情绪原因提取方法。
背景技术
情绪原因提取旨在从对话中提取出导致目标情绪句子含有特定情绪的“情绪原因片段”。现有的方法把这个任务看作是抽取式问答任务,将情绪、情绪句子和单个情绪原因句子填入问题模板,并从情绪原因句子中抽取出情绪原因片段。
这种做法的局限性在于每次仅对一个情绪原因句子分析,忽略了句子之间的因果关系,可能造成情绪原因片段的遗漏。
本发明建立关于情绪原因句子、目标情绪句子和情绪的有向图模型,并将它们的相对位置关系引入到边上,从而全面地捕获情绪产生过程的因果关系,减少了由于忽略句子间因果关系造成的遗漏问题。
发明内容
为解决上述技术问题,本发明提供一种基于图结构的情绪原因提取方法。
为解决上述技术问题,本发明采用如下技术方案:
一种基于图结构的情绪原因提取方法,通过情绪原因提取模型从对话中提取出导致情绪句子含有特定情绪E的情绪原因片段,情绪原因片段所在的句子称为情绪原因句子;
对话记为
Figure SMS_2
,其中/>
Figure SMS_6
为对话的第i个句子,N为对话中的句子总数,/>
Figure SMS_10
为第i个句子的第j个词,/>
Figure SMS_4
为第i个句子中词的总数;情绪句子记为/>
Figure SMS_7
Figure SMS_11
为词/>
Figure SMS_14
的情绪原因抽取标签,当/>
Figure SMS_1
不属于情绪E的原因时,/>
Figure SMS_5
;当/>
Figure SMS_9
在情绪E的原因的开始位置时,/>
Figure SMS_13
;/>
Figure SMS_3
在情绪E的原因的中间时,/>
Figure SMS_8
;将情绪原因抽取标签/>
Figure SMS_12
Figure SMS_15
的词按顺序组合在一起即形成所述的情绪原因片段;
情绪原因提取模型包括编码器、多原因推测图网络和解码器;
情绪原因提取模型训练过程包括以下步骤:
步骤一、使用编码器为对话中的N个句子以及句子中的词进行编码,得到第i个句子的初始句子编码向量
Figure SMS_16
,第i个句子中第j个词的初始词编码向量/>
Figure SMS_20
;记情绪句子/>
Figure SMS_23
的初始情绪编码向量/>
Figure SMS_18
;将初始句子编码向量/>
Figure SMS_21
和初始情绪编码向量/>
Figure SMS_24
输入到双向长短期记忆网络后,得到句子编码向量/>
Figure SMS_26
和情绪编码向量/>
Figure SMS_19
;取句子/>
Figure SMS_22
中,存在情绪原因片段的情绪原因句子/>
Figure SMS_25
对应的句子编码向量,得到原因编码向量
Figure SMS_27
,n为情绪原因句子的总数;第c个情绪原因句子中第j个词的词编码向量为/>
Figure SMS_17
步骤二、使用多原因推测图网络,对n个原因编码向量
Figure SMS_28
、情绪E、情绪编码向量/>
Figure SMS_29
建模,得到n个增强原因隐向量/>
Figure SMS_30
,其中,第c个增强原因隐向量为/>
Figure SMS_31
步骤三、使用解码器,对某个情绪原因句子
Figure SMS_33
的每个词的词编码向量/>
Figure SMS_40
与/>
Figure SMS_42
对应的原因增强隐向量/>
Figure SMS_35
进行粘连,生成增强词编码隐向量/>
Figure SMS_36
,即
Figure SMS_39
;将增强词编码隐向量/>
Figure SMS_43
通过全连接层得到最终输出词向量/>
Figure SMS_32
,即
Figure SMS_37
,/>
Figure SMS_41
和b分别为解码器矩阵和向量;其中/>
Figure SMS_44
每个维度的值表示对应维度的情绪标签得分,选择得分最高的情绪标签作为词/>
Figure SMS_34
的情绪原因抽取标签/>
Figure SMS_38
的预测结果。
进一步地,所述编码器为SpanBERT编码器。
进一步地,多原因推测图网络包括嵌入模块、图构建模块、关系图卷积神经网络模块和注意力图卷积神经网络模块;步骤二中,多原因推测图网络计算增强原因隐向量
Figure SMS_45
的过程如下:
步骤21:在嵌入模块中,使用情绪嵌入矩阵,把情绪E映射为向量
Figure SMS_46
,然后计算原因编码隐向量/>
Figure SMS_47
、情绪隐向量/>
Figure SMS_48
和情绪句子隐向量/>
Figure SMS_49
Figure SMS_50
其中
Figure SMS_51
和/>
Figure SMS_52
为可训练参数,构成关于原因编码向量/>
Figure SMS_53
的全连接层;/>
Figure SMS_54
为非线性激活函数;
Figure SMS_55
其中
Figure SMS_56
和/>
Figure SMS_57
为可训练的参数,构成关于情绪编码向量/>
Figure SMS_58
的全连接层;
Figure SMS_59
其中
Figure SMS_60
为情绪词嵌入矩阵,/>
Figure SMS_61
和/>
Figure SMS_62
均为线性激活函数/>
Figure SMS_63
的参数,/>
Figure SMS_64
表示自变量;
步骤22:在图构建模块中,把情绪句子隐向量
Figure SMS_82
、情绪隐向量/>
Figure SMS_85
以及n个原因编码隐向量/>
Figure SMS_88
作为节点表征;记这n+2个节点表征为/>
Figure SMS_66
,/>
Figure SMS_71
为第k个节点,其中当/>
Figure SMS_75
时,/>
Figure SMS_79
;当/>
Figure SMS_65
时,/>
Figure SMS_69
;当/>
Figure SMS_73
时,/>
Figure SMS_76
;得到邻接矩阵
Figure SMS_68
和关系矩阵/>
Figure SMS_72
;其中/>
Figure SMS_77
表示为G中任意两个节点/>
Figure SMS_81
之间的有向边,/>
Figure SMS_83
,/>
Figure SMS_86
表示有向边/>
Figure SMS_89
所标记的值,反映了节点/>
Figure SMS_91
与节点/>
Figure SMS_67
之间的关系;对得到的n+2个节点/>
Figure SMS_70
使用有向异构图模型/>
Figure SMS_74
进行建模:即G中的每一对节点/>
Figure SMS_78
都能够映射到邻接矩阵A中的一个元素/>
Figure SMS_80
,而邻接矩阵A中的元素/>
Figure SMS_84
也能够映射为关系矩阵/>
Figure SMS_87
中的元素/>
Figure SMS_90
步骤23:在关系图卷积神经网络模块中,对于每个节点
Figure SMS_92
,将与/>
Figure SMS_93
有连接的其他节点/>
Figure SMS_94
的信息聚合到节点/>
Figure SMS_95
中后,记为节点/>
Figure SMS_96
Figure SMS_97
其中,
Figure SMS_99
是与节点/>
Figure SMS_102
有连接的其他节点的集合;/>
Figure SMS_104
是关系矩阵R中起始节点为/>
Figure SMS_100
的可能值的集合,/>
Figure SMS_103
;/>
Figure SMS_106
是用于自连接的矩阵,能够聚合自身的信息;/>
Figure SMS_107
是在关系r下用于提取节点/>
Figure SMS_98
信息的矩阵,/>
Figure SMS_101
和/>
Figure SMS_105
均为可训练参数;
步骤24:在注意力图卷积神经网络模块中,使用注意力机制,对连接节点的异构信息进行动态聚合,具体包括:对于节点
Figure SMS_108
,计算与/>
Figure SMS_109
连接的节点/>
Figure SMS_110
对应的注意力系数/>
Figure SMS_111
Figure SMS_112
其中
Figure SMS_113
表示softmax激活函数,/>
Figure SMS_114
为LeakyRelu非线性激活函数,/>
Figure SMS_115
是用于得到注意力打分值的可训练的向量,/>
Figure SMS_116
为可训练的参数,/>
Figure SMS_117
是与节点/>
Figure SMS_118
有连接的其他节点的集合;
得到注意力系数
Figure SMS_119
后,将和/>
Figure SMS_120
相连的节点进行加权求和得到所述的增强原因隐向量/>
Figure SMS_121
Figure SMS_122
其中,
Figure SMS_123
是节点/>
Figure SMS_124
对自身的注意力系数,/>
Figure SMS_125
是节点/>
Figure SMS_126
关于节点/>
Figure SMS_127
的注意力系数。
与现有技术相比,本发明的有益技术效果是:
本发明在图构建模块中,通过在情绪原因句子
Figure SMS_128
、情绪句子/>
Figure SMS_129
以及情绪E之间构建边,有效构建起了他们之间的上下文和情绪信息之间的关系,并通过关系图卷积网络和注意力图卷积神经网络的建模有效利用了这些信息,从而提升了模型的性能。
本发明通过注意力图卷积神经网络模块计算注意力系数,对不同的上下文信息和情绪信息进行加权,实现了对不同信息的重要性的识别和利用,有效避免了这些信息中潜在的噪音对模型性能的影响。
附图说明
图1为本发明的整体模型结构图。
具体实施方式
下面结合附图对本发明的一种优选实施方式作详细的说明。
情绪原因提取方法,是通过情绪原因提取模型从对话中提取出导致情绪句子含有特定情绪E的情绪原因片段,情绪原因片段所在的句子称为情绪原因句子。
对话记为
Figure SMS_131
,其中/>
Figure SMS_134
为对话的第i个句子,N为对话中的句子总数,/>
Figure SMS_138
为第i个句子的第j个词,/>
Figure SMS_132
为第i个句子中词的总数;情绪句子记为/>
Figure SMS_135
Figure SMS_139
为词/>
Figure SMS_142
的情绪原因抽取标签,当/>
Figure SMS_130
不属于情绪E的原因时,/>
Figure SMS_136
;当/>
Figure SMS_140
在情绪E的原因的开始位置时,/>
Figure SMS_143
;/>
Figure SMS_133
在情绪E的原因的中间时,/>
Figure SMS_137
;将情绪原因抽取标签/>
Figure SMS_141
Figure SMS_144
的词按顺序组合在一起即形成情绪原因片段。
本发明中的情绪原因提取模型包括编码器、多原因推测图网络和解码器;
情绪原因提取模型训练过程包括以下步骤:
S1、使用编码器为对话中的N个句子以及句子中的词进行编码,得到第i个句子的初始句子编码向量
Figure SMS_146
,第i个句子中第j个词的初始词编码向量/>
Figure SMS_149
;记情绪句子/>
Figure SMS_152
的初始情绪编码向量/>
Figure SMS_147
;将初始句子编码向量/>
Figure SMS_148
和初始情绪编码向量/>
Figure SMS_151
输入到双向长短期记忆网络后,得到句子编码向量/>
Figure SMS_153
和情绪编码向量/>
Figure SMS_145
;由于情绪句子属于对话中所有句子的一部分,故将初始句子编码向量输入双向长短期记忆网络(BiLSTM)时,同时也会将初始情绪编码向量/>
Figure SMS_150
输入,但这里为了强调,故写做:将初始句子编码向量和初始情绪编码向量输入到双向长短期记忆网络。
取句子
Figure SMS_154
中,存在情绪原因片段的情绪原因句子/>
Figure SMS_155
对应的句子编码向量,得到原因编码向量/>
Figure SMS_156
,n为情绪原因句子的总数;第c个情绪原因句子中第j个词的词编码向量为/>
Figure SMS_157
。情绪原因句子不一定在对话中的句子中连续。
S2、使用多原因推测图网络,对n个原因编码向量
Figure SMS_158
、情绪E、情绪编码向量/>
Figure SMS_159
建模,得到n个增强原因隐向量/>
Figure SMS_160
,其中,第c个增强原因隐向量为/>
Figure SMS_161
S3、使用解码器,对某个情绪原因句子
Figure SMS_163
的每个词的词编码向量/>
Figure SMS_166
与/>
Figure SMS_169
对应的原因增强隐向量/>
Figure SMS_165
进行粘连,生成增强词编码隐向量/>
Figure SMS_168
,即
Figure SMS_171
;将增强词编码隐向量/>
Figure SMS_173
通过全连接层得到最终输出词向量/>
Figure SMS_162
,即
Figure SMS_167
,/>
Figure SMS_170
和b分别为解码器矩阵和向量;其中/>
Figure SMS_172
每个维度的值表示对应维度的情绪标签得分,选择得分最高的情绪标签(ECEC label)作为词/>
Figure SMS_164
的情绪原因抽取标签的预测结果。
本实施例,编码器为SpanBERT编码器。
本发明中的多原因推测图网络包括嵌入模块、图构建模块、关系图卷积神经网络模块和注意力图卷积神经网络模块;步骤二中,多原因推测图网络计算增强原因隐向量
Figure SMS_174
的过程如下:
S21:在嵌入模块中,使用情绪嵌入矩阵,把情绪E映射为向量
Figure SMS_175
,然后计算原因编码隐向量/>
Figure SMS_176
、情绪隐向量/>
Figure SMS_177
和情绪句子隐向量/>
Figure SMS_178
Figure SMS_179
其中
Figure SMS_180
和/>
Figure SMS_181
为可训练参数,构成关于原因编码向量/>
Figure SMS_182
的全连接层;/>
Figure SMS_183
为非线性激活函数;
Figure SMS_184
其中
Figure SMS_185
和/>
Figure SMS_186
为可训练的参数,构成关于情绪编码向量/>
Figure SMS_187
的全连接层;
Figure SMS_188
其中
Figure SMS_189
为情绪词嵌入矩阵,/>
Figure SMS_190
和/>
Figure SMS_191
均为线性激活函数/>
Figure SMS_192
的参数。
S22:在图构建模块中,把情绪句子隐向量
Figure SMS_196
、情绪隐向量/>
Figure SMS_199
以及n个原因编码隐向量/>
Figure SMS_203
作为节点表征;记这n+2个节点表征为/>
Figure SMS_194
,/>
Figure SMS_198
为第k个节点,其中当
Figure SMS_202
时,/>
Figure SMS_206
;当/>
Figure SMS_195
时,/>
Figure SMS_197
;当/>
Figure SMS_201
时,/>
Figure SMS_205
;得到邻接矩阵
Figure SMS_207
和关系矩阵/>
Figure SMS_210
;为充分利用情绪原因句子/>
Figure SMS_218
、情绪句子/>
Figure SMS_221
,以及情绪E之间的关系,其中/>
Figure SMS_212
表示为G中任意两个节点/>
Figure SMS_215
之间的有向边,
Figure SMS_217
,/>
Figure SMS_220
表示有向边/>
Figure SMS_193
所标记的值,反映了节点/>
Figure SMS_200
与节点/>
Figure SMS_204
之间的关系;对得到的n+2个节点/>
Figure SMS_208
使用有向异构图模型/>
Figure SMS_209
进行建模:即G中的每一对节点/>
Figure SMS_213
都可映射到邻接矩阵A中的一个元素/>
Figure SMS_216
,而邻接矩阵A中的元素/>
Figure SMS_219
也可映射为关系矩阵/>
Figure SMS_211
中的元素/>
Figure SMS_214
根据有向边
Figure SMS_222
所连接节点的属性,关系矩阵/>
Figure SMS_223
中元素的值有三种类型{原因-原因,原因-目标,情绪-话语}:
对于类型“原因-原因”,根据有向节点对
Figure SMS_224
对应的情绪原因句子/>
Figure SMS_225
是否相邻,即{相邻,不相邻},以及情绪原因句子/>
Figure SMS_226
在对话中的顺序,即{未来,过去},组合后得到四种值{相邻-过去,相邻-未来,不相邻-过去,不相邻-未来}。
对于类型“原因-目标”,由于节点
Figure SMS_227
对应的情绪原因句子/>
Figure SMS_228
都在节点/>
Figure SMS_229
对应的情绪句子/>
Figure SMS_230
之前,所以“原因-目标”不考虑节点对应句子在对话中的顺序,即{未来,过去}。而/>
Figure SMS_231
与/>
Figure SMS_232
之间存在邻近与远离的情况,所以考虑是否相邻,即{相邻,不相邻}。同时考虑到,情绪句子/>
Figure SMS_233
有可能也是促使其情绪产生的原因,对于这种情况,引入“自身”表示。最终得到三种值{相邻,不相邻,自身}。
对于类型“情绪-话语”,由于
Figure SMS_234
对应的情绪E与情绪原因句子/>
Figure SMS_235
和情绪句子/>
Figure SMS_236
之间,既没有邻近关系也没有顺序关系,所以引入新的值“影响”表示。最终得到一种值{影响}。
S23:在关系图卷积神经网络模块中,对于每个节点
Figure SMS_237
,将与/>
Figure SMS_238
有连接的其他节点/>
Figure SMS_239
的信息聚合到节点/>
Figure SMS_240
中后,记为节点/>
Figure SMS_241
Figure SMS_242
其中,
Figure SMS_244
是与节点/>
Figure SMS_246
有连接的其他节点的集合;/>
Figure SMS_247
是关系矩阵R中起始节点为/>
Figure SMS_245
的可能值的集合/>
Figure SMS_248
;/>
Figure SMS_250
是用于自连接的矩阵,能够聚合自身的信息;/>
Figure SMS_252
是在关系r下用于提取节点/>
Figure SMS_243
信息的矩阵,/>
Figure SMS_249
和/>
Figure SMS_251
均为可训练参数。
S24:在注意力图卷积神经网络模块中,使用注意力机制,对连接节点的异构信息进行动态的聚合,注意力机制可以是多头注意力,取其中的一个部分进行描述:对于节点
Figure SMS_253
,计算与/>
Figure SMS_254
连接的节点/>
Figure SMS_255
对应的注意力系数/>
Figure SMS_256
Figure SMS_257
其中
Figure SMS_258
表示softmax激活函数,/>
Figure SMS_259
为LeakyRelu非线性激活函数,/>
Figure SMS_260
是用于得到注意力打分值的可训练的向量,/>
Figure SMS_261
为可训练的参数,/>
Figure SMS_262
是与节点/>
Figure SMS_263
有连接的其他节点的集合。
得到注意力系数
Figure SMS_264
}后,将和/>
Figure SMS_265
相连的节点进行加权求和得到所述的增强原因隐向量/>
Figure SMS_266
Figure SMS_267
其中,
Figure SMS_268
是节点/>
Figure SMS_269
对自身的注意力系数,/>
Figure SMS_270
是节点/>
Figure SMS_271
关于节点/>
Figure SMS_272
的注意力系数。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内,不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立技术方案,说明书的这种叙述方式仅仅是为了清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (3)

1.一种基于图结构的情绪原因提取方法,其特征在于,通过情绪原因提取模型从对话中提取出导致情绪句子含有特定情绪E的情绪原因片段,情绪原因片段所在的句子称为情绪原因句子;
对话记为
Figure QLYQS_1
,其中/>
Figure QLYQS_5
为对话的第i个句子,N为对话中的句子总数,/>
Figure QLYQS_9
为第i个句子的第j个词,/>
Figure QLYQS_3
为第i个句子中词的总数;情绪句子记为/>
Figure QLYQS_8
;/>
Figure QLYQS_12
为词
Figure QLYQS_15
的情绪原因抽取标签,当/>
Figure QLYQS_2
不属于情绪E的原因时,/>
Figure QLYQS_6
;当/>
Figure QLYQS_10
在情绪E的原因的开始位置时,/>
Figure QLYQS_13
;/>
Figure QLYQS_4
在情绪E的原因的中间时,/>
Figure QLYQS_7
;将情绪原因抽取标签/>
Figure QLYQS_11
和/>
Figure QLYQS_14
的词按顺序组合在一起即形成所述的情绪原因片段;
情绪原因提取模型包括编码器、多原因推测图网络和解码器;
情绪原因提取模型训练过程包括以下步骤:
步骤一、使用编码器为对话中的N个句子以及句子中的词进行编码,得到第i个句子的初始句子编码向量
Figure QLYQS_16
,第i个句子中第j个词的初始词编码向量/>
Figure QLYQS_20
;记情绪句子/>
Figure QLYQS_23
的初始情绪编码向量/>
Figure QLYQS_17
;将初始句子编码向量/>
Figure QLYQS_21
和初始情绪编码向量/>
Figure QLYQS_24
输入到双向长短期记忆网络后,得到句子编码向量/>
Figure QLYQS_26
和情绪编码向量/>
Figure QLYQS_18
;取句子/>
Figure QLYQS_22
中,存在情绪原因片段的情绪原因句子/>
Figure QLYQS_25
对应的句子编码向量,得到原因编码向量
Figure QLYQS_27
,n为情绪原因句子的总数;第c个情绪原因句子中第j个词的词编码向量为/>
Figure QLYQS_19
步骤二、使用多原因推测图网络,对n个原因编码向量
Figure QLYQS_28
、情绪E、情绪编码向量/>
Figure QLYQS_29
建模,得到n个增强原因隐向量/>
Figure QLYQS_30
,其中,第c个增强原因隐向量为/>
Figure QLYQS_31
步骤三、使用解码器,对某个情绪原因句子
Figure QLYQS_33
的每个词的词编码向量/>
Figure QLYQS_36
与/>
Figure QLYQS_39
对应的原因增强隐向量/>
Figure QLYQS_35
进行粘连,生成增强词编码隐向量/>
Figure QLYQS_40
,即
Figure QLYQS_42
;将增强词编码隐向量/>
Figure QLYQS_44
通过全连接层得到最终输出词向量/>
Figure QLYQS_32
,即
Figure QLYQS_38
,/>
Figure QLYQS_41
和b分别为解码器矩阵和向量;其中/>
Figure QLYQS_43
每个维度的值表示对应维度的情绪标签得分,选择得分最高的情绪标签作为词/>
Figure QLYQS_34
的情绪原因抽取标签/>
Figure QLYQS_37
的预测结果。
2.根据权利要求1所述的基于图结构的情绪原因提取方法,其特征在于,所述编码器为SpanBERT编码器。
3.根据权利要求1所述的基于图结构的情绪原因提取方法,其特征在于,多原因推测图网络包括嵌入模块、图构建模块、关系图卷积神经网络模块和注意力图卷积神经网络模块;步骤二中,多原因推测图网络计算增强原因隐向量
Figure QLYQS_45
的过程如下:
步骤21:在嵌入模块中,使用情绪嵌入矩阵,把情绪E映射为向量
Figure QLYQS_46
,然后计算原因编码隐向量/>
Figure QLYQS_47
、情绪隐向量/>
Figure QLYQS_48
和情绪句子隐向量/>
Figure QLYQS_49
Figure QLYQS_50
其中
Figure QLYQS_51
和/>
Figure QLYQS_52
为可训练参数,构成关于原因编码向量/>
Figure QLYQS_53
的全连接层;/>
Figure QLYQS_54
为非线性激活函数;
Figure QLYQS_55
其中
Figure QLYQS_56
和/>
Figure QLYQS_57
为可训练的参数,构成关于情绪编码向量/>
Figure QLYQS_58
的全连接层;
Figure QLYQS_59
其中
Figure QLYQS_60
为情绪词嵌入矩阵,/>
Figure QLYQS_61
和/>
Figure QLYQS_62
均为线性激活函数/>
Figure QLYQS_63
的参数,/>
Figure QLYQS_64
表示自变量;
步骤22:在图构建模块中,把情绪句子隐向量
Figure QLYQS_81
、情绪隐向量/>
Figure QLYQS_84
以及n个原因编码隐向量
Figure QLYQS_87
作为节点表征;记这n+2个节点表征为/>
Figure QLYQS_65
,/>
Figure QLYQS_69
为第k个节点,其中当
Figure QLYQS_73
时,/>
Figure QLYQS_77
;当/>
Figure QLYQS_82
时,/>
Figure QLYQS_85
;当/>
Figure QLYQS_88
时,/>
Figure QLYQS_90
;得到邻接矩阵
Figure QLYQS_83
和关系矩阵/>
Figure QLYQS_86
;其中/>
Figure QLYQS_89
表示为G中任意两个节点/>
Figure QLYQS_91
之间的有向边,/>
Figure QLYQS_68
,/>
Figure QLYQS_72
表示有向边/>
Figure QLYQS_76
所标记的值,反映了节点/>
Figure QLYQS_80
与节点/>
Figure QLYQS_67
之间的关系;对得到的n+2个节点/>
Figure QLYQS_70
使用有向异构图模型/>
Figure QLYQS_74
进行建模:即G中的每一对节点/>
Figure QLYQS_78
都能够映射到邻接矩阵A中的一个元素/>
Figure QLYQS_66
,而邻接矩阵A中的元素/>
Figure QLYQS_71
也能够映射为关系矩阵/>
Figure QLYQS_75
中的元素/>
Figure QLYQS_79
步骤23:在关系图卷积神经网络模块中,对于每个节点
Figure QLYQS_92
,将与/>
Figure QLYQS_93
有连接的其他节点/>
Figure QLYQS_94
的信息聚合到节点/>
Figure QLYQS_95
中后,记为节点/>
Figure QLYQS_96
Figure QLYQS_97
其中,
Figure QLYQS_99
是与节点/>
Figure QLYQS_103
有连接的其他节点的集合;/>
Figure QLYQS_105
是关系矩阵R中起始节点为/>
Figure QLYQS_100
的可能值的集合,/>
Figure QLYQS_101
;/>
Figure QLYQS_104
是用于自连接的矩阵,能够聚合自身的信息;/>
Figure QLYQS_107
是在关系r下用于提取节点/>
Figure QLYQS_98
信息的矩阵,/>
Figure QLYQS_102
和/>
Figure QLYQS_106
均为可训练参数;
步骤24:在注意力图卷积神经网络模块中,使用注意力机制,对连接节点的异构信息进行动态聚合,具体包括:对于节点
Figure QLYQS_108
,计算与/>
Figure QLYQS_109
连接的节点/>
Figure QLYQS_110
对应的注意力系数/>
Figure QLYQS_111
Figure QLYQS_112
其中
Figure QLYQS_113
表示softmax激活函数,/>
Figure QLYQS_114
为LeakyRelu非线性激活函数,/>
Figure QLYQS_115
是用于得到注意力打分值的可训练的向量,/>
Figure QLYQS_116
为可训练的参数,/>
Figure QLYQS_117
是与节点/>
Figure QLYQS_118
有连接的其他节点的集合;
得到注意力系数
Figure QLYQS_119
后,将和/>
Figure QLYQS_120
相连的节点进行加权求和得到所述的增强原因隐向量/>
Figure QLYQS_121
Figure QLYQS_122
其中,
Figure QLYQS_123
是节点/>
Figure QLYQS_124
对自身的注意力系数,/>
Figure QLYQS_125
是节点/>
Figure QLYQS_126
关于节点/>
Figure QLYQS_127
的注意力系数。
CN202310144042.1A 2023-02-21 2023-02-21 一种基于图结构的情绪原因提取方法 Active CN115841119B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310144042.1A CN115841119B (zh) 2023-02-21 2023-02-21 一种基于图结构的情绪原因提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310144042.1A CN115841119B (zh) 2023-02-21 2023-02-21 一种基于图结构的情绪原因提取方法

Publications (2)

Publication Number Publication Date
CN115841119A CN115841119A (zh) 2023-03-24
CN115841119B true CN115841119B (zh) 2023-06-16

Family

ID=85579983

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310144042.1A Active CN115841119B (zh) 2023-02-21 2023-02-21 一种基于图结构的情绪原因提取方法

Country Status (1)

Country Link
CN (1) CN115841119B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116258134B (zh) * 2023-04-24 2023-08-29 中国科学技术大学 一种基于卷积联合模型的对话情感识别方法
CN116187419B (zh) * 2023-04-25 2023-08-29 中国科学技术大学 一种基于文本组块的层级体系自动构建方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018097292A (ja) * 2016-12-16 2018-06-21 日本電気株式会社 感情識別装置、感情識別方法および感情識別プログラム
CN110162636A (zh) * 2019-05-30 2019-08-23 中森云链(成都)科技有限责任公司 基于d-lstm的文本情绪原因识别方法
CN112100337A (zh) * 2020-10-15 2020-12-18 平安科技(深圳)有限公司 交互对话中的情绪识别方法及装置
CN113505583A (zh) * 2021-05-27 2021-10-15 山东交通学院 基于语义决策图神经网络的情感原因子句对提取方法
CN113535957A (zh) * 2021-07-27 2021-10-22 哈尔滨工业大学 基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质
CN113926198A (zh) * 2021-11-15 2022-01-14 网易(杭州)网络有限公司 情绪数据的识别方法、装置、存储介质及电子设备
CN113988048A (zh) * 2021-10-13 2022-01-28 北京理工大学 基于多轮机器阅读理解的情感原因对抽取方法
CN113987179A (zh) * 2021-10-27 2022-01-28 哈尔滨工业大学 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质
CN114911932A (zh) * 2022-04-22 2022-08-16 南京信息工程大学 基于主题语义增强的异构图结构多会话者情感分析方法
CN115129818A (zh) * 2022-07-10 2022-09-30 大连理工大学 基于知识驱动多分类的情绪原因对提取方法及系统
CN115329769A (zh) * 2022-07-05 2022-11-11 中国电子科技集团公司电子科学研究院 基于语义增强网络的平台企业网络舆论情感分析方法
CN115510860A (zh) * 2022-10-27 2022-12-23 苏州思萃人工智能研究所有限公司 一种文本情感分析方法、装置、电子设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018097292A (ja) * 2016-12-16 2018-06-21 日本電気株式会社 感情識別装置、感情識別方法および感情識別プログラム
CN110162636A (zh) * 2019-05-30 2019-08-23 中森云链(成都)科技有限责任公司 基于d-lstm的文本情绪原因识别方法
CN112100337A (zh) * 2020-10-15 2020-12-18 平安科技(深圳)有限公司 交互对话中的情绪识别方法及装置
CN113505583A (zh) * 2021-05-27 2021-10-15 山东交通学院 基于语义决策图神经网络的情感原因子句对提取方法
CN113535957A (zh) * 2021-07-27 2021-10-22 哈尔滨工业大学 基于双重知识交互和多任务学习的对话情绪识别网络模型、构建方法、电子设备及存储介质
CN113988048A (zh) * 2021-10-13 2022-01-28 北京理工大学 基于多轮机器阅读理解的情感原因对抽取方法
CN113987179A (zh) * 2021-10-27 2022-01-28 哈尔滨工业大学 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质
CN113926198A (zh) * 2021-11-15 2022-01-14 网易(杭州)网络有限公司 情绪数据的识别方法、装置、存储介质及电子设备
CN114911932A (zh) * 2022-04-22 2022-08-16 南京信息工程大学 基于主题语义增强的异构图结构多会话者情感分析方法
CN115329769A (zh) * 2022-07-05 2022-11-11 中国电子科技集团公司电子科学研究院 基于语义增强网络的平台企业网络舆论情感分析方法
CN115129818A (zh) * 2022-07-10 2022-09-30 大连理工大学 基于知识驱动多分类的情绪原因对提取方法及系统
CN115510860A (zh) * 2022-10-27 2022-12-23 苏州思萃人工智能研究所有限公司 一种文本情感分析方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN115841119A (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
CN115841119B (zh) 一种基于图结构的情绪原因提取方法
CN108875807B (zh) 一种基于多注意力多尺度的图像描述方法
CN109508462B (zh) 一种基于编码器-解码器的神经网络蒙汉机器翻译方法
Zhao et al. Automatic assessment of depression from speech via a hierarchical attention transfer network and attention autoencoders
CN108363695B (zh) 一种基于双向依赖语法树表征的用户评论属性抽取方法
CN111382582A (zh) 一种基于非自回归的神经机器翻译解码加速方法
CN113987179A (zh) 基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质
CN115964467A (zh) 一种融合视觉情境的富语义对话生成方法
CN113435211A (zh) 一种结合外部知识的文本隐式情感分析方法
CN114360502A (zh) 语音识别模型的处理方法、语音识别方法及装置
CN112560440A (zh) 一种基于深度学习的面向方面级情感分析的句法依赖方法
CN110717342A (zh) 一种基于transformer的距离参量对齐翻译方法
CN112464673B (zh) 融合义原信息的语言含义理解方法
CN113361505B (zh) 基于对比解耦元学习的非特定人的手语翻译方法和系统
CN114896969A (zh) 一种基于深度学习的方面词提取方法
CN115169363A (zh) 一种融合知识的增量编码的对话情感识别方法
CN113869059A (zh) 基于注意力机制的自然语言文本三元组提取方法及系统
CN114492458A (zh) 一种基于多头注意力和词共现的方面级情感分析方法
CN113077785B (zh) 一种端到端的多语言连续语音流语音内容识别方法及系统
JP7120064B2 (ja) 言語モデルスコア計算装置、言語モデル作成装置、それらの方法、プログラム、および記録媒体
CN113901758A (zh) 一种面向知识图谱自动构建系统的关系抽取方法
Sun et al. Human-machine conversation based on hybrid neural network
CN117787224B (zh) 一种基于多源异构特征融合的可控故事生成方法
Zhou et al. Multimodal emotion recognition based on multilevel acoustic and textual information
CN116258134B (zh) 一种基于卷积联合模型的对话情感识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant