CN116303947A

CN116303947A - 一种问答文本的情绪识别方法、装置及电子设备

Info

Publication number: CN116303947A
Application number: CN202310169316.2A
Authority: CN
Inventors: 尚媛园; 陈德馨; 邵珠宏; 刘靖祎; 王雪; 丁辉; 刘铁; 赵晓旭
Original assignee: Capital Normal University
Current assignee: Capital Normal University
Priority date: 2023-02-24
Filing date: 2023-02-24
Publication date: 2023-06-23
Anticipated expiration: 2043-02-24
Also published as: CN116303947B

Abstract

本申请提供了一种问答文本的情绪识别方法、装置及电子设备，提取出与所有预设主题对应的多个问答文本对；针对每个预设主题，该预设主题对应的所有问答文本对转换为特征向量，并形成与该预设主题对应的提问文本向量序列和应答文本向量序列；通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互，以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量；通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接；将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以确定出情绪识别结果，通过关注问答文本的结构特点，可以进一步提升情绪识别的准确性。

Description

一种问答文本的情绪识别方法、装置及电子设备

技术领域

本申请涉及文本识别技术领域，具体而言，涉及一种问答文本的情绪识别方法、装置及电子设备。

背景技术

近年来，基于深度学习的模型成为了文本分类模型的主流，其中主要的模型包括RNN，CNN等。在这些基础深度模型的基础之上，一些工作着眼于将不同角度的信息融入到文本分类任务当中，并取得了成功。

语言和对话是医生诊断和治疗精神疾病的主要数据来源，将人工智能技术应用于患者的分析，可以帮助精神疾病的预警。而现有的抑郁症识别方法，通常直接拼接问答文本进行识别，效果不佳，因此需要进一步提升识别的准确性。

发明内容

有鉴于此，本申请的目的在于提供一种问答文本的情绪识别方法、装置及电子设备，通过关注问答文本的结构特点，可以进一步提升情绪识别的准确性。

第一方面，本申请提供了一种问答文本的情绪识别方法，方法包括：对目标问答文本进行处理，以提取出与所有预设主题对应的多个问答文本对，每个问答文本对包括提问文本和对应的应答文本；针对每个预设主题，将该预设主题对应的所有问答文本对转换为特征向量，并形成与该预设主题对应的提问文本向量序列和应答文本向量序列；针对每个预设主题，通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互，以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量；针对每个预设主题，通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接，以生成问答拼接特征向量；将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以确定出情绪识别结果，情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。

优选的，通过以下方式确定出情绪识别结果：将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以获取主题拼接特征；通过自注意力机制对主题拼接特征进行信息融合，以生成主题融合特征；将主题融合特征输入前馈神经网络，以输出情绪特征向量，情绪特征向量用于指示目标问答文本所表达的情绪；基于情绪特征向量，计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。

优选的，通过以下方式对目标问答文本进行处理：确定出目标问答文本中的所有问答文本对；针对每个问答文本对，基于文本情绪的相似度，确定该问答文本对所表达的主题是否为预设主题中的一个，若是，则将该问答文本对作为该预设主题对应的一个问答文本对。

优选的，针对每个预设主题，通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列：将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换，以输出提问文本向量序列和应答文本向量序列。

优选的，针对每个预设主题，通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量：将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型，以输出第一信息交互结果和第二信息交互结果；将第一信息交互结果和提问文本向量序列输入归一层，以输出目标提问文本特征向量；将第二信息交互结果和应答文本向量序列输入归一层，以输出目标应答文本特征向量。

优选的，针对每个预设主题，通过以下方式生成对应的问答拼接特征向量：生成目标提问文本特征向量对应的目标提问融合特征；将目标提问融合特征向量与目标应答文本特征进行拼接，以生成第一拼接特征；将第一拼接特征输入预先训练好的双向长短期记忆力神经网络，以分别输出正向第二拼接特征和反向第二拼接特征；将正向第二拼接特征和反向第二拼接特征进行拼接，以生成该预设主题对应的问答拼接特征向量。

优选的，针对每个预设主题，该预设主题对应的所有问答文本对转换为特征向量的步骤之前，还包括：针对每个问答文本对中的提问文本和应答文本，通过以下至少一种方式进行归一化处理：对提问文本和应答文本中的缩写词进行还原；对提问文本和应答文本中的词性进行还原；去除提问文本和应答文本中的停用词；去除提问文本和应答文本中的标点符号。

第二方面，本申请提供了一种问答文本的情绪识别装置，装置包括：

文本提取模块，用于对目标问答文本进行处理，以提取出与所有预设主题对应的多个问答文本对，每个问答文本对包括提问文本和对应的应答文本；

向量转换模块，用于针对每个预设主题，将该预设主题对应的所有问答文本对转换为特征向量，并形成与该预设主题对应的提问文本向量序列和应答文本向量序列；

信息交互模块，用于针对每个预设主题，通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互，以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量；

融合拼接模块，用于针对每个预设主题，通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接，以生成问答拼接特征向量；

情绪评价模块，用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以确定出情绪识别结果，情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。

第三方面，本申请还提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如上述的问答文本的情绪识别方法的步骤。

第四方面，本申请还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述的问答文本的情绪识别方法的步骤。

本申请提供的问答文本的情绪识别方法、装置及电子设备，对目标问答文本进行处理，以提取出与所有预设主题对应的多个问答文本对，每个问答文本对包括提问文本和对应的应答文本；针对每个预设主题，将该预设主题对应的所有问答文本对转换为特征向量，并形成与该预设主题对应的提问文本向量序列和应答文本向量序列；针对每个预设主题，通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互，以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量；针对每个预设主题，通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接，以生成问答拼接特征向量；将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以确定出情绪识别结果，情绪识别结果用于指示目标问答文本所表达的情绪的健康程度，通过基于问答文本的结构特点设计模型结构，对文本向量进行处理，计算出情绪识别结果，提升了情绪识别的准确性。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例所提供的一种问答文本的情绪识别方法的流程图；

图2为本申请实施例所提供的一种单轮问答信息交互的步骤的流程图；

图3为本申请实施例所提供的一种单轮问答特征融合的步骤的流程图；

图4为本申请实施例所提供的一种确定情绪识别结果的步骤的流程图；

图5为本申请实施例所提供的一种问答文本的情绪识别装置的结构示意图；

图6为本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例，都属于本申请保护的范围。

首先，对本申请可适用的应用场景进行介绍。本申请可应用于基于问答文本的抑郁症识别。

基于此，本申请实施例提供了一种问答文本的情绪识别方法、装置及电子设备。

请参阅图1，图1为本申请实施例所提供的一种问答文本的情绪识别方法的流程图。所如图1中所示，本申请实施例提供的问答文本的情绪识别方法，方法包括：

S101、对目标问答文本进行处理，以提取出与所有预设主题对应的多个问答文本对，每个问答文本对包括提问文本和对应的应答文本。

该步骤中，可以通过问诊或抑郁症评定量表的诊断过程，获得诊断文字或音频记录，进而转换为多轮问答文本。一轮问答文本即一个问答文本对(Q_i，A_i)，包括提问文本Q_i和应答文本A_i，其中i∈[0,l]，l为问答文本对的数量。

在一次抑郁症的评估过程中会产生很多个问答对，这些问答对并不都对抑郁症的识别起到积极作用。与抑郁症识别关联性小的或者无关的问答对可能成为干扰信息，影响抑郁症识别的精度和效率。因此，在得到问答文本后，首先要进行问答对筛选。受医生筛选抑郁症时使用的量表和文献相关研究的启发，这里的预设主题包括：argue、proud、sleep、study、emotion、depress、PTSD(post-traumatic stress disorder，创伤后应激障碍)。

例如，对应的问题分别可以为“上次争吵是因为什么/什么时候”、“有没有什么值得骄傲的事情”、“睡醒情况怎么样”、“学习能力怎么样”、“情绪控制能力怎么样”、“是否被确诊过抑郁症”以及“是否被确诊过创伤后应激障碍”等等。

具体的，可以通过以下方式对目标问答文本进行处理：

确定出目标问答文本中的所有问答文本对。针对每个问答文本对，基于文本情绪的相似度，确定该问答文本对所表达的主题是否为预设主题中的一个，若是，则将该问答文本对作为该预设主题对应的一个问答文本对。

这里筛选与预设主题对应的问答文本对，可以采用MPNet(Masked and PermutedPre-training for Language Understanding)模型，计算语句相似度的方式进行筛选，也可以是采用人工构筑正则表达式进行匹配等。

针对每个预设主题，该预设主题对应的所有问答文本对转换为特征向量的步骤之前，还包括：

针对每个问答文本对中的提问文本和应答文本，通过以下至少一种方式进行归一化处理：

对提问文本和应答文本中的缩写词进行还原；

对提问文本和应答文本中的词性进行还原；

去除提问文本和应答文本中的停用词；

去除提问文本和应答文本中的标点符号。

筛选后的问答文本对，还需要进行文本预处理，使文本归一化，方便输入深度学习模型。这里可以按照上文顺序，采用所有方式依次对每个问答文本对进行处理。每个预处理后的问答文本对记为

S102、针对每个预设主题，将该预设主题对应的所有问答文本对转换为特征向量，并形成与该预设主题对应的提问文本向量序列和应答文本向量序列。

该步骤中，针对每个预设主题，通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列：

将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换，以输出提问文本向量序列和应答文本向量序列。

这里采用预先训练好的BERT模型将处理后的问答文本对转换为向量序列：

转换后的序列可表示为：

其中，/>

为提问文本向量序列，/>

为应答文本向量序列，h_ij为词向量，j表示词的顺序，i∈(argue,proud,sleep,study,emotion,depress,PTSD)，/>

d_h为词向量维度，m为提问文本向量序列的序列长度，n为应答文本向量序列的序列长度。

S103、针对每个预设主题，通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互，以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量。

图2为本申请实施例所提供的一种单轮问答信息交互的步骤的流程图。如图2所示，针对每个预设主题，通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量：

S1030、将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型，以输出第一信息交互结果和第二信息交互结果；

S1032、将第一信息交互结果和提问文本向量序列输入归一层，以输出目标提问文本特征向量；

S1034、将第二信息交互结果和应答文本向量序列输入归一层，以输出目标应答文本特征向量。

获得问答文本的特征表示后，使用注意力机制进行问答文本间的信息交互，可以表示为：

其中，

为目标提问文本特征向量，/>

为目标应答文本特征向量，MH-Att(Q,K,V)为多头注意力机制，LN表示归一化层。

以提问文本为例，从多头注意力机制的角度来看，这样的表示可以看作是以问题为“query”，与答案中的“key”对齐，从而获得相关意见信息的结果，即“value”部分。

S104、针对每个预设主题，通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接，以生成问答拼接特征向量。

图3为本申请实施例所提供的一种单轮问答特征融合的步骤的流程图。如图3所示，该步骤中，针对每个预设主题，通过以下方式生成对应的问答拼接特征向量：

S1040、生成目标提问文本特征向量对应的目标提问融合特征；将目标提问融合特征向量与目标应答文本特征进行拼接，以生成第一拼接特征；

S1042、将第一拼接特征输入预先训练好的双向长短期记忆力神经网络，以分别输出正向第二拼接特征和反向第二拼接特征；

S1044、将正向第二拼接特征和反向第二拼接特征进行拼接，以生成该预设主题对应的问答拼接特征向量。

对通过步骤S103获得的信息交互后的目标提问文本特征向量

使用单词级门控融合机制，使其与提问文本向量序列/>

中融合细粒度信息：

其中，W^r和W^a为可学习参数，b_g为预设参数，⊙表示将两个矩阵对应位置元素进行乘积。融合后的目标提问融合特征为：

拼接目标提问融合特征

和目标应答文本特征/>

进行问答特征融合：

其中，S_i为第一拼接特征。

接着使用双向长短期记忆力神经网络，对问答文本的上下文信息进行建模，将其前后向输出拼接，作为该问答对情感特征的最终表示：

其中，V_i为问答拼接特征向量。

S105、将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以确定出情绪识别结果，情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。

图4为本申请实施例所提供的一种确定情绪识别结果的步骤的流程图。如图4所示，该步骤中，通过以下方式确定出情绪识别结果：

S1050、将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以获取主题拼接特征；

通过步骤S104获得各预设主题对应的问答拼接特征向量后，将其拼接作为目标问答文本的主题拼接特征表示为：

P＝[V_argue,V_proud,V_sleep,V_study,V_emotion,V_depress,V_PTSD]。

S1052、通过自注意力机制对主题拼接特征进行信息融合，以生成主题融合特征；

相较于循环神经网络，自注意力机制能够更好的捕获长距离上下文依赖关系，因此本发明使用自注意力机制对问答对级上下文信息进行建模：

为主题融合特征，这里使用了MH_ProbSpares_Self_Attention机制，相比传统自注意力机制，该自注意力机制通过概率计算聚焦重要信息，能够提升情绪识别的计算效率。

S1054、将主题融合特征输入前馈神经网络，以输出情绪特征向量，情绪特征向量用于指示目标问答文本所表达的情绪；

S1056、基于情绪特征向量，计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。

在步骤S1054和S1056中，通过前馈神经网络获得问答文本的最终情感表示为：

FFN(x)＝Linear(Relu(Linear(x)))；

其中，

为情绪特征向量，Linear表示线性层，Relu为激活函数，

MaxPooling是最大值池化层。

最后，通过Softmax层计算输出是否抑郁的分类概率：

其中，p_h是识别为健康的概率,_d为识别为抑郁(非健康)的概率，W^s和b_s是Soft-max层的权重和偏置。采用交叉熵函数作为目标函数，定义如下：

其中，K表示训练样本的数目，C表示目标类别的数目，y_k表示第k个样本的正确标签，

表示第k个样本的预测标签，λ是正则化系数，θ代表所有参数。采用Adam优化算法对参数进行更新。

本申请实施例提供的问答文本的情绪识别方法，考虑了问答文本的结构特点，对单轮问答文本对进行信息交互，同时对多轮问答文本对也进行了信息交互，最后输出了情绪识别结果，能够更准确的识别出问答文本所表达的抑郁程度。能够迁移到心理问诊环节，帮助评价病人是否患有抑郁症。

基于同一发明构思，本申请实施例中还提供了与问答文本的情绪识别方法对应的问答文本的情绪识别装置，由于本申请实施例中的装置解决问题的原理与本申请实施例上述问答文本的情绪识别方法相似，因此装置的实施可以参见方法的实施，重复之处不再赘述。

请参阅图5，图5为本申请实施例所提供的一种问答文本的情绪识别装置的结构示意图。如图5中所示，所述情绪识别装置500包括：

文本提取模块510，用于对目标问答文本进行处理，以提取出与所有预设主题对应的多个问答文本对，每个问答文本对包括提问文本和对应的应答文本；

向量转换模块520，用于针对每个预设主题，将该预设主题对应的所有问答文本对转换为特征向量，并形成与该预设主题对应的提问文本向量序列和应答文本向量序列；

信息交互模块530，用于针对每个预设主题，通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互，以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量；

融合拼接模块540，用于针对每个预设主题，通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接，以生成问答拼接特征向量；

情绪评价模块550，用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以确定出情绪识别结果，情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。

在一优选实施例中，情绪评价模块550通过以下方式确定出情绪识别结果：将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以获取主题拼接特征；通过自注意力机制对主题拼接特征进行信息融合，以生成主题融合特征；将主题融合特征输入前馈神经网络，以输出情绪特征向量，情绪特征向量用于指示目标问答文本所表达的情绪；基于情绪特征向量，计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。

在一优选实施例中，文本提取模块510通过以下方式对目标问答文本进行处理：确定出目标问答文本中的所有问答文本对；针对每个问答文本对，基于文本情绪的相似度，确定该问答文本对所表达的主题是否为预设主题中的一个，若是，则将该问答文本对作为该预设主题对应的一个问答文本对。

在一优选实施例中，针对每个预设主题，向量转换模块520通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列：将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换，以输出提问文本向量序列和应答文本向量序列。

在一优选实施例中，针对每个预设主题，信息交互模块530通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量：将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型，以输出第一信息交互结果和第二信息交互结果；将第一信息交互结果和提问文本向量序列输入归一层，以输出目标提问文本特征向量；将第二信息交互结果和应答文本向量序列输入归一层，以输出目标应答文本特征向量。

在一优选实施例中，针对每个预设主题，融合拼接模块540通过以下方式生成对应的问答拼接特征向量：生成目标提问文本特征向量对应的目标提问融合特征；将目标提问融合特征向量与目标应答文本特征进行拼接，以生成第一拼接特征；将第一拼接特征输入预先训练好的双向长短期记忆力神经网络，以分别输出正向第二拼接特征和反向第二拼接特征；将正向第二拼接特征和反向第二拼接特征进行拼接，以生成该预设主题对应的问答拼接特征向量。

在一优选实施例中，文本提取模块510还用于针对每个问答文本对中的提问文本和应答文本，通过以下至少一种方式进行归一化处理：对提问文本和应答文本中的缩写词进行还原；对提问文本和应答文本中的词性进行还原；去除提问文本和应答文本中的停用词；去除提问文本和应答文本中的标点符号。

请参阅图6，图6为本申请实施例所提供的一种电子设备的结构示意图。如图6中所示，所述电子设备600包括处理器610、存储器620和总线630。

所述存储器620存储有所述处理器610可执行的机器可读指令，当电子设备600运行时，所述处理器610与所述存储器620之间通过总线630通信，所述机器可读指令被所述处理器610执行时，可以执行如上述图1所示方法实施例中的问答文本的情绪识别方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的问答文本的情绪识别方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种问答文本的情绪识别方法，其特征在于，所述方法包括：

对目标问答文本进行处理，以提取出与所有预设主题对应的多个问答文本对，每个问答文本对包括提问文本和对应的应答文本；

针对每个预设主题，将该预设主题对应的所有问答文本对转换为特征向量，并形成与该预设主题对应的提问文本向量序列和应答文本向量序列；

针对每个预设主题，通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互，以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量；

针对每个预设主题，通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接，以生成问答拼接特征向量；

将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以确定出情绪识别结果，所述情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。

2.根据权利要求1所述的方法，其特征在于，通过以下方式确定出情绪识别结果：

将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以获取主题拼接特征；

通过自注意力机制对所述主题拼接特征进行信息融合，以生成主题融合特征；

将所述主题融合特征输入前馈神经网络，以输出情绪特征向量，所述情绪特征向量用于指示所述目标问答文本所表达的情绪；

基于所述情绪特征向量，计算出所述目标问答文本所表达的情绪为目标情绪的概率值、所述目标问答文本所表达的情绪为非目标情绪的概率值。

3.根据权利要求1所述的方法，其特征在于，通过以下方式对目标问答文本进行处理：

确定出目标问答文本中的所有问答文本对；

针对每个问答文本对，基于文本情绪的相似度，确定该问答文本对所表达的主题是否为预设主题中的一个，若是，则将该问答文本对作为该预设主题对应的一个问答文本对。

4.根据权利要求1所述的方法，其特征在于，针对每个预设主题，通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列：

5.根据权利要求1所述的方法，其特征在于，针对每个预设主题，通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量：

将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型，以输出第一信息交互结果和第二信息交互结果；

将所述第一信息交互结果和提问文本向量序列输入归一层，以输出目标提问文本特征向量；

将所述第二信息交互结果和应答文本向量序列输入归一层，以输出目标应答文本特征向量。

6.根据权利要求1所述的方法，其特征在于，针对每个预设主题，通过以下方式生成对应的问答拼接特征向量：

生成目标提问文本特征向量对应的目标提问融合特征；

将目标提问融合特征向量与目标应答文本特征进行拼接，以生成第一拼接特征；

将所述第一拼接特征输入预先训练好的双向长短期记忆力神经网络，以分别输出正向第二拼接特征和反向第二拼接特征；

将所述正向第二拼接特征和反向第二拼接特征进行拼接，以生成该预设主题对应的问答拼接特征向量。

7.根据权利要求1所述的方法，其特征在于，所述针对每个预设主题，该预设主题对应的所有问答文本对转换为特征向量的步骤之前，还包括：

对所述提问文本和所述应答文本中的缩写词进行还原；

对所述提问文本和所述应答文本中的词性进行还原；

去除所述提问文本和所述应答文本中的停用词；

去除所述提问文本和所述应答文本中的标点符号。

8.一种问答文本的情绪识别装置，其特征在于，所述装置包括：

情绪评价模块，用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接，以确定出情绪识别结果，所述情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。

9.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述处理器执行所述机器可读指令，以执行如权利要求1至7任一所述问答文本的情绪识别方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至7任一所述问答文本的情绪识别方法的步骤。