CN116303947A - 一种问答文本的情绪识别方法、装置及电子设备 - Google Patents
一种问答文本的情绪识别方法、装置及电子设备 Download PDFInfo
- Publication number
- CN116303947A CN116303947A CN202310169316.2A CN202310169316A CN116303947A CN 116303947 A CN116303947 A CN 116303947A CN 202310169316 A CN202310169316 A CN 202310169316A CN 116303947 A CN116303947 A CN 116303947A
- Authority
- CN
- China
- Prior art keywords
- text
- question
- answer
- target
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000008909 emotion recognition Effects 0.000 title claims abstract description 43
- 239000013598 vector Substances 0.000 claims abstract description 192
- 230000004044 response Effects 0.000 claims abstract description 72
- 230000008451 emotion Effects 0.000 claims abstract description 64
- 230000004927 fusion Effects 0.000 claims abstract description 45
- 230000003993 interaction Effects 0.000 claims abstract description 35
- 230000007246 mechanism Effects 0.000 claims abstract description 33
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000036541 health Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000007526 fusion splicing Methods 0.000 claims description 3
- 230000036651 mood Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 5
- 208000028173 post-traumatic stress disease Diseases 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 208000020016 psychiatric disease Diseases 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000994 depressogenic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种问答文本的情绪识别方法、装置及电子设备,提取出与所有预设主题对应的多个问答文本对;针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,通过关注问答文本的结构特点,可以进一步提升情绪识别的准确性。
Description
技术领域
本申请涉及文本识别技术领域,具体而言,涉及一种问答文本的情绪识别方法、装置及电子设备。
背景技术
近年来,基于深度学习的模型成为了文本分类模型的主流,其中主要的模型包括RNN,CNN等。在这些基础深度模型的基础之上,一些工作着眼于将不同角度的信息融入到文本分类任务当中,并取得了成功。
语言和对话是医生诊断和治疗精神疾病的主要数据来源,将人工智能技术应用于患者的分析,可以帮助精神疾病的预警。而现有的抑郁症识别方法,通常直接拼接问答文本进行识别,效果不佳,因此需要进一步提升识别的准确性。
发明内容
有鉴于此,本申请的目的在于提供一种问答文本的情绪识别方法、装置及电子设备,通过关注问答文本的结构特点,可以进一步提升情绪识别的准确性。
第一方面,本申请提供了一种问答文本的情绪识别方法,方法包括:对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
优选的,通过以下方式确定出情绪识别结果:将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;通过自注意力机制对主题拼接特征进行信息融合,以生成主题融合特征;将主题融合特征输入前馈神经网络,以输出情绪特征向量,情绪特征向量用于指示目标问答文本所表达的情绪;基于情绪特征向量,计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。
优选的,通过以下方式对目标问答文本进行处理:确定出目标问答文本中的所有问答文本对;针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。
优选的,针对每个预设主题,通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列:将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。
优选的,针对每个预设主题,通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;将第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;将第二信息交互结果和应答文本向量序列输入归一层,以输出目标应答文本特征向量。
优选的,针对每个预设主题,通过以下方式生成对应的问答拼接特征向量:生成目标提问文本特征向量对应的目标提问融合特征;将目标提问融合特征向量与目标应答文本特征进行拼接,以生成第一拼接特征;将第一拼接特征输入预先训练好的双向长短期记忆力神经网络,以分别输出正向第二拼接特征和反向第二拼接特征;将正向第二拼接特征和反向第二拼接特征进行拼接,以生成该预设主题对应的问答拼接特征向量。
优选的,针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量的步骤之前,还包括:针对每个问答文本对中的提问文本和应答文本,通过以下至少一种方式进行归一化处理:对提问文本和应答文本中的缩写词进行还原;对提问文本和应答文本中的词性进行还原;去除提问文本和应答文本中的停用词;去除提问文本和应答文本中的标点符号。
第二方面,本申请提供了一种问答文本的情绪识别装置,装置包括:
文本提取模块,用于对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;
向量转换模块,用于针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;
信息交互模块,用于针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;
融合拼接模块,用于针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;
情绪评价模块,用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
第三方面,本申请还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的问答文本的情绪识别方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的问答文本的情绪识别方法的步骤。
本申请提供的问答文本的情绪识别方法、装置及电子设备,对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度,通过基于问答文本的结构特点设计模型结构,对文本向量进行处理,计算出情绪识别结果,提升了情绪识别的准确性。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种问答文本的情绪识别方法的流程图;
图2为本申请实施例所提供的一种单轮问答信息交互的步骤的流程图;
图3为本申请实施例所提供的一种单轮问答特征融合的步骤的流程图;
图4为本申请实施例所提供的一种确定情绪识别结果的步骤的流程图;
图5为本申请实施例所提供的一种问答文本的情绪识别装置的结构示意图;
图6为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于基于问答文本的抑郁症识别。
近年来,基于深度学习的模型成为了文本分类模型的主流,其中主要的模型包括RNN,CNN等。在这些基础深度模型的基础之上,一些工作着眼于将不同角度的信息融入到文本分类任务当中,并取得了成功。
语言和对话是医生诊断和治疗精神疾病的主要数据来源,将人工智能技术应用于患者的分析,可以帮助精神疾病的预警。而现有的抑郁症识别方法,通常直接拼接问答文本进行识别,效果不佳,因此需要进一步提升识别的准确性。
基于此,本申请实施例提供了一种问答文本的情绪识别方法、装置及电子设备。
请参阅图1,图1为本申请实施例所提供的一种问答文本的情绪识别方法的流程图。所如图1中所示,本申请实施例提供的问答文本的情绪识别方法,方法包括:
S101、对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本。
该步骤中,可以通过问诊或抑郁症评定量表的诊断过程,获得诊断文字或音频记录,进而转换为多轮问答文本。一轮问答文本即一个问答文本对(Qi,Ai),包括提问文本Qi和应答文本Ai,其中i∈[0,l],l为问答文本对的数量。
在一次抑郁症的评估过程中会产生很多个问答对,这些问答对并不都对抑郁症的识别起到积极作用。与抑郁症识别关联性小的或者无关的问答对可能成为干扰信息,影响抑郁症识别的精度和效率。因此,在得到问答文本后,首先要进行问答对筛选。受医生筛选抑郁症时使用的量表和文献相关研究的启发,这里的预设主题包括:argue、proud、sleep、study、emotion、depress、PTSD(post-traumatic stress disorder,创伤后应激障碍)。
例如,对应的问题分别可以为“上次争吵是因为什么/什么时候”、“有没有什么值得骄傲的事情”、“睡醒情况怎么样”、“学习能力怎么样”、“情绪控制能力怎么样”、“是否被确诊过抑郁症”以及“是否被确诊过创伤后应激障碍”等等。
具体的,可以通过以下方式对目标问答文本进行处理:
确定出目标问答文本中的所有问答文本对。针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。
这里筛选与预设主题对应的问答文本对,可以采用MPNet(Masked and PermutedPre-training for Language Understanding)模型,计算语句相似度的方式进行筛选,也可以是采用人工构筑正则表达式进行匹配等。
针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量的步骤之前,还包括:
针对每个问答文本对中的提问文本和应答文本,通过以下至少一种方式进行归一化处理:
对提问文本和应答文本中的缩写词进行还原;
对提问文本和应答文本中的词性进行还原;
去除提问文本和应答文本中的停用词;
去除提问文本和应答文本中的标点符号。
S102、针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列。
该步骤中,针对每个预设主题,通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列:
将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。
这里采用预先训练好的BERT模型将处理后的问答文本对转换为向量序列:
转换后的序列可表示为:
其中,/>为提问文本向量序列,/>为应答文本向量序列,hij为词向量,j表示词的顺序,i∈(argue,proud,sleep,study,emotion,depress,PTSD),/>dh为词向量维度,m为提问文本向量序列的序列长度,n为应答文本向量序列的序列长度。
S103、针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量。
图2为本申请实施例所提供的一种单轮问答信息交互的步骤的流程图。如图2所示,针对每个预设主题,通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:
S1030、将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;
S1032、将第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;
S1034、将第二信息交互结果和应答文本向量序列输入归一层,以输出目标应答文本特征向量。
获得问答文本的特征表示后,使用注意力机制进行问答文本间的信息交互,可以表示为:
以提问文本为例,从多头注意力机制的角度来看,这样的表示可以看作是以问题为“query”,与答案中的“key”对齐,从而获得相关意见信息的结果,即“value”部分。
S104、针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量。
图3为本申请实施例所提供的一种单轮问答特征融合的步骤的流程图。如图3所示,该步骤中,针对每个预设主题,通过以下方式生成对应的问答拼接特征向量:
S1040、生成目标提问文本特征向量对应的目标提问融合特征;将目标提问融合特征向量与目标应答文本特征进行拼接,以生成第一拼接特征;
S1042、将第一拼接特征输入预先训练好的双向长短期记忆力神经网络,以分别输出正向第二拼接特征和反向第二拼接特征;
S1044、将正向第二拼接特征和反向第二拼接特征进行拼接,以生成该预设主题对应的问答拼接特征向量。
其中,Wr和Wa为可学习参数,bg为预设参数,⊙表示将两个矩阵对应位置元素进行乘积。融合后的目标提问融合特征为:
其中,Si为第一拼接特征。
接着使用双向长短期记忆力神经网络,对问答文本的上下文信息进行建模,将其前后向输出拼接,作为该问答对情感特征的最终表示:
其中,Vi为问答拼接特征向量。
S105、将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
图4为本申请实施例所提供的一种确定情绪识别结果的步骤的流程图。如图4所示,该步骤中,通过以下方式确定出情绪识别结果:
S1050、将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;
通过步骤S104获得各预设主题对应的问答拼接特征向量后,将其拼接作为目标问答文本的主题拼接特征表示为:
P=[Vargue,Vproud,Vsleep,Vstudy,Vemotion,Vdepress,VPTSD]。
S1052、通过自注意力机制对主题拼接特征进行信息融合,以生成主题融合特征;
相较于循环神经网络,自注意力机制能够更好的捕获长距离上下文依赖关系,因此本发明使用自注意力机制对问答对级上下文信息进行建模:
S1054、将主题融合特征输入前馈神经网络,以输出情绪特征向量,情绪特征向量用于指示目标问答文本所表达的情绪;
S1056、基于情绪特征向量,计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。
在步骤S1054和S1056中,通过前馈神经网络获得问答文本的最终情感表示为:
FFN(x)=Linear(Relu(Linear(x)));
MaxPooling是最大值池化层。
最后,通过Softmax层计算输出是否抑郁的分类概率:
其中,ph是识别为健康的概率,d为识别为抑郁(非健康)的概率,Ws和bs是Soft-max层的权重和偏置。采用交叉熵函数作为目标函数,定义如下:
本申请实施例提供的问答文本的情绪识别方法,考虑了问答文本的结构特点,对单轮问答文本对进行信息交互,同时对多轮问答文本对也进行了信息交互,最后输出了情绪识别结果,能够更准确的识别出问答文本所表达的抑郁程度。能够迁移到心理问诊环节,帮助评价病人是否患有抑郁症。
基于同一发明构思,本申请实施例中还提供了与问答文本的情绪识别方法对应的问答文本的情绪识别装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述问答文本的情绪识别方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图5,图5为本申请实施例所提供的一种问答文本的情绪识别装置的结构示意图。如图5中所示,所述情绪识别装置500包括:
文本提取模块510,用于对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;
向量转换模块520,用于针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;
信息交互模块530,用于针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;
融合拼接模块540,用于针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;
情绪评价模块550,用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
在一优选实施例中,情绪评价模块550通过以下方式确定出情绪识别结果:将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;通过自注意力机制对主题拼接特征进行信息融合,以生成主题融合特征;将主题融合特征输入前馈神经网络,以输出情绪特征向量,情绪特征向量用于指示目标问答文本所表达的情绪;基于情绪特征向量,计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。
在一优选实施例中,文本提取模块510通过以下方式对目标问答文本进行处理:确定出目标问答文本中的所有问答文本对;针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。
在一优选实施例中,针对每个预设主题,向量转换模块520通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列:将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。
在一优选实施例中,针对每个预设主题,信息交互模块530通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;将第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;将第二信息交互结果和应答文本向量序列输入归一层,以输出目标应答文本特征向量。
在一优选实施例中,针对每个预设主题,融合拼接模块540通过以下方式生成对应的问答拼接特征向量:生成目标提问文本特征向量对应的目标提问融合特征;将目标提问融合特征向量与目标应答文本特征进行拼接,以生成第一拼接特征;将第一拼接特征输入预先训练好的双向长短期记忆力神经网络,以分别输出正向第二拼接特征和反向第二拼接特征;将正向第二拼接特征和反向第二拼接特征进行拼接,以生成该预设主题对应的问答拼接特征向量。
在一优选实施例中,文本提取模块510还用于针对每个问答文本对中的提问文本和应答文本,通过以下至少一种方式进行归一化处理:对提问文本和应答文本中的缩写词进行还原;对提问文本和应答文本中的词性进行还原;去除提问文本和应答文本中的停用词;去除提问文本和应答文本中的标点符号。
请参阅图6,图6为本申请实施例所提供的一种电子设备的结构示意图。如图6中所示,所述电子设备600包括处理器610、存储器620和总线630。
所述存储器620存储有所述处理器610可执行的机器可读指令,当电子设备600运行时,所述处理器610与所述存储器620之间通过总线630通信,所述机器可读指令被所述处理器610执行时,可以执行如上述图1所示方法实施例中的问答文本的情绪识别方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的问答文本的情绪识别方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种问答文本的情绪识别方法,其特征在于,所述方法包括:
对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;
针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;
针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;
针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;
将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,所述情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
2.根据权利要求1所述的方法,其特征在于,通过以下方式确定出情绪识别结果:
将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;
通过自注意力机制对所述主题拼接特征进行信息融合,以生成主题融合特征;
将所述主题融合特征输入前馈神经网络,以输出情绪特征向量,所述情绪特征向量用于指示所述目标问答文本所表达的情绪;
基于所述情绪特征向量,计算出所述目标问答文本所表达的情绪为目标情绪的概率值、所述目标问答文本所表达的情绪为非目标情绪的概率值。
3.根据权利要求1所述的方法,其特征在于,通过以下方式对目标问答文本进行处理:
确定出目标问答文本中的所有问答文本对;
针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。
4.根据权利要求1所述的方法,其特征在于,针对每个预设主题,通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列:
将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。
5.根据权利要求1所述的方法,其特征在于,针对每个预设主题,通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:
将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;
将所述第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;
将所述第二信息交互结果和应答文本向量序列输入归一层,以输出目标应答文本特征向量。
6.根据权利要求1所述的方法,其特征在于,针对每个预设主题,通过以下方式生成对应的问答拼接特征向量:
生成目标提问文本特征向量对应的目标提问融合特征;
将目标提问融合特征向量与目标应答文本特征进行拼接,以生成第一拼接特征;
将所述第一拼接特征输入预先训练好的双向长短期记忆力神经网络,以分别输出正向第二拼接特征和反向第二拼接特征;
将所述正向第二拼接特征和反向第二拼接特征进行拼接,以生成该预设主题对应的问答拼接特征向量。
7.根据权利要求1所述的方法,其特征在于,所述针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量的步骤之前,还包括:
针对每个问答文本对中的提问文本和应答文本,通过以下至少一种方式进行归一化处理:
对所述提问文本和所述应答文本中的缩写词进行还原;
对所述提问文本和所述应答文本中的词性进行还原;
去除所述提问文本和所述应答文本中的停用词;
去除所述提问文本和所述应答文本中的标点符号。
8.一种问答文本的情绪识别装置,其特征在于,所述装置包括:
文本提取模块,用于对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;
向量转换模块,用于针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;
信息交互模块,用于针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;
融合拼接模块,用于针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;
情绪评价模块,用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,所述情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一所述问答文本的情绪识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述问答文本的情绪识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310169316.2A CN116303947B (zh) | 2023-02-24 | 2023-02-24 | 一种问答文本的情绪识别方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310169316.2A CN116303947B (zh) | 2023-02-24 | 2023-02-24 | 一种问答文本的情绪识别方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116303947A true CN116303947A (zh) | 2023-06-23 |
CN116303947B CN116303947B (zh) | 2024-01-19 |
Family
ID=86829844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310169316.2A Active CN116303947B (zh) | 2023-02-24 | 2023-02-24 | 一种问答文本的情绪识别方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116303947B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117649141A (zh) * | 2023-11-28 | 2024-03-05 | 广州方舟信息科技有限公司 | 一种客服服务质量评估方法、装置、设备及存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106547739A (zh) * | 2016-11-03 | 2017-03-29 | 同济大学 | 一种文本语义相似度分析方法 |
CN107704506A (zh) * | 2017-08-30 | 2018-02-16 | 华为技术有限公司 | 智能应答的方法和装置 |
CN109710934A (zh) * | 2018-12-26 | 2019-05-03 | 南京云问网络技术有限公司 | 基于情感的客服质量监督算法 |
CN110263141A (zh) * | 2019-06-25 | 2019-09-20 | 杭州微洱网络科技有限公司 | 一种基于bert的客服问答系统 |
CN111415740A (zh) * | 2020-02-12 | 2020-07-14 | 东北大学 | 问诊信息的处理方法、装置、存储介质及计算机设备 |
US20210050033A1 (en) * | 2019-08-16 | 2021-02-18 | Adobe Inc. | Utilizing bi-directional recurrent encoders with multi-hop attention for speech emotion recognition |
CN112926341A (zh) * | 2021-03-25 | 2021-06-08 | 腾讯科技(深圳)有限公司 | 文本数据处理方法、装置 |
WO2022064741A1 (ja) * | 2020-09-28 | 2022-03-31 | 株式会社日立製作所 | 関連表現抽出装置及び関連表現抽出方法 |
WO2022104967A1 (zh) * | 2020-11-19 | 2022-05-27 | 深圳大学 | 一种基于预训练语言模型的摘要生成方法 |
CN114661881A (zh) * | 2022-03-30 | 2022-06-24 | 中国科学院空天信息创新研究院 | 一种基于问答模式的事件抽取方法、装置和设备 |
CN114897078A (zh) * | 2022-05-19 | 2022-08-12 | 辽宁大学 | 基于深度学习和主题模型的短文本相似度计算方法 |
CN114970517A (zh) * | 2021-12-20 | 2022-08-30 | 昆明理工大学 | 一种基于多模态交互的上下文感知的面向视觉问答的方法 |
CN115329779A (zh) * | 2022-08-10 | 2022-11-11 | 天津大学 | 一种多人对话情感识别方法 |
CN115599894A (zh) * | 2022-09-22 | 2023-01-13 | 号百信息服务有限公司(Cn) | 情绪识别的方法、装置、电子设备及存储介质 |
-
2023
- 2023-02-24 CN CN202310169316.2A patent/CN116303947B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106547739A (zh) * | 2016-11-03 | 2017-03-29 | 同济大学 | 一种文本语义相似度分析方法 |
CN107704506A (zh) * | 2017-08-30 | 2018-02-16 | 华为技术有限公司 | 智能应答的方法和装置 |
CN109710934A (zh) * | 2018-12-26 | 2019-05-03 | 南京云问网络技术有限公司 | 基于情感的客服质量监督算法 |
CN110263141A (zh) * | 2019-06-25 | 2019-09-20 | 杭州微洱网络科技有限公司 | 一种基于bert的客服问答系统 |
US20210050033A1 (en) * | 2019-08-16 | 2021-02-18 | Adobe Inc. | Utilizing bi-directional recurrent encoders with multi-hop attention for speech emotion recognition |
CN111415740A (zh) * | 2020-02-12 | 2020-07-14 | 东北大学 | 问诊信息的处理方法、装置、存储介质及计算机设备 |
WO2022064741A1 (ja) * | 2020-09-28 | 2022-03-31 | 株式会社日立製作所 | 関連表現抽出装置及び関連表現抽出方法 |
WO2022104967A1 (zh) * | 2020-11-19 | 2022-05-27 | 深圳大学 | 一种基于预训练语言模型的摘要生成方法 |
CN112926341A (zh) * | 2021-03-25 | 2021-06-08 | 腾讯科技(深圳)有限公司 | 文本数据处理方法、装置 |
CN114970517A (zh) * | 2021-12-20 | 2022-08-30 | 昆明理工大学 | 一种基于多模态交互的上下文感知的面向视觉问答的方法 |
CN114661881A (zh) * | 2022-03-30 | 2022-06-24 | 中国科学院空天信息创新研究院 | 一种基于问答模式的事件抽取方法、装置和设备 |
CN114897078A (zh) * | 2022-05-19 | 2022-08-12 | 辽宁大学 | 基于深度学习和主题模型的短文本相似度计算方法 |
CN115329779A (zh) * | 2022-08-10 | 2022-11-11 | 天津大学 | 一种多人对话情感识别方法 |
CN115599894A (zh) * | 2022-09-22 | 2023-01-13 | 号百信息服务有限公司(Cn) | 情绪识别的方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
沈忱林;张璐;吴良庆;李寿山: "基于双向注意力机制的问答情感分类方法", 计算机科学, vol. 46, no. 7, pages 4 * |
陈虎;高波涌;陈莲娜;余翠;: "结合注意力机制与双向切片GRU的情感分类模型", 小型微型计算机系统, no. 09 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117649141A (zh) * | 2023-11-28 | 2024-03-05 | 广州方舟信息科技有限公司 | 一种客服服务质量评估方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116303947B (zh) | 2024-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110781680B (zh) | 基于孪生网络和多头注意力机制的语义相似度匹配方法 | |
US11281976B2 (en) | Generative adversarial network based modeling of text for natural language processing | |
McClelland | Integrating probabilistic models of perception and interactive neural networks: a historical and tutorial review | |
Jacobs et al. | MROM-p: An interactive activation, multiple readout model of orthographic and phonological processes in visual word recognition | |
CN110148318B (zh) | 一种数字助教系统、信息交互方法和信息处理方法 | |
CN111708873A (zh) | 智能问答方法、装置、计算机设备和存储介质 | |
JP2021521508A (ja) | 勾配を使用したニューラル・ネットワーク内のバックドアの検出 | |
CN111680484B (zh) | 一种视觉常识推理问答题的答题模型生成方法和系统 | |
CN111814454A (zh) | 一种社交网络上的多模态网络欺凌检测模型 | |
Li et al. | Computational modeling | |
CN116303947B (zh) | 一种问答文本的情绪识别方法、装置及电子设备 | |
Gilbert et al. | Epistemic therapy for bias in automated decision-making | |
Vong et al. | Cross‐Situational Word Learning With Multimodal Neural Networks | |
CN113779190A (zh) | 事件因果关系识别方法、装置、电子设备与存储介质 | |
CN116030271A (zh) | 一种基于深度学习和双模态数据的抑郁情绪预测系统 | |
Jin | Relevance Between Artificial Intelligence and Cognitive Science | |
US20240153630A1 (en) | Apparatus and methods for supporting medical decisions | |
Chen et al. | SSL Framework for Causal Inconsistency between Structures and Representations | |
Juyal et al. | Emotion Detection from Text: Classification and Prediction of Moods in Real-Time Streaming Text | |
Kusumaningrum et al. | Long Short-Term Memory for Non-Factoid Answer Selection in Indonesian Question Answering System for Health Information | |
US20230112740A1 (en) | Textual content evaluation using machine learned models | |
Strømsvåg | Exploring the Why in AI: Investigating how Visual Question Answering models can be interpreted by post-hoc linguistic and visual explanations | |
Allouche | Assisting children with special needs in their daily interaction with other people | |
Warstadt | Artificial Neural Networks as Models of Human Language Acquisition | |
CN117438047A (zh) | 心理咨询模型训练和心理咨询处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |