CN116303947A - 一种问答文本的情绪识别方法、装置及电子设备 - Google Patents

一种问答文本的情绪识别方法、装置及电子设备 Download PDF

Info

Publication number
CN116303947A
CN116303947A CN202310169316.2A CN202310169316A CN116303947A CN 116303947 A CN116303947 A CN 116303947A CN 202310169316 A CN202310169316 A CN 202310169316A CN 116303947 A CN116303947 A CN 116303947A
Authority
CN
China
Prior art keywords
text
question
answer
target
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310169316.2A
Other languages
English (en)
Other versions
CN116303947B (zh
Inventor
尚媛园
陈德馨
邵珠宏
刘靖祎
王雪
丁辉
刘铁
赵晓旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Normal University
Original Assignee
Capital Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Normal University filed Critical Capital Normal University
Priority to CN202310169316.2A priority Critical patent/CN116303947B/zh
Publication of CN116303947A publication Critical patent/CN116303947A/zh
Application granted granted Critical
Publication of CN116303947B publication Critical patent/CN116303947B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种问答文本的情绪识别方法、装置及电子设备,提取出与所有预设主题对应的多个问答文本对;针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,通过关注问答文本的结构特点,可以进一步提升情绪识别的准确性。

Description

一种问答文本的情绪识别方法、装置及电子设备
技术领域
本申请涉及文本识别技术领域,具体而言,涉及一种问答文本的情绪识别方法、装置及电子设备。
背景技术
近年来,基于深度学习的模型成为了文本分类模型的主流,其中主要的模型包括RNN,CNN等。在这些基础深度模型的基础之上,一些工作着眼于将不同角度的信息融入到文本分类任务当中,并取得了成功。
语言和对话是医生诊断和治疗精神疾病的主要数据来源,将人工智能技术应用于患者的分析,可以帮助精神疾病的预警。而现有的抑郁症识别方法,通常直接拼接问答文本进行识别,效果不佳,因此需要进一步提升识别的准确性。
发明内容
有鉴于此,本申请的目的在于提供一种问答文本的情绪识别方法、装置及电子设备,通过关注问答文本的结构特点,可以进一步提升情绪识别的准确性。
第一方面,本申请提供了一种问答文本的情绪识别方法,方法包括:对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
优选的,通过以下方式确定出情绪识别结果:将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;通过自注意力机制对主题拼接特征进行信息融合,以生成主题融合特征;将主题融合特征输入前馈神经网络,以输出情绪特征向量,情绪特征向量用于指示目标问答文本所表达的情绪;基于情绪特征向量,计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。
优选的,通过以下方式对目标问答文本进行处理:确定出目标问答文本中的所有问答文本对;针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。
优选的,针对每个预设主题,通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列:将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。
优选的,针对每个预设主题,通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;将第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;将第二信息交互结果和应答文本向量序列输入归一层,以输出目标应答文本特征向量。
优选的,针对每个预设主题,通过以下方式生成对应的问答拼接特征向量:生成目标提问文本特征向量对应的目标提问融合特征;将目标提问融合特征向量与目标应答文本特征进行拼接,以生成第一拼接特征;将第一拼接特征输入预先训练好的双向长短期记忆力神经网络,以分别输出正向第二拼接特征和反向第二拼接特征;将正向第二拼接特征和反向第二拼接特征进行拼接,以生成该预设主题对应的问答拼接特征向量。
优选的,针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量的步骤之前,还包括:针对每个问答文本对中的提问文本和应答文本,通过以下至少一种方式进行归一化处理:对提问文本和应答文本中的缩写词进行还原;对提问文本和应答文本中的词性进行还原;去除提问文本和应答文本中的停用词;去除提问文本和应答文本中的标点符号。
第二方面,本申请提供了一种问答文本的情绪识别装置,装置包括:
文本提取模块,用于对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;
向量转换模块,用于针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;
信息交互模块,用于针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;
融合拼接模块,用于针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;
情绪评价模块,用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
第三方面,本申请还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的问答文本的情绪识别方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的问答文本的情绪识别方法的步骤。
本申请提供的问答文本的情绪识别方法、装置及电子设备,对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度,通过基于问答文本的结构特点设计模型结构,对文本向量进行处理,计算出情绪识别结果,提升了情绪识别的准确性。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种问答文本的情绪识别方法的流程图;
图2为本申请实施例所提供的一种单轮问答信息交互的步骤的流程图;
图3为本申请实施例所提供的一种单轮问答特征融合的步骤的流程图;
图4为本申请实施例所提供的一种确定情绪识别结果的步骤的流程图;
图5为本申请实施例所提供的一种问答文本的情绪识别装置的结构示意图;
图6为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于基于问答文本的抑郁症识别。
近年来,基于深度学习的模型成为了文本分类模型的主流,其中主要的模型包括RNN,CNN等。在这些基础深度模型的基础之上,一些工作着眼于将不同角度的信息融入到文本分类任务当中,并取得了成功。
语言和对话是医生诊断和治疗精神疾病的主要数据来源,将人工智能技术应用于患者的分析,可以帮助精神疾病的预警。而现有的抑郁症识别方法,通常直接拼接问答文本进行识别,效果不佳,因此需要进一步提升识别的准确性。
基于此,本申请实施例提供了一种问答文本的情绪识别方法、装置及电子设备。
请参阅图1,图1为本申请实施例所提供的一种问答文本的情绪识别方法的流程图。所如图1中所示,本申请实施例提供的问答文本的情绪识别方法,方法包括:
S101、对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本。
该步骤中,可以通过问诊或抑郁症评定量表的诊断过程,获得诊断文字或音频记录,进而转换为多轮问答文本。一轮问答文本即一个问答文本对(Qi,Ai),包括提问文本Qi和应答文本Ai,其中i∈[0,l],l为问答文本对的数量。
在一次抑郁症的评估过程中会产生很多个问答对,这些问答对并不都对抑郁症的识别起到积极作用。与抑郁症识别关联性小的或者无关的问答对可能成为干扰信息,影响抑郁症识别的精度和效率。因此,在得到问答文本后,首先要进行问答对筛选。受医生筛选抑郁症时使用的量表和文献相关研究的启发,这里的预设主题包括:argue、proud、sleep、study、emotion、depress、PTSD(post-traumatic stress disorder,创伤后应激障碍)。
例如,对应的问题分别可以为“上次争吵是因为什么/什么时候”、“有没有什么值得骄傲的事情”、“睡醒情况怎么样”、“学习能力怎么样”、“情绪控制能力怎么样”、“是否被确诊过抑郁症”以及“是否被确诊过创伤后应激障碍”等等。
具体的,可以通过以下方式对目标问答文本进行处理:
确定出目标问答文本中的所有问答文本对。针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。
这里筛选与预设主题对应的问答文本对,可以采用MPNet(Masked and PermutedPre-training for Language Understanding)模型,计算语句相似度的方式进行筛选,也可以是采用人工构筑正则表达式进行匹配等。
针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量的步骤之前,还包括:
针对每个问答文本对中的提问文本和应答文本,通过以下至少一种方式进行归一化处理:
对提问文本和应答文本中的缩写词进行还原;
对提问文本和应答文本中的词性进行还原;
去除提问文本和应答文本中的停用词;
去除提问文本和应答文本中的标点符号。
筛选后的问答文本对,还需要进行文本预处理,使文本归一化,方便输入深度学习模型。这里可以按照上文顺序,采用所有方式依次对每个问答文本对进行处理。每个预处理后的问答文本对记为
Figure BDA0004097530500000071
S102、针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列。
该步骤中,针对每个预设主题,通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列:
将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。
这里采用预先训练好的BERT模型将处理后的问答文本对转换为向量序列:
Figure BDA0004097530500000081
Figure BDA0004097530500000082
转换后的序列可表示为:
Figure BDA0004097530500000083
Figure BDA0004097530500000084
其中,/>
Figure BDA0004097530500000085
为提问文本向量序列,/>
Figure BDA0004097530500000086
为应答文本向量序列,hij为词向量,j表示词的顺序,i∈(argue,proud,sleep,study,emotion,depress,PTSD),/>
Figure BDA0004097530500000087
dh为词向量维度,m为提问文本向量序列的序列长度,n为应答文本向量序列的序列长度。
S103、针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量。
图2为本申请实施例所提供的一种单轮问答信息交互的步骤的流程图。如图2所示,针对每个预设主题,通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:
S1030、将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;
S1032、将第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;
S1034、将第二信息交互结果和应答文本向量序列输入归一层,以输出目标应答文本特征向量。
获得问答文本的特征表示后,使用注意力机制进行问答文本间的信息交互,可以表示为:
Figure BDA0004097530500000091
Figure BDA0004097530500000092
其中,
Figure BDA0004097530500000093
为目标提问文本特征向量,/>
Figure BDA0004097530500000094
为目标应答文本特征向量,MH-Att(Q,K,V)为多头注意力机制,LN表示归一化层。
以提问文本为例,从多头注意力机制的角度来看,这样的表示可以看作是以问题为“query”,与答案中的“key”对齐,从而获得相关意见信息的结果,即“value”部分。
S104、针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量。
图3为本申请实施例所提供的一种单轮问答特征融合的步骤的流程图。如图3所示,该步骤中,针对每个预设主题,通过以下方式生成对应的问答拼接特征向量:
S1040、生成目标提问文本特征向量对应的目标提问融合特征;将目标提问融合特征向量与目标应答文本特征进行拼接,以生成第一拼接特征;
S1042、将第一拼接特征输入预先训练好的双向长短期记忆力神经网络,以分别输出正向第二拼接特征和反向第二拼接特征;
S1044、将正向第二拼接特征和反向第二拼接特征进行拼接,以生成该预设主题对应的问答拼接特征向量。
对通过步骤S103获得的信息交互后的目标提问文本特征向量
Figure BDA0004097530500000101
使用单词级门控融合机制,使其与提问文本向量序列/>
Figure BDA0004097530500000102
中融合细粒度信息:
Figure BDA0004097530500000103
Figure BDA0004097530500000104
其中,Wr和Wa为可学习参数,bg为预设参数,⊙表示将两个矩阵对应位置元素进行乘积。融合后的目标提问融合特征为:
Figure BDA0004097530500000105
拼接目标提问融合特征
Figure BDA0004097530500000106
和目标应答文本特征/>
Figure BDA0004097530500000107
进行问答特征融合:
Figure BDA0004097530500000108
其中,Si为第一拼接特征。
接着使用双向长短期记忆力神经网络,对问答文本的上下文信息进行建模,将其前后向输出拼接,作为该问答对情感特征的最终表示:
Figure BDA0004097530500000109
Figure BDA00040975305000001010
Figure BDA00040975305000001011
其中,Vi为问答拼接特征向量。
S105、将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
图4为本申请实施例所提供的一种确定情绪识别结果的步骤的流程图。如图4所示,该步骤中,通过以下方式确定出情绪识别结果:
S1050、将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;
通过步骤S104获得各预设主题对应的问答拼接特征向量后,将其拼接作为目标问答文本的主题拼接特征表示为:
P=[Vargue,Vproud,Vsleep,Vstudy,Vemotion,Vdepress,VPTSD]。
S1052、通过自注意力机制对主题拼接特征进行信息融合,以生成主题融合特征;
相较于循环神经网络,自注意力机制能够更好的捕获长距离上下文依赖关系,因此本发明使用自注意力机制对问答对级上下文信息进行建模:
Figure BDA0004097530500000111
Figure BDA0004097530500000112
为主题融合特征,这里使用了MH_ProbSpares_Self_Attention机制,相比传统自注意力机制,该自注意力机制通过概率计算聚焦重要信息,能够提升情绪识别的计算效率。
S1054、将主题融合特征输入前馈神经网络,以输出情绪特征向量,情绪特征向量用于指示目标问答文本所表达的情绪;
S1056、基于情绪特征向量,计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。
在步骤S1054和S1056中,通过前馈神经网络获得问答文本的最终情感表示为:
FFN(x)=Linear(Relu(Linear(x)));
Figure BDA0004097530500000113
其中,
Figure BDA0004097530500000121
为情绪特征向量,Linear表示线性层,Relu为激活函数,
MaxPooling是最大值池化层。
最后,通过Softmax层计算输出是否抑郁的分类概率:
Figure BDA0004097530500000122
其中,ph是识别为健康的概率,d为识别为抑郁(非健康)的概率,Ws和bs是Soft-max层的权重和偏置。采用交叉熵函数作为目标函数,定义如下:
Figure BDA0004097530500000123
其中,K表示训练样本的数目,C表示目标类别的数目,yk表示第k个样本的正确标签,
Figure BDA0004097530500000124
表示第k个样本的预测标签,λ是正则化系数,θ代表所有参数。采用Adam优化算法对参数进行更新。
本申请实施例提供的问答文本的情绪识别方法,考虑了问答文本的结构特点,对单轮问答文本对进行信息交互,同时对多轮问答文本对也进行了信息交互,最后输出了情绪识别结果,能够更准确的识别出问答文本所表达的抑郁程度。能够迁移到心理问诊环节,帮助评价病人是否患有抑郁症。
基于同一发明构思,本申请实施例中还提供了与问答文本的情绪识别方法对应的问答文本的情绪识别装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述问答文本的情绪识别方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图5,图5为本申请实施例所提供的一种问答文本的情绪识别装置的结构示意图。如图5中所示,所述情绪识别装置500包括:
文本提取模块510,用于对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;
向量转换模块520,用于针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;
信息交互模块530,用于针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;
融合拼接模块540,用于针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;
情绪评价模块550,用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
在一优选实施例中,情绪评价模块550通过以下方式确定出情绪识别结果:将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;通过自注意力机制对主题拼接特征进行信息融合,以生成主题融合特征;将主题融合特征输入前馈神经网络,以输出情绪特征向量,情绪特征向量用于指示目标问答文本所表达的情绪;基于情绪特征向量,计算出目标问答文本所表达的情绪为目标情绪的概率值、目标问答文本所表达的情绪为非目标情绪的概率值。
在一优选实施例中,文本提取模块510通过以下方式对目标问答文本进行处理:确定出目标问答文本中的所有问答文本对;针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。
在一优选实施例中,针对每个预设主题,向量转换模块520通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列:将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。
在一优选实施例中,针对每个预设主题,信息交互模块530通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;将第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;将第二信息交互结果和应答文本向量序列输入归一层,以输出目标应答文本特征向量。
在一优选实施例中,针对每个预设主题,融合拼接模块540通过以下方式生成对应的问答拼接特征向量:生成目标提问文本特征向量对应的目标提问融合特征;将目标提问融合特征向量与目标应答文本特征进行拼接,以生成第一拼接特征;将第一拼接特征输入预先训练好的双向长短期记忆力神经网络,以分别输出正向第二拼接特征和反向第二拼接特征;将正向第二拼接特征和反向第二拼接特征进行拼接,以生成该预设主题对应的问答拼接特征向量。
在一优选实施例中,文本提取模块510还用于针对每个问答文本对中的提问文本和应答文本,通过以下至少一种方式进行归一化处理:对提问文本和应答文本中的缩写词进行还原;对提问文本和应答文本中的词性进行还原;去除提问文本和应答文本中的停用词;去除提问文本和应答文本中的标点符号。
请参阅图6,图6为本申请实施例所提供的一种电子设备的结构示意图。如图6中所示,所述电子设备600包括处理器610、存储器620和总线630。
所述存储器620存储有所述处理器610可执行的机器可读指令,当电子设备600运行时,所述处理器610与所述存储器620之间通过总线630通信,所述机器可读指令被所述处理器610执行时,可以执行如上述图1所示方法实施例中的问答文本的情绪识别方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的问答文本的情绪识别方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种问答文本的情绪识别方法,其特征在于,所述方法包括:
对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;
针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;
针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;
针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;
将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,所述情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
2.根据权利要求1所述的方法,其特征在于,通过以下方式确定出情绪识别结果:
将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以获取主题拼接特征;
通过自注意力机制对所述主题拼接特征进行信息融合,以生成主题融合特征;
将所述主题融合特征输入前馈神经网络,以输出情绪特征向量,所述情绪特征向量用于指示所述目标问答文本所表达的情绪;
基于所述情绪特征向量,计算出所述目标问答文本所表达的情绪为目标情绪的概率值、所述目标问答文本所表达的情绪为非目标情绪的概率值。
3.根据权利要求1所述的方法,其特征在于,通过以下方式对目标问答文本进行处理:
确定出目标问答文本中的所有问答文本对;
针对每个问答文本对,基于文本情绪的相似度,确定该问答文本对所表达的主题是否为预设主题中的一个,若是,则将该问答文本对作为该预设主题对应的一个问答文本对。
4.根据权利要求1所述的方法,其特征在于,针对每个预设主题,通过以下方式形成于该预设主题对应的提问文本向量序列和应答文本向量序列:
将该预设主题所对应的所有问答文本对输入预先训练好的BERT模型进行向量转换,以输出提问文本向量序列和应答文本向量序列。
5.根据权利要求1所述的方法,其特征在于,针对每个预设主题,通过以下方式生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量:
将提问文本向量序列和应答文本向量序列输入预先训练好的多头注意力机制模型,以输出第一信息交互结果和第二信息交互结果;
将所述第一信息交互结果和提问文本向量序列输入归一层,以输出目标提问文本特征向量;
将所述第二信息交互结果和应答文本向量序列输入归一层,以输出目标应答文本特征向量。
6.根据权利要求1所述的方法,其特征在于,针对每个预设主题,通过以下方式生成对应的问答拼接特征向量:
生成目标提问文本特征向量对应的目标提问融合特征;
将目标提问融合特征向量与目标应答文本特征进行拼接,以生成第一拼接特征;
将所述第一拼接特征输入预先训练好的双向长短期记忆力神经网络,以分别输出正向第二拼接特征和反向第二拼接特征;
将所述正向第二拼接特征和反向第二拼接特征进行拼接,以生成该预设主题对应的问答拼接特征向量。
7.根据权利要求1所述的方法,其特征在于,所述针对每个预设主题,该预设主题对应的所有问答文本对转换为特征向量的步骤之前,还包括:
针对每个问答文本对中的提问文本和应答文本,通过以下至少一种方式进行归一化处理:
对所述提问文本和所述应答文本中的缩写词进行还原;
对所述提问文本和所述应答文本中的词性进行还原;
去除所述提问文本和所述应答文本中的停用词;
去除所述提问文本和所述应答文本中的标点符号。
8.一种问答文本的情绪识别装置,其特征在于,所述装置包括:
文本提取模块,用于对目标问答文本进行处理,以提取出与所有预设主题对应的多个问答文本对,每个问答文本对包括提问文本和对应的应答文本;
向量转换模块,用于针对每个预设主题,将该预设主题对应的所有问答文本对转换为特征向量,并形成与该预设主题对应的提问文本向量序列和应答文本向量序列;
信息交互模块,用于针对每个预设主题,通过注意力机制对提问文本向量序列和应答文本向量序列进行信息交互,以生成与该预设主题对应的目标提问文本特征向量和目标应答文本特征向量;
融合拼接模块,用于针对每个预设主题,通过门控融合机制对该预设主题对应的目标提问文本特征向量和目标应答文本特征向量进行信息融合并拼接,以生成问答拼接特征向量;
情绪评价模块,用于将所有预设主题对应的问答拼接特征向量按顺序进行拼接,以确定出情绪识别结果,所述情绪识别结果用于指示目标问答文本所表达的情绪的健康程度。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一所述问答文本的情绪识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述问答文本的情绪识别方法的步骤。
CN202310169316.2A 2023-02-24 2023-02-24 一种问答文本的情绪识别方法、装置及电子设备 Active CN116303947B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310169316.2A CN116303947B (zh) 2023-02-24 2023-02-24 一种问答文本的情绪识别方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310169316.2A CN116303947B (zh) 2023-02-24 2023-02-24 一种问答文本的情绪识别方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN116303947A true CN116303947A (zh) 2023-06-23
CN116303947B CN116303947B (zh) 2024-01-19

Family

ID=86829844

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310169316.2A Active CN116303947B (zh) 2023-02-24 2023-02-24 一种问答文本的情绪识别方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116303947B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117649141A (zh) * 2023-11-28 2024-03-05 广州方舟信息科技有限公司 一种客服服务质量评估方法、装置、设备及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106547739A (zh) * 2016-11-03 2017-03-29 同济大学 一种文本语义相似度分析方法
CN107704506A (zh) * 2017-08-30 2018-02-16 华为技术有限公司 智能应答的方法和装置
CN109710934A (zh) * 2018-12-26 2019-05-03 南京云问网络技术有限公司 基于情感的客服质量监督算法
CN110263141A (zh) * 2019-06-25 2019-09-20 杭州微洱网络科技有限公司 一种基于bert的客服问答系统
CN111415740A (zh) * 2020-02-12 2020-07-14 东北大学 问诊信息的处理方法、装置、存储介质及计算机设备
US20210050033A1 (en) * 2019-08-16 2021-02-18 Adobe Inc. Utilizing bi-directional recurrent encoders with multi-hop attention for speech emotion recognition
CN112926341A (zh) * 2021-03-25 2021-06-08 腾讯科技(深圳)有限公司 文本数据处理方法、装置
WO2022064741A1 (ja) * 2020-09-28 2022-03-31 株式会社日立製作所 関連表現抽出装置及び関連表現抽出方法
WO2022104967A1 (zh) * 2020-11-19 2022-05-27 深圳大学 一种基于预训练语言模型的摘要生成方法
CN114661881A (zh) * 2022-03-30 2022-06-24 中国科学院空天信息创新研究院 一种基于问答模式的事件抽取方法、装置和设备
CN114897078A (zh) * 2022-05-19 2022-08-12 辽宁大学 基于深度学习和主题模型的短文本相似度计算方法
CN114970517A (zh) * 2021-12-20 2022-08-30 昆明理工大学 一种基于多模态交互的上下文感知的面向视觉问答的方法
CN115329779A (zh) * 2022-08-10 2022-11-11 天津大学 一种多人对话情感识别方法
CN115599894A (zh) * 2022-09-22 2023-01-13 号百信息服务有限公司(Cn) 情绪识别的方法、装置、电子设备及存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106547739A (zh) * 2016-11-03 2017-03-29 同济大学 一种文本语义相似度分析方法
CN107704506A (zh) * 2017-08-30 2018-02-16 华为技术有限公司 智能应答的方法和装置
CN109710934A (zh) * 2018-12-26 2019-05-03 南京云问网络技术有限公司 基于情感的客服质量监督算法
CN110263141A (zh) * 2019-06-25 2019-09-20 杭州微洱网络科技有限公司 一种基于bert的客服问答系统
US20210050033A1 (en) * 2019-08-16 2021-02-18 Adobe Inc. Utilizing bi-directional recurrent encoders with multi-hop attention for speech emotion recognition
CN111415740A (zh) * 2020-02-12 2020-07-14 东北大学 问诊信息的处理方法、装置、存储介质及计算机设备
WO2022064741A1 (ja) * 2020-09-28 2022-03-31 株式会社日立製作所 関連表現抽出装置及び関連表現抽出方法
WO2022104967A1 (zh) * 2020-11-19 2022-05-27 深圳大学 一种基于预训练语言模型的摘要生成方法
CN112926341A (zh) * 2021-03-25 2021-06-08 腾讯科技(深圳)有限公司 文本数据处理方法、装置
CN114970517A (zh) * 2021-12-20 2022-08-30 昆明理工大学 一种基于多模态交互的上下文感知的面向视觉问答的方法
CN114661881A (zh) * 2022-03-30 2022-06-24 中国科学院空天信息创新研究院 一种基于问答模式的事件抽取方法、装置和设备
CN114897078A (zh) * 2022-05-19 2022-08-12 辽宁大学 基于深度学习和主题模型的短文本相似度计算方法
CN115329779A (zh) * 2022-08-10 2022-11-11 天津大学 一种多人对话情感识别方法
CN115599894A (zh) * 2022-09-22 2023-01-13 号百信息服务有限公司(Cn) 情绪识别的方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
沈忱林;张璐;吴良庆;李寿山: "基于双向注意力机制的问答情感分类方法", 计算机科学, vol. 46, no. 7, pages 4 *
陈虎;高波涌;陈莲娜;余翠;: "结合注意力机制与双向切片GRU的情感分类模型", 小型微型计算机系统, no. 09 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117649141A (zh) * 2023-11-28 2024-03-05 广州方舟信息科技有限公司 一种客服服务质量评估方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN116303947B (zh) 2024-01-19

Similar Documents

Publication Publication Date Title
CN110781680B (zh) 基于孪生网络和多头注意力机制的语义相似度匹配方法
US11281976B2 (en) Generative adversarial network based modeling of text for natural language processing
McClelland Integrating probabilistic models of perception and interactive neural networks: a historical and tutorial review
Jacobs et al. MROM-p: An interactive activation, multiple readout model of orthographic and phonological processes in visual word recognition
CN110148318B (zh) 一种数字助教系统、信息交互方法和信息处理方法
CN111708873A (zh) 智能问答方法、装置、计算机设备和存储介质
JP2021521508A (ja) 勾配を使用したニューラル・ネットワーク内のバックドアの検出
CN111680484B (zh) 一种视觉常识推理问答题的答题模型生成方法和系统
CN111814454A (zh) 一种社交网络上的多模态网络欺凌检测模型
Li et al. Computational modeling
CN116303947B (zh) 一种问答文本的情绪识别方法、装置及电子设备
Gilbert et al. Epistemic therapy for bias in automated decision-making
Vong et al. Cross‐Situational Word Learning With Multimodal Neural Networks
CN113779190A (zh) 事件因果关系识别方法、装置、电子设备与存储介质
CN116030271A (zh) 一种基于深度学习和双模态数据的抑郁情绪预测系统
Jin Relevance Between Artificial Intelligence and Cognitive Science
US20240153630A1 (en) Apparatus and methods for supporting medical decisions
Chen et al. SSL Framework for Causal Inconsistency between Structures and Representations
Juyal et al. Emotion Detection from Text: Classification and Prediction of Moods in Real-Time Streaming Text
Kusumaningrum et al. Long Short-Term Memory for Non-Factoid Answer Selection in Indonesian Question Answering System for Health Information
US20230112740A1 (en) Textual content evaluation using machine learned models
Strømsvåg Exploring the Why in AI: Investigating how Visual Question Answering models can be interpreted by post-hoc linguistic and visual explanations
Allouche Assisting children with special needs in their daily interaction with other people
Warstadt Artificial Neural Networks as Models of Human Language Acquisition
CN117438047A (zh) 心理咨询模型训练和心理咨询处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant