CN113705558A - 基于上下文迭代的情绪识别方法、装置、设备及存储介质 - Google Patents
基于上下文迭代的情绪识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113705558A CN113705558A CN202111014415.0A CN202111014415A CN113705558A CN 113705558 A CN113705558 A CN 113705558A CN 202111014415 A CN202111014415 A CN 202111014415A CN 113705558 A CN113705558 A CN 113705558A
- Authority
- CN
- China
- Prior art keywords
- emotion
- text
- feature
- weight
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008909 emotion recognition Effects 0.000 title claims abstract description 115
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000008451 emotion Effects 0.000 claims abstract description 285
- 238000004458 analytical method Methods 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 43
- 230000006870 function Effects 0.000 claims description 28
- 230000004927 fusion Effects 0.000 claims description 25
- 238000007499 fusion processing Methods 0.000 claims description 21
- 238000010586 diagram Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 15
- 230000002457 bidirectional effect Effects 0.000 claims description 14
- 230000015654 memory Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000013473 artificial intelligence Methods 0.000 abstract 2
- 230000003321 amplification Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及AI技术领域,并公开了一种基于上下文迭代的情绪识别方法、装置、设备及存储介质,通过生成目标文本的特征图;将特征图通过分支处理之后输入预设的文本情绪识别模型,基于文本情绪识别模型,预测第一情绪类别、第一情绪权重、第二情绪类别和第二情绪权重;基于文本情绪识别模型对第一情绪类别、第一情绪权重、第二情绪类别和第二情绪权重进行迭代编码分析,得到目标文本中当前语句对应的目标情绪类别。能够避免由于对文本中任意语句情绪识别的错误,而导致的情绪识别误差,保证对文本情绪的识别逼近真实的情绪,提高情绪识别的准确率。
Description
技术领域
本申请涉及AI技术领域,尤其涉及一种基于上下文迭代的情绪识别方法、装置、设备及存储介质。
背景技术
大数据技术在情绪预测方面也得到了广泛的应用,现有常见的情绪识别方法是预测语句中词语代表的情绪,但是由于情绪受上下文语境的影响较大,若单独对各语句中词语进行情绪预测,则会导致预测的准确率较低。近来有人提出了基于上下文的情绪识别方法,但是在实际的情况下,人的语境所代表的情绪往往是动态变化的,因此,如果文本中一旦有语句的情绪识别错误,会大概率导致该语句对应下文的情绪出错,从而导致情绪识别错误的问题出现。
发明内容
本申请提供了一种基于上下文迭代的情绪识别方法、装置、设备及存储介质,能够避免由于对文本中任意语句情绪识别的错误,而导致的情绪识别误差,保证对文本情绪的识别逼近真实的情绪,提高情绪识别的准确率。
第一方面,本申请提供了一种基于上下文迭代的情绪识别方法,所述方法包括:
从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图;
对所述第一特征图进行分支处理,得到第二特征图;
将所述第二特征图输入预设的文本情绪识别模型,基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重;
基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
第二方面,本申请还提供了一种基于上下文迭代的情绪识别装置,包括:
生成模块,用于从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图;
第一得到模块,用于对所述第一特征图进行分支处理,得到第二特征图;
第二得到模块,用于将所述第二特征图输入预设的文本情绪识别模型,基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重;
分析模块,用于基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
第三方面,本申请还提供了一种基于上下文迭代的情绪识别设备,包括:
存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上第一方面所述的基于上下文迭代的情绪识别方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上第一方面所述的基于上下文迭代的情绪识别方法的步骤。
本申请公开了一种基于上下文迭代的情绪识别方法、装置、设备及存储介质,首先通过从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成特征图;然后将所述特征图通过分支处理之后输入预设的文本情绪识别模型,基于所述文本情绪识别模型,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重;进而基于所述文本情绪识别模型对第一情绪类别、第一情绪权重、第二情绪类别和第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。能够避免由于对文本中任意语句情绪识别的错误,而导致的情绪识别误差,保证对文本情绪的识别逼近真实的情绪,提高情绪识别的准确率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的基于上下文迭代的情绪识别方法的实现流程图;
图2是图1中S103的具体实现流程图;
图3是图1中S104的具体实现流程图;
图4是本申请实施例提供的基于上下文迭代的情绪识别装置的结构示意图;
图5是本申请实施例提供的基于上下文迭代的情绪识别设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请的实施例提供了一种基于上下文迭代的情绪识别方法、装置、设备及存储介质。本申请实施例提供的基于上下文迭代的情绪识别方法,首先通过从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成特征图;然后将所述特征图通过分支处理之后输入预设的文本情绪识别模型,基于所述文本情绪识别模型,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重;进而基于所述文本情绪识别模型对第一情绪类别、第一情绪权重、第二情绪类别和第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。能够避免由于对文本中任意语句情绪识别的错误,而导致的情绪识别误差,保证对文本情绪的识别逼近真实的情绪,提高情绪识别的准确率。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请一实施例提供的基于上下文迭代的情绪识别方法的示意流程图。该基于上下文迭代的情绪识别方法可以由服务器或者终端实现,所述服务器可以是单个服务器或者服务器集群。所述终端可以是手持终端、笔记本电脑、可穿戴设备或者机器人等。
如图1所示,图1是本申请一实施例提供的基于上下文迭代的情绪识别方法的实现流程图。具体包括:步骤S101至步骤S104。详述如下:
S101,从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图。
在本申请的实施例中,所述目标文本为在网络销售或者服务过程中,获取的用户在线输入的话术。例如,网络销售过程中,用户在线输入的商品咨询问信息;或者联系在线客服,输入的商品使用反馈文本信息等。通常,用户在线输入的文本信息代表着用户对产品的满意度以及对在线客服的情绪,其往往是动态变化的,如果能够准确地根据用户输入的文本信息识别出用户的情绪,则对提高销售业绩具有很大的帮助。
具体地,在本实施例中,获取目标文本,从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图,可以包括:基于预设可变性卷积网络对所述目标文本进行特征文本提取,将提取的特征文本经过特征金字塔通道进行级联处理后,生成所述第一特征图。
具体地,预设可变卷积网络可以是ResNet,金字塔通道可以是FPN;示例性地,基于预设可变性卷积网络对目标文本进行特征文本提取,将提取的特征文本经过特征金字塔通道进行级联处理后,生成第一特征图,包括:基于预设可变性卷积网络ResNet对所述目标文本进行预设次数的下采样,得到第一预设数量的第一特征文本、第二预设数量的第二特征文本和第三预设数量的第三特征文本;其中,第一特征文本包含的文本内容少于所述第二特征文本包含的文本内容,所述第二特征文本包含的文本内容少于所述第三特征文本包含的文本内容;将所述第一特征文本通过所述特征金字塔通道FPN依次进行上采样处理之后,分别与所述第二特征文本进行特征融合处理,得到不同的融合特征图;对所述融合特征图分别上采样处理,使得所述融合特征图包含的文本内容与所述第三特征文本包含的文本内容大小相同;将上采样处理之后的各个所述融合特征图与所述第三特征文件进行级联,生成所述第一特征图。
例如,基于预设可变性卷积网络ResNet对所述目标文本进行5次下采样处理,得到5个特征文本,分别纪为f1、f2、f3、f4和f5;其中,从f1到f5包含的文本内容依次降低为前者的1/2,包含的语音信息越来越丰富。具体地,假设f5、f4和f3为第一特征文本,通过FPN通道对f5、f4和f3依次经过上采样两倍处理之后,再分别与f4、f3和f2进行特征融合处理,分别得到融合特征图;其中,f4、f3和f2为第二特征文本;示例性地,假设得到的融合特征图分别为h4、h3和h2。最后将融合特征图h4、h3和h2分别上采样到f1的大小,与f1级联,生成所述第一特征图;其中,f1为第三特征文本。具体地,假设生成的第一特征图为p,则p融合了具有不同感受和语义信息的特征图,从而对于包含有内容的文本具有更强的检测能力。
S102,对所述第一特征图进行分支处理,得到第二特征图。
具体地,对所述第一特征图进行分支处理,得到第二特征图,包括:将所述第一特征图按照预设比例分别进行缩小和放大处理,得到缩小之后的特征图和放大之后的特征图;假设,将缩小之后的特征图标记为p1,将放大之后的特征图标记为p2;将缩小之后的特征图P1经过3×3的卷积处理,得到第一卷积特征图p3,将p1与p3相乘之后与p2相加得到第二特征图p5。类似地,将p2经过3×3的卷积处理之后得到第二卷积特征图p4,将p4和p2相乘之后与p1相加得到第二特征图p6。也就是说,在本申请的实施例中,对第一特征图进行分支处理之后,得到具有不同尺寸及特征的两个第二特征图。
可以理解地,将p5和p6输入所述双向文本特征融合模块进行处理,能使p5和p6两个分支的信息互相监督,彼此受益,从而促进双向文本特征融合模块优化。此外,还能融合上下文的尺寸信息,实现特征信息的互补,得到更准确的文本情绪预测结果。
S103,将所述第二特征图输入预设的文本情绪识别模型,基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重。
其中,所述预设的文本情绪识别模型包括双向文本特征融合网络层,所述将基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重,可以包括:基于所述双向文本特征融合网络层对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重。其中,所述双向文本特征融合网络层具体包括上下文编码信息预测层和权重分析层。
在本实施例中,示例性地,如图2所示,图2是图1中S103的具体实现流程图。由图3可知,在本实施例中,S103具体包括S1031至S1032,详述如下:
S1031,基于所述上下文编码信息预测层的前向LSTM对与当前语句相邻的上一语句进行第一情绪类别预测,基于所述上下文编码信息预测层的后向LSTM对与当前语句相邻的下一语句进行第二情绪类别预测。
S1032,基于所述权重分析层对所述第一情绪类别和所述第二情绪类别进行权重分析,分别得到所述第一情绪权重和所述第二情绪权重。
其中,所述上下文信息编码预测层能够有效地检测相邻文本,显著提升网络性能,广泛应用于深度学习的任务中。需要说明的是,尽管在特征提取阶段的FPN已经使用了特征融合,但是这对于预测背景复杂的文本内容的情绪类别还是不够的,因此本实施例的文本情绪识别模型进一步通过双向文本特征融合模块进行上下文情绪和权重预测。具体地,上下文信息编码预测层包括BILEST(Bi-directional Long Short-Term Memory)层,该层由前向LSTM与后向LSTM组合而成,其中,前向LSTM用于对与当前语句相邻的上一语句进行第一情绪类别预测,后向LSTM用于对与当前语句相邻的下一语句进行第二情绪类别预测;权重分析层包括attention机制,用于对BILEST层预测的情绪类别进行情绪权重分析,分别得到所述第一情绪类别的第一情绪权重和所述第二情绪类别的第二情绪权重。
S104,基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
其中,所述文本情绪识别模型还包括上下文迭代编码层,所述基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别,可以包括:基于所述上下文迭代编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。其中,所述上下文迭代编码层包括话语级编码层、总迭代预测损失函数和相邻两轮迭代预测损失函数。
在本实施例中,示例性地,如图3所示,图3是图1中S104的具体实现流程图。由图4可知,S104包括S1041至S1044,详述如下:
S1041,基于所述话语级编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行分析,得到当前语句对应上下文情绪概率分布。
S1042,将所述上下文情绪概率分布再次作为所述话语级编码器的输入,进行情绪预测的迭代更新。
S1043,在所述话语级编码器进行情绪预测的迭代更新过程中,分别检测所述总迭代预测损失函数的值和所述相邻两轮迭代预测损失函数的值。
S1044,若所述总迭代预测损失函数的值和所述相邻两轮迭代预测损失函数的值均小于预设值,则确定迭代更新结束,获取当前输出的情绪类别作为所述目标文本中当前语句对应的目标情绪类别。
其中,所述总迭代预测损失函数可以表示为:
所述相邻两轮迭代预测损失函数可以表示为:
此外,在本申请的实施例中,在预测得到所述目标文本中各语句各自对应的情绪类别之后,还可以将各语句各自对应的情绪类别由情绪类别编码向量进行表示。
另外,需要说明的是,所述文本情绪识别模型的上下文情绪编码层可以为隐藏层embedding,在本实施例中,假设有L个情绪类别,L={l1,l2,…li},每个情绪类别对应的隐藏向量为xi,首先,通过所述隐藏层对各语句的所述情感类别权重向量进行情绪分析,得到各语句的情绪类别概率向量为进一步通过加权得到各语句的情绪类别编码为ei,则可以得到所述目标文本中各语句的情绪类别编码向量为E={e1,e2,…eN},其中,
通过上述分析可知,本实施例提供的基于上行文迭代的情绪识别方法,首先通过从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成特征图;然后将所述特征图通过分支处理之后输入预设的文本情绪识别模型,基于所述文本情绪识别模型,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重;进而基于所述文本情绪识别模型对第一情绪类别、第一情绪权重、第二情绪类别和第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。能够避免由于对文本中任意语句情绪识别的错误,而导致的情绪识别误差,保证对文本情绪的识别逼近真实的情绪,提高情绪识别的准确率。
请参阅图4所示,图4是本申请实施例提供的基于上下文迭代的情绪识别装置的结构示意图。该基于上下文迭代的情绪识别装置400用于执行图1实施例所示的基于上下文迭代的情绪识别方法的步骤。该基于上下文迭代的情绪识别装置400可以是单个服务器或服务器集群,或者该基于上下文迭代的情绪识别装置400可以是终端,该终端可以是手持终端、笔记本电脑、可穿戴设备或者机器人等。
如图4所示,基于上下文迭代的情绪识别装置400包括:
生成模块401,用于从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图;
第一得到模块402,用于对所述第一特征图进行分支处理,得到第二特征图;
第二得到模块403,用于将所述第二特征图输入预设的文本情绪识别模型,基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重;
分析模块404,用于基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
在一实施例中,生成模块401,具体用于:
基于预设可变性卷积网络对所述目标文本进行特征文本提取,将提取的特征文本经过特征金字塔通道进行级联处理后,生成所述第一特征图。
在一实施例中,生成模块401,包括:
第一得到单元,用于基于预设可变性卷积网络对所述目标文本进行预设次数的下采样,得到第一预设数量的第一特征文本、第二预设数量的第二特征文本和第三预设数量的第三特征文本;其中,第一特征文本包含的文本内容少于所述第二特征文本包含的文本内容,所述第二特征文本包含的文本内容少于所述第三特征文本包含的文本内容;
第二得到单元,用于将所述第一特征文本通过所述特征金字塔通道依次进行上采样处理之后,分别与所述第二特征文本进行特征融合处理,得到不同的融合特征图;
处理单元,用于对所述融合特征图分别上采样处理,使得所述融合特征图包含的文本内容与所述第三特征文本包含的文本内容大小相同;
级联单元,用于将上采样处理之后的各个所述融合特征图与所述第三特征文件进行级联,生成所述第一特征图。
在一实施例中,所述预设的文本情绪识别模型包括双向文本特征融合网络层,第二得到模块403,具体用于:
基于所述双向文本特征融合网络层对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重。
在一实施例中,所述双向文本特征融合网络层包括上下文编码信息预测层和权重分析层,第二得到模块403,包括:
预测单元,用于基于所述上下文编码信息预测层的前向LSTM对与当前语句相邻的上一语句进行第一情绪类别预测,基于所述上下文编码信息预测层的后向LSTM对与当前语句相邻的下一语句进行第二情绪类别预测;
第一分析单元,用于基于所述权重分析层对所述第一情绪类别和所述第二情绪类别进行权重分析,分别得到所述第一情绪权重和所述第二情绪权重。
在一实施例中,所述文本情绪识别模型包括上下文迭代编码层,分析模块404,具体用于:
基于所述上下文迭代编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
在一实施例中,所述上下文迭代编码层包括话语级编码层、总迭代预测损失函数和相邻两轮迭代预测损失函数;
分析模块404,包括:
第二分析单元,用于基于所述话语级编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行分析,得到当前语句对应上下文情绪概率分布;
更新单元,用于将所述上下文情绪概率分布再次作为所述话语级编码器的输入,进行情绪预测的迭代更新;
检测单元,用于在所述话语级编码器进行情绪预测的迭代更新过程中,分别检测所述总迭代预测损失函数的值和所述相邻两轮迭代预测损失函数的值;
获取单元,用于在若所述总迭代预测损失函数的值和所述相邻两轮迭代预测损失函数的值均小于预设值,则确定迭代更新结束,获取当前输出的情绪类别作为所述目标文本中当前语句对应的目标情绪类别。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的基于上下文迭代的情绪识别装置和各模块的具体工作过程,可以参考图1实施例所述的基于上下文迭代的情绪识别方法实施例中的对应过程,在此不再赘述。
上述的基于上下文迭代的情绪识别方法可以实现为一种计算机程序的形式,该计算机程序可以在如图4所示的装置上运行。
请参阅图5,图5是本申请实施例提供的基于上下文迭代的情绪识别设备的结构示意性框图。该基于上下文迭代的情绪识别设备500包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种基于上下文迭代的情绪识别方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种基于上下文迭代的情绪识别方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的终端的限定,具体的基于上下文迭代的情绪识别设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图;
对所述第一特征图进行分支处理,得到第二特征图;
将所述第二特征图输入预设的文本情绪识别模型,基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重;
基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
在一实施例中,所述从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图,包括:
基于预设可变性卷积网络对所述目标文本进行特征文本提取,将提取的特征文本经过特征金字塔通道进行级联处理后,生成所述第一特征图。
在一实施例中,所述基于预设可变性卷积网络对所述目标文本进行特征文本提取,将提取的特征文本经过特征金字塔通道进行级联处理后,生成所述第一特征图,包括:
基于预设可变性卷积网络对所述目标文本进行预设次数的下采样,得到第一预设数量的第一特征文本、第二预设数量的第二特征文本和第三预设数量的第三特征文本;其中,第一特征文本包含的文本内容少于所述第二特征文本包含的文本内容,所述第二特征文本包含的文本内容少于所述第三特征文本包含的文本内容;
将所述第一特征文本通过所述特征金字塔通道依次进行上采样处理之后,分别与所述第二特征文本进行特征融合处理,得到不同的融合特征图;
对所述融合特征图分别上采样处理,使得所述融合特征图包含的文本内容与所述第三特征文本包含的文本内容大小相同;
将上采样处理之后的各个所述融合特征图与所述第三特征文件进行级联,生成所述第一特征图。
在一实施例中,所述预设的文本情绪识别模型包括双向文本特征融合网络层,所述将基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重,包括:
基于所述双向文本特征融合网络层对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重。
在一实施例中,所述双向文本特征融合网络层包括上下文编码信息预测层和权重分析层,所述基于所述双向文本特征融合网络层对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重,包括:
基于所述上下文编码信息预测层的前向LSTM对与当前语句相邻的上一语句进行第一情绪类别预测,基于所述上下文编码信息预测层的后向LSTM对与当前语句相邻的下一语句进行第二情绪类别预测;
基于所述权重分析层对所述第一情绪类别和所述第二情绪类别进行权重分析,分别得到所述第一情绪权重和所述第二情绪权重。
在一实施例中,所述文本情绪识别模型包括上下文迭代编码层,所述基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别,包括:
基于所述上下文迭代编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
在一实施例中,所述上下文迭代编码层包括话语级编码层、总迭代预测损失函数和相邻两轮迭代预测损失函数;
所述基于所述上下文迭代编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别,包括:
基于所述话语级编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行分析,得到当前语句对应上下文情绪概率分布;
将所述上下文情绪概率分布再次作为所述话语级编码器的输入,进行情绪预测的迭代更新;
在所述话语级编码器进行情绪预测的迭代更新过程中,分别检测所述总迭代预测损失函数的值和所述相邻两轮迭代预测损失函数的值;
若所述总迭代预测损失函数的值和所述相邻两轮迭代预测损失函数的值均小于预设值,则确定迭代更新结束,获取当前输出的情绪类别作为所述目标文本中当前语句对应的目标情绪类别。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请图1实施例提供的基于上下文迭代的情绪识别方法的步骤。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于上下文迭代的情绪识别方法,其特征在于,所述方法包括:
从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图;
对所述第一特征图进行分支处理,得到第二特征图;
将所述第二特征图输入预设的文本情绪识别模型,基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重;
基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
2.根据权利要求1所述的基于上下文迭代的情绪识别方法,其特征在于,所述从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图,包括:
基于预设可变性卷积网络对所述目标文本进行特征文本提取,将提取的特征文本经过特征金字塔通道进行级联处理后,生成所述第一特征图。
3.根据权利要求2所述的基于上下文迭代的情绪识别方法,其特征在于,所述基于预设可变性卷积网络对所述目标文本进行特征文本提取,将提取的特征文本经过特征金字塔通道进行级联处理后,生成所述第一特征图,包括:
基于预设可变性卷积网络对所述目标文本进行预设次数的下采样,得到第一预设数量的第一特征文本、第二预设数量的第二特征文本和第三预设数量的第三特征文本;其中,第一特征文本包含的文本内容少于所述第二特征文本包含的文本内容,所述第二特征文本包含的文本内容少于所述第三特征文本包含的文本内容;
将所述第一特征文本通过所述特征金字塔通道依次进行上采样处理之后,分别与所述第二特征文本进行特征融合处理,得到不同的融合特征图;
对所述融合特征图分别上采样处理,使得所述融合特征图包含的文本内容与所述第三特征文本包含的文本内容大小相同;
将上采样处理之后的各个所述融合特征图与所述第三特征文件进行级联,生成所述第一特征图。
4.根据权利要求1至3任一项所述的基于上下文迭代的情绪识别方法,其特征在于,所述预设的文本情绪识别模型包括双向文本特征融合网络层,所述将基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重,包括:
基于所述双向文本特征融合网络层对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重。
5.根据权利要求4所述的基于上下文迭代的情绪识别方法,其特征在于,所述双向文本特征融合网络层包括上下文编码信息预测层和权重分析层,所述基于所述双向文本特征融合网络层对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重,包括:
基于所述上下文编码信息预测层的前向LSTM对与当前语句相邻的上一语句进行第一情绪类别预测,基于所述上下文编码信息预测层的后向LSTM对与当前语句相邻的下一语句进行第二情绪类别预测;
基于所述权重分析层对所述第一情绪类别和所述第二情绪类别进行权重分析,分别得到所述第一情绪权重和所述第二情绪权重。
6.根据权利要求1所述的基于上下文迭代的情绪识别方法,其特征在于,所述文本情绪识别模型包括上下文迭代编码层,所述基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别,包括:
基于所述上下文迭代编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
7.根据权利要求6所述的基于上下文迭代的情绪识别方法,其特征在于,所述上下文迭代编码层包括话语级编码层、总迭代预测损失函数和相邻两轮迭代预测损失函数;
所述基于所述上下文迭代编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别,包括:
基于所述话语级编码层对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行分析,得到当前语句对应上下文情绪概率分布;
将所述上下文情绪概率分布再次作为所述话语级编码器的输入,进行情绪预测的迭代更新;
在所述话语级编码器进行情绪预测的迭代更新过程中,分别检测所述总迭代预测损失函数的值和所述相邻两轮迭代预测损失函数的值;
若所述总迭代预测损失函数的值和所述相邻两轮迭代预测损失函数的值均小于预设值,则确定迭代更新结束,获取当前输出的情绪类别作为所述目标文本中当前语句对应的目标情绪类别。
8.一种基于上下文迭代的情绪识别装置,其特征在于,包括:
生成模块,用于从目标文本中提取出特征文本,对所述特征文本进行通道级联处理,生成第一特征图;
第一得到模块,用于对所述第一特征图进行分支处理,得到第二特征图;
第二得到模块,用于将所述第二特征图输入预设的文本情绪识别模型,基于所述文本情绪识别模型对所述第二特征图进行特征融合处理,得到与当前语句相邻的上一语句的第一情绪类别和第一情绪权重,以及与当前语句相邻的下一语句的第二情绪类别和第二情绪权重;
分析模块,用于基于所述文本情绪识别模型对所述第一情绪类别、所述第一情绪权重、所述第二情绪类别和所述第二情绪权重进行迭代编码分析,得到所述目标文本中当前语句对应的目标情绪类别。
9.一种基于上下文迭代的情绪识别设备,其特征在于,包括:
存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的基于上下文迭代的情绪识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的基于上下文迭代的情绪识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111014415.0A CN113705558A (zh) | 2021-08-31 | 2021-08-31 | 基于上下文迭代的情绪识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111014415.0A CN113705558A (zh) | 2021-08-31 | 2021-08-31 | 基于上下文迭代的情绪识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113705558A true CN113705558A (zh) | 2021-11-26 |
Family
ID=78658128
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111014415.0A Pending CN113705558A (zh) | 2021-08-31 | 2021-08-31 | 基于上下文迭代的情绪识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113705558A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107562816A (zh) * | 2017-08-16 | 2018-01-09 | 深圳狗尾草智能科技有限公司 | 用户意图自动识别方法及装置 |
CN107608956A (zh) * | 2017-09-05 | 2018-01-19 | 广东石油化工学院 | 一种基于cnn‑grnn的读者情绪分布预测算法 |
US20190042952A1 (en) * | 2017-08-03 | 2019-02-07 | Beijing University Of Technology | Multi-task Semi-Supervised Online Sequential Extreme Learning Method for Emotion Judgment of User |
-
2021
- 2021-08-31 CN CN202111014415.0A patent/CN113705558A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190042952A1 (en) * | 2017-08-03 | 2019-02-07 | Beijing University Of Technology | Multi-task Semi-Supervised Online Sequential Extreme Learning Method for Emotion Judgment of User |
CN107562816A (zh) * | 2017-08-16 | 2018-01-09 | 深圳狗尾草智能科技有限公司 | 用户意图自动识别方法及装置 |
CN107608956A (zh) * | 2017-09-05 | 2018-01-19 | 广东石油化工学院 | 一种基于cnn‑grnn的读者情绪分布预测算法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019288674B2 (en) | Neural network acceleration and embedding compression systems and methods with activation sparsification | |
US11948058B2 (en) | Utilizing recurrent neural networks to recognize and extract open intent from text inputs | |
CN110750965B (zh) | 英文文本序列标注方法、系统及计算机设备 | |
CN112100354B (zh) | 人机对话方法、装置、设备及存储介质 | |
JP2021501390A (ja) | テキスト意味論的コード化の方法および装置 | |
CN110298019A (zh) | 命名实体识别方法、装置、设备及计算机可读存储介质 | |
US11636341B2 (en) | Processing sequential interaction data | |
CN109816438B (zh) | 信息推送方法及装置 | |
CN111967264B (zh) | 一种命名实体识别方法 | |
CN111274797A (zh) | 用于终端的意图识别方法、装置、设备及存储介质 | |
CN108664512B (zh) | 文本对象分类方法及装置 | |
CN112528634A (zh) | 文本纠错模型训练、识别方法、装置、设备及存储介质 | |
CN111767375A (zh) | 语义召回方法、装置、计算机设备及存储介质 | |
CN111104516B (zh) | 一种文本分类方法、装置及电子设备 | |
CN113268560A (zh) | 用于文本匹配的方法和装置 | |
CN113886601A (zh) | 电子文本事件抽取方法、装置、设备及存储介质 | |
CN112836502A (zh) | 一种金融领域事件隐式因果关系抽取方法 | |
CN113296755A (zh) | 代码结构树库构建方法和信息推送方法 | |
CN112418320A (zh) | 一种企业关联关系识别方法、装置及存储介质 | |
CN108475346B (zh) | 神经随机访问机器 | |
CN108021544B (zh) | 对实体词的语义关系进行分类的方法、装置和电子设备 | |
CN114817473A (zh) | 用于压缩语义理解模型的方法、装置、设备、介质和产品 | |
CN116680387A (zh) | 基于检索增强的对话答复方法、装置、设备及存储介质 | |
CN113705558A (zh) | 基于上下文迭代的情绪识别方法、装置、设备及存储介质 | |
CN114817523A (zh) | 摘要生成方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |