CN116521875A - 引入群体情绪感染的原型增强小样本对话情感识别方法 - Google Patents
引入群体情绪感染的原型增强小样本对话情感识别方法 Download PDFInfo
- Publication number
- CN116521875A CN116521875A CN202310515226.4A CN202310515226A CN116521875A CN 116521875 A CN116521875 A CN 116521875A CN 202310515226 A CN202310515226 A CN 202310515226A CN 116521875 A CN116521875 A CN 116521875A
- Authority
- CN
- China
- Prior art keywords
- dialogue
- emotion
- sentence
- class
- prototype
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 title claims abstract description 55
- 208000015181 infectious disease Diseases 0.000 title claims abstract description 35
- 230000008909 emotion recognition Effects 0.000 title claims abstract description 31
- 238000005070 sampling Methods 0.000 claims abstract description 25
- 230000007246 mechanism Effects 0.000 claims abstract description 12
- 230000014509 gene expression Effects 0.000 claims abstract description 9
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000002996 emotional effect Effects 0.000 claims description 3
- 230000002776 aggregation Effects 0.000 claims description 2
- 238000004220 aggregation Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 230000008447 perception Effects 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims 1
- 238000003058 natural language processing Methods 0.000 abstract description 4
- 238000012549 training Methods 0.000 description 6
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241000287196 Asthenes Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了引入群体情绪感染的原型增强小样本对话情感识别方法,涉及自然语言处理技术领域,针对现有的小样本对话情感识别方法直接根据对话中语句类别采样导致的各类别语句不均衡问题,本方法引入自适应交叉采样策略,根据对话中各类别语句数量进行自适应分组,并根据不同组之间的比例进行采样,有效缓解了各类别语句不平衡问题。同时,在考虑对话上下文信息方面,本方法引入了群体情绪感染机制构建加权有向无环图,有效区分了他人与说话者本人对说话者的不同影响。此外,本方法基于原型网络提出了增强对话原型网络,通过动态加权计算对话内各类别语句原型再平均的方法,增强了对话内语句类原型表示。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其是引入群体情绪感染的原型增强小样本对话情感识别方法。
背景技术
随着自然语言处理在学术理论上的深入研究和实际场景下的广泛应用,对话情感识别逐渐成为其中一个重要领域。传统的对话情感识别方法可以归纳为基于图模型和基于递归模型的方法,但是这些方法都存在着严重的局限性,即需要大量带注释的数据训练模型以正确识别对话情感,并且近年来情感分类不断细化,对话情感的划分也将逐步增加,若依旧采用传统的对话情感识别方法,将会带来非常昂贵的计算代价,而小样本学习旨在通过学习少量样本即可实现对新样本的分类。小样本对话情感识别包括两个输入:支持集对话语句和查询集对话语句。首先模型分别对支持集对话和查询集对话提取上下文信息,然后在支持集对话中训练并提取对话中语句类原型,使用支持集类原型特征对查询集对话语句分类。
目前,小样本对话情感识别主要采用原型网络,其在自然语言处理方面有着非常广泛且有效的应用。但是应用在小样本对话情感识别中仍然面临着诸多问题:(1)支持集和查询集中的语句类别个数是不确定的,支持集和查询集以对话为单位进行采样,对话中每个类别的语句数量不能保证,然而如何确保语句类别数量均衡是构建小样本对话情感识别的主要问题;(2)对于对话情感识别而言,不仅要有效提取上下文信息和说话者关系,对话中存在的情绪感染对判断说话者的情感也是至关重要的,如何利用此信息对于对话情感识别任务非常关键;(3)原型网络忽略了对话内语句之间的联系,如何将原型网络更好的应用在对话情感识别中是非常重要的。
发明内容
本发明人针对上述问题及技术需求,提出了引入群体情绪感染的原型增强小样本对话情感识别方法,提出自适应分组交叉采样,缓解了类别不平衡问题;然后,引入群体情绪感染机制构建了加权有向无环图,并利用有向无环图神经网络提取对话上下文信息;最后,采用重加权方法对每个对话语句进行动态加权再平均计算其类原型,增强对话内各类别语句类原型表示。本发明的技术方案如下:
引入群体情绪感染的原型增强小样本对话情感识别方法,包括如下步骤:
步骤1:获取包含多个说话者语句的对话文本构建数据集,并将所述数据集中的对话按照对应的情感类别划分成各个目标类别集合;
步骤2:将所有目标类别集合中的对话进行自适应交叉采样,构成支持集和查询集;
步骤3:基于群体情绪感染机制对所述支持集和查询集中的每个对话分别构建加权有向无环图,并提取出每个对话的引入对话语句上下文信息的语句表示;
步骤4:根据所述支持集中每个对话的引入对话语句上下文信息的语句表示,计算支持集中的每个对话中所包含各情感类别语句的增强类原型;
步骤5:计算所述查询集中每个对话的引入对话语句上下文信息的语句表示分别与各个增强类原型的欧式距离,将与所述查询集中每个对话最近的增强类原型对应的原型情感类别,作为该对话的情感类别。
本发明的有益技术效果是:
1)通过步骤2提出的自适应交叉采样,有效缓解了支持集和查询集中各类别语句数量不平衡问题;
2)步骤3基于群体情绪感染机制构建加权有向无环图,有效区分了同一说话者与不同说话者之间的情感影响;
3)步骤4中,结合上一步获取的结果计算得到了对话中语句的增强类原型,加强了对话内的类原型的表示,有效区分了不同对话间语句原型的权重影响;
4)与现有的小样本对话情感识别方法相比,本方法的准确率更高,同时缓解了类别不平衡问题,并考虑了对话中说话者之间的关系,有更好更全面提取对话上下文信息的能力,同时增强了对话内的类原型表示。
附图说明
图1是本申请提供的小样本对话情感识别方法流程图。
图2是本申请提供的该方法的整体框架图。
图3是本申请提供的自适应交叉采样结构图。
图4是本申请提供的加权有向无环图的结构示意。
图5是本申请提供的增强对话原型结构图。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
结合图1、图2所示,本实施例公开了一种引入群体情绪感染的原型增强小样本对话情感识别方法,包括如下步骤:
步骤1:获取包含多个说话者语句的对话文本构建数据集,并将数据集中的对话按照对应的情感类别划分成各个目标类别集合。
在本实施例中,以公开的数据集DailyDialog为例进行阐述。其中,将数据集中的对话按照对应的情感类别划分成各个目标类别集合具体包括:
假设情感类别数为NC,若对话中含有至少一个语句属于情感类别k∈[1,NC],则将此对话标识为目标类别k,目标类别k集合表示为其中:|Dk|表示目标类别集合Dk中的对话数量,Ci∈Dk表示目标类别集合Dk中的第i个对话,Dk∈D,D为包含所有对话文本的数据集集合。
步骤1划分得到的目标类别集合Dk已满足支持集与查询集的采样条件,即分别从每个情绪类别中选取NS个对话支持集和NQ个对话查询集。但是在选取目标类别集合中的对话时,对话中包含的各类别语句数量不确定,例如选取类别k中的一个对话,对话中只含有一个类别为k的语句,而含有多个其他类别的语句,这将导致各类别语句数量极不平衡,对分类结果造成较大误差。针对该问题,本发明提出自适应交叉采样,对步骤一得到的目标类别集合进行重新划分,即进入步骤2。
步骤2:将所有目标类别集合中的对话进行自适应交叉采样,构成支持集和查询集。如图3所示,具体包括:
步骤2-1:根据所有目标类别集合对话中的语句类别数量确定阈值的初始值,记为mm。
对于每个目标类别集合,计算集合中每个对话的语句属于该集合对应的情感类别的数量,并选取其中的最大值。以目标类别集合Dk为例,对Dk中的每个对话Ci,计算对话Ci中语句类别为k的数量计算目标类别k∈[1,NC]的集合Dk中/>的最大值为
从计算得到的各个目标类别集合对应的最大值中选出一个最小值作为阈值的初始值,即
步骤2-2:根据阈值将每个目标类别集合中的对话划分为G1和G2两个集合。具体的,对于每个目标类别集合,判断计算得到的与阈值mm的大小关系,若/>则将对话划分到集合G1中;若/>则将对话划分到集合G2中。
步骤2-3:根据G1和G2两个集合中的对话数量确定比例R,R=|G2|/(|G1|+|G2|),其中|G1|和|G2|分别表示相应集合中的对话数量。
步骤2-4:判断比例R是否合适。即当满足γ1<R<γ2或者mm≤1时,进入步骤2-5;若不满足此条件,则令mm=mm-1,再重新执行步骤2-2,直到条件满足,其中γ1和γ2为超参数。
步骤2-5:分别从集合G1中采样(1-R)*NS个对话、从集合G2中采样R*NS个对话构成支持集S,以及分别从集合G1中采样(1-R)*NQ个对话、从集合G2中采样R*NQ个对话构成查询集Q,且其中NS和NQ为预定采样参数。
通过步骤2构建的自适应交叉采样,集合G1是为了保证所有对话都能够被采样,集合G2是让包含目标类别语句多的对话被划分在相应目标类别中。对每个类别都按照一定的比例从G1和G2中分组采样,既保证了所有数据集都有机会被选择作为支持集和查询集,也保证了支持集和查询集在各类别对话中含有的对应类别语句数量占有优势,从而在每次训练中都尽可能保证各类别语句数量均衡,不会出现较大的差距。
步骤3:基于群体情绪感染机制对支持集和查询集中的每个对话分别构建加权有向无环图,并提取出每个对话的引入对话语句上下文信息的语句表示。
群体情绪感染,顾名思义是指在群体中个体情绪更容易受到他人情绪的影响。心理学研究表明,人们会不由自主的模仿他人的面部表情、肢体动作、说话方式以及语调。此外,人们也会设身处地的感受他人的情绪,并作出合时宜的反应。通过具体的实验数据,Barsade教授证明了在群体中确实存在情绪感染。因此,本方法引入了群体情绪感染机制构建加权有效无环图,通过区分不同说话者对当前语句的影响,有效提取引入对话语句上下文信息的语句表示。
步骤3-1:对支持集和查询集中的每个对话分别提取其语句特征。
在本实施例中,采用现有的RoBERTa模型作为特征提取器,首先在每个语句前面加上特殊标记[CLS],使输入成为u1={[CLS],w1,w2,……,wb},其中w表示语句中的单词,b表示语句中的单词数量。然后经过RoBERTa模型在最后一层利用[CLS]的池化嵌入作为语句的特征表示ui,则对每个对话Ci提取的语句特征集合U={u1,u2,……,u|Ci|},其中|Ci|为对话Ci中的语句数量。提取语句特征的方法也可以采用其他类似的模型作为特征提取器,对此本申请不做具体限定。
步骤3-2:将每个对话中的语句特征ui作为加权有向无环图的节点,从一个节点ui向另一个节点uj的信息传递作为加权有向无环图的边eij。如图4所示,不同图形表示不同说话者,不同灰度表示不同情绪类别,不同图形也代表了不同的节点,节点之间的连线表示边eij,虚线表示同一说话者之间的信息传递,实线表示不同说话者之间的信息传递。
步骤3-3:引入群体情绪感染机制,表现为:在对话中,将同一个说话者的前一个语句传递给当前语句的信息权重ω1作为边的值,将同一个说话者两个语句间不同说话者传递给当前语句的信息权重ω2作为边的值,其中ω1<ω2,eij∈{ω1,ω2}。然后将两个相邻语句间说话者是否属于同一个人作为边之间的关系rij,若两个相邻语句间说话者为同一个人,则确定rij=1,否则rij=0。由此,完成加权有向无环图的构建,如图4所示。
步骤3-4:采用对话情感识别的有向无环图神经网络提取对话语句的上下文信息。具体的,将加权有向无环图的节点ui、边值eij和边之间的关系rij送入三层有向无环图神经网络中,提取出每个对话的引入对话语句上下文信息的语句表示v。本实施例采用的加权有向无环图神经网络包括关系感知特征转换网络、节点信息单元和上下文信息单元,其中节点信息单元和上下文信息单元由两个门控循环单元实现。以对话中的节点ui为例,在加权有向无环图神经网络中,首先基于关系感知特征转换网络得到当前节点在l层的聚合信息:
其中,表示节点ui的邻近节点,/>表示提取的l-1层节点i的引入上下文信息的语句表示,/>表示提取的l层节点j的引入上下文信息的语句表示。
再经过两个门控循环单元提取在l层的节点信息和上下文信息/>将节点信息和上下文信息进行串联得到引入对话语句上下文信息的语句表示/>
现有的小样本对话情感识别方法基于原型网络,直接将对话支持集中所有对话的语句按类别划分并计算每个类别语句的平均原型,但这种方法忽略了对话内各类别语句之间的关系。对此本方法提出了增强对话原型网络,如图5所示,进入步骤4。
步骤4:根据支持集中每个对话的引入对话语句上下文信息的语句表示,计算支持集中的每个对话中所包含各情感类别语句的增强类原型。
首先,根据支持集中每个对话的引入对话语句上下文信息的语句表示,计算支持集中的每个对话中所包含各情感类别语句的类原型,并根据各类别语句在对话中的数量占比进行加权,得到各情感类别语句的动态加权平均类原型;然后,采用平均法计算支持集中的每个对话中所包含各情感类别语句的增强类原型。
以对话Ci为例,假设对话Ci中情感类别为k的语句的动态加权平均类原型表示为则:
其中,表示对话中语句类别为k的语句集合,vj表示对话中提取的第j个引入对话语句上下文信息的语句表示,即语句表示vj的情感标签为k。然后,采用平均法计算支持集中对话Ci中含有k类别语句的增强类原型pk的计算表达式为:
其中,NC*NS表示支持集中的对话数量。
最后,采用标准交叉熵函数计算模型总损失
其中,yi,j表示查询集中第i个对话中第j个语句的真实情感标签(即类别),Pi,j表示查询集样本预测正确的概率。
步骤4中构建的增强对话原型网络,通过计算每个对话中的动态加权平均类原型,考虑了各类别语句在所属对话中的权重影响,而不是无差别的将所有对话中的各类别语句提取出来计算类原型。最后再次利用平均法计算支持集中所有对话包含的加权平均类原型,这样既考虑了对话内相同情感类别语句间的联系,也包含了数据集中此类别语句存在的共同特点,有效的将原型网络应用在小样本对话情感识别中。
步骤5:计算查询集中每个对话的引入对话语句上下文信息的语句表示分别与各个增强类原型的欧式距离,将与查询集中每个对话最近的增强类原型对应的原型情感类别,作为该对话的情感类别。
为了验证本发明的准确性与鲁棒性,本发明在公开数据集DailyDialog和MELD上进行实验。DailyDialog是从多个不同英语学习网站提取的英语学习者在日常生活中练习的英语对话,涵盖了非常广泛的日常情景。该数据集的每段对话由两个说话者构成,包含6种基本的情感标签,共有13118个对话,平均每个对话包含7.9个语句,其中11118个对话为训练集,验证集和测试集各有1000个对话。MELD来自情景喜剧《老友记》中的对话,每段对话包含多个说话者,含有7种基本情感标签,共有1432个对话,平均每个对话包含9.6个语句,其中1038个对话为训练集,114个对话为验证集,280个对话为测试集。实验参数设置参考表1所示:
表1.数据集实验参数设置
表1是两个数据集在实验中的参数设置。其中分别包括训练样本、验证样本和测试样本的对话数量和语句数量,以及学习率和总的迭代次数。
表2为上述实施例提出的引入群体情绪感染的原型增强小样本对话情感识别方法在DailyDialog和MELD数据集上的测试结果,其中对DailyDialog数据集采用微观F1评价指标,MELD数据集采用宏观F1评价指标。从表2可以看出,本方法在双人对话数据集DailyDialog和多人对话数据集MELD中都取得了先进的结果,这表明本发明提出的方法具有很好的鲁棒性。
表2.在DailyDialog和MELD数据集上的性能指标
数据集 | DailyDialog | MELD |
PEEmoConta | 57.87 | 58.82 |
为了验证本发明提出的自适应交叉采样、引入群体情绪感染机制的加权有向无环图和增强对话原型网络的有效性,另外构建了一个基础模型,该模型包括一个特征提取网络RoBERTa,对提取的语句特征构建有向无环图,利用有向无环图网络计算对话语句的上下文信息,然后采用序列原型网络计算每类语句的原型表示。从表3中可以看出,对于DailyDialog数据集,基础网络的精度达到56.67。在基础网络中添加自适应交叉采样模块,精确度达到57.17。引入群体情绪感染后,构建加权有向无环图,模型精度进一步提高达到57.21。在此基础上,添加增强对话原型网络,模型精度达到较高的结果57.87。这表明本申请设计的自适应交叉采样、引入群体情绪感染机制的加权有向无环图和增强对话原型网络对小样本对话情感识别分类都有正向效果,它们分别减缓了类别数量不平衡问题、增加了对话中情绪感染的影响、增强了类原型对话内语句间的联系,进而提高了模型的分类能力。
表3.在DailyDialog数据集上三个模型的效果
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。
Claims (10)
1.引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,所述方法包括:
获取包含多个说话者语句的对话文本构建数据集,并将所述数据集中的对话按照对应的情感类别划分成各个目标类别集合;
将所有目标类别集合中的对话进行自适应交叉采样,构成支持集和查询集;
基于群体情绪感染机制对所述支持集和查询集中的每个对话分别构建加权有向无环图,并提取出每个对话的引入对话语句上下文信息的语句表示;
根据所述支持集中每个对话的引入对话语句上下文信息的语句表示,计算支持集中的每个对话中所包含各情感类别语句的增强类原型;
计算所述查询集中每个对话的引入对话语句上下文信息的语句表示分别与各个增强类原型的欧式距离,将与所述查询集中每个对话最近的增强类原型对应的原型情感类别,作为该对话的情感类别。
2.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,将所述数据集中的对话按照对应的情感类别划分成各个目标类别集合的方法包括:
假设情感类别数为NC,若对话中含有至少一个语句属于情感类别k∈[1,NC],则将此对话标识为目标类别k,目标类别k集合表示为其中:|Dk|表示目标类别集合Dk中的对话数量,Ci∈Dk表示目标类别集合Dk中的第i个对话,Dk∈D,D为包含所有对话文本的数据集集合。
3.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,将所有目标类别集合中的对话进行自适应交叉采样,构成支持集和查询集的方法包括:
根据所有目标类别集合对话中的语句类别数量确定阈值的初始值,记为mm;
根据所述阈值将每个所述目标类别集合中的对话划分为G1和G2两个集合;
根据G1和G2两个集合中的对话数量确定比例R,R=|G2|/(|G1|+|G2|);当满足γ1<R<γ2或者mm≤1时,分别从集合G1中采样(1-R)*NS个对话、从集合G2中采样R*NS个对话构成支持集S,以及分别从集合G1中采样(1-R)*NQ个对话、从集合G2中采样R*NQ个对话构成查询集Q,且否则令mm=mm-1,再重新执行根据所述阈值将每个所述目标类别集合中的对话划分为G1和G2两个集合;
其中,|G1|和|G2|分别表示相应集合中的对话数量,γ1和γ2为超参数,NS和NQ为预定采样参数。
4.根据权利要求3所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,所述根据所有目标类别集合对话中的语句类别数量确认阈值的初始值的方法包括:
对于每个所述目标类别集合,计算集合中每个对话的语句属于该集合对应的情感类别的数量,并选取其中的最大值;
从计算得到的各个目标类别集合对应的最大值中选出一个最小值作为阈值的初始值。
5.根据权利要求3所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,根据所述阈值将每个所述目标类别集合中的对话划分为G1和G2两个集合的方法包括:
对于每个所述目标类别集合,计算集合中每个对话的语句属于该集合对应的情感类别的数量若/>则将所述对话划分到集合G1中,否则划分到集合G2中。
6.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,基于群体情绪感染机制对所述支持集和查询集中的每个对话分别构建加权有向无环图的方法包括:
对所述支持集和查询集中的每个对话分别提取其语句特征;
将每个对话中的语句特征作为加权有向无环图的节点,从一个节点向另一个节点的信息传递作为加权有向无环图的边;
引入群体情绪感染机制,表现为:在所述对话中,将同一个说话者的前一个语句传递给当前语句的信息权重ω1作为所述边的值,将同一个说话者两个语句间不同说话者传递给当前语句的信息权重ω2作为所述边的值,其中ω1<ω2;若两个相邻语句间说话者为同一个人,则确定边之间的关系rij=1,否则rij=0。
7.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,提取出每个对话的引入对话语句上下文信息的语句表示的方法包括:
将构建加权有向无环图时得到的参数送入用于对话情感识别的有向无环图神经网络中,提取出每个对话的引入对话语句上下文信息的语句表示;其中,所述加权有向无环图的参数包括节点、边值和边之间的关系。
8.根据权利要求7所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,所述有向无环图神经网络包括关系感知特征转换网络、节点信息单元和上下文信息单元,其中节点信息单元和上下文信息单元由两个门控循环单元实现;在所述有向无环图神经网络中,基于所述关系感知特征转换网络得到当前节点的聚合信息,再经过两个所述门控循环单元提取节点信息和上下文信息,将所述节点信息和上下文信息进行串联得到引入对话语句上下文信息的语句表示。
9.根据权利要求1所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,根据所述支持集中每个对话的引入对话语句上下文信息的语句表示,计算支持集中的每个对话中所包含各情感类别语句的增强类原型的方法包括:
首先,根据所述支持集中每个对话的引入对话语句上下文信息的语句表示,计算支持集中的每个对话中所包含各情感类别语句的类原型,并根据各类别语句在对话中的数量占比进行加权,得到各情感类别语句的动态加权平均类原型;然后,采用平均法计算所述支持集中的每个对话中所包含各情感类别语句的增强类原型;假设情感类别为k的语句的动态加权平均类原型表示为则所述支持集中的每个对话中含有k类别语句的增强类原型pk的计算表达式为:
其中,NC*NS表示支持集中的对话数量。
10.根据权利要求9所述的引入群体情绪感染的原型增强小样本对话情感识别方法,其特征在于,情感类别为k的语句的动态加权平均类原型的计算表达式为:
其中,|Ci|表示对话中语句的数量,表示对话Ci中语句类别为k的数量,/>表示对话中语句类别为k的语句集合,vj表示对话中提取的第j个引入对话语句上下文信息的语句表示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310515226.4A CN116521875B (zh) | 2023-05-09 | 2023-05-09 | 引入群体情绪感染的原型增强小样本对话情感识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310515226.4A CN116521875B (zh) | 2023-05-09 | 2023-05-09 | 引入群体情绪感染的原型增强小样本对话情感识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116521875A true CN116521875A (zh) | 2023-08-01 |
CN116521875B CN116521875B (zh) | 2023-10-31 |
Family
ID=87407946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310515226.4A Active CN116521875B (zh) | 2023-05-09 | 2023-05-09 | 引入群体情绪感染的原型增强小样本对话情感识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116521875B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110347796A (zh) * | 2019-07-05 | 2019-10-18 | 神思电子技术股份有限公司 | 向量语义张量空间下的短文本相似度计算方法 |
CN111859054A (zh) * | 2020-07-23 | 2020-10-30 | 中国科学院计算机网络信息中心 | 气象卫星数据的处理方法及装置 |
CN113051399A (zh) * | 2021-03-31 | 2021-06-29 | 浙江大学 | 一种基于关系型图卷积网络的小样本细粒度实体分类方法 |
CN113569865A (zh) * | 2021-09-27 | 2021-10-29 | 南京码极客科技有限公司 | 一种基于类别原型学习的单样本图像分割方法 |
US20220046310A1 (en) * | 2018-10-15 | 2022-02-10 | Sony Corporation | Information processing device, information processing method, and computer program |
US20220093270A1 (en) * | 2020-09-21 | 2022-03-24 | Siemens Healthcare Gmbh | Few-Shot Learning and Machine-Learned Model for Disease Classification |
CN114333064A (zh) * | 2021-12-31 | 2022-04-12 | 江南大学 | 基于多维原型重构增强学习的小样本行为识别方法及系统 |
CN114444600A (zh) * | 2022-01-28 | 2022-05-06 | 南通大学 | 基于记忆增强原型网络的小样本图像分类方法 |
CN114676259A (zh) * | 2022-04-11 | 2022-06-28 | 哈尔滨工业大学 | 一种基于因果感知交互网络的对话情绪识别方法 |
CN114971022A (zh) * | 2022-05-26 | 2022-08-30 | 郑州轻工业大学 | 基于D-value-LSTM神经网络模型的风电功率预测方法 |
CN114997331A (zh) * | 2022-06-27 | 2022-09-02 | 吉林大学 | 基于度量学习的小样本关系分类方法及系统 |
CN115186064A (zh) * | 2022-07-18 | 2022-10-14 | 中国人民解放军国防科技大学 | 基于规则知识增强的数据关系抽取方法及相关装置 |
-
2023
- 2023-05-09 CN CN202310515226.4A patent/CN116521875B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220046310A1 (en) * | 2018-10-15 | 2022-02-10 | Sony Corporation | Information processing device, information processing method, and computer program |
CN110347796A (zh) * | 2019-07-05 | 2019-10-18 | 神思电子技术股份有限公司 | 向量语义张量空间下的短文本相似度计算方法 |
CN111859054A (zh) * | 2020-07-23 | 2020-10-30 | 中国科学院计算机网络信息中心 | 气象卫星数据的处理方法及装置 |
US20220093270A1 (en) * | 2020-09-21 | 2022-03-24 | Siemens Healthcare Gmbh | Few-Shot Learning and Machine-Learned Model for Disease Classification |
CN113051399A (zh) * | 2021-03-31 | 2021-06-29 | 浙江大学 | 一种基于关系型图卷积网络的小样本细粒度实体分类方法 |
CN113569865A (zh) * | 2021-09-27 | 2021-10-29 | 南京码极客科技有限公司 | 一种基于类别原型学习的单样本图像分割方法 |
CN114333064A (zh) * | 2021-12-31 | 2022-04-12 | 江南大学 | 基于多维原型重构增强学习的小样本行为识别方法及系统 |
CN114444600A (zh) * | 2022-01-28 | 2022-05-06 | 南通大学 | 基于记忆增强原型网络的小样本图像分类方法 |
CN114676259A (zh) * | 2022-04-11 | 2022-06-28 | 哈尔滨工业大学 | 一种基于因果感知交互网络的对话情绪识别方法 |
CN114971022A (zh) * | 2022-05-26 | 2022-08-30 | 郑州轻工业大学 | 基于D-value-LSTM神经网络模型的风电功率预测方法 |
CN114997331A (zh) * | 2022-06-27 | 2022-09-02 | 吉林大学 | 基于度量学习的小样本关系分类方法及系统 |
CN115186064A (zh) * | 2022-07-18 | 2022-10-14 | 中国人民解放军国防科技大学 | 基于规则知识增强的数据关系抽取方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116521875B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111427995B (zh) | 基于内部对抗机制的语义匹配方法、装置及存储介质 | |
CN109992779B (zh) | 一种基于cnn的情感分析方法、装置、设备及存储介质 | |
CN108549658B (zh) | 一种基于语法分析树上注意力机制的深度学习视频问答方法及系统 | |
CN111444709A (zh) | 文本分类方法、装置、存储介质及设备 | |
US20210375280A1 (en) | Systems and methods for response selection in multi-party conversations with dynamic topic tracking | |
CN110929515A (zh) | 基于协同注意力和自适应调整的阅读理解方法及系统 | |
CN111897944B (zh) | 基于语义空间共享的知识图谱问答系统 | |
CN111933127A (zh) | 一种具备自学习能力的意图识别方法及意图识别系统 | |
CN110866113B (zh) | 基于稀疏自注意力机制微调伯特模型的文本分类方法 | |
CN111125520B (zh) | 一种面向新闻文本的基于深度聚类模型的事件线抽取方法 | |
CN114818703B (zh) | 基于BERT语言模型和TextCNN模型的多意图识别方法及系统 | |
CN109408619B (zh) | 一种面向问答领域动态计算问句与答案相似性的方法 | |
CN110929532B (zh) | 数据处理方法、装置、设备及存储介质 | |
CN113849653A (zh) | 一种文本分类方法及装置 | |
CN111914553A (zh) | 一种基于机器学习的金融信息负面主体判定的方法 | |
CN117494727B (zh) | 用于大语言模型的去偏倚方法 | |
CN112950414B (zh) | 一种基于解耦法律要素的法律文本表示方法 | |
CN113934835A (zh) | 结合关键词和语义理解表征的检索式回复对话方法及系统 | |
CN113743079A (zh) | 一种基于共现实体交互图的文本相似度计算方法及装置 | |
CN108629381A (zh) | 基于大数据的人群筛选方法及终端设备 | |
CN110334204B (zh) | 一种基于用户记录的习题相似度计算推荐方法 | |
CN111368524A (zh) | 一种基于自注意力双向gru和svm的微博观点句识别方法 | |
CN116521875B (zh) | 引入群体情绪感染的原型增强小样本对话情感识别方法 | |
CN108831487B (zh) | 声纹识别方法、电子装置及计算机可读存储介质 | |
CN110287396A (zh) | 文本匹配方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |