CN117017288B

CN117017288B - 跨被试情绪识别模型及其训练方法、情绪识别方法、设备

Info

Publication number: CN117017288B
Application number: CN202310707364.2A
Authority: CN
Inventors: 顾瑾; 龚新皓; 李天瑞
Original assignee: Southwest Jiaotong University
Current assignee: Southwest Jiaotong University
Priority date: 2023-06-14
Filing date: 2023-06-14
Publication date: 2024-03-19
Anticipated expiration: 2043-06-14
Also published as: CN117017288A

Abstract

本发明公开了一种跨被试情绪识别模型及其训练方法、情绪识别方法、设备，训练方法基于神经网络结构实现，神经网络结构包括两个独立且结构相同的子神经网络；训练方法包括以下步骤：S1：获取脑电原始信号，并对其进行微分熵特征提取；S2：将提取的微分熵特征划分为多个数据组，并将其中一个作为目标域数据，剩余的作为源域数据；S3：假设当前源域数据分别为S_i和S_j，目标域数据为T，其中，S_i为子神经网络一的输入，S_j为子神经网络二的输入；S4：建立子神经网络的目标函数；S5：建立跨被试情绪识别模型的损失函数；S6：进行神经网络训练，直至跨被试情绪识别模型的损失函数最小化。本发明获得的跨被试情绪识别模型更加轻量化、识别准确率更高。

Description

跨被试情绪识别模型及其训练方法、情绪识别方法、设备

技术领域

本发明涉及脑电情绪识别技术领域，特别涉及一种跨被试情绪识别模型及其训练方法、情绪识别方法、设备。

背景技术

在脑电跨被试情绪识别中，主要难点是脑电数据存在基于被试的个体差异性。这将导致两方面问题：1、特定于被试的模型在新被试上表现差；2、被试通用模型预测效果不佳。目前，这方面的研究最常用的解决办法是在神经网络中引入域适应。域适应目的是将源域中学到的知识可以应用到不同但相关的目标域中，通过对齐源域和目标域的边缘分布或条件分布，将模型推广到不同分布的不同领域。在域适应中度量源域和目标域的分布距离一般采用最大均值差异(MMD)。在神经网络训练过程中，通过不断最小化MMD损失函数来降低源域和目标域的分布差异，提高模型在目标域的泛化能力。

在现有技术MS-MDA中，采用多源域适应的方法进行脑电跨被试情绪识别，但该方法的模型结果会随着被试的增多而增大，在被试较多的数据集中，如DEAP数据集(含32被试)需要构建32个DSFE和DSC，极大增加了模型的参数量，降低模型运行效率；另外，该方法仅考虑了对齐源域和目标域的边缘分布而忽视了条件分布，降低了域不变特征的情感识别能力。

发明内容

针对上述问题，本发明旨在提供一种跨被试情绪识别模型及其训练方法、情绪识别方法、设备。

本发明的技术方案如下：

本发明提供了一种跨被试情绪识别模型的训练方法，所述训练方法基于神经网络结构实现，所述神经网络结构包括两个独立且结构相同的子神经网络一和子神经网络二，两个子神经网络均包括一个编码器和一个分类器，所述编码器用于进行特征提取，并将提取的特征输入到所述分类器中，所述分类器用于完成预测；

所述训练方法包括以下步骤：

S1：获取脑电原始信号，并根据所述脑电原始信号提取微分熵特征；

S2：将提取获得的微分熵特征根据被试个数划分为多个数据组，并将其中一个数据组作为目标域数据，剩余的其他数据组作为源域数据；

S3：假设当前源域数据分别为S_i和S_j，目标域数据为T，其中，所述S_i为子神经网络一的输入，所述S_j为子神经网络二的输入；

S4：以相同的方法建立所述子神经网络一的目标函数一和所述子神经网络二的目标函数二；

S5：根据所述目标函数一和所述目标函数二建立跨被试情绪识别模型的损失函数；

S6：对所述神经网络结构进行神经网络训练，直至所述跨被试情绪识别模型的损失函数最小化，此时获得的神经网络结构即为能够进行跨被试情绪识别的跨被试情绪识别模型。

作为优选，步骤S4中，所述子神经网络一的目标函数一为：

式中：为子神经网络一的目标函数一；/>为子神经网络一关于源域数据S_i上的交叉熵损失函数；/>为子神经网络二指导子神经网络一产生的协作损失函数；/>为动态对齐目标域数据和源域数据之间的边缘分布和条件分布的函数；

步骤S5中，所述跨被试情绪识别模型的损失函数为：

式中：为跨被试情绪识别模型的损失函数；/>为子神经网络二的目标函数二。

作为优选，所述子神经网络一关于源域数据S_i上的交叉熵损失函数为：

式中：k为批大小；y_i为源域数据的真实标签；为源域数据由子神经网络一的分类器经过softmax得到的预测标签。

作为优选，所述子神经网络二指导子神经网络一产生的协作损失函数为：

式中：为源域数据S_j经过子神经网络二的编码器得到的特征；/>为源域数据S_j经过子神经网络一的编码器得到的特征；/>为目标域数据T经过子神经网络二的编码器得到的特征；/>为目标域数据T经过子神经网络一的编码器得到的特征。

作为优选，所述动态对齐目标域数据和源域数据之间的边缘分布和条件分布的函数为：

式中：α为关于训练轮数的单调递减函数；为减少目标域数据和源域数据的边缘分布；/>为减少目标域数据和源域数据的条件分布。

作为优选，所述关于训练轮数的单调递减函数α为：

式中：e为自然常数；epoch为当前训练轮数；N为总训练轮数；

作为优选，所述减少目标域数据和源域数据的边缘分布通过下式进行计算：

式中：n和m分别为源域样本量和目标域样本量；k(·,·)为核函数；对应编码器的作用；/>和/>分别为源域第i个和第j个样本数据，/>和/>分别为目标域第i和第j个样本数据；

所述减少目标域数据和源域数据的条件分布通过下式进行计算：

式中：M为标签类别的数量；D_cc(·,·)和D_cc‘(·,·)分别表示相同标签的跨域差异和不同标签的跨域差异。

本发明还提供了一种跨被试情绪识别模型，采用上述任意一项所述的跨被试情绪识别模型的训练方法训练而成。

本发明还提供了一种跨被试情绪识别方法，采用上述所述的跨被试情绪识别模型进行跨被试情绪识别。

本发明还提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述的跨被试情绪识别模型的训练方法或上述所述的跨被试情绪识别方法。

本发明的有益效果是：

本发明通过采用两个独立且结构相同的子神经网络，使两者互为对方的Teacher网络，相互指导和学习，通过协作学习关联提升两个网络的泛化能力；本发明在建立目标函数时，通过考虑动态对齐目标域数据和源域数据之间的边缘分布和条件分布的函数，减小相同类别的分布差异，增大不同类别的分布差异，利用动态分布自适应实现对齐每个类别内的分布；综上使得本发明跨被试情绪识别模型相较于多源域适应的方法，不会随着被试的增多而增大，且模型本身的参数量较少，能够实现模型轻量化，且预测准确率高，能够为脑电跨被试情绪识别提供技术支持。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明跨被试情绪识别模型的结构示意图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的技术特征可以相互结合。需要指出的是，除非另有指明，本申请使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。本发明公开使用的“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。

实施例1

如图1所示，本实施例提供了一种跨被试情绪识别模型的训练方法，所述训练方法基于神经网络结构实现，所述神经网络结构包括两个独立且结构相同的子神经网络一和子神经网络二，两个子神经网络均包括一个编码器和一个分类器，所述编码器用于进行特征提取，并将提取的特征输入到所述分类器中，所述分类器用于完成预测；

所述训练方法包括以下步骤：

S1：获取脑电原始信号，并根据所述脑电原始信号提取微分熵特征。

S2：将提取获得的微分熵特征根据被试个数划分为多个数据组，并将其中一个数据组作为目标域数据，剩余的其他数据组作为源域数据。

S3：假设当前源域数据分别为S_i和S_j，目标域数据为T，其中，所述S_i为子神经网络一的输入，所述S_j为子神经网络二的输入。

S4：以相同的方法建立所述子神经网络一的目标函数一和所述子神经网络二的目标函数二。

在一个具体的实施例中，所述子神经网络一的目标函数一为：

式中：为子神经网络一的目标函数一；/>为子神经网络一关于源域数据S_i上的交叉熵损失函数；/>为子神经网络二指导子神经网络一产生的协作损失函数；/>为动态对齐目标域数据和源域数据之间的边缘分布和条件分布的函数。

在一个具体的实施例中，所述子神经网络一关于源域数据S_i上的交叉熵损失函数为：

所述子神经网络二指导子神经网络一产生的协作损失函数为：

在本实施例中，利用两个子神经网络相互为对方生成伪标签，在子神经网络一中目标域的标签由前一轮训练的子神经网络二生成，子神经网络二目标域标签同理；最后采用FixMatch的方法为生成的伪标签设置一个高且固定的置信阈值，以滤除大量的噪声数据标签。

所述动态对齐目标域数据和源域数据之间的边缘分布和条件分布的函数为：

在一个具体的实施例中，所述关于训练轮数的单调递减函数α为：

式中：e为自然常数；epoch为当前训练轮数；N为总训练轮数；

所述减少目标域数据和源域数据的边缘分布通过下式进行计算：

式中：M为标签类别的数量；D_cc（·,·)和D_cc‘(·,·)分别表示相同标签的跨域差异和不同标签的跨域差异。

对于任意两个类别的分类器c₁和c₂，它们的差值由以下公式计算：

式中：n_s和n_t分别为源域和目标域的样本量；为同属于c₁标签；/>为同属于c₂标签；/>为属于c₁和c₂两个不同标签；/>为源域第i个样本的真实标签；/>为源域第j个样本的真实标签；/>为目标域第i个样本的真实标签；/>为目标域第j个样本的真实标签。

需要说明的是，所述子神经网络二的目标函数二与所述子神经网络一的目标函数一的建立方法相同，即所述子神经网络二的目标函数二的表达式与式(1)类似，只是其中的参数会相应的换为子神经网络二关于源域数据S_j上的交叉熵损失函数，子神经网络一指导子神经网络二产生的协作损失函数等，具体公式在此不再赘述。

S5：根据所述目标函数一和所述目标函数二建立跨被试情绪识别模型的损失函数；所述跨被试情绪识别模型的损失函数为：

在一个具体的实施例中，采用本发明所述的跨被试情绪识别模型的训练方法进行跨被试情绪识别模型的训练，具体包括以下步骤：

(1)获取数据集

本实施例使用SEED和SEED-IV两个公开数据集进行训练和测试，两个数据集包含了15名被试者，脑电信号采集设备均为62个通道的电极帽。在SEED数据集中包含三种情绪，SEED-IV数据集对应四种情绪。

(2)构建神经网络结构

所述神经网络结构由两个独立且结构相同的子神经网络一M₁和子神经网络二M₂构成，每个子神经网络均包含一个编码器e(·)和一个分类器c(·)，子神经网络一M₁由e₁和c₁组成，子神经网络二M₂由e₂和c₂组成，所述编码器的作用是进行特征提取，然后将提取的特征输入到所述分类器，由所述分类器完成预测。

在本实施例中，所述编码器采用多层感知机来实现，所述分类器由一个线性层构成。具体的，所述编码器为一个五层的网络结构，输入层的节点是310，每层的隐藏层节点数量分别为256、128、64、32，层与层之间使用批归一化并采用线性整流函数作为激活层；所述分类器是预测结果的输出，其隐藏层节点与所使用的数据集情感类别相对应，SEED是三个情绪类别，SEED-IV对应四个情绪类别。

(3)对数据集中的脑电原始信号进行微分熵特征提取

首先，将脑电原始信号通过带通滤波分解为δ(1-4Hz)、θ(4-8Hz)、α(8-14Hz)、β(14-31Hz)和γ(31-50Hz)五个频段。假设脑电信号服从高斯分布，则微分熵(DE)公式可以化简为：

式中：a和b表示提取从a到b这段脑电信号的微分熵的起始采样点和终点；σ为标准差；x为脑电信号采样点；μ为均值；

然后通过合并频段和通道即可得到微分熵特征，记为X＝(X₁,X₂,…,X₁₅)∈R¹⁵ ^×N×5c，其对应的标签记为Y＝(Y₁,Y₂,…,Y₁₅)∈R^15×N，其中N表示一个被试的样本数量。

(4)初始化两个子神经网络M₁和M₂。在被试数据中遍历选择一个被试数据X_i作为目标域T，其他被试作为源域S＝(S₁,…,S_i-1,S_i+1,…,S₁₅)；

(5)从源域数据中随机抽取不同被试分别记为S_i和S_j，然后再与目标域数据T共同作为两个子神经网络的输入；

(6)通过式(3)计算子神经网络一M₁关于源域数据S_i上的交叉熵损失函数，更换式(3)相应参数计算子神经网络二M₂关于源域数据S_j上的交叉熵损失函数；

(7)通过式(4)计算子神经网络二M₂指导子神经网络一M₁产生的协作损失函数，更换式(4)相应参数计算子神经网络一M₁指导子神经网络二M₂产生的协作损失函数；

(8)通过式(5)-(13)对子神经网络应用动态分布自适应进行优化，降低源域与目标域的分布差异；在本实施例中，总训练轮数为100轮；

(9)通过式(1)计算子神经网络一M₁的目标函数一，更换式(1)相应参数计算子神经网络二M₂的目标函数二，

(10)通过式(2)计算情绪识别模型的损失函数，根据所述情绪识别模型的损失函数优化e₁，c₁，e₂，c₂；

(11)重复步骤(5)-(10)直到两个子神经网络均已遍历完当前源域；

(12)重复步骤(4)-(11)直到目标域遍历完所有被试数据，此时获得的神经网络结构即为能够进行跨被试情绪识别的跨被试情绪识别模型。

实施例2

本实施例提供了一种跨被试情绪识别模型，采用实施例1所述的跨被试情绪识别模型的训练方法训练而成。

实施例3

本实施例提供了一种跨被试情绪识别方法，采用实施例2所述的跨被试情绪识别模型进行跨被试情绪识别。

在一个具体的实施例中，采用本发明所述跨被试情绪识别方法以及现有跨被试情绪识别方法进行脑电跨被试情绪识别，在SEED和SEED-IV均做了15次留一验证，即在15个被试中，有一个被试被当做目标域数据，剩余的14个被试作为源域数据进行预测得到一次预测结果，遍历选择不同被试作为目标域数据重复15次，最终结果取15次留一验证预测结果的平均值，识别结果如表1所示：

表1SEED和SEED-IV上不同方法的跨被试情绪识别平均结果

从表1可以看出，本发明在数据集SEED上平均分类准确率达到90.08％，在数据集SEED-IV上平均分类准确率达到77.55％，均优于现有情绪识别方法。

实施例4

本实施例提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现实施例1所述的跨被试情绪识别模型的训练方法或实施例3所述的跨被试情绪识别方法。

需要说明的是，所述存储器和所述处理器均为现有技术，具体结构在此不再赘述。

实施例5

本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的跨被试情绪识别模型的训练方法或上述所述的跨被试情绪识别方法。

在一个具体的实施例中，所述计算机可读存储介质为便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件中的任意一种或多种。

在另一个具体的实施例中，所述计算机可读存储介质为一种程序产品的形式，包括程序代码；当所述程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行实现实施例1所述的跨被试情绪识别模型的训练方法或实施例3所述的跨被试情绪识别方法。需要说明的是，所述程序产品的程序代码可以采用一种或多种程序设计语言进行编写。

综上所述，本发明能够更准确地识别脑电情绪。与现有技术相比，本发明具有显著的进步。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明，任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内，当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例，但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种跨被试情绪识别模型的训练方法，其特征在于，所述训练方法基于神经网络结构实现，所述神经网络结构包括两个独立且结构相同的子神经网络一和子神经网络二，两个子神经网络均包括一个编码器和一个分类器，所述编码器用于进行特征提取，并将提取的特征输入到所述分类器中，所述分类器用于完成预测；

所述训练方法包括以下步骤：

S4：以相同的方法建立所述子神经网络一的目标函数一和所述子神经网络二的目标函数二；所述子神经网络一的目标函数一为：

式中：为跨被试情绪识别模型的损失函数；/>为子神经网络二的目标函数二；

2.根据权利要求1所述的跨被试情绪识别模型的训练方法，其特征在于，所述子神经网络一关于源域数据S_i上的交叉熵损失函数为：

3.根据权利要求1所述的跨被试情绪识别模型的训练方法，其特征在于，所述子神经网络二指导子神经网络一产生的协作损失函数为：

式中：k为批大小；为源域数据S_j经过子神经网络二的编码器得到的特征；/>为源域数据S_j经过子神经网络一的编码器得到的特征；/>为目标域数据T经过子神经网络二的编码器得到的特征；/>为目标域数据T经过子神经网络一的编码器得到的特征。

4.根据权利要求1所述的跨被试情绪识别模型的训练方法，其特征在于，所述动态对齐目标域数据和源域数据之间的边缘分布和条件分布的函数为：

5.根据权利要求4所述的跨被试情绪识别模型的训练方法，其特征在于，所述关于训练轮数的单调递减函数α为：

式中：e为自然常数；epoch为当前训练轮数；N为总训练轮数。

6.根据权利要求4或5所述的跨被试情绪识别模型的训练方法，其特征在于，所述减少目标域数据和源域数据的边缘分布通过下式进行计算：

7.一种跨被试情绪识别模型，其特征在于，采用权利要求1-6中任意一项所述的跨被试情绪识别模型的训练方法训练而成。

8.一种跨被试情绪识别方法，其特征在于，采用权利要求7所述的跨被试情绪识别模型进行跨被试情绪识别。

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1-6中任一项所述的跨被试情绪识别模型的训练方法或权利要求8所述的跨被试情绪识别方法。