CN115590530A

CN115590530A - 跨对象目标域代理子域适应方法、系统及介质

Info

Publication number: CN115590530A
Application number: CN202211350636.XA
Authority: CN
Inventors: 伍冬睿; 王紫薇
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2022-10-31
Filing date: 2022-10-31
Publication date: 2023-01-13
Anticipated expiration: 2042-10-31
Also published as: CN115590530B

Abstract

本发明公开了一种跨对象目标域代理子域适应方法、系统及介质，属于机器学习领域，方法包括：采用上采样技术将不平衡数据集转化为平衡数据集并生成相应的域标签；对于任一平衡数据集，计算目标域中所有样本在其上的预测概率的和，得到其与目标域的相似度；将前M’个最大相似度对应的平衡数据集拼接以得到最优源域，将最大相似度对应的平衡数据集作为目标域代理；对目标域和最优源域进行全局域适应，计算域适应损失，对最优源域和目标域代理进行子域适应，计算子域适应损失；利用交叉熵函数计算分类损失，根据域适应损失、子域适应损失和分类损失计算总体损失；以总体损失收敛为目标，反向传播更新源域模型的参数。提升癫痫电信号分类的准确度。

Description

跨对象目标域代理子域适应方法、系统及介质

技术领域

本发明属于机器学习领域，更具体地，涉及一种跨对象目标域代理子域适应方法、系统及介质。

背景技术

癫痫是大脑神经元突发性异常放电，导致大脑短暂功能障碍的慢性脑部电生理疾病。相对于传统依赖于医生的视觉检测和手动标注脑电信号的方法，基于脑电图(Electroencephalogram，EEG)的癫痫自动检测技术可以减少人力标注成本，且能减少医生主观判断带来的误差。迁移学习技术可以有效缓解癫痫脑电信号的非平稳性和被试的高度差异性问题，它使用来自一个或多个已有的辅助患者的脑电数据/模型(源域)来帮助完成目标患者脑电数据(目标域)的分类或回归任务。

然而，直接将无监督迁移学习用于跨对象癫痫自动检测中存在以下问题：由于脑电数据具有高度的不平稳性及个体差异性，不同个体之间可能存在较大差异，当有多个源域时，不是所有的源域都对目标域任务有正向作用，使用和目标域不相关的源域数据训练模型会带来负迁移；由于无监督场景下缺少目标域标签信息，现有研究较少关注子域适应且不能有效利用源域信息，导致一些更加细粒度的信息没有被挖掘；类别不平衡对模型性能的负面影响，具体地，癫痫检测任务中，正样本(发作期)的数量远低于负样本(非发作期)的数量，使得训练模型时对多数类样本有偏向性，从而导致在测试时模型性能下降。

发明内容

针对现有技术的缺陷和改进需求，本发明提供了一种跨对象目标域代理子域适应方法、系统及介质，其目的在于解决无监督场景下跨对象癫痫检测的目标域标签缺失、负迁移、以及类别不平衡问题，从而提升癫痫电信号分类的准确度。

为实现上述目的，按照本发明的一个方面，提供了一种跨对象目标域代理子域适应方法，包括：S1，对原始脑电数据依次进行预处理、特征提取以及类别平衡处理，得到多个平衡数据集，并为每一所述平衡数据集生成相应的域标签；S2，对于任一平衡数据集，计算目标域中所有样本在所述平衡数据集上的预测概率的和，从而得到所述平衡数据集与所述目标域的相似度；S3，将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域，将最大相似度对应的平衡数据集作为目标域代理，M’为大于1的预设值；S4，对所述目标域和所述最优源域进行全局域适应，计算域适应损失，对所述最优源域和所述目标域代理进行子域适应，计算子域适应损失；S5，利用交叉熵函数计算分类损失，并根据所述域适应损失、所述子域适应损失和所述分类损失计算总体损失；S6，以所述总体损失收敛为目标，反向传播更新源域模型的模型参数，得到最终的源域模型。

更进一步地，还包括分类阶段：利用最终的源域模型对所述目标域中的样本进行分类，输出相应的分类标签，所述分类标签用于表征所述目标域中的样本是否对应癫痫发作期。

更进一步地，所述S4中进行子域适应还包括：利用所述最优源域的域标签和所述目标域代理的域标签，计算目标域代理最大均值差异度量；利用所述目标域代理最大均值差异度量，对所述最优源域和所述目标域代理进行细粒度子域适应。

更进一步地，所述目标域代理最大均值差异度量为：

其中，

为目标域代理最大均值差异度量，p、q分别为最优源域、目标域代理中数据的概率分布，ω_k为目标域代理和目标域之间的相似度，E_p(c)表示对最优源域的c类样本的条件概率分布求期望，E_q(c)示对目标域代理的c类样本的条件概率分布求期望，φ(·)为将原始样本映射到可再生希尔伯特空间的特征映射函数，x_s为最优源域的样本，x_ta为目标域代理的样本，E_c(·)表示期望函数，

表示求平方。

更进一步地，所述S4中进行细粒度子域适应包括：以所述目标域代理最大均值差异度量最小为目标进行优化，以令所述最优源域和所述目标域中相同类别的子域彼此对齐，不同类别的子域彼此远离。

更进一步地，所述相似度为：

其中，ω_m为第m个平衡数据集与目标域的相似度，m＝1,2,…,M，M为所述平衡数据集的总个数，n_t为所述目标域中样本的总个数，

为

在第m个平衡数据集上预测得到的标签，

为所述目标域中第i个样本，

为

在第m个平衡数据集上的预测概率。

更进一步地，所述总体损失为：

其中，

为所述总体损失，

为所述分类损失，

为所述域适应损失，

为所述子域适应损失，λ₁为第一损失参数，λ₂为第二损失参数。

更进一步地，所述S6中反向传播更新源域模型的模型参数为：

其中，θ为所述源域模型的模型参数，α为学习率，f_θ为所述源域模型，

为所述源域模型的总体损失。

按照本发明的另一个方面，提供了一种跨对象目标域代理子域适应系统，包括：处理及生成模块，用于对原始脑电数据依次进行预处理、特征提取以及类别平衡处理，得到多个平衡数据集，并为每一所述平衡数据集生成相应的域标签；相似度计算模块，用于对于任一平衡数据集，计算目标域中所有样本在所述平衡数据集上的预测概率的和，从而得到所述平衡数据集与所述目标域的相似度；最优源域及目标域代理生成模块，用于将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域，将最大相似度对应的平衡数据集作为目标域代理，M’为大于1的预设值；适应模块，用于对所述目标域和所述最优源域进行全局域适应，计算域适应损失，对所述最优源域和所述目标域代理进行子域适应，计算子域适应损失；损失计算模块，用于利用交叉熵函数计算分类损失，并根据所述域适应损失、所述子域适应损失和所述分类损失计算总体损失；更新模块，用于以所述总体损失收敛为目标，反向传播更新源域模型的模型参数，得到最终的源域模型。

按照本发明的另一个方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如上所述的跨对象目标域代理子域适应方法。

总体而言，通过本发明所构思的以上技术方案，能够取得以下有益效果：

(1)考虑多源域适应的场景，提出基于域相关性的源域选择方法，通过选择更相关的源域组成最优源域并作为训练集，更好地利用了相关性较高的源域数据，避免了不相关源域数据对模型训练造成的负迁移影响；此外，考虑数据集的类别不平衡问题，使用少数类别上采样，以克服类别不平衡的影响；

(2)目标域代理子域适应网络(Target Agent Subdomain Adaptation Network，TASAN)方法选出了相关性更大的源域进行迁移，进一步减少了学习过程中的负迁移影响，TASAN选择目标域代理，利用其已知标签信息和最优源域进行更细粒度的子域对齐，在实现最优源域和目标域的全局域适应的同时，实现了最优源域和目标域代理的子域适应；

(3)针对源域输入及模型优化方式进行改进，可以实现更精准的跨对象无标签迁移，适用于有辅助对象数据的常见癫痫检测场景，方法简单，可扩展性强。

附图说明

图1为本发明实施例提供的跨对象目标域代理子域适应方法的流程图；

图2为本发明实施例提供的使用TASAN进行跨对象癫痫检测的框架图；

图3为本发明实施例提供的跨对象目标域代理子域适应系统的框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

在本发明中，本发明及附图中的术语“第一”、“第二”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

图1为本发明实施例提供的跨对象目标域代理子域适应方法的流程图。参阅图1，结合图2，对本实施例中跨对象目标域代理子域适应方法进行详细说明，方法包括操作S1-操作S6，主要包括基于人工神经网络优化的目标域代理子域适应方法、源域选择方法、平衡采样方法，整体框架如图2所示。

操作S1，对原始脑电数据依次进行预处理、特征提取以及类别平衡处理，得到多个平衡数据集，并为每一平衡数据集生成相应的域标签。

具体地，对原始脑电数据依次进行滤波、滑窗等预处理，对预处理后每个通道内的脑电数据提取时域、频域、时频域以及非线性特征，使用合成样本上采样技术(SyntheticMinority Over-sampling Technique，SMOTE)对特征提取后的训练集进行类别平衡处理，得到多个平衡数据集，该多个平衡数据集为最初的源域，将该多个平衡数据集的总个数记为M。通过数据集平衡采样，克服训练中类别不平衡的影响，再在类别平衡的基础上进行后续的一系列实验。

由此，得到M个源域D_m，每个源域

包括n_m个带标签(0类：非发作期；1类：发作期)的样本。进一步地，将M个平衡数据集拼在一起作为整体的源域

并根据每个域的代号生成对应的域标签。对于这M个平衡数据集而言，其域标签分别为1,2,…,M。目标域为

操作S2，对于任一平衡数据集，计算目标域中所有样本在平衡数据集上的预测概率的和，从而得到平衡数据集与目标域的相似度。

优选地，对于任一平衡数据集m，使用逻辑回归分类器计算目标域中所有样本在平衡数据集上的预测概率的和

进而计算平衡数据集m与目标域的相似度ω_m：

其中，ω_m为第m个平衡数据集与目标域的相似度，m＝1,2,…,M，M为平衡数据集的总个数，n_t为目标域中样本的总个数，

为

在第m个平衡数据集上预测得到的标签，

为目标域中第i个样本，

为

在第m个平衡数据集上的预测概率。

操作S3，将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域，将最大相似度对应的平衡数据集作为目标域代理，M’为大于1的预设值。

根据ω_m值的大小，选择最大的前M’个平衡数据集进行拼接，得到最优源域D_s′；选择相似度最大的一个平衡数据集作为目标域代理D_ta。

本实施例中，通过提升源域数据质量，以减少跨域训练中的负迁移。具体地，基于先验知识和域相关性提出三种源域选择方法：基于发作位置的源域选择方法(FL-SS)、基于癫痫发作亚型的源域选择方法(ST-SS)、基于域相关性的源域选择方法(DS-SS)。一方面，利用先验知识进行源域选择时，根据发作位置/发作亚型的不同，将所有源域划分到不同的子集，进而在各个子集中进行跨被试迁移；另一方面，计算相似度进行源域选择时，按照相似度大小选择最相关的一些源域拼在一起组成训练数据，不使用其他不相关的源域数据，将相关性最大的源域定义为目标域代理(Target Agent，TA)，用于后续开展的子域适应。DS-SS方法不访问任何先验知识和发作标签信息，只使用每个域的代号作为域标签，是一种无监督的源域选择方法。

通过目标域代理子域适应方法，以更好地挖掘细粒度特征。具体地，提出目标域代理子域适应(Target Agent Subdomain Adaptation，TASA)方法，以解决全局域适应的局限性以及目标域错误伪标签的负面影响。该方法基于上述源域选择(DS-SS)方法得到的TA，利用TA中可访问的标签信息，以避免直接使用模型预测的目标域伪标签。然后，基于传统的MMD(Maximum Mean Discrepancy)加入TA的标签信息和域相关性信息，设计目标域代理最大均值差异(Target Agent Maximum Mean Discrepancy，TAMMD)度量，再利用TAMMD在TA和最优源域数据之间进行更加细粒度的子域适应，通过缩小各个子域的差异进一步实现源域和目标域的对齐。将目标域全局域适应和子域适应结合起来，提升迁移的效果。

操作S4，对目标域和最优源域进行全局域适应，计算域适应损失，对最优源域和目标域代理进行子域适应，计算子域适应损失。

具体地，操作S4包括子操作S41-子操作S42。

在子操作S41中，对无标签信息的目标域D_t和有标签信息的最优源域D_s′进行全局域适应，计算域适应损失

在子操作S42中，对有标签信息的最优源域D_s′和有标签信息的目标域代理D_ta进行子域适应，计算子域适应损失

根据本发明的实施例，进行子域适应还包括：利用最优源域D_s′的域标签和目标域代理D_ta的域标签，计算目标域代理最大均值差异度量；利用目标域代理最大均值差异度量，对最优源域D_s′的域标签和目标域代理D_ta进行细粒度子域适应。

计算得到的目标域代理最大均值差异度量为：

其中，

为目标域代理最大均值差异度量，p、q分别为最优源域、目标域代理中数据的概率分布，ω_k为目标域代理和目标域之间的相似度，

表示对最优源域的c类样本的条件概率分布求期望，

示对目标域代理的c类样本的条件概率分布求期望，φ(·)为将原始样本映射到可再生希尔伯特空间的特征映射函数，x_s为最优源域的样本，x_ta为目标域代理的样本，E_c(·)表示期望函数，

表示求平方。

根据本发明的实施例，上述进行细粒度子域适应包括：以目标域代理最大均值差异度量最小为目标进行优化，以令最优源域和目标域中相同类别的子域彼此对齐，不同类别的子域彼此远离。

操作S5，利用交叉熵函数计算分类损失，并根据域适应损失、子域适应损失和分类损失计算总体损失。

最终计算得到的总体损失为：

其中，

为总体损失，

为分类损失，

为域适应损失，

为子域适应损失，λ₁为第一损失参数，λ₂为第二损失参数。

操作S6，以总体损失收敛为目标，反向传播更新源域模型的模型参数，得到最终的源域模型。

根据本发明的实施例，反向传播更新源域模型的模型参数为：

其中，θ为源域模型的模型参数，α为学习率，f_θ为源域模型，

为源域模型的总体损失。

根据本发明的实施例，方法还包括分类阶段：利用最终的源域模型f_θ对目标域D_t中的样本

进行分类，输出相应的分类标签，分类标签用于表征目标域D_t中的各样本

是否对应癫痫发作期。

本实施例中，在赫尔辛基大学医院新生儿重症监护室(NICU)数据集上进行跨对象实验，实验结果如表1所示。

表1

此外，还在华中科技大学同济医学院附属武汉儿童医院(CHSZ)数据集上进行跨对象实验，实验结果如表2所示。

表2

参阅表1和表2，可以看出，子域适应(TASA)和源域选择(DS-SS)策略都有效果。其中，同时使用子域适应和源域选择的TASA-DS方法效果最好，优于仅使用TASA和仅使用DS-SS的方法。从结果上看，在NICU数据集上的AUC分数比基准方法提升了10.91％，在CHSZ数据集上的AUC分数比基准方法提升了4.96％。在两个数据集上的结果表明，本发明实施例所提方法实现了多源域适应场景下的子域适应和源域选择的改进，有效提升了跨对象癫痫检测的性能。

图3为本发明实施例提供的跨对象目标域代理子域适应系统的框图。参阅图3，跨对象目标域代理子域适应系统300包括处理及生成模块310、相似度计算模块320、最优源域及目标域代理生成模块330、适应模块340、损失计算模块350以及更新模块360。

处理及生成模块310例如执行操作S1，用于对原始脑电数据依次进行预处理、特征提取以及类别平衡处理，得到多个平衡数据集，并为每一平衡数据集生成相应的域标签。

相似度计算模块320例如执行操作S2，用于对于任一平衡数据集，计算目标域中所有样本在平衡数据集上的预测概率的和，从而得到平衡数据集与目标域的相似度。

最优源域及目标域代理生成模块330例如执行操作S3，用于将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域，将最大相似度对应的平衡数据集作为目标域代理，M’为大于1的预设值。

适应模块340例如执行操作S4，用于对目标域和最优源域进行全局域适应，计算域适应损失，对最优源域和目标域代理进行子域适应，计算子域适应损失。

损失计算模块350例如执行操作S5，用于利用交叉熵函数计算分类损失，并根据域适应损失、子域适应损失和分类损失计算总体损失。

更新模块360例如执行操作S6，用于以总体损失收敛为目标，反向传播更新源域模型的模型参数，得到最终的源域模型。

跨对象目标域代理子域适应系统300用于执行上述图1-图2所示实施例中跨对象目标域代理子域适应方法。

本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述图1-图2所示实施例中跨对象目标域代理子域适应方法。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种跨对象目标域代理子域适应方法，其特征在于，包括：

S1，对原始脑电数据依次进行预处理、特征提取以及类别平衡处理，得到多个平衡数据集，并为每一所述平衡数据集生成相应的域标签；

S2，对于任一平衡数据集，计算目标域中所有样本在所述平衡数据集上的预测概率的和，从而得到所述平衡数据集与所述目标域的相似度；

S3，将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域，将最大相似度对应的平衡数据集作为目标域代理，M’为大于1的预设值；

S4，对所述目标域和所述最优源域进行全局域适应，计算域适应损失，对所述最优源域和所述目标域代理进行子域适应，计算子域适应损失；

S5，利用交叉熵函数计算分类损失，并根据所述域适应损失、所述子域适应损失和所述分类损失计算总体损失；

S6，以所述总体损失收敛为目标，反向传播更新源域模型的模型参数，得到最终的源域模型。

2.如权利要求1所述的跨对象目标域代理子域适应方法，其特征在于，还包括分类阶段：利用最终的源域模型对所述目标域中的样本进行分类，输出相应的分类标签，所述分类标签用于表征所述目标域中的样本是否对应癫痫发作期。

3.如权利要求1所述的跨对象目标域代理子域适应方法，其特征在于，所述S4中进行子域适应还包括：

利用所述最优源域的域标签和所述目标域代理的域标签，计算目标域代理最大均值差异度量；

利用所述目标域代理最大均值差异度量，对所述最优源域和所述目标域代理进行细粒度子域适应。

4.如权利要求3所述的跨对象目标域代理子域适应方法，其特征在于，所述目标域代理最大均值差异度量为：

其中，

表示对最优源域的c类样本的条件概率分布求期望，

表示求平方。

5.如权利要求3所述的跨对象目标域代理子域适应方法，其特征在于，所述S4中进行细粒度子域适应包括：以所述目标域代理最大均值差异度量最小为目标进行优化，以令所述最优源域和所述目标域中相同类别的子域彼此对齐，不同类别的子域彼此远离。

6.如权利要求1所述的跨对象目标域代理子域适应方法，其特征在于，所述相似度为：

为

在第m个平衡数据集上预测得到的标签，

为所述目标域中第i个样本，

为

在第m个平衡数据集上的预测概率。

7.如权利要求1所述的跨对象目标域代理子域适应方法，其特征在于，所述总体损失为：

其中，

为所述总体损失，

为所述分类损失，

为所述域适应损失，

8.如权利要求1-7任一项所述的跨对象目标域代理子域适应方法，其特征在于，所述S6中反向传播更新源域模型的模型参数为：

为所述源域模型的总体损失。

9.一种跨对象目标域代理子域适应系统，其特征在于，包括：

处理及生成模块，用于对原始脑电数据依次进行预处理、特征提取以及类别平衡处理，得到多个平衡数据集，并为每一所述平衡数据集生成相应的域标签；

相似度计算模块，用于对于任一平衡数据集，计算目标域中所有样本在所述平衡数据集上的预测概率的和，从而得到所述平衡数据集与所述目标域的相似度；

最优源域及目标域代理生成模块，用于将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域，将最大相似度对应的平衡数据集作为目标域代理，M’为大于1的预设值；

适应模块，用于对所述目标域和所述最优源域进行全局域适应，计算域适应损失，对所述最优源域和所述目标域代理进行子域适应，计算子域适应损失；

损失计算模块，用于利用交叉熵函数计算分类损失，并根据所述域适应损失、所述子域适应损失和所述分类损失计算总体损失；

更新模块，用于以所述总体损失收敛为目标，反向传播更新源域模型的模型参数，得到最终的源域模型。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-8任一项所述的跨对象目标域代理子域适应方法。