CN115590530A - 跨对象目标域代理子域适应方法、系统及介质 - Google Patents

跨对象目标域代理子域适应方法、系统及介质 Download PDF

Info

Publication number
CN115590530A
CN115590530A CN202211350636.XA CN202211350636A CN115590530A CN 115590530 A CN115590530 A CN 115590530A CN 202211350636 A CN202211350636 A CN 202211350636A CN 115590530 A CN115590530 A CN 115590530A
Authority
CN
China
Prior art keywords
domain
loss
target
adaptation
target domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211350636.XA
Other languages
English (en)
Other versions
CN115590530B (zh
Inventor
伍冬睿
王紫薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202211350636.XA priority Critical patent/CN115590530B/zh
Publication of CN115590530A publication Critical patent/CN115590530A/zh
Application granted granted Critical
Publication of CN115590530B publication Critical patent/CN115590530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • A61B5/372Analysis of electroencephalograms
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4094Diagnosing or monitoring seizure diseases, e.g. epilepsy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physics & Mathematics (AREA)
  • Psychiatry (AREA)
  • Neurology (AREA)
  • Psychology (AREA)
  • Neurosurgery (AREA)
  • Physiology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种跨对象目标域代理子域适应方法、系统及介质,属于机器学习领域,方法包括:采用上采样技术将不平衡数据集转化为平衡数据集并生成相应的域标签;对于任一平衡数据集,计算目标域中所有样本在其上的预测概率的和,得到其与目标域的相似度;将前M’个最大相似度对应的平衡数据集拼接以得到最优源域,将最大相似度对应的平衡数据集作为目标域代理;对目标域和最优源域进行全局域适应,计算域适应损失,对最优源域和目标域代理进行子域适应,计算子域适应损失;利用交叉熵函数计算分类损失,根据域适应损失、子域适应损失和分类损失计算总体损失;以总体损失收敛为目标,反向传播更新源域模型的参数。提升癫痫电信号分类的准确度。

Description

跨对象目标域代理子域适应方法、系统及介质
技术领域
本发明属于机器学习领域,更具体地,涉及一种跨对象目标域代理子域适应方法、系统及介质。
背景技术
癫痫是大脑神经元突发性异常放电,导致大脑短暂功能障碍的慢性脑部电生理疾病。相对于传统依赖于医生的视觉检测和手动标注脑电信号的方法,基于脑电图(Electroencephalogram,EEG)的癫痫自动检测技术可以减少人力标注成本,且能减少医生主观判断带来的误差。迁移学习技术可以有效缓解癫痫脑电信号的非平稳性和被试的高度差异性问题,它使用来自一个或多个已有的辅助患者的脑电数据/模型(源域)来帮助完成目标患者脑电数据(目标域)的分类或回归任务。
然而,直接将无监督迁移学习用于跨对象癫痫自动检测中存在以下问题:由于脑电数据具有高度的不平稳性及个体差异性,不同个体之间可能存在较大差异,当有多个源域时,不是所有的源域都对目标域任务有正向作用,使用和目标域不相关的源域数据训练模型会带来负迁移;由于无监督场景下缺少目标域标签信息,现有研究较少关注子域适应且不能有效利用源域信息,导致一些更加细粒度的信息没有被挖掘;类别不平衡对模型性能的负面影响,具体地,癫痫检测任务中,正样本(发作期)的数量远低于负样本(非发作期)的数量,使得训练模型时对多数类样本有偏向性,从而导致在测试时模型性能下降。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种跨对象目标域代理子域适应方法、系统及介质,其目的在于解决无监督场景下跨对象癫痫检测的目标域标签缺失、负迁移、以及类别不平衡问题,从而提升癫痫电信号分类的准确度。
为实现上述目的,按照本发明的一个方面,提供了一种跨对象目标域代理子域适应方法,包括:S1,对原始脑电数据依次进行预处理、特征提取以及类别平衡处理,得到多个平衡数据集,并为每一所述平衡数据集生成相应的域标签;S2,对于任一平衡数据集,计算目标域中所有样本在所述平衡数据集上的预测概率的和,从而得到所述平衡数据集与所述目标域的相似度;S3,将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域,将最大相似度对应的平衡数据集作为目标域代理,M’为大于1的预设值;S4,对所述目标域和所述最优源域进行全局域适应,计算域适应损失,对所述最优源域和所述目标域代理进行子域适应,计算子域适应损失;S5,利用交叉熵函数计算分类损失,并根据所述域适应损失、所述子域适应损失和所述分类损失计算总体损失;S6,以所述总体损失收敛为目标,反向传播更新源域模型的模型参数,得到最终的源域模型。
更进一步地,还包括分类阶段:利用最终的源域模型对所述目标域中的样本进行分类,输出相应的分类标签,所述分类标签用于表征所述目标域中的样本是否对应癫痫发作期。
更进一步地,所述S4中进行子域适应还包括:利用所述最优源域的域标签和所述目标域代理的域标签,计算目标域代理最大均值差异度量;利用所述目标域代理最大均值差异度量,对所述最优源域和所述目标域代理进行细粒度子域适应。
更进一步地,所述目标域代理最大均值差异度量为:
Figure BDA0003918779270000031
其中,
Figure BDA0003918779270000032
为目标域代理最大均值差异度量,p、q分别为最优源域、目标域代理中数据的概率分布,ωk为目标域代理和目标域之间的相似度,Ep(c)表示对最优源域的c类样本的条件概率分布求期望,Eq(c)示对目标域代理的c类样本的条件概率分布求期望,φ(·)为将原始样本映射到可再生希尔伯特空间的特征映射函数,xs为最优源域的样本,xta为目标域代理的样本,Ec(·)表示期望函数,
Figure BDA0003918779270000033
表示求平方。
更进一步地,所述S4中进行细粒度子域适应包括:以所述目标域代理最大均值差异度量最小为目标进行优化,以令所述最优源域和所述目标域中相同类别的子域彼此对齐,不同类别的子域彼此远离。
更进一步地,所述相似度为:
Figure BDA0003918779270000034
其中,ωm为第m个平衡数据集与目标域的相似度,m=1,2,…,M,M为所述平衡数据集的总个数,nt为所述目标域中样本的总个数,
Figure BDA0003918779270000035
Figure BDA0003918779270000036
在第m个平衡数据集上预测得到的标签,
Figure BDA0003918779270000037
为所述目标域中第i个样本,
Figure BDA0003918779270000038
Figure BDA0003918779270000039
在第m个平衡数据集上的预测概率。
更进一步地,所述总体损失为:
Figure BDA00039187792700000310
其中,
Figure BDA00039187792700000311
为所述总体损失,
Figure BDA00039187792700000312
为所述分类损失,
Figure BDA00039187792700000313
为所述域适应损失,
Figure BDA00039187792700000314
为所述子域适应损失,λ1为第一损失参数,λ2为第二损失参数。
更进一步地,所述S6中反向传播更新源域模型的模型参数为:
Figure BDA00039187792700000315
其中,θ为所述源域模型的模型参数,α为学习率,fθ为所述源域模型,
Figure BDA00039187792700000316
为所述源域模型的总体损失。
按照本发明的另一个方面,提供了一种跨对象目标域代理子域适应系统,包括:处理及生成模块,用于对原始脑电数据依次进行预处理、特征提取以及类别平衡处理,得到多个平衡数据集,并为每一所述平衡数据集生成相应的域标签;相似度计算模块,用于对于任一平衡数据集,计算目标域中所有样本在所述平衡数据集上的预测概率的和,从而得到所述平衡数据集与所述目标域的相似度;最优源域及目标域代理生成模块,用于将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域,将最大相似度对应的平衡数据集作为目标域代理,M’为大于1的预设值;适应模块,用于对所述目标域和所述最优源域进行全局域适应,计算域适应损失,对所述最优源域和所述目标域代理进行子域适应,计算子域适应损失;损失计算模块,用于利用交叉熵函数计算分类损失,并根据所述域适应损失、所述子域适应损失和所述分类损失计算总体损失;更新模块,用于以所述总体损失收敛为目标,反向传播更新源域模型的模型参数,得到最终的源域模型。
按照本发明的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的跨对象目标域代理子域适应方法。
总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:
(1)考虑多源域适应的场景,提出基于域相关性的源域选择方法,通过选择更相关的源域组成最优源域并作为训练集,更好地利用了相关性较高的源域数据,避免了不相关源域数据对模型训练造成的负迁移影响;此外,考虑数据集的类别不平衡问题,使用少数类别上采样,以克服类别不平衡的影响;
(2)目标域代理子域适应网络(Target Agent Subdomain Adaptation Network,TASAN)方法选出了相关性更大的源域进行迁移,进一步减少了学习过程中的负迁移影响,TASAN选择目标域代理,利用其已知标签信息和最优源域进行更细粒度的子域对齐,在实现最优源域和目标域的全局域适应的同时,实现了最优源域和目标域代理的子域适应;
(3)针对源域输入及模型优化方式进行改进,可以实现更精准的跨对象无标签迁移,适用于有辅助对象数据的常见癫痫检测场景,方法简单,可扩展性强。
附图说明
图1为本发明实施例提供的跨对象目标域代理子域适应方法的流程图;
图2为本发明实施例提供的使用TASAN进行跨对象癫痫检测的框架图;
图3为本发明实施例提供的跨对象目标域代理子域适应系统的框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
在本发明中,本发明及附图中的术语“第一”、“第二”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
图1为本发明实施例提供的跨对象目标域代理子域适应方法的流程图。参阅图1,结合图2,对本实施例中跨对象目标域代理子域适应方法进行详细说明,方法包括操作S1-操作S6,主要包括基于人工神经网络优化的目标域代理子域适应方法、源域选择方法、平衡采样方法,整体框架如图2所示。
操作S1,对原始脑电数据依次进行预处理、特征提取以及类别平衡处理,得到多个平衡数据集,并为每一平衡数据集生成相应的域标签。
具体地,对原始脑电数据依次进行滤波、滑窗等预处理,对预处理后每个通道内的脑电数据提取时域、频域、时频域以及非线性特征,使用合成样本上采样技术(SyntheticMinority Over-sampling Technique,SMOTE)对特征提取后的训练集进行类别平衡处理,得到多个平衡数据集,该多个平衡数据集为最初的源域,将该多个平衡数据集的总个数记为M。通过数据集平衡采样,克服训练中类别不平衡的影响,再在类别平衡的基础上进行后续的一系列实验。
由此,得到M个源域Dm,每个源域
Figure BDA0003918779270000061
包括nm个带标签(0类:非发作期;1类:发作期)的样本。进一步地,将M个平衡数据集拼在一起作为整体的源域
Figure BDA0003918779270000062
并根据每个域的代号生成对应的域标签。对于这M个平衡数据集而言,其域标签分别为1,2,…,M。目标域为
Figure BDA0003918779270000063
操作S2,对于任一平衡数据集,计算目标域中所有样本在平衡数据集上的预测概率的和,从而得到平衡数据集与目标域的相似度。
优选地,对于任一平衡数据集m,使用逻辑回归分类器计算目标域中所有样本在平衡数据集上的预测概率的和
Figure BDA0003918779270000064
进而计算平衡数据集m与目标域的相似度ωm
Figure BDA0003918779270000065
其中,ωm为第m个平衡数据集与目标域的相似度,m=1,2,…,M,M为平衡数据集的总个数,nt为目标域中样本的总个数,
Figure BDA0003918779270000066
Figure BDA0003918779270000067
在第m个平衡数据集上预测得到的标签,
Figure BDA0003918779270000068
为目标域中第i个样本,
Figure BDA0003918779270000069
Figure BDA00039187792700000610
在第m个平衡数据集上的预测概率。
操作S3,将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域,将最大相似度对应的平衡数据集作为目标域代理,M’为大于1的预设值。
根据ωm值的大小,选择最大的前M’个平衡数据集进行拼接,得到最优源域Ds′;选择相似度最大的一个平衡数据集作为目标域代理Dta
本实施例中,通过提升源域数据质量,以减少跨域训练中的负迁移。具体地,基于先验知识和域相关性提出三种源域选择方法:基于发作位置的源域选择方法(FL-SS)、基于癫痫发作亚型的源域选择方法(ST-SS)、基于域相关性的源域选择方法(DS-SS)。一方面,利用先验知识进行源域选择时,根据发作位置/发作亚型的不同,将所有源域划分到不同的子集,进而在各个子集中进行跨被试迁移;另一方面,计算相似度进行源域选择时,按照相似度大小选择最相关的一些源域拼在一起组成训练数据,不使用其他不相关的源域数据,将相关性最大的源域定义为目标域代理(Target Agent,TA),用于后续开展的子域适应。DS-SS方法不访问任何先验知识和发作标签信息,只使用每个域的代号作为域标签,是一种无监督的源域选择方法。
通过目标域代理子域适应方法,以更好地挖掘细粒度特征。具体地,提出目标域代理子域适应(Target Agent Subdomain Adaptation,TASA)方法,以解决全局域适应的局限性以及目标域错误伪标签的负面影响。该方法基于上述源域选择(DS-SS)方法得到的TA,利用TA中可访问的标签信息,以避免直接使用模型预测的目标域伪标签。然后,基于传统的MMD(Maximum Mean Discrepancy)加入TA的标签信息和域相关性信息,设计目标域代理最大均值差异(Target Agent Maximum Mean Discrepancy,TAMMD)度量,再利用TAMMD在TA和最优源域数据之间进行更加细粒度的子域适应,通过缩小各个子域的差异进一步实现源域和目标域的对齐。将目标域全局域适应和子域适应结合起来,提升迁移的效果。
操作S4,对目标域和最优源域进行全局域适应,计算域适应损失,对最优源域和目标域代理进行子域适应,计算子域适应损失。
具体地,操作S4包括子操作S41-子操作S42。
在子操作S41中,对无标签信息的目标域Dt和有标签信息的最优源域Ds′进行全局域适应,计算域适应损失
Figure BDA0003918779270000081
在子操作S42中,对有标签信息的最优源域Ds′和有标签信息的目标域代理Dta进行子域适应,计算子域适应损失
Figure BDA0003918779270000082
根据本发明的实施例,进行子域适应还包括:利用最优源域Ds′的域标签和目标域代理Dta的域标签,计算目标域代理最大均值差异度量;利用目标域代理最大均值差异度量,对最优源域Ds′的域标签和目标域代理Dta进行细粒度子域适应。
计算得到的目标域代理最大均值差异度量为:
Figure BDA0003918779270000083
其中,
Figure BDA0003918779270000084
为目标域代理最大均值差异度量,p、q分别为最优源域、目标域代理中数据的概率分布,ωk为目标域代理和目标域之间的相似度,
Figure BDA00039187792700000812
表示对最优源域的c类样本的条件概率分布求期望,
Figure BDA00039187792700000811
示对目标域代理的c类样本的条件概率分布求期望,φ(·)为将原始样本映射到可再生希尔伯特空间的特征映射函数,xs为最优源域的样本,xta为目标域代理的样本,Ec(·)表示期望函数,
Figure BDA0003918779270000085
表示求平方。
根据本发明的实施例,上述进行细粒度子域适应包括:以目标域代理最大均值差异度量最小为目标进行优化,以令最优源域和目标域中相同类别的子域彼此对齐,不同类别的子域彼此远离。
操作S5,利用交叉熵函数计算分类损失,并根据域适应损失、子域适应损失和分类损失计算总体损失。
最终计算得到的总体损失为:
Figure BDA0003918779270000086
其中,
Figure BDA0003918779270000087
为总体损失,
Figure BDA0003918779270000088
为分类损失,
Figure BDA0003918779270000089
为域适应损失,
Figure BDA00039187792700000810
为子域适应损失,λ1为第一损失参数,λ2为第二损失参数。
操作S6,以总体损失收敛为目标,反向传播更新源域模型的模型参数,得到最终的源域模型。
根据本发明的实施例,反向传播更新源域模型的模型参数为:
Figure BDA0003918779270000091
其中,θ为源域模型的模型参数,α为学习率,fθ为源域模型,
Figure BDA0003918779270000092
为源域模型的总体损失。
根据本发明的实施例,方法还包括分类阶段:利用最终的源域模型fθ对目标域Dt中的样本
Figure BDA0003918779270000093
进行分类,输出相应的分类标签,分类标签用于表征目标域Dt中的各样本
Figure BDA0003918779270000094
是否对应癫痫发作期。
本实施例中,在赫尔辛基大学医院新生儿重症监护室(NICU)数据集上进行跨对象实验,实验结果如表1所示。
表1
Figure BDA0003918779270000095
此外,还在华中科技大学同济医学院附属武汉儿童医院(CHSZ)数据集上进行跨对象实验,实验结果如表2所示。
表2
Figure BDA0003918779270000096
参阅表1和表2,可以看出,子域适应(TASA)和源域选择(DS-SS)策略都有效果。其中,同时使用子域适应和源域选择的TASA-DS方法效果最好,优于仅使用TASA和仅使用DS-SS的方法。从结果上看,在NICU数据集上的AUC分数比基准方法提升了10.91%,在CHSZ数据集上的AUC分数比基准方法提升了4.96%。在两个数据集上的结果表明,本发明实施例所提方法实现了多源域适应场景下的子域适应和源域选择的改进,有效提升了跨对象癫痫检测的性能。
图3为本发明实施例提供的跨对象目标域代理子域适应系统的框图。参阅图3,跨对象目标域代理子域适应系统300包括处理及生成模块310、相似度计算模块320、最优源域及目标域代理生成模块330、适应模块340、损失计算模块350以及更新模块360。
处理及生成模块310例如执行操作S1,用于对原始脑电数据依次进行预处理、特征提取以及类别平衡处理,得到多个平衡数据集,并为每一平衡数据集生成相应的域标签。
相似度计算模块320例如执行操作S2,用于对于任一平衡数据集,计算目标域中所有样本在平衡数据集上的预测概率的和,从而得到平衡数据集与目标域的相似度。
最优源域及目标域代理生成模块330例如执行操作S3,用于将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域,将最大相似度对应的平衡数据集作为目标域代理,M’为大于1的预设值。
适应模块340例如执行操作S4,用于对目标域和最优源域进行全局域适应,计算域适应损失,对最优源域和目标域代理进行子域适应,计算子域适应损失。
损失计算模块350例如执行操作S5,用于利用交叉熵函数计算分类损失,并根据域适应损失、子域适应损失和分类损失计算总体损失。
更新模块360例如执行操作S6,用于以总体损失收敛为目标,反向传播更新源域模型的模型参数,得到最终的源域模型。
跨对象目标域代理子域适应系统300用于执行上述图1-图2所示实施例中跨对象目标域代理子域适应方法。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述图1-图2所示实施例中跨对象目标域代理子域适应方法。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种跨对象目标域代理子域适应方法,其特征在于,包括:
S1,对原始脑电数据依次进行预处理、特征提取以及类别平衡处理,得到多个平衡数据集,并为每一所述平衡数据集生成相应的域标签;
S2,对于任一平衡数据集,计算目标域中所有样本在所述平衡数据集上的预测概率的和,从而得到所述平衡数据集与所述目标域的相似度;
S3,将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域,将最大相似度对应的平衡数据集作为目标域代理,M’为大于1的预设值;
S4,对所述目标域和所述最优源域进行全局域适应,计算域适应损失,对所述最优源域和所述目标域代理进行子域适应,计算子域适应损失;
S5,利用交叉熵函数计算分类损失,并根据所述域适应损失、所述子域适应损失和所述分类损失计算总体损失;
S6,以所述总体损失收敛为目标,反向传播更新源域模型的模型参数,得到最终的源域模型。
2.如权利要求1所述的跨对象目标域代理子域适应方法,其特征在于,还包括分类阶段:利用最终的源域模型对所述目标域中的样本进行分类,输出相应的分类标签,所述分类标签用于表征所述目标域中的样本是否对应癫痫发作期。
3.如权利要求1所述的跨对象目标域代理子域适应方法,其特征在于,所述S4中进行子域适应还包括:
利用所述最优源域的域标签和所述目标域代理的域标签,计算目标域代理最大均值差异度量;
利用所述目标域代理最大均值差异度量,对所述最优源域和所述目标域代理进行细粒度子域适应。
4.如权利要求3所述的跨对象目标域代理子域适应方法,其特征在于,所述目标域代理最大均值差异度量为:
Figure FDA0003918779260000021
其中,
Figure FDA0003918779260000022
为目标域代理最大均值差异度量,p、q分别为最优源域、目标域代理中数据的概率分布,ωk为目标域代理和目标域之间的相似度,
Figure FDA0003918779260000023
表示对最优源域的c类样本的条件概率分布求期望,
Figure FDA0003918779260000024
示对目标域代理的c类样本的条件概率分布求期望,φ(·)为将原始样本映射到可再生希尔伯特空间的特征映射函数,xs为最优源域的样本,xta为目标域代理的样本,Ec(·)表示期望函数,
Figure FDA0003918779260000025
表示求平方。
5.如权利要求3所述的跨对象目标域代理子域适应方法,其特征在于,所述S4中进行细粒度子域适应包括:以所述目标域代理最大均值差异度量最小为目标进行优化,以令所述最优源域和所述目标域中相同类别的子域彼此对齐,不同类别的子域彼此远离。
6.如权利要求1所述的跨对象目标域代理子域适应方法,其特征在于,所述相似度为:
Figure FDA0003918779260000026
其中,ωm为第m个平衡数据集与目标域的相似度,m=1,2,…,M,M为所述平衡数据集的总个数,nt为所述目标域中样本的总个数,
Figure FDA0003918779260000027
Figure FDA0003918779260000028
在第m个平衡数据集上预测得到的标签,
Figure FDA0003918779260000029
为所述目标域中第i个样本,
Figure FDA00039187792600000210
Figure FDA00039187792600000211
在第m个平衡数据集上的预测概率。
7.如权利要求1所述的跨对象目标域代理子域适应方法,其特征在于,所述总体损失为:
Figure FDA00039187792600000212
其中,
Figure FDA00039187792600000213
为所述总体损失,
Figure FDA00039187792600000214
为所述分类损失,
Figure FDA00039187792600000215
为所述域适应损失,
Figure FDA00039187792600000216
为所述子域适应损失,λ1为第一损失参数,λ2为第二损失参数。
8.如权利要求1-7任一项所述的跨对象目标域代理子域适应方法,其特征在于,所述S6中反向传播更新源域模型的模型参数为:
Figure FDA0003918779260000031
其中,θ为所述源域模型的模型参数,α为学习率,fθ为所述源域模型,
Figure FDA0003918779260000032
为所述源域模型的总体损失。
9.一种跨对象目标域代理子域适应系统,其特征在于,包括:
处理及生成模块,用于对原始脑电数据依次进行预处理、特征提取以及类别平衡处理,得到多个平衡数据集,并为每一所述平衡数据集生成相应的域标签;
相似度计算模块,用于对于任一平衡数据集,计算目标域中所有样本在所述平衡数据集上的预测概率的和,从而得到所述平衡数据集与所述目标域的相似度;
最优源域及目标域代理生成模块,用于将前M’个最大相似度对应的平衡数据集进行拼接以得到最优源域,将最大相似度对应的平衡数据集作为目标域代理,M’为大于1的预设值;
适应模块,用于对所述目标域和所述最优源域进行全局域适应,计算域适应损失,对所述最优源域和所述目标域代理进行子域适应,计算子域适应损失;
损失计算模块,用于利用交叉熵函数计算分类损失,并根据所述域适应损失、所述子域适应损失和所述分类损失计算总体损失;
更新模块,用于以所述总体损失收敛为目标,反向传播更新源域模型的模型参数,得到最终的源域模型。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8任一项所述的跨对象目标域代理子域适应方法。
CN202211350636.XA 2022-10-31 2022-10-31 跨对象目标域代理子域适应方法、系统及介质 Active CN115590530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211350636.XA CN115590530B (zh) 2022-10-31 2022-10-31 跨对象目标域代理子域适应方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211350636.XA CN115590530B (zh) 2022-10-31 2022-10-31 跨对象目标域代理子域适应方法、系统及介质

Publications (2)

Publication Number Publication Date
CN115590530A true CN115590530A (zh) 2023-01-13
CN115590530B CN115590530B (zh) 2024-09-06

Family

ID=84851231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211350636.XA Active CN115590530B (zh) 2022-10-31 2022-10-31 跨对象目标域代理子域适应方法、系统及介质

Country Status (1)

Country Link
CN (1) CN115590530B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115902814A (zh) * 2023-03-09 2023-04-04 中国人民解放军国防科技大学 基于信息空间度量的目标识别模型性能评估方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200082221A1 (en) * 2018-09-06 2020-03-12 Nec Laboratories America, Inc. Domain adaptation for instance detection and segmentation
CN113157096A (zh) * 2021-04-26 2021-07-23 杭州电子科技大学 基于深度子域关联适应网络的脑电情感迁移方法
CN113392733A (zh) * 2021-05-31 2021-09-14 杭州电子科技大学 基于标签对齐的多源域自适应跨被试eeg认知状态评估方法
US20220138495A1 (en) * 2020-11-05 2022-05-05 University Of Electronic Science And Technology Of China Model and method for multi-source domain adaptation by aligning partial features
CN114464274A (zh) * 2022-01-14 2022-05-10 哈尔滨理工大学 一种基于机器学习和改进遗传算法特征筛选的高熵合金硬度预测方法
CN114842267A (zh) * 2022-05-23 2022-08-02 南京邮电大学 基于标签噪声域自适应的图像分类方法及系统
CN114879838A (zh) * 2022-04-20 2022-08-09 华中科技大学 用于脑机接口的元学习方法、脑电信号识别方法及装置
WO2022179548A1 (zh) * 2021-02-26 2022-09-01 腾讯科技(深圳)有限公司 脑电信号分类方法、装置、设备、存储介质及程序产品

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200082221A1 (en) * 2018-09-06 2020-03-12 Nec Laboratories America, Inc. Domain adaptation for instance detection and segmentation
US20220138495A1 (en) * 2020-11-05 2022-05-05 University Of Electronic Science And Technology Of China Model and method for multi-source domain adaptation by aligning partial features
WO2022179548A1 (zh) * 2021-02-26 2022-09-01 腾讯科技(深圳)有限公司 脑电信号分类方法、装置、设备、存储介质及程序产品
CN113157096A (zh) * 2021-04-26 2021-07-23 杭州电子科技大学 基于深度子域关联适应网络的脑电情感迁移方法
CN113392733A (zh) * 2021-05-31 2021-09-14 杭州电子科技大学 基于标签对齐的多源域自适应跨被试eeg认知状态评估方法
CN114464274A (zh) * 2022-01-14 2022-05-10 哈尔滨理工大学 一种基于机器学习和改进遗传算法特征筛选的高熵合金硬度预测方法
CN114879838A (zh) * 2022-04-20 2022-08-09 华中科技大学 用于脑机接口的元学习方法、脑电信号识别方法及装置
CN114842267A (zh) * 2022-05-23 2022-08-02 南京邮电大学 基于标签噪声域自适应的图像分类方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
伍冬睿: "基于EEG的癫痫自动检测:综述与展望", 自动化学报, 23 April 2021 (2021-04-23), pages 335 - 350 *
程磊;吴晓富;张索非;: "数据集类别不平衡性对迁移学习的影响分析", 信号处理, no. 01, 25 January 2020 (2020-01-25), pages 114 - 121 *
许鹏;邓赵红;王骏;王士同;: "基于联合信息保持的异构领域自适应", 计算机科学与探索, no. 07, 31 July 2020 (2020-07-31), pages 107 - 117 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115902814A (zh) * 2023-03-09 2023-04-04 中国人民解放军国防科技大学 基于信息空间度量的目标识别模型性能评估方法和装置

Also Published As

Publication number Publication date
CN115590530B (zh) 2024-09-06

Similar Documents

Publication Publication Date Title
Giovannucci et al. CaImAn an open source tool for scalable calcium imaging data analysis
Hemalatha et al. Machine learning techniques for heart disease prediction
Perna Convolutional neural networks learning from respiratory data
Qin et al. Combining low-dimensional wavelet features and support vector machine for arrhythmia beat classification
US11232344B2 (en) Multi-task feature selection neural networks
Yang et al. Multi-source transfer learning via ensemble approach for initial diagnosis of Alzheimer’s disease
CN111524557A (zh) 基于人工智能的逆合成预测方法、装置、设备及存储介质
Pizzagalli et al. A trainable clustering algorithm based on shortest paths from density peaks
Islam et al. Cardiovascular disease forecast using machine learning paradigms
CN112116957A (zh) 基于小样本的疾病亚型预测方法、系统、装置及介质
Ma et al. Attention-guided deep graph neural network for longitudinal Alzheimer’s disease analysis
Jatav An algorithm for predictive data mining approach in medical diagnosis
CN115590530A (zh) 跨对象目标域代理子域适应方法、系统及介质
Allami et al. A genetic algorithm-neural network wrapper approach for bundle branch block detection
CN114821237A (zh) 一种基于多级对比学习的无监督船舶再识别方法及系统
CN114722892A (zh) 基于机器学习的持续学习方法及装置
Ke et al. Interpretation of frequency channel-based CNN on depression identification
US6941288B2 (en) Online learning method in a decision system
CN117371511A (zh) 图像分类模型的训练方法、装置、设备及存储介质
CN108446740B (zh) 一种用于脑影像病历特征提取的多层一致协同方法
JP2022088341A (ja) 機器学習装置及び方法
CN113066544B (zh) 基于CAA-Net与LightGBM的FVEP特征点检测方法
AU2021102593A4 (en) A Method for Detection of a Disease
Einipour et al. EinImpute: a local and gene-based approach to imputation of dropout events in ScRNA-seq data
Premanand et al. A Tree Based Machine Learning Approach for PTB Diagnostic Dataset

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant