CN116342938A - 基于多个潜在域混合的域泛化图像分类方法 - Google Patents

基于多个潜在域混合的域泛化图像分类方法 Download PDF

Info

Publication number
CN116342938A
CN116342938A CN202310238084.1A CN202310238084A CN116342938A CN 116342938 A CN116342938 A CN 116342938A CN 202310238084 A CN202310238084 A CN 202310238084A CN 116342938 A CN116342938 A CN 116342938A
Authority
CN
China
Prior art keywords
domain
data
network
training
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310238084.1A
Other languages
English (en)
Inventor
刘龙
黄珂卿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN202310238084.1A priority Critical patent/CN116342938A/zh
Publication of CN116342938A publication Critical patent/CN116342938A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明基于多个潜在域混合的域泛化图像分类方法,步骤包括:1)获取领域泛化数据集,进行数据增强和数据集扩充;2)构建AlexNet网络,加载预训练权重,对AlexNet网络进行对抗式训练;3)提取AlexNet网络的浅层特征,获得卷积特征统计信息,计算域判别特征;4)将卷积特征统计信息进行聚类,分为若干个簇,并根据簇为数据分配伪域标签;同时对伪域标签进行更新;5)将伪域标签输入给领域判别器完成领域判别器的训练,同时完成整体图像的分类网络的训练,将未参与训练的数据作为测试集输入给分类网络,得到分类结果。本发明的方法,提高网络的泛化性能,具有更好的分类和预测性能。

Description

基于多个潜在域混合的域泛化图像分类方法
技术领域
本发明属于迁移学习技术领域,涉及一种基于多个潜在域混合的域泛化图像分类方法。
背景技术
目前,深度学习模型已广泛应用于计算机视觉的各个领域,其中便包括图像分类。随着深度神经网络的兴起和GPU强大的算力使得基于深度学习的图像分类方法继续蓬勃发展。然而,一个性能较优的深度网络模型的训练和更新依赖于大量的数据标注,尽管海量的图像数据易于获取,但这些数据往往只具备初级形态,标注数据需要耗费大量的人力和物力,这成为制约计算机视觉发展的一大重要因素。同时,在机器学习领域中,网络的训练数据和测试数据均来自同一分布,即满足独立同分布的假设前提,但在实际的工程应用中,不同场景下的数据分布往往存在差异,这导致模型在新的场景中泛化能力较差。
领域泛化放宽了传统机器学习中独立同分布这一基本假设,目的是将知识从标签丰富的相似领域迁移到未知的目标域,主要解决的是当训练数据和测试数据存在偏差且目标域数据难以获取时,如何利用仅有的源域数据训练具有良好泛化性能的网络模型。所以,近年来领域泛化方法越来越受到学者们的广泛关注,并取得了一些值得关注的研究成果。
现有的图像分类算法利用深度学习网络作为其骨干网络,分别从输入图像中提取特征,进行分类。目前的很多有监督图像分类算法已经可以在多数公开数据集上取得极优的准确率,但这些算法的前提是都需要有大规模的已标注数据对网络进行训练,而在实际生活中,在其他图像领域并不一定能够获得大规模的已标注数据,正因为存在上述问题,所有当应用场景发生变化时,有监督图像分类算法具有一定的局限性。而领域泛化研究的问题具体是从若干个具有不同数据分布的数据集中学习一个泛化能力强的模型,以便在未知的测试集上取得良好的效果,即使用具有丰富标签的源域数据训练网络模型,而在与源域数据具有一定相关性的未知目标域上进行测试,并能够取得较高的目标识别准确率。
发明内容
本发明的目的是提供一种基于多个潜在域混合的域泛化图像分类方法,解决了现有技术拥有具有丰富标签的源域数据,并且目标域的数据难以获取时,在图像分类中对深度模型性能的影响大,导致训练后网络模型对未知目标域数据类别预测准确率低下的问题。
本发明所采用的技术方案是,一种基于多个潜在域混合的域泛化图像分类方法,按照以下步骤具体实施:
步骤1,获取领域泛化数据集,包括源域数据集Ds和目标域数据集DT,进行数据增强和数据集扩充;
步骤2,构建AlexNet网络,加载预训练权重,同时将源域数据集Ds数据输入AlexNet网络中,对AlexNet网络进行对抗式训练;
步骤3,提取AlexNet网络的浅层特征,获得卷积特征统计信息,并计算域判别特征;
步骤4,通过标准聚类算法K-means将卷积特征统计信息进行聚类,分为若干个簇,并根据簇为数据分配伪域标签;同时,随着网络训练过程对伪域标签进行更新;
步骤5,将聚类算法输出的伪域标签输入给领域判别器,完成领域判别器的训练,同时完成整体图像的分类网络的训练,将未参与训练的目标域DT数据作为测试集输入给分类网络,最终得到分类结果。
本发明的有益效果是,1)在训练过程中并不使用目标域数据,仅使用源域数据训练网络模型,在保证全局领域分布近似的基础上,提高网络的泛化性能。2)考虑了更现实的场景,多个源域数据并不一定完全分开,而更有可能混合在同一个源域中,经过熵损失、领域对抗损失和分类损失作为总体损失函数训练以后,通过标准聚类算法对多个潜在域混合的源域数据进行聚类分析,将聚类分析后的簇标签作为样本的伪域标签,并进一步通过目标函数进行更新、优化,完成领域判别器的训练。3)将未知的目标域数据,即未参与训练的目标域数据作为测试集输入给网络模型,验证网络模型的泛化性能,使其能够在目标域测试中展现出更好的分类和预测性能。
附图说明
图1是本发明方法的网络结构图;
图2是本发明方法中采用的深度特征提取网络的结构框图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明基于多个潜在域混合的域泛化图像分类方法,按照以下步骤具体实施:
步骤1,获取领域泛化数据集,包括源域数据集Ds和目标域数据集DT,进行数据增强和数据集扩充,具体过程是,
源域数据集Ds服从某种分布Ps(x),类别标签为Ls,m为样本数目,即
Figure BDA0004123174350000041
目标域数据集DT服从分布PT(x),类别标签为LT,即
Figure BDA0004123174350000042
Figure BDA0004123174350000043
将源域数据集Ds、目标域数据集DT分批次输入到随机数据增广网络中(随机数据增广网络是现有的常规技术),随机数据增广网络对源域数据集Ds和目标域数据集DT的样本实施旋转、裁剪和加入高斯白噪声变换后,恢复至原始输入大小,形成新的样本,重新加入至源域数据集Ds中,实现数据集扩充的目的。
步骤2,构建AlexNet网络,加载预训练权重,同时将(由多个潜在域样本组成的)源域数据集Ds数据输入AlexNet网络中,对AlexNet网络进行对抗式训练,
AlexNet网络的结构是,由一个输入层、五个卷积层、两个全连接层和一个输出层构成,见图2;每个卷积层后接一种非线性激活函数,在每个非线性激活函数后面再接一层最大池化层(总共有五个非线性激活函数和五个最大池化层);在最后一个最大池化层后接一个全连接层,紧接着再加一个全连接层(总共是两个全连接层),随后在最后一个全连接层后加设一个Softmax函数,
对AlexNet网络的训练过程为:
2.1)参照图2,搭建好AlexNet网络的架构,加载预训练模型(预训练模型是现有的常规技术),然后从源域数据集Ds中抽取一个批次数据X,输入给AlexNet网络中;
2.2)AlexNet网络对输入数据X(输入图像)进行卷积、池化操作,同时计算损失函数、计算梯度,对AlexNet网络的分类误差进行反向传播,迭代更新AlexNet网络的参数,完成AlexNet网络的训练,
AlexNet网络的操作,包括三个损失函数的计算,即分类损失Lcls(Ff,Fc)、对抗性学习中域判别器的对抗性损失Ladv(Ff,Fd)、熵损失Lent(Ff,Fc),计算式分别如下:
a)分类损失Lcls(Ff,Fc)的计算式为:
Figure BDA0004123174350000051
其中,Ff为特征提取器,Fc为分类器,Ns表示输入的样本数量,C表示数据样本的标签集合,yi表示第i个样本的标签;
b)对抗性损失Ladv(Ff,Fd)的计算式为:
Figure BDA0004123174350000052
其中,Fd为领域判别器,
Figure BDA0004123174350000053
表示伪域,K表示已知数量的域,k表示第k个域,/>
Figure BDA0004123174350000054
表示伪域标签;
c)熵损失Lent(Ff,Fc)的计算式为:
Figure BDA0004123174350000055
其中,H(·)代表交叉熵损失函数;
到此,得到两个最终的优化函数,表达式如下:
Figure BDA0004123174350000061
Figure BDA0004123174350000062
步骤3,提取AlexNet网络的浅层特征,获得卷积特征统计信息,并计算域判别特征,具体过程为:
3.1)将源域数据集Ds的样本
Figure BDA0004123174350000063
并使用AlexNet网络作为特征提取器F(·),提取得到的浅层特征称为卷积特征统计信息;
3.2)将所提取的卷积特征统计信息用于计算风格损失,为每个通道c跨空间维度独立计算均值μ(x)和标准差σ(x),计算式分别为:
Figure BDA0004123174350000064
Figure BDA0004123174350000065
其中,H、W分别表示特征向量的高和宽,c表示特征向量的通道,x为输入的数据样本;
3.3)计算出均值μ(x)和标准差σ(x)以后,为了组合从不同卷积层获得的多尺度风格特征,将均值μ(x)和标准差σ(x)的堆栈定义为域判别特征ddf(x),域判别特征ddf(x)的计算式为:
ddf(x)={μ(φ1(x)),σ(φ1(x)),…,μ(φM(x)),σ(φM(x))} (8)
其中,μ表示式(5)中均值的计算,σ表示式(6)中的标准差计算,φ(·)表示映射函数MMD。
步骤4,通过标准聚类算法K-means将卷积特征统计信息进行聚类,分为若干个簇,并根据簇为数据分配伪域标签;同时,随着网络训练过程对伪域标签进行更新,具体过程是:
4.1)得到域判别特征ddf(x)后,通过K-means算法进行聚类分析,
首先计算源域数据样本的聚类中心,其次使得每个聚类集合中的样本点与聚类中心的距离平方和最小,反复迭代更新聚类中心;直到聚类中心不再发生变化,或是达到一定的迭代次数时,认为K-means算法已经收敛,
K-means算法的目标函数为:
Figure BDA0004123174350000071
其中,x为给定源域数据集Ds中的每个数据样本
Figure BDA0004123174350000072
Si表示聚类集合N={N1,N2,…,Nk}中的一个子集,ai是集合Si的中心点,也就是聚类中心;
4.2)根据K-means算法所得到的聚类中心,将多个潜在混合的源域数据集Ds的数据划分为
Figure BDA0004123174350000073
个簇,并利用簇分配ai作为伪域标签/>
Figure BDA0004123174350000074
将聚类的簇分配结果ai转为伪域标签/>
Figure BDA0004123174350000075
的过程进行反复迭代,进行更新,更新过程所需的目标函数的表达式为:
Figure BDA0004123174350000076
其中,Ns为第s个聚类集合,
Figure BDA0004123174350000077
表示一个epoch之前的伪域标签,ai表示第Ns个聚类集合的聚类中心,π表示Kuhn-Munkres算法。
步骤5,将聚类算法输出的伪域标签输入给领域判别器,完成领域判别器的训练,同时完成整体图像的分类网络的训练,将未参与训练的目标域DT数据作为测试集输入给分类网络,最终得到分类结果,
具体过程是:
5.1)将步骤4输出的伪域标签输入给领域判别器,结合之前特征提取器所提取的领域不变特征,完成领域判别器的训练,具体的损失函数定义如式(2)所示;
5.2)完成本发明方法所述的图像的分类网络的训练,将未参与训练的目标域DT数据作为测试集输入给分类网络,最终得到分类结果。
实验验证:
为了验证本发明方法的有效性,将本发明方法与现有技术的两个方法CIDDG和MLDG在目前公开的PACS数据集做了性能测试,具体结果见表1。从表1中可看出,本发明方法在PACS数据集上准确率有所提升,说明本发明方法的准确性更高,可靠性更好。
表1、领域泛化方法PACS数据集的实验结果
Figure BDA0004123174350000081

Claims (6)

1.一种基于多个潜在域混合的域泛化图像分类方法,其特征在于,按照以下步骤具体实施:
步骤1,获取领域泛化数据集,包括源域数据集Ds和目标域数据集DT,进行数据增强和数据集扩充;
步骤2,构建AlexNet网络,加载预训练权重,同时将源域数据集Ds数据输入AlexNet网络中,对AlexNet网络进行对抗式训练;
步骤3,提取AlexNet网络的浅层特征,获得卷积特征统计信息,并计算域判别特征;
步骤4,通过标准聚类算法K-means将卷积特征统计信息进行聚类,分为若干个簇,并根据簇为数据分配伪域标签;同时,随着网络训练过程对伪域标签进行更新;
步骤5,将聚类算法输出的伪域标签输入给领域判别器,完成领域判别器的训练,同时完成整体图像的分类网络的训练,将未参与训练的目标域DT数据作为测试集输入给分类网络,最终得到分类结果。
2.根据权利要求1所述的基于多个潜在域混合的域泛化图像分类方法,其特征在于,步骤1中,具体过程是:
所述的源域数据集Ds服从某种分布Ps(x),类别标签为Ls,m为样本数目,即
Figure FDA0004123174340000011
所述的目标域数据集DT服从分布PT(x),类别标签为LT,即
Figure FDA0004123174340000012
将源域数据集Ds、目标域数据集DT分批次输入到随机数据增广网络中,随机数据增广网络对源域数据集Ds和目标域数据集DT的样本实施旋转、裁剪和加入高斯白噪声变换后,恢复至原始输入大小,形成新的样本,重新加入至源域数据集Ds中,实现数据集扩充。
3.根据权利要求1所述的基于多个潜在域混合的域泛化图像分类方法,其特征在于,步骤2中,具体过程是:
所述的AlexNet网络的结构是,由一个输入层、五个卷积层、两个全连接层和一个输出层构成;每个卷积层后接一种非线性激活函数,在每个非线性激活函数后面再接一层最大池化层;在最后一个最大池化层后接一个全连接层,紧接着再加一个全连接层,随后在最后一个全连接层后加设一个Softmax函数,
对AlexNet网络的训练过程为:
2.1)搭建好AlexNet网络的架构,加载预训练模型,然后从源域数据集Ds中抽取一个批次数据X,输入给AlexNet网络中;
2.2)AlexNet网络对输入数据X进行卷积、池化操作,同时计算损失函数、计算梯度,对AlexNet网络的分类误差进行反向传播,迭代更新AlexNet网络的参数,完成AlexNet网络的训练,
AlexNet网络的操作,包括三个损失函数的计算,即分类损失Lcls(Ff,Fc)、对抗性学习中域判别器的对抗性损失Ladv(Ff,Fd)、熵损失Lent(Ff,Fc),计算式分别如下:
a)分类损失Lcls(Ff,Fc)的计算式为:
Figure FDA0004123174340000021
其中,Ff为特征提取器,Fc为分类器,Ns表示输入的样本数量,C表示数据样本的标签集合,yi表示第i个样本的标签;
b)对抗性损失Ladv(Ff,Fd)的计算式为:
Figure FDA0004123174340000031
其中,Fd为领域判别器,
Figure FDA0004123174340000032
表示伪域,K表示已知数量的域,k表示第k个域,/>
Figure FDA0004123174340000033
表示伪域标签;
c)熵损失Lent(Ff,Fc)的计算式为:
Figure FDA0004123174340000034
其中,H(·)代表交叉熵损失函数;
到此,得到两个最终的优化函数,表达式如下:
Figure FDA0004123174340000035
Figure FDA0004123174340000036
4.根据权利要求1所述的基于多个潜在域混合的域泛化图像分类方法,其特征在于,步骤3中,具体过程为:
3.1)将源域数据集Ds的样本
Figure FDA0004123174340000037
并使用AlexNet网络作为特征提取器F(·),提取得到的浅层特征称为卷积特征统计信息;
3.2)将所提取的卷积特征统计信息用于计算风格损失,为每个通道c跨空间维度独立计算均值μ(x)和标准差σ(x),计算式分别为:
Figure FDA0004123174340000038
Figure FDA0004123174340000039
其中,H、W分别表示特征向量的高和宽,c表示特征向量的通道,x为输入的数据样本;
3.3)计算出均值μ(x)和标准差σ(x)以后,为了组合从不同卷积层获得的多尺度风格特征,将均值μ(x)和标准差σ(x)的堆栈定义为域判别特征ddf(x),域判别特征ddf(x)的计算式为:
ddf(x)={μ(φ1(x)),σ(φ1(x)),…,μ(φM(x)),σ(φM(x))} (8)
其中,μ表示式(5)中均值的计算,σ表示式(6)中的标准差计算,φ(·)表示映射函数MMD。
5.根据权利要求1所述的基于多个潜在域混合的域泛化图像分类方法,其特征在于,步骤4中,具体过程是:
4.1)得到域判别特征ddf(x)后,通过K-means算法进行聚类分析,
首先计算源域数据样本的聚类中心,其次使得每个聚类集合中的样本点与聚类中心的距离平方和最小,反复迭代更新聚类中心;直到聚类中心不再发生变化,或是达到一定的迭代次数时,认为K-means算法已经收敛,
K-means算法的目标函数为:
Figure FDA0004123174340000041
其中,x为给定源域数据集Ds中的每个数据样本
Figure FDA0004123174340000042
Si表示聚类集合N={N1,N2,…,Nk}中的一个子集,ai是集合Si的中心点,也就是聚类中心;
4.2)根据K-means算法所得到的聚类中心,将多个潜在混合的源域数据集Ds的数据划分为
Figure FDA0004123174340000043
个簇,并利用簇分配ai作为伪域标签/>
Figure FDA0004123174340000044
将聚类的簇分配结果ai转为伪域标签/>
Figure FDA0004123174340000045
的过程进行反复迭代,进行更新,更新过程所需的目标函数的表达式为:
Figure FDA0004123174340000051
其中,Ns为第s个聚类集合,
Figure FDA0004123174340000052
表示一个epoch之前的伪域标签,ai表示第Ns个聚类集合的聚类中心,π表示Kuhn-Munkres算法。
6.根据权利要求1所述的基于多个潜在域混合的域泛化图像分类方法,其特征在于,步骤5中,具体过程是:
5.1)将步骤4输出的伪域标签输入给领域判别器,结合之前特征提取器所提取的领域不变特征,完成领域判别器的训练,具体的损失函数定义如式(2)所示;
5.2)完成本发明方法所述的图像的分类网络的训练,将未参与训练的目标域DT数据作为测试集输入给分类网络,最终得到分类结果。
CN202310238084.1A 2023-03-10 2023-03-10 基于多个潜在域混合的域泛化图像分类方法 Pending CN116342938A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310238084.1A CN116342938A (zh) 2023-03-10 2023-03-10 基于多个潜在域混合的域泛化图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310238084.1A CN116342938A (zh) 2023-03-10 2023-03-10 基于多个潜在域混合的域泛化图像分类方法

Publications (1)

Publication Number Publication Date
CN116342938A true CN116342938A (zh) 2023-06-27

Family

ID=86881624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310238084.1A Pending CN116342938A (zh) 2023-03-10 2023-03-10 基于多个潜在域混合的域泛化图像分类方法

Country Status (1)

Country Link
CN (1) CN116342938A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117115567A (zh) * 2023-10-23 2023-11-24 南方科技大学 基于特征调整的域泛化图像分类方法、系统、终端及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117115567A (zh) * 2023-10-23 2023-11-24 南方科技大学 基于特征调整的域泛化图像分类方法、系统、终端及介质
CN117115567B (zh) * 2023-10-23 2024-03-26 南方科技大学 基于特征调整的域泛化图像分类方法、系统、终端及介质

Similar Documents

Publication Publication Date Title
Zhang et al. Weakly supervised semantic segmentation for large-scale point cloud
WO2021134871A1 (zh) 基于局部二值模式和深度学习的合成人脸图像取证方法
CN111723674B (zh) 基于马尔科夫链蒙特卡洛与变分推断的半贝叶斯深度学习的遥感图像场景分类方法
CN101794396B (zh) 基于迁移网络学习的遥感图像目标识别系统及方法
CN110619059B (zh) 一种基于迁移学习的建筑物标定方法
WO2022062419A1 (zh) 基于非督导金字塔相似性学习的目标重识别方法及系统
CN114169442B (zh) 基于双原型网络的遥感图像小样本场景分类方法
CN111429340A (zh) 一种基于自注意力机制的循环图像翻译方法
CN109743642B (zh) 基于分层循环神经网络的视频摘要生成方法
CN109741410A (zh) 基于深度学习的荧光编码微球图像生成及标注方法
CN114913379B (zh) 基于多任务动态对比学习的遥感图像小样本场景分类方法
Chen et al. Binarized neural architecture search
CN112784921A (zh) 任务注意力引导的小样本图像互补学习分类算法
Tao et al. DREAMT: Diversity Enlarged Mutual Teaching for Unsupervised Domain Adaptive Person Re-Identification
CN115311502A (zh) 基于多尺度双流架构的遥感图像小样本场景分类方法
CN116206327A (zh) 一种基于在线知识蒸馏的图像分类方法
CN112329830B (zh) 一种基于卷积神经网络和迁移学习的无源定位轨迹数据识别方法及系统
CN116342938A (zh) 基于多个潜在域混合的域泛化图像分类方法
CN115661539A (zh) 一种嵌入不确定性信息的少样本图像识别方法
CN118571328A (zh) 一种基于图对比学习的单细胞多组学数据整合方法和系统
CN107729942A (zh) 一种结构化视图缺失数据的分类方法
CN113688879B (zh) 一种基于置信度分布外检测的广义零样本学习分类方法
CN116911377A (zh) 基于迁移学习的辐射源个体识别方法、设备及介质
Hu et al. Data-free dense depth distillation
CN115329821A (zh) 一种基于配对编码网络和对比学习的舰船噪声识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination