CN114549909A - 一种基于自适应阈值的伪标签遥感图像场景分类方法 - Google Patents

一种基于自适应阈值的伪标签遥感图像场景分类方法 Download PDF

Info

Publication number
CN114549909A
CN114549909A CN202210209902.0A CN202210209902A CN114549909A CN 114549909 A CN114549909 A CN 114549909A CN 202210209902 A CN202210209902 A CN 202210209902A CN 114549909 A CN114549909 A CN 114549909A
Authority
CN
China
Prior art keywords
domain data
data set
classification
network
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210209902.0A
Other languages
English (en)
Inventor
黄颖
李汤升
刘苏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202210209902.0A priority Critical patent/CN114549909A/zh
Publication of CN114549909A publication Critical patent/CN114549909A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于遥感图像识别领域,特别涉及一种基于自适应阈值的伪标签遥感图像场景分类方法,包括先使用对抗生成网络对源域数据集进行初步的扩充,然后将扩充后的数据集在骨干网络中通过高斯引导将数据进行浅层对齐,之后接入一个具有两个分类器的伪标签模块生成目标域的伪标签;将两个分类方差正则化并作为自适应阈值对交叉熵损失进行修正,当主分类器和辅助分类器二者之间的预测距离很大时,就表示该标签是错误的,对于这种不确定的样本就不进行惩罚,即抛弃掉错误的标签样本,将预测距离较小的作为伪标签;之后得到带伪标签的目标域和源域送入域分辨器中,更好地拉近了源域和目标域的特征距离;本发明可以更好的应用在遥感图像场景分类上。

Description

一种基于自适应阈值的伪标签遥感图像场景分类方法
技术领域
本发明涉及遥感图像处理和分类识别领域,特别涉及一种基于自适应阈值的伪标签遥感图像场景分类方法。
背景技术
遥感图像广泛应用于测绘、环境监测、城市规划等领域。随着遥感图像采集量的不断增加,场景分类和语义分割收到了遥感界的广泛关注。遥感场景分类是根据图像内容推断出正确的场景类别的一项现实任务。在过去的几十年中,传统的遥感图像场景分类主要基于手动提取特征。但是,它手动提取的功能是低级功能,其仅仅只能够表示目标的能力,这意味着本发明使用这些功能会具有更高的分类错误率。
近年来,卷积神经网络对该领域起到了很大的推动作用,它需要大量数据集进行训练,这是更强大的模型泛化能力的先决条件。但是,实际任务中没有足够的数据集,并且手动标签也非常耗时。研究表明,迁移学习可以有效解决这个问题。然而,在真实的任务情况下,RS图像受自然因素的影响,例如照明、空间分辨率、旋转和天气条件。因此,无法将迁移学习有效地应用到遥感场景分类中,其本质就是因为源域和目标域的特征差距过大。
为了使遥感图像中的源域和目标域之间的特征更加接近,研究人员提出了域自适应方法来解决这个问题。域自适应方法目前主要可以分为传统的基于度量距离的方法和基于深度学习的方法。基于深度学习的方法常采用对抗学习的方式来将源域和目标域的特征映射到同一个特征空间中。域对抗学习由域判别器和产生器构成。产生器主要的作用就是混淆源域和目标域的特征,达到域判别器不能判断特征是来自于源域还是来自于目标域的目的。而域判别器的作用与产生器相反,其目的是为了最大可能地正确判断特征的来源。这样形成了一个对抗的形式,最终会达到源域和目标域混淆在一起的结果。但是这种方式并不能形成有效的决策边界,两个域的图像类别完全被混淆在了一起。所以常常采用添加伪标签的方式来帮助形成有效的决策边界。但是伪标签方案是通过手动设置阈值,而阈值大小的设置往往很难决定。阈值过高或者过低都会影响到模型的学习。所以为了更加有效地设置合理的阈值形成决策边界,需要一种自适应的阈值策略,用于更加有效地进行遥感图像场景分类。
发明内容
针对上述技术问题,本发明提供了一种基于自适应阈值的伪标签遥感图像场景分类方法,所述方法能够有效的解决手动设置阈值时造成模型不稳定的问题,使得通过阈值过滤掉噪声标签,能够使得遥感图像场景分类更加准确。本发明不仅有效的将遥感图像的源域和目标域映射到同一个特征空间,而且通过阈值形成了有效的决策边界,并且这个阈值也不需要手动设置,是根据数据集的特点自动生成的,提高了分类的能力。
本发明采用的技术方案是:
一种基于自适应阈值的伪标签遥感图像场景分类方法,包括以下步骤:
S1、将遥感图像数据集划分为源域数据集和目标域数据集,并将带有真实标签的源域数据集输入到对抗生成网络中以扩充所述源域数据集;
S2、构建出包括特征提取器和分类器的第一场景分类网络,以及构建出包括生成器和判别器的第二场景分类网络;并利用扩充后的源域数据集对所述第一场景分类网络进行预训练;
S3、采用预训练后的特征提取器提取目标域数据集在不同层级的数据特征,并通过高斯引导将浅层的数据特征对齐;
S4、对预训练后的分类器进行复制,形成主分类器和辅助分类器,将对齐后的目标域数据集中不同层级的数据特征输入到主分类器和辅助分类器,并输出第一分类标签和第二分类标签;
S5、根据目标域数据集的第一分类标签和第二分类标签,计算出两个分类器之间的分类方差以及交叉熵损失;
S6、对分类方差进行正则化处理,将方差正则化作为自适应阈值对所述交叉熵进行修正,并利用修正后的交叉熵损失来更新第一场景分类网络的模型参数,并确定出目标域数据的伪标签;
S7、将带有伪标签的目标域数据和带有真实标签的源域数据输入至第二场景分类网络中,利用对抗训练的方式来更新第二场景分类网络的模型参数;
S8、循环迭代步骤S3-S7,更新并优化预训练后的各个场景分类网络模型参数,直至满足分类目标需求,输出目标域数据集的遥感图像场景分类结果。
本发明的有益效果:
本发明适用于遥感图像场景分类,与现有方法相比,本发明的优点在于:
(1)本发明利用对抗学习的思想,使用生成器来提取源域和目标域的数据特征,使用判别器来判断特征的来源于源域还是目标域,这样的域自适应方法将遥感图像的源域数据和目标域数据特征映射到同一个特征空间中,减小了域之间迁移出现的准确率下降问题;
(2)本发明提出构建主分类器和辅助分类器,通过引入方差正则化作为自适应的阈值,该阈值可以过滤掉数据集中的噪声,更加有效得学习到遥感数据集中的特征。
附图说明
图1是本发明实施例的基于自适应阈值的伪标签遥感图像场景分类方法流程图;
图2是本发明的网络结构图;
图3是本发明采用的三个数据集的部分场景图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例中的一种基于自适应阈值的伪标签遥感图像场景分类方法流程图,如图1所示,所述方法包括:
S1、将遥感图像数据集划分为源域数据集和目标域数据集,并将带有真实标签的源域数据集输入到对抗生成网络中以扩充所述源域数据集;
在本发明实施例中,所述遥感图像数据集可以直接从各个公开的数据平台中调用,例如可以采集UCAS AOD遥感影像数据集,用于飞机和车辆检测。该飞机数据集包括600张图像和3210架飞机,而车辆数据集包括310张图像和2819辆车辆。所有的图像都经过精心挑选,使数据集中的物体方向分布均匀;也可以采集RSSCN7 Dataset遥感图像数据集,其包含2800幅遥感图像,这些图像来自于7个典型的场景类别,包括草地、森林、农田、停车场、住宅区、工业区和河湖,其中每个类别包含400张图像,分别基于4个不同的尺度进行采样。该数据集中每张图像的像素大小为400*400,场景图像的多样性导致其具有较大的挑战性,这些图像来源于不同季节和天气变化,并以不同的比例进行采样,除此以外,本发明可以从任意的公开数据集中获取,本实施例可以对其不作具体的限定。
在本发明实施例中,假设选取了三个遥感图像数据集,分别是AID,UC Merced和RSI数据集。这三个遥感图像数据集的分辨率和尺寸各不相同,选出三个共有的场景作为要使用的数据集。然后将使用这三个数据集建立六个跨数据集任务,分别是
Figure BDA0003530568240000044
Figure BDA0003530568240000045
即前者为源域数据集,后者为目标域数据集。将这些数据集中的源域数据集分别投入对抗生成网络生成更多的数据;具体的,对抗生成网络中的生成器接受一个随机噪声向量,目标是通过这个噪声向量来生成类似的真实样本,对抗生成网络中的判别器判别出样本是自己生成器中生成的还是真实样本,并利用损失函数来优化这个对抗生成网络,直至对抗生成网络的损失函数达到收敛,输出扩充后的源域数据集,增强数据集样本;其中,损失函数可以表示为:V(G,D)=Ex~Pdata[logD(x)]+Ex-pg[log(1-D(x))]。
其中,V(G,D)表示对抗生成网络中的生成器与判别器的对抗损失,E[]表示求期望,x~Pdata表示真实图像的分布;x表示真实样本,并通过判别网络D()判断x为真实样本的概率;z~Pz(z)表示生成图像的分布;z表示输入到生成网络的噪声,G(z)表示生成网络G()生成的噪声样本z,D(G(z))表示生成样本通过判别网络后,判断其真实样本的概率。
S2、构建出包括特征提取器和分类器的第一场景分类网络,以及构建出包括生成器和判别器的第二场景分类网络;并利用扩充后的源域数据集对所述第一场景分类网络进行预训练;
在本发明实施例中,需要构建出卷积神经网络,如图2所示,主要分成三部分,第一部分为特征提取器,本发明中使用ResNet-101作为模型的骨干网络,并且该网络是在ImageNet数据集上预先训练过的,一共有5组卷积。第一组卷积的输入大小是224x224,第五组卷积的输出大小是7x7,每次缩小2倍,总共缩小5次,并且每次都是在每组卷积的第一层上跨度为2。第二部分为伪标签模块,由两个接到不同层的主分类器和辅助分类器构成。两个分类器的结构都是一样的,由卷积层、BN层、ReLU激活函数和最大池化层构成。将这个辅助分类器网络连接到主干网络中的res4b22,也就是说res4b22的输出作为这个网络的输入。主分类器采用同样的网络结构,该分类器和res5c层相连接。其中,在预训练过程中,伪标签模块只有一个分类器,用于对源域数据集的分类;第三部分为对抗生成模块,该对抗生成网络包括生成器、判别器和分类器,这里的判别器为域判别器构成,域判别器采用两层卷积层构成,同样采用ReLU激活函数。
为了方便说明,本发明将其划分为两个场景分类网络,所述第一场景分类网络的目的是为了获取目标域数据集中每一个目标域数据的伪标签,所述第二场景分类网络的目的是为了确定出目标域数据集中每一个目标域数据的场景分类预测结果。
在本发明实施例中,利用扩充后的源域数据集对所述第一场景分类网络进行训练,优化所述第一场景分类网络中的特征提取器和分类器;训练完成后,就可以直接利用特征提取器提取出目标域数据集的数据特征,还可以利用训练完成的分类器得到目标域数据集的分类结果作为对应的伪标签。
可以理解的是,在本发明实施例中,本发明对第一场景分类网络的具体构造和训练过程可以不作具体的限定,本领域技术人员能够根据现有的分类器模型进行适应性改变。
S3、采用预训练后的特征提取器提取目标域数据集在不同层级的数据特征,并通过高斯引导将浅层的数据特征对齐;
在本发明实施例中,在高斯先验的引导下,对源域数据集的数据特征和目标域数据集的数据特征进行间接对齐。也即是将两个域的样本分布构建在一个共同的特征空间中,最终更好的促进特征的对齐。为了鼓励在先验空间上构造源域的判别特征空间,对标记的原样本使用softmax交叉熵损失进行正则化,同时目标域的潜在特征也应与高斯先验相似。为了有效地将目标潜在的分布对准,使用L1距离来度量二者特征之间的差距,更加有效地起到预先引导的作用。L1距离也叫作曼哈顿距离,其表示为:
C=|x1-x2|+|y1-y2|
S4、对预训练后的分类器进行复制,形成主分类器和辅助分类器,将对齐后的目标域数据集中不同层级的数据特征输入到主分类器和辅助分类器,并输出第一分类标签和第二分类标签;
在本发明实施例中,经过源域数据集训练后的分类器可以有效对目标域数据集进行分类,也即是为未标记的目标域数据集生成伪标签;其中,传统方式可以直接使用上述经过训练后的分类器得到目标域数据的伪标签,表示为:
yt=argmaxF(xts)
其中,yt表示目标域数据的伪标签;输入表示为xt,F()表示经过分类器;θs表示从遥感源域数据集中学到的参数。但是,由于源域数据集和目标域数据集的数据分布不同,所以传统方式得出的伪标签并不是准确的。可以用偏差来表示:
Figure BDA0003530568240000071
其中,Bias(pt)表示伪标签的偏差;第一项是预测标签F(xtt)和伪标签
Figure BDA0003530568240000072
之间的差异,而第二项是真实标签pt和伪标签
Figure BDA0003530568240000073
之间的误差。然而存在一个固有的问题,那就是标签不可避免的包含噪声。错误的标注从原模型传递到最终的模型。所以传统技术的伪标签很大程度上降低了训练效果。
基于此,本发明利用两个层级分类器来分别对分别得到目标域数据集的分类结果,利用两个分类结果之间的分类方差来形成自适应阈值控制产生对应的决策边界。
其中,本发明实施例的两个层级分类器可以直接采用经过源域数据集训练完成的分类器,两个层级分类器的结构完全相同;但是是对特征提取器中的不同网络层的数据特征进行分类处理,即将对齐后的目标域数据集中深层特征输入到主分类器中,得到目标域数据集的第一分类标签,将对齐后的目标域数据集中浅层特征输入到辅助分类器中,得到目标域数据的第二分类标签,两个分类标签中可以选择距离较小的作为目标域数据的伪标签。
S5、根据目标域数据集的第一分类标签和第二分类标签,计算出两个分类器之间的分类方差以及交叉熵损失;
在本发明实施例中,首先计算预测的方差:
Var(pt)=E[(F(xt)-pt)2]
因为pt代表的是真实标签,在目标域上是未知的,所以本发明采用伪标签
Figure BDA0003530568240000076
来代替pt,所以相应的公式变化为
Figure BDA0003530568240000074
但是本发明使用了特征提取器F(x)来获得
Figure BDA0003530568240000075
当优化预测偏差的时候,方差将会变小,所以在训练阶段并不能反映出真实的预测方式。因此采取另一个相似的判断公式
Var(pt)≈E[(F(xt)-Faux(xt))2]
其中Faux(xt)表示了辅助分类器的输出。由于主分类器从更深层次学习,辅助分类器从相对较浅层学习,并且两个分类器之间的输入激活是不同的,这将导致预测差异。其次两个分类器尚未在目标域数据集上训练。因此这两个分类器对于目标域数据集具有不同的偏差。本发明中使用KL散度来表示二者的分类方差
Figure BDA0003530568240000081
其中,Dkl表示两个分类器之间的分类方差的KL散度;F(xt)表示主分类器输出的第一分类标签;Faux(xt)表示了辅助分类器输出的第二分类标签;E[]表示求期望。
如果两个分类器提供两个不同的类预测,则近似方差将得到一个较大的值。它反映了模型对预测的不确定性。KL散度是方差计算的替代选择,也可以更换距离公式计算主分类器和辅助分类器的距离。最大均值差异就是常见的度量距离公式,表示为:
Figure BDA0003530568240000082
其中
Figure BDA0003530568240000083
表示映射,用于把变量映射到再生核希尔伯特空间中,该公式表达的就是两个数据在这个空间的均值距离。
在本发明实施例中,因为预测标签和伪标签是有一定差距的,所以使用交叉熵函数来最小化这个偏差。所述交叉熵损失表示为:
Figure BDA0003530568240000084
其中,Lce表示交叉熵损失;
Figure BDA0003530568240000085
表示伪标签;F(xtt)表示利用主分类器输出的第一分类标签。
S6、相比于其他手动设置阈值来卡掉低置信度的方法,对分类方差进行正则化处理,就相当于是形成了一个自适应阈值的过程,将方差正则化作为自适应阈值对所述交叉熵进行修正,并利用修正后的交叉熵损失来更新第一场景分类网络的模型参数,并确定出目标域数据的伪标签;
在本发明实施例中,固定分类方差,将所述分类方差进行正则化处理,来从错误的标签中纠正学习,修正后的目标损失函数可以表示为:
Figure BDA0003530568240000091
由于并不是在所有的条件下都最小化预测方差。如果预测的方差得到一个较大的值,将不会惩罚偏差。与此同时,为了防止模型总是预测较大的方差,本发明添加Var(pt)来引入正则化。此外由于Var(pt)可能为零,因此存在可能除以零的情况。所以为了排除这种情况,使用exp(-Var)来代替
Figure BDA0003530568240000092
因此修正后的损失函数被重写为:
Lrect=E[exp{-Dkl}Lce+Dkl]
其中,Lrect表示修正后的交叉熵损失,Dkl表示分类方差的KL散度损失,E[]表示求期望;Lce表示交叉熵损失。
S7、将带有伪标签的目标域数据和带有真实标签的源域数据输入至第二场景分类网络中,利用对抗训练的方式来更新第二场景分类网络的模型参数;
在本发明实施例中,通过上述过程就可以为目标域数据集中所有的目标域数据打上伪标签,因此所有的源域数据和目标域数据都有标签了,将带有伪标签的目标域数据和带有真实标签的源数据一起送入域判别器来判断特征的来源。源域和目标域是来自不同的分布,所以在源域上训练目标域上测试不能得到一个很好的结果。主要的原因是二者的特征分布不同,所以需要做的就是拉近距源域和目标域的特征距离。通过前面步骤的对数据集特征提取,再加上域判别器判断特征的来源,这样形成了对抗生成的循环,最终能够将二者的特征映射到同一个空间中。
S8、循环迭代步骤S3-S7,更新并优化预训练后的各个场景分类网络模型参数,直至满足分类目标需求,输出目标域数据集的遥感图像场景分类结果。
在本发明实施例中,需要联合优化第一场景分类网络和第二场景分类网络,直至满足分类目标需求,即可以将目标域数据集的遥感图像场景分类结果输出。
可以理解的是,本发明先使用对抗生成网络对源域数据集进行初步的扩充,然后将扩充后的数据集在骨干网络中通过高斯引导将数据进行浅层对齐,之后接入一个伪标签模块生成目标域的伪标签。该伪标签模块主要由两个分类器构成,一个主分类器和一个辅助分类器,分别接在不同的网络层后面,得到暂时的分类结果。由于接入的网络层次不同和标签的特征分布不同,两个分类器的分类结果也会不同。所以采用交叉熵损失做出修正,当主分类器和辅助分类器二者之间的预测距离很大时,就表示该标签是错误的,对于这种不确定的样本就不进行惩罚,即抛弃掉错误的标签样本,将预测距离较小的作为伪标签。之后得到带伪标签的目标域和源域送入域分辨器中,更好地拉近了源域和目标域的特征距离。本发明运算快,效果好,容易部署,首先通过对抗生成网络扩充了数据集,之后通过伪标签模块针对源域和目标域差距不确定的情况下主动学习出一个阈值,不用担心手动设置的阈值将有效的标签当做噪声影响模型的学习效率,可以更好的应用在遥感图像场景分类上。
图3是本发明实施例中采用的三个数据集的部分场景图。这三个数据集分别达到了94.6%,94.1%,95.1%的准确率,可以充分证明了本发明的有效性。
在本发明的描述中,需要理解的是,术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种基于自适应阈值的伪标签遥感图像场景分类方法,其特征在于,具体包括以下步骤:
S1、将遥感图像数据集划分为源域数据集和目标域数据集,并将带有真实标签的源域数据集输入到对抗生成网络中以扩充所述源域数据集;
S2、构建出包括特征提取器和分类器的第一场景分类网络,以及构建出包括生成器和判别器的第二场景分类网络;并利用扩充后的源域数据集对所述第一场景分类网络进行预训练;
S3、采用预训练后的特征提取器提取目标域数据集在不同层级的数据特征,并通过高斯引导将浅层的数据特征对齐;
S4、对预训练后的分类器进行复制,形成主分类器和辅助分类器,将对齐后的目标域数据集中不同层级的数据特征输入到主分类器和辅助分类器,并输出第一分类标签和第二分类标签;
S5、根据目标域数据集的第一分类标签和第二分类标签,计算出两个分类器之间的分类方差以及交叉熵损失;
S6、对分类方差进行正则化处理,将方差正则化作为自适应阈值对所述交叉熵进行修正,并利用修正后的交叉熵损失来更新第一场景分类网络的模型参数,并确定出目标域数据的伪标签;
S7、将带有伪标签的目标域数据和带有真实标签的源域数据输入至第二场景分类网络中,利用对抗训练的方式来更新第二场景分类网络的模型参数;
S8、循环迭代步骤S3-S7,更新并优化预训练后的各个场景分类网络模型参数,直至满足分类目标需求,输出目标域数据集的遥感图像场景分类结果。
2.根据权利要求1所述的一种基于自适应阈值的伪标签遥感图像场景分类方法,其特征在于,所述将带有真实标签的源域数据集输入到对抗生成网络中以扩充所述源域数据集。包括所述对抗生成网络中的生成网络接受一个随机噪声向量,目标是通过该随机噪声向量来生成与源域数据集类似的真实样本,对抗生成网络中的判别网络判断样本是其生成网络生成的还是真实的源域数据集样本,直至损失函数收敛,输出扩充后的源域数据集样本;所述损失函数表示为:
Figure FDA0003530568230000021
其中,V(G,D)表示对抗生成网络中的生成器与判别器的对抗损失,E[]表示求期望,x~Pdata表示真实图像的分布;x表示真实样本,并通过判别网络D()判断x为真实样本的概率;z~Pz(z)表示生成图像的分布;z表示输入到生成网络的噪声,G(z)表示生成网络G()生成的噪声样本z,D(G(z))表示生成样本通过判别网络后,判断其真实样本的概率。
3.根据权利要求1所述的一种基于自适应阈值的伪标签遥感图像场景分类方法,其特征在于,所述通过高斯引导将浅层的数据特征对齐。包括在高斯引导的提前接入下,将两个域的样本分布构建在一个共同的特征空间中,最终更好的促进特征的对齐。
4.根据权利要求1所述的一种基于自适应阈值的伪标签遥感图像场景分类方法,其特征在于,所述将对齐后的目标域数据集中不同层级的数据特征输入到主分类器和辅助分类器,并输出第一分类标签和第二分类标签包括将对齐后的目标域数据集中深层特征输入到主分类器中,浅层特征输入到辅助分类器中,依次得到目标域数据的第一分类标签和第二分类标签。
5.根据权利要求1所述的一种基于自适应阈值的伪标签遥感图像场景分类方法,其特征在于,两个分类器之间的分类方差表示为:
Figure FDA0003530568230000022
其中,Dkl表示两个分类器之间的分类方差的KL散度;F(xt)表示主分类器输出的第一分类标签;Faux(xt)表示了辅助分类器输出的第二分类标签;E[]表示求期望。
6.根据权利要求1所述的一种基于自适应阈值的伪标签遥感图像场景分类方法,其特征在于,所述交叉熵损失表示为:
Figure FDA0003530568230000023
其中,Lce表示交叉熵损失;
Figure FDA0003530568230000031
表示目标域数据的伪标签的one-hot向量;F(xtt)表示利用主分类器输出的第一分类标签,E[ ]表示求期望。
7.根据权利要求1所述的一种基于自适应阈值的伪标签遥感图像场景分类方法,其特征在于,修正后的交叉熵损失表示为:
Lrect=E[exp{-Dkl}Lce+Dkl]
其中,Lrect表示修正后的交叉熵损失,Dkl表示分类方差的KL散度损失,E[ ]表示求期望;Lce表示交叉熵损失。
8.根据权利要求1所述的一种基于自适应阈值的伪标签遥感图像场景分类方法,其特征在于,所述将带有伪标签的目标域数据和带有真实标签的源域数据输入至第二场景分类网络中,利用对抗训练的方式来更新第二场景分类网络的模型参数包括利用第二场景分类网络中的生成器分别提取出目标域数据和源域数据的数据特征,利用域分类器判断出数据特征的来源为目标域数据或源域数据集,通过对抗训练的方式,拉近距源域数据集和目标域数据集的特征距离,并确定出对抗损失,直至所述对抗损失收敛,从而优化第二场景分类网络的模型参数。
CN202210209902.0A 2022-03-03 2022-03-03 一种基于自适应阈值的伪标签遥感图像场景分类方法 Pending CN114549909A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210209902.0A CN114549909A (zh) 2022-03-03 2022-03-03 一种基于自适应阈值的伪标签遥感图像场景分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210209902.0A CN114549909A (zh) 2022-03-03 2022-03-03 一种基于自适应阈值的伪标签遥感图像场景分类方法

Publications (1)

Publication Number Publication Date
CN114549909A true CN114549909A (zh) 2022-05-27

Family

ID=81662036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210209902.0A Pending CN114549909A (zh) 2022-03-03 2022-03-03 一种基于自适应阈值的伪标签遥感图像场景分类方法

Country Status (1)

Country Link
CN (1) CN114549909A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115292532A (zh) * 2022-06-24 2022-11-04 中南大学 基于伪标签一致性学习的遥感图像域适应检索方法
CN116665113A (zh) * 2023-07-28 2023-08-29 广东海洋大学 基于不确定性量化的遥感场景识别方法、系统及介质
CN117765292A (zh) * 2023-12-26 2024-03-26 哈尔滨理工大学 一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115292532A (zh) * 2022-06-24 2022-11-04 中南大学 基于伪标签一致性学习的遥感图像域适应检索方法
CN115292532B (zh) * 2022-06-24 2024-03-15 中南大学 基于伪标签一致性学习的遥感图像域适应检索方法
CN116665113A (zh) * 2023-07-28 2023-08-29 广东海洋大学 基于不确定性量化的遥感场景识别方法、系统及介质
CN116665113B (zh) * 2023-07-28 2023-10-27 广东海洋大学 基于不确定性量化的遥感场景识别方法、系统及介质
CN117765292A (zh) * 2023-12-26 2024-03-26 哈尔滨理工大学 一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法

Similar Documents

Publication Publication Date Title
CN110796168B (zh) 一种基于改进YOLOv3的车辆检测方法
CN107563372B (zh) 一种基于深度学习ssd框架的车牌定位方法
CN109598241B (zh) 基于Faster R-CNN的卫星图像海上舰船识别方法
EP3690741B1 (en) Method for automatically evaluating labeling reliability of training images for use in deep learning network to analyze images, and reliability-evaluating device using the same
CN114549909A (zh) 一种基于自适应阈值的伪标签遥感图像场景分类方法
CN110659601B (zh) 基于中心点的深度全卷积网络遥感图像密集车辆检测方法
CN110555841A (zh) 基于自注意图像融合和dec的sar图像变化检测方法
CN114821152B (zh) 基于前景-类别感知对齐的域自适应目标检测方法及系统
CN114627437B (zh) 一种交通目标识别方法及系统
CN112270285B (zh) 一种基于稀疏表示和胶囊网络的sar图像变化检测方法
CN113052215A (zh) 基于神经网络可视化的声呐图像自动目标识别方法
CN114913498A (zh) 一种基于关键点估计的并行多尺度特征聚合车道线检测方法
CN115100741B (zh) 一种点云行人距离风险检测方法、系统、设备和介质
CN116977710A (zh) 一种遥感图像长尾分布目标半监督检测方法
CN114863122B (zh) 一种基于人工智能的智能化高精度路面病害识别方法
CN116342942A (zh) 基于多级域适应弱监督学习的跨域目标检测方法
CN111666953B (zh) 一种基于语义分割的潮汐带测绘方法及设备
CN116385866B (zh) 基于sar图像的铁路沿线彩钢房变化检测方法和装置
CN115965867A (zh) 基于伪标签和类别词典学习的遥感图像地表覆盖分类方法
CN115630361A (zh) 一种基于注意力蒸馏的联邦学习后门防御方法
CN110084190B (zh) 一种基于ann的剧烈光照环境下实时非结构化道路检测方法
Li et al. A fast detection method for polynomial fitting lane with self-attention module added
CN116778277B (zh) 基于渐进式信息解耦的跨域模型训练方法
Xiaozhou et al. Recognition method of outdoor design scene based on support vector machine and feature fusion
Guo et al. STOD: toward semi-supervised tiny object detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination