CN115115933A - 基于自监督对比学习的高光谱图像目标检测方法 - Google Patents

基于自监督对比学习的高光谱图像目标检测方法 Download PDF

Info

Publication number
CN115115933A
CN115115933A CN202210524826.2A CN202210524826A CN115115933A CN 115115933 A CN115115933 A CN 115115933A CN 202210524826 A CN202210524826 A CN 202210524826A CN 115115933 A CN115115933 A CN 115115933A
Authority
CN
China
Prior art keywords
spectrum
cluster
encoder
contrast
hyperspectral image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210524826.2A
Other languages
English (en)
Inventor
王玉磊
陈昔
张文君
张姗姗
李亚东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN202210524826.2A priority Critical patent/CN115115933A/zh
Publication of CN115115933A publication Critical patent/CN115115933A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/194Terrestrial scenes using hyperspectral data, i.e. more or other wavelengths than RGB
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Remote Sensing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于自监督对比学习的高光谱图像目标检测方法,包括:首先对待检测的高光谱图像进行奇偶波段采样,然后将得到的奇偶波段高光谱图像用于训练相应的对抗卷积自编码器,将训练好的编码器的特征提取部分作为数据增强函数用于数据增强。正负对通过数据增强构建,主干用于提取增强样本的表示向量。然后使用它们对应的对比头将表示向量分别映射到光谱和聚类对比空间。在对比空间中,通过最大化正对的相似性同时最小化负对的相似性来学习光谱和簇的相似性和相异性,以增加目标和背景的表示向量之间的差异。最后,结合空间信息,使用边缘保持滤波器对利用光谱信息通过余弦相似度得到的检测结果进行处理得到最终的检测结果。

Description

基于自监督对比学习的高光谱图像目标检测方法
技术领域
本发明涉及高光谱图像目标检测领域,尤其涉及一种基于自监督对比学习的高光谱图像目标检测方法。
背景技术
高光谱图像是具有丰富光谱信息和空间信息的三维图像,其光谱分辨率高达纳米级,图像中每个像元的光谱是近似连续的曲线。得益于丰富的光谱信息,可以通过光谱对不同地物进行区分。高光谱目标检测由此应运而生并被广泛应用于环境检测、矿产勘测、医疗诊断和军事伪装目标识别等领域,在民用与军事领域发挥着重要的作用。
传统的高光谱图像目标检测方法,如基于子空间投影的正交子空间投影(OSP)方法在已知目标与背景先验信息的情况下通过将像元光谱投影到背景子空间的正交子空间中以抑制背景并突出目标。基于约束能量最小化(CEM)的目标检测器通过构建有限脉冲响应滤波器并以特定增益约束待检测目标光谱的特征同时最小化背景的影响进行目标检测。传统的高光谱目标检测方法对目标光谱固有可变性的适应性弱,导致检测精度下降。近年来,在高光谱图像目标检测领域出现了基于深度学习的方法。从有监督学习的角度出发,为了训练深层的神经网络,针对训练样本不足的情况,出现了基于迁移学习的方法,为了扩充训练样本,将已知有标签高光谱数据集中的同类像元光谱之间相减,不同类像元光谱之间相减,进而扩充了训练样本的数量,但像元光谱之间相减会损失像元精细的光谱特征,对目标检测的精度会产生较大影响。从无监督学习的角度出发,基于目标抑制约束的背景学习高光谱目标检测方法使用CEM方法对待检测高光谱图像进行粗略检测以获得背景样本,在将背景样本送入施加目标抑制约束的对抗性自动编码器(AAE)中进行训练以重建纯净的背景,通过重建背景图像与待检测图像进行比较以实现目标检测。其使用的粗略检测方法对最终目标检测的结果影响很大。
发明内容
根据现有技术存在的问题,本发明公开了一种基于自监督对比学习的高光谱图像目标检测方法,具体包括如下步骤:
构建光谱残差通道注意力机制,有选择性的强调有用信息特征并抑制对目标检测任务不重要的特征;
构建具有光谱残差通道注意力机制的对抗性卷积自动编码器,用于光谱数据增强;
对待检测高光谱图像进行奇偶波段采样,得到奇数波段高光谱图像与偶数波段高光谱图像;
分别用奇数波段高光谱图像与偶数波段高光谱图像训练具有光谱残差通道注意力机制的对抗性卷积自动编码器。对待检测高光谱图像进行奇偶波段采样,得到由奇数波段与偶数波段组成的两个高光谱图像,分别表示为
Figure BDA0003643762760000021
Figure BDA0003643762760000022
在分别用Xodd和Xeven训练具有光谱残差通道注意力机制的对抗性卷积自动编码器。训练分为自编码器网络的训练与对抗网络的训练。在自编码器网络训练阶段,编码器G1(·)与解码器G2(·)组成自编码器网络。对于给定输入像元光谱xi,自编码器网络通过最小化重构误差损失来优化网络中的参数,重构误差损失被定义为:
Figure BDA0003643762760000023
在对抗网络训练阶段,训练可以看成生成器G1(·)(编码器)与鉴别器D(·)之间的博弈过程。对抗训练的目标是能够使生成器输出的潜层编码结果越来越接近预设的先验分布p(z),同时使得鉴别器能够更好地区分特征向量是来自生成器输出的潜层编码还是从先验分布中采样的向量。先验分布预设为多元高斯分布。对抗训练过程的优化目标为:
Figure BDA0003643762760000024
将训练好的两个具有光谱残差通道注意力机制的对抗性卷积自动编码器中编码器的特征提取部分视为起数据增强作用的转换函数,分别表示为gAAE1(·)和gAAE2(·)。然后对奇数波段高光谱图像Xodd与偶数波段高光谱图像Xeven使用对应的训练好的编码器中的特征提取部分进行特征提取得到两种数据增强样本该过程可以表示为:
Da=gAAE1(Xodd)
Db=gAAE2(Xeven)
其中
Figure BDA0003643762760000025
是从待检测高光谱图像X中采样奇数波段组成的高光谱图像Xodd通过编码器特征提取部分gAAE1(·)得到的数据增强样本,
Figure BDA0003643762760000031
是采样偶数波段得到的高光谱图像Xeven通过编码器特征提取部分gAAE2(·)得到的数据增强样本。L是编码器特征提取部分输出特征向量的大小;
构建具有光谱残差通道注意力机制的主干网络,用于在对比学习阶段进行特征提取;
设计光谱对比损失函数,并采用光谱对比损失函数进行光谱级对比学习。从待检测高光谱图像X中随机采样一个批次其中包含N个像元光谱,对其中的每个像元光谱xi执行所设计的数据增强方法,得到2N个数据增强样本
Figure BDA0003643762760000032
对于一个特定像元光谱xi的增强样本
Figure BDA0003643762760000033
其与一个批次的增强样本之间可以构成2N-1对。其中该增强样本
Figure BDA0003643762760000034
与特定像元光谱xi的另一个增强样本
Figure BDA0003643762760000035
之间形成正样本对
Figure BDA0003643762760000036
与剩余的2N-2个样本组成负样本对。使用光谱对比头gS(·)将主干提取的表示映射到光谱对比损失空间中,可以表示为
Figure BDA0003643762760000037
样本对之间的相似性通过余弦距离衡量,可以表示为
Figure BDA0003643762760000038
其中c1,c2∈{a,b}并且i,j∈[1,N]。对于给定增强样本
Figure BDA0003643762760000039
的光谱对比损失可以定义为:
Figure BDA00036437627600000310
其中τs是光谱对比学习中的温度参数用于控制柔软度。为了从光谱水平上学习所有正样本对之间的相似性,因此在每个增强样本上计算光谱对比损失,可以形式化如下:
Figure BDA00036437627600000311
设计聚类对比损失函数,并采用聚类对比损失函数进行聚类级对比学习。给定一个批次其中包含N个像元光谱,表示为
Figure BDA00036437627600000312
经过数据增强后得到增强样本
Figure BDA00036437627600000313
Figure BDA00036437627600000314
然后增强样本送入主干f(·)后得到对应的表示矩阵
Figure BDA00036437627600000315
Figure BDA0003643762760000041
使用聚类对比头gc(·)将Ha和Hb投影到聚类对比空间中得到最终的特征矩阵
Figure BDA0003643762760000042
Figure BDA0003643762760000043
特征矩阵Ya与Yb每一列都代表一个对应的簇,每一行都表示对应样本的软标签。更具体地说,特征矩阵Ya与Yb中的任意行向量
Figure BDA0003643762760000044
Figure BDA0003643762760000045
的维度都为2,行向量
Figure BDA0003643762760000046
Figure BDA0003643762760000047
中的第j个元素表示该样本属于第j个簇的概率。因此从特征矩阵列的角度出发,令
Figure BDA0003643762760000048
Figure BDA0003643762760000049
分别表示特征矩阵Ya与Yb中的第i列。特征矩阵Ya与Yb中的第i列都表示同一个簇,因此将
Figure BDA00036437627600000410
Figure BDA00036437627600000411
配对形成正簇对
Figure BDA00036437627600000412
与剩余样本配对形成2个负簇对。同样使用余弦距离衡量簇对之间的相似性,即:
Figure BDA00036437627600000413
其中c1,c2∈{a,b}并且i,j∈[1,2]。为了区分正簇对与负簇对,定义聚类对比损失为:
Figure BDA00036437627600000414
其中τc是聚类温度系数用于控制柔软度。遍历所有簇,可以得到最终的聚类对比损失,即:
Figure BDA00036437627600000415
其中J(Y)是聚类分配概率的熵,用于避免将大多数样本分配到同一簇,可以形式化如下:
Figure BDA00036437627600000416
其中,
Figure BDA00036437627600000417
Figure BDA00036437627600000418
表示聚类分配概率。对于聚类对比头输出的特征矩阵Ya与Yb,聚类分配概率可以表示为:
Figure BDA00036437627600000419
其中c∈{a,b};
使用数据增强样本在进行光谱级对比学习的同时进行聚类级对比学习,使具有光谱残差通道注意力机制的主干网络在进行光谱相似性与相异性学习的同时,有效地增大对目标与背景提取的表示向量之间的差异;
使用训练好的具有光谱残差通道注意力机制的主干网络分别提取待检测高光谱图像中各个像元光谱与先验目标光谱的表示向量,通过余弦相似性衡量待检测像元光谱表示向量与先验目标光谱表示向量之间的相似性,得到仅利用光谱信息的检测结果。
结合高光谱图像的空间信息,采用边缘保持滤波器对仅利用光谱信息得到的检测结果滤波,获得联合空间-光谱信息的目标检测结果。
由于采用了上述技术方案,本发明提供的一种基于自监督对比学习的高光谱目标检测方法,该方法有效地解决了在高光谱目标检测领域中背景难以抑制的问题,首先通过所述数据增强方法对待检测高光谱图像进行数据增强产生两种增强样本,待检测高光谱图像中的任一像元光谱就存在两个增强样本。同一像元光谱的两个增强样本配对形成正样本对,非同一像元光谱增强样本之间配对形成负样本对。其次,使用主干提取两种增强样本的表示,通过光谱对比头将表示映射到光谱对比空间中学习光谱差异性,通过聚类对比头将表示映射到聚类对比空间中将光谱聚类为目标与背景两个簇,以增强目标与背景的分离度。然后,使用训练好的主干提取先验目标光谱与待检测高光谱图像中每个像元光谱的表示,在根据提取的表示通过余弦相似性来判断待检测高光谱图像中的每个像元光谱与先验目标光谱的相似度,得到仅利用光谱信息进行目标检测的光谱检测结果,最后结合高光谱图像的空间信息,采用边缘保持滤波器对光谱检测结果滤波,得到最终的高光谱图像目标检测结果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中公开的方法的流程图;
图2为光谱残差通道注意力机制(SRCAM)结构图;
图3为具有光谱残差通道注意力机制的对抗性卷积自动编码器结构图;
图4为具有光谱残差通道注意力机制的主干网络结构图;
图5a-图5b为San Diego数据集groundtruth标注图及检测结果图;
图6a-图6b为Urban数据集groundtruth标注图及检测结果图。
图7a-图7b为提出目标检测方法(SCLHTD)与对比目标检测方法在San Diego数据集上的(PD,PF)与(PF,τ)ROC曲线示意图。
图8a-图8b为提出目标检测方法(SCLHTD)与对比目标检测方法在Urban数据集上的(PD,PF)与(PF,τ)ROC曲线示意图。
具体实施方式
为使本发明的技术方案和优点更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整的描述:
如图1所示的一种基于自监督对比学习的高光谱图像目标检测方法,具体包括如下步骤:
S1:构建光谱残差通道注意力机制,有选择性的强调有用信息特征并抑制对目标检测任务不重要的特征;
S1中具体采用如下方式:
S11:为了有选择性地强调信息特征并抑制对目标检测任务不太重要的特征,通过设计的光谱残差通道注意力模块(SRCAM)将不同卷积核对同一像元光谱卷积后得到的特征张量进行自适应的赋予权重,更加关注对于优化目标有利的特征张量。SRCAM的结构如图2所示。给定一组特征张量
Figure BDA0003643762760000061
其中B,C和L分别是批量大小,通道数和特征张量的深度。依次经过CONV1,Batch Normalization,ReLU,CONV2后得到一组特征张量,表示为
Figure BDA0003643762760000062
CONV1与CONV2表示一维卷积层,图2卷积层中的参数kn,ks,s和p分别表示卷积核数量,卷积核大小,卷积步长与填充。SRCAM中两层卷积层的参数相同,BatchNormalization表示批量归一化;
S12:为了获得不同光谱通道之间特征张量的权重,将CONV2层输出的特征张量
Figure BDA0003643762760000063
经过自适应全局平均池化压缩光谱深度维度后得到
Figure BDA0003643762760000064
可以描述为:
Figure BDA0003643762760000065
其中k={1,2,...,B×C};
S13:然后将光谱描述符向量Z通过reshape层转换为二维矩阵
Figure BDA0003643762760000066
并将其送入两层全连接层(FC),得到光谱通道的权重,该过程可以形式化为:
si=δ(W2σ(W1ei))
其中
Figure BDA0003643762760000067
是得到的注意力权重向量,i=[1,2,...B],σ为ReLU激活函数,sigmoid函数δ用于将注意力权重向量的值限定在0到1之间。
Figure BDA0003643762760000071
Figure BDA0003643762760000072
分别是FC1和FC2中的参数;
S14:将获得的光谱通道注意力权重与CONV2层输出的特征张量
Figure BDA0003643762760000073
进行元素相乘,可以描述为:
Figure BDA0003643762760000074
其中Uij是U中第i个特征图的第j个特征向量,sij是S中第i行的第j个元素,i=[1,2,...,B],j=[1,2,...,C];
S15:通过残差连接,SRCAM的最终输出为:
Figure BDA0003643762760000075
S2:构建具有光谱残差通道注意力机制的对抗性卷积自动编码器;
S2中具体采用如下方式:其结构如图3所示,由编码器G1(·),解码器G2(·)和鉴别器D(·)构成。编码器由特征提取与特征映射两个部分组成。特征提取部分gAAE(·)由两个卷积层,两个光谱残差通道注意力模块和一层自适应全局平均池化层组成,其中卷积层与光谱残差通道注意力模块(SRCAM)中的卷积核数量kn,卷积核大小ks,卷积步长s与填充p的具体数值如图3中所示编码器特征提取部分,自适应全局平均池化层用于将特征张量固定为特定形状,经过reshape操作后可以得到固定维度的特征向量。编码器中的特征映射部分是由全连接层FC1与FC2构成,用于将编码器特征提取部分gAAE(·)提取的特征向量映射到潜层空间中。解码器由两层全连接层FC3与FC4,两个转置卷积层与两个转置光谱残差通道注意力模块(DSRCAM)组成。其中DSRCAM是将SRCAM中的卷积层更换为转置卷积层而构成的模块。全连接层FC3与FC4用于将潜层编码映射为特定维数以便解码器后续部分重建该像元光谱。卷积层与DSRCAM中的具体参数如图3解码器部分所示。为了减少模型内部斜变量转移,每一层卷积层后都采用批量归一化。除输出层外其余层都与修正线性单元(ReLU)相结合。判别器由两层全连接层FC5和FC6组成,FC5的激活函数使用ReLU,FC6使用双曲正切函数(Tanh),将输出特征向量的值限制在[-1,1]的范围内;
S3:对待检测高光谱图像进行奇偶波段采样,得到奇数波段高光谱图像与偶数波段高光谱图像,分别表示为
Figure BDA0003643762760000076
Figure BDA0003643762760000077
S4:分别用奇数波段高光谱图像与偶数波段高光谱图像训练具有光谱残差通道注意力机制的对抗性卷积自动编码器,训练分为自编码器网络的训练与对抗网络的训练;
S4中具体采用如下方式:
S41:在自编码器网络训练阶段,编码器G1(·)与解码器G2(·)组成自编码器网络。对于给定输入像元光谱,自编码器网络的训练通过最小化重构误差损失来优化网络中的参数,重构误差损失被定义为:
Figure BDA0003643762760000081
S42:在对抗网络训练阶段,训练可以看成生成器G1(·)(编码器)与鉴别器D(·)之间的博弈过程。对抗训练的目标是能够使生成器输出的潜层编码结果越来越接近预设的先验分布p(z),同时使得鉴别器能够更好地区分特征向量是来自生成器输出的潜层编码还是从先验分布中采样的向量。先验分布预设为多元高斯分布。对抗训练过程的优化目标为:
Figure BDA0003643762760000082
S5:光谱数据增强;
S5中具体采用如下方式:将训练好的两个具有光谱残差通道注意力机制的对抗性卷积自动编码器中编码器的特征提取部分视为起数据增强作用的转换函数,分别表示为gAAE1(·)和gAAE2(·)。然后对奇数波段高光谱图像Xodd与偶数波段高光谱图像Xeven使用对应的训练好的编码器中的特征提取部分进行特征提取得到两种数据增强样本该过程可以描述为:
Da=gAAE1(Xodd)
Db=gAAE2(Xeven)
其中
Figure BDA0003643762760000083
是从待检测高光谱图像X中采样奇数波段组成的高光谱图像Xodd通过编码器特征提取部分gAAE1(·)得到的数据增强样本,
Figure BDA0003643762760000084
是采样偶数波段得到的高光谱图像Xeven通过编码器特征提取部分gAAE2(·)得到的数据增强样本。L是编码器特征提取部分输出特征向量的大小;
S6:构建具有光谱残差通道注意力机制的主干网络,用于在对比学习阶段进行特征提取,其结构如图4所示;
S7:设计光谱对比损失函数,采用光谱对比损失函数进行光谱级对比学习;
S7中具体采用如下方式:
S71:从待检测高光谱图像X中随机采样一个批次其中包含N个像元光谱,对其中的每个像元光谱xi执行所设计的数据增强方法,得到2N个数据增强样本
Figure BDA0003643762760000085
对于一个特定像元光谱xi的增强样本
Figure BDA0003643762760000086
其与一个批次的增强样本之间可以构成2N-1对。其中该增强样本
Figure BDA0003643762760000091
与特定像元光谱xi的另一个增强样本
Figure BDA0003643762760000092
之间形成正样本对
Figure BDA0003643762760000093
与剩余的2N-2个样本组成负样本对。用光谱对比头gS(·)将主干提取的表示映射到光谱对比损失空间中通过
Figure BDA0003643762760000094
样本对之间的相似性通过余弦距离衡量,可以表示为
Figure BDA0003643762760000095
其中c1,c2∈{a,b}并且i,j∈[1,N]。
S72:对于给定增强样本
Figure BDA0003643762760000096
的光谱对比损失可以定义为:
Figure BDA0003643762760000097
其中τs是光谱对比学习中的温度参数用于控制柔软度。
S73:为了从光谱水平上学习所有正样本对之间的相似性,因此在每个增强样本上计算光谱对比损失,可以形式化如下:
Figure BDA0003643762760000098
S8:设计聚类对比损失函数,采用聚类对比损失函数进行聚类级对比学习;
S8中具体采用如下方式:
S81:给定一个批次其中包含N个像元光谱,表示为
Figure BDA0003643762760000099
经过数据增强后得到增强样本
Figure BDA00036437627600000910
Figure BDA00036437627600000911
然后增强样本送入主干f(·)后得到对应的表示矩阵
Figure BDA00036437627600000912
Figure BDA00036437627600000913
最后使用聚类对比头gc(·)将Ha和Hb投影到聚类对比空间中得到最终的特征矩阵
Figure BDA00036437627600000914
Figure BDA00036437627600000915
分别通过Ya=gc(Ha)与Yb=gc(Hb)。特征矩阵Ya与Yb每一列都代表一个对应的簇,每一行都表示对应样本的软标签。更具体地说,特征矩阵Ya与Yb中的任意行向量
Figure BDA00036437627600000916
Figure BDA00036437627600000917
的维度都为2,行向量
Figure BDA00036437627600000918
Figure BDA00036437627600000919
中的第j个元素表示该样本属于第j个簇的概率。因此从特征矩阵列的角度出发,令
Figure BDA00036437627600000920
Figure BDA00036437627600000921
分别表示特征矩阵Ya与Yb中的第i列。特征矩阵Ya与Yb中的第i列都表示同一个簇,因此将
Figure BDA00036437627600000922
Figure BDA00036437627600000923
配对形成正簇对
Figure BDA00036437627600000924
与剩余样本配对形成2个负簇对。同样使用余弦距离衡量簇对之间的相似性,即:
Figure BDA00036437627600000925
其中c1,c2∈{a,b}并且i,j∈[1,2]。
S82:为了区分正簇对与负簇对,定义聚类对比损失为:
Figure BDA0003643762760000101
其中τc是聚类温度系数用于控制柔软度。
S83:遍历所有簇,可以得到最终的聚类对比损失,即:
Figure BDA0003643762760000102
其中J(Y)是聚类分配概率的熵,用于避免将大多数样本分配到同一簇,可以形式化如下:
Figure BDA0003643762760000106
其中,
Figure BDA0003643762760000103
Figure BDA0003643762760000104
表示聚类分配概率。对于聚类对比头输出的特征矩阵Ya与Yb,聚类分配概率可以表示为:
Figure BDA0003643762760000105
其中c∈{a,b};
S9:联合光谱级对比学习与聚类级对比学习,目标函数由光谱对比损失和聚类对比损失组成,可以表示为:
L=Lspectral+Lcluster
S10:使用训练好的具有光谱残差通道注意力机制的主干网络分别提取待检测高光谱图像中各个像元光谱与先验目标光谱的表示向量,通过余弦相似性衡量待检测像元光谱表示向量与先验目标光谱表示向量之间的相似性,得到仅利用光谱信息的检测结果;
S11:结合高光谱图像的空间信息,采用边缘保持滤波器对仅利用光谱信息得到的检测结果滤波,获得联合空间-光谱信息的目标检测结果。
下面将在两组公开真实的高光谱图像数据集上对本发明提供的一种基于自监督对比学习的高光谱目标检测方法进行评估与评价。
第一组实验数据为San Diego真实高光谱图像数据集,是由机载可见光\红外成像光谱仪(AVIRIS)拍摄美国加利福尼亚州圣地亚哥机场区域得到的。原始图像尺寸为400×400,波长范围为370到2510nm,图像的空间分辨率为3.5m,光谱分辨率为10nm。实验选取120×120大小的部分,其中目标为飞机,共有58个目标像元,去除低信噪比和水吸收波段后,剩余189个波段。
第二组实验数据为Urban真实高光谱图像数据集,是由AVIRIS传感器在美国德克萨斯州海岸捕获的,每个像元的空间分辨率为17.2米。Urban数据集有100×100个像元,去除低信噪比波段后剩余204个波段,一共有67个像元被认为是目标用于检测。
本发明提供一种基于自监督对比学习的高光谱目标检测方法在两组真实高光谱图像数据上进行检测的检测结果图如图5b,图6b所示。采用接收机工作特性曲线(ROC)与曲线下面积(AUC)定量分析检测结果。对于San Diego数据集,(PD,PF)与(PF,τ)的ROC曲线如图7a与7b所示,曲线下面积
Figure BDA0003643762760000113
Figure BDA0003643762760000114
的值为别为0.9986与0.0089。对于Urban数据集,(PD,PF)与(PF,τ)的ROC曲线如图8a与8b所示,曲线下面积
Figure BDA0003643762760000111
Figure BDA0003643762760000112
的值为别为0.9947与0.0244。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (5)

1.一种基于自监督对比学习的高光谱目标检测方法,其特征在于包括:
构建光谱残差通道注意力机制,有选择性的强调有用信息特征并抑制对目标检测任务不重要的特征;
构建具有光谱残差通道注意力机制的对抗性卷积自动编码器,所述对抗性卷积自动编码器对光谱进行数据增强;
对待检测高光谱图像进行奇偶波段采样,得到奇数波段高光谱图像和偶数波段高光谱图像;
分别用奇数波段高光谱图像和偶数波段高光谱图像训练具有光谱残差通道注意力机制的对抗性卷积自动编码器;
将训练好的对抗性卷积自动编码器中编码器的特征提取部分视为起数据增强作用的转换函数,再对奇数波段高光谱图像和偶数波段高光谱图像使用对应的训练好的编码器中的特征提取部分进行特征提取得到两种数据增强样本;
构建具有光谱残差通道注意力机制的主干网络,用于在对比学习阶段进行特征提取;
设计光谱对比损失函数和聚类对比损失函数,采用光谱对比损失函数进行光谱级对比学习和采用聚类对比损失函数进行聚类级对比学习;
使用数据增强样本在进行光谱级对比学习的同时进行聚类级对比学习,使具有光谱残差通道注意力机制的主干网络在进行光谱相似性与相异性学习的同时,有效地增大对目标和背景提取的表示向量之间的差异;
使用训练好的具有光谱残差通道注意力机制的主干网络分别提取待检测高光谱图像中各个像元光谱和先验目标光谱的表示向量,通过余弦相似性衡量待检测像元光谱表示向量和先验目标光谱表示向量之间的相似性,从而得到检测结果。
2.根据权利要求1所述的方法,其特征在于:所述具有光谱残差通道注意力机制的对抗性卷积自动编码器的训练过程为:
对待检测高光谱图像进行奇偶波段采样,得到由奇数波段与偶数波段组成的两个高光谱图像,分别表示为
Figure FDA0003643762750000011
Figure FDA0003643762750000012
分别使用Xodd与Xeven训练具有光谱残差通道注意力机制的对抗性卷积自动编码器,训练分为自编码器网络的训练和对抗网络的训练,在自编码器网络训练阶段,编码器G1(·)与解码器G2(·)组成自编码器网络,重构损失被定义为:
Figure FDA0003643762750000021
其中xi是输入像元光谱,在对抗网络训练阶段,将训练定义成生成器G1(·)与鉴别器D(·)之间的博弈过程,先验分布p(z)预设为多元高斯分布,对抗训练过程的优化目标为:
Figure FDA0003643762750000022
3.根据权利要求1所述的方法,其特征在于:所述对抗性卷积自动编码器对光谱进行数据增强时:
将训练好的两个具有光谱残差通道注意力机制的对抗性卷积自动编码器中编码器的特征提取部分视为起数据增强作用的转换函数,分别表示为gAAE1(·)和gAAE2(·),对奇数波段高光谱图像Xodd与偶数波段高光谱图像Xeven使用对应的训练好的编码器中的特征提取部分进行特征提取得到两种数据增强样本,此过程表示为:
Da=gAAE1(Xodd)
Db=gAAE2(Xeven)
其中
Figure FDA0003643762750000023
是从待检测高光谱图像X中采样奇数波段组成的高光谱图像Xodd通过编码器特征提取部分gAAE1(·)得到的数据增强样本,
Figure FDA0003643762750000024
是采样偶数波段得到的高光谱图像Xeven通过编码器特征提取部分gAAE2(·)得到的数据增强样本,L是编码器特征提取部分输出特征向量的大小。
4.根据权利要求1所述的方法,其特征在于:所述采用光谱对比损失函数进行光谱级对比学习时:
从待检测高光谱图像X中随机采样一个批次,该批次包含N个像元光谱,对该批次中的每个像元光谱xi执行所设计的数据增强方法,得到2N个数据增强样本
Figure FDA0003643762750000025
对于一个特定像元光谱xi的增强样本
Figure FDA0003643762750000026
该增强样本
Figure FDA0003643762750000027
与一个批次的增强样本之间构成2N-1对,其中该增强样本
Figure FDA0003643762750000028
与特定像元光谱xi的另一个增强样本
Figure FDA0003643762750000029
之间形成正样本对
Figure FDA00036437627500000210
与剩余的2N-2个数据增强样本组成负样本对,用光谱对比头gS(·)将主干提取的表示映射到光谱对比损失空间中,该过程表示为
Figure FDA0003643762750000031
样本对之间的相似性通过余弦距离衡量,表示为
Figure FDA0003643762750000032
其中c1,c2∈{a,b}并且i,j∈[1,N],将给定增强样本
Figure FDA0003643762750000033
的光谱对比损失定义为:
Figure FDA0003643762750000034
其中τs是光谱对比学习中的温度参数,用于控制柔软度,最后在每个增强样本上计算光谱对比损失:
Figure FDA0003643762750000035
5.根据权利要求1所述的方法,其特征在于:采用聚类对比损失函数进行聚类级对比学习时:
设定一个包含N个像元光谱的批次,表示为
Figure FDA0003643762750000036
经过数据增强后得到增强样本
Figure FDA0003643762750000037
Figure FDA0003643762750000038
将增强样本输入主干f(·)后得到对应的表示矩阵
Figure FDA0003643762750000039
Figure FDA00036437627500000310
使用聚类对比头gc(·)将Ha和Hb投影到聚类对比空间中得到特征矩阵
Figure FDA00036437627500000311
Figure FDA00036437627500000312
特征矩阵Ya和Yb每一列都代表一个对应的簇,每一行都表示对应样本的软标签,其中特征矩阵Ya和Yb中的任意行向量
Figure FDA00036437627500000313
Figure FDA00036437627500000314
的维度都为2,行向量
Figure FDA00036437627500000315
Figure FDA00036437627500000316
中的第j个元素表示该样本属于第j个簇的概率,从特征矩阵列的角度出发,令
Figure FDA00036437627500000317
Figure FDA00036437627500000318
分别表示特征矩阵Ya和Yb中的第i列,特征矩阵Ya和Yb中的第i列都表示同一个簇,因此将
Figure FDA00036437627500000319
Figure FDA00036437627500000320
配对形成正簇对
Figure FDA00036437627500000321
Figure FDA00036437627500000322
与剩余样本配对形成2个负簇对,同样使用余弦距离衡量簇对之间的相似性,即:
Figure FDA00036437627500000323
其中c1,c2∈{a,b}并且i,j∈[1,2],为了区分正簇对与负簇对,定义聚类对比损失为:
Figure FDA0003643762750000041
其中τc是聚类温度系数用于控制柔软度,遍历所有簇得到最终的聚类对比损失,即:
Figure FDA0003643762750000042
其中J(Y)是聚类分配概率的熵,用于避免将大多数样本分配到同一簇,J(Y)形式化如下:
Figure FDA0003643762750000043
其中,
Figure FDA0003643762750000044
Figure FDA0003643762750000045
表示聚类分配概率,对于聚类对比头输出的特征矩阵Ya与Yb,聚类分配概率表示为:
Figure FDA0003643762750000046
其中c∈{a,b}。
CN202210524826.2A 2022-05-13 2022-05-13 基于自监督对比学习的高光谱图像目标检测方法 Pending CN115115933A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210524826.2A CN115115933A (zh) 2022-05-13 2022-05-13 基于自监督对比学习的高光谱图像目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210524826.2A CN115115933A (zh) 2022-05-13 2022-05-13 基于自监督对比学习的高光谱图像目标检测方法

Publications (1)

Publication Number Publication Date
CN115115933A true CN115115933A (zh) 2022-09-27

Family

ID=83327132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210524826.2A Pending CN115115933A (zh) 2022-05-13 2022-05-13 基于自监督对比学习的高光谱图像目标检测方法

Country Status (1)

Country Link
CN (1) CN115115933A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116563711A (zh) * 2023-05-17 2023-08-08 大连民族大学 基于动量更新的二分类编码器网络的高光谱目标检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116563711A (zh) * 2023-05-17 2023-08-08 大连民族大学 基于动量更新的二分类编码器网络的高光谱目标检测方法
CN116563711B (zh) * 2023-05-17 2024-02-09 大连民族大学 基于动量更新的二分类编码器网络的高光谱目标检测方法

Similar Documents

Publication Publication Date Title
CN112836773B (zh) 一种基于全局注意力残差网络的高光谱图像分类方法
CN109376804B (zh) 基于注意力机制和卷积神经网络高光谱遥感图像分类方法
CN109543602B (zh) 一种基于多视角图像特征分解的行人再识别方法
CN110348399B (zh) 基于原型学习机制和多维残差网络的高光谱智能分类方法
CN111310666B (zh) 一种基于纹理特征的高分辨率影像地物识别与分割方法
CN113361485B (zh) 基于光谱空间注意力融合和可变形卷积残差网络的高光谱图像分类方法
CN112200090B (zh) 基于交叉分组空谱特征增强网络的高光谱图像分类方法
CN113139512B (zh) 基于残差和注意力的深度网络高光谱影像分类方法
CN111881953A (zh) 基于局部二值模式和knn分类器的遥感高光谱图像分类方法
CN115222994A (zh) 一种基于混合光谱网络和多头自注意力机制的高光谱图像分类方法
CN110569860A (zh) 结合判别分析和多核学习的图像有趣性二分类预测方法
CN115187861A (zh) 一种基于深度孪生网络的高光谱图像变化检测方法及系统
CN115564996A (zh) 一种基于注意力联合网络的高光谱遥感图像分类方法
CN112580480A (zh) 一种高光谱遥感影像分类方法及装置
Fırat et al. Spatial-spectral classification of hyperspectral remote sensing images using 3D CNN based LeNet-5 architecture
CN114048810A (zh) 一种基于多层次特征提取网络的高光谱图像分类方法
CN113537239A (zh) 一种基于全局关系感知注意力的高光谱图像波段选择方法
Liu et al. Hyperspectral remote sensing imagery generation from RGB images based on joint discrimination
CN115115933A (zh) 基于自监督对比学习的高光谱图像目标检测方法
CN115439679A (zh) 一种联合多注意及Transformer的高光谱图像分类方法
Raza Shah et al. Hyperspectral anomaly detection: a performance comparison of existing techniques
CN113052130B (zh) 基于深度残差网络和边缘保护滤波的高光谱影像分类方法
CN105719323A (zh) 一种基于优化图谱理论的高光谱降维方法
CN117115675A (zh) 一种跨时相轻量化空谱特征融合高光谱变化检测方法、系统、设备及介质
CN110852304B (zh) 基于深度学习方法的高光谱数据处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination