CN113655479B

CN113655479B - 基于可变形卷积和双注意力的小样本sar目标分类方法

Info

Publication number: CN113655479B
Application number: CN202110938580.9A
Authority: CN
Inventors: 李明; 郑佳; 张鹏; 吴艳; 辛欣悦; 徐大治; 王洪菠
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2021-08-16
Filing date: 2021-08-16
Publication date: 2023-07-07
Anticipated expiration: 2041-08-16
Also published as: CN113655479A

Abstract

本发明提出了一种基于混合损失与图注意力的小样本SAR目标分类方法，实现步骤为：(1)获取训练任务集

和测试任务集

(2)构建基于可变形卷积和双注意力的网络模型H；(3)对H进行迭代训练；(4)获取小样本SAR图像的目标分类结果。本发明特征提取模块中的可变形卷积网络能够对所有SAR图像提取更多有效的特征，且可过滤掉无关的特征，自注意力机制模块和互注意力机制模块能够提取到每个特征向量组的细粒度自相关特征和互相关特征，避免了现有技术中因目标的有效特征和细粒度特征提取不充分对分类精度的影响，有效地提高了分类准确率。

Description

基于可变形卷积和双注意力的小样本SAR目标分类方法

技术领域

本发明属于雷达图像处理技术领域，涉及一种SAR目标分类方法，具体涉及一种基于可变形卷积和双注意力的小样本SAR目标分类方法，可用于获取SAR图像数量较少情况下的SAR目标分类。

背景技术

合成孔径雷达(Synthetic Aperture Radar，SAR)是一种先进的主动式微波对地观测设备，具有全天候、全天时、高分辨率和不受光线影响等优点，因此，广泛应用于目标检测、城市规划、海水监测及灾害方面的应急与救灾等领域。

SAR目标分类，是一种根据不同类别的目标各自在图像信息中所反映的不同特征，把不同类别的目标区分开来的图像处理方法。SAR目标分类可基于色彩、纹理、形状、空间关系等图像特征对目标进行分类。SAR目标分类方法可分为基于传统的分类方法和基于深度学习的分类方法。基于传统的SAR目标分类方法是基于色彩、纹理、形状、空间关系等图像特征对图像目标进行分类。通常采用人工选取特征、设计分类器，然而这往往需要依据大量的经验和较强的专业知识来针对特定目标设定特定算法，耗时长且难以推广，同时无法获得较好的分类精度。近年来随着深度学习的发展，涌现出了许多VGG、ResNet、DenseNet等一系列强大的卷积神经网络，可对SAR目标自动提取更加稳健的特征，从而取得较好的分类结果，得到了研究人员的广泛应用。

但是，SAR所观测的一些目标为非合作的小样本SAR目标，即所能获取的SAR图像数量较少，而基于深度学习的SAR目标分类方法通常需要大量的训练样本来训练模型以在测试样本上获得高的分类准确率，对于小样本SAR目标，这些基于深度学习的SAR目标分类方法会由于训练样本的不足出现分类准确率低的问题。

为了解决这个问题，现有技术通过改进模型结构，设计对样本数量要求较低的特殊模型来提高小样本SAR目标的分类准确率。例如申请公布号为CN113095416A，名称为“基于混合损失与图注意力的小样本SAR目标分类方法”的专利申请，公开了一种基于混合损失与图注意力的小样本SAR目标分类方法，该方法通过训练任务集的分类损失值l-C和训练任务集的嵌入损失值l-E的加权和组成训练任务集的混合损失值l，对嵌入网络模块E中所有第一卷积层和第二卷积层的参数、图注意力网络模块G中所有第一全连接层和第二全连接层的参数进行更新，增强了同种SAR目标类别的特征之间的相似性和不同SAR目标类别的特征之间的差异性，且通过数据增强有效降低了模型训练过程中过拟合的风险，提高了小样本SAR目标的分类精度。但是该方法仍未充分提取SAR目标的有效特征和细粒度特征，即提取的特征不稳健，导致对SAR目标分类的精度依然较低。

发明内容

本发明的目的在于克服上述现有技术存在的缺陷，提出了一种基于可变形卷积和双注意力的小样本SAR目标分类方法，用于解决现有技术中存在的因目标的有效特征和细粒度特征提取不充分导致的分类准确率较低的技术问题。

为实现上述目的，本发明采取的技术方案包括如下步骤：

(1)获取训练任务集

和测试任务集/>

(1a)获取包含C个不同目标类别共U幅大小为h×h的合成孔径雷达SAR图像，每个目标类别对应M幅SAR图像，其中C≥10，M≥200，64≤h≤2560，U≥2000；

(1b)对每幅SAR图像中的目标类别进行标记，并随机选取C_train个目标类别对应的C_train×M幅SAR图像及其标签组成训练数据集

将其余的C_test个目标类别对应的C_test×M幅SAR图像及其标签组成测试数据集/>

其中C_train+C_test＝C，/>

∩表示交集，C_train＞C/2，C_train×M+C_test×M＝U；

(1c)对从训练数据集

中随机选取的包含C_test个目标类别的z＝C_test×M幅SAR图像中的每幅SAR图像的标签进行one-hot编码，得到/>

对应的标签向量集合，并选取该标签向量集合中z₁＝C_test×K个标签向量及其对应的SAR图像组成训练支撑样本集

将其余z₂＝C_test(M-K)个标签向量及其对应的SAR图像组成训练查询样本集/>

然后将/>

与每个训练查询样本/>

进行组合，得到训练任务集/>

其中，/>

表示由SAR图像及其对应的标签向量组成的第a个训练支撑样本，/>

表示由SAR图像及其对应的标签向量组成的第b个训练查询样本，1≤K≤10，/>

表示第b个训练任务，/>

(1d)对从测试数据集

对应的标签向量集合，并选取该标签向量集合中z₁＝C_test×K个标签向量及其对应的SAR图像组成测试支撑样本集

将其余z₂＝C_test(M-K)个标签向量及其对应的SAR图像组成测试查询样本集/>

然后将/>

与每个测试查询样本/>

进行组合，得到测试任务集/>

其中，/>

表示由SAR图像及其对应的标签向量组成的第e测试支撑样本，/>

表示由SAR图像及其对应的标签向量组成的第g个测试查询样本，/>

表示第g个测试任务，/>

(2)构建基于可变形卷积和双注意力的网络模型H：

构建包含顺次级联的基于可变形卷积网络的特征提取模块D、并形排布的自注意力机制模块E₁和互注意力机制模块E₂、特征融合模块E₃、拼接模块E₄、图神经网络模块G的小样本SAR目标分类网络模型H，其中，特征提取模块D包括级联的卷积模块D₁和多个可变形卷积模块D₂；自注意力机制模块E₁和互注意力机制模块E₂均包括多个卷积模块D₁、多个reshape模块R₁、多个矩阵相乘模块R₂，矩阵求和模块R₃，E₁还包括自注意力关系模块D₃，E₂还包括互注意力关系模块D₄；图神经网络模块G包括相间排列的多个邻接矩阵更新模块G₁和图卷积模块G₂；

(3)对基于可变形卷积和双注意力的小样本SAR目标分类网络模型H进行迭代训练：

(3a)初始化迭代次数为n，最大迭代次数为N，N≥1000，第n次迭代的SAR目标分类网络模型为Hⁿ，并令n＝0，H＝Hⁿ；

(3b)将训练任务集

作为基于可变形卷积和双注意力的小样本SAR目标分类方法H的输入，特征提取模块D对每个训练任务进行特征提取，得到特征向量组集合/>

(3c)自注意力机制模块E₁、互注意力机制模块E₂对

中每个特征向量组进行自相关特征提取、互相关特征提取，得到自相关特征向量组集合F_s和互相关特征向量组集合F_c；

(3d)特征融合模块E₃对自相关特征向量组集合F_s和互相关特征向量组集合F_c对应位置向量进行特征融合，得到融合特征向量组集F_sc；拼接模块E₄对特征向量组F_sc中每个特征向量与对应SAR图像的标签向量进行拼接，得到向量组集F_sc'；

(3e)将F_sc'作为图神经网络模块G的顶点特征，图神经网络模块G的最后一层softmax将顶点特征映射到K分类预测，最终得到K个特征，每个特征代表每个类的概率，概率最大的即为预测的类别，由此得到预测标签集合y＝{y₁,y₂,...,y_m,...,y_M}，其中，M≥5，y_m表示第m个训练样本对应的预测标签；

(3f)采用交叉熵损失函数，并通过每个预测标签y_m和其对应的真实标签

计算Hⁿ的损失值L_s，然后求取L_s对权值参数ω_s的偏导/>

再采用梯度下降法，通过将/>

在Hⁿ中进行反向传播的方式对权值参数ω_s进行更新；

(3g)判断n≥N是否成立，若是，得到训练好的小样本SAR目标分类网络模型H′，否则，令n＝n+1，并执行步骤(3b)；

(4)获取小样本SAR目标的目标分类结果：

将测试任务集

作为训练好的基于可变形卷积和双注意力的小样本SAR目标分类网络模型H′的输入进行前向传播，得到所有测试任务集/>

的预测标签。

本发明与现有的技术相比具有以下优点：

本发明所构建的目标分类网络模型包含有基于可变形卷积网络的特征提取模块，以及并形排布的自注意力机制模块和互注意力机制模块，在对该目标分类网络模型进行训练以及获取小样本SAR图像的目标分类结果的过程中，特征提取模块中的可变形卷积网络能够对所有SAR图像提取更多有效的特征，且可过滤掉无关的特征，自注意力机制模块和互注意力机制模块能够提取到每个特征向量组的细粒度自相关特征和互相关特征，避免了现有技术中因目标的有效特征和细粒度特征提取不充分对分类精度的影响，仿真结果表明，本发明有效地提高了分类准确率。

附图说明

图1是本发明的实现流程图。

图2是本发明对基于可变形卷积与双注意力的网络模型H进行迭代训练的实现流程图。

图3是本发明获取小样本SAR图像的目标分类结果的实现流程图。

具体实施方式

以下结合附图和具体实施例，对本发明作进一步详细描述。

参照图1，本发明包括如下步骤：

步骤1)获取训练任务集

和测试任务集/>

(1a)获取包含C个不同目标类别共U幅大小为h×h的合成孔径雷达SAR图像，每个目标类别对应M幅SAR图像，其中C≥10，M≥200，h＝600，U≥2000；

其中C_train+C_test＝C，/>

∩表示交集，C_train＞C/2，C_train×M+C_test×M＝U；

(1c)对从训练数据集

然后将/>

与每个训练查询样本/>

进行组合，得到训练任务集/>

其中，/>

表示第b个训练任务，/>

(1d)对从测试数据集

对应的标签向量集合，并选取该标签向量集合中z₁＝C_test×K个标签向量及其对应的SAR图像组成测试支撑样本集/>

将其余z₂＝C_test(M-K)个标签向量及其对应的SAR图像组成测试查询样本集

然后将/>

与每个测试查询样本/>

进行组合，得到测试任务集

其中，/>

表示第g个测试任务，/>

步骤2)构建基于可变形卷积和双注意力的小样本SAR目标分类网络模型H：

特征提取模块D中的卷积模块D₁包含依次层叠的卷积核个数为64的第一卷积层、批量归一化层、Leaky Relu激活层和最大池化层；可变形卷积模块D₂包含依次层叠的卷积核个数均为128的三个可变形卷积层、批量归一化层、Leaky Relu激活层和最大池化层，第一卷积层和可变形卷积层的卷积核大小均为3×3，步长和填充均为1，最大池化层的池化核大小均为2×2，步长均为2；

自注意力机制模块E₁和互注意力机制模块E₂包括的卷积模块D₁、reshape模块R₁及矩阵相乘模块R₂的数量分别为4、4，4、2，2、2，其中，E₁中矩阵求和模块R₃的数量为1，E₂中余弦相似度模块R₄的数量为1，E₁和E₂中所有的卷积核大小均为1×1，步长和填充均为1；

自注意力机制模块E₁的具体结构为顺次级联的并形排布的自注意力关系模块D₃和卷积模块D₁、矩阵相乘模块R₂、Reshape模块R₁、卷积模块D₁、矩阵求和模块R₃，其中，自注意力关系模块D₃包含顺次级联的并形排布的两个卷积模块D₁和Reshape模块R₁、矩阵相乘模块R₂；

该互注意力机制模块E₂的具体结构为互注意力关系模块D₄、并形排布的两个矩阵相乘模块R₂、并形排布的两个卷积模块D₁，其中，互注意力关系模块D₄包含顺次级联的并行排布的两个卷积模块D₁、余弦相似度模块R₄；

图神经网络模块G包括两个相间排列的邻接矩阵更新模块G₁和图卷积模块G₂；邻接矩阵更新模块G₁包括顺次级联的绝对值求解模块R₅、第一全连接模块F₁、第二全连接模块F₂、第三全连接模块F₃、第四全连接模块F₄、第五全连接模块F₅，其中，第一、二、三、四全连接层模块均包含顺次连接的全连接层、批量归一化层、Leaky Relu层，第一、二全连接层模块中的全连接层的神经元个数为128，第三、四全连接层模块中的全连接层的神经元个数为64，第五全连接模块包含一个全连接层，神经元个数为1；图卷积模块G₂包含顺次连接的图卷积模块D₅、批量归一化层、Leaky Relu、softmax层。

步骤3)对基于可变形卷积和双注意力的小样本SAR目标分类网络模型H进行迭代训练，实现步骤如图2所示：

(3b)将训练任务集

(3c)自注意力机制模块E₁、互注意力机制模块E₂对

(3d)特征融合模块E₃对自相关特征向量组集合F_s和互相关特征向量组集合F_c对应位置向量进行特征融合，得到融合特征向量组集F_sc；拼接模块E₄对特征向量组F_sc中每个特征向量与对应SAR图像的标签向量进行拼接得到向量组集F_sc'；

计算Hⁿ的损失值L_s，然后求取L_s对权值参数ω_s的偏导/>

再采用梯度下降法，通过将/>

在Hⁿ中进行反向传播的方式对权值参数ω_s进行更新，计算、更新过程分别为：

其中，ln表示以自然常数e为底的对数，

表示ω_s的更新结果，η表示L_s的学习率，

表示求导操作。

交叉熵损失函数可表示如下：

其中，z₂＝C_test(M-K)，z₃＝C_testK+1，

表示训练任务/>

对应的训练融合特征向量组，满足a≠C_testK+1的/>

表示训练支撑样本/>

对应的训练特征融合向量，/>

表示训练查询样本/>

对应的训练特征融合向量，log(·)表示以自然常数e为底的对数，exp(·)表示以自然常数e为底的指数，∑表示连续求和，/>

表示对训练任务/>

中的训练支撑样本集/>

包括的第c个目标类别的每幅SAR图像对应的每个训练特征融合向量/>

求均值得到的第c个目标类别的类中心，/>

表示和训练任务/>

中的训练查询样本/>

包含的SAR图像中的目标属于同一个目标类别的类中心，d表示度量函数，d(p,q)＝||p-q||²。

步骤4)获取小样本SAR图像的目标分类结果，实现步骤如图3所示：

将测试任务集

的预测标签。

(4a)训练好的网络模块H′对测试任务集

中的每个测试任务/>

包含的每幅SAR图像通过特征提取模块D进行特征提取，得到测试特征向量组集合/>

其中，z₂＝C_test(M-K)，z₃＝C_testK+1，

表示测试任务/>

对应的测试特征向量组，满足e≠z₃的/>

表示测试支撑样本/>

对应的测试特征向量，/>

表示测试查询样本

对应的测试特征向量；

(4b)将测试特征向量组集合

通过自注意力机制模块E₁和互注意力机制模块E₂对/>

中每个测试特征向量组进行自相关特征提取、互相关特征提取，得到自相关特征向量组集合/>

和互相关特征向量组集合/>

其中，z₂＝C_test(M-K)，z₃＝C_testK+1，

分别表示测试任务/>

对应的自相关特征向量组、互相关特征向量组，满足e≠C_testK+1的/>

表示测试支撑样本/>

对应的测试特征向量，测试自相关特征向量、测试互相关特征向量，/>

表示测试查询样本/>

对应的测试自相关特征向量、测试互相关特征向量；

(4c)特征融合模块E₃将

和/>

中特征向量组的对应位置特征向量进行求和运算，得到融合特征向量集/>

其中：

其中，z₂＝C_test(M-K)，z₃＝C_testK+1，

表示测试任务/>

对应的融合特征向量组，满足e≠C_testK+1的/>

表示测试支撑样本/>

对应的测试互相关特征向量，/>

表示测试查询样本/>

对应的测试融合特征向量；

(4d)构造一个元素全为0虚拟标签向量

并对每个融合特征向量组/>

中满足e≠C_testK+1的每个测试融合向量/>

与对应的SAR图像的标签向量通过拼接模块E₄进行拼接，同时对每个测试融合向量组/>

中的测试融合向量/>

与虚拟标签向量/>

也通过拼接模块E₄进行拼接得到特征组集合/>

(4e)将

作为图神经网络模块G的输入：

其中，z₂＝C_test(M-K)，z₃＝C_testK+1，

表示测试融合向量组/>

对应的图神经网络模块G的输入特征组，/>

表测试融合向量/>

对应测试特征；

(4f)对特征组

中/>

对应的测试查询样本/>

包括的SAR图像中的目标进行类别预测，得到测试预测结果向量集合/>

其中，z₂＝C_test(M-K)，每个测试预测结果向量/>

中最大值对应的维数号即为/>

对应的测试查询样本/>

包括的SAR图像中目标的预测类别，其中，/>

表示测试节点1层特征/>

z₃＝C_testK+1对应的维数为C_test的测试预测结果向量，第c维的元素值表示测试节点1层特征/>

对应的测试查询样本/>

包括的SAR图像中的目标属于第c个目标类别的概率。

下面结合仿真实验，对本发明的技术效果作进一步的说明：

1.仿真实验条件和内容：

仿真实验的硬件平台为：GPU为NVIDIA GeForce RTX 1650，软件平台为：操作系统为Ubuntu18.04。仿真实验的数据集为公开的AID数据集，其中，C＝30，类别为BareLand、Beach、Desert、Meadow、Mountain、Parking、Port、RailwayStation、School、StorageTanks、Airport、BaseballField、Bridge、Center、Church、Commercial、DenseResidential、Farmland、Forest、Industrial、MediumResidential、Park、Playground、Pond、Resort、River、SparseResidential、Square、Stadium、Viaduct。每类目标的SAR图像为290幅，即M＝290。

为了和现有的基于混合损失与图注意力的小样本SAR目标分类方法对比小样本SAR目标分类准确率，从AID数据集中选取个20目标类别的总共5800幅SAR图像及每幅SAR图像的标签作为训练样本集，即C_train＝20，类别分别为，Airport、BaseballField、Bridge、Center、Church、Commercial、DenseResidential、Farmland、Forest、Industrial、MediumResidential、Park、Playground、Pond、Resort、River、SparseResidential、Square、Stadium、Viaduct；选取剩余10个目标类别的总共2900幅SAR图像及每幅SAR图像的标签作为测试样本集，C_test＝10，类别分别为，BareLand、Beach、Desert、Meadow、Mountain、Parking、Port、RailwayStation、School、StorageTanks。同时，每个训练/测试任务中每个目标类别采样的训练/测试支撑样本数量K＝10，训练/测试查询样本数量M-K＝280。训练样本集和测试样本集的中的目标类别划分及每类目标的SAR图像数量如表1所示：

对本发明和现有的基于混合损失与图注意力的小样本SAR目标分类方法，也即对比算法，在5-way 1-shot、5-way 5-shot两种模式下的平均准确率进行仿真对比，其结果如表1所示：

表1

N-way K-shot	5-way 1-shot	5-way 5-shot
			对比算法	54.23％±0.13	66.39％±0.23
本发明	59.84％±0.09	73.41％±0.14

从表1中可以看出，本发明与对比算法而言，在5-way 1-shot和5-way 5-shot两种模式下平均准确率分别提高了5.61％、7.02％。

Claims

1.一种基于可变形卷积和双注意力的小样本SAR目标分类方法，其特征在于，包括如下步骤：

(1)获取训练任务集

和测试任务集/>

其中C_train+C_test＝C，/>

∩表示交集，C_train＞C/2，C_train×M+C_test×M＝U；

(1c)对从训练数据集

然后将/>

与每个训练查询样本/>

进行组合，得到训练任务集/>

其中，/>

表示第b个训练任务，/>

(1d)对从测试数据集

然后将/>

与每个测试查询样本/>

进行组合，得到测试任务集/>

其中，/>

表示第g个测试任务，/>

(2)构建基于可变形卷积和双注意力的网络模型H：

(3b)将训练任务集

(3c)自注意力机制模块E₁、互注意力机制模块E₂对F_T中每个特征向量组进行自相关特征提取、互相关特征提取，得到自相关特征向量组集合F_s和互相关特征向量组集合F_c；

(3d)特征融合模块E₃对自相关特征向量组集合F_s和互相关特征向量组集合F_c对应位置向量进行特征融合，得到融合特征向量组集F_sc；拼接模块E₄对特征向量组F_sc中每个特征向量与对应SAR图像的标签向量进行拼接，得到向量组集合F_sc'；

计算Hⁿ的损失值L_s，然后求取L_s对权值参数ω_s的偏导/>

再采用梯度下降法，通过将/>

在Hⁿ中进行反向传播的方式对权值参数ω_s进行更新；

(4)获取小样本SAR目标的目标分类结果：

将测试任务集

的预测标签。

2.根据权利要求1所述的基于可变形卷积和双注意力的小样本SAR目标分类方法，其特征在于，步骤(2)中所述的基于可变形卷积和双注意力的SAR目标分类网络模型H，其中：构建包含顺次级联的基于可变形卷积网络的特征提取模块D、并形排布的自注意力机制模块E₁和互注意力机制模块E₂、特征融合模块E₃、拼接模块E₄、图神经网络模块G的小样本SAR目标分类网络模型H，其中，特征提取模块D包括级联的卷积模块D₁和多个可变形卷积模块D₂；自注意力机制模块E₁和互注意力机制模块E₂均包括多个卷积模块D₁、多个reshape模块R₁、多个矩阵相乘模块R₂，矩阵求和模块R₃，E₁还包括自注意力关系模块D₃，E₂还包括互注意力关系模块D₄；图神经网络模块G包括相间排列的多个邻接矩阵更新模块G₁和图卷积模块G₂；