CN116597384A

CN116597384A - 基于小样本训练的空间目标识别方法、装置及计算机设备

Info

Publication number: CN116597384A
Application number: CN202310650721.6A
Authority: CN
Inventors: 任笑圆; 谢文茜; 王粲雨; 蒋李兵; 王壮; 姜胜腾; 郑舒予
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2023-06-02
Filing date: 2023-06-02
Publication date: 2023-08-15
Anticipated expiration: 2043-06-02
Also published as: CN116597384B

Abstract

本申请涉及一种基于小样本训练的空间目标识别方法、装置及计算机设备，通过根据特征提取单元、特征交叉融合单元以及相似性度量分类单元构建得到目标识别网络，将每次输入网络中的训练数据分为包括多个类别多张样本图像的支持集和只包含一张样本图像的查询集，通过训练使得网络具有将查询集中样本图像的类别从支持集中的多个目标类别选取出来，在训练过程中，还根据由特征提取单元输出的特征图像采用全连接分类器对查询集图像进行识别预测，并基于该结果计算损失函数，同时还根据相似性度量分类单元输出的预测结果计算损失函数，另外在计算总损失函数时还加入了标签权重。采用本方法可有效提高小样本空间目标识别的准确率。

Description

基于小样本训练的空间目标识别方法、装置及计算机设备

技术领域

本申请涉及空间目标识别技术领域，特别是涉及一种基于小样本训练的空间目标识别方法、装置及计算机设备。

背景技术

在空间监视领域，空间目标识别是空间监视的基础任务，同时也是后续特性研判任务的首要前提。传统的空间目标识别手段以轨道测量为主，即通过目标在轨位置确认其身份，近年来，航天活动日趋复杂，目标轨道机动频繁发生，这种方法往往难以准确、唯一地辨别目标身份，需要更为丰富的特性数据支撑识别任务。依托于监视卫星平台的天基光学成像手段为目标发生机动后如何确定身份引入了天基光学图像的新信息，成为空间监视体系的新兴技术。

目前基于天基光学成像手段受限于成像环境及成像条件，所积累的图像数据稀少，难以满足大数据驱动的传统目标识别网络，因而使用小样本识别技术进行空间目标识别。现有的小样本识别技术无法解决以下针对空间目标识别的问题：(1)空间目标不同姿态下图像变化剧烈，同一类目标差异较大，小样本识别网络特征提取难、关联难。(2)空间目标积累的观测图像数据库中类内姿态分布不均衡，导致分类器过多关注姿态密集的样本，潜在增加了小样本网络识别结果的偏差。

发明内容

基于此，有必要针对上述技术问题，提供一种能够至少解决上述一个问题的基于小样本训练的空间目标识别方法、装置及计算机设备。

一种基于小样本训练的空间目标识别方法，所述方法包括：

获取训练样本数据集，所述训练样本数据集中包括多个目标类别的样本图像，且每一个类别均包括呈现空间目标不同姿态的多张样本图像；

在所述训练样本数据集中，随机选取预设数量目标类别的多张样本图像，且各类别的样本图像数量均为预设张数作为支持集，并在选取的目标类别中抽取一张样本图像作为查询集；

将所述支持集及和查询集输入目标识别网络中，得到所述查询集中样本图像目标类别的第一预测结果，其中所述目标识别网络包括依次连接的特征提取单元、基于自注意力的特征交叉融合单元、基于互注意力的特征交叉融合单元以及相似性度量分类单元；

输入所述目标识别网络中的支持集和查询集通过所述特征提取单元提取得到对应的支持集特征图以及查询集特征图，将提取出查询集特征图通过全连接层分类单元对所述查询集中样本图像的目标类别进行预测，得到第二预测结果；

根据当前查询集中的样本图像计算样本标签权重，根据所述第一预测结果、第二预测结果、样本标签权重以及当前查询集中的样本图像的类别标签构建得到总损失函数；

根据所述总损失函数对所述目标识别网络进行迭代训练，直至所述总损失函数收敛，则得到训练后的目标识别网络；

获取待识别的空间目标图像，将样本库中所有目标类别对应的预设张样本图像与所述空间目标图像输入所述训练后的目标识别网络，以对所述空间目标图像中的目标进行识别。

在其中一实施例中，在对所述目标识别网络进行训练的过程中，每一次迭代训练，均根据所述训练样本数据集构建新的支持集以及查询集。

在其中一实施例中，将所述支持集和查询集输入到所述目标识别网络中后：

所述支持集和查询集通过所述特征提取单元提取得到对应的支持集特征图以及查询集特征图；

对所述支持集特征图以及查询集特征图转换为序列格式，得到对应的支持局部描述子序列以及查询局部描述子序列，并对各序列加上位置编码；

将加上位置编码的所述支持局部描述子序列以及查询局部描述子序列输入至所述基于自注意力的特征交叉融合单元，得到加权特征融合后的支持局部描述子序列以及查询局部描述子序列；

将加权特征融合后的支持局部描述子序列以及查询局部描述子序列输入至所述基于互注意力的特征交叉融合单元，得到交叉关注后的支持局部描述子序列以及查询局部描述子序列；

将交叉关注后的支持局部描述子序列以及查询局部描述子序列输入所述相似性度量分类单元，得到所述第一预测结果。

在其中一实施例中，所述第一预测结果为所述查询集中样本图像中目标为各类别的相似性得分，采用以下公式计算得到：

在上式中，F_As表示所述交叉关注后的支持局部描述子序列，F_Aq表示所述交叉关注后的查询局部描述子序列，As_i表示F_As中的元素，Aq_i表示F_Aq中的元素，m表示所述局部描述子序列中的元素个数。

在其中一实施例中，所述根据当前查询集中的样本图像计算样本标签权重，根据所述第一预测结果、第二预测结果、样本标签权重以及当前查询集中的样本图像的类别标签构建得到总损失函数包括：

根据所述第一预测结果以及当前查询集中的样本图像的类别标签进行计算得到相似性度量分类损失；

根据所述第二预测结果以及当前查询集中的样本图像的类别标签进行计算得到全连接分类损失；

根据所述相似性度量分类损失、全连接分类损失以及所述样本标签权重进行计算，得到所述总损失函数。

在其中一实施例中，所述样本标签权重根据当前查询集中的样本图像采用以下公式计算得到：

其中，

在上式中，γ表示超参数，表示图像表征向量之间的欧式距离，I(·)表示当dist(x,x_i)≤d时取1，dist(x,x_i)＞d时取0，x表示当前查询集中的样本图像的向量，d表示欧式距离阈值，y表示当前查询集中的样本图像所属类别中的图像样本，D_i表示训练样本数据集中某一类目标类别对应的所有样本图像。

在其中一实施例中，所述总损失函数表示为：

L＝weight*(λL_sim+L_fc)

在上式中，weight表示所述样本标签权重，λ表示所述相似性度量分类损失和全连接分类损失的权重比，L_sim表示所述相似性度量分类损失，L_fc表示所述全连接分类损失。

在其中一实施例中，所述支持集中包括5个目标类别的样本图像，且各目标类别对应的样本图像数量均为张数一致的多张或1张；

在采用训练好的目标识别网络对待识别的空间目标图像进行识别时，从所述样本库中挑选各目标类别的样本图像数量与训练该目标识别网络时所述支持集中对应各目标类别的样本图像数量一致。

一种基于小样本训练的空间目标识别装置，所述装置包括：

数据集获取模块，用于获取训练样本数据集，所述训练样本数据集中包括多个目标类别的样本图像，且每一个类别均包括呈现空间目标不同姿态的多张样本图像；

训练集构建模块，用于在所述训练样本数据集中，随机选取预设数量目标类别的多张样本图像，且各类别的样本图像数量均为预设张数作为支持集，并在选取的目标类别中抽取一张样本图像作为查询集；

第一预测结果得到模块，用于将所述支持集和查询集输入目标识别网络中，得到所述查询集中样本图像目标类别的第一预测结果，其中所述目标识别网络包括依次连接的特征提取单元、基于自注意力的特征交叉融合单元、基于互注意力的特征交叉融合单元以及相似性度量分类单元；

第二预测结果得到模块，用于输入所述目标识别网络中的支持集和查询集通过所述特征提取单元提取得到对应的支持集特征图以及查询集特征图，将提取出查询集特征图通过全连接层分类单元对所述查询集中样本图像的目标类别进行预测，得到第二预测结果；

总损失函数计算模块，用于根据当前查询集中的样本图像计算样本标签权重，根据所述第一预测结果、第二预测结果、样本标签权重以及当前查询集中的样本图像的类别标签构建得到总损失函数；

目标识别网络训练模块，用于根据所述总损失函数对所述目标识别网络进行迭代训练，直至所述总损失函数收敛，则得到训练后的目标识别网络；

图像目标识别模块，用于获取待识别的空间目标图像，将样本库中所有目标类别对应的预设张样本图像与所述空间目标图像输入所述训练后的目标识别网络，以对所述空间目标图像中的目标进行识别。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

输入所述目标识别网络中的支持集和查询集通过所述特征提取单元提取得到对应的支持集特征图以及查询集特征图，并将提取出来的查询集特征图通过全连接层分类单元对所述查询集中样本图像的目标类别进行预测，得到第二预测结果；

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

上述基于小样本训练的空间目标识别方法、装置及计算机设备，通过根据特征提取单元、基于自注意力的特征交叉融合单元、基于互注意力的特征交叉融合单元以及相似性度量分类单元构建得到目标识别网络，并且在训练该目标识别网络时，将每次输入网络中的训练数据分为包括多个类别多张样本图像的支持集和只包含一张样本图像的查询集，通过训练使得网络学习将查询集中样本图像映射到支持集中类别之一的能力

，在对网络进行训练过程中，还根据由特征提取单元输出的特征图像采用全连接分类器对查询集样本图像进行识别预测，并根据预测结果计算损失函数，同时还根据相似性度量分类单元输出的类别预测结果计算损失函数，另外在计算总损失函数时还加入了标签权重。采用本方法可有效提高小样本空间目标识别的准确率。

附图说明

图1为一个实施例中基于小样本训练的空间目标识别方法的流程示意图；

图2为一个实施例中目标识别网络的结构示意图；

图3为一个实施例中基于自注意力的特征交叉融合单元结构示意图；

图4为另一个实施例中基于互注意力的特征交叉融合单元结构示意图；

图5为一个实施例中基于小样本训练的空间目标识别装置的结构框图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

针对现有技术中，空间目标不同姿态下图像变化剧烈，同一类目标差异较大，小样本识别网络特征提取难、关联难，以及空间目标积累的观测图像数据库中类内姿态分布不均衡，导致分类器过多关注姿态密集的样本，潜在增加了小样本网络识别结果的偏差。如图1所示，提供了一种基于小样本训练的空间目标识别方法，包括以下步骤：

步骤S100，获取训练样本数据集，该训练样本数据集中包括多个目标类别的样本图像，且每一个类别均包括呈现空间目标不同姿态的多张样本图像；

步骤S110，在训练样本数据集中，随机选取预设数量目标类别的多张样本图像，且各类别的样本图像数量均为预设张数作为支持集，并在选取的目标类别中抽取一张样本图像作为查询集；

步骤S120，将支持集及和查询集输入目标识别网络中，得到查询集中样本图像目标类别的第一预测结果，其中目标识别网络包括依次连接的特征提取单元、基于自注意力的特征交叉融合单元、基于互注意力的特征交叉融合单元以及相似性度量分类单元；

步骤S130，输入目标识别网络中的支持集和查询集通过所述特征提取单元提取得到对应的支持集特征图以及查询集特征图，并将提取出来的查询集特征图通过全连接层分类单元对所述查询集中样本图像的目标类别进行预测，得到第二预测结果；

步骤S140，根据当前查询集中的样本图像计算样本标签权重，根据所述第一预测结果、第二预测结果、样本标签权重以及当前查询集中的样本图像的类别标签构建得到总损失函数；

步骤S150，根据所述总损失函数对所述目标识别网络进行迭代训练，直至所述总损失函数收敛，则得到训练后的目标识别网络；

步骤S160，获取待识别的空间目标图像，将样本库中所有目标类别对应的预设张样本图像与所述空间目标图像输入所述训练后的目标识别网络，以对所述空间目标图像中的目标进行识别。

在本实施例中，提出了一种由特征提取单元、基于自注意力的特征交叉融合单元、基于互注意力的特征交叉融合单元以及相似性度量分类单元构建的目标识别网络，其结构如图2所示。其中，基于自注意力的特征交叉融合单元可以自适应地学习并增强特征图像上不同空间位置之间的特征相关关系，以提高特征的辨识性和姿态鲁棒性。而基于互注意力的特征交叉融合单元通过学习支持集和查询集之间的局部特征相关关系，改善目标在不同姿态下由于表征差异造成的局部特征难以关联的问题。同时，本方法中还包括对该目标识别网络进行训练的过程，其中，采用基于邻域密度的样本标签权重的损失函数均衡化方法，解决训练数据姿态不均衡带来的网络识别偏差问题。

在步骤S100中，获取的训练数据集中包括多种目标类别不同的样本图像，且对应每一个类别均有多张关于同一类别目标或同一目标的不同姿态的样本图像。在这里需要说明的是，在训练数据集中，各类别目标的不同姿态对应的样本图像是不均衡的。

在步骤S110中，根据训练数据集中的样本图像构建支持集和查询集，其中支持集中包括预设数量类别的样本图像，且每一个类别对应的图像样本数量是相同的。实际上支持集中的不同类别的数量以及各类别对应的图像样本的数量是可以根据实际情况进行调整的，为了后续对本方法说明时更为清楚，在这里以支持集中有5个类别的样本图像，且各类别均包括5张样本图像为例进行说明。再从当前支持集中多个类别中随机选择一个类别对应的样本图像。

在后续，将构建好的支持集和查询集输入目标识别图像中进行迭代训练时，每一次迭代训练，均根据训练样本数据集中的样本图像随机构建新的支持集以及查询集。

具体的，将已有的空间目标数据集(即训练数据集)划分为训练数据D_train和测试数据D_test，分别含有C_train和C_test个类别，且类别不重合。D_train和D_test都由一个查询集Q和一个支持集S组成。在N-way K-shot的实验设置中，在训练过程中，从D_train中随机抽取N个类，每类取K个构建支持集，剩余的抽取做查询集，训练模型学习从图像到标签的映射。而在测试过程中，同样从D_test中选取N个类别，每个类提供K个样本有标签做支持集，使用模型学习到的映射将查询集分类为支持集的N个类之一。在本文中，仅对训练过程进行详细说明。

在本实施例中，N和K均为5，则支持集可以表示为S＝[S1,S2,S3,S4,S5]，且支持集和查询集均满足：S,Q∈R^H×W×C。

在本实施例中，将支持集和查询集输入到所述目标识别网络中后：支持集和查询集首先通过特征提取单元提取得到对应的支持集特征图以及查询集特征图，接着，对支持集特征图以及查询集特征图转换为序列格式，得到对应的支持局部描述子序列以及查询局部描述子序列，并对各序列加上位置编码，再将加上位置编码的支持局部描述子序列以及查询局部描述子序列输入至基于自注意力的特征交叉融合单元，得到加权特征融合后的支持局部描述子序列以及查询局部描述子序列，紧接着，将加权特征融合后的输出融合后的支持局部描述子序列以及查询局部描述子序列输入至基于互注意力的特征交叉融合单元，得到交叉关注后的支持局部描述子序列以及查询局部描述子序列，最后将交叉关注后的支持局部描述子序列以及查询局部描述子序列输入相似性度量分类单元，得到第一预测结果。

在本实施例中，特征提取单元采用ResNet-12的卷积网络结构。将支持集S和查询集Q经过预处理送入特征提取单元，得到支持集特征图F_S以及查询集特征图F_Q，且F_S,F_Q∈R^h ^×w×c，其中，h＝5,w＝5,c＝640。

再将特征图输入到下一个单元之前，还将两个特征图进行展开看作是两组m个d维(m＝h×w,d＝c)的局部描述子序列：F_S＝[s₁,...,s_m]∈R^d×m，F_Q＝[q₁,...,q_m]∈R^d×m。

由于将特征图像转换为序列后就丢失了位置特征，所以需要对转换后的序列加上位置编码：

在公式(1)中，表示特征图中的位置是(x,y)的图像局部描述子中第i个特征通道的编码信息，i为特征通道索引，/>

接着，将加上编码位置的支持局部描述子序列以及查询局部描述子序列时输入至基于自注意力的特征交叉融合单元中，以有效增强判别特征，准确定位更具辨识性和姿态鲁棒性的深层特征。

如图3所示，为基于自注意力的特征交叉融合过程，通过多头注意力衡量各个局部描述子的重要程度，并在特征融合过程中进行加权，提高特征的辨识性。

定义输入基于自注意力的特征交叉融合单元的序列为X，则注意力机制可表示为：

Attention(q,k,v)＝softmax(q·k^T)v (3)

则多头注意力机制可表示为：

在公式(5)中，

在本实施例中，d＝640，k＝8，d_k＝d/k＝80。

经过基于自注意力的交叉融合单元后支持集和查询集用F_S'、F_Q'即加权特征融合后的支持局部描述子序列以及查询局部描述子序列表示：

F′_S＝F_S+MultiHeadAttention(F_S,F_S,F_S) (6)

F′_Q＝F_Q+MultiHeadAttention(F_Q,F_Q,F_Q) (7)

接下来将F′_S、F′_Q输入至基于互注意力的特征交叉融合单元，其融合过程如图4所示，基于互注意力的特征交叉融合通过对支持集和查询集的图像局部特征序列进行交叉关注，可挖掘出支持集和查询集之间的局部特征相关性。经过基于互注意力交叉融合模块的支持集和查询集用F_As、F_Aq表示：

F_As＝F′_S+MultiHeadAttention(F′_S,F′_Q,F′_Q) (8)

F_Aq＝F′_Q+MultiHeadAttention(F′_Q,F_As,F_As) (9)

接着，将F_As、F_Aq输入相似性度量单元来计算支持集和查询集的相似度得到，经过特征提取和特征交叉融合之后可得到F_As＝[As₁,...,As_m]∈R^d×m，F_Aq＝[Aq₁,...,Aq_m]∈R^d ^×m。相似性度量单元计算相似性得分采用以下公式：

在公式(10)中，F_As表示交叉关注后的支持局部描述子序列，F_Aq表示交叉关注后的查询局部描述子序列，As_i表示F_As中的元素，Aq_i表示F_Aq中的元素，m表示局部描述子序列中的元素个数。

而第一预测结果也就是查询集中样本图像中目标的类别与支持集中各类别样本图像的相似度，其中相似度最高的类别即可认为查询集中样本图像的目标类别。

而在对该目标识别网络进行训练时，采用相似性度量分类器和全连接层分类器两个分类器，两个分类损失联合优化网络。而在训练好的目标识别网络中仅使用相似性度量分类器进行预测。

首先，可根据第一预测结果以及当前查询集中的样本图像的类别标签进行计算得到相似性度量分类损失。具体的，输入网络的支持集有N类，每类有K个样本，经过特征提取与注意力模块得到嵌入向量S'＝{(F_{As_1},...,F_{As_k}),(F_{As_2},...,F_{As_2k}),...,(F_{As_N},...,F_{As_Nk})}，将同类样本的嵌入向量取平均值作为该类的表征，即类原型中心S'_pro＝{Fs₁,Fs₂,...,Fs_N}，相似性度量分类单元输出查询集F_Aq与N个类别的相似度即预测值利用softmax函数求得相似性度量分类损失。相似性度量分类器的损失函数计算如下：

在公式(11)中，y_i表示当前查询集样本图像中的类别标签，即真实值，只有正确类别y_i＝1，其他N-1个类别为y_i＝0。τ为温度系数，在本实施例中，该值可取0.01。

进一步的，可根据第二预测结果以及当前查询集中的样本图像的类别标签进行计算得到全连接分类损失。

具体的，在特征提取单元后设置单层的全连接分类器，引入全连接分类损失帮助特征提取模块提取更准确的特征帮助识别目标。查询集经过特征提取模块得到特征图，通过一个全连接层，得到对每个类别的预测概率值，进而对预测概率进行softmax归一化，得到最终的分类结果。全连接分类器的损失函数如下：

在公式(12)中，W_i、b_i是第i个类别的权值矩阵和偏置，一共C_train个类别。y_i为真实值，只有正确类别y_i＝1，其他N-1个类别为y_i＝0。

此外，在根据相似性度量分类损失以及全连接分类损失对总损失函数进行计算时，还加入了样本标签权重。

在本实施例中，引入一种基于邻域密度的样本标签权重来自适应均衡损失函数。训练数据集D_train某一类数据子集为D_i(i∈[1,C_train])，其中一个样本的向量为x，欧式距离阈值为d，可以用以下公式表示以x为中心，同一类内与x的欧式距离小于d的图像样本数量为：

在公式(13)中，表示图像表征向量之间的欧式距离，I(·)表示当dist(x,x_i)≤d时取1，dist(x,x_i)＞d时取0。y表示当前查询集中的样本图像所属类别中的图像样本，D_i表示训练样本数据集中某一类目标类别对应的所有样本图像。与每张图像相似的样本数量和该图像在类内姿态属性空间的密度成反比，给姿态属性密集的图像更小的损失权重，姿态属性稀疏的图像更大的损失权重，人为的纠正网络对多数样本的关注偏差，权重计算如下：

在公式(14)中，γ表示超参数。在本实施例中，γ取2，d取600。

最终目标识别网络的总损失函数加上基于邻域密度的样本标签权重，表示为：

L＝weight*(λL_sim+L_fc) (15)

在公式(15)中，weight表示样本标签权重，λ表示相似性度量分类损失和全连接分类损失的权重比，L_sim表示相似性度量分类损失，L_fc表示全连接分类损失。

在其中一实施例中，λ可设置为0.75。

通过上述的总损失函数对目标识别网络进行迭代训练后，直至该总损失函数收敛，则得到训练好的目标识别网络，此时，该网络具备将查询集样本图像的类别从支持集中各类别中选取出来的能力。在利用训练好的目标识别网络对待识别目标图像进行识别时，同时将样本库中的所有类别的样本图像一起输入训练好的目标识别网络中。

为了使得识别效果更好，可从样本库中挑选出来的各个类别对应的样本图像数量可以与训练该网络时支持集中各类别对应的样本图像数量一致。

在本文中，为了验证本文方法的有效性，还根据本方法进行仿真实验。仿真实验采用的自然数据集是CUB-200数据集，表1展示了本文方法在5-way1-shot和5-way5-shot设置下的与现在主流小样本识别方法的仿真实验对比结果。

本文方法针对的是姿态不均衡空间目标数据集，因而本文将开源的姿态均衡的空间目标数据集BUAA-SID1.0删去一部分姿态图像，制作出一个姿态不均衡的数据集BUAA_unbalanced以验证本文方法的有效性。表2展示了本文方法在5-way1-shot和5-way5-shot设置下的仿真实验结果。通过分析实验结果可知，本方法所提算法有效。

表1不同方法在CUB-200数据集上的分类精度

网络模型	5way1shot/％	5way5shot/％
			DN4^[1]	46.84±0.81	74.92±0.64
DeepEMD^[2]	75.65±0.83	88.69±0.50
			LMPNet^[3]	65.59±0.13	68.19±0.23
RENet^[4]	79.49±0.44	91.11±0.24
			本文方法	81.14±1.02	91.35±0.54

表2在BUAA_unbalanced上的权重消融实验

实验设置	未加权重acc/％	加权重acc/％
			5way1shot	70.770	74.200
5way5shot	87.110	88.393

上述基于小样本训练的空间目标识别方法中，通过提出了基于自注意力的局部特征交叉融合模块，自适应地学习并增强不同空间位置之间的特征相关关系，提高特征的辨识性和姿态鲁棒性，同时，提出了基于互注意力的局部特征交叉融合模块，通过学习支持集和查询集之间的局部特征相关关系，改善在不同姿态下由于表征差异造成的局部特征难以关联的问题，还提出了基于邻域密度的样本标签权重的损失函数均衡化方法，解决训练数据姿态不均衡带来的网络识别偏差问题。

应该理解的是，虽然图1的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图5所示，提供了一种基于小样本训练的空间目标识别装置，包括：数据集获取模块200、训练集构建模块210、第一预测结果得到模块220、第二预测结果得到模块230、总损失函数计算模块240、目标识别网络训练模块250和图像目标识别模块260，其中：

数据集获取模块200，用于获取训练样本数据集，所述训练样本数据集中包括多个目标类别的样本图像，且每一个类别均包括呈现空间目标不同姿态的多张样本图像；

训练集构建模块210，用于在所述训练样本数据集中，随机选取预设数量目标类别的多张样本图像，且各类别的样本图像数量均为预设张数作为支持集，并在选取的目标类别中抽取一张样本图像作为查询集；

第一预测结果得到模块220，用于将所述支持集及和查询集输入目标识别网络中，得到所述查询集中样本图像目标类别的第一预测结果，其中所述目标识别网络包括依次连接的特征提取单元、基于自注意力的特征交叉融合单元、基于互注意力的特征交叉融合单元以及相似性度量分类单元；

第二预测结果得到模块230，用于输入所述目标识别网络中的支持集和查询集通过所述特征提取单元提取得到对应的支持集特征图以及查询集特征图，并将提取出来的查询集特征图通过全连接层分类单元对所述查询集中样本图像的目标类别进行预测，得到第二预测结果；

总损失函数计算模块240，用于根据当前查询集中的样本图像计算样本标签权重，根据所述第一预测结果、第二预测结果、样本标签权重以及当前查询集中的样本图像的类别标签构建得到总损失函数；

目标识别网络训练模块250，用于根据所述总损失函数对所述目标识别网络进行迭代训练，直至所述总损失函数收敛，则得到训练后的目标识别网络；

图像目标识别模块260，用于获取待识别的空间目标图像，将样本库中所有目标类别对应的预设张样本图像与所述空间目标图像输入所述训练后的目标识别网络，以对所述空间目标图像中的目标进行识别。

关于基于小样本训练的空间目标识别装置的具体限定可以参见上文中对于基于小样本训练的空间目标识别方法的限定，在此不再赘述。上述基于小样本训练的空间目标识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于小样本训练的空间目标识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.基于小样本训练的空间目标识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的空间目标识别方法，其特征在于，在对所述目标识别网络进行训练的过程中，每一次迭代训练，均根据所述训练样本数据集构建新的支持集以及查询集。

3.根据权利要求2所述的空间目标识别方法，其特征在于，将所述支持集和查询集输入到所述目标识别网络中后：

4.根据权利要求3所述的空间目标识别方法，其特征在于，所述第一预测结果为所述查询集中样本图像中目标为各类别的相似性得分，采用以下公式计算得到：

5.根据权利要求4所述的空间目标识别方法，其特征在于，所述根据当前查询集中的样本图像计算样本标签权重，根据所述第一预测结果、第二预测结果、样本标签权重以及当前查询集中的样本图像的类别标签构建得到总损失函数包括：

6.根据权利要求5所述的空间目标识别方法，其特征在于，所述样本标签权重根据当前查询集中的样本图像采用以下公式计算得到：

其中，

7.根据权利要求6所述的空间目标识别方法，其特征在于，所述总损失函数表示为：

L＝weight*(λL_sim+L_fc)

8.根据权利要求1-7任一项所述的空间目标识别方法，其特征在于，所述支持集中包括5个目标类别的样本图像，且各目标类别对应的样本图像数量均为张数一致的多张或1张；

9.基于小样本训练的空间目标识别装置，其特征在于，所述装置包括：

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。