CN114879185A

CN114879185A - 基于任务经验迁移的雷达目标智能识别方法

Info

Publication number: CN114879185A
Application number: CN202210668475.2A
Authority: CN
Inventors: 简涛; 刘瑜; 李刚; 何友; 李恒; 张健; 何佳
Original assignee: Naval Aeronautical University
Current assignee: Naval Aeronautical University
Priority date: 2022-06-14
Filing date: 2022-06-14
Publication date: 2022-08-09

Abstract

本发明公开了一种基于任务经验迁移的雷达目标智能识别方法，属于雷达信号处理领域。构建了多类平衡中心余弦损失基础学习器结合任务损失倒数加权更新元学习器的元学习识别框架，设计了基础学习器中卷积神经网络的多类平衡余弦中心损失函数，通过引入Focal损失，避免了不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题。基于平滑平均绝对误差损失函数，设计了元学习器参数的任务损失倒数加权更新方式，提升了对高相关度经验的借鉴程度，通过取小运算避免了元训练任务损失值过小而导致参数更新过程不收敛的问题。本发明方法提高了小样本条件下雷达目标高分辨距离像多类别识别正确率，具有推广应用价值。

Description

基于任务经验迁移的雷达目标智能识别方法

一、技术领域

本发明隶属于雷达信号处理领域，具体涉及一种基于任务经验迁移的雷达目标智能识别方法。

二、背景技术

高分辨距离像(High Resolution Range Profile，HRRP)是目标主散射点在雷达照射方向上的投影，反映了目标散射点的相对位置信息，一定程度上体现了目标部分结构信息，具有易存储、易处理以及方便获取等优点，因此在目标识别领域具有广阔的应用前景。对于合作目标，可以获取大量的目标HRRP样本，但在实际应用中，雷达所针对的目标往往是非合作目标，难以获取数量足够的非合作目标HRRP数据。因此，小样本条件下雷达目标HRRP识别已成为雷达目标识别领域的研究热点之一。

早期小样本条件下的目标分类识别技术主要以HRRP的统计建模方法为主，如线性动态模型、因子分析模型以及自适应高斯分类器模型等，随后学者们利用多任务学习理念和类别标签信息，在上述模型的基础上进行改进，相继提出了多任务因子分析模型、标签辅助因子分析模型以及多任务标签约束卷积因子分析模型等。统计建模方法需要对模型的变量进行先验假设，当实际环境与先验假设条件失配时，该类方法的识别性能将急剧下降。

近年来，深度学习方法在雷达目标识别领域得到了越来越多的重视。深度学习模型可以自主学习数据的内在规律和表示层次，但其往往需要依赖大量的样本数据以及较深的网络结构来获得预期的识别效果。在实际对抗环境中，能获取的非合作目标数据量较少且角度往往较为单一，针对上述小样本数据，深度学习过深的网络结构会导致模型过拟合。针对这一问题，相关学者一方面从增加数据量的角度出发，通过生成对抗网络等方法进行数据增强，以期满足深度学习模型对数据集的要求；另一方面则研究基于模型迁移的学习方法，将源域学习到的模型参数迁移至目标域中，从而利用迁移的知识进行小样本识别。需要指出的是，在模型迁移方法中，当源域与目标域差异较大时，所建立的迁移模型难以适用于不同的识别问题。作为迁移学习方法的拓展，元学习是一种针对不同任务设计具有不同特性学习器的机制，可利用以往不同任务上的经验，来指导新任务的学习，适用于分类、回归以及强化学习等多种应用场合。需要指出的是，现有元学习方法往往对所有任务的学习经验进行无差别借鉴，忽视了不同任务经验对新任务的差异性影响，易造成对低相关度经验的过度借鉴，进而导致识别率下降。另外，在小样本条件下，多个类别之间往往存在样本个数不均衡的情况，在反向传播过程中，样本较多的类别占损失函数的比重较高，易引导模型向利于输出该类别分类结果的方向优化，进而降低样本数较少类别目标的识别率。

针对小样本条件下雷达目标HRRP多类别识别精度差的问题，如何设计合适的基础学习器损失函数，避免不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降的问题；进而在元学习器中对不同任务学习经验进行针对性迁移借鉴，指导新识别任务进行有效的小样本识别，提高后续目标识别精度，是雷达目标多类别小样本智能识别领域的难点之一。

三、发明内容

1.要解决的技术问题

针对小样本条件下雷达目标HRRP多类别识别精度差的问题，如何构建合适的元学习识别框架，将单个任务特性与任务间共性进行解耦，设计合适的基础学习器和元学习器对单个任务特性和任务间共性进行经验迁移，实现雷达目标的有效小样本识别；针对基础学习器构建，如何设计合适的损失函数，避免多类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题；针对元学习器构建，如何实现对不同任务学习经验的针对性迁移借鉴，用于指导新识别任务进行有效的小样本识别，提高新任务的小样本目标识别精度。

2.技术方案

本发明所述基于任务经验迁移的雷达目标智能识别方法包括以下步骤：

步骤1深度元学习的数据集构建；依据待识别的N类目标的雷达高分辨距离像数据，构建元测试任务小样本训练数据集和元测试任务测试数据集，将待识别任务归为元测试任务集；依据与待识别目标数据不同类别或不同数据来源的M类非待识别目标积累数据，通过随机抽取N类目标数据构建元训练任务集，并将N类非待识别目标数据全部作为元训练任务训练数据集；

元学习的方法具体包含神经网络适应法、度量学习适应法、基础学习器和元学习器适应法以及贝叶斯元学习适应法等。其中，基础学习器和元学习器相结合可将任务特性建模与任务间共性建模进行解耦，通过二者间的互相交流，使得模型在任务特性和共性两方面均可达到最优，从而在保持模型精度的基础上，提升模型的泛化能力。传统机器学习的数据结构一般分为训练集和测试集，无论是训练集还是测试集，均需包含大量样本数据。而深度元学习与传统机器学习相类似，同样分为元训练集和元测试集，不同之处在于元训练集和元测试集中不是样本数据，而是各个任务的集合，在各个任务中又包含相应的训练数据集和测试数据集。与传统机器学习和经典元学习不同，本发明元学习模型的数据结构分为元训练任务集和元测试任务集，元测试任务集中包含相应的训练数据集和测试数据集，而为了提高数据利用率，元训练任务集只包含相应的训练数据集。

对于N类雷达目标的识别任务，依据待识别的N类目标的雷达高分辨距离像数据，构建元测试任务小样本训练数据集和元测试任务测试数据集，即元测试任务训练数据集为小样本数据集，将待识别任务归为元测试任务集；依据与待识别目标数据不同目标类别或不同数据来源的M类非待识别目标积累数据，其中M≥N，通过从M类中随机抽取N类目标数据构建元训练任务集，每个元训练任务包含N类非待识别目标，每个元训练任务只包含元训练任务训练数据集。

与经典元学习方法将元训练任务数据划分为训练数据集和测试数据集不同，本发明将元训练任务中的所有数据均作为元训练任务训练数据集，提高了元训练任务数据的训练利用率，改善了单个元训练任务的特性参数和损失值的计算精度和稳定性，有利于为后续元学习器提供更可靠的任务学习经验，用于指导待识别目标小样本分类器精准设计。

需要强调的是，鉴于待识别目标数据的小样本特性，与待识别的N类目标的雷达高分辨距离像数据相比，本发明的非待识别目标的积累数据，其不同之处可体现在两个方面：或体现为目标类型不同(例如，待识别目标为舰船目标，非待识别目标的积累数据涉及的是飞机目标)；或体现为数据的类型不同(例如，同样为舰船目标，待识别目标的雷达高分辨距离像数据为实测数据，而非待识别目标的积累数据为仿真数据)；或者以上两个方面均不相同(例如，待识别目标的雷达高分辨距离像数据为实测数据，而非待识别目标为地面车辆目标，其积累数据为红外图像的一维径向采样数据或雷达高分辨距离像仿真数据)。

步骤2元学习模型设计；将元学习模型设计为多类平衡中心余弦损失基础学习器和任务损失倒数加权更新元学习器的组合；多类平衡中心余弦损失基础学习器采用多类平衡余弦中心损失函数作为元训练任务的卷积神经网络损失函数；任务损失倒数加权更新元学习器基于平滑平均绝对误差损失函数，采用元训练任务损失值的倒数对元学习器参数进行加权修正更新；元学习模型的输入为元训练任务集，元学习模型的输出为更新后的模型参数；

本发明的元学习模型设计为多类平衡中心余弦损失基础学习器和任务损失倒数加权更新元学习器的组合。基础学习器对任务特性进行建模，要求基础学习器能够发现每个任务数据集的内在规律。深度学习模型依赖于强大的表示能力，可以提取目标深层次的特征，且对数据的拟合程度较好。因此，针对雷达目标HRRP多类别小样本识别任务，本发明设计了多类平衡中心余弦损失基础学习器，以一维卷积神经网络(CNN)作为学习训练模型；构建了多类平衡余弦中心损失函数作为一维CNN的损失函数，该损失函数利用大边缘余弦损失对类间特征进行约束的同时，对与类中心夹角较大的特征进行惩罚，使得类内特征的角度距离不断减小，提高特征的可分性；同时该损失函数通过降低易区分类别在损失函数中的权重来平衡各类别在损失函数中的占比，避免了不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题。

多类平衡中心余弦损失基础学习器包含一个输入层、三个卷积层(Conv)、三个池化层(POOL)、一个批归一化层(BN)、两个全连接层(FC)以及一个输出层。具体连接方式为：

Conv1→POOL1→Conv2→POOL2→Conv3+BN→POOL3→FC1→FC2

其中，输入层导入的是每个元训练任务训练数据集中的一小批次数据；前两个卷积层Conv1和Conv2为标准的卷积层；第三个卷积层Conv3为标准化卷积层，在卷积层Conv3的基础上添加了一个批归一化层BN，用于加强多类平衡余弦中心损失函数的梯度变化，三个卷积层均采用一维卷积核，大小分别为为A₁、A₂和A₃，个数分别为B₁、B₂和B₃，步长为D，填充方式均为相同填充；池化层POOL为平均池化层，步长为H；第一层全连接层FC1的神经元个数为F，第二层全连接层FC2的神经元个数等于待识别目标类别数N；输出层利用softmax函数计算每个样本的类别概率，根据计算结果计算损失函数值。

在小样本条件下，多个类别之间往往存在样本个数不均衡的情况，在反向传播过程中，样本较多的类别占损失函数的比重较高，易引导模型向利于输出该类别分类结果的方向优化，进而降低样本数较少类别目标的识别率。为此，本发明在基础学习器的CNN中构建了多类平衡余弦中心损失函数，在余弦距离和特征中心的基础上计算Focal损失，利用增强边缘余弦损失对类间特征进行约束的同时，对与类中心夹角较大的特征进行惩罚，使得类内特征的角度距离不断减小，提高特征的可分性；同时该损失函数通过引入Focal损失降低易区分类别在损失函数中的权重，以此平衡各类别在损失函数中的占比，避免了不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题。

每个元训练任务的损失函数可表示为：

其中，m是梯度更新过程中样本数据的个数；x_i表示第i个样本所对应的全连接层输出特征向量；y_i是第i个样本的真实标签；W_j是全连接层的权值矩阵W的第j列，即代表第j类目标对应的权值向量；

表示第y_i类目标的归一化特征中心向量；log₂(·)表示以2为底的对数函数；a、λ、s、α和γ为正的实参数；其中，正参数a满足0≤a≤1-cos(2π/N)，其作用是为了增强特征向量x_i与第y_i类目标对应的权值向量

的夹角约束；实参数s解决损失函数不收敛的问题，满足

ε是一个接近于0的正常数；正参数γ用于调节输出的权值，满足0≤γ≤5；实参数α用于调整中心损失项中归一化特征幅度，防止出现特征归一化后损失函数不收敛的问题；正参数λ是中心损失项的权重，满足λ>0，λ越大，类内特征越聚集；φ_(·,·)表示两个同维度向量间的夹角。

如果两个向量x与y之间的夹角为φ_(x,y)，则两个向量x与y之间的余弦距离为二者夹角的余弦值，可用归一化向量的内积表示为cos(φ_(x,y))＝x^Ty/(||x||||y||)，上标T表示转置，||·||表示取欧几里得范数，余弦距离可有效避免不同向量的模值大小对距离度量的不利影响。

为权值向量W_j和特征向量x_i之间的相似性度量，因为夹角的余弦值在

区间上是单调递减的，向量间夹角越小，则其余弦值越大，特征向量x_i相对应的第i个样本属于类别j的概率则越大；为进一步增大不同类别目标特征的类间距离，本发明引入超参数a，当满足

时，才判定第i个样本属于类别j，超参数a的作用是为了增强特征向量x_i与权值向量

的夹角约束。

第j类目标的归一化特征中心向量c_j的初始化可表示为

其中，δ[·]表示单位冲激序列函数，当x＝0时，δ[x]等于1，否则δ[x]等于0。在训练的过程中，对第j类目标的归一化特征中心向量c_j的更新量为：

元学习模型设计中的元学习器，主要对任务间共性进行建模，功能是在每次基础学习器训练完成之后，对所有任务上的训练经验进行总结归纳，综合出新的经验，反馈给基础学习器。元学习器的形式多样，可以是任意一种基于随机梯度下降的模型，也可以是一种参数更新算法。为了降低运算复杂度并提高参数更新精度与效率，本发明方法设计了任务损失倒数加权更新元学习器，基于平滑平均绝对误差损失函数，采用元训练任务损失值的倒数对元学习器参数进行加权修正更新，通过充分考虑不同任务经验对新任务的差异性影响，对不同元训练任务的学习经验进行针对性借鉴，避免了对低相关度经验的过度借鉴而导致的识别率下降问题，使元学习器的初始化模型参数θ_M向高相关度任务的共性方向更新靠近。

元学习的主要目的是寻找高相关度任务的共性方向，使得元学习器的初始化模型参数θ_M向基础学习器中高相关度元训练任务的特性参数靠近，即使得参数θ_M与所有元训练任务特性参数之间的误差距离最小化，即元学习器的学习目标函数如下

其中，D_k为第k个元训练任务的特性参数θ_Bk与元学习器参数θ_M之间的误差。与常用元学习器目标函数设计不同，式(4)中忽略了不平等度量，仅保留主要的误差项，在保证参数更新精度的基础上，降低了后续梯度求解难度和元学习器参数更新的计算复杂度，提高了参数更新效率。

为了防止均方误差(与欧几里得空间距离相对应)梯度爆炸问题，同时避免平均绝对误差在零点处的梯度不平滑缺陷，本发明方法构建了平滑平均绝对误差损失函数。误差项D_k具体表示为

元学习器的学习目标就是最小化两个学习器参数间的误差。根据拉格朗日定理，可计算D_k在参数θ_M处的梯度来最小化D_k。对于||θ_Bk-θ_M||<1的情况，对距离D_k进行求导可得：

元学习器常假设每个元训练任务对元学习器参数θ_M的影响程度相同，进而将各项任务对元学习器参数θ_M的影响进行无差别叠加，用于计算所有任务的共性方向。考虑到不同元训练任务经验对新任务的差异性影响，第k个元训练任务的任务损失值L_k可在一定程度上反映出学习经验的差异程度，损失值越小，其倒数越大，说明训练效果越好，即该任务的学习经验更值得借鉴；反之损失值越大，其倒数越小，则表示该元训练任务的学习效果越差，学习经验可借鉴度较低。因此，为避免对低相关度经验的过度借鉴，充分利用不同元训练任务对元学习器参数更新的偏差影响，本发明方法利用元训练任务损失值的倒数，对元学习器的参数更新过程进行加权修正，使得元学习器有针对性地借鉴每个元训练任务的经验，减轻对低相关度经验的过度借鉴，提升高相关度经验的借鉴程度。任务损失倒数加权更新元学习器的参数更新方式如下：

其中，

即为元学习器更新后的参数，ε₀为元学习器的更新步长；任务损失值L_k的倒数与L_k的变化直接负相关，采用该加权更新方式直观简洁。考虑到参数更新过程的函数收敛问题，min(·,·)表示取两个参数中的较小值，其作用是防止L_k过小时导致参数更新过程不收敛。

步骤3从元训练任务集中随机抽取K个元训练任务进行基础学习器训练；对第k个元训练任务，在多类平衡中心余弦损失基础学习器上利用元训练任务训练数据集进行分批次训练，通过卷积神经网络迭代更新优化，得到第k个元训练任务的特性参数θ_Bk和损失值L_k；将K个元训练任务的特性参数和损失值正向传递给任务损失倒数加权更新元学习器，转入步骤4；

从元训练任务集中随机抽取K个元训练任务进行基础学习器训练；对第k个元训练任务，利用步骤2中设计的多类平衡中心余弦损失基础学习器，结合第k个元训练任务的训练数据集进行分批次训练，依据式(1)的多类平衡余弦中心损失函数，通过卷积神经网络进行迭代更新优化训练，得到第k个元训练任务的特性参数θ_Bk和相应任务损失值L_k；在所有K个元训练任务完成基础学习器训练后，将K个元训练任务的特性参数{θ_B1,θ_B2,…,θ_Bk,…,θ_BK}和相应的任务损失值{L_B1,L_B2,…,L_Bk,…,L_BK}正向传递给任务损失倒数加权更新元学习器，转入步骤4进行元学习器参数更新。

步骤4任务损失倒数加权更新元学习器基于K个元训练任务的特性参数，利用相应的元训练任务损失值的倒数对元学习器参数θ_M进行加权修正更新，并将更新后的参数

反馈给多类平衡中心余弦损失基础学习器；以

为多类平衡中心余弦损失基础学习器的新初始化模型参数，重新执行步骤3进行新一轮的优化训练；

任务损失倒数加权更新元学习器基于K个元训练任务的特性参数{θ_B1,θ_B2,…,θ_Bk,…,θ_BK}，利用相应的元训练任务损失值{L_B1,L_B2,…,L_Bk,…,L_BK}的倒数，基于式(7)对元学习器参数θ_M进行加权修正更新，并将更新后的参数

反馈给多类平衡中心余弦损失基础学习器；以

步骤5循环执行步骤3和步骤4，直至达到N_c次循环结束，保存最后的任务损失倒数加权更新元学习器参数

构建与多类平衡中心余弦损失基础学习器相同模型结构的卷积神经网络识别模型，将

作为卷积神经网络识别模型的初始化参数，分批次导入元测试任务小样本训练数据集进行识别模型的训练更新，当卷积神经网络的多类平衡余弦中心损失函数收敛且不再下降时结束识别模型训练；利用训练好的卷积神经网络识别模型，对元测试任务测试数据集进行分类识别，评估待识别的N类目标的分类识别正确率。

元学习训练阶段结构上分为内、外两个循环结构，内循环是指基础学习器和元学习器之间参数的循环更新，外循环则是指内循环的训练轮次循环。首先，初始化基础学习器的模型参数，从元训练集中抽取识别任务导入基础学习器进行学习，根据多类平衡余弦中心损失函数更新基础学习器参数；其次，将基础学习器学习后的模型参数导入任务损失倒数加权更新元学习器进行参数更新，并将更新后的参数反馈给基础学习器重新进行参数赋值，并开展新一轮的元训练任务抽取与基础学习器训练，循环重复，直至达到外循环次数结束，并保存最终的CNN模型参数。

元学习测试阶段则是利用元学习训练阶段的训练参数对识别模型进行参数初始化，以便将以往的学习经验迁移至元测试集中，利用初始化后的识别模型进行分类识别，验证方法的效能。首先，将元学习训练阶段中保存的CNN模型参数作为识别模型的初始参数，导入元测试集中的小样本训练数据集进行识别模型训练，直至多类平衡余弦中心损失函数收敛，结束元测试集训练；然后，利用元测试集训练所得的识别模型和参数，对元测试集的测试数据集进行分类识别评估，计算测试数据集中每类目标的分类识别正确率。

3.有益效果

与背景技术相比，本发明的有益效果是：1)针对小样本条件下雷达目标HRRP多类别识别精度差的问题，构建了多类平衡中心余弦损失基础学习器结合任务损失倒数加权更新元学习器的元学习识别框架，将单个任务特性与任务间共性进行解耦，对单个任务特性和任务间共性进行经验迁移，实现雷达目标HRRP的小样本有效识别；2)针对基础学习器的CNN构建，设计了多类平衡余弦中心损失函数，利用增强边缘余弦损失对类间特征进行约束，提高类间特征可分性，同时对与类中心夹角较大的特征进行惩罚，提高了类内特征的聚集性，进一步增强特征整体可分性；3)多类平衡余弦中心损失函数通过引入Focal损失，降低易区分类别在损失函数中的权重，平衡了各类别在损失函数中的占比，避免了不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题；4)构建了仅含主要误差项的元学习器学习目标函数，通过忽略影响度低的不平等度量，在保证参数更新精度的基础上，降低了后续梯度求解难度和元学习器参数更新的计算复杂度，提高了参数更新效率；5)构建了元学习器的平滑平均绝对误差损失函数，避免了均方误差的梯度爆炸问题，克服了平均绝对误差在零点处的梯度不平滑缺陷，提高了元学习器目标函数误差项的建模精度，为后续元学习器参数的高效更新提供模型保证；6)设计了元学习器参数的任务损失倒数加权更新方式，利用元训练任务损失值与任务训练效果的负相关性，避免了对低相关度经验的过度借鉴，提升了对高相关度经验的借鉴程度，通过取小运算避免了元训练任务损失值过小而导致参数更新过程不收敛的问题。

四、附图说明

图1是本发明方法的元学习数据结构示意图；

图2是本发明方法的元学习模型结构示意图；

图3是本发明方法的基础学习器的结构示意图

图4是基于任务经验迁移的雷达目标智能识别方法流程图

五、具体实施方式

下面结合附图对本发明作进一步描述。本发明实施例用来解释说明本发明，而不是对本发明进行限制，在本发明的精神和权利要求的保护范围内，对本发明做出的任何修改和改变，都落入本发明的保护范围。

为验证本发明所述方法的有效性，本具体实施方式给出了2个实施例，第一个实施例针对多类舰船目标雷达HRRP识别应用，第二个实施例针对多类飞机目标雷达HRRP识别应用。

实施例1：

实施例1为5类舰船目标雷达HRRP识别应用，具体可以分为以下几个步骤：

步骤A-1：构建深度元学习的数据集，其元学习数据结构如图1所示；首先，获取M＝10类舰船目标HRRP的仿真数据，通过随机抽取N＝5类目标数据构建元训练任务集，并将N类非待识别舰船目标仿真数据全部作为元训练任务训练数据集；鉴于实际试验舰船目标的非合作性，仅能获取数量较少的待识别舰船目标小样本HRRP实测数据，依据待识别的N类舰船目标的雷达实测HRRP数据，构建元测试任务小样本训练数据集和元测试任务测试数据集，将待识别任务归为元测试任务集。

步骤A-2：设计元学习模型；将元学习模型设计为多类平衡中心余弦损失基础学习器和任务损失倒数加权更新元学习器的组合，其模型结构如图2所示。多类平衡中心余弦损失基础学习器采用多类平衡余弦中心损失函数作为元训练任务的卷积神经网络损失函数；任务损失倒数加权更新元学习器基于平滑平均绝对误差损失函数，采用元训练任务损失值的倒数对元学习器参数进行加权修正更新；元学习模型的输入为元训练任务集，元学习模型的输出为更新后的模型参数；

步骤A-3：由10类舰船目标HRRP的仿真数据不重复抽取5类目标数据，构成252个元训练任务组成的集合，从元训练任务集中随机抽取K＝10个元训练任务进行基础学习器训练；

对多类平衡中心余弦损失基础学习器的CNN模型参数θ_B进行初始化，具体包括卷积层的权值{w_conv1,b_conv1,w_conv2,b_conv2，w_conv3,b_conv3}，全连接层的权值{w_fc,b_fc,w_fc2,b_fc2}。多类平衡中心余弦损失基础学习器的结构参数取值为：N＝5，A₁＝9，A₂＝9，A₃＝9，B₁＝8，B₂＝16，B₃＝32，D＝1，H＝2，F＝100；对应的多类平衡中心余弦损失基础学习器的具体设计如图3所示。

对第k个元训练任务，利用多类平衡中心余弦损失基础学习器，结合第k个元训练任务的训练数据集进行分批次训练，依据式(1)的卷积神经网络多类平衡余弦中心损失函数，利用Adam优化器进行参数的迭代优化更新，进而得到第k个元训练任务的特性参数θ_Bk和相应任务损失值L_k；在所有K个元训练任务完成基础学习器训练后，将K个元训练任务的特性参数{θ_B1,θ_B2,…,θ_Bk,…,θ_BK}和相应的任务损失值{L_B1,L_B2,…,L_Bk,…,L_BK}正向传递给任务损失倒数加权更新元学习器，转入步骤A-4进行元学习器参数更新。

步骤A-4：任务损失倒数加权更新元学习器基于K个元训练任务的特性参数{θ_B1,θ_B2,…,θ_Bk,…,θ_BK}，利用相应的元训练任务损失值{L_B1,L_B2,…,L_Bk,…,L_BK}的倒数，基于式(7)对元学习器参数θ_M进行加权修正更新，并将更新后的参数

反馈给步骤A-3的多类平衡中心余弦损失基础学习器；以

为多类平衡中心余弦损失基础学习器的新初始化模型参数，重新执行步骤A-3进行新一轮的优化训练；

步骤A-5：基于任务经验迁移的雷达目标智能识别方法的流程如图4所示。依据处理流程，循环执行步骤A-3和步骤A-4，直至达到N_c＝25次循环结束，保存最后的元学习器参数

依据多类平衡中心余弦损失基础学习器构建相同模型结构的CNN识别模型，将

作为CNN识别模型的初始化参数，分批次导入元测试任务小样本训练数据集进行模型的训练更新，当CNN的多类平衡余弦中心损失函数收敛且不再下降时结束模型训练；利用训练好的CNN识别模型，对元测试任务测试数据集进行分类识别，评估待识别的5类舰船目标实测数据的分类识别正确率。

实验分析结果表明，与CNN模型、深度迁移学习模型(DTL)和任务经验无偏差借鉴的元学习模型(UBML)相比，本发明设计的任务损失倒数加权更新元学习模型，通过对以往不同仿真舰船目标识别任务经验有区别的针对性迁移利用，大幅提升了小样本条件下的多类舰船目标实测HRRP的识别性能。小样本条件下，CNN模型从头到尾直接进行训练测试，由于训练数据的减少，CNN网络易出现过拟合，识别率差；DTL仅能对单任务特性进行迁移，其识别受限于单个源任务的经验质量，小样本识别效果欠佳；UBML对元训练任务的学习经验进行无差别借鉴，通过任务共性经验的迁移，可以进行较准确的分类识别，但对低相关度经验的过度借鉴导致舰船目标小样本识别率欠佳，且难以避免不同类别目标样本数不均衡所导致的样本数较少类别目标的识别率下降；本发明设计的任务损失倒数加权更新元学习模型，在元学习器中对不同任务学习经验进行任务损失倒数加权修正，指导新识别任务进行有效的小样本识别，提高了舰船目标小样本识别的整体识别正确率。综合来看，本发明方法整体优于其他现有学习模型，较以往的迁移学习方法更适合于小样本舰船目标的分类识别，体现了本发明方法的优越性。

实施例2：

实施例2为4类飞机目标雷达HRRP识别应用，具体可以分为以下几个步骤：

步骤B-1：构建深度元学习的数据集，其元学习数据结构如图1所示。由于缺乏飞机目标的仿真模型，可利用已积累的地面车辆目标实测HRRP数据构建元学习训练任务。首先，获取M＝8类车辆目标HRRP的实测数据，通过随机抽取N＝4类目标数据构建元训练任务集，并将N类非待识别车辆目标实测数据全部作为元训练任务训练数据集；鉴于实际试验飞机目标的非合作性，仅能获取数量较少的待识别飞机目标小样本HRRP实测数据，依据待识别的N类飞机目标的雷达实测HRRP数据，构建元测试任务小样本训练数据集和元测试任务测试数据集，将待识别任务归为元测试任务集。

步骤B-2：设计元学习模型；将元学习模型设计为多类平衡中心余弦损失基础学习器和任务损失倒数加权更新元学习器的组合，其模型结构如图2所示。多类平衡中心余弦损失基础学习器采用多类平衡余弦中心损失函数作为元训练任务的卷积神经网络损失函数；任务损失倒数加权更新元学习器基于平滑平均绝对误差损失函数，采用元训练任务损失值的倒数对元学习器参数进行加权修正更新；元学习模型的输入为元训练任务集，元学习模型的输出为更新后的模型参数；

步骤B-3：由8类车辆目标HRRP的实测数据不重复抽取4类目标数据，构成70个元训练任务组成的集合，从元训练任务集中随机抽取K＝10个元训练任务进行基础学习器训练；

对第k个元训练任务，利用多类平衡中心余弦损失基础学习器，结合第k个元训练任务的训练数据集进行分批次训练，依据式(1)的卷积神经网络多类平衡余弦中心损失函数，利用Adam优化器进行参数的迭代优化更新，进而得到第k个元训练任务的特性参数θ_Bk和相应任务损失值L_k；在所有K个元训练任务完成基础学习器训练后，将K个元训练任务的特性参数{θ_B1,θ_B2,…,θ_Bk,…,θ_BK}和相应的任务损失值{L_B1,L_B2,…,L_Bk,…,L_BK}正向传递给任务损失倒数加权更新元学习器，转入步骤B-4进行元学习器参数更新。

步骤B-4：任务损失倒数加权更新元学习器基于K个元训练任务的特性参数{θ_B1,θ_B2,…,θ_Bk,…,θ_BK}，利用相应的元训练任务损失值{L_B1,L_B2,…,L_Bk,…,L_BK}的倒数，基于式(7)对元学习器参数θ_M进行加权修正更新，并将更新后的参数

反馈给步骤B-3的多类平衡中心余弦损失基础学习器；以

为多类平衡中心余弦损失基础学习器的新初始化模型参数，重新执行步骤B-3进行新一轮的优化训练；

步骤B-5：基于任务经验迁移的雷达目标智能识别方法的流程如图4所示。依据处理流程，循环执行步骤B-3和步骤B-4，直至达到N_c＝7次循环结束，保存最后的元学习器参数

作为CNN识别模型的初始化参数，分批次导入元测试任务小样本训练数据集进行模型的训练更新，当CNN的多类平衡余弦中心损失函数收敛且不再下降时结束模型训练；利用训练好的CNN识别模型，对元测试任务测试数据集进行分类识别，评估待识别的4类飞机目标实测数据的分类识别正确率。

实验分析结果表明，与CNN模型、深度迁移学习模型(DTL)和任务经验无偏差借鉴的元学习模型(UBML)相比，本发明设计的任务损失倒数加权更新元学习模型，通过对以往不同实测车辆目标识别任务经验有区别的针对性迁移利用，大幅提升了小样本条件下的多类飞机目标实测HRRP的识别性能。小样本条件下，CNN模型从头到尾直接进行训练测试，由于训练数据的减少，CNN网络易出现过拟合，识别率差；DTL仅能对单任务特性进行迁移，其识别受限于单个源任务的经验质量，小样本识别效果欠佳；UBML对元训练任务的学习经验进行无差别借鉴，通过任务共性经验的迁移，可以进行较准确的分类识别，但对低相关度经验的过度借鉴导致飞机目标小样本识别率欠佳，且难以避免不同类别目标样本数不均衡所导致的样本数较少类别目标的识别率下降；本发明设计的任务损失倒数加权更新元学习模型，在元学习器中对不同任务学习经验进行任务损失倒数加权修正，指导新识别任务进行有效的小样本识别，提高了飞机目标小样本识别的整体识别正确率。综合来看，本发明方法整体优于其他现有学习模型，较以往的迁移学习方法更适合于小样本飞机目标的分类识别，体现了本发明方法的优越性。