CN114879185A - 基于任务经验迁移的雷达目标智能识别方法 - Google Patents

基于任务经验迁移的雷达目标智能识别方法 Download PDF

Info

Publication number
CN114879185A
CN114879185A CN202210668475.2A CN202210668475A CN114879185A CN 114879185 A CN114879185 A CN 114879185A CN 202210668475 A CN202210668475 A CN 202210668475A CN 114879185 A CN114879185 A CN 114879185A
Authority
CN
China
Prior art keywords
meta
task
training
loss
learner
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210668475.2A
Other languages
English (en)
Inventor
简涛
刘瑜
李刚
何友
李恒
张健
何佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naval Aeronautical University
Original Assignee
Naval Aeronautical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naval Aeronautical University filed Critical Naval Aeronautical University
Priority to CN202210668475.2A priority Critical patent/CN114879185A/zh
Publication of CN114879185A publication Critical patent/CN114879185A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/88Radar or analogous systems specially adapted for specific applications
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/41Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • G01S7/417Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section involving the use of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Electromagnetism (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于任务经验迁移的雷达目标智能识别方法,属于雷达信号处理领域。构建了多类平衡中心余弦损失基础学习器结合任务损失倒数加权更新元学习器的元学习识别框架,设计了基础学习器中卷积神经网络的多类平衡余弦中心损失函数,通过引入Focal损失,避免了不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题。基于平滑平均绝对误差损失函数,设计了元学习器参数的任务损失倒数加权更新方式,提升了对高相关度经验的借鉴程度,通过取小运算避免了元训练任务损失值过小而导致参数更新过程不收敛的问题。本发明方法提高了小样本条件下雷达目标高分辨距离像多类别识别正确率,具有推广应用价值。

Description

基于任务经验迁移的雷达目标智能识别方法
一、技术领域
本发明隶属于雷达信号处理领域,具体涉及一种基于任务经验迁移的雷达目标智能识别方法。
二、背景技术
高分辨距离像(High Resolution Range Profile,HRRP)是目标主散射点在雷达照射方向上的投影,反映了目标散射点的相对位置信息,一定程度上体现了目标部分结构信息,具有易存储、易处理以及方便获取等优点,因此在目标识别领域具有广阔的应用前景。对于合作目标,可以获取大量的目标HRRP样本,但在实际应用中,雷达所针对的目标往往是非合作目标,难以获取数量足够的非合作目标HRRP数据。因此,小样本条件下雷达目标HRRP识别已成为雷达目标识别领域的研究热点之一。
早期小样本条件下的目标分类识别技术主要以HRRP的统计建模方法为主,如线性动态模型、因子分析模型以及自适应高斯分类器模型等,随后学者们利用多任务学习理念和类别标签信息,在上述模型的基础上进行改进,相继提出了多任务因子分析模型、标签辅助因子分析模型以及多任务标签约束卷积因子分析模型等。统计建模方法需要对模型的变量进行先验假设,当实际环境与先验假设条件失配时,该类方法的识别性能将急剧下降。
近年来,深度学习方法在雷达目标识别领域得到了越来越多的重视。深度学习模型可以自主学习数据的内在规律和表示层次,但其往往需要依赖大量的样本数据以及较深的网络结构来获得预期的识别效果。在实际对抗环境中,能获取的非合作目标数据量较少且角度往往较为单一,针对上述小样本数据,深度学习过深的网络结构会导致模型过拟合。针对这一问题,相关学者一方面从增加数据量的角度出发,通过生成对抗网络等方法进行数据增强,以期满足深度学习模型对数据集的要求;另一方面则研究基于模型迁移的学习方法,将源域学习到的模型参数迁移至目标域中,从而利用迁移的知识进行小样本识别。需要指出的是,在模型迁移方法中,当源域与目标域差异较大时,所建立的迁移模型难以适用于不同的识别问题。作为迁移学习方法的拓展,元学习是一种针对不同任务设计具有不同特性学习器的机制,可利用以往不同任务上的经验,来指导新任务的学习,适用于分类、回归以及强化学习等多种应用场合。需要指出的是,现有元学习方法往往对所有任务的学习经验进行无差别借鉴,忽视了不同任务经验对新任务的差异性影响,易造成对低相关度经验的过度借鉴,进而导致识别率下降。另外,在小样本条件下,多个类别之间往往存在样本个数不均衡的情况,在反向传播过程中,样本较多的类别占损失函数的比重较高,易引导模型向利于输出该类别分类结果的方向优化,进而降低样本数较少类别目标的识别率。
针对小样本条件下雷达目标HRRP多类别识别精度差的问题,如何设计合适的基础学习器损失函数,避免不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降的问题;进而在元学习器中对不同任务学习经验进行针对性迁移借鉴,指导新识别任务进行有效的小样本识别,提高后续目标识别精度,是雷达目标多类别小样本智能识别领域的难点之一。
三、发明内容
1.要解决的技术问题
针对小样本条件下雷达目标HRRP多类别识别精度差的问题,如何构建合适的元学习识别框架,将单个任务特性与任务间共性进行解耦,设计合适的基础学习器和元学习器对单个任务特性和任务间共性进行经验迁移,实现雷达目标的有效小样本识别;针对基础学习器构建,如何设计合适的损失函数,避免多类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题;针对元学习器构建,如何实现对不同任务学习经验的针对性迁移借鉴,用于指导新识别任务进行有效的小样本识别,提高新任务的小样本目标识别精度。
2.技术方案
本发明所述基于任务经验迁移的雷达目标智能识别方法包括以下步骤:
步骤1深度元学习的数据集构建;依据待识别的N类目标的雷达高分辨距离像数据,构建元测试任务小样本训练数据集和元测试任务测试数据集,将待识别任务归为元测试任务集;依据与待识别目标数据不同类别或不同数据来源的M类非待识别目标积累数据,通过随机抽取N类目标数据构建元训练任务集,并将N类非待识别目标数据全部作为元训练任务训练数据集;
元学习的方法具体包含神经网络适应法、度量学习适应法、基础学习器和元学习器适应法以及贝叶斯元学习适应法等。其中,基础学习器和元学习器相结合可将任务特性建模与任务间共性建模进行解耦,通过二者间的互相交流,使得模型在任务特性和共性两方面均可达到最优,从而在保持模型精度的基础上,提升模型的泛化能力。传统机器学习的数据结构一般分为训练集和测试集,无论是训练集还是测试集,均需包含大量样本数据。而深度元学习与传统机器学习相类似,同样分为元训练集和元测试集,不同之处在于元训练集和元测试集中不是样本数据,而是各个任务的集合,在各个任务中又包含相应的训练数据集和测试数据集。与传统机器学习和经典元学习不同,本发明元学习模型的数据结构分为元训练任务集和元测试任务集,元测试任务集中包含相应的训练数据集和测试数据集,而为了提高数据利用率,元训练任务集只包含相应的训练数据集。
对于N类雷达目标的识别任务,依据待识别的N类目标的雷达高分辨距离像数据,构建元测试任务小样本训练数据集和元测试任务测试数据集,即元测试任务训练数据集为小样本数据集,将待识别任务归为元测试任务集;依据与待识别目标数据不同目标类别或不同数据来源的M类非待识别目标积累数据,其中M≥N,通过从M类中随机抽取N类目标数据构建元训练任务集,每个元训练任务包含N类非待识别目标,每个元训练任务只包含元训练任务训练数据集。
与经典元学习方法将元训练任务数据划分为训练数据集和测试数据集不同,本发明将元训练任务中的所有数据均作为元训练任务训练数据集,提高了元训练任务数据的训练利用率,改善了单个元训练任务的特性参数和损失值的计算精度和稳定性,有利于为后续元学习器提供更可靠的任务学习经验,用于指导待识别目标小样本分类器精准设计。
需要强调的是,鉴于待识别目标数据的小样本特性,与待识别的N类目标的雷达高分辨距离像数据相比,本发明的非待识别目标的积累数据,其不同之处可体现在两个方面:或体现为目标类型不同(例如,待识别目标为舰船目标,非待识别目标的积累数据涉及的是飞机目标);或体现为数据的类型不同(例如,同样为舰船目标,待识别目标的雷达高分辨距离像数据为实测数据,而非待识别目标的积累数据为仿真数据);或者以上两个方面均不相同(例如,待识别目标的雷达高分辨距离像数据为实测数据,而非待识别目标为地面车辆目标,其积累数据为红外图像的一维径向采样数据或雷达高分辨距离像仿真数据)。
步骤2元学习模型设计;将元学习模型设计为多类平衡中心余弦损失基础学习器和任务损失倒数加权更新元学习器的组合;多类平衡中心余弦损失基础学习器采用多类平衡余弦中心损失函数作为元训练任务的卷积神经网络损失函数;任务损失倒数加权更新元学习器基于平滑平均绝对误差损失函数,采用元训练任务损失值的倒数对元学习器参数进行加权修正更新;元学习模型的输入为元训练任务集,元学习模型的输出为更新后的模型参数;
本发明的元学习模型设计为多类平衡中心余弦损失基础学习器和任务损失倒数加权更新元学习器的组合。基础学习器对任务特性进行建模,要求基础学习器能够发现每个任务数据集的内在规律。深度学习模型依赖于强大的表示能力,可以提取目标深层次的特征,且对数据的拟合程度较好。因此,针对雷达目标HRRP多类别小样本识别任务,本发明设计了多类平衡中心余弦损失基础学习器,以一维卷积神经网络(CNN)作为学习训练模型;构建了多类平衡余弦中心损失函数作为一维CNN的损失函数,该损失函数利用大边缘余弦损失对类间特征进行约束的同时,对与类中心夹角较大的特征进行惩罚,使得类内特征的角度距离不断减小,提高特征的可分性;同时该损失函数通过降低易区分类别在损失函数中的权重来平衡各类别在损失函数中的占比,避免了不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题。
多类平衡中心余弦损失基础学习器包含一个输入层、三个卷积层(Conv)、三个池化层(POOL)、一个批归一化层(BN)、两个全连接层(FC)以及一个输出层。具体连接方式为:
Conv1→POOL1→Conv2→POOL2→Conv3+BN→POOL3→FC1→FC2
其中,输入层导入的是每个元训练任务训练数据集中的一小批次数据;前两个卷积层Conv1和Conv2为标准的卷积层;第三个卷积层Conv3为标准化卷积层,在卷积层Conv3的基础上添加了一个批归一化层BN,用于加强多类平衡余弦中心损失函数的梯度变化,三个卷积层均采用一维卷积核,大小分别为为A1、A2和A3,个数分别为B1、B2和B3,步长为D,填充方式均为相同填充;池化层POOL为平均池化层,步长为H;第一层全连接层FC1的神经元个数为F,第二层全连接层FC2的神经元个数等于待识别目标类别数N;输出层利用softmax函数计算每个样本的类别概率,根据计算结果计算损失函数值。
在小样本条件下,多个类别之间往往存在样本个数不均衡的情况,在反向传播过程中,样本较多的类别占损失函数的比重较高,易引导模型向利于输出该类别分类结果的方向优化,进而降低样本数较少类别目标的识别率。为此,本发明在基础学习器的CNN中构建了多类平衡余弦中心损失函数,在余弦距离和特征中心的基础上计算Focal损失,利用增强边缘余弦损失对类间特征进行约束的同时,对与类中心夹角较大的特征进行惩罚,使得类内特征的角度距离不断减小,提高特征的可分性;同时该损失函数通过引入Focal损失降低易区分类别在损失函数中的权重,以此平衡各类别在损失函数中的占比,避免了不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题。
每个元训练任务的损失函数可表示为:
Figure BDA0003693893000000041
其中,m是梯度更新过程中样本数据的个数;xi表示第i个样本所对应的全连接层输出特征向量;yi是第i个样本的真实标签;Wj是全连接层的权值矩阵W的第j列,即代表第j类目标对应的权值向量;
Figure BDA0003693893000000042
表示第yi类目标的归一化特征中心向量;log2(·)表示以2为底的对数函数;a、λ、s、α和γ为正的实参数;其中,正参数a满足0≤a≤1-cos(2π/N),其作用是为了增强特征向量xi与第yi类目标对应的权值向量
Figure BDA0003693893000000043
的夹角约束;实参数s解决损失函数不收敛的问题,满足
Figure BDA0003693893000000044
ε是一个接近于0的正常数;正参数γ用于调节输出的权值,满足0≤γ≤5;实参数α用于调整中心损失项中归一化特征幅度,防止出现特征归一化后损失函数不收敛的问题;正参数λ是中心损失项的权重,满足λ>0,λ越大,类内特征越聚集;φ(·,·)表示两个同维度向量间的夹角。
如果两个向量x与y之间的夹角为φ(x,y),则两个向量x与y之间的余弦距离为二者夹角的余弦值,可用归一化向量的内积表示为cos(φ(x,y))=xTy/(||x||||y||),上标T表示转置,||·||表示取欧几里得范数,余弦距离可有效避免不同向量的模值大小对距离度量的不利影响。
Figure BDA0003693893000000045
为权值向量Wj和特征向量xi之间的相似性度量,因为夹角的余弦值在
Figure BDA0003693893000000046
区间上是单调递减的,向量间夹角越小,则其余弦值越大,特征向量xi相对应的第i个样本属于类别j的概率则越大;为进一步增大不同类别目标特征的类间距离,本发明引入超参数a,当满足
Figure BDA0003693893000000047
时,才判定第i个样本属于类别j,超参数a的作用是为了增强特征向量xi与权值向量
Figure BDA0003693893000000048
的夹角约束。
第j类目标的归一化特征中心向量cj的初始化可表示为
Figure BDA0003693893000000051
其中,δ[·]表示单位冲激序列函数,当x=0时,δ[x]等于1,否则δ[x]等于0。在训练的过程中,对第j类目标的归一化特征中心向量cj的更新量为:
Figure BDA0003693893000000052
元学习模型设计中的元学习器,主要对任务间共性进行建模,功能是在每次基础学习器训练完成之后,对所有任务上的训练经验进行总结归纳,综合出新的经验,反馈给基础学习器。元学习器的形式多样,可以是任意一种基于随机梯度下降的模型,也可以是一种参数更新算法。为了降低运算复杂度并提高参数更新精度与效率,本发明方法设计了任务损失倒数加权更新元学习器,基于平滑平均绝对误差损失函数,采用元训练任务损失值的倒数对元学习器参数进行加权修正更新,通过充分考虑不同任务经验对新任务的差异性影响,对不同元训练任务的学习经验进行针对性借鉴,避免了对低相关度经验的过度借鉴而导致的识别率下降问题,使元学习器的初始化模型参数θM向高相关度任务的共性方向更新靠近。
元学习的主要目的是寻找高相关度任务的共性方向,使得元学习器的初始化模型参数θM向基础学习器中高相关度元训练任务的特性参数靠近,即使得参数θM与所有元训练任务特性参数之间的误差距离最小化,即元学习器的学习目标函数如下
Figure BDA0003693893000000053
其中,Dk为第k个元训练任务的特性参数θBk与元学习器参数θM之间的误差。与常用元学习器目标函数设计不同,式(4)中忽略了不平等度量,仅保留主要的误差项,在保证参数更新精度的基础上,降低了后续梯度求解难度和元学习器参数更新的计算复杂度,提高了参数更新效率。
为了防止均方误差(与欧几里得空间距离相对应)梯度爆炸问题,同时避免平均绝对误差在零点处的梯度不平滑缺陷,本发明方法构建了平滑平均绝对误差损失函数。误差项Dk具体表示为
Figure BDA0003693893000000054
元学习器的学习目标就是最小化两个学习器参数间的误差。根据拉格朗日定理,可计算Dk在参数θM处的梯度来最小化Dk。对于||θBkM||<1的情况,对距离Dk进行求导可得:
Figure BDA0003693893000000061
元学习器常假设每个元训练任务对元学习器参数θM的影响程度相同,进而将各项任务对元学习器参数θM的影响进行无差别叠加,用于计算所有任务的共性方向。考虑到不同元训练任务经验对新任务的差异性影响,第k个元训练任务的任务损失值Lk可在一定程度上反映出学习经验的差异程度,损失值越小,其倒数越大,说明训练效果越好,即该任务的学习经验更值得借鉴;反之损失值越大,其倒数越小,则表示该元训练任务的学习效果越差,学习经验可借鉴度较低。因此,为避免对低相关度经验的过度借鉴,充分利用不同元训练任务对元学习器参数更新的偏差影响,本发明方法利用元训练任务损失值的倒数,对元学习器的参数更新过程进行加权修正,使得元学习器有针对性地借鉴每个元训练任务的经验,减轻对低相关度经验的过度借鉴,提升高相关度经验的借鉴程度。任务损失倒数加权更新元学习器的参数更新方式如下:
Figure BDA0003693893000000062
其中,
Figure BDA0003693893000000063
即为元学习器更新后的参数,ε0为元学习器的更新步长;任务损失值Lk的倒数与Lk的变化直接负相关,采用该加权更新方式直观简洁。考虑到参数更新过程的函数收敛问题,min(·,·)表示取两个参数中的较小值,其作用是防止Lk过小时导致参数更新过程不收敛。
步骤3从元训练任务集中随机抽取K个元训练任务进行基础学习器训练;对第k个元训练任务,在多类平衡中心余弦损失基础学习器上利用元训练任务训练数据集进行分批次训练,通过卷积神经网络迭代更新优化,得到第k个元训练任务的特性参数θBk和损失值Lk;将K个元训练任务的特性参数和损失值正向传递给任务损失倒数加权更新元学习器,转入步骤4;
从元训练任务集中随机抽取K个元训练任务进行基础学习器训练;对第k个元训练任务,利用步骤2中设计的多类平衡中心余弦损失基础学习器,结合第k个元训练任务的训练数据集进行分批次训练,依据式(1)的多类平衡余弦中心损失函数,通过卷积神经网络进行迭代更新优化训练,得到第k个元训练任务的特性参数θBk和相应任务损失值Lk;在所有K个元训练任务完成基础学习器训练后,将K个元训练任务的特性参数{θB1B2,…,θBk,…,θBK}和相应的任务损失值{LB1,LB2,…,LBk,…,LBK}正向传递给任务损失倒数加权更新元学习器,转入步骤4进行元学习器参数更新。
步骤4任务损失倒数加权更新元学习器基于K个元训练任务的特性参数,利用相应的元训练任务损失值的倒数对元学习器参数θM进行加权修正更新,并将更新后的参数
Figure BDA0003693893000000064
反馈给多类平衡中心余弦损失基础学习器;以
Figure BDA0003693893000000071
为多类平衡中心余弦损失基础学习器的新初始化模型参数,重新执行步骤3进行新一轮的优化训练;
任务损失倒数加权更新元学习器基于K个元训练任务的特性参数{θB1B2,…,θBk,…,θBK},利用相应的元训练任务损失值{LB1,LB2,…,LBk,…,LBK}的倒数,基于式(7)对元学习器参数θM进行加权修正更新,并将更新后的参数
Figure BDA0003693893000000072
反馈给多类平衡中心余弦损失基础学习器;以
Figure BDA0003693893000000073
为多类平衡中心余弦损失基础学习器的新初始化模型参数,重新执行步骤3进行新一轮的优化训练;
步骤5循环执行步骤3和步骤4,直至达到Nc次循环结束,保存最后的任务损失倒数加权更新元学习器参数
Figure BDA0003693893000000074
构建与多类平衡中心余弦损失基础学习器相同模型结构的卷积神经网络识别模型,将
Figure BDA0003693893000000075
作为卷积神经网络识别模型的初始化参数,分批次导入元测试任务小样本训练数据集进行识别模型的训练更新,当卷积神经网络的多类平衡余弦中心损失函数收敛且不再下降时结束识别模型训练;利用训练好的卷积神经网络识别模型,对元测试任务测试数据集进行分类识别,评估待识别的N类目标的分类识别正确率。
元学习训练阶段结构上分为内、外两个循环结构,内循环是指基础学习器和元学习器之间参数的循环更新,外循环则是指内循环的训练轮次循环。首先,初始化基础学习器的模型参数,从元训练集中抽取识别任务导入基础学习器进行学习,根据多类平衡余弦中心损失函数更新基础学习器参数;其次,将基础学习器学习后的模型参数导入任务损失倒数加权更新元学习器进行参数更新,并将更新后的参数反馈给基础学习器重新进行参数赋值,并开展新一轮的元训练任务抽取与基础学习器训练,循环重复,直至达到外循环次数结束,并保存最终的CNN模型参数。
元学习测试阶段则是利用元学习训练阶段的训练参数对识别模型进行参数初始化,以便将以往的学习经验迁移至元测试集中,利用初始化后的识别模型进行分类识别,验证方法的效能。首先,将元学习训练阶段中保存的CNN模型参数作为识别模型的初始参数,导入元测试集中的小样本训练数据集进行识别模型训练,直至多类平衡余弦中心损失函数收敛,结束元测试集训练;然后,利用元测试集训练所得的识别模型和参数,对元测试集的测试数据集进行分类识别评估,计算测试数据集中每类目标的分类识别正确率。
3.有益效果
与背景技术相比,本发明的有益效果是:1)针对小样本条件下雷达目标HRRP多类别识别精度差的问题,构建了多类平衡中心余弦损失基础学习器结合任务损失倒数加权更新元学习器的元学习识别框架,将单个任务特性与任务间共性进行解耦,对单个任务特性和任务间共性进行经验迁移,实现雷达目标HRRP的小样本有效识别;2)针对基础学习器的CNN构建,设计了多类平衡余弦中心损失函数,利用增强边缘余弦损失对类间特征进行约束,提高类间特征可分性,同时对与类中心夹角较大的特征进行惩罚,提高了类内特征的聚集性,进一步增强特征整体可分性;3)多类平衡余弦中心损失函数通过引入Focal损失,降低易区分类别在损失函数中的权重,平衡了各类别在损失函数中的占比,避免了不同类别样本数不均衡所导致的样本数较少类别目标的识别率下降问题;4)构建了仅含主要误差项的元学习器学习目标函数,通过忽略影响度低的不平等度量,在保证参数更新精度的基础上,降低了后续梯度求解难度和元学习器参数更新的计算复杂度,提高了参数更新效率;5)构建了元学习器的平滑平均绝对误差损失函数,避免了均方误差的梯度爆炸问题,克服了平均绝对误差在零点处的梯度不平滑缺陷,提高了元学习器目标函数误差项的建模精度,为后续元学习器参数的高效更新提供模型保证;6)设计了元学习器参数的任务损失倒数加权更新方式,利用元训练任务损失值与任务训练效果的负相关性,避免了对低相关度经验的过度借鉴,提升了对高相关度经验的借鉴程度,通过取小运算避免了元训练任务损失值过小而导致参数更新过程不收敛的问题。
四、附图说明
图1是本发明方法的元学习数据结构示意图;
图2是本发明方法的元学习模型结构示意图;
图3是本发明方法的基础学习器的结构示意图
图4是基于任务经验迁移的雷达目标智能识别方法流程图
五、具体实施方式
下面结合附图对本发明作进一步描述。本发明实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。
为验证本发明所述方法的有效性,本具体实施方式给出了2个实施例,第一个实施例针对多类舰船目标雷达HRRP识别应用,第二个实施例针对多类飞机目标雷达HRRP识别应用。
实施例1:
实施例1为5类舰船目标雷达HRRP识别应用,具体可以分为以下几个步骤:
步骤A-1:构建深度元学习的数据集,其元学习数据结构如图1所示;首先,获取M=10类舰船目标HRRP的仿真数据,通过随机抽取N=5类目标数据构建元训练任务集,并将N类非待识别舰船目标仿真数据全部作为元训练任务训练数据集;鉴于实际试验舰船目标的非合作性,仅能获取数量较少的待识别舰船目标小样本HRRP实测数据,依据待识别的N类舰船目标的雷达实测HRRP数据,构建元测试任务小样本训练数据集和元测试任务测试数据集,将待识别任务归为元测试任务集。
步骤A-2:设计元学习模型;将元学习模型设计为多类平衡中心余弦损失基础学习器和任务损失倒数加权更新元学习器的组合,其模型结构如图2所示。多类平衡中心余弦损失基础学习器采用多类平衡余弦中心损失函数作为元训练任务的卷积神经网络损失函数;任务损失倒数加权更新元学习器基于平滑平均绝对误差损失函数,采用元训练任务损失值的倒数对元学习器参数进行加权修正更新;元学习模型的输入为元训练任务集,元学习模型的输出为更新后的模型参数;
步骤A-3:由10类舰船目标HRRP的仿真数据不重复抽取5类目标数据,构成252个元训练任务组成的集合,从元训练任务集中随机抽取K=10个元训练任务进行基础学习器训练;
对多类平衡中心余弦损失基础学习器的CNN模型参数θB进行初始化,具体包括卷积层的权值{wconv1,bconv1,wconv2,bconv2,wconv3,bconv3},全连接层的权值{wfc,bfc,wfc2,bfc2}。多类平衡中心余弦损失基础学习器的结构参数取值为:N=5,A1=9,A2=9,A3=9,B1=8,B2=16,B3=32,D=1,H=2,F=100;对应的多类平衡中心余弦损失基础学习器的具体设计如图3所示。
对第k个元训练任务,利用多类平衡中心余弦损失基础学习器,结合第k个元训练任务的训练数据集进行分批次训练,依据式(1)的卷积神经网络多类平衡余弦中心损失函数,利用Adam优化器进行参数的迭代优化更新,进而得到第k个元训练任务的特性参数θBk和相应任务损失值Lk;在所有K个元训练任务完成基础学习器训练后,将K个元训练任务的特性参数{θB1B2,…,θBk,…,θBK}和相应的任务损失值{LB1,LB2,…,LBk,…,LBK}正向传递给任务损失倒数加权更新元学习器,转入步骤A-4进行元学习器参数更新。
步骤A-4:任务损失倒数加权更新元学习器基于K个元训练任务的特性参数{θB1B2,…,θBk,…,θBK},利用相应的元训练任务损失值{LB1,LB2,…,LBk,…,LBK}的倒数,基于式(7)对元学习器参数θM进行加权修正更新,并将更新后的参数
Figure BDA0003693893000000091
反馈给步骤A-3的多类平衡中心余弦损失基础学习器;以
Figure BDA0003693893000000092
为多类平衡中心余弦损失基础学习器的新初始化模型参数,重新执行步骤A-3进行新一轮的优化训练;
步骤A-5:基于任务经验迁移的雷达目标智能识别方法的流程如图4所示。依据处理流程,循环执行步骤A-3和步骤A-4,直至达到Nc=25次循环结束,保存最后的元学习器参数
Figure BDA0003693893000000093
依据多类平衡中心余弦损失基础学习器构建相同模型结构的CNN识别模型,将
Figure BDA0003693893000000094
作为CNN识别模型的初始化参数,分批次导入元测试任务小样本训练数据集进行模型的训练更新,当CNN的多类平衡余弦中心损失函数收敛且不再下降时结束模型训练;利用训练好的CNN识别模型,对元测试任务测试数据集进行分类识别,评估待识别的5类舰船目标实测数据的分类识别正确率。
实验分析结果表明,与CNN模型、深度迁移学习模型(DTL)和任务经验无偏差借鉴的元学习模型(UBML)相比,本发明设计的任务损失倒数加权更新元学习模型,通过对以往不同仿真舰船目标识别任务经验有区别的针对性迁移利用,大幅提升了小样本条件下的多类舰船目标实测HRRP的识别性能。小样本条件下,CNN模型从头到尾直接进行训练测试,由于训练数据的减少,CNN网络易出现过拟合,识别率差;DTL仅能对单任务特性进行迁移,其识别受限于单个源任务的经验质量,小样本识别效果欠佳;UBML对元训练任务的学习经验进行无差别借鉴,通过任务共性经验的迁移,可以进行较准确的分类识别,但对低相关度经验的过度借鉴导致舰船目标小样本识别率欠佳,且难以避免不同类别目标样本数不均衡所导致的样本数较少类别目标的识别率下降;本发明设计的任务损失倒数加权更新元学习模型,在元学习器中对不同任务学习经验进行任务损失倒数加权修正,指导新识别任务进行有效的小样本识别,提高了舰船目标小样本识别的整体识别正确率。综合来看,本发明方法整体优于其他现有学习模型,较以往的迁移学习方法更适合于小样本舰船目标的分类识别,体现了本发明方法的优越性。
实施例2:
实施例2为4类飞机目标雷达HRRP识别应用,具体可以分为以下几个步骤:
步骤B-1:构建深度元学习的数据集,其元学习数据结构如图1所示。由于缺乏飞机目标的仿真模型,可利用已积累的地面车辆目标实测HRRP数据构建元学习训练任务。首先,获取M=8类车辆目标HRRP的实测数据,通过随机抽取N=4类目标数据构建元训练任务集,并将N类非待识别车辆目标实测数据全部作为元训练任务训练数据集;鉴于实际试验飞机目标的非合作性,仅能获取数量较少的待识别飞机目标小样本HRRP实测数据,依据待识别的N类飞机目标的雷达实测HRRP数据,构建元测试任务小样本训练数据集和元测试任务测试数据集,将待识别任务归为元测试任务集。
步骤B-2:设计元学习模型;将元学习模型设计为多类平衡中心余弦损失基础学习器和任务损失倒数加权更新元学习器的组合,其模型结构如图2所示。多类平衡中心余弦损失基础学习器采用多类平衡余弦中心损失函数作为元训练任务的卷积神经网络损失函数;任务损失倒数加权更新元学习器基于平滑平均绝对误差损失函数,采用元训练任务损失值的倒数对元学习器参数进行加权修正更新;元学习模型的输入为元训练任务集,元学习模型的输出为更新后的模型参数;
步骤B-3:由8类车辆目标HRRP的实测数据不重复抽取4类目标数据,构成70个元训练任务组成的集合,从元训练任务集中随机抽取K=10个元训练任务进行基础学习器训练;
对多类平衡中心余弦损失基础学习器的CNN模型参数θB进行初始化,具体包括卷积层的权值{wconv1,bconv1,wconv2,bconv2,wconv3,bconv3},全连接层的权值{wfc,bfc,wfc2,bfc2}。多类平衡中心余弦损失基础学习器的结构参数取值为:N=5,A1=9,A2=9,A3=9,B1=8,B2=16,B3=32,D=1,H=2,F=100;对应的多类平衡中心余弦损失基础学习器的具体设计如图3所示。
对第k个元训练任务,利用多类平衡中心余弦损失基础学习器,结合第k个元训练任务的训练数据集进行分批次训练,依据式(1)的卷积神经网络多类平衡余弦中心损失函数,利用Adam优化器进行参数的迭代优化更新,进而得到第k个元训练任务的特性参数θBk和相应任务损失值Lk;在所有K个元训练任务完成基础学习器训练后,将K个元训练任务的特性参数{θB1B2,…,θBk,…,θBK}和相应的任务损失值{LB1,LB2,…,LBk,…,LBK}正向传递给任务损失倒数加权更新元学习器,转入步骤B-4进行元学习器参数更新。
步骤B-4:任务损失倒数加权更新元学习器基于K个元训练任务的特性参数{θB1B2,…,θBk,…,θBK},利用相应的元训练任务损失值{LB1,LB2,…,LBk,…,LBK}的倒数,基于式(7)对元学习器参数θM进行加权修正更新,并将更新后的参数
Figure BDA0003693893000000111
反馈给步骤B-3的多类平衡中心余弦损失基础学习器;以
Figure BDA0003693893000000112
为多类平衡中心余弦损失基础学习器的新初始化模型参数,重新执行步骤B-3进行新一轮的优化训练;
步骤B-5:基于任务经验迁移的雷达目标智能识别方法的流程如图4所示。依据处理流程,循环执行步骤B-3和步骤B-4,直至达到Nc=7次循环结束,保存最后的元学习器参数
Figure BDA0003693893000000113
依据多类平衡中心余弦损失基础学习器构建相同模型结构的CNN识别模型,将
Figure BDA0003693893000000114
作为CNN识别模型的初始化参数,分批次导入元测试任务小样本训练数据集进行模型的训练更新,当CNN的多类平衡余弦中心损失函数收敛且不再下降时结束模型训练;利用训练好的CNN识别模型,对元测试任务测试数据集进行分类识别,评估待识别的4类飞机目标实测数据的分类识别正确率。
实验分析结果表明,与CNN模型、深度迁移学习模型(DTL)和任务经验无偏差借鉴的元学习模型(UBML)相比,本发明设计的任务损失倒数加权更新元学习模型,通过对以往不同实测车辆目标识别任务经验有区别的针对性迁移利用,大幅提升了小样本条件下的多类飞机目标实测HRRP的识别性能。小样本条件下,CNN模型从头到尾直接进行训练测试,由于训练数据的减少,CNN网络易出现过拟合,识别率差;DTL仅能对单任务特性进行迁移,其识别受限于单个源任务的经验质量,小样本识别效果欠佳;UBML对元训练任务的学习经验进行无差别借鉴,通过任务共性经验的迁移,可以进行较准确的分类识别,但对低相关度经验的过度借鉴导致飞机目标小样本识别率欠佳,且难以避免不同类别目标样本数不均衡所导致的样本数较少类别目标的识别率下降;本发明设计的任务损失倒数加权更新元学习模型,在元学习器中对不同任务学习经验进行任务损失倒数加权修正,指导新识别任务进行有效的小样本识别,提高了飞机目标小样本识别的整体识别正确率。综合来看,本发明方法整体优于其他现有学习模型,较以往的迁移学习方法更适合于小样本飞机目标的分类识别,体现了本发明方法的优越性。

Claims (4)

1.基于任务经验迁移的雷达目标智能识别方法,其特征在于,包括以下步骤:
步骤1深度元学习的数据集构建;依据待识别的N类目标的雷达高分辨距离像数据,构建元测试任务小样本训练数据集和元测试任务测试数据集,将待识别任务归为元测试任务集;依据与待识别目标数据不同类别或不同数据来源的M类非待识别目标积累数据,通过随机抽取N类目标数据构建元训练任务集,并将N类非待识别目标数据全部作为元训练任务训练数据集;
步骤2元学习模型设计;将元学习模型设计为多类平衡中心余弦损失基础学习器和任务损失倒数加权更新元学习器的组合;多类平衡中心余弦损失基础学习器采用多类平衡余弦中心损失函数作为元训练任务的卷积神经网络损失函数;任务损失倒数加权更新元学习器基于平滑平均绝对误差损失函数,采用元训练任务损失值的倒数对元学习器参数进行加权修正更新;元学习模型的输入为元训练任务集,元学习模型的输出为更新后的模型参数;
步骤3从元训练任务集中随机抽取K个元训练任务进行基础学习器训练;对第k个元训练任务,在多类平衡中心余弦损失基础学习器上利用元训练任务训练数据集进行分批次训练,通过卷积神经网络迭代更新优化,得到第k个元训练任务的特性参数θBk和损失值Lk;将K个元训练任务的特性参数和损失值正向传递给任务损失倒数加权更新元学习器,转入步骤4;
步骤4任务损失倒数加权更新元学习器基于K个元训练任务的特性参数,利用相应的元训练任务损失值的倒数对元学习器参数θM进行加权修正更新,并将更新后的参数
Figure FDA0003693892990000011
反馈给多类平衡中心余弦损失基础学习器;以
Figure FDA0003693892990000012
为多类平衡中心余弦损失基础学习器的新初始化模型参数,重新执行步骤3进行新一轮的优化训练;
步骤5循环执行步骤3和步骤4,直至达到Nc次循环结束,保存最后的任务损失倒数加权更新元学习器参数
Figure FDA0003693892990000013
构建与多类平衡中心余弦损失基础学习器相同模型结构的卷积神经网络识别模型,将
Figure FDA0003693892990000014
作为卷积神经网络识别模型的初始化参数,分批次导入元测试任务小样本训练数据集进行识别模型的训练更新,当卷积神经网络的多类平衡余弦中心损失函数收敛且不再下降时结束识别模型训练;利用训练好的卷积神经网络识别模型,对元测试任务测试数据集进行分类识别,评估待识别的N类目标的分类识别正确率。
2.根据权利要求1所述的基于任务经验迁移的雷达目标智能识别方法,其特征在于,在所述步骤2中:
多类平衡中心余弦损失基础学习器的卷积神经网络构建中,设计了多类平衡余弦中心损失函数,在余弦距离和特征中心的基础上计算Focal损失,每个元训练任务的损失函数具体表示为
Figure FDA0003693892990000021
其中,m是梯度更新过程中样本数据的个数;xi表示第i个样本所对应的全连接层输出特征向量;yi是第i个样本的真实标签;Wj是第j类目标对应的权值向量;
Figure FDA0003693892990000022
表示第yi类目标的归一化特征中心向量;a、λ、s、α和γ为正的实参数;φ(·,·)表示两个同维度向量间的夹角;
第j类目标的归一化特征中心向量cj的初始化可表示为
Figure FDA0003693892990000023
在训练的过程中,对cj的更新量为
Figure FDA0003693892990000024
其中,δ[·]表示单位冲激序列函数。
3.根据权利要求1所述的基于任务经验迁移的雷达目标智能识别方法,其特征在于,在所述步骤2中:
任务损失倒数加权更新元学习器的学习目标函数中主要误差项设计为平滑平均绝对误差损失函数,第k个元训练任务的特性参数θBk与元学习器参数θM之间的误差Dk表示为
Figure FDA0003693892990000025
其中,||·||表示取欧几里得范数。
4.根据权利要求1所述的基于任务经验迁移的雷达目标智能识别方法,其特征在于,在所述步骤2中:
任务损失倒数加权更新元学习器的参数更新方式为
Figure FDA0003693892990000026
其中,
Figure FDA0003693892990000027
即为元学习器更新后的参数,min(·,·)表示取两个参数中的较小值。
CN202210668475.2A 2022-06-14 2022-06-14 基于任务经验迁移的雷达目标智能识别方法 Pending CN114879185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210668475.2A CN114879185A (zh) 2022-06-14 2022-06-14 基于任务经验迁移的雷达目标智能识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210668475.2A CN114879185A (zh) 2022-06-14 2022-06-14 基于任务经验迁移的雷达目标智能识别方法

Publications (1)

Publication Number Publication Date
CN114879185A true CN114879185A (zh) 2022-08-09

Family

ID=82681096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210668475.2A Pending CN114879185A (zh) 2022-06-14 2022-06-14 基于任务经验迁移的雷达目标智能识别方法

Country Status (1)

Country Link
CN (1) CN114879185A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115345322A (zh) * 2022-10-19 2022-11-15 电子科技大学长三角研究院(衢州) 一种基于层级化元迁移的小样本雷达目标识别方法
WO2024114121A1 (zh) * 2022-11-30 2024-06-06 南京邮电大学 一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115345322A (zh) * 2022-10-19 2022-11-15 电子科技大学长三角研究院(衢州) 一种基于层级化元迁移的小样本雷达目标识别方法
WO2024114121A1 (zh) * 2022-11-30 2024-06-06 南京邮电大学 一种基于知识自演化的人工智能跨平台模型智能计算引擎构建方法

Similar Documents

Publication Publication Date Title
CN109993280B (zh) 一种基于深度学习的水下声源定位方法
CN106355151B (zh) 一种基于深度置信网络的三维sar图像目标识别方法
CN112001270B (zh) 基于一维卷积神经网络的地面雷达自动目标分类识别方法
CN111160176B (zh) 基于融合特征的一维卷积神经网络地面雷达目标分类方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN108696331B (zh) 一种基于生成对抗网络的信号重构方法
CN114879185A (zh) 基于任务经验迁移的雷达目标智能识别方法
CN108133232A (zh) 一种基于统计字典学习的雷达高分辨距离像目标识别方法
CN113537305B (zh) 一种基于匹配网络少样本学习的图像分类方法
CN108960330A (zh) 基于快速区域卷积神经网络的遥感图像语义生成方法
CN107315765A (zh) 一种大规模图片集分布式近似搜索的方法
CN114488140B (zh) 一种基于深度迁移学习的小样本雷达一维像目标识别方法
CN112557034B (zh) 一种基于pca_cnns的轴承故障诊断方法
CN112966667B (zh) 海面目标一维距离像降噪卷积神经网络识别方法
CN110363230A (zh) 基于加权基分类器的stacking集成污水处理故障诊断方法
CN111191685A (zh) 一种损失函数动态加权的方法
CN115659254A (zh) 一种双模态特征融合的配电网电能质量扰动分析方法
CN113723572B (zh) 船只目标识别方法、计算机系统及程序产品、存储介质
CN114492744A (zh) 一种基于对抗生成网络的地海杂波谱数据样本生成方法
CN114859317A (zh) 雷达目标自适应反向截断智能识别方法
CN109902589A (zh) 一种基于雷达一维距离像的目标识别方法及系统
CN110223342A (zh) 一种基于深度神经网络的空间目标尺寸估计方法
CN114859316A (zh) 基于任务相关度加权的雷达目标智能识别方法
CN109871907A (zh) 基于sae-hmm模型的雷达目标高分辨率距离像识别方法
CN117370766A (zh) 一种基于深度学习的卫星任务规划方案评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination