CN116310732A

CN116310732A - 一种面向开集雷达图像自动目标识别的熵感知元学习方法

Info

Publication number: CN116310732A
Application number: CN202310354938.2A
Authority: CN
Inventors: 黄钰林; 裴季方; 王陈炜; 张寅�; 罗思懿; 霍伟博; 杨建宇
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2023-04-06
Filing date: 2023-04-06
Publication date: 2023-06-23

Abstract

本发明公开一种面向开集雷达图像自动目标识别的熵感知元学习方法，应用于目标识别领域，针对现有的SAR自动目标识别对开放集目标无法有效区分的问题；本发明通过设计元学习任务，基于已知类构造动态的特征空间；为进一步增强未知类和已知类之间的区分，设计熵感知损失函数来迫使模型增强特征空间，最终实现开集环境下准确地SAR目标图像已知类识别和未知类拒绝。

Description

一种面向开集雷达图像自动目标识别的熵感知元学习方法

技术领域

本发明属于目标识别领域，特别涉及一种雷达图像目标识别技术。

背景技术

作为一种必不可少的微波遥感系统，合成孔径雷达(synthetic aperture radar，SAR)在民用和军事领域的应用广泛。而SAR自动目标识别(automatic targetrecognition，ATR)是其重要应用之一。随着近年来的深度学习的不断发展，SAR ATR也越来越多地利用深度学习来解决瓶颈问题。然而，大多数SAR ATR方法设置在封闭集中，即所有待检测的目标均为训练学习过的已知类目标。当存在一些未知类别的目标时，现有方法依旧会将这些目标分配为已知类别，这很可能引发一些潜在的风险。例如，当一些看不见的危险等级被划分为已知的安全等级时，可能会导致战场侦察崩溃。因此，区分不可见的目标类是实际应用中亟待解决的问题，即开放集识别(open set recognition，OSR)问题。

OSR的目标是建立一个能够同时识别已知类并拒绝未知类目标的模型。例如，文献“S.Dang,Z.Cao,Z.Cui,and Y.Pi,Open set sar target recognition using classboundary extracting,in 2019 6th Asia-Pacific Conference on Synthetic ApertureRadar(APSAR).IEEE,2019,pp.1–4.”使用类边界来训练开放集识别或离群值检测模型，其提出的O-SAR方法在准确拒绝未知目标上表现良好。然而，即使这些现有方法对SAR ATR中的OSR有了一定的了解，但它们主要是基于手工特征或先验知识，识别性能也主要取决于这些先验信息的质量。此外，它们大多只是基于整个封闭数据集构造静态特征空间，设计手工特征来拒绝有限的开放类，对于实际中的OSR问题并不总是有效的。

发明内容

为解决上述技术问题，本发明提出一种面向开集雷达图像自动目标识别的熵感知元学习方法，通过设计元学习任务，基于已知类构造动态的特征空间，为进一步增强未知类和已知类之间的区分，设计熵感知损失函数来迫使模型增强特征空间，最终实现开集环境下准确的SAR目标图像已知类识别和未知类拒绝。

本发明采用的技术方案为：一种面向开集雷达图像自动目标识别的熵感知元学习方法，包括：

S1、获取雷达图像数据集，并将雷达图像数据集分为元训练集和元测试集；

S2、元训练阶段，通过随机选择已知类和未知类，得到元学习任务的训练子集与测试子集；基于各元学习任务的训练子集训练元学习器；

S3、将训练完成的元学习器应用于各元学习任务的测试子集进行SAR目标识别。

本发明的有益效果：本发明方法首先通过元学习任务学习构造动态分配的已知类的特征空间，并强制特征空间区分未知类和已知类，以此在开集条件下拒绝所有不属于已知类的其他类。同时，利用设计的熵感知损失函数增强模型的特征空间，更加有效且鲁棒地实现已知类和未知类间的区分；

本发明通过构造一个动态特征空间，在动态识别已知类的同时能够准确拒绝未知类。在运动和静止目标采集与识别(moving and stationary target acquisition andrecognition，MSTAR)数据集上的实验展现了该发明在开集雷达图像自动目标识别上优异的性能。

附图说明

图1为本发明方法的整体框架；

图2为本发明方法的具体结构和熵感知损失函数的三个部分的细节。

具体实施方式

为便于本领域技术人员理解本发明的技术内容，下面结合附图对本发明内容进一步阐释。

步骤一：将可用的雷达图像数据集分为元训练集和元测试集。在元训练阶段，使用元训练集进行基于任务的元训练。在元训练中，通过随机选择已知类和未知类，元学习器面临许多不同的任务，并根据这些任务的表现进行优化，最终具有识别已知类和拒绝未知类的能力。本实施例中以应用场景下应用方已经具备的或者开源的数据集来作为可用的雷达图像数据集。

以元学习任务为训练和测试阶段的基本单元，过程中定义一个元训练数据集D_mtr和一个元测试数据集D_mte，如图1所示。元训练数据集D_mtr在实际应用中被视为封闭数据集。本发明在D_mtr上训练模型，期望在测试阶段能够识别开放数据集中已知类的目标并拒绝封闭数据集外未知类的目标。开放数据集是指测试图像，即包含未知类别的图像得数据集。

对于元训练阶段采样的所有任务，数据集可以表述为

其中C表示可用的监督图像数据类的集合(封闭集)，N^tr是元训练阶段所有任务的数量，/>

表示元训练数据集中第i个任务的训练子集，/>

表示元训练数据集中第i个任务的测试子集。对于元训练阶段的每一个任务，从/>

中随机选定一部分类为已知类C^closed，并将其它类设置为未知类U^open。其中已知类C^closed和未知类U^open需要满足两个条件：/>

和/>

简而言之，训练子集/>

从已知类C^closed采样得到，测试子集T_i ^tr从元训练数据集的所有类/>

中采样得到。

对于第i个任务，元训练阶段分为两步进行。给定元学习器f_θ(θ表示元学习器的参数)和合适的损失L，第一步是对训练子集

进行优化，操作如下：

其中

表示训练子集S^tr的对应类别标签(如MSTAR中SAR目标车辆图像的类别：步兵战车(BMP2)、装甲运输车(BTR70)、坦克(T72)等等，f′_θ表示整个训练子集S^tr下的最优元学习器。

第二步是对测试子集T^tr进行优化，基于上述训练得到的f′_θ进一步更新得到第i个任务的最佳元学习器

其中

表示测试子集T^tr的对应类别标签。

步骤二：基于设计的熵感知损失函数优化模型，包括元交叉熵损失、熵距离损失和开集损失三个部分。如图2所示，展示了本发明方法的具体网络结构以及设计的三个损失函数的细节。简而言之，本发明首先引用Swin Transformer网络结构(源自文献“Liu Z,LinY,Cao Y,et al.Swin transformer:Hierarchical vision transformer using shiftedwindows,Proceedings of the IEEE/CVF international conference on computervision.2021:10012-10022.”)，然后将原始雷达图像数据输入该网络，将样本图像映射到一个更高维的空间，即特征空间。再利用损失函数反向更新模型，减小损失，获取得到更优的特征表达以实现后续的准确识别。

对于给定元训练数据集

如公式(1)所示，在S^tr上训练的元学习器f′_θ，其中应用熵感知损失函数L_ea作为损失函数L。L_ea设置如下：

L_ea＝λ₁L_meta-ce+λ₂L_entropy+λ₃L_open (3)

其中L_meta-ce是元交叉熵损失，L_entropy是熵距离损失，L_open是开集损失，λ₁、λ₂和λ₃是加权参数，λ₁、λ₂和λ₃取值范围为[0,1]。

元交叉熵损失L_meta-ce的设计旨在最大化已知类的特征距离熵来帮助模型构建基本特征空间，它为模型提供了识别已知类的基本能力。基于测试子集T^tr的元交叉熵损失L_meta-ce定义如下：

其中C^closed表示该任务中选定的已知类，且y_j∈C^closed。此外，在计算中，若输入样本x_i(第i张SAR图像)属于j类则使得yj＝1，否则yj＝0。p(y_j|x_i)＝sf(L₂(-d(v(x_i),a_j)))表示输入的x_i经模型判别为j类目标图像的概率，其中sf(·)表示SoftMax函数，L₂(·)表示L₂归一化处理，d(v(x_i),a_j)表示v(x_i)和a_j之间的距离。v(x_i)＝GAP(net(x_i))是指输入图像样本x_i提取得到的最终特征图，其中GAP(·)指代全局平均池化操作，net(·)指代如图2所示网络结构的各层操作(具体运算可参照文献“Liu Z,Lin Y,Cao Y,et al.Swintransformer:Hierarchical vision transformer using shifted windows,Proceedingsof the IEEE/CVF international conference on computer vision.2021:10012-10022.”)。a_j指代j类目标图像的原型(计算参照文献“J.Snell,K.Swersky,and R.Zemel,Prototypical networks for few-shot learning,Advances in neural informationprocessing systems,vol.30,2017.”中的原型定义)。

熵距离损失L_entropy的设计旨在最小化未知类相对于已知类的特征距离熵，为模型提供了拒绝未知类的基本能力。简而言之，L_entropy通过计算并减少分配给已知类的未知类的熵，扩大了已知类与未知类之间的特征距离，如图2所示。基于来自开集U^open的样本x_i的熵距离损失L_entropy定义如下：

开集损失L_open的设计迫使构造的特征空间在已知类和未知类之间获得区分。如图2所示，在网络提取的特征图经过全局平均池化(global average pooling layer，GAP)之后，特征通过SoftMax的密集层识别器，从而计算开集损失如下：

总之，元学习器通过熵感知损失函数这三个组成部分，可以使得已知类之间的特征距离熵普遍大于未知类相对于已知类的特征距离熵，并通过判断特征距离熵的大小来实现模型对未知类的区分。最后，促进模型在已知类和未知类之间实现有效且具有鲁棒性的区分，同时精确识别已知类。

通过上述的损失和优化过程，可以优化得到第i个任务的最佳元学习器f_θ ^*，并将其作为第(i+1)个任务的初始元学习器，以此迭代完成元训练阶段。

步骤三：在元测试阶段，实现开集条件下的SAR目标准确识别，并评估本发明方法面向OSR问题的性能。

元学习器在N个元训练任务下不断优化后，将在元测试阶段对元学习器进行评估。元测试数据集表示为

其训练子集S^te从封闭集C中随机采样得到，测试子集T^te从包含已知标签和未知标签的所有类(C∪U)中采样得到。元学习器/>

通过训练子集S^te生成最终的最优模型f″_θ：

其中

是训练子集S^te对应的标签。

至此得到了最终元学习器f″_θ，它将应用于测试子集T^te以完成最后的SAR目标识别。设置MSTAR数据集中BMP2、BTR70和T72这三类为已知类，其余七类作为未知类，表1展示了本发明方法在不同识别指标下与其他开集识别方法之间的开集识别性能对比。其中，真正类率是当前预测为已知类中真实的已知类样本所占所有真实已知类样本的比例；负正类率是当前被错误预测为已知类中真实的未知类样本所占所有真实未知类样本总数的比例；召回率表示所有已知类样本能被正确识别的概率；精确率表示预测为已知类样本中正确识别的概率；准确率给出正确识别每一个已知类以及准确拒绝未知类的平均概率。

表1本发明方法与其余开集SAR目标识别方法的对比结果

在本实施例中，本发明通过元学习任务动态地为封闭集构造特征空间，同时辅助设计熵感知损失函数以增强识别已知类和拒绝未知类的能力，使得模型完成准确预测已知类的概率分布的同时，也能给出一个值来预测测试图像是否属于任何已知类，最终实现开集SAR目标识别。实验证明，本发明在MSTAR数据集中展现了优异的性能。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

Claims

1.一种面向开集雷达图像自动目标识别的熵感知元学习方法，其特征在于，包括：

S1、获取雷达图像数据集，并根据雷达图像数据集得到元训练数据集和元测试数据集；元训练数据集和元测试数据集中，各自包括对应的训练子集与测试子集；

S2、元训练阶段，基于各元学习任务元训练数据集的训练子集、测试子集，训练得到元学习器；

S3、元测试阶段，步骤S2的元学习器根据元测试数据集中的训练子集，生成最终的最优模型；

S4、将步骤S3得到的最终的最优模型，应用于元测试数据集中的测试子集进行SAR目标识别。

2.根据权利要求1所述的一种面向开集雷达图像自动目标识别的熵感知元学习方法，其特征在于，对于元训练阶段的每一个任务，从雷达图像数据已知类集合中随机选定一部分类为已知类C^closed，并将雷达图像数据已知类集合中剩下的类设置为未知类U^open；其中已知类C^closed和未知类U^open满足：

和/>

3.根据权利要求2所述的一种面向开集雷达图像自动目标识别的熵感知元学习方法，其特征在于，元训练数据集中的训练子集从已知类C^closed采样得到，元训练数据集中的测试子集从雷达图像数据已知类集合中采样得到。

4.根据权利要求3所述的一种面向开集雷达图像自动目标识别的熵感知元学习方法，其特征在于，元测试数据集的训练子集从雷达图像数据已知类集合中采样得到，测试子集T^te从包含雷达图像数据已知类集合和未知类集合的所有类的总集合中采样得到。

5.根据权利要求4所述的一种面向开集雷达图像自动目标识别的熵感知元学习方法，其特征在于，步骤S2元训练阶段，采用的损失函数为：

L_ea＝λ₁L_meta-ce+λ₂L_entropy+λ₃L_open

其中，L_meta-ce是元交叉熵损失，L_entropy是熵距离损失，L_open是开集损失，λ₁、λ₂和λ₃是加权参数。