CN114863188A

CN114863188A - 用于sar图像的目标分类方法

Info

Publication number: CN114863188A
Application number: CN202210783198.XA
Authority: CN
Inventors: 王源源; 周紫璇; 王晓玲; 顾城天; 史勤刚; 何晓
Original assignee: Chengdu College of University of Electronic Science and Technology of China
Current assignee: Chengdu College of University of Electronic Science and Technology of China
Priority date: 2022-07-05
Filing date: 2022-07-05
Publication date: 2022-08-05

Abstract

本发明公开了用于SAR图像的目标分类方法，涉及SAR图像处理领域，包括S1、SAR图像划分为训练样本和测试样本；S2、采用二维变分模态分解方法分解训练样本和测试样本获得K个模态的解析信号，提取各模态目标特征；S3、构建神经网络模型CNN，训练优化神经网络模型CNN；S4、测试样本导入优化后的神经网络模型获取各模态的决策变量；S5、判定目标分类结果；对原始SAR图像进行分析获得多模态表示，综合反映目标的全局重点以及局部细节信息，神经网络模型CNN对各个模态的分解结果进行独立分类，获取其属于各类别的后验概率矢量，最后对各个模态的决策进行融合，获得更为可靠的分类结果。

Description

用于SAR图像的目标分类方法

技术领域

本发明涉及SAR图像处理领域，尤其涉及一种用于SAR图像的目标分类方法。

背景技术

合成孔径雷达（synthetic aperture radar，SAR）是一种微波成像传感器，具备不受天时、天候影响的优良特性。随着SAR图像分辨率的不断提高，基于SAR图像的目标检测、分类技术得到广泛研究并成为军事侦察、战场情报解译的重要手段。自20世纪90年代以来，伴随机器学习和人工智能的发展，SAR图像目标检测分类领域产出了大量的成果。国内相关科研机构也开展了深入的研究。然而，由于SAR图像成像机理和图像质量相比传统光学图像存在的差异，SAR图像的特征提取和针对性目标分类一直是领域难题。

现有方法主要从特征提取和分类器设计两个方向出发力图提升SAR目标识别性能。特征提取分析SAR图像中目标的几何形状、像素分布以及电磁散射等特性，从而达到去粗存精的目的，它的重点仍然是提取鉴别力强的特征，从而达到区分不同类别的目的；不足的是，特征提取的科学性和有效性仍存在差距；针对SAR目标分类问题，研究人员也提出了多种深度学习模型，具有代表性的是卷积神经网络，相比传统方法，深度学习具有更强的数据分析能力，弥补了传统特征提取有效性不足的问题。然而，深度学习算法依赖训练集的完备性，在训练样本不足的条件下其性能往往受限。

发明内容

本发明的目的就在于为了解决上述问题设计了一种用于SAR图像的目标分类方法。

本发明通过以下技术方案来实现上述目的：

用于SAR图像的目标分类方法，包括：

S1、待分析的SAR图像信号划分为训练样本和测试样本；

S2、对训练样本采用二维变分模态分解方法BVMD进行分解分析获得训练样本的K个模态的解析信号，形成K个模态的训练样本集，并提取每个模态的目标特征，对测试样本采用二维变分模态分解方法BVMD进行分解分析获得测试样本K个模态的解析信号，其中K为常数，取值范围为不小于3的整数；

S3、构建K个初始的神经网络模型CNN，将训练样本的K个模态的解析信号分别导入K个初始的神经网络模型CNN进行训练优化，得到优化后的神经网络模型CNN；

S4、使用测试样本的K个模态的解析信号分别导入K个优化后的神经网络模型CNN进行分类，获取每个模态的决策变量，记为当前模态属于各类别的后验概率矢量；

S5、采用决策融合对每个模态的后验概率矢量进行融合，判定测试样本的目标分类结果。

进一步地，在S5中具体包括：

S51、采用T₁，T₂，…，T_C和Y=[y₁，y₂，…，y_k]分别代表C个类别和K个决策变量，每个模态的决策y_k来自类别T_i的概率为

，其中C为常数，取值范围为不小于3的整数；

S52、在各个决策变量相互独立的条件下，联合概率分布计算表示为P(T_i|Y)=P(T_i|y₁)P(T_i|y₂)…P(T_i|y_k) ，其中i代表需要估计联合概率的第i个类别，取值范围为不小于1且不大于C的整数；

S53、在决策融合的基础上，根据最大后验概率判定当前测试样本的目标类别，表示为

。

进一步地，神经网络模型CNN从输入到输出依次包括第一卷积层、第一最大值池化层、第二卷积层、第二最大值池化层、第三卷积层、第三最大值池化层、第一全连接层和第二全连接层，第一卷积层、第二卷积层、第三卷积层和第一全连接层的激活函数为ReLU，并采用批标准化对每一层的输出进行处理，第二全连接层为回归分类器，第二全连接层用于计算训练样本或测试样本属于各个类别的后验概率进而获得类别分布。

本发明的有益效果在于：本申请采用二维变分模态分解方法BVMD与神经网络模型CNN进行结合，二维变分模态分解方法BVMD对原始SAR图像进行分析获得多模态表示，可以综合反映目标的全局重点以及局部细节信息，神经网络模型CNN对各个模态的分解结果进行独立分类，获取其属于各类别的后验概率矢量，最后对各个模态的决策进行融合，获得更为可靠的分类结果。

附图说明

图1是本发明用于SAR图像的目标分类方法的流程示意图；

图2是本发明中二维变分模态分解方法BVMD提取SAR图像特征的流程示意图；

图3是本发明中神经网络模型CNN的示意图；

图4是试验场景1下的结果对比图；

图5是试验场景2下的结果对比图；

图6是试验场景3下的结果对比图；

图7是试验场景4的结果对比图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在本发明的描述中，需要理解的是，术语“上”、“下”、“内”、“外”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系，或者是该发明产品使用时惯常摆放的方位或位置关系，或者是本领域技术人员惯常理解的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本发明的描述中，还需要说明的是，除非另有明确的规定和限定，“设置”、“连接”等术语应做广义理解，例如，“连接”可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接连接，也可以通过中间媒介间接连接，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

下面结合附图，对本发明的具体实施方式进行详细说明。

如图1所示，用于SAR图像的目标分类方法，包括：

S1、待分析的SAR图像信号划分为训练样本和测试样本。

S2、对训练样本采用二维变分模态分解方法BVMD进行分解分析获得训练样本的K个模态的解析信号，形成K个模态的训练样本集，并提取每个模态的目标特征，对测试样本采用二维变分模态分解方法BVMD进行分解分析获得测试样本K个模态的解析信号，其中K为常数，取值范围为不小于3的整数；如图2所示，具体包括：

S21、将信号x(t)分解为K个模态u_k(k=1,2,…,K)；

S22、通过希尔伯特变换hilbert transform得到各模态相应的解析信号；

S23、将各模态的解析信号调制到基带上通过对解析信号进行梯度平方范数求解估计各模态的带宽，表示为：

，其中，u_k={u₁，u₂，…，u_k}代表所有模态的集合，w_k={w₁，w₂，…，w_k}为各个模态的中心频率，

表示所有模态之和与原始信号相等的约束条件，δ(t)为狄拉克函数，

为算子，利用指数

修正，使每个模态函数的频谱调制到相应的基频带，

为冲击响应函数，j为虚数单位，u_k(t)为约束条件更严格的有限带宽的本征模态函数，

表示求偏导；

S24、采用拉格朗日乘子算法对各模态的带宽进行转化，表示为：

其中，

为拉格朗日算子；α为二次惩罚因子；

S25、初始化

，

和

，

；

S26、采用乘法算子交替方向法ADMM对u_k和w_k进行更新；u_k的更新表示为：

其中w_k与

等价，

与

等价，根据Parseval傅里叶等距变换原理，

可通过时频变换得到各个模态的频域，表示为

；

变换到频域的更新表示为

，其中，

代表第k个模态的功率谱重心，

为信号x(t)经时频变换后频域表达式，

为当前残差

的维纳滤波；

S27、采用乘法算子交替方向法ADMM对

进行更新，

的更新表示为

，其中，

为常量；

S28、根据预设的判别精度e判断是否甚至迭代，若

，则终止迭代并进入S27；反之则返回S24；

S29、当下的u_k和w_k作为最优解，对各模态进行特征提取。

S3、构建K个初始的神经网络模型CNN，将K个模态的训练样本集分别导入K个初始的神经网络模型CNN进行训练优化，得到优化后的神经网络模型CNN；

S4、使用K个模态的测试样本分别导入K个优化后的神经网络模型CNN进行分类，获取每个模态的决策变量，记为当前模态属于各类别的后验概率矢量；

S5、采用决策融合对每个模态的后验概率矢量进行融合，判定测试样本的目标分类结果；具体包括：

，其中C为常数，取值范围为不小于3的整数；

。

如图3所示，神经网络模型CNN从输入到输出依次包括第一卷积层、第一最大值池化层、第二卷积层、第二最大值池化层、第三卷积层、第三最大值池化层、第一全连接层和第二全连接层，第一卷积层、第二卷积层、第三卷积层和第一全连接层的激活函数为ReLU，并采用批标准化对每一层的输出进行处理，第二全连接层为回归分类器，第二全连接层用于计算训练样本或测试样本属于各个类别的后验概率进而获得类别分布。

试验场景1

场景1设置为标准操作条件，是当前SAR目标分类问题的基本测试场景。此时，测试样本与训练样本具有很高的相关性，因此识别问题的难度相对较小。表1给出了基于MSTAR数据集设置的一种典型的标准操作条件，包括了十类目标的SAR图像，十类目标依次编号为1-10。其中，训练集采集自17°俯仰角，测试集采集自15°俯仰角。与现有SAR图像目标分类方法一致，本文采用平均识别率评价识别性能，定义为正确识别样本的数目占总测试样本的比例。在场景1下，本方法的分类结果如图4所示。该混淆矩阵反映了不同类别正确分类以及误判类别的基本情况。从图中可以看出，十类目标的平均识别率均达到96%以上，可计算平均识别率为98.34%，验证了方法在标准操作条件下的有效性。表2对比了各类方法的平均识别率。本方法的平均识别率最高，验证其在标准操作条件下的优越性能。基于深度学习的全卷积神经网络方法A-ConvNets方法取得了第二高的识别性能，主要因为在场景1下训练样本和测试样本的相似度较高，深度学习模型分类能力得到了较高的保持。单演信号联合稀疏表示Mono-JSR方法通过多层次单演信号特征的联合运用，性能优于一般的稀疏表示分类SRC方法。本方法通过结合二维变分模态分解方法BVMD多模态表示以及神经网络模型CNN的深度学习模型优势，进一步促进了识别性能提升，最终结果也是最佳的。

表1是基于MSTAR数据集设置的一种典型的标准操作条件

表2是各类方法的平均识别率

方法	平均识别率（%）
		本方法	98.34
SRC	96.24
		Mono-JSR	97.28
A-ConvNets	97.96

试验场景2

场景2设置为俯仰角差异。测试样本和训练样本一般会存在一定的俯仰角差异，如表1中两者就存在2°的差异。较小的俯仰角差异不会带来较大的图像畸变，因此对于分类问题影响不大。但当俯仰角差异较大时，同一目标的SAR图像存在较大差异，此时会对正确分类产生很大影响。表3给出了本文针对俯仰角变化设置的训练和测试样本。其中，训练样本来自17°俯仰角；测试样本分别来自30°和45°俯仰角。在两个测试俯仰角下分别对各类方法进行测试，统计它们的平均识别率如图5所示。本方法在两个俯仰角下均取得最高的识别率，表明其对于较大俯仰角变化具有良好的稳健性。由于剧烈的俯仰角变化，训练样本与测试样本的相似度下降，这导致基于深度学习的全卷积神经网络方法A-ConvNets方法的性能下降更为显著。单演信号联合稀疏表示Mono-JSR方法在两个俯仰角下均取得仅次于提出方法的性能，主要得益于多层次单演型号特征对于俯仰角变化具有一定的适应性。本方法应用了二维变分模态分解方法BVMD多模态分解结果，对于俯仰角差异具有一定适应性，同时结合神经网络模型CNN的优势，因此稳健性较强。

表3是针对俯仰角变化设置的训练和测试样本

试验场景3

场景3设置为噪声干扰。噪声广泛存在于SAR图像中，对SAR图像的解译、分类带来的较大的障碍。提升目标分类算法对于噪声干扰的稳健性十分必要。原始MSTAR数据集均在合作条件下获取，信噪比（SNR）较高，不利于检验识别方法在噪声干扰下的性能。为此，本试验场景3向表1中的测试样本中添加不同程度的高斯白噪声，进而对噪声测试样本进行分类。图6显示了各类方法在不同信噪比下的平均识别率曲线，反映了它们受噪声干扰的基本情况。可以看出，本方法在各个噪声水平下均优于对比方法，说明其对于噪声干扰具有更强的稳健性。与场景2类似，由于训练样本与测试样本之间差异的增大，基于深度学习模型的全卷积神经网络方法A-ConvNets方法性能下降显著。单演信号联合稀疏表示Mono-JSR和文本方法都通过多层次分解特征提高了对于噪声干扰的稳健性。相比来说，本文二维变分模态分解方法BVMD的特征具有更强稳健性，同时提出方法结合了神经网络模型CNN的优势。此外，决策层的贝叶斯Bayesian融合也可以增强分类结果对于噪声干扰的可靠性。

试验场景3

场景4为有限训练样本。训练样本的数量和规模是SAR目标分类算法的关键要素之一，也是目前制约SAR目标分类性能的瓶颈之一。与光学图像不同，SAR图像的获取途径相对更少、可用于训练样本的目标图像更是有限。因此，有必要检验SAR目标分类方法在有限训练样本下的分类性能。在表1的基础上，通过按比例减少训练集规模进而测试各方法的分类性能。图7显示了各方法在不同比例训练样本的条件下的识别率曲线。对比可见，本方法在各个比例下均取得最高的识别率。全卷积神经网络方法A-ConvNets方法随着训练集的规模减小性能下降最为显著，主要因为深度学习模型对于训练样本的依赖性。本方法通过二维变分模态分解方法BVMD的引入以及决策层的贝叶斯Bayesian融合，有效增强了方法在少量训练样本条件下的分类性能。

本发明的技术方案不限于上述具体实施例的限制，凡是根据本发明的技术方案做出的技术变形，均落入本发明的保护范围之内。

Claims

1.用于SAR图像的目标分类方法，其特征在于，包括：

S1、待分析的SAR图像信号划分为训练样本和测试样本；

2.根据权利要求1所述的用于SAR图像的目标分类方法，其特征在于，在S5中具体包括：

，其中C为常数，取值范围为不小于3的整数；

。

3.根据权利要求1所述的用于SAR图像的目标分类方法，其特征在于，神经网络模型CNN从输入到输出依次包括第一卷积层、第一最大值池化层、第二卷积层、第二最大值池化层、第三卷积层、第三最大值池化层、第一全连接层和第二全连接层，第一卷积层、第二卷积层、第三卷积层和第一全连接层的激活函数为ReLU，并采用批标准化对每一层的输出进行处理，第二全连接层为回归分类器，第二全连接层用于计算训练样本或测试样本属于各个类别的后验概率进而获得类别分布。