CN113033609B

CN113033609B - 一种基于多任务dcgan的sar图像分类方法

Info

Publication number: CN113033609B
Application number: CN202110186968.8A
Authority: CN
Inventors: 张征; 杜阳
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-02-16
Filing date: 2021-02-16
Publication date: 2022-11-29
Anticipated expiration: 2041-02-16
Also published as: CN113033609A

Abstract

本发明涉及图像处理技术领域，旨在提供一种基于多任务DCGAN的SAR图像分类方法。包括步骤：构建多任务DCGAN网络框架；对原始SAR数据进行合理表征；生成训练数据集和测试数据集；训练多任务DCGAN；对测试SAR图像数据集进行地物分类并计算评价指标。本发明的DCGAN网络能够协同处理生成任务、重构任务、分类任务。能够同时判断图像真假、捕获其低维流形稀疏特征、并用编码的稀疏特征进行图像分类，克服了通过DCGAN网络对SAR图像进行分类时特征信息不全面问题，缓解了模式坍塌问题。对于多任务DCGAN网络结构，自适应损失函数权值参数能在网络训练过程中被自动学习。因此克服了现有技术中模式坍塌或训练不稳定的问题，使SAR图像分类精度得以提高。

Description

一种基于多任务DCGAN的SAR图像分类方法

技术领域

本发明属于图像处理技术领域，更进一步涉及雷达图像分类技术领域中的基于多任务DCGAN(深度卷积生成对抗网络，Deep Convolutional Generative AdversarialNetwork)的SAR(合成孔径雷达)图像分类方法。本发明可用于对SAR图像中的地物目标进行分类。

背景技术

随着合成孔径雷达(SAR)图像数据资源的不断丰富，SAR图像解译变得更为重要。然而，相比SAR成像技术的快速发展，现有的SAR图像解译技术发展相对滞后。SAR图像分类通过分析获取地物后向散射信号来提取地物类别信息，是SAR图像解译的重要内容，在农业植被调研、资源勘测、海洋环境监测等众多应用中都涉及到SAR图像分类技术。考虑到SAR图像特殊的成像机理，使得光学遥感图像分类算法在SAR图像上往往难以取得优异的效果。SAR图像分类关键问题包括以下两个方面：(1)有效的特征表达；(2)鲁棒的分类器。

传统的SAR图像特征提取算法主要分为以灰度共生矩阵(Gray-Level Co-occurrence Matrix，GLCM)、马尔可夫随机场(Markov Random Fields，MRF)、基于形态学闭运算、统计建模等空间域特征提取算法，以小波、曲波、轮廓波等为代表的多尺度几何分析(Multi-scale Geometric Analysis，MGA)的变换域特征提取算法以及以相干目标分解、非相关目标分解的极化特征提取算法。上述传统方法需要依赖人工经验，对不同数据、不同地物目标的适应性较差。近年来深度学习作为一种自动提取特征的手段，为SAR图像分类提供了新的思路。

以堆叠自动编码器、深度置信网络、深度卷积网络、生成对抗网络等的深度学习框架都被应用于SAR图像分类问题中，在上述深度学习网络中，生成对抗网络作为一种生成模型，可以捕获图像的高阶统计特征，被广泛用于特征工程中，但是其固有的模式坍塌、训练不稳定问题可能会造成特征不能有效表达。在SAR图像分类的特征提取中，可能出现类间特征模糊，类内特征差异大的特点，进而影响对地物的准确识别，降低分类精度。

发明内容

本发明要解决的技术问题是，克服现有技术中存在的不足，提出一种基于多任务DCGAN(深度卷积生成对抗网络)的SAR(合成孔径雷达)图像分类方法。

为解决技术问题，本发明的解决方案是：

提供一种基于多任务DCGAN的SAR图像分类方法，包括以下步骤：

(1)构建多任务DCGAN网络框架

构建内容包括：对抗任务模块、分类任务模块、自编码任务模块，及多任务GAN的自适应损失函数。

(2)对原始SAR数据进行合理表征

包括：对于单极化数据，采用幅度或强度进行表征；对于极化数据，采用水平-水平、水平-垂直、垂直-垂直三种极化的幅度、强度或者极化分解得到的相应物理量进行表征；

(3)生成训练数据集和测试数据集

包括：采用滑窗法生成SAR图像每个像素点的切片图像；对每种地物类别随机取10％的切片图像数据作为训练集，其余数据作为测试集；

(4)训练多任务DCGAN

采用交替训练的方式更新对抗任务模块、分类任务模块与自编码任务模块直至收敛，在训练过程中采用Adam算法进行梯度回传；

(5)对测试SAR图像数据集进行地物分类并计算相应评价指标

将测试SAR图像数据输入训练好的多任务DCGAN网络中，得到地物分类结果，并计算相应的Precision、Recall、F1-Score、OA、Kappa评价指标。

本发明所述步骤(1)中，对抗任务模块的具体结构和参数为：

对抗任务模块具有4层结构，其结构依次为：输入层->第一全连接层->BatchNorm层->LeakyRelu层->第二全连接层->BatchNorm层->LeakyRelu层->第一反卷积层->BatchNorm层->LeakyRelu层->第二反卷积层->Tanh层；

各层的参数设置如下：

输入层的特征图维度设置为100(噪声维度)+类别个数；

第一全连接层、BatchNorm层节点个数设置为1024，LeakyRelu层的斜率参数设置为0.2；

第二全连接层、BatchNorm层节点个数设置为128*输入图像长度/4*输入图像宽度/4，LeakyRelu层的斜率参数设置为0.2；

第一反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为64，4，2，1；BatchNorm层节点个数设置为64，LeakyRelu层斜率参数设置为0.2；

第二反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为类别数，4，2，1；。Tanh层节点个数为3。

本发明所述步骤(1)中，分类任务模块的具体结构和参数：

分类任务模块具有5层结构，其结构依次为：输入层->第一卷积层->LeakyRelu层->第二卷积层->BatchNorm层->LeakyRelu层->第三卷积层->LeakyRelu层->第一全连接层->自编码层->Softmax层、Sigmoid层；

各层的参数设置如下：

输入层的特征图维度为3；

第一卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为64，4，2，1；LeakyRelu层斜率参数设置为0.2；

第二卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128，4，2，1；BatchNorm层节点个数设置为128，LeakyRelu层斜率参数设置为0.2；

第三卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128，4，2，1；LeakyRelu层斜率参数设置为0.2；

第一全连接层节点个数设置为256，自编码层的隐节点设置为128，Softmax层节点个数设置为类别个数，Sigmoid层节点个数设置为2。

本发明所述步骤(1)中，自编码任务模块的具体结构和参数：

自编码任务任务模块具有三层结构，依次为：输入层->隐层->输出层。

各层的参数设置如下：

输入层节点个数为2048，隐层节点个数为1024，输出层节点个数为2048。

本发明所述步骤(1)中，构建多任务GAN的自适应损失函数具体包括：

(a)对于回归任务，定义似然函数p(y|f^w(x))＝N(f^w(x)，σ²)，其中f^w(x)为网络的输出，w为网络权值，σ为观测噪声标准差；

对于分类任务，定义似然函数p(y|f^w(x))＝softmax(f^w(x))；

对于对抗任务，定义似然函数p(y|f^w(x))＝Sigmoid(f^w(x))；

对于多任务网络结构，定义似然函数

p(y₁，y₂，...，y_K|f^w(x))＝p(y₁|f^w(x)...p(y_K|f^w(x))；

(b)在高斯似然函数的假定下，多任务GAN的自适应损失函数为：

p(y₁，y₂，y₃|f^w(x))＝p(y₁|f^w(x)p(y₂|f^w(x)p(y₃|f^w(x))

上述各式中：f^w(x)为网络的输出，其中

为分类任务模块的输出，

为对抗任务模块的输出；w为网络权值；σ为观测噪声标准差；c为类别数；y₁，y₂，...，y_k为k个任务的实际值；L₁(w)为自编码任务损失函数，L₂(w)为分类任务损失函数，L₃(w)为对抗任务损失函数。

本发明中，所述步骤(4)具体包括：

(4.1)首先固定分类任务模块、自编码任务模块，对高斯分布随机采样出100维度的一维向量，经过对抗任务模块得到虚假图像，该图像和真实图像馈入分类任务模块、自编码任务模块中，得到相应损失；在训练过程中采用Adam算法进行梯度回传，更新对抗任务模块相应参数；

(4.2)其次固定对抗任务模块，对高斯分布随机采样出100维度的一维向量，经过对抗任务模块得到虚假图像，该图像和真实图像输入分类任务模块、自编码任务模块中，得到相应损失，在训练过程中采用Adam算法进行梯度回传，更新分类任务模块、自编码任务模块相应参数；

(4.3)对抗任务模块与分类任务模块、自编码任务模块不断进行交替训练，直至收敛，保存最优模型。

发明原理描述：

相较于DCGAN框架，本发明引入了分类任务与编码任务，使得网络能够获得较为稀疏的分类有效特征，缓解模式坍塌问题。相较于CGAN，ACGAN框架，本发明通过极大似然函数建模，定义了多任务DCGAN网络的自适应损失函数保证各个任务间训练的稳定性。基于多任务DCGAN的SAR图像分类方法能够保证图像分类区域的一致性，提高分类精度。具体是：对抗任务保证网络能够提取SAR图像的高阶统计特征，使得不同地物特征区分度更大，易于分类；由于相干斑噪声会导致SAR图像的质量降低，因此地物特征容易受到噪声干扰，编码任务的引入可以保证网络提取的特征位于低维流形空间，加强网络的抗噪能力；分类任务可以缓解模式坍塌问题，使得训练更加稳定。多任务DCGAN网络自适应损失函数能够在训练过程中学习到不同任务之间的权值系数，克服了现有技术人为设置损失函数权值导致模式坍塌或训练不稳定问题，从而提高地物分类精度。

本发明与现有的技术相比具有以下优点：

第一，本发明构建了基于多任务的DCGAN网络，该网络能够协同处理生成任务、重构任务、分类任务。对抗任务模块生成的虚假SAR图像与真实SAR图像输入分类任务模块、自编码任务模块中，得到相应损失；能够同时判断图像真假、捕获其低维流形稀疏特征、并用编码的稀疏特征进行图像分类，克服了通过DCGAN网络对SAR图像进行分类时特征信息不全面问题，缓解了模式坍塌问题。

第二，本发明构建了自适应损失函数。对于多任务DCGAN网络结构，自适应损失函数权值参数能在网络训练过程中被自动学习。克服了现有技术通过条件生成对抗网络(Conditional Generative Adversarial Network)人为设置损失权值导致模式坍塌或训练不稳定的问题，使得本发明提高了SAR图像分类精度。

附图说明

图1是本发明的流程图。

图2是本发明的仿真图。

具体实施方式

下面结合附图对本发明实现步骤做进一步的详细描述。

本发明所述基于多任务DCGAN的SAR图像分类方法，包括以下步骤：

步骤1，构建多任务DCGAN网络框架

(1)构建对抗任务模块：

对抗任务模块具有4层结构，依次为：输入层->第一全连接层->BatchNorm层->LeakyRelu层->第二全连接层->BatchNorm层->LeakyRelu层->第一反卷积层->BatchNorm层->LeakyRelu层->第二反卷积层->Tanh层；

各层的参数设置如下：

输入层的特征图维度设置为100(噪声维度)+类别个数。

第一全连接层、BatchNorm层节点个数设置为1024，LeakyRelu斜率参数设置为0.2。

第二全连接层、BatchNorm层节点个数设置为128*输入图像长度/4*输入图像宽度/4，LeakyRelu斜率参数设置为0.2。

第一反卷积层滤波器个数、滤波器尺寸大小，步长、填充分别设置为64，4，2，1。BatchNorm层节点个数设置为64，LeakyRelu层斜率参数设置为0.2。

第二反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为类别数，4，2，1；Tanh层的节点个数为3。

(2)构建分类任务模块

分类任务模块具有5层结构，依次为：输入层->第一卷积层->LeakyRelu层->第二卷积层->BatchNorm层->LeakyRelu层->第三卷积层->LeakyRelu层->第一全连接层->自编码层->Softmax层、Sigmoid层。

输入层的特征图维度为3

第一卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为64，4，2，1。LeakyRelu层斜率参数设置为0.2。

第二卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128，4，2，1。BatchNorm层节点个数设置为128，LeakyRelu层斜率参数设置为0.2。

第三卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128，4，2，1。LeakyRelu层斜率参数设置为0.2。

第一全连接层节点个数设置为256，自编码层隐节点设置为128，Softmax层节点个数设置为类别个数，Sigmoid层节点个数设置为2。

(3)构建自编码任务模块

(4)构建多任务GAN自适应损失函数：

对于回归任务，定义似然函数p(y|f^w(x))＝N(f^w(x)，σ²)，其中f^w(x)为网络的输出，w为网络权值，σ为观测噪声标准差。

对于分类任务，定义似然函数p(y|f^w(x))＝softmax(f^w(x))。

对于对抗任务，定义似然函数p(y|f^w(x))＝Sigmoid(f^w(x))；

对于多任务网络结构，定义似然函数

p(y₁，y₂，...，y_K|f^w(x))＝p(y₁|f^w(x)...p(y_K|f^w(x))。

在高斯似然函数的假定下，多任务GAN的自适应损失函数为：

p(y₁，y₂，y₃|f^w(x))＝p(y₁|f^w(x)p(y₂|f^w(x)p(y₃|f^w(x))

上述各式中，f^w(x)为网络的输出，其中

为分类任务模块的输出，

为对抗任务模块的输出，w为网络权值，σ为观测噪声标准差，c为类别数，y₁，y₂，...，yk为k个任务的实际值，本示例中k的值可取3，L₁(w)为自编码任务损失函数，L₂(w)为分类任务损失函数，L3(w)为对抗任务损失函数。

步骤2，对原始SAR数据进行合理表征

对于单极化数据，采用幅度或强度对原始SAR数据进行表征。

对于极化数据，可采用水平-水平(HH)、水平-垂直(HV)、垂直-垂直(VV)三种极化的幅度、强度或者极化分解得到的相应物理量对原始极化SAR数据进行表征。

步骤3，生成训练数据集和测试数据集

采用滑窗法生成SAR图像每个像素点的切片图像，大小为m*m。

对每一地物种类随机取10％的切片图像数据作为训练集，其余数据作为测试集。

步骤4，训练多任务DCGAN

采用交替训练的方式更新对抗任务模块、分类任务模块与自编码任务模块直至收敛，具体步骤为：

(4.2)其次固定对抗任务模块，对高斯分布随机采样出100维度的一维向量，经过对抗任务模块得到虚假图像，该图像和真实图像输入分类任务模块、自编码任务模块中，得到相应损失；在训练过程中采用Adam算法进行梯度回传，更新分类任务模块、自编码任务模块相应参数；

步骤5，对测试SAR图像数据集进行地物分类并计算相应评价指标

将测试数据输入训练好的多任务DCGAN网络中，得到预测结果，并计算相应的Precision、Recall、F1-Score、OA、Kappa评价指标。

下面通过仿真实验进一步说明本发明的技术效果。

(1)仿真条件

实验平台：操作系统Linux Ubuntu 16.04、Intel(R)Core(TM)i7-6800K CPU@3.40GHz、Geforce GTX 1080。软件环境：pytorch

(2)仿真内容与结果分析

本发明的仿真实验对比不同SAR数据表征方式下的DCGAN网络与多任务DCGAN网络对SAR数据分类效果。SAR数据表征分别采用了单极化HH，多极化HH_HV_VV，Pauli分解的SanFrancisco AirSAR图像。图像大小为900*900像素。

图2中(a)为SanFrancisco AirSAR图像真实场景，图2中(b)-(d)分别为以单极化HH，多极化HH_HV_VV，Pauli分解为SAR数据表征的DCGAN分类结果图，图2中(e)-(g)分别为以单极化HH，多极化HH_HV_VV，Pauli分解为SAR数据表征的多任务DCGAN分类结果图。表1为上述两种网络的量化精度对比。

表1.分类指标对比表

对比图2中的(e)-(g)与(b)-(d)可以看出，在相同SAR数据表征下，多任务DCGAN网络较DCGAN网络在水体、建筑区域一致性更好。在表1中，不同类型的地物在多任务DCGAN网络下，其F1-score，OA，Kappa都得到了一定程度提升。

综上所述，本发明构建了对抗任务模块、分类任务模块、自编码模块在内的多任务GAN网络结构及多任务GAN网络的自适应损失函数，缓解了模式坍塌问题，保证了训练的稳定性，有效的提取了SAR图像的特征，减少了分类结果的噪声点，保持了区域的一致性，提高了分类精度。

Claims

1.一种基于多任务DCGAN的SAR图像分类方法，其特征在于，包括以下步骤：

(1)构建多任务DCGAN网络框架

构建内容包括：对抗任务模块、分类任务模块、自编码任务模块，及多任务GAN的自适应损失函数；

(2)对原始SAR数据进行合理表征

包括：对于单极化数据，采用幅度或强度进行表征；对于极化数据，采用水平-水平、水平-垂直、垂直-垂直三种极化的幅度、强度，或者极化分解得到的相应物理量进行表征；

(3)生成训练数据集和测试数据集

(4)训练多任务DCGAN

(5)对测试SAR图像数据集进行地物分类并计算评价指标

2.根据权利要求1所述的方法，其特征在于，所述步骤(1)中，对抗任务模块的具体结构和参数为：

各层的参数设置如下：

输入层的特征图维度设置为100+类别个数；

第一反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为64,4,2,1；BatchNorm层节点个数设置为64，LeakyRelu层斜率参数设置为0.2；

第二反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为类别数，4，2，1；Tanh层节点个数为3。

3.根据权利要求1所述的方法，其特征在于，所述步骤(1)中，分类任务模块的具体结构和参数为：

分类任务模块具有5层结构，其结构依次为：输入层-＞第一卷积层-＞LeakyRelu层-＞第二卷积层-＞BatchNorm层-＞LeakyRelu层-＞第三卷积层-＞LeakyRelu层-＞第一全连接层-＞自编码层-＞Softmax层、Sigmoid层；

各层的参数设置如下：

输入层的特征图维度为3；

4.根据权利要求1所述的方法，其特征在于，所述步骤(1)中，自编码任务模块的具体结构和参数为：

自编码任务模块具有三层结构，依次为：输入层-＞隐层-＞输出层；

各层的参数设置如下：

5.根据权利要求1所述的方法，其特征在于，所述步骤(1)中，自适应损失函数具体包括：

对于分类任务，定义似然函数p(y|f^w(x))＝Softmax(f^w(x))；

对于对抗任务，定义似然函数p(y|f^w(x))＝Sigmoid(f^w(x))；

对于多任务网络结构，定义似然函数

p(y₁，y₂，...，y_K|f^w(x))＝p(y₁|f^w(x)...p(y_K|f^w(x))；

(b)在高斯似然函数的假定下，

p(y₁，y₂，y₃|f^w(x))＝p(y₁|f^w(x)p(y₂|f^w(x)p(y₃|f^w(x))

多任务GAN的自适应损失函数loss为：

上述各式中：f^w(x)为网络的输出，其中

为分类任务模块的输出，

6.根据权利要求1所述的方法，其特征在于，所述步骤(4)具体包括：

(4.1)首先固定分类任务模块、自编码任务模块，对高斯分布随机采样出100维度的一维向量，经过对抗任务模块得到虚假图像，该图像和真实图像输入分类任务模块、自编码任务模块中，得到相应损失；在训练过程中采用Adam算法进行梯度回传，更新对抗任务模块相应参数；

(4.2)其次固定对抗任务模块，对高斯分布随机采样出100维度的一维向量，经过对抗任务模块得到虚假图像，该图像和真实图像输入分类任务模块、自编码任务模块中，得到相应损失，采用Adam算法进行梯度回传，更新分类任务模块、自编码任务模块相应参数；