CN113033609B - 一种基于多任务dcgan的sar图像分类方法 - Google Patents

一种基于多任务dcgan的sar图像分类方法 Download PDF

Info

Publication number
CN113033609B
CN113033609B CN202110186968.8A CN202110186968A CN113033609B CN 113033609 B CN113033609 B CN 113033609B CN 202110186968 A CN202110186968 A CN 202110186968A CN 113033609 B CN113033609 B CN 113033609B
Authority
CN
China
Prior art keywords
layer
task module
classification
task
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110186968.8A
Other languages
English (en)
Other versions
CN113033609A (zh
Inventor
张征
杜阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202110186968.8A priority Critical patent/CN113033609B/zh
Publication of CN113033609A publication Critical patent/CN113033609A/zh
Application granted granted Critical
Publication of CN113033609B publication Critical patent/CN113033609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像处理技术领域,旨在提供一种基于多任务DCGAN的SAR图像分类方法。包括步骤:构建多任务DCGAN网络框架;对原始SAR数据进行合理表征;生成训练数据集和测试数据集;训练多任务DCGAN;对测试SAR图像数据集进行地物分类并计算评价指标。本发明的DCGAN网络能够协同处理生成任务、重构任务、分类任务。能够同时判断图像真假、捕获其低维流形稀疏特征、并用编码的稀疏特征进行图像分类,克服了通过DCGAN网络对SAR图像进行分类时特征信息不全面问题,缓解了模式坍塌问题。对于多任务DCGAN网络结构,自适应损失函数权值参数能在网络训练过程中被自动学习。因此克服了现有技术中模式坍塌或训练不稳定的问题,使SAR图像分类精度得以提高。

Description

一种基于多任务DCGAN的SAR图像分类方法
技术领域
本发明属于图像处理技术领域,更进一步涉及雷达图像分类技术领域中的基于多任务DCGAN(深度卷积生成对抗网络,Deep Convolutional Generative AdversarialNetwork)的SAR(合成孔径雷达)图像分类方法。本发明可用于对SAR图像中的地物目标进行分类。
背景技术
随着合成孔径雷达(SAR)图像数据资源的不断丰富,SAR图像解译变得更为重要。然而,相比SAR成像技术的快速发展,现有的SAR图像解译技术发展相对滞后。SAR图像分类通过分析获取地物后向散射信号来提取地物类别信息,是SAR图像解译的重要内容,在农业植被调研、资源勘测、海洋环境监测等众多应用中都涉及到SAR图像分类技术。考虑到SAR图像特殊的成像机理,使得光学遥感图像分类算法在SAR图像上往往难以取得优异的效果。SAR图像分类关键问题包括以下两个方面:(1)有效的特征表达;(2)鲁棒的分类器。
传统的SAR图像特征提取算法主要分为以灰度共生矩阵(Gray-Level Co-occurrence Matrix,GLCM)、马尔可夫随机场(Markov Random Fields,MRF)、基于形态学闭运算、统计建模等空间域特征提取算法,以小波、曲波、轮廓波等为代表的多尺度几何分析(Multi-scale Geometric Analysis,MGA)的变换域特征提取算法以及以相干目标分解、非相关目标分解的极化特征提取算法。上述传统方法需要依赖人工经验,对不同数据、不同地物目标的适应性较差。近年来深度学习作为一种自动提取特征的手段,为SAR图像分类提供了新的思路。
以堆叠自动编码器、深度置信网络、深度卷积网络、生成对抗网络等的深度学习框架都被应用于SAR图像分类问题中,在上述深度学习网络中,生成对抗网络作为一种生成模型,可以捕获图像的高阶统计特征,被广泛用于特征工程中,但是其固有的模式坍塌、训练不稳定问题可能会造成特征不能有效表达。在SAR图像分类的特征提取中,可能出现类间特征模糊,类内特征差异大的特点,进而影响对地物的准确识别,降低分类精度。
发明内容
本发明要解决的技术问题是,克服现有技术中存在的不足,提出一种基于多任务DCGAN(深度卷积生成对抗网络)的SAR(合成孔径雷达)图像分类方法。
为解决技术问题,本发明的解决方案是:
提供一种基于多任务DCGAN的SAR图像分类方法,包括以下步骤:
(1)构建多任务DCGAN网络框架
构建内容包括:对抗任务模块、分类任务模块、自编码任务模块,及多任务GAN的自适应损失函数。
(2)对原始SAR数据进行合理表征
包括:对于单极化数据,采用幅度或强度进行表征;对于极化数据,采用水平-水平、水平-垂直、垂直-垂直三种极化的幅度、强度或者极化分解得到的相应物理量进行表征;
(3)生成训练数据集和测试数据集
包括:采用滑窗法生成SAR图像每个像素点的切片图像;对每种地物类别随机取10%的切片图像数据作为训练集,其余数据作为测试集;
(4)训练多任务DCGAN
采用交替训练的方式更新对抗任务模块、分类任务模块与自编码任务模块直至收敛,在训练过程中采用Adam算法进行梯度回传;
(5)对测试SAR图像数据集进行地物分类并计算相应评价指标
将测试SAR图像数据输入训练好的多任务DCGAN网络中,得到地物分类结果,并计算相应的Precision、Recall、F1-Score、OA、Kappa评价指标。
本发明所述步骤(1)中,对抗任务模块的具体结构和参数为:
对抗任务模块具有4层结构,其结构依次为:输入层->第一全连接层->BatchNorm层->LeakyRelu层->第二全连接层->BatchNorm层->LeakyRelu层->第一反卷积层->BatchNorm层->LeakyRelu层->第二反卷积层->Tanh层;
各层的参数设置如下:
输入层的特征图维度设置为100(噪声维度)+类别个数;
第一全连接层、BatchNorm层节点个数设置为1024,LeakyRelu层的斜率参数设置为0.2;
第二全连接层、BatchNorm层节点个数设置为128*输入图像长度/4*输入图像宽度/4,LeakyRelu层的斜率参数设置为0.2;
第一反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为64,4,2,1;BatchNorm层节点个数设置为64,LeakyRelu层斜率参数设置为0.2;
第二反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为类别数,4,2,1;。Tanh层节点个数为3。
本发明所述步骤(1)中,分类任务模块的具体结构和参数:
分类任务模块具有5层结构,其结构依次为:输入层->第一卷积层->LeakyRelu层->第二卷积层->BatchNorm层->LeakyRelu层->第三卷积层->LeakyRelu层->第一全连接层->自编码层->Softmax层、Sigmoid层;
各层的参数设置如下:
输入层的特征图维度为3;
第一卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为64,4,2,1;LeakyRelu层斜率参数设置为0.2;
第二卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128,4,2,1;BatchNorm层节点个数设置为128,LeakyRelu层斜率参数设置为0.2;
第三卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128,4,2,1;LeakyRelu层斜率参数设置为0.2;
第一全连接层节点个数设置为256,自编码层的隐节点设置为128,Softmax层节点个数设置为类别个数,Sigmoid层节点个数设置为2。
本发明所述步骤(1)中,自编码任务模块的具体结构和参数:
自编码任务任务模块具有三层结构,依次为:输入层->隐层->输出层。
各层的参数设置如下:
输入层节点个数为2048,隐层节点个数为1024,输出层节点个数为2048。
本发明所述步骤(1)中,构建多任务GAN的自适应损失函数具体包括:
(a)对于回归任务,定义似然函数p(y|fw(x))=N(fw(x),σ2),其中fw(x)为网络的输出,w为网络权值,σ为观测噪声标准差;
对于分类任务,定义似然函数p(y|fw(x))=softmax(fw(x));
对于对抗任务,定义似然函数p(y|fw(x))=Sigmoid(fw(x));
对于多任务网络结构,定义似然函数
p(y1,y2,...,yK|fw(x))=p(y1|fw(x)...p(yK|fw(x));
(b)在高斯似然函数的假定下,多任务GAN的自适应损失函数为:
p(y1,y2,y3|fw(x))=p(y1|fw(x)p(y2|fw(x)p(y3|fw(x))
Figure BDA0002943175920000041
上述各式中:fw(x)为网络的输出,其中
Figure BDA0002943175920000042
为分类任务模块的输出,
Figure BDA0002943175920000043
为对抗任务模块的输出;w为网络权值;σ为观测噪声标准差;c为类别数;y1,y2,...,yk为k个任务的实际值;L1(w)为自编码任务损失函数,L2(w)为分类任务损失函数,L3(w)为对抗任务损失函数。
本发明中,所述步骤(4)具体包括:
(4.1)首先固定分类任务模块、自编码任务模块,对高斯分布随机采样出100维度的一维向量,经过对抗任务模块得到虚假图像,该图像和真实图像馈入分类任务模块、自编码任务模块中,得到相应损失;在训练过程中采用Adam算法进行梯度回传,更新对抗任务模块相应参数;
(4.2)其次固定对抗任务模块,对高斯分布随机采样出100维度的一维向量,经过对抗任务模块得到虚假图像,该图像和真实图像输入分类任务模块、自编码任务模块中,得到相应损失,在训练过程中采用Adam算法进行梯度回传,更新分类任务模块、自编码任务模块相应参数;
(4.3)对抗任务模块与分类任务模块、自编码任务模块不断进行交替训练,直至收敛,保存最优模型。
发明原理描述:
相较于DCGAN框架,本发明引入了分类任务与编码任务,使得网络能够获得较为稀疏的分类有效特征,缓解模式坍塌问题。相较于CGAN,ACGAN框架,本发明通过极大似然函数建模,定义了多任务DCGAN网络的自适应损失函数保证各个任务间训练的稳定性。基于多任务DCGAN的SAR图像分类方法能够保证图像分类区域的一致性,提高分类精度。具体是:对抗任务保证网络能够提取SAR图像的高阶统计特征,使得不同地物特征区分度更大,易于分类;由于相干斑噪声会导致SAR图像的质量降低,因此地物特征容易受到噪声干扰,编码任务的引入可以保证网络提取的特征位于低维流形空间,加强网络的抗噪能力;分类任务可以缓解模式坍塌问题,使得训练更加稳定。多任务DCGAN网络自适应损失函数能够在训练过程中学习到不同任务之间的权值系数,克服了现有技术人为设置损失函数权值导致模式坍塌或训练不稳定问题,从而提高地物分类精度。
本发明与现有的技术相比具有以下优点:
第一,本发明构建了基于多任务的DCGAN网络,该网络能够协同处理生成任务、重构任务、分类任务。对抗任务模块生成的虚假SAR图像与真实SAR图像输入分类任务模块、自编码任务模块中,得到相应损失;能够同时判断图像真假、捕获其低维流形稀疏特征、并用编码的稀疏特征进行图像分类,克服了通过DCGAN网络对SAR图像进行分类时特征信息不全面问题,缓解了模式坍塌问题。
第二,本发明构建了自适应损失函数。对于多任务DCGAN网络结构,自适应损失函数权值参数能在网络训练过程中被自动学习。克服了现有技术通过条件生成对抗网络(Conditional Generative Adversarial Network)人为设置损失权值导致模式坍塌或训练不稳定的问题,使得本发明提高了SAR图像分类精度。
附图说明
图1是本发明的流程图。
图2是本发明的仿真图。
具体实施方式
下面结合附图对本发明实现步骤做进一步的详细描述。
本发明所述基于多任务DCGAN的SAR图像分类方法,包括以下步骤:
步骤1,构建多任务DCGAN网络框架
(1)构建对抗任务模块:
对抗任务模块具有4层结构,依次为:输入层->第一全连接层->BatchNorm层->LeakyRelu层->第二全连接层->BatchNorm层->LeakyRelu层->第一反卷积层->BatchNorm层->LeakyRelu层->第二反卷积层->Tanh层;
各层的参数设置如下:
输入层的特征图维度设置为100(噪声维度)+类别个数。
第一全连接层、BatchNorm层节点个数设置为1024,LeakyRelu斜率参数设置为0.2。
第二全连接层、BatchNorm层节点个数设置为128*输入图像长度/4*输入图像宽度/4,LeakyRelu斜率参数设置为0.2。
第一反卷积层滤波器个数、滤波器尺寸大小,步长、填充分别设置为64,4,2,1。BatchNorm层节点个数设置为64,LeakyRelu层斜率参数设置为0.2。
第二反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为类别数,4,2,1;Tanh层的节点个数为3。
(2)构建分类任务模块
分类任务模块具有5层结构,依次为:输入层->第一卷积层->LeakyRelu层->第二卷积层->BatchNorm层->LeakyRelu层->第三卷积层->LeakyRelu层->第一全连接层->自编码层->Softmax层、Sigmoid层。
输入层的特征图维度为3
第一卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为64,4,2,1。LeakyRelu层斜率参数设置为0.2。
第二卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128,4,2,1。BatchNorm层节点个数设置为128,LeakyRelu层斜率参数设置为0.2。
第三卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128,4,2,1。LeakyRelu层斜率参数设置为0.2。
第一全连接层节点个数设置为256,自编码层隐节点设置为128,Softmax层节点个数设置为类别个数,Sigmoid层节点个数设置为2。
(3)构建自编码任务模块
自编码任务任务模块具有三层结构,依次为:输入层->隐层->输出层。
输入层节点个数为2048,隐层节点个数为1024,输出层节点个数为2048。
(4)构建多任务GAN自适应损失函数:
对于回归任务,定义似然函数p(y|fw(x))=N(fw(x),σ2),其中fw(x)为网络的输出,w为网络权值,σ为观测噪声标准差。
对于分类任务,定义似然函数p(y|fw(x))=softmax(fw(x))。
对于对抗任务,定义似然函数p(y|fw(x))=Sigmoid(fw(x));
对于多任务网络结构,定义似然函数
p(y1,y2,...,yK|fw(x))=p(y1|fw(x)...p(yK|fw(x))。
在高斯似然函数的假定下,多任务GAN的自适应损失函数为:
p(y1,y2,y3|fw(x))=p(y1|fw(x)p(y2|fw(x)p(y3|fw(x))
Figure BDA0002943175920000071
上述各式中,fw(x)为网络的输出,其中
Figure BDA0002943175920000072
为分类任务模块的输出,
Figure BDA0002943175920000073
为对抗任务模块的输出,w为网络权值,σ为观测噪声标准差,c为类别数,y1,y2,...,yk为k个任务的实际值,本示例中k的值可取3,L1(w)为自编码任务损失函数,L2(w)为分类任务损失函数,L3(w)为对抗任务损失函数。
步骤2,对原始SAR数据进行合理表征
对于单极化数据,采用幅度或强度对原始SAR数据进行表征。
对于极化数据,可采用水平-水平(HH)、水平-垂直(HV)、垂直-垂直(VV)三种极化的幅度、强度或者极化分解得到的相应物理量对原始极化SAR数据进行表征。
步骤3,生成训练数据集和测试数据集
采用滑窗法生成SAR图像每个像素点的切片图像,大小为m*m。
对每一地物种类随机取10%的切片图像数据作为训练集,其余数据作为测试集。
步骤4,训练多任务DCGAN
采用交替训练的方式更新对抗任务模块、分类任务模块与自编码任务模块直至收敛,具体步骤为:
(4.1)首先固定分类任务模块、自编码任务模块,对高斯分布随机采样出100维度的一维向量,经过对抗任务模块得到虚假图像,该图像和真实图像馈入分类任务模块、自编码任务模块中,得到相应损失;在训练过程中采用Adam算法进行梯度回传,更新对抗任务模块相应参数;
(4.2)其次固定对抗任务模块,对高斯分布随机采样出100维度的一维向量,经过对抗任务模块得到虚假图像,该图像和真实图像输入分类任务模块、自编码任务模块中,得到相应损失;在训练过程中采用Adam算法进行梯度回传,更新分类任务模块、自编码任务模块相应参数;
(4.3)对抗任务模块与分类任务模块、自编码任务模块不断进行交替训练,直至收敛,保存最优模型。
步骤5,对测试SAR图像数据集进行地物分类并计算相应评价指标
将测试数据输入训练好的多任务DCGAN网络中,得到预测结果,并计算相应的Precision、Recall、F1-Score、OA、Kappa评价指标。
下面通过仿真实验进一步说明本发明的技术效果。
(1)仿真条件
实验平台:操作系统Linux Ubuntu 16.04、Intel(R)Core(TM)i7-6800K CPU@3.40GHz、Geforce GTX 1080。软件环境:pytorch
(2)仿真内容与结果分析
本发明的仿真实验对比不同SAR数据表征方式下的DCGAN网络与多任务DCGAN网络对SAR数据分类效果。SAR数据表征分别采用了单极化HH,多极化HH_HV_VV,Pauli分解的SanFrancisco AirSAR图像。图像大小为900*900像素。
图2中(a)为SanFrancisco AirSAR图像真实场景,图2中(b)-(d)分别为以单极化HH,多极化HH_HV_VV,Pauli分解为SAR数据表征的DCGAN分类结果图,图2中(e)-(g)分别为以单极化HH,多极化HH_HV_VV,Pauli分解为SAR数据表征的多任务DCGAN分类结果图。表1为上述两种网络的量化精度对比。
表1.分类指标对比表
Figure BDA0002943175920000091
对比图2中的(e)-(g)与(b)-(d)可以看出,在相同SAR数据表征下,多任务DCGAN网络较DCGAN网络在水体、建筑区域一致性更好。在表1中,不同类型的地物在多任务DCGAN网络下,其F1-score,OA,Kappa都得到了一定程度提升。
综上所述,本发明构建了对抗任务模块、分类任务模块、自编码模块在内的多任务GAN网络结构及多任务GAN网络的自适应损失函数,缓解了模式坍塌问题,保证了训练的稳定性,有效的提取了SAR图像的特征,减少了分类结果的噪声点,保持了区域的一致性,提高了分类精度。

Claims (6)

1.一种基于多任务DCGAN的SAR图像分类方法,其特征在于,包括以下步骤:
(1)构建多任务DCGAN网络框架
构建内容包括:对抗任务模块、分类任务模块、自编码任务模块,及多任务GAN的自适应损失函数;
(2)对原始SAR数据进行合理表征
包括:对于单极化数据,采用幅度或强度进行表征;对于极化数据,采用水平-水平、水平-垂直、垂直-垂直三种极化的幅度、强度,或者极化分解得到的相应物理量进行表征;
(3)生成训练数据集和测试数据集
包括:采用滑窗法生成SAR图像每个像素点的切片图像;对每种地物类别随机取10%的切片图像数据作为训练集,其余数据作为测试集;
(4)训练多任务DCGAN
采用交替训练的方式更新对抗任务模块、分类任务模块与自编码任务模块直至收敛,在训练过程中采用Adam算法进行梯度回传;
(5)对测试SAR图像数据集进行地物分类并计算评价指标
将测试SAR图像数据输入训练好的多任务DCGAN网络中,得到地物分类结果,并计算相应的Precision、Recall、F1-Score、OA、Kappa评价指标。
2.根据权利要求1所述的方法,其特征在于,所述步骤(1)中,对抗任务模块的具体结构和参数为:
对抗任务模块具有4层结构,其结构依次为:输入层->第一全连接层->BatchNorm层->LeakyRelu层->第二全连接层->BatchNorm层->LeakyRelu层->第一反卷积层->BatchNorm层->LeakyRelu层->第二反卷积层->Tanh层;
各层的参数设置如下:
输入层的特征图维度设置为100+类别个数;
第一全连接层、BatchNorm层节点个数设置为1024,LeakyRelu层的斜率参数设置为0.2;
第二全连接层、BatchNorm层节点个数设置为128*输入图像长度/4*输入图像宽度/4,LeakyRelu层的斜率参数设置为0.2;
第一反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为64,4,2,1;BatchNorm层节点个数设置为64,LeakyRelu层斜率参数设置为0.2;
第二反卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为类别数,4,2,1;Tanh层节点个数为3。
3.根据权利要求1所述的方法,其特征在于,所述步骤(1)中,分类任务模块的具体结构和参数为:
分类任务模块具有5层结构,其结构依次为:输入层->第一卷积层->LeakyRelu层->第二卷积层->BatchNorm层->LeakyRelu层->第三卷积层->LeakyRelu层->第一全连接层->自编码层->Softmax层、Sigmoid层;
各层的参数设置如下:
输入层的特征图维度为3;
第一卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为64,4,2,1;LeakyRelu层斜率参数设置为0.2;
第二卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128,4,2,1;BatchNorm层节点个数设置为128,LeakyRelu层斜率参数设置为0.2;
第三卷积层滤波器个数、滤波器尺寸大小、步长、填充分别设置为128,4,2,1;LeakyRelu层斜率参数设置为0.2;
第一全连接层节点个数设置为256,自编码层的隐节点设置为128,Softmax层节点个数设置为类别个数,Sigmoid层节点个数设置为2。
4.根据权利 要求1所述的方法,其特征在于,所述步骤(1)中,自编码任务模块的具体结构和参数为:
自编码任务模块具有三层结构,依次为:输入层->隐层->输出层;
各层的参数设置如下:
输入层节点个数为2048,隐层节点个数为1024,输出层节点个数为2048。
5.根据权利要求1所述的方法,其特征在于,所述步骤(1)中,自适应损失函数具体包括:
(a)对于回归任务,定义似然函数p(y|fw(x))=N(fw(x),σ2),其中fw(x)为网络的输出,w为网络权值,σ为观测噪声标准差;
对于分类任务,定义似然函数p(y|fw(x))=Softmax(fw(x));
对于对抗任务,定义似然函数p(y|fw(x))=Sigmoid(fw(x));
对于多任务网络结构,定义似然函数
p(y1,y2,...,yK|fw(x))=p(y1|fw(x)...p(yK|fw(x));
(b)在高斯似然函数的假定下,
p(y1,y2,y3|fw(x))=p(y1|fw(x)p(y2|fw(x)p(y3|fw(x))
多任务GAN的自适应损失函数loss为:
Figure FDA0003772717940000031
上述各式中:fw(x)为网络的输出,其中
Figure FDA0003772717940000032
为分类任务模块的输出,
Figure FDA0003772717940000033
为对抗任务模块的输出;w为网络权值;σ为观测噪声标准差;c为类别数;y1,y2,...,yk为k个任务的实际值;L1(w)为自编码任务损失函数,L2(w)为分类任务损失函数,L3(w)为对抗任务损失函数。
6.根据权利要求1所述的方法,其特征在于,所述步骤(4)具体包括:
(4.1)首先固定分类任务模块、自编码任务模块,对高斯分布随机采样出100维度的一维向量,经过对抗任务模块得到虚假图像,该图像和真实图像输入分类任务模块、自编码任务模块中,得到相应损失;在训练过程中采用Adam算法进行梯度回传,更新对抗任务模块相应参数;
(4.2)其次固定对抗任务模块,对高斯分布随机采样出100维度的一维向量,经过对抗任务模块得到虚假图像,该图像和真实图像输入分类任务模块、自编码任务模块中,得到相应损失,采用Adam算法进行梯度回传,更新分类任务模块、自编码任务模块相应参数;
(4.3)对抗任务模块与分类任务模块、自编码任务模块不断进行交替训练,直至收敛,保存最优模型。
CN202110186968.8A 2021-02-16 2021-02-16 一种基于多任务dcgan的sar图像分类方法 Active CN113033609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110186968.8A CN113033609B (zh) 2021-02-16 2021-02-16 一种基于多任务dcgan的sar图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110186968.8A CN113033609B (zh) 2021-02-16 2021-02-16 一种基于多任务dcgan的sar图像分类方法

Publications (2)

Publication Number Publication Date
CN113033609A CN113033609A (zh) 2021-06-25
CN113033609B true CN113033609B (zh) 2022-11-29

Family

ID=76461256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110186968.8A Active CN113033609B (zh) 2021-02-16 2021-02-16 一种基于多任务dcgan的sar图像分类方法

Country Status (1)

Country Link
CN (1) CN113033609B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114821199A (zh) * 2022-06-24 2022-07-29 聊城大学 一种美国白蛾幼虫网幕图像数据集增强方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106296692A (zh) * 2016-08-11 2017-01-04 深圳市未来媒体技术研究院 基于对抗网络的图像显著性检测方法
CN107368852A (zh) * 2017-07-13 2017-11-21 西安电子科技大学 一种基于非下采样轮廓波dcgan的极化sar图像分类方法
CN109977812B (zh) * 2019-03-12 2023-02-24 南京邮电大学 一种基于深度学习的车载视频目标检测方法
CN110610207B (zh) * 2019-09-10 2022-11-25 重庆邮电大学 一种基于迁移学习的小样本sar图像舰船分类方法
CN112052754B (zh) * 2020-08-24 2023-05-05 西安电子科技大学 基于自监督表征学习的极化sar影像地物分类方法

Also Published As

Publication number Publication date
CN113033609A (zh) 2021-06-25

Similar Documents

Publication Publication Date Title
CN109934815B (zh) 一种结合atv约束的张量恢复红外弱小目标检测方法
CN107590515B (zh) 基于熵率超像素分割的自编码器的高光谱图像分类方法
Delbo et al. A fuzzy shell clustering approach to recognize hyperbolic signatures in subsurface radar images
CN111046967A (zh) 一种基于卷积神经网络和注意力机制的水下图像分类方法
CN111951186B (zh) 一种基于低秩和全变分约束的高光谱图像去噪方法
Li Deep learning for image denoising
CN105117736B (zh) 基于稀疏深度堆栈网络的极化sar图像分类方法
CN110751087B (zh) 一种基于eof的无人机信号识别系统和方法
Liu et al. Group sparse representation based dictionary learning for SAR image despeckling
Chen et al. Fourier domain structural relationship analysis for unsupervised multimodal change detection
CN113033609B (zh) 一种基于多任务dcgan的sar图像分类方法
CN110490894A (zh) 基于改进的低秩稀疏分解的视频前背景分离方法
CN113919226A (zh) 基于权重的采矿植被生态累积效应扰动范围识别方法
CN113421198B (zh) 一种基于子空间的非局部低秩张量分解的高光谱图像去噪方法
CN114037891A (zh) 基于u型注意力控制网络的高分辨率遥感影像建筑物提取方法及装置
Jiang et al. Quality prediction of DWT-based compression for remote sensing image using multiscale and multilevel differences assessment metric
CN114067217A (zh) 基于非下采样分解转换器的sar图像目标识别方法
CN111460943A (zh) 一种遥感影像地物分类方法及系统
Li et al. Image Classification Accuracy Analysis for Three-channel Remote Sensing Data.
CN113887656B (zh) 一种联合深度学习与稀疏表示的高光谱图像分类方法
Sharmili et al. Performance Analysis of Elevation & Building Contours Image using K-Mean Clustering with Mathematical Morphology and SVM
Liu et al. Multi-focus image fusion algorithm based on unsupervised deep learning
Wang et al. Image denoising using an improved generative adversarial network with Wasserstein distance
Sheng et al. Fuzzy preprocessing and clustering analysis method of underwater multiple targets in forward looking sonar image for AUV tracking
Zhou et al. SAR image denoising method based on sparse representation<? show [AQ ID= Q1]?>

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant