CN114549966A - 基于多任务子网络分解的sar变化检测网络训练方法 - Google Patents

基于多任务子网络分解的sar变化检测网络训练方法 Download PDF

Info

Publication number
CN114549966A
CN114549966A CN202210011083.9A CN202210011083A CN114549966A CN 114549966 A CN114549966 A CN 114549966A CN 202210011083 A CN202210011083 A CN 202210011083A CN 114549966 A CN114549966 A CN 114549966A
Authority
CN
China
Prior art keywords
network
training
task
target parameters
change detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210011083.9A
Other languages
English (en)
Other versions
CN114549966B (zh
Inventor
李豪
郑宇�
公茂果
刘洁怡
蒋祥明
唐泽栋
张明阳
武越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202210011083.9A priority Critical patent/CN114549966B/zh
Publication of CN114549966A publication Critical patent/CN114549966A/zh
Application granted granted Critical
Publication of CN114549966B publication Critical patent/CN114549966B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多任务子网络分解的SAR变化检测网络训练方法,包括:获取SAR图像样本集,获取预设卷积神经网络并对目标参数初始化;用SGD随机梯度下降法迭代训练;当训练效果不明显时,利用得到的多组全网目标参数得到父代种群;全网目标参数优化定为主任务,全网络按层分解得到子网络的优化定为辅任务,选择一个辅任务配合主任务,基于种群遗传方式迭代训练,若多次迭代后辅任务遍历完成,保留得到的一组最优的全网目标参数,返回SGD随机梯度下降法;在训练结束时获得最优全网目标参数代入预设卷积神经网络得到训练完成的SAR图像变化检测网络。本发明能加快网络收敛,避免陷入局部最优,缓解梯度消失和梯度爆炸现象。

Description

基于多任务子网络分解的SAR变化检测网络训练方法
技术领域
本发明属于遥感技术领域,具体涉及一种基于多任务子网络分解的SAR变化检测网络训练方法。
背景技术
SAR图像变化检测是通过SAR图像检测不同时间段地球表面同一地理位置变化情况的一种技术,目前已被广泛应用于城市规划、农作物生长检测、森林预警以及灾害监测等领域,具有重要的实际应用价值。传统的SAR图像变化检测方法包括图像差异法、原理分析法和分类比较法等。
近年来,随着深度学习技术的发展,出现了较多基于卷积神经网络的变化检测方法,这些方法能够尽可能地模拟图像和现实世界地理特征之间的关系,检测更实际的变化信息,因此性能优于传统的特征提取方法。然而在训练变化检测卷积神经网络时,已有的基于梯度的训练方法往往会面临误差信号的梯度从后向前传播时呈现指数级下降的问题,会显著降低变化检测卷积神经网络前层的学习效率,导致网络学习性能下降、误检率升高。同时,训练参数的初始化也容易让模型陷入次局部最优,导致网络检测精确度降低。
具体针对SAR图像的变化检测,梁怿清等在《基于深度学习的SAR目标检测方法》中,使用反向传播BP算法来训练SAR图像的变化检测网络。其中,BP梯度下降算法是目前应用最多的网络训练形式,具有较强的映射能力和自适应能力。但由于变化检测卷积神经网络中参数过多,这种方法会导致收敛速度过慢,而且容易陷入局部最小化。而且SAR图像的变化检测卷积神经网络若要获得更高分类精度往往具有更深的网络层数,该方法随着网络层数的加深会变得极不稳定,容易出现梯度弥散和梯度爆炸现象。
另外,徐真等在《一种基于CNN的SAR图像变化检测方法》中使用了Adam算法作为梯度训练算法。该训练方法属于传统的SGD随机梯度下降算法的改进算法,具有更快的收敛速度,同时还具有较好的抗噪声性能。但是该方法的二阶动量是固定时间窗口内的累积。随着时间窗口的变化,遇到的训练数据可能发生巨大变化,使得二阶动量可能时大时小,而不是单调变化,这就可能在训练后期引起学习率的震荡,导致模型无法收敛。另外,由于SAR变化检测卷积神经网络往往包含大量的参数,在这样一个维度极高的空间内,非凸的目标函数往往起起伏伏,拥有无数个极大值和极小值。有些陡峭的极值,通过引入动量可能很容易越过,而有些较为平缓的极值,可能探索很多次都无法找出,于是会导致陷入局部最优,使得训练停止。
因此,如何针对SAR图像的变化检测网络,提出一种快速、有效的训练方法,以提升SAR图像变化检测网络的精度,是本领域内一个亟待解决的问题。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于多任务子网络分解的SAR变化检测网络训练方法和一种针对SAR图像的变化检测方法。本发明要解决的技术问题通过以下技术方案实现:
第一方面,本发明实施例提出了一种基于多任务子网络分解的SAR变化检测网络训练方法,包括:
S1,获取SAR图像样本集,获取预设卷积神经网络并对待训练的目标参数进行初始化;
S2,利用所述SAR图像样本集,采用SGD随机梯度下降法对当前网络进行迭代训练,保留每次训练得到的全网目标参数;其中,若当前次训练满足第一结束条件时执行S5;否则在判定训练无效时执行S3;
S3,利用所述SGD随机梯度下降法迭代训练得到的多组全网目标参数,进行种群初始化得到父代种群;其中,每代种群含有的个体数量相同;每个个体对应一个针对SAR图像的变化检测网络,每个个体的染色体编码是按照对应的变化检测网络各层顺序将各层所对应的目标参数顺序排列得到的;
S4,选择一个辅任务配合主任务,基于种群遗传方式进行多任务优化的网络迭代训练,保留每次训练得到的全网目标参数;其中,若当前次训练满足第二结束条件,执行S5;若多次迭代训练后判定所有辅任务遍历完成,保留多任务演化得到的一组最优的全网目标参数,并返回S2;所述预设卷积神经网络依据层数被预先分解为多个子网络,每个子网络被设定为用于优化该子网络的目标参数的辅任务,全部子网络的集合被设定为用于优化全网络的目标参数的主任务;
S5,获得迭代训练完成的最优全网目标参数,并将其代入所述预设卷积神经网络,得到训练完成的SAR图像变化检测网络,以用于对待测SAR图像对进行变化检测。
第二方面,本发明实施例提出了一种针对SAR图像的变化检测方法,包括:
获取待测SAR图像对;
将所述待测SAR图像对输入SAR图像变化检测网络,得到所述待测SAR图像对的变化检测结果;其中,所述SAR图像变化检测网络基于第一方面所述的基于多任务子网络分解的SAR变化检测网络训练方法得到。
本发明实施例所提供的基于多任务子网络分解的SAR变化检测网络训练方法,将所述SGD随机梯度下降法和多任务优化方法作为依次执行的两个训练阶段进行结合,在第一阶段的多次迭代无效后执行第二阶段的网络训练,并在第二阶段训练未达到要求时,将第二阶段多任务优化得到的一组最优的全网目标参数作为新的第一阶段训练的起点。由于多任务优化方法是无梯度的,将其和所述SGD随机梯度下降法结合能够有效缓解传统的SAR图像变化检测网络训练中会出现的梯度消失、梯度弥散、爆炸现象。同时,在利用多任务优化方法进行迭代训练时,将整个网络分解为多个子网络,全部的子网络集合设定为主任务,随机的单个子网络设定为辅任务。本发明实施例利用小规模的辅任务更易收敛的特点与主任务一同优化,能够加快收敛速度,降低网络训练成本。并且,本发明实施例在多任务优化方法的执行过程中,采用大量候选解方案来寻求全局最优解,能够帮助传统的SAR图像变化检测网络的训练脱离局部最优现象,寻求到性能更优的用于SAR图像变化检测的卷积神经网络参数。
以及,本发明实施例提出的一种针对SAR图像的变化检测方法,利用本发明实施例所提出的基于多任务子网络分解的SAR变化检测网络训练方法训练完成的SAR图像变化检测网络进行检测,能够提高检测的准确性。
以下将结合附图及实施例对本发明做进一步详细说明。
附图说明
图1为本发明实施例提供的一种基于多任务子网络分解的SAR变化检测网络训练方法的流程示意图;
图2为本发明实施例的一种矩形滑窗滑动遍历差异图的示意图;
图3为本发明实施例以VGG16网络为例提供的一种个体染色体编码示意图;
图4为本发明实施例所提供的两点交叉变异示意图;
图5为本发明实施例提供的另一种基于多任务子网络分解的SAR变化检测网络训练方法的流程示意图;
图6为本发明实施例用于仿真实验的第一组SAR图像和变化参考图;
图7为本发明实施例用于仿真实验的第二组SAR图像和变化参考图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决现有技术中SAR图像变化检测网络的训练问题,以及提高SAR图像变化检测的精度,本发明实施例提供了一种基于多任务子网络分解的SAR变化检测网络训练方法和一种针对SAR图像的变化检测方法。
第一方面,本发明实施例提供了一种基于多任务子网络分解的SAR变化检测网络训练方法,即具体利用多任务子网络分解优化的方式提出了一种SAR图像变化检测卷积神经网络的训练方法,请参见图1,该方法可以包括以下步骤:
S1,获取SAR图像样本集,获取预设卷积神经网络并对待训练的目标参数进行初始化。
首先,介绍SAR图像样本集的获取过程。
本发明实施例中,SAR图像样本集用于网络训练,其中每个样本基于同一地点不同时刻的SAR图像对,以及对应的差异图得到。
可选的一种实施方式中,获取SAR图像样本集,可以包括以下步骤A1~A5:
A1,获取多组SAR图像对,并分别进行预处理,得到多组样本SAR图像对。
本发明实施例中,每一组SAR图像对包括同一地点不同时刻的两幅SAR图像。
预处理主要包括图像配准、几何校正及图像去噪等。目的是让两幅SAR图像在空域和谱域具有一致可比性。
通过图像配准,可以使得两幅SAR图像的坐标系表示相同地理位置信息。本发明实施例可以采用现有的任意一种图像配准方法,比如通过尺度不变特征或者互信息特征来对两幅SAR图像进行尺度级别或者灰度级别的配准等,在此不做限制。
由于遥感成像过程中,受多种因素的综合影响,图像会产生几何畸变,通过几何校正能够将因照射条件等原因产生的误差进行辐射校正。本发明实施例可以采用现有的任意一种几何校正方法,比如正射纠正、RPC模型以及多项式模型等,在此不做限制。
通过图像去噪能够消除SAR图像中斑点噪声等,提高图像质量。本发明实施例可以采用现有的任意一种图像去噪方法,比如均值滤波、中值滤波、Lee滤波、Sigma滤波、Frost滤波、Gamma MAP滤波、基于小波分解的阈值滤波等等,在此不做限制。
为了区分,本发明实施例将预处理后的SAR图像对命名为样本SAR图像对。
A2,生成每组样本SAR图像对的差异图。
针对每组样本SAR图像对,通过将该组样本SAR图像对中的两幅SAR图像进行比较,可以生成一个差异图。在差异图中,变化区域的像素和非变化区域的像素在灰度上将呈现出明显的差异,因此,能够初步区分两幅SAR图像中的未变化类和变化类。
关于生成差异图的方法,可以采用现有的任意一种差异图生成方法实现,比如:采用差值算子运算、采用比值算子运算、采用对数比(Log-ratio,LR)算子运算、采用均值比(Mean-ratio,MR)算子运算、组合差异图法(Combined Difference Image,CDI)、基于邻域的比值差异图算法、小波融合(Wavelet Fusion,WF)法等等,在此不做限制。
可选的一种实施方式中,可以采用基于比值算子的方法生成差异图,具体可以选择LR算子,LR算子的计算公式如下:
Figure BDA0003457377650000071
其中,I1(x)和I2(x)分别表示SAR图像I1和I2在空间位置x处的像素强度值,C(C>0)是一个极小常数,用来防止分母为0的情况发生;|·|表示绝对值函数。
关于利用LR算子,基于比值法生成差异图的具体过程请参见相关现有技术,在此不做详细说明。
A3,针对每个差异图,利用阈值法确定该差异图中每个像素的类别标签。
其中,类别标签包括变化类和未变化类。
其中,阈值法是通过某种阈值选择方法找出一个最优阈值以后,将差异图以阈值像素值为界划分为变化类和未变化类。
本发明实施例的阈值法可以包括KI(Kilter&Illingworth)法和EM(ExpectationMaximization,期望最大化)法等。
可选的一种实施方式中,可以采用GKI(Generalized KI,广义KI)阈值法将差异图上的像素分为变化类ωc和未变化类ωn。具体的:
假设差异图概率分布函数为p(Xl),则使用全概率公式得到其概率分布函数具体为:
p(Xl)=p(Xl∣ωc)·P(ωc)+p(Xl∣ωn)·P(ωn)
其中,p(Xl∣ωc)和p(Xl∣ωn)分别表示变化类ωc和未变化类ωn的条件概率密度函数,P(ωc)和P(ωn)为对应的先验概率。
假设差异图中的像素在假设条件Hk下的参数模型为p(·|θk),k=0,1其中,
Figure BDA0003457377650000082
为该分布的参数向量;H0和H1分别对应未变化部分和变化部分。将差异图量化到Z个等级{0,1,...,Z-1},对应的归一化直方图为{h(u):0,1,...,Z-1}。
根据贝叶斯决策理论,后验概率密度可以由下式得到:
Figure BDA0003457377650000081
在此基础上,通过最小化分类误差,可以得到最佳分割阈值:
Figure BDA0003457377650000091
其中,τ*表示最佳分割阈值;
Figure BDA0003457377650000092
是差异图的先验概率;R={0,1,...,τ}和R={τ+1,τ+2,...,Z-1}是假设条件H0和H1的等级集合;
Figure BDA0003457377650000093
是参数向量θk的估计值。利用下式将差异图中的像素分为变化类ωc和未变化类ωn,即:
Figure BDA0003457377650000094
其中,ρ(i,j)指的是差异图在空间位置x(i,j)处的像素强度值。由此得到差异图对应的预分类结果。
A4,针对每个差异图,将该差异图中各像素依次作为预设大小的矩形滑窗的中心像素进行该差异图像素的滑动遍历;在滑动遍历过程中,若判定矩形滑窗内的差异图图像块满足预设条件,则将该差异图图像块、从对应的样本SAR图像对中依据该差异图图像块位置获得的两个样本SAR图像块共同构成一个样本。
A3中的预分类结果并不完全正确,该步骤是为了选择具有高置信度的样本以构造SAR图像样本集。
本发明实施例中,预设大小的矩形滑窗比如可以为16×16等。此处以3×3为例简单说明,请参见图2,图2为本发明实施例的一种矩形滑窗滑动遍历差异图的示意图,其中圆点表示像素。具体的,将差异图中的每个像素,依次作为该矩形滑窗的中心像素(见灰色圆点)。在矩形滑窗的每个位置处,判断矩形滑窗内9个像素所构成的差异图图像块是否满足预设条件,如果是,将该差异图图像块、生成该差异图的样本SAR图像对中,第一幅SAR图像依据该差异图图像块位置获得的样本SAR图像块,以及第二幅SAR图像依据该差异图图像块位置获得的样本SAR图像块,共同构成一个样本。如果否,则继续将下一个像素作为该矩形滑窗的中心像素进行滑动遍历。
其中,预设条件为该差异图图像块中与其中心像素的类别标签相同的像素数,与该差异图图像块的像素总数之比大于预设比值。以数学表达式说明即为:针对该矩形滑窗,若中心像素pij在预分类结果中对应的类别标签为Lij,以pij为中心的邻域为Ωij,其大小为w×w。如果pij满足以下条件则它的邻域被纳入一个样本:
Figure BDA0003457377650000101
其中,点pξψ是邻域Ωij中的像素;Q(pξψ∈Ωij∩Lξψ=Lij)表示在该邻域中类别标签为Lij的像素个数,w表示中心像素的邻域大小,即矩形滑窗的大小;η表示预设比值,可以根据经验值设定,比如可以为0.2等。
需要说明的是,在矩形滑窗的滑动遍历过程中,若对应的差异图图像块出现空白像素,可以采用预设像素或者利用邻近像素进行填充,具体方法在此不做详细说明。
本发明实施例中,一个差异图中可以得到多个样本,每个样本对应的差异图图像块具有确定的类别标签,该类别标签为其中心像素对应的类别标签。
A5,由所有差异图得到的样本构成SAR图像样本集,并将SAR图像样本集划分为多个子训练集。
本发明实施例可以得到若干样本,合并构成SAR图像样本集;并将SAR图像样本集作为训练集,划分为多个大小一致的子训练集,比如每个子训练集的样本数可以为50等。
其次,介绍获取预设卷积神经网络并对待训练的目标参数进行初始化的过程。
可选的一种实施方式中,获取预设卷积神经网络并对待训练的目标参数进行初始化,可以包括以下步骤B1~B2:
B1,获取预设卷积神经网络。
本发明实施例可以获取现有的任意一种能够用于SAR图像变化检测的卷积神经网络作为预设卷积神经网络。比如,预设卷积神经网络可以包括LeNet-5、AlexNet、VGG16网络等。
针对预设卷积神经网络为VGG16网络,其可以具有以下的初步设置:每一层使用的卷积核的大小为3×3,激活函数为relu,每次卷积前图像外围可以设置为0以保证图像大小不变,池化层大小为2×2,采用最大池化,步长为2。使用到第三层网络,全连接层的Dense设置为500,最后一层采用sigmod激活函数。当然,初步设置中的一些参数可以根据需要调整。
B2,将预设卷积神经网络中各层的权重参数和偏置参数作为待训练的目标参数进行随机初始化。
针对预设卷积神经网络,待训练的目标参数是各卷积层和全连接层中的权重系数和偏置系数;对于整个网络而言,以全网目标参数表述,具体包括整个网络对应的权重矩阵W和偏置矩阵B。
为了开始后续训练,需要先对W和B进行初始化。本发明实施例可以采用现有的任意一种初始化方法实现,比如均匀分布初始化、positive_unitball初始化、xavier初始化、msra初始化或者双线性初始化等。
可选的一种实施方式中,可以采用高斯分布初始化,从均值为0,方差为1的高斯分布中采样实现目标参数的初始化。
S2,利用SAR图像样本集,采用SGD随机梯度下降法对当前网络进行迭代训练,保留每次训练得到的全网目标参数。
其中,若当前次训练满足第一结束条件时执行S5;否则在判定训练无效时执行S3。
针对当前网络(第一次训练的当前网络为初始化后的预设卷积神经网络),本发明实施例利用SGD随机梯度下降法对其进行训练,若当前次训练得到的全网目标参数使得当前次训练满足第一结束条件,则结束训练,执行S5。其中,第一结束条件为当前次训练得到的全网目标参数使得网络性能达到预定要求,或者表明网络已经实现收敛,具体可以根据需要设计。若当前次训练得到的全网目标参数未使得当前次训练满足第一结束条件,则需要判定当前次训练是否有效,若有效则表明需要继续利用SGD随机梯度下降法进行迭代训练,若失效则停止SGD随机梯度下降法的迭代训练,执行S3。其中,当前次训练是否有效可以利用当前次训练的训练增益等参数指标进行设定,具体细节请参见后文。
其中,针对每次训练会保留该次训练得到的全网目标参数,如前,全网目标参数是针对预设卷积神经网络的权重矩阵和偏置矩阵。
关于SGD随机梯度下降法的相关内容请参见现有技术理解,在此不做具体说明。
S3,利用SGD随机梯度下降法迭代训练得到的多组全网目标参数,进行种群初始化得到父代种群。
关于该步骤,可选的一种实施方式中,可以包括:
获取利用SGD随机梯度下降法迭代训练得到的t组全网目标参数;其中,t表示利用SGD随机梯度下降法迭代训练的总次数,n表示每代种群含有的个体数量;t和n为大于0的自然数。
若n≤t,从t组全网目标参数中选择n组进行个体初始化,得到父代种群。具体的,可以从t组全网目标参数中随机选择n组;由于随着迭代次数的增多,目标参数优化效果增强,因此在优先的一种实施方式中,可以依据t组全网目标参数的获得顺序,从t组全网目标参数中获取在后的n组进行个体初始化,即采用SGD随机梯度下降法进行(t-n+1),(t-n+2),...,(t-n+i),...,(t-n+n)次迭代训练得到的目标参数进行个体初始化。
若n>t,选择t组全网目标参数,并利用预设初始化方法获取n-t组全网目标参数,共同进行个体初始化,得到父代种群。其中,预设初始化方法可以为高斯分布初始化等。
本发明实施例中,每代种群含有的个体数量相同,为了便于描述,可以用n表示;每个个体对应一个针对SAR图像的变化检测网络,每个个体的染色体编码是按照对应的变化检测网络各层顺序将各层所对应的目标参数顺序排列得到的。本领域技术人员可以理解的是,每个个体利用携带有预设卷积神经网络各层目标参数的染色体编码,表征了一个变化检测网络。
关于编码方式,请参见图3,图3为本发明实施例以VGG16网络为例提供的一种个体染色体编码示意图。
S4,选择一个辅任务配合主任务,基于种群遗传方式进行多任务优化的网络迭代训练,保留每次训练得到的全网目标参数。
其中,预设卷积神经网络依据层数被预先分解为多个子网络,每个子网络被设定为用于优化该子网络的目标参数的辅任务,全部子网络的集合被设定为用于优化全网络的目标参数的主任务。比如针对预设卷积神经网络为VGG16网络,每个卷积层为一个子网络,每个全连接层为一个子网络,共得到16个子网络,其中包含13个卷积层子网络,3个全连接层子网络。根据分解得到的16个子网络定义17个任务,其中包括1个主任务maintask和16个辅任务subtask k,k=1,2,...,16。maintask对应变化检测网络全部目标参数的优化,每个subtask对应一个子网络的目标参数的优化。
关于该步骤的多任务优化的网络迭代训练,若当前次训练满足第二结束条件,执行S5;若多次迭代训练后判定所有辅任务遍历完成,保留多任务演化得到的一组最优的全网目标参数,并返回S2。
具体的,本发明实施例该步骤是利用演化多任务优化子网络。总体上,会遍历每个辅任务,利用该辅任务和主任务一起进行目标参数优化,利用小规模的辅任务更易收敛的特点与主任务一同优化,能够加快收敛速度。针对遍历到的每个辅任务,会对该辅任务进行多次迭代;而在每次迭代中,从父代个体中基于主任务,选出擅长主任务优化的个体以及擅长该辅任务优化的个体,利用个体的任务擅长性采用遗传算法产生子代种群以实现任务擅长性的基因遗传;根据当前次的子代种群得到的全网目标参数,可以判定当前次训练是否满足第二结束条件,其中,第二结束条件为当前次训练得到的全网目标参数使得网络性能达到预定要求。若当前次训练满足第二结束条件则结束网络训练,执行S5。若当前次训练未满足第二结束条件则需要继续针对该辅任务进行迭代训练,这时则利用当前次的子代种群产生新一代的父代种群以用于下一次迭代。
若是所有辅任务全部遍历完成也没有能够结束网络训练,则利用多任务演化得到的一组最优的全网目标参数作为S2中预设卷积神经网络的初始目标参数继续进行SGD随机梯度下降法迭代训练。
关于S4的具体实现方式,在后文中予以详细说明。
可以理解的是,本发明实施例中,是将SGD随机梯度下降法作为第一阶段的网络训练方法,在其失效时,将多任务优化的网络迭代训练作为第二阶段的网络训练方法继续进行,若第二阶段执行完未达到目标,则以当前得到的一组最优的全网目标参数重新开始下一轮第一阶段的网络训练。因此,本发明实施例是将SGD随机梯度下降法和多任务优化方法进行了有效结合,并且利用多任务优化各个子网络,配合主任务实现了全网目标参数的训练寻优。
S5,获得迭代训练完成的最优全网目标参数,并将其代入预设卷积神经网络,得到训练完成的SAR图像变化检测网络,以用于对待测SAR图像对进行变化检测。
本领域技术人员可以理解的是,当执行至S5步骤时,可以基于多次迭代获得一组最优全网目标参数,那么将最优全网目标参数写入预设卷积神经网络,就可以得到训练完成的SAR图像变化检测网络,至此,针对SAR图像的变化检测网络的训练过程完成。可以理解的是,利用该SAR图像变化检测网络可以对同一地点不同时刻采集的未知SAR图像对,得到相应的差异图作为变化检测结果。
本发明实施例所提供的基于多任务子网络分解的SAR变化检测网络训练方法,将所述SGD随机梯度下降法和多任务优化方法作为依次执行的两个训练阶段进行结合,在第一阶段的多次迭代无效后执行第二阶段的网络训练,并在第二阶段训练未达到要求时,将第二阶段多任务优化得到的一组最优的全网目标参数作为新的第一阶段训练的起点。由于多任务优化方法是无梯度的,将其和所述SGD随机梯度下降法结合能够有效缓解传统的SAR图像变化检测网络训练中会出现的梯度消失、梯度弥散、爆炸现象。同时,在利用多任务优化方法进行迭代训练时,将整个网络分解为多个子网络,全部的子网络集合设定为主任务,随机的单个子网络设定为辅任务。本发明实施例利用小规模的辅任务更易收敛的特点与主任务一同优化,能够加快收敛速度,降低网络训练成本。并且,本发明实施例在多任务优化方法的执行过程中,采用大量候选解方案来寻求全局最优解,能够帮助传统的SAR图像变化检测网络的训练脱离局部最优现象,寻求到性能更优的用于SAR图像变化检测的卷积神经网络参数。
以下对S2和S4步骤一种可选的实施方式进行说明。
针对S2,可选的一种实施方式中,利用SAR图像样本集,采用SGD随机梯度下降法对当前网络进行迭代训练,包括以下步骤:
①利用一个未参与训练的子训练集,采用SGD随机梯度下降法训练已获取的当前网络,获得当前次训练得到的全网目标参数和训练增益。
具体的,采用SGD随机梯度下降法训练时,每次迭代随机选择一个未参与训练的子训练集对当前网络进行训练。其中,第一次利用SGD随机梯度下降法训练时,当前网络为初始化后的预设卷积神经网络。
使用如下公式完成梯度的更新,得到当前次训练得到的全网目标参数:
Figure BDA0003457377650000161
Figure BDA0003457377650000162
其中,α表示学习率,W和B分别为权重矩阵和偏置矩阵。i表示迭代序号。
本发明实施例网络训练的目的即为找到使SAR图像变化检测误检率最小的目标参数值;针对每一次迭代,可以计算出该次迭代结束后,将当前得到的全网目标参数写入预设卷积神经网络后所得的网络,利用SAR图像样本集进行变化检测得到的误检率。误检率可以采用最小均方误差函数表示,如下:
Figure BDA0003457377650000171
其中,oL(xk)表示当前网络针对输入样本对xk所输出的差异图,以差异图矩阵表示,其中,输入样本对为SAR图像样本集中的样本SAR图像对;yk表示SAR图像样本集中针对该样本SAR图像对的差异图,以差异图矩阵表示,作为样本训练的真值;
Figure BDA0003457377650000172
表示用于测量oL(xk)和yk之间平方欧式距离的平方2范数;N表示子训练集的样本数;t表示第t次迭代。当然,误检率还可以采用其余函数表示,在此不做限制。
并且,每次训练结束后,可以计算出当前次训练的训练增益:
εt=Et(P)+Et-2(P)-2Et-1(P)
本领域技术人员可以理解的是,SGD随机梯度下降法通常要进行多次迭代,对第一次和第二次的训练增益可以不单独考虑会存在停止迭代的情况。
②判断当前次训练是否满足第一结束条件。
其中,第一结束条件为网络进行变化检测的误检率小于误检率阈值,或累计迭代次数达到第一预设迭代次数。其中,第一预设迭代次数是针对SGD随机梯度下降法迭代训练预先设置的最大迭代次数,比如可以为80等。
其中,误检率阈值可以用ζ表示,可以根据经验值设定,比如ζ=0.032等。
③若当前次训练满足第一结束条件,将当前次训练得到的全网目标参数作为最优全网目标参数执行S5。则表示网络训练结束。
④若当前次训练未满足第一结束条件,判断训练增益是否小于训练增益阈值。其中,训练增益阈值可以用λ表示,可以根据经验值设定,比如λ=0.012等。
⑤若训练增益大于或等于训练增益阈值,返回利用一个未参与训练的子训练集,采用SGD随机梯度下降法训练已获取的当前网络的步骤。即若εt≥λ,表示仍需要继续采用SGD随机梯度下降法迭代训练,返回①。
⑥若训练增益小于训练增益阈值,判定SGD随机梯度下降法训练无效,执行S3。即若εt<λ,表示SGD随机梯度下降法损失值变化不再有效,则执行S3,开始第二阶段训练。
针对S4,可选的一种实施方式中,选择一个辅任务配合主任务,基于种群遗传方式进行多任务优化的网络迭代训练,可以包括以下步骤:
1)从分解得到的多个辅任务中随机选择一个未参与过优化的辅任务作为目标辅任务。
选中的目标辅任务subtask k与主任务maintask两个任务将会在后续一起进行目标参数的优化。
2)将父代种群中每个个体分别在主任务和目标辅任务上进行评估;依据评估结果,将主任务上n/2个优秀个体的技能系数类别标定为主任务类别,剩余个体的技能系数类别标定为辅任务类别。
可选的一种实施方式种,将父代种群中每个个体分别在主任务和目标辅任务上进行评估,包括:
针对父代种群中的每个个体,将该个体依据主任务评估策略在主任务上进行评估,并依据辅任务评估策略在目标辅任务上进行评估。
其中,主任务评估策略包括将该个体对应的全网目标参数写入原始变化检测网络,基于SAR图像样本集,利用误检率进行网络评估;辅任务评估策略包括用对应子网络的目标参数,替代当前保留的最优全网目标参数中相应层的目标参数后,基于SAR图像样本集,利用误检率进行网络评估。其中,当前保留的最优全网目标参数是对父代种群评估前,以前迭代训练得到的一个最优全网目标参数。
因此,父代种群中每个个体在maintask和subtask k上均会得到评估后的误检率。那么,针对maintask,会得到n个个体的误检率。将这n个个体依据误检率由小至大进行排序,选取排序在前的n/2个优秀个体,将其技能系数类别标定为主任务类别τmain,以负责主任务maintask的优化;同时将排序在后的n/2个个体的技能系数类别标定为辅任务类别τsubk,以负责目标辅任务subtask k的优化。本领域技术人员可以理解的是,技能系数是神经网络训练中的常用参数,在此不做详细说明。
3)基于当前代的父代种群中个体的技能系数类别,利用个体的染色体交叉变异产生子代种群,并确定其中每个个体的技能系数类别。
可选的一种实施方式中,该步骤3)可以包括以下步骤:
产生随机数rand1和rand2,并获取参数rmp1和rmp2
其中,rand1、rand2、rmp1和rmp2介于[0,1]之间;rmp1和rmp2可以根据经验值设定,比如rmp1=0.3、rmp2=0.01等。
判断父代种群中,两个亲代染色体p1和p2的技能系数是否满足
Figure BDA0003457377650000191
或者rand1<rmp1。其中,
Figure BDA0003457377650000201
Figure BDA0003457377650000202
分别表示p1和p2的技能系数。
若是,p1和p2采用两点交叉方式共产生两个子代,并根据rand2和rmp2的大小比较情况,确定两个子代的技能系数类别。
具体的:
若p1和p2的技能系数类别均为主任务类别,两个交叉点分别从p1和p2中随机选取;若p1和p2的技能系数类别至少包括一个辅任务类别,两个交叉点均从p1和p2中辅任务对应子网络的有效编码段内随机选取。
具体请参见图4,图4为本发明实施例所提供的两点交叉变异示意图;其中(a)为p1和p2的技能系数类别均为主任务类别的交叉变异示意图;(b)为p1和p2的技能系数类别均为辅任务类别的交叉变异示意图;(c)为p1和p2的技能系数类别分别为主任务类别和辅任务类别的交叉变异示意图。图4(a)中,两个擅长主任务的染色体进行交叉是两个主任务的全部染色体随机选择一段交叉;图4(b)中,两个擅长辅任务的染色体进行交叉,是在各自的子网络的染色体段中随机选取小段交叉;图4(c)中,擅长主任务和擅长辅任务的染色体进行交叉,是辅任务的子网络的染色体段与主任务相应子网络的染色体段中随机选取小段交叉。
并且,针对p1和p2的技能系数类别的任一种情况,若rand2<rmp2,确定
Figure BDA0003457377650000203
若rand2≥rmp2,确定
Figure BDA0003457377650000204
其中,
Figure BDA0003457377650000205
表示两个子代中子代off1的技能系数,
Figure BDA0003457377650000206
表示两个子代中子代off2的技能系数。
若否,每个亲代染色体采用突变方式各自产生一个子代,且子代继承亲代的技能系数类别。
具体的,p1突变产生子代off1,且设定
Figure BDA0003457377650000207
同时,p2突变产生子代off2,且设定
Figure BDA0003457377650000211
其中,一个基因变异的概率可以为0.02,变异点的值可以由均值为0、方差为1的高斯分布中采样得到的值替代。
由得到的所有子代构成子代种群。
其中,子代种群Off含有n个子代,子代种群中技能系数类别属于主任务类别τmain和辅任务类别τsubk的子代总数各占n/2。
4)将子代种群中的每个个体,依据自身的技能系数类别在对应任务上进行误检率评估。
具体的,针对子代种群Off中的每个子代,若该子代的技能系数类别为主任务类别τmain,则将该子代依据主任务评估策略仅在主任务上进行评估;若该子代的技能系数类别为辅任务类别τsubk,则将该子代依据辅任务评估策略仅目标辅任务上进行评估,具体评估方式与前文相同,在此不做赘述。可以理解的是,每个子代评估得到一个误检率。
5)判断当前次训练是否满足第二结束条件。
其中,第二结束条件为当前次训练得到的所有误检率中至少存在一个误检率小于误检率阈值。其中,误检率阈值与前文相同。
6)若当前次训练满足第二结束条件,将小于误检率阈值的一个最小误检率所对应的全网目标参数作为最优全网目标参数,并执行S5。至此网络训练结束。
7)若当前次训练未满足第二结束条件,判断当前次训练是否达到第二预设迭代次数。其中,第二预设迭代次数是针对多任务优化的网络迭代训练预先设置的最大迭代次数,比如可以为20等,该步骤的当前次训练对应的迭代次数是从第一次进行多任务优化开始累计得到的迭代次数。
8)若当前次训练未达到第二预设迭代次数,从评估后的两代种群中,针对两任务均选取评估结果优秀的n/2个个体,合并得到下一代的父代种群,执行基于当前代的父代种群中个体的技能系数类别,利用个体的染色体交叉变异产生子代种群的步骤。也就是说继续返回3)进行迭代训练,8)得到的“下一代的父代种群”在返回3)后,则作为3)的“当前代的父代种群”。关于如何选取优秀个体请参见前文描述。
9)若当前次训练达到第二预设迭代次数,判断是否遍历完所有辅任务。
10)若否,返回从分解得到的多个辅任务中随机选择一个未参与过优化的辅任务作为目标辅任务的步骤。也就是说返回1)重新换一个未参与过优化的辅任务作为目标辅任务开始新的迭代训练。
11)若是,停止多任务优化的网络迭代训练,利用多任务演化得到的一组最优的全网目标参数返回S2,以将预设卷积神经网络写入一组最优的全网目标参数后的一个网络作为待处理的当前网络。也就是说,将第二阶段的多任务演化得到的一组最优的全网目标参数作为新的第一阶段的起点,返回S2再次开始第一阶段的网络训练。
上述针对S2和S4的可选的实施方式,可以分别与前文整体介绍S1~S5步骤的方案配合作为一个实施例。当然也可以结合使用形成一个具体的实施例,具体请参见图5,图5为本发明实施例提供的另一种基于多任务子网络分解的SAR变化检测网络训练方法的流程示意图。包括以下步骤:
S001,获取SAR图像样本集,获取预设卷积神经网络并对待训练的目标参数进行初始化。
S002,利用一个未参与训练的子训练集,采用SGD随机梯度下降法训练已获取的当前网络,获得当前次训练得到的全网目标参数和训练增益。
S003,判断当前次训练是否满足第一结束条件:误检率小于误检率阈值或达到第一预设迭代次数。若当前次训练满足第一结束条件,将当前次训练得到的全网目标参数作为最优全网目标参数执行S013。若当前次训练未满足第一结束条件,执行S004,判断训练增益是否小于训练增益阈值。
若训练增益大于或等于训练增益阈值,返回S002,即利用一个未参与训练的子训练集,采用SGD随机梯度下降法训练已获取的当前网络的步骤。
若训练增益小于训练增益阈值,判定SGD随机梯度下降法训练无效,执行S005。
S005,利用SGD随机梯度下降法迭代训练得到的多组全网目标参数,进行种群初始化得到父代种群。
S006,从分解得到的多个辅任务中随机选择一个未参与过优化的辅任务作为目标辅任务。
S007,将父代种群中每个个体分别在主任务和目标辅任务上进行评估;依据评估结果,将主任务上n/2个优秀个体的技能系数类别标定为主任务类别,剩余个体的技能系数类别标定为辅任务类别。
S008,基于当前代的父代种群中个体的技能系数类别,利用个体的染色体交叉变异产生子代种群,并确定其中每个个体的技能系数类别。
S009,将子代种群中的每个个体,依据自身的技能系数类别在对应任务上进行误检率评估。
S010,判断当前次训练是否满足第二结束条件:当前次训练得到的所有误检率中至少存在一个误检率小于所述误检率阈值。
若当前次训练满足第二结束条件,将小于误检率阈值的一个最小误检率所对应的全网目标参数作为最优全网目标参数执行S013。
若当前次训练未满足第二结束条件,执行S011,判断当前次训练是否达到第二预设迭代次数。
若当前次训练未达到第二预设迭代次数,从评估后的两代种群中,针对两任务均选取评估结果优秀的n/2个个体,合并得到下一代的父代种群,执行S008,即基于当前代的父代种群中个体的技能系数类别,利用个体的染色体交叉变异产生子代种群的步骤。
若当前次训练达到第二预设迭代次数,执行S012,判断是否遍历完所有辅任务。
若否,返回S006,即从分解得到的多个辅任务中随机选择一个未参与过优化的辅任务作为目标辅任务的步骤。
若是,停止多任务优化的网络迭代训练,利用多任务演化得到的一组最优的全网目标参数返回S005,以将预设卷积神经网络写入一组最优的全网目标参数后的一个网络作为待处理的当前网络。
S013,获得迭代训练完成的最优全网目标参数,并将其代入预设卷积神经网络,得到训练完成的SAR图像变化检测网络,以用于对待测SAR图像对进行变化检测。
关于上述各步骤的具体内容请参见前文相关部分,在此不做赘述。
为了说明本发明实施例所提供的基于多任务子网络分解的SAR变化检测网络训练方法的有效性,以下将本发明实施例方法与传统变化检测BP梯度下降训练方法所得神经网络的实验结果数据进行对比。其中评价指标有:
(1)错误检测数FP:将使用不同方法得到的变化检测结果和变化参考图相比较,变化参考图中属于未变化类但在仿真实验结果图中属于变化类的像素数量,称为错误检测数。
(2)漏检测数FN:将使用不同方法得到的变化检测结果和变化参考图相比较,变化检测参考图中属于变化类但在仿真实验结果图中属于未变化类的像素数量,称为漏检测数。
(3)衡量仿真实验结果图与变化参考图一致性的KC系数:
Figure BDA0003457377650000251
其中,PCC表示将像素正确分类的概率,PRE表示期望一致性比率。
其中,图6为本发明实施例用于仿真实验的第一组SAR图像和变化参考图;图7为本发明实施例用于仿真实验的第二组SAR图像和变化参考图。
两种训练方法的实验结果数据对比如下表1和表2。
表1第一组仿真实验的数据对比
Figure BDA0003457377650000252
表2第二组仿真实验的数据对比
Figure BDA0003457377650000253
可见,和传统训练方法相比,本发明实施例所提出的基于多任务子网络分解的SAR变化检测网络训练方法具有更好的训练效果。
第二方面,本发明实施例提出了一种针对SAR图像的变化检测方法,包括以下步骤:
获取待测SAR图像对。
将待测SAR图像对输入SAR图像变化检测网络,得到待测SAR图像对的变化检测结果。
其中,SAR图像变化检测网络基于第一方面提出的基于多任务子网络分解的SAR变化检测网络训练方法得到。
因此,本发明实施例针对同一地点不同时刻的未知SAR图像对,利用本发明实施例所提出的基于多任务子网络分解的SAR变化检测网络训练方法训练完成的SAR图像变化检测网络,能够获得较为准确的SAR图像变化检测结果。关于网络的具体细节请参见第一方面的相关内容,在此不做重复说明。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种基于多任务子网络分解的SAR变化检测网络训练方法,其特征在于,包括:
S1,获取SAR图像样本集,获取预设卷积神经网络并对待训练的目标参数进行初始化;
S2,利用所述SAR图像样本集,采用SGD随机梯度下降法对当前网络进行迭代训练,保留每次训练得到的全网目标参数;其中,若当前次训练满足第一结束条件时执行S5;否则在判定训练无效时执行S3;
S3,利用所述SGD随机梯度下降法迭代训练得到的多组全网目标参数,进行种群初始化得到父代种群;其中,每代种群含有的个体数量相同;每个个体对应一个针对SAR图像的变化检测网络,每个个体的染色体编码是按照对应的变化检测网络各层顺序将各层所对应的目标参数顺序排列得到的;
S4,选择一个辅任务配合主任务,基于种群遗传方式进行多任务优化的网络迭代训练,保留每次训练得到的全网目标参数;其中,若当前次训练满足第二结束条件,执行S5;若多次迭代训练后判定所有辅任务遍历完成,保留多任务演化得到的一组最优的全网目标参数,并返回S2;所述预设卷积神经网络依据层数被预先分解为多个子网络,每个子网络被设定为用于优化该子网络的目标参数的辅任务,全部子网络的集合被设定为用于优化全网络的目标参数的主任务;
S5,获得迭代训练完成的最优全网目标参数,并将其代入所述预设卷积神经网络,得到训练完成的SAR图像变化检测网络,以用于对待测SAR图像对进行变化检测。
2.根据权利要求1所述的基于多任务子网络分解的SAR变化检测网络训练方法,其特征在于,所述获取SAR图像样本集,包括:
获取多组SAR图像对,并分别进行预处理,得到多组样本SAR图像对;
生成每组样本SAR图像对的差异图;
针对每个差异图,利用阈值法确定该差异图中每个像素的类别标签;所述类别标签包括变化类和未变化类;
针对每个差异图,将该差异图中各像素依次作为预设大小的矩形滑窗的中心像素进行该差异图像素的滑动遍历;在滑动遍历过程中,若判定所述矩形滑窗内的差异图图像块满足预设条件,则将该差异图图像块、从对应的样本SAR图像对中依据该差异图图像块位置获得的两个样本SAR图像块共同构成一个样本;其中,所述预设条件为该差异图图像块中与其中心像素的类别标签相同的像素数,与该差异图图像块的像素总数之比大于预设比值;
由所有差异图得到的样本构成所述SAR图像样本集,并将所述SAR图像样本集划分为多个子训练集。
3.根据权利要求1所述的基于多任务子网络分解的SAR变化检测网络训练方法,其特征在于,所述获取预设卷积神经网络并对待训练的目标参数进行初始化,包括:
获取预设卷积神经网络;其中,所述预设卷积神经网络包括VGG16网络;
将所述预设卷积神经网络中各层的权重参数和偏置参数作为待训练的目标参数进行随机初始化。
4.根据权利要求2所述的基于多任务子网络分解的SAR变化检测网络训练方法,其特征在于,所述利用所述SAR图像样本集,采用SGD随机梯度下降法对当前网络进行迭代训练,包括:
利用一个未参与训练的子训练集,采用SGD随机梯度下降法训练已获取的当前网络,获得当前次训练得到的全网目标参数和训练增益;其中,第一次利用所述SGD随机梯度下降法训练时,当前网络为初始化后的预设卷积神经网络;
判断当前次训练是否满足所述第一结束条件;其中,所述第一结束条件为网络进行变化检测的误检率小于误检率阈值,或累计迭代次数达到第一预设迭代次数;
若所述当前次训练满足所述第一结束条件,将所述当前次训练得到的全网目标参数作为最优全网目标参数执行S5;
若所述当前次训练未满足所述第一结束条件,判断所述训练增益是否小于训练增益阈值;
若所述训练增益大于或等于所述训练增益阈值,返回所述利用一个未参与训练的子训练集,采用SGD随机梯度下降法训练已获取的当前网络的步骤;
若所述训练增益小于所述训练增益阈值,判定所述SGD随机梯度下降法训练无效,执行S3。
5.根据权利要求4所述的基于多任务子网络分解的SAR变化检测网络训练方法,其特征在于,所述利用所述SGD随机梯度下降法迭代训练得到的多组全网目标参数,进行种群初始化得到父代种群,包括:
获取利用所述SGD随机梯度下降法迭代训练得到的t组全网目标参数;其中,t表示利用所述SGD随机梯度下降法迭代训练的总次数,n表示每代种群含有的个体数量;t和n为大于0的自然数;
若n≤t,从所述t组全网目标参数中选择n组进行个体初始化,得到父代种群;
若n>t,选择所述t组全网目标参数,并利用预设初始化方法获取n-t组全网目标参数,共同进行个体初始化,得到父代种群。
6.根据权利要求5所述的基于多任务子网络分解的SAR变化检测网络训练方法,其特征在于,所述选择一个辅任务配合主任务,基于种群遗传方式进行多任务优化的网络迭代训练,包括:
从分解得到的多个辅任务中随机选择一个未参与过优化的辅任务作为目标辅任务;
将所述父代种群中每个个体分别在所述主任务和所述目标辅任务上进行评估;依据评估结果,将所述主任务上n/2个优秀个体的技能系数类别标定为主任务类别,剩余个体的技能系数类别标定为辅任务类别;
基于当前代的父代种群中个体的技能系数类别,利用个体的染色体交叉变异产生子代种群,并确定其中每个个体的技能系数类别;
将所述子代种群中的每个个体,依据自身的技能系数类别在对应任务上进行误检率评估;
判断当前次训练是否满足所述第二结束条件;其中,所述第二结束条件为当前次训练得到的所有误检率中至少存在一个误检率小于所述误检率阈值;
若所述当前次训练满足所述第二结束条件,将小于所述误检率阈值的一个最小误检率所对应的全网目标参数作为最优全网目标参数执行S5;
若所述当前次训练未满足所述第二结束条件,判断当前次训练是否达到第二预设迭代次数;
若所述当前次训练未达到所述第二预设迭代次数,从评估后的两代种群中,针对两任务均选取评估结果优秀的n/2个个体,合并得到下一代的父代种群,执行所述基于当前代的父代种群中个体的技能系数类别,利用个体的染色体交叉变异产生子代种群的步骤;
若所述当前次训练达到所述第二预设迭代次数,判断是否遍历完所有辅任务;
若否,返回所述从分解得到的多个辅任务中随机选择一个未参与过优化的辅任务作为目标辅任务的步骤;
若是,停止所述多任务优化的网络迭代训练,利用多任务演化得到的一组最优的全网目标参数返回S2,以将所述预设卷积神经网络写入所述一组最优的全网目标参数后的一个网络作为待处理的当前网络。
7.根据权利要求6所述的基于多任务子网络分解的SAR变化检测网络训练方法,其特征在于,所述将所述父代种群中每个个体分别在所述主任务和所述目标辅任务上进行评估,包括:
针对所述父代种群中的每个个体,将该个体依据主任务评估策略在所述主任务上进行评估,并依据辅任务评估策略在所述目标辅任务上进行评估;
其中,所述主任务评估策略包括将该个体对应的全网目标参数写入所述原始变化检测网络,基于所述SAR图像样本集,利用误检率进行网络评估;所述辅任务评估策略包括用对应子网络的目标参数,替代当前保留的最优全网目标参数中相应层的目标参数后,基于所述SAR图像样本集,利用误检率进行网络评估。
8.根据权利要求7所述的基于多任务子网络分解的SAR变化检测网络训练方法,其特征在于,所述基于当前代的父代种群中个体的技能系数类别,利用个体的染色体交叉变异产生子代种群,并确定其中每个个体的技能系数类别,包括:
产生随机数rand1和rand2,并获取参数rmp1和rmp2;其中,rand1、rand2、rmp1和rmp2介于[0,1]之间;
判断所述父代种群中,两个亲代染色体p1和p2的技能系数是否满足
Figure FDA0003457377640000061
或者rand1<rmp1;其中,
Figure FDA0003457377640000062
Figure FDA0003457377640000063
分别表示p1和p2的技能系数;
若是,p1和p2采用两点交叉方式共产生两个子代,并根据rand2和rmp2的大小比较情况,确定所述两个子代的技能系数类别;
若否,每个亲代染色体采用突变方式各自产生一个子代,且子代继承亲代的技能系数类别;
由得到的所有子代构成子代种群;其中,所述子代种群中技能系数类别属于所述主任务类别和所述辅任务类别的子代总数各占n/2。
9.根据权利要求8所述的基于多任务子网络分解的SAR变化检测网络训练方法,其特征在于,所述p1和p2采用两点交叉方式共产生两个子代,并根据rand2和rmp2的大小比较情况,确定所述两个子代的技能系数类别,包括:
若p1和p2的技能系数类别均为主任务类别,两个交叉点分别从p1和p2中随机选取;若p1和p2的技能系数类别至少包括一个辅任务类别,两个交叉点均从p1和p2中辅任务对应子网络的有效编码段内随机选取;
并且,针对p1和p2的技能系数类别的任一种情况,若rand2<rmp2,确定
Figure FDA0003457377640000064
若rand2≥rmp2,确定
Figure FDA0003457377640000065
其中,
Figure FDA0003457377640000066
表示所述两个子代中子代off1的技能系数,
Figure FDA0003457377640000071
表示所述两个子代中子代off2的技能系数。
10.一种针对SAR图像的变化检测方法,其特征在于,包括:
获取待测SAR图像对;
将所述待测SAR图像对输入SAR图像变化检测网络,得到所述待测SAR图像对的变化检测结果;其中,所述SAR图像变化检测网络基于权利要求1~9任一项所述的基于多任务子网络分解的SAR变化检测网络训练方法得到。
CN202210011083.9A 2022-01-05 2022-01-05 基于多任务子网络分解的sar变化检测网络训练方法 Active CN114549966B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210011083.9A CN114549966B (zh) 2022-01-05 2022-01-05 基于多任务子网络分解的sar变化检测网络训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210011083.9A CN114549966B (zh) 2022-01-05 2022-01-05 基于多任务子网络分解的sar变化检测网络训练方法

Publications (2)

Publication Number Publication Date
CN114549966A true CN114549966A (zh) 2022-05-27
CN114549966B CN114549966B (zh) 2024-10-15

Family

ID=81669413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210011083.9A Active CN114549966B (zh) 2022-01-05 2022-01-05 基于多任务子网络分解的sar变化检测网络训练方法

Country Status (1)

Country Link
CN (1) CN114549966B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112509017A (zh) * 2020-11-18 2021-03-16 西北工业大学 一种基于可学习差分算法的遥感影像变化检测方法
CN112734695A (zh) * 2020-12-23 2021-04-30 中国海洋大学 基于区域增强卷积神经网络的sar图像变化检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112509017A (zh) * 2020-11-18 2021-03-16 西北工业大学 一种基于可学习差分算法的遥感影像变化检测方法
CN112734695A (zh) * 2020-12-23 2021-04-30 中国海洋大学 基于区域增强卷积神经网络的sar图像变化检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAO LI等: "A multiobjective fuzzy clustering method for change detection in SAR images", 《APPLIED SOFT COMPUTING》, 1 September 2016 (2016-09-01) *
郭松林;王朝晖;: "神经网络梯度下降与粒子群组合的训练算法", 黑龙江科技大学学报, no. 04, 30 July 2020 (2020-07-30) *

Also Published As

Publication number Publication date
CN114549966B (zh) 2024-10-15

Similar Documents

Publication Publication Date Title
CN110532859B (zh) 基于深度进化剪枝卷积网的遥感图像目标检测方法
CN111583263B (zh) 一种基于联合动态图卷积的点云分割方法
CN108399428B (zh) 一种基于迹比准则的三元组损失函数设计方法
CN111191732B (zh) 一种基于全自动学习的目标检测方法
US11816183B2 (en) Methods and systems for mining minority-class data samples for training a neural network
CN112308961B (zh) 基于分层高斯混合模型的机器人快速鲁棒三维重建方法
CN113326731B (zh) 一种基于动量网络指导的跨域行人重识别方法
CN111542843A (zh) 利用协作生成器积极开发
CN111191718B (zh) 基于图注意力网络的小样本sar目标识别方法
CN101286229B (zh) 基于分层mrf的声呐图像自适应分割方法
CN108108854A (zh) 城市路网链路预测方法、系统及存储介质
CN101540047A (zh) 基于独立高斯混合模型的纹理图像分割方法
CN112464004A (zh) 一种多视角深度生成图像聚类方法
CN112905894B (zh) 一种基于增强图学习的协同过滤推荐方法
CN111652264B (zh) 基于最大均值差异的负迁移样本筛选方法
CN109658378B (zh) 基于土壤ct图像的孔隙辨识方法及系统
CN112489168A (zh) 一种图像数据集生成制作方法、装置、设备及存储介质
CN114036308A (zh) 基于图注意力神经网络的知识图谱表示方法
CN113344220A (zh) 一种联邦学习中基于局部模型梯度的用户筛选方法、系统、设备及存储介质
CN112836736B (zh) 一种基于深度自编码器构图的高光谱图像半监督分类方法
CN113239199B (zh) 一种基于多方数据集的信用分类方法
CN116596023A (zh) 一种基于距离编码的图卷积神经网络模型的训练方法
JP2018124990A (ja) モデル生成装置、評価装置、モデル生成方法、評価方法及びプログラム
CN114549966A (zh) 基于多任务子网络分解的sar变化检测网络训练方法
CN116611576A (zh) 碳排量预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Li Hao

Inventor after: Zheng Yu

Inventor after: Pan Ke

Inventor after: Gong Maoguo

Inventor after: Liu Jieyi

Inventor after: Jiang Xiangming

Inventor after: Tang Zedong

Inventor after: Zhang Mingyang

Inventor after: Wu Yue

Inventor before: Li Hao

Inventor before: Zheng Yu

Inventor before: Gong Maoguo

Inventor before: Liu Jieyi

Inventor before: Jiang Xiangming

Inventor before: Tang Zedong

Inventor before: Zhang Mingyang

Inventor before: Wu Yue

CB03 Change of inventor or designer information
GR01 Patent grant