CN115601660A

CN115601660A - 基于神经网络结构搜索的遥感影像变化检测方法

Info

Publication number: CN115601660A
Application number: CN202211316028.7A
Authority: CN
Inventors: 万全; 盛森; 魏汝兰; 庞亚菲; 王洪飞; 梁雄师; 吉绪发; 邓赟
Original assignee: South Digital Technology Co ltd
Current assignee: South Digital Technology Co ltd
Priority date: 2022-10-26
Filing date: 2022-10-26
Publication date: 2023-01-13

Abstract

本发明涉及基于神经网络结构搜索的遥感影像变化检测方法，属于遥感解译技术领域。传统方法在变化检测模块的设计上过于依赖人工经验，且设计的模块深度与复杂度较低，无法提取高质量变化特征。本发明针对遥感影像变化检测任务设计了专用的搜索空间，利用结构搜索完成变化特征提取模块的自动设计。搜索空间有四条包含六个节点的链式路径，每两个节点之间有五种可采取的操作，这样的结构增加了模块结构的深度与复杂度，能够提取更加高质量的变化特征。本发明所提方法能够有效地提取前后影像图的变化特征，提升变化检测的模型的判别能力，具有重要的理论和实际应用价值。

Description

基于神经网络结构搜索的遥感影像变化检测方法

技术领域

本发明设计基于神经网络结构搜索的遥感影像变化检测方法，属于遥感解译技术领域。

背景技术

变化检测是遥感影像领域的一项重要技术，在土地利用、城市设计、资源勘探、农业调查、灾害评估等方面有着广泛的应用。传统变化检测方法主要有三个发展阶段。20世纪80年代最早提出的基于统计的直接比较法、图像变换类方法、分类后比较方法等，这类方法以单像素为检测单位，通过对像素的逐一比较获取变化特征。20世纪90年代以机器学习为代表的决策树、随机森林、支持向量机等方法被引入到遥感影像处理中，显著提高了变化检测的性能。进入21世纪，变化检测的基本检测单位由像素上升到对象，对象级变化检测方法有效的结合了光谱信息和空间信息，提升了检测结果的确定性。上述传统方法取得了可观的效果，但其建模过程自动化低、数据处理能力和泛化能力较弱。

基于深度学习的遥感变化检测方法自动化过程高、大数据可执行能力强并且拥有较高的普适性。目前主流的遥感变化检测模型都采取端到端的结构，编码器提取前后时相的变化特征特，然后经过解码器得到输出。编码器一般由三部分组成，图像特征提取模块、变化特征提取模块及特征融合模块在变化检测任务特有的变化特征提取模块，设计者一般只常采取前后时相对应尺度特征相加然后衔接卷积等基础操作，这样的设计无论是深度还是复杂度都比较低，提取变化特征的能力有限。为了获得更高质量的变化特征，本发明在变化特征提取模块进行了研究，提出基于神经网络结构搜索的遥感影像变化检测方法。

发明内容

本发明提供了基于神经网络结构搜索的遥感影像变化检测方法，用于缓解变化特征提取质量较低且模块设计过于依赖人工经验的问题，在提升模型变化特征的提取能力和判别能力的同时，缩减模型设计中人力的投入。

本发明的技术方案是：基于神经网络结构搜索的遥感影像变化检测方法，所述方法包括如下步骤：

Step1、构造遥感影像变化检测模型整体框架：该框架包括图像特征提取模块、变化特征提取、变化特征融合模块及分类器；

Step2、定义变化特征提取模块搜索空间，构造混合模型：搜索空间的类型为链式结构，有n1条路径，每条路径n2个节点，每两个节点间可采取的操作有n3种，节点之间的操作分别赋予不同的的结构权重，其中n1的取值为图像特征提取模块中提取的特征个数；

Step3、在现有的数据集上进行结构搜索，对现有的数据集进行划分，分别用于结构权重α和模型权重w的训练，得到若干个不同的混合模型，选择搜索过程中在验证集上F1值最大的结构作为独立模型；

Step4、重复执行Step3，得到若干个独立模型，然后将独立模型代入到遥感影像变化检测模型整体框架中，在变化检测任务上进行评估，在现有的数据集上，对搜索阶段得到的若干个独立模型进行短时间评估，得到最优的独立模型；

Step5、将最优的独立模型代入到遥感影像变化检测模型整体框架中，实现遥感影像变化检测。

进一步的，所述步骤Step1的具体步骤为：

Step1.1、图像特征提取模块用于提取不同尺度的图像特征；

Step1.2、变化特征提取模块是基于神经网络结构搜索构造，该模块用于对两幅图像同一尺度的特征进行变化特征提取，得到不同尺度的变化特征Di，i的取值为n1；

Step1.3、特征融合模块：输入变化特征Di，经过双向金字塔网络BiFPN得到融合特征Pi，BiFPN包含的由下至上和由上至下的双向融合路径，使语义信息和感受野信息在不同尺度间流动；

Step1.4、分类器用于将Pi进行拼接，送入由全连接网络组成的分类器，得到输出图像。

进一步的，Step1.1的具体实现方式如下；

Step1.1.1、基于残差网络ResNet50的多尺度图像特征：输入两幅图像，残差网络ResNet50提取四组不同尺度的图像特征，具体由ResNet50的Layer2、Layer3、Layer4、Layer5得到第一幅图像特征{C1i|(i＝1,2,3,4)}，第二幅图像特征{C2i|(i＝1,2,3,4)}，1、2、3、4分别代表原始图像大小的1/4、1/8、1/16和1/32；

Step1.1.2、基于空洞卷积池化金字塔ASPP的图像特征：输入1/32原始图像大小的C14和C24特征，利用空洞卷积将其尺寸上采样到原始图像1/16大小，从而在保持感受野的情况下提升语义信息。

进一步的，步骤Step2的具体实现方式如下；

Step2.1、链式路径：搜索空间包含四条搜索路径{Li|(i＝1,2,3,4)}，分别处理特征提取模块提取的n1组同尺度的图像特征，得到n1个不同尺度的变化特征，即n1＝4；

Step2.2、节点数量：每条路径设置节点数量为6，同时保持模块的深度与复杂度，节点分为两组，每条路径的1号节点定义为起始节点，2-6号节点定义为其他节点，起始节点的输入为当前路径的两个图像特征，其他节点的输入为当前路径的两个图像特征和前序节点的输出；

Step2.3、可采取操作：对于起始节点，可采取的操作有5种，包括add1、sub1、abs1、cat、g_cat，其中add1表示将两个图像特征相加，然后做卷积，sub1表示将两个图像特征相减，然后做卷积，abs1表示将两个图像特征相减取绝对值，然后做卷积，cat表示将两个图像特征拼接，然后做卷积，g_cat表示将两个图像特征在对应通道拼接，然后做分组卷积；对于其他节点，可采取的操作也是5种，包括add2、sub2、abs2、cat、g_cat，其中add2表示将两个图像特征分别与前序节点的输出相加，然后对应通道拼接并进行分组卷积，sub2表示将两个图像特征分别与前序节点的输出相减，然后对应通道拼接并进行分组卷积，abs2表示将两个图像特征分别与前序节点的输出相减取绝对值，然后对应通道拼接并进行分组卷积，cat表示将两个图像特征和前序节点的输出拼接，然后做卷积，g_cat表示将两个图像特征和前序节点的输出在对应通道拼接，然后做分组卷积；因此节点间可采取的操作一共包含的8种，即add1、sub1、abs1、add2、sub2、abs2、cat、g_cat；

Step2.4、混合模型构造：对每两个节点之间的五个操作分别乘以不同的结构权重

i代表节点，五个权重和为1，构造混合模型。

进一步的，步骤Step3的具体步骤为：

Step3.1、训练集划分：将CDD训练集划分为train1和train2，分别用于结构权重α和模型权重w训练；

Step3.2、结构权重优化：固定模型权重w，在train1上训练混合模型，得到使损失最小的结构权重

优化算法为Adam，学习率为3e-3；

Step3.3、模型权重优化：固定结构权重

在train2上训练混合模型，得到使损失最小的模型权重w，优化算法为随机梯度下降SGD，初始学习率为0.025；

Step3.4、独立模型确定：结构搜索持续若干个epoch，每个epoch结束后，根据

中最大的值确定独立模型结构，并在CDD验证集上对该独立模型评估，F1值最高的模型即为本次结构搜索得到的独立模型。

进一步的，Step3中F1值的计算方式如下；

设TP表示预测正确的正样本数，FP表示预测错误的正样本数，TN表示预测正确的负样本数，FN表示预测错误的负样本数，评价指标计算方式如下：

进一步的，步骤Step4中在CDD数据集上，对搜索阶段得到的独立模型分别进行35个epoch训练并评估其F1值，F1值最高的为最优独立模型，然后对最优独立模型进行100epoch训练并评估其F1值，具体实现方式方式如下；

Step4.1、独立模型评估：参数设置如下，优化算法选择随机梯度下降SGD，学习率设置为0.05，对每个独立模型进行35个epoch的训练，每5个epoch在CDD验证集上评估一次，选择F1值最大的独立模型作为最终模型；

Step4.2、最终模型评估：参数设置如下，优化算法选择随机梯度下降SGD，学习率设置为0.05，训练时间100epoch，每5个epoch在验证集评估一次，最后选择F1值最高的模型在CDD测试集验证结果。

本发明的有益效果是：

针对遥感影像变化特征提取质量较低和模型设计过于依赖人工经验的问题，本发明提出了基于神经网络结构搜索的遥感影像变化检测方法，利用基于梯度下降的神经网络结构搜索方法实现变化特征提取模块的自动设计，节省了设计模型时人工的投入；同时，本发明针对变化检测任务设计了专用的搜索空间，提升了变化特征提取模块提取变化特征的能力，对遥感影像变化检测任务具有一定的理论意义和实际应用价值。

附图说明

图1为本发明中基于神经网络结构搜索的遥感影像变化检测模型整体框架图；

图2为本发明提出搜索空间链式结构图；

图3为本发明搜索到的待选结构训练35个epoch时的F1值结果；

图4为本发明搜索到最优变化特征提取模块结构拓扑图。

具体实施方式

下面结合附图对本发明的技术方案作进一步的描述。

如图1-4所示，基于神经网络结构搜索的遥感影像变化检测方法，所述方法包括：

Step1、构造遥感影像变化检测模型整体框架：该框架由图像特征提取模块、变化特征提取、变化特征融合模块及分类器，如图1所示；

作为本发明的优选方案，所述步骤Step1的具体步骤如下：

Step1.1、图像特征提取模块：为了减少提取特征时人工的投入，本发明设计了图像特征提取模块自动获得图像特征，根据模块中不同深度的网络提取各个尺度的图像特征，浅层图像特征具有丰富的语义信息，高层网络具有更大的感受野。

作为本发明的优选方案，所述步骤Step1.1的具体步骤如下：

Step1.1.1、基于残差网络ResNet50的多尺度图像特征：输入两幅图像，残差网络ResNet50提取四组不同尺度的图像特征，具体由ResNet50的Layer2、Layer3、Layer4、Layer5得到第一幅图像特征{C1i|(i＝1,2,3,4)},第二幅图像特征{C2i|(i＝1,2,3,4)}，1、2、3、4分别代表原始图像大小的1/4、1/8、1/16和1/32；

Step1.2、变化特征提取模块：该模块基于神经网络结构搜索构造，能够跳出人工设计网络时过多的经验依赖，该模块用于对第一幅图像特征C11、C12、C13以及上采样后的C14和第二幅图像特征C21、C22、C23以及上采样后的C24进行变化特征提取，得到{Di|i＝1,2,3,4}。

Step1.3、特征融合模块：输入变化特征{Di|i＝1,2,3,4}，经过双向金字塔网络BiFPN得到融合特征{Pi|i＝1,2,3,4}，BiFPN包含的由下至上和由上至下的双向融合路径，使语义信息和感受野信息在不同尺度间流动。

Step1.4、分类器：将Pi进行拼接，送入由全连接网络组成的分类器，得到输出图像。

Step2、定义变化特征提取模块搜索空间，构造混合模型：该空间类型为链式结构，有4条路径，每条路径6个节点，节点间可采取的操作有8种；

作为本发明的优选方案，所述步骤Step2的具体步骤如下：

Step2.1、链式路径：如图2所示，搜索空间包含四条搜索路径{Li|(i＝1,2,3,4)}，分别处理四组同尺度的图像特征C11、C21，C12、C22，C13、C23，上采样后的C14、C24，得到4个不同尺度的变化特征D1，D2，D3，D4。

Step2.2、节点数量：每条路径设置节点数量为6，同时保持模块的深度与复杂度，节点分为两组，每条路径的1号节点定义为起始节点，2-6号节点定义为其他节点，起始节点的输入为当前路径的两个图像特征，其他节点的输入为当前路径的两个图像特征和前序节点的输出。

Step2.3、可采取操作：对于起始节点，可采取的操作有5种，add1(将两个图像特征相加，然后做卷积)、sub1(将两个图像特征相减，然后做卷积)、abs1(将两个图像特征相减取绝对值，然后做卷积)、cat(将两个图像特征拼接，然后做卷积)、g_cat(将两个图像特征在对应通道拼接，然后做分组卷积)，对于其他节点，可采取的操作也是5种，add2(将两个图像特征分别与前序节点的输出相加，然后对应通道拼接并进行分组卷积)、sub2(将两个图像特征分别与前序节点的输出相减，然后对应通道拼接并进行分组卷积)、abs2(将两个图像特征分别与前序节点的输出相减取绝对值，然后对应通道拼接并进行分组卷积)、cat(将两个图像特征和前序节点的输出拼接，然后做卷积)、g_cat(将两个图像特征和前序节点的输出在对应通道拼接，然后做分组卷积)，因此节点间可采取的操作一共包含的8种，add1、sub1、abs1、add2、sub2、abs2、cat、g_cat。

(i代表节点，五个权重和为1)，构造混合模型。

Step3、在CDD数据集上进行结构搜索，从混合模型中得到表现最好的独立模型：将CDD训练集划分为train1和train2，对模型进行30个epoch的训练，每个epoch先在train1上训练，优化结构权重α，然后在train2上训练，优化模型权重w，每个epoch结束后在CDD验证集上评估，根据评估F1值最大的结构权重α确定独立模型结构。

作为本发明的优选方案，所述步骤Step3的具体步骤如下：

Step3.1、训练集划分：CDD数据集训练集大小为10000，将其随机平均分成大小为5000的train1和trian2，分别用于结构权重α和模型权重w训练。

Step3.2、结构权重训练：固定模型权重w，在train1上训练混合模型，得到使损失最小的结构权重

优化算法为Adam，学习率为3e-3，beats范围(0.9，0.999)，weight_decay为1e-3。

Step3.3、模型权重训练：固定结构权重

在train2上训练混合模型，得到使损失最小的模型权重w，优化算法为随机梯度下降SGD，初始学习率为0.025，weight_decay、momentum分别为1e-3和0.9。

Step3.4、独立模型确定：结构搜索持续30个epoch，每个epoch结束后，根据

中最大的值确定独立模型结构，并在CDD验证集上对该模型评估，30个epoch中评估F1值最高的模型即为本次结构搜索得到的独立模型。

模型训练时结构权重α均为初始化得到，为了减少初始化对结构搜索的影响，可以将step3重复多次(本次实施例设置5次)，得到多个独立模型。为保证结果的公平性，所有实验基于均Pytorch框架实现，GPU选择显存大小为32G的V100。实验的主要评价指标为F1、Recall和Precision，设TP表示预测正确的正样本数，FP表示预测错误的正样本数，TN表示预测正确的负样本数，FN表示预测错误的负样本数，三个评价指标计算方式如下：

表1显示了本发明五次结构搜索得到的独立模型的F1值结果。

表1：本发明方法五次结构搜索得到的独立模型的F1值

独立模型	第一次	第二次	第三次	第四次	第五次
						F1值(％)	71.9	68.53	67.64	70.11	70.68

Step4、在变化检测任务上进行结构评估(即将独立模型代入遥感影像变化检测模型整体框架中进行的评估)：在CDD数据集上，对搜索阶段得到的独立模型分别进行35个epoch训练并评估其F1值，F1值最高的为最优独立模型，然后对最优独立模型进行100epoch训练并评估其F1值。

作为本发明的优选方案，所述步骤Step4的具体步骤如下：

Step4.1、独立模型评估：参数设置如下，优化算法选择随机梯度下降SGD，学习率设置为0.05，weight_decay为1e-3，momentum为0.9，对每个独立模型进行35个epoch的训练，每5个epoch在CDD验证集上评估一次，选择F1值最大的独立模型作为最终模型，五个独立模型评估结果如图3所示，最高的F1值为93.86％，对应的结构如图4所示。

Step4.2、最终模型评估：参数设置如下，优化算法选择随机梯度下降SGD，学习率设置为0.05，weight_decay为1e-3，momentum为0.9，训练时间100epoch，每5个epoch在验证集评估一次，最后选择F1值最高的模型在CDD测试集验证结果，表2显示了本发明方法与其他方法在CDD数据集的测试结果。

表2：本发明方法与其他方法在CDD测试集上的F1值对比

相较于其他方法，本发明方法在三个评价指标上均取得了第一的成绩，F1值、Recall、Precision至少提升了3.13％、2.22％和2.45％。

Step5、为了说明本发明的通用性，进一步进行结构迁移实验，我们选择的数据集是LEVIR-CD，该数据集包含637张分辨率为1024*1024的影像对，将数据集切分为256*256大小，并按比例7:1:2随机划分为训练集(7120)、验证集(1024)和测试集(2048)，训练参数设置如下，优化算法选择随机梯度下降SGD，学习率设置为0.025，weight_decay为1e-3，momentum为0.9，训练时间100epoch，每5个epoch在验证集评估一次，最后选择F1值最高的模型在LEVIR-CD测试集验证结果，表3显示了本发明方法与其他方法在LEVIR-CD数据集的测试结果。

表3：本发明方法与其他方法在LEVIR-CD测试集上的F1值对比

相较于其他方法，本发明方法取得了最高的F1值，第二高的Recall和第三高的Precision。

上面结合附图对本发明的具体实施方式作了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。