CN116310863A

CN116310863A - 一种多尺度差分特征增强的遥感图像变化检测方法和装置

Info

Publication number: CN116310863A
Application number: CN202310131782.1A
Authority: CN
Inventors: 李皓; 刘晓勇; 李辉辉
Original assignee: Guangdong Polytechnic Normal University
Current assignee: Guangdong Polytechnic Normal University
Priority date: 2023-02-18
Filing date: 2023-02-18
Publication date: 2023-06-23

Abstract

本发明公开了一种多尺度差分特征增强的遥感图像变化检测方法和装置，包括：将双时相遥感图像导入至图像导入模块，并由初始化模块对遥感图像进行初始化；将初始化的遥感图像输入到特征提取模块，所述特征提取模块对导入的遥感图像进行特征提取，得到三组不同尺度的差分特征；将三组差分特征输入到多尺度差分特征增强模块中，输出三组经过增强的差分特征；构建多尺度差分特征融合模块，输入三组经过增强的特征，最后输出一个逐点卷积层映射成的变化检测结果图；该方法将卷积神经网络和transformer进行结合，提高在高分辨率遥感图像数据下进行变化检测的准确率。

Description

一种多尺度差分特征增强的遥感图像变化检测方法和装置

技术领域

本发明涉及图像处理和遥感的交叉技术领域，特别涉及一种多尺度差分特征增强的遥感图像变化检测方法和装置。

背景技术

遥感图像变化检测一直是遥感领域研究的热点问题之一，随着高分辨率光学传感器的发展，现在已经可以更加容易地获取到不同区域的高分辨率多时相遥感影像，但是基于高分辨率遥感图像的变化检测也带来了更多复杂的问题：1、高分辨率遥感图像携带更多的信息，加大了数据处理的难度；2、由于太阳光照强度不同，季节变化差异等情况，相同的物体可能会呈现出不同的颜色偏移；同时，在不同时间采集的图像也由于传感器的位姿，视角不同而导致相同物体在图像中发生位置偏移的情况。上述问题都会加大变化检测的难度，导致模型无法区分“真正的变化”和“伪变化”。从高分辨率遥感图像的特征中提取最具区分度的特征信息，减少伪变化，是遥感变化检测领域的重要问题。

近年来，基于卷积神经网络的方法开始在计算机视觉和遥感领域中流行起来。对于低分辨率的遥感图像卷积神经网络很容易提取出包含了丰富的语义信息的特征，即变化的对象和不变的对象，后续通过特征组合或者度量学习可以得到变化图；但是不适用于更加精细以及纹理特征更加复杂的高分辨率遥感图像。相比于卷积神经网络，transformer结构拥有全局建模能力，可以更好捕捉到全局信息，但存在参数量多，模型大的问题。

发明内容

本发明的目的在于克服现有技术中的上述缺陷，提供一种多尺度差分特征增强的遥感图像变化检测方法和装置，该方法将卷积神经网络和transformer结构进行结合，充分利用它们各自的优点，并设计了多尺度的模型结构，使高级差分特征参与低级差分特征的生成，增强不同尺度特征的信息交流，提高在高分辨率遥感图像数据下进行变化检测的准确率。

为实现上述目的，本发明提供了一种多尺度差分特征增强的遥感图像变化检测方法，包括以下步骤：

步骤S1：将双时相遥感图像导入至图像导入模块，所述图像导入模块对遥感图像进行数据增强操作；并由初始化模块对遥感图像进行初始化；

步骤S2：将初始化的遥感图像输入到特征提取模块，所述特征提取模块对导入的遥感图像进行特征提取，得到三组不同尺度的差分特征；

步骤S3：将三组差分特征输入到多尺度差分特征增强模块中，它们各自通过对应层的tokenizer映射为tokens，再输入transformer-encoder和transformer-decoder进行重新编解码，输出三组经过增强的差分特征；

步骤S4：构建多尺度差分特征融合模块，输入三组经过增强的特征，最后输出一个逐点卷积层映射成的变化检测结果图。

作为优选的，所述步骤S1中的初始化模块还包括损失函数，所述损失函数采用混合损失函数，即focal loss和dice loss的组合。

作为优选的，所述步骤S2中，导入双时相遥感图像T1，T2，构建特征提取模块，将图像T1，T2输入到共享权重的特征特征提取模块中得到两组分级的多尺度高维特征图F_i＝{T_iConv1，T_iConv2，T_iConv3，T_iConv4}，i＝1，2，并将F_i中的T_iConv2，T_iConv3，T_iConv4分别concatenate起来作为输入下阶段的三组特征

公式为：

所述特征提取模块，包括一个卷积核大小为7x7的conv层后面接上batchnormalization(BN)和ReLU，再通过maxpooling层和三个ResBlock；ResBlock的结构包括一个3x3的conv层，一个batch normalization(BN)层，经过ReLU激活后，再输入一个3x3的conv层和一个batch normalization(BN)层，最后与原始输入相加，经过ReLU激活输出；三个ResBlock输出的特征深度是64，128，256；

特征提取模块的输入是两幅大小为H*W*3的遥感图像T1、T2，输出是三组特征，分别是：

大小为/>

大小为/>

大小为

作为优选的，所述步骤S3中，构建多尺度差分特征增强模块，由三层tokenizer，transformer-encoder和transformer-decoder组成；

输入三组经过卷积提取的特征

δ＝2，3，4，通过tokenizer映射为tokens，再将tokens输入transformer-encoder和transformer-decoder进行重新编解码，输出三组经过增强的特征/>

公式为：

公式中，

分别表示tokenizer生成的tokens和经过transformer-encoder编码的tokens。

作为优选的，所述tokenizer的结构具体包括：

为分级输入高维特征图；

其中H为高度；W为宽度；C为通道；

为tokens，其中L和C分别为tokens的个数和tokens维的大小；Tokens的个数L是可设置的参数，这里设置为8；对高维特征/>

的每个像素进行Conv2d，即逐点卷积，卷积核大小为1*1，得到L组语义组合，然后利用softmax函数对语义组合的H，W维进行操作，计算出空间注意力图，通过注意力映射计算/>

中像素的加权平均和，得到一组tokens；

最后，将上一层的tokens做1D卷积并加入到该层上；在公式(2)中可看出，在特征

生成tokens的操作与/>

和/>

不同，并没有上一层tokens的加入；

对于输入

经过tokenizer输出/>

大小为8*512；

输入

经过tokenizer输出/>

大小为8*256；

输入

经过tokenizer输出/>

大小为8*128。

作为优选的，所述transformer-encoder的结构具体包括：该结构由多头自注意块(MSA)和多层感知器块(MLP)组成；在每个块之前应用层归一化(LN)；残差连接在每个块后应用；MLP包含两层具有高斯误差的线性单元(GELU)激活；

对于步骤S3中的公式(3)的transformer-encoder内部每一层的计算过程如下：

T0＝T_in+E_pos#(5)

T′1＝MSA(LN(T0))+T0#(6)

T1＝MLP(LN(T1))+T′1#(7)

T_out＝LN(T1)#(8)

在公式中，T_in表示从Tokenizer输出的tokens，E_pos表示一组可学习的位置嵌入(PE)，

他们相加得到T₀，表示tokens学到了位置信息；LN表示Layer-normalization；T_out表示transformer-encoder的输出；三组tokens输入和输出的大小不变。

作为优选的，所述transformer-decoder的结构具体包括：

将transformer-encoder的输出与特征图F_cate融合，利用tokens的高级语义信息细化特征图的像素阵列表示；公式如下：

Z′1＝MA(T_out，LN(Z0))+Z0#(10)

Z1＝MLP(LN(z′1))+Z′1#(11)

Z_out＝LN(Z1)#(12)

F_out＝σ(Z_out)#(13)

上式中T_out，T_{In_F}分别表示transformer-encoder的输出以及经过reshape成tokens的原始特征F_cate；σ表示反卷积和reshape操作，将tokens转换为特征图；在MA中，两部分输入来自于图像特征F_cate和tokens；

其他模块的实现与transformer-encoder的相同；最终，输出三组经过增强的特征

大小分别为/>

作为优选的，所述步骤S4中，所述多尺度差分特征融合模块，输入三组经过增强的特征，上采样融合多尺度特征，最后通过一个1*1卷积层映射成大小为H*W*2的变化检测结果图；

所述多尺度特征图转换为tokens经过transformer编解码后获得了更精细的变化特征图；将这些不同尺度的特征图融合就可以得到最终的变化图；每一个上采样模块主要包括了一个卷积核为3*3，步长为2的转置卷积层(TransposedConv)，一个batchnormalization，ReLU和一个卷积核为3*3，步长为1的转置卷积层(TransposedConv)；

输入多尺度增强特征图

他们的大小分别是/>

计算过程如下：

在公式中Conv^1x1表示卷积核为1x1的卷积层，σ_i，i＝2，3，4表示转置卷积层TransposedConv_i，i＝2，3，4，changemap表示最终输出的变化图，大小为H*W*2。

作为优选的，所述损失函数采用混合损失函数，即focal loss和diceloss的组合，公式定义为

L＝FL(P_t)+L_dice#(15)

FL(P_t)＝-α_t(1-P_t)^γlog(P_t)#(16)

其中，FL(P_t)表示focal loss，P_t表示不同类别的分类概率，这里表示变化的概率和不变化的概率，α_t和γ设为定值，设为0.25和2；

L_dice表示dice loss；其中Y和Y分别表示训练图像对的预测概率和ground truth标签。

本发明还提供了一种多尺度差分特征增强的遥感图像变化检测装置，用于执行上述所述的一种多尺度差分特征增强的遥感图像变化检测方法；还包括图像导入模块、初始化模块、特征提取模块、多尺度差分特征增强模块和多尺度差分特征融合模块；各个模块的功能分别如下：

图像导入模块，用于对双时相遥感图像的导入，并进行常见数据增强操作；

初始化模块，用于初始化模块参数，学习率，损失函数参数，batch的大小；

特征提取模块，用于提取双时相遥感图像的多尺度特征；

多尺度差分特征增强模块，用于增强特征中最具有判别性的特征，包括了tokenizer、transformer-encoder和transformer-decoder三个部分，分别用于将特征转换为token空间、对token进行编码和解码还原回特征的像素空间；

多尺度差分特征融合模块，用于把经过增强的多尺度特征，进行逐层上采样融合，生成变化检测结果图。

与现有技术相比，本发明的有益效果在于：

1、本发明提供的一种多尺度差分特征增强的遥感图像变化检测方法：首先，进行双时相遥感图像的导入，对导入的遥感图像进行特征提取，得到三组不同尺度的差分特征；其次，将三组差分特征输入到多尺度差分特征增强模块中，它们各自通过对应层的tokenizer映射为tokens，再输入transformer-encoder和transformer-decoder进行重新编解码，输出三组经过增强的差分特征；再次，构建多尺度差分特征融合模块，输入三组经过增强的特征，上采样融合多尺度特征；最后，通过一个逐点卷积层映射成的变化检测结果图；对于训练模型时用到的损失函数，考虑到遥感图像变化检测任务的样本不平衡问题，采用混合损失函数，即focal loss和dice loss的组合。基于此，该模型在对于纹理特征更加复杂的高分辨率遥感图像下，仍然能区分“真正的变化”和“伪变化”。

2、本发明多尺度差分特征增强的遥感图像变化检测方法中，设计的多尺度差分特征增强模块由三层tokenizer，transformer-encoder和transformer-decoder组成。Tokenizer可以将特征抽象成token，将变化信息映射到token空间，方便后续使用transformer进行全局建模；transformer-encoder和transformer-decoder可以利用多头自注意力机制对token进行全局建模，有利于挖掘出token中关键的变化信息。

3、本发明多尺度差分特征增强的遥感图像变化检测方法中，多尺度的特征编解码结构，使高级差分特征参与低级差分特征的生成，增强不同尺度特征的信息交流，融合高级特征高语义信息与低级特征高空间信息，改进变化检测结果图中目标的边界完整性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的一种多尺度差分特征增强的遥感图像变化检测方法的流程图；

图2是本发明提供的特征提取模块的结构示意图；

图3是本发明提供的tokenizer的结构示意图；

图4是本发明提供的transformer-encoder和transformer-decoder的结构示意图；

图5是本发明提供的多尺度差分特征融合模块的结构示意图。

具体实施方式

下面将结合本发明本实施方式中的附图，对本发明本实施方式中的技术方案进行清楚、完整地描述，显然，所描述的本实施方式是本发明的一种实施方式，而不是全部的本实施方式。基于本发明中的本实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他本实施方式，都属于本发明保护的范围。

实施例一

请参考图1至图5，一种多尺度差分特征增强的遥感图像变化检测方法，该方法将卷积神经网络和transformer进行结合，充分利用它们各自的优点，提高在高分辨率遥感图像数据下进行变化检测的准确率，如图1所示，该方法包括以下步骤：

具体的，导入双时相遥感图像T1，T2；构建特征提取模块，将图像T1，T2输入到共享权重的特征特征提取模块中得到两组分级的多尺度高维特征图F_i＝{T_iConv1，T_iConv2，T_iConv3，T_iConv4}，i＝1，2，并将F_i中的T₍Conv2，T₍Conv3，T_iConv4分别concatenate起来作为输入下阶段的三组特征

公式为：

参照图2，特征提取模块如图2所示，包括一个卷积核大小为7x7的conv层后面接上batch normalization(BN)和ReLU，再通过maxpooling层和三个ResBlock。ResBlock的结构包括一个3x3的conv层，一个batch normalization(BN)层，经过ReLU激活后，再输入一个3x3的conv层和一个batch normalization(BN)层，最后与原始输入相加，经过ReLU激活输出。三个ResBlock输出的特征深度是64，128，256。

大小为/>

大小为/>

大小为/>

具体的，构建多尺度差分特征增强模块，由三层tokenizer，transformer-encoder和transformer-decoder组成，输入步骤S2中三组经过卷积提取的特征

通过tokenizer映射为tokens，再将tokens输入transformer-encoder和transformer-decoder进行重新编解码，输出三组经过增强的特征

公式为：

公式中，

参照图3，更具体地说明公式(2)中tokenizer的结构。

，δ＝2，3，4为分级输入高维特征图，其中H为高度；W为宽度；C为通道；

为tokens，其中L和C分别为tokens的个数和tokens维的大小。Tokens的个数L是可设置的参数，这里设置为8。对高维特征/>

中像素的加权平均和，得到一组tokens。最后，将上一层的tokens做1D卷积并加入到该层上。需要注意的是，在公式(2)中可看出，在特征/>

生成tokens的操作与/>

和/>

不同，并没有上一层tokens的加入。对于输入/>

经过tokenizer输出/>

大小为8*512；输入/>

经过tokenizer输出

大小为8*256；输入/>

经过tokenizer输出/>

大小、为8*128；

参照图4，为transformer-encoder和transformer-decoder的结构。

如图4(a)所示，为transformer-encoder结构，该结构由多头自注意(MSA)块和多层感知器(MLP)块组成。在每个块之前应用层归一化(LN)。残差连接在每个块后应用。MLP包含两层具有高斯误差的线性单元(GELU)激活。对于步骤S3中的公式(3)的transformer-encoder内部每一层的计算过程如下：

T0＝T_in+E_pos#(5)

T′1＝MSA(LN(T0))+T0#(6)

T1＝MLP(LN(T1))+T′1#(7)

T_out＝LN(T1)#(8)

他们相加得到T₀，表示tokens学到了位置信息。LN表示Layer-normalization。T_out表示transformer-encoder的输出。三组tokens输入和输出的大小不变。

如图4(b)所示，为transformer-decoder结构，将transformer-encoder的输出与特征图F_cate融合，利用tokens的高级语义信息细化特征图的像素阵列表示。公式如下：

Z′1＝MA(T_out，LN(Z0))+Z0#(10)

Z1＝MLP(LN(z′1))+Z′1#(11)

Z_out＝LN(Z1)#(12)

F_out＝σ(Z_out)#(13)

上式中T_out，T_{In_F}分别表示transformer-encoder的输出以及经过reshape成tokens的原始特征F_cate。σ表示反卷积和reshape操作，将tokens转换为特征图。在MA中，两部分输入来自于图像特征F_cate和tokens。其他模块的实现与transformer-encoder的相同。最终，输出三组经过增强的特征

大小分别为/>

步骤S4：构建多尺度差分特征融合模块，输入三组经过增强的特征，上采样融合多尺度特征，最后通过一个1*1卷积层映射成大小为H*W*2的变化检测结果图。

参照图5，为多尺度差分特征融合模块。原有的多尺度特征图转换为tokens经过transformer编解码后获得了更精细的变化特征图。现在只需要将这些不同尺度的特征图融合就可以得到最终的变化图。每一个上采样模块主要包括了一个卷积核为3*3，步长为2的转置卷积层(TransposedConv)，一个batch normalization，ReLU和一个卷积核为3*3，步长为1的转置卷积层(TransposedConv)。整体的特征融合模块如图所示，输入步骤S3中的多尺度增强特征图

他们的大小分别是/>

计算过程如下：

所述步骤S1中的初始化模块还包括损失函数，所述损失函数采用混合损失函数，即focal loss和dice loss的组合。

在定义训练模型时用到的损失函数时，需要考虑到遥感图像变化检测任务中，不变像素的数量往往远远大于变化像素的数量。为了减弱样本不平衡的影响，这里采用混合损失函数，即focal loss和dice loss的组合，公式定义为：

L＝FL(P_t)+L_dice#(15)

FL(P_t)＝-α_t(1-P_t)γlog(P_t)#(16)

其中，FL(P_t)表示focal loss，P_t表示不同类别的分类概率，这里表示变化的概率和不变化的概率，α_t和γ设为定值，设为0.25和2。L_dice表示dice loss。其中Y和Y分别表示训练图像对的预测概率和ground truth标签。

实施例二

本实施例公开了一种多尺度差分特征增强的遥感图像变化检测装置，用于执行实施例一所述的一种多尺度差分特征增强的遥感图像变化检测方法；还包括图像导入模块、初始化模块、特征提取模块、多尺度差分特征增强模块和多尺度差分特征融合模块；各个模块的功能分别如下：

图像导入模块，用于对双时相遥感图像的导入，并进行常见数据增强操作；如水平和垂直翻转、旋转和高斯模糊；

特征提取模块，用于提取双时相遥感图像的多尺度特征；

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种多尺度差分特征增强的遥感图像变化检测方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种多尺度差分特征增强的遥感图像变化检测方法，其特征在于：所述步骤S1中的初始化模块还包括损失函数，所述损失函数采用混合损失函数，即focal loss和dice loss的组合。

3.根据权利要求1所述的一种多尺度差分特征增强的遥感图像变化检测方法，其特征在于：所述步骤S2中，导入双时相遥感图像T1，T2，构建特征提取模块，将图像T1，T2输入到共享权重的特征特征提取模块中得到两组分级的多尺度高维特征图F_i＝{T_iConv1，T_iConv2，T_iConv3，T_iConv4}，i＝1，2，并将F_i中的T_iConv2，T_iConv3，T_iConv4分别concatenate起来作为输入下阶段的三组特征

公式为：

大小为/>

大小为/>

大小为/>

4.根据权利要求3所述的一种多尺度差分特征增强的遥感图像变化检测方法，其特征在于：所述步骤S3中，构建多尺度差分特征增强模块，由三层tokenizer，transformer-encoder和transformer-decoder组成；

输入三组经过卷积提取的特征

通过tokenizer映射为tokens，再将tokens输入transformer-encoder和transformer-decoder进行重新编解码，输出三组经过增强的特征/>

公式为：

公式中，

5.根据权利要求4所述的一种多尺度差分特征增强的遥感图像变化检测方法，其特征在于：所述tokenizer的结构具体包括：

为分级输入高维特征图；

其中H为高度；W为宽度；C为通道；

中像素的加权平均和，得到一组tokens；

生成tokens的操作与/>

和/>

不同，并没有上一层tokens的加入；

对于输入

经过tokenizer输出/>

大小为8*512；

输入

经过tokenizer输出/>

大小为8*256；

输入

经过tokenizer输出/>

大小为8*128。

6.根据权利要求5所述的一种多尺度差分特征增强的遥感图像变化检测方法，其特征在于：所述transformer-encoder的结构具体包括：该结构由多头自注意块(MSA)和多层感知器块(MLP)组成；在每个块之前应用层归一化(LN)；残差连接在每个块后应用；MLP包含两层具有高斯误差的线性单元(GELU)激活；

T0＝T_in+E_pos#(5)

T′₁＝MSA(LN(T0))+T0#(6)

T1＝MLP(LN(T1))+T′1#(7)

T_out＝LN(T1)#(8)