CN112288690B

CN112288690B - 一种融合多尺度多层级特征的卫星影像密集匹配方法

Info

Publication number: CN112288690B
Application number: CN202011094084.1A
Authority: CN
Inventors: 张永军; 郑志; 万一; 鄢小虎; 刘欣怡
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2020-10-14
Filing date: 2020-10-14
Publication date: 2023-08-18
Anticipated expiration: 2040-10-14
Also published as: CN112288690A

Abstract

本发明公开了一种融合多尺度多层级特征的卫星影像密集匹配方法，该方法划分为四个组成部分，分别为特征提取、代价体构建、代价聚合和视差回归。网络的特征提取部分利用残差模块构建了多尺度特征提取模块和多层级特征融合模块，前者用于多尺度影像信息挖掘，后者用于融合多层次特征。利用多尺度特征提取模块和多层级特征融合模块，网络将实现对影像信息的有效提取。在给定视差范围的条件下，代价体构建部分将提取的左、右影像特征构造成一个四维的代价聚合体。代价聚合部分利用本发明提出的代价聚合模块对代价聚合体进行三维卷积变换，以实现匹配代价聚合。视差回归部分对聚合后的匹配代价依次进行维度变换、上采样和回归分析，获取最终视差图。

Description

一种融合多尺度多层级特征的卫星影像密集匹配方法

技术领域

本发明属于遥感影像处理方法，具体涉及一种融合多尺度多层级特征的卫星影像密集匹配网络。

技术背景

利用卫星影像生成数字表面模型的核心过程为卫星影像密集匹配。传统处理流程中，该过程一般被分为四个步骤：代价计算，代价积聚，视差优化以及视差精化。这种分步骤处理的方式会造成处理误差的逐步积累，尽管处理中会对得到的视差图进行精化处理，但最终生成的视差图的精度仍旧较低。此外，传统方法高度依赖于人为设计的特征提取器，这种特征提取器在弱纹理、重复纹理等地物特征不够明显区域极易产生误匹配。上述两个因素是导致传统卫星影像密集匹配精度较低、特殊区域误匹配严重的主要原因。近年来，深度学习技术的快速发展，很大程度上解决了传统方法的弊端、推动了影像密集匹配精度的提升。首先，基于卷积神经网络的影像密集匹配技术采取端到端的处理方式，将特征提取、代价体构建、代价聚合和视差回归等流程纳入到统一的网络中进行处理，避免了处理过程中的误差积累；此外，这类方法无需设计复杂的人工特征，而是通过数据驱动的方式学习样本中的特征范式，因而对弱纹理、重复纹理等区域有更强的抵抗性，可以显著降低匹配困难区域的误匹配率。然而，由于当前基于深度学习的密集匹配方法在进行特征提取时仅使用了多尺度特征或多层级特征，对特征信息的挖掘程度不够，匹配精度仍有待提升。在该背景下，本发明提出一种融合多尺度多层级特征的卫星影像密集匹配方法，旨在通过融合影像间的多尺度及多层级特征，实现更高精度的卫星影像密集匹配。

发明内容

本发明提出一种融合多尺度多层级特征的卫星影像密集匹配方法，用以提高卫星影像密集匹配的精度、降低误匹配率。

本发明所使用的技术方案是：一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于，包括以下步骤：

步骤1：将能够构成立体像对的两景卫星影像通过几何精校正和核线纠正得到处理后的左、右卫星影像；利用同一地理范围、相近时间获得的激光雷达点云(LiDAR)或其他辅助高程数据生成数字表面模型(DSM)、并转化为以左卫星影像为基准的视差图；通过左、右卫星影像，视差图构建训练集。其中，左、右卫星影像用于预测匹配视差图，训练集给定的视差图将作为真值数据，用于算法精度验证。

步骤2：定义多尺度特征提取模块、多层级特征融合模块和代价聚合模块。多尺度特征提取模块、多层级特征融合模块和代价聚合模块均具有双分支。其中，多尺度特征提取模块用以提取不同尺度的影像特征；多层级特征融合模块用于进行不同层级影像特征的融合；代价聚合模块以不同步距的三维卷积进行不同尺度的代价计算、并通过反卷积及代价级联方式实现多尺度代价聚合。

步骤3：利用多尺度特征提取模块、多层级特征融合模块和代价聚合模块构建密集匹配网络；所述密集匹配网络主要分为四个部分，分别是：特征提取部分、匹配代价体部分、代价聚合部分及视差回归部分，具体描述如下：

特征提取部分；首先通过二维卷积将影像转换到特征空间；而后通过多尺度特征提取模块提取两个尺度的影像特征，该模块的分支一将作为后续多尺度特征提取模块的输入，分支二将与下一多尺度特征提取模块的分支一特征一起实现多层级特征融合。交替使用多个多尺度特征提取模块及多层级特征融合模块，即可在特征提取过程实现影像多尺度与多层级特征的初步融合。最后，对获取的多层级特征进行尺度和维度变换实现进一步的特征融合，以此提取融合多尺度和多层级信息的影像特征。左、右影像通过权重共享的方式提取影像特征。

匹配代价体部分；在给定视差范围的条件下，网络将利用特征提取部分中提取的左、右影像特征构建匹配代价体。

代价聚合部分；以得到的匹配代价体作为输入，该部分首先通过一系列三维卷积操作构建初始匹配聚合代价。而后以初始聚合代价为输入，通过依次使用多个代价聚合模块(不少于三个)实现不同层级匹配代价的聚合。最后按一定比例对多层级聚合代价进行叠加，实现多层级匹配代价聚合。

视差回归部分；对于获取的不同层级聚合代价，网络依次进行维度变换、上采样和视差回归处理，获取多层级的预测视差图结果；而后对多层级视差图结果以一定比例进行融合，得到网络的最终输出。

利用步骤1中构建的训练集训练步骤3设计的密集匹配网络，当网络的预测视差图和训练集给定的视差图真值之间的差别小于一定的阈值，即认为网络训练完成。

步骤4：当训练完成后，利用训练好的网络对经过几何精校正和核线纠正的待匹配影像进行密集匹配，即可获得匹配结果——视差图。

作为优选，步骤1所述能构成立体像对的左、右卫星影像之间具有合适的交会角、且两景影像地理覆盖范围具有一定的重叠；

所述经过几何精校正和核线纠正的第i组左、右卫星影像定义为：{I_l，i、I_r，i}；视差图中u列第v行的像素值D^*(u，v)＝d说明第i组左、右卫星影像I_l，i和I_r，i在该位置基于左卫星影像的视差大小为d像素。

步骤1中所述训练集为：

其中，为经由高精度LiDAR点云或其他辅助高程数据转化生成的、以第i组左、右卫星影像中左影像为基准的视差图真值。

步骤2中所述多尺度特征提取模块、多层级特征融合模块和代价聚合模块的定义如下：

步骤2.1：定义所使用的基础残差模块为Res_s；其中，下标s(s＝1，2，...N)表明残差模块的步距为s。根据特征图尺寸计算公式，当给定尺寸为{I像素*I像素}的输入特征图，设定卷积核尺寸大小为{k*k}像素,边缘填充像素数为p像素,则经过残差模块Res_s运算后得到的特征图大小为：

步骤2.2：定义多尺度特征提取模块SFE_m。其中，下标m(m＝1，2，...N)表示第m个多尺度提取模块，该模块具备双分支结构，分支1由n₁个步距为s₁的残差模块Res_s1和n₂个步距为s₂的残差模块Res_s2构成，分支2由n₃个步距为s₃的残差模块Res_s3和n₄个步距为s₄的残差模块Res_s4构成。作为优选，要求：

由此，SFE_m的不同分支将获取不同尺度的特征图，由此实现多尺度特征提取。

步骤2.3：定义多层级特征融合模块CSF_n。其中，下标n(n＝1，2，...m-1)表示第n个多层级特征融合模块；且要求在使用过程中，假设多尺度特征提取模块SFE的个数为m，则多层级特征融合模块CSF的个数为m-1。CSF_n具有双分支结构，该模块要求SFE_m-1的分支2和SFE_m的分支1具有相同尺度，并以级联方式融合SFE_m-1分支2获取的特征图和SFE_m的分支1获取的特征图。假设待融合特征图的尺寸为{S像素*S像素}；SFE_m分支1的通道数为C₁，SFE_m-1分支2的通道数为C₂，则经过CSF_m融合操作后，所得特征图的尺寸为：

(C₁+C₂)*S

步骤2.4：定义代价聚合模块CA_p(p＝1,2,...N)。其中，下标p(p＝1，2，...N)表示第p个代价聚合模块，该模块具有双分支结构。定义三维卷积操作1为3CBR，该卷积操作包含三维卷积、批量归一化和非线性化操作；定义三维卷积操作2为3CB，该卷积操作包含三维卷积和批量归一化操作；定义三维反卷积操作为3DC。

进一步地，代价聚合模块CA_p(p＝1,2,...N)的构建过程如下；

步骤2.4.1:定义CA_p分支1为Cost_b1，Cost_b1由l₁个步距为q₁的3CBR,l₂个步距为q₂的3CBR和l₃个步距为q₃的3CB构成；定义CA_p分支2为Cost_b2，Cost_b2由l₄个步距为q₄的3CBR；由此，CA_p分支1的尺度将降为初始代价的CA_p分支2的尺度将变为初始代价的/>为进行不同尺度的代价聚合，CA_p要求：

步骤2.4.2：为实现不同尺度匹配代价的聚合，CA_p分支2利用l₅个步距为的反卷积操作3DC进行尺度变换。经由尺度变换后Cost_b2的尺度降为原尺度的/>

步骤2.4.3：作为优选，CA_p首先对Cost_b1和Cost_b2进行元素级相加，即要求：

而后，CA_p对叠加后的聚合代价施以l₆个步距为的反卷积操作3DC以及l₇个步距为q₅的3CB，得到和输入代价体具有相同尺寸的聚合代价Cost_{agg_p}。

步骤3中所述一种融合多尺度多层级特征的卫星影像密集网络模型为：

其中，I表示输入的立体像对，Θ表示网络参数，表示网络特征提取部分输出的特征图；/>表示构建的匹配代价体；Cost_p表示第p层级的聚合代价；D_p表示经由第p层级聚合代价预测的视差图。

步骤3中所述通过多尺度特征提取模块、多层级特征融合模块和代价聚合模块构建密集匹配网络的过程具体为：

训练过程中,Φ经由特征提取部分获取左、右影像的特征图和/>利用/>和/>构建匹配代价体/>对/>进行多层级代价聚合，得到Cost_p；对Cost_p进行视差回归，得到对应层级的预测视差D_p；按照一定比例因子对D_p进行元素级相加，得到以左影像为基准的视差图，即视差图D。

进一步地，利用构造的密集匹配网络，经由所述训练集训练密集匹配网络的过程包含以下子步骤：

步骤3.1：以训练集作为密集匹配网络的输入。其中，左、右影像数据I_l，i，I_r，i作为密集匹配网络的输入，用于学习预测的视差结果D′_i；视差真值用于和预测视差结果D′_i进行比对，判断预测结果的准确性并通过反向传播机制更新网络。

步骤3.2：构建网络的特征提取部分。作为优选，步骤3.2中所述网络特征提取部分可定义为：

其中，I表示左、右影像，为网络特征提取部分的输入，Conv_a表示需要进行的二维卷积；SFE_b表示使用的多尺度特征提取模块；CSF_c表示使用的多层级特征融合模块；T_d表示需要进行的维度转换或尺度变换操作。下标a,b,c,d表示这些操作和模块均可以多次使用。N^*表示正整数。则分别以左、右影像I_l、I_r为输入，经过特征提取部分，即可得到影像对应的输出特征图

进一步地，以左影像I_l为例，网络特征提取部分的构建过程如下：

步骤3.2.1：定义左影像大小为C*H*W，其中，C为影像的通道数(波段数)，H为影像的高度，W为影像宽度。以左影像数据I_l，i为输入，通过二维卷积操作Conv₁将影像数据转换到特征空间，定义此时获得的特征图为F_0，l，其尺寸为C₀*H₀*W₀。

步骤3.2.2：利用多尺度特征提取模块SFE₁对F_0，l进行多尺度特征提取。定义SFE₁分支1和分支2的输出结果为F_{0_1，l}，F_{0_2，l}；通道数分别为C_{0_1},C_{0_2}。

SFE₁的分支1采用n₁个步距为s₁的残差模块和n₂个步距为s₂的残差模块/>进行特征提取，所得特征图F_{0_1，l}的尺寸为：

SFE₁的分支2采用n₃个步距为s₃的残差模块和n₄个步距为s₄的残差模块/>进行特征提取，所得特征图F_{0_2，l}的尺寸为：

步骤3.2.3：利用多尺度特征提取模块SFE₂对F_{0_1，l}进行多尺度特征提取。定义SFE₂分支1和分支2的输出结果为F_{1_2，l}，F_{1_3，l}；通道数分别为C_{1_2},C_{1_3}。

SFE₂的分支1采用n₅个步距为s₅的残差模块和n₆个步距为s₆的残差模块/>进行特征提取，所得特征图F_{1_2，l}的尺寸为：

SFE₂的分支2采用n₇个步距为s₇的残差模块和n₈个步距为s₈的残差模块/>进行特征提取，所得特征图F_{1_3，l}的尺寸为：

步骤3.2.4：利用多层级特征融合模块CSF₁对F_{0_2，l}和F_{1_2，l}进行特征融合，定义CSF₁的输出结果为F_{2_2，l}。该模块要求：

则F_{2_2，l}的尺寸为:

步骤3.2.5：利用多尺度特征提取模块SFE₃对F_{2_2，l}进行多尺度特征提取。定义SFE₃分支1和分支2的输出结果为F_{2_3，l}，F_{2_4，l}；通道数分别为C_{2_3},C_{2_4}。

SFE₃的分支1采用n₉个步距为s₉的残差模块和n₁₀个步距为s₁₀的残差模块进行特征提取，所得特征图F_{2_3，l}的尺寸为：

SFE₃的分支2采用n₁₁个步距为s₁₁的残差模块和n₁₂个步距为s₁₂的残差模块进行特征提取，所得特征图F_{2_4，l}的尺寸为：

步骤3.2.6：利用多层级特征融合模块CSF₂对F_{1_3，l}和F_{2_3，l}进行特征融合，定义CSF₂的输出结果为F_{3_3，l}。该模块要求：

则F_{3_3，l}的尺寸为:

步骤3.2.7：利用卷积操作Conv₂对F_{3_3，l}进行维度压缩得到F_{3_3_dim，l}，作为优选，压缩后的通道数为C_{3_3_dim}；F_{3_3_dim，l}经过n₁₃个步距为s₁₃的残差模块Ress₁₃和n₁₄个步距为s₁₄的残差模块Ress₁₄得到输出特征图F_{3_4},F_{3_4，l}的通道数为C_{3_4}。则F_{3_4，l}的尺寸为：

步骤3.2.8：对F_{2_4，l}和F_{3_4，l}进行特征融合，定义CSF₃的输出结果为F_{4_4，l}。要求:

则F_{4_4，l}的尺寸为：

步骤3.2.9：利用尺度变换操作T₁对特征图F_{3_3，l}进行尺度和维度变换，利用尺度和维度变换操作T₂对特征图F_{4_4，l}进行尺度和维度变换。定义变换后的特征图分别为F_{3_3_u，l}，F_{4_4_u，l},变换后特征图的通道数分别为C_{3_u},C_{4_u}。

作为优选，要求F_{3_3_u，l}，F_{4_4_u，l}和F_{2_2，l}具有相同尺寸，并通过级联方式对F_{3_3_u，l}，F_{4_4_u，l}和，F_{2_2，l}进行连接，定义为F_fuse，l。则F_fuse，l的尺寸为：

步骤3.2.10：对F_fuse，l进行卷积操作Conv₃和维度变换操作T₃，得到左影像的特征提取结果F_l。作为优选，F_l的通道数与F_0，l一致,则特征图F_l的尺寸为：

步骤3.2.11：定义右影像大小为C*H*W。对右影像进行如步骤3.2.1至步骤3.2.10的操作，则可得到右影像的特征提取结果F_r。作为优选，F_r的通道数与F_0，r一致,则特征图F_r的尺寸为

步骤3.3：构建网络的匹配代价体部分。作为优选，步骤3.3中所述网络匹配代价体部分可定义为：

其中，表示左、右影像经由网络特征提取部分获取的影像特征；d_max表示给定的左、右影像的视差值范围；/>为经由匹配代价体构建过程得到的代价体。

当给定视差大小为d(0≤d<d_max)、影像行列数为x和y时，经过校正的左、右影像的对应像素之间具有如下关系：

(x_l,y)＝(x_r-d,y)

即左影像的第x列(x≥d)像素对应于右影像的第(x-d)列像素。

进一步地，网络代价体的构建过程如下：

步骤3.3.1：左、右卫星影像经由步骤3.2以权重共享方式得到的影像特征图的尺寸为给定待匹配影像的视差范围为d_max，则所需构建的代价体的尺寸为：/>

步骤3.3.2：匹配代价体的计算过程如下：

当视差为d时,从左、右影像特征图中各获取尺寸为的区域构建代价图，则单张代价图尺寸为/>在C₀维度叠加左、右影像的代价图构建视差为d时的联合代价图，其尺寸为/>该代价图[0,C₀)通道的代价值根据左影像特征图进行计算，[C₀,2C₀)通道的代价值根据右影像特征图进行计算。

根据视差对应关系，该代价图的[0,C₀)通道的代价值为：特征图对应通道的第列至第/>列；[C₀,2C₀)通道内的代价值为：特征图对应通道的第1列至第列。

步骤3.3.3：设定视差d的取值范围为0≤d＜d_max，则共可获取张代价图。将在不同视差值下获取的联合代价图在维度d处进行叠加，即可得到尺寸为/>的代价体。

步骤3.4：构建网络的代价聚合部分。作为优选，步骤3.4中所述网络代价聚合部分可定义为：

其中，为经由匹配代价体构建过程计算得到的代价体；3CBR为需要进行归一化和非线性激活的三维卷积操作；3CB为需要进行归一化的三维卷积操作；3DC为三维反卷积操作；CA_p为代价聚合模块；下标p指第p个模块；N^*表示正整数。经由相关操作，即可获取不同层级的聚合代价Cost_p。

进一步地，网络代价聚合部分的构建过程如下：

步骤3.4.1：首先构建初始聚合代价Cost₁。Cost₁由m₁个步距为1的3CBR构成；其中，m₁个3CBR中的后m′₁(m′₁＜m₁)个以跳跃连接方式进行连接。

作为优选，Cost₁的通道数为C_{c_1},则Cost₁的尺寸为：

步骤3.4.2：利用步骤2.3中定义的CA_p聚合第p(p≥2)个模块匹配代价Cost_{agg_p}；则第p(p≥2)层级的代价Cost_p的代价聚合结果为：

Cost_p＝Cost_p-1+Cost_{agg_p}(p≥2)

步骤3.5：构建网络的视差回归部分。作为优选，步骤3.5中所述网络视差回归部分可定义为：

D＝∑_p∈Nλ_pD_p,p∈N^*

其中，D_p表示经由一系列变换操作及进行视差回归得到的各层级视差，λ_p表示D_p对应的比例因子；D表示预测的以左影像为基准的视差图；

定义用于维度变换的三维卷积操作Clf。Clf包含t个三维卷积操作。其中，前t-1个三维卷积在卷积后均进行批量归一化和以ReLU为激活函数的非线性化操作。第t个卷积操作只进行卷积操作，且输出通道数为1。进一步地，视差回归部分的构建过程如下：

步骤3.5.1：对步骤3.4获取的多层级聚合代价Cost_p(p∈N^*)依次进行Clf、倍数为的上采样操作及以[0,1]为范围的回归分析操作，得到多层级的预测视差D_p(p∈N^*)，其尺寸为1*H₀*W₀。

步骤3.5.2：按照一定的比例因子λ_p对D_p进行元素级相加，得到以左影像为基准的预测视差D。即：

D＝∑_p∈N*λ_pD_p,p∈N^*

步骤3.6：以输出结果D和真值D^*之间的相似程度计算损失函数，利用后向传播更新全部网络学习参数

作为优选，步骤3.6所述训练过程中采用的损失函数可以定义为：

其中，λ_p为权重控制参数，用以调控D_p之间的比例。

上述训练过程需要迭代进行，通过不断更新网络参数来降低损失函数，提升网络性能，直到满足迭代停止条件。作为优选，此处设定的迭代终止条件为全部训练数据经由χ轮迭代循环。

步骤3中所述得到训练后跨层卷积神经网络模型为：

其中，Θ^*， Cost_p ^*，D^*表示经由网络训练后得到的最优网络参数，Φ^*表示最终所得到的最优网络结果，该结果将对能构成立体像对的卫星影像进行密集匹配处理，得到密集匹配结果。

步骤4：利用训练集训练设计的密集匹配网络。通过训练后的卫星影像密集匹配网络对经过几何精校正和核线纠正的左、右卫星影像进行密集匹配，得到以左影像为基准的视差图。

与现有技术相比，本发明的优点和有益效果：相较于传统密集匹配算法，本发明采取端到端的处理方式，避免了处理过程中的误差积累，且对弱纹理、重复纹理等区域有更强的抵抗性，可以显著降低匹配困难区域的误匹配率。相较于现有基于深度学习的密集匹配方法，本发明采取的多尺度特征提取模块有效的挖掘了影像的多尺度特征；采取的多层级特征融合模块实现了影像多尺度及多层级特征的融合，故而网络具备更好的特征提取能力，能更充分的提取影像信息；采取的代价聚合模块在代价聚合过程中进一步纳入了多尺度和多层级信息，因此能进一步降低匹配误差并能有效应对卫星影像中地物尺度的变化，故而更加适合于卫星影像的密集匹配。

附图说明

图1：本发明涉及的卫星影像密集匹配流程图；

图2：本发明方法所设计的网络特征提取部分；

图3：本发明方法所设计的网络代价聚合部分。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

图1为本发明涉及的卫星影像密集匹配流程图；图2为本发明方法的特征提取部分；图3为本发明方法的代价聚合部分。

下面结合图1至图3介绍本发明的具体实施方式，包括以下步骤：

步骤1：将经过几何精校正和核线纠正的第i组左、右卫星影像定义为：I_l，i、I_r，i；视差图中u列第v行的像素值D^*(u，v)＝d说明第i组左、右卫星影像I_l，i和I_r，i在该位置基于左卫星影像的视差大小为d像素。

步骤1中所述训练集为：

其中，为经由高精度LiDAR点云或其他辅助高程数据转化生成的、以第i组左、右卫星影像中左影像为基准的视差图，即真值。具体实施时，训练集图像I_1，l与I_2，l的尺寸大小设定为{256像素*512像素}，图像通道数均为1。

步骤2：构建多尺度特征提取模块SFE_m(m＝1，2，3)。

步骤2.1：SFE_m使用了两种残差模块Res_a和Res_b；其中，下标a和b表明该残差模块所用的步距。作为优选，本发明实际使用的残差模块的卷积核尺寸为{3像素*3像素},边缘填充像素为1，设定步距a＝1,b＝2。则：

经由Res_a运算后得到的特征图大小为：

[I+2*1-3]+1＝I

经由Res_b运算后得到的特征图大小为：

作为优选，本发明使用的残差模块如图2所示。残差模块Res_a和Res_b第一次卷积时所使用的步距分别为a和b。第二次卷积时所使用的步距为1，而后通过跳跃连接将初始特征图和经过卷积变换后的特征图进行元素级相加。

步骤2.2：本发明使用的多尺度特征提取模块的定义如下：

多层级特征提取模块的左右分支仅使用步距为1和2的残差模块构建。作为优选，SFE₁的分支1由3个Res_a构成、分支2由4个Res_a和1个Res_b构成；SFE₂的分支1由4个Res_a和1个Res_b构成构成；分支2由2个Res_b构成；SFE₃的分支1由2个Res_a和1个Res_b构成构成；分支2由2个Res_b构成。

步骤2.3：本发明使用的多层级特征融合模块的定义如下:

作为优选，CSF₁将SFE₁的分支2与SFE₂的分支1以级联方式进行连；CSF₂将SFE₂的分支2与SFE₃的分支1以级联方式进行连接。

步骤2.4：本发明使用的代价聚合模块的定义如下：

作为优选，如不作特别说明，本发明中所使用的三维卷积3CBR，3CB和3DC的卷积核尺寸均为{3像素*3像素*3像素}，边缘填充像素数均为1。三维卷积后，3CBR将进行批量归一化和以ReLU为激活函数的非线性操作；3CB则只进行批量归一化处理。

步骤2.4.1：代价聚合模块CA_p的分支1定义为Cost_b1，分支2定义为Cost_b2。Cost_b1利用1个步距为2的3CBR和1个步距为1的3CBR进行代价聚合；假设初始代价Cost₁的尺寸为SC；则Cost_b1的尺寸为Cost_b2利用2个步距为2的3CBR进行代价聚合，此时Cost_b2的尺寸为

步骤2.4.2：为实现不同尺度代价的聚合，Cost_b1利用1个步距为1的3CB进行维度变换，变换后Cost_b1的维度与Cost_b2一致；Cost_b2则利用1个步距为2的3DC进行尺度变换，其尺度变为

步骤2.4.3：对进行了维度变换的Cost_b1和进行了尺度变换的Cost_b2以元素级相加方式进行代价聚合；对聚合后的代价施以1个步距为2的反卷积操作3DC以及1个步距为1的3CB，得到和输入代价具有相同尺寸的聚合代价Cost_{agg_p}。

作为优选，步骤3中所述一种融合多尺度多层级特征的卫星影像密集网络模型为：

其中，Θ表示网络参数，表示网络特征提取部分输出的特征图；/>表示构建的匹配代价体；Cost_p表示第p层级的聚合代价；D表示视差预测过程得到的视差图。

步骤3中所述通过多尺度特征提取模块，多层级特征融合模块以及代价聚合模块构建密集匹配网络的具体过程为：

训练过程中,Φ经由特征提取部分获取输出特征图和/>利用/>和/>构建匹配代价体/>对代价体/>进行多层级的代价聚合，得到Cost_p；对Cost_p进行视差回归，并按照一定比例因子进行元素级合并，得到最终的以左影像为基准的视差图，即视差图D。

进一步地、利用构造的密集匹配网络，经由所述训练集训练密集匹配网络的过程包含以下子步骤：

步骤3.1：以训练集作为密集匹配网络的输入。训练集影像I_l，i，I_r，i的尺寸为均为{256像素*512像素}，通道数为1。即C＝1,H＝256,W＝512。

步骤3.2:构建网络的特征提取部分。网络特征提取部分如图2所示：

作为优选，步骤3.2中所述网络特征提取部分定义为：

其中，I表示左、右影像，为网络特征提取部分的输入，Conv_a表示需要进行的卷积操作；SFE_b表示使用的多尺度特征提取模块；CSF_c表示使用的多层级特征融合模块；T_d表示需要进行的维度转换或尺度变换操作。下标a,b,c,d表示这些操作和模块均可以多次使用，N^*表示正整数。则以I为输入，经过特征提取部分，即可得到该部分输出特征图

作为优选，不做特别说明时，本发明的网络特征提取部分所使用的二维卷积操作的卷积核尺寸均为{3像素*3像素}，边缘填充数均为1像素，且每个卷积操作在卷积之后均进行批量归一化并利用ReLU函数进行激活。进一步地，以左影像为例、网络特征提取部分的构建过程如下：

步骤3.2.1：以左影像I_l，i为输入，通过二维卷积操作Conv₁将影像转换到特征空间，获得特征图F_0，l。其中，Conv₁的操作包含一个步距为2的卷积操作和2个步距为1的卷积操作、卷积操作的输出特征图通道数均为32。由于输入左影像的尺寸为1*256*512，则该过程所获取的特征图F_0，l的尺寸为C₀*H₀*W₀，即32*128*256。

步骤3.2.2：利用多尺度特征提取模块SFE₁对特征图F_0，l进行多尺度特征提取。定义SFE₁分支1和分支2的输出特征图为F_{0_1，l}，F_{0_2，l}。

作为优选，F_{0_1，l}，F_{0_2，l}的通道数C_{0_1}＝32，C_{0_2}＝64。

作为优选，SFE₁分支1采用3个步距为1的残差模块Res_a进行特征提取；所得特征图F_{0_1，l}的尺寸为:

即32*128*256

作为优选，分支2采用5个步距为1的残差模块Res_a和1个步距为2的残差模块Res_b进行特征提取；所得特征图F_{0_2，l}的尺寸为：

即64*64*128

步骤3.2.3：利用多尺度特征提取模块SFE₂对特征图F_{0_1，l}进行多尺度特征提取。定义SFE₂分支1和分支2的输出结果为F_{1_2，l}，F_{1_3，l}。

作为优选，F_{1_2，l}，F_{1_3，l}的通道数C_{1_2}＝64，C_{1_3}＝64。

作为优选，SFE₂的分支1采用4个步距为1的残差模块Res_a和1个步距为2的残差模块Res_b进行特征提取；所得特征图F_{1_2，l}的尺寸为：

即64*64*128

作为优选，分支2采用2个步距为2的残差模块Res_b进行特征提取；所得特征图F_{1_3，l}的尺寸为:

即64*32*64

步骤3.2.4：利用多层级特征融合模块CSF₁对特征图F_{0_2，l}和F_{1_2，l}进行特征融合，定义CSF₁的输出结果为F_{2_2，l}。则F_{2_2，l}的尺寸为：

即128*64*128

步骤3.2.5：利用多尺度特征提取模块SFE₃对特征图F_{2_2，l}进行多尺度特征提取。定义SFE₃分支1和分支2的输出结果分别为F_{2_3，l}，F_{2_4，l}。

作为优选，，F_{2_3，l}，，F_{2_4，l}的通道数C_{2_3}＝128，C_{2_4}＝128。

作为优选，SFE₃的分支1采用2个步距为1的残差模块Res_a和1个步距为2的残差模块Res_b进行特征提取；所得特征图F_{2_3，l}的尺寸为：

即128*32*64

作为优选，分支2采用2个步距为2的残差模块Res_b进行特征提取；所得特征图F_{2_4，l}的尺寸为：

即128*16*32

步骤3.2.6：利用多层级特征融合模块CSF₂对特征图F_{1_3，l}和F_{2_3，l}进行特征融合，定义CSF₂的输出结果为F_{3_3，l}。则F_{3_3，l}的尺寸为：

即192*32*64

步骤3.2.7：利用卷积操作Conv₂对F_{3_3，l}进行维度压缩得到F_{3_3_dim，l}。

作为优选，Conv₂包含1个卷积核尺寸为{1像素*1像素}，边缘填充数为0的二维卷积操作；卷积操作后，进行批量归一化操作和以ReLU为激活函数的非线性化操作。

作为优选，压缩后的通道数C_{3_3_dim}＝64。

作为优选，采用2个步距为1的残差模块Res_a和1个步距为2的残差模块Res_b对特征图F_{3_3_dim，l}进行特征提取，得到特征图F_{3_4，l}；F_{3_4，l}的通道数C_{3_4}＝128；尺寸为：

即128*16*32

步骤3.2.8：对特征图F_{2_4，l}和F_{3_4，l}进行特征融合，定义输出结果为F_{4_4，l}。则F_{4_4，l}的尺寸为：

即256*16*32

步骤3.2.9：利用尺度变换操作T₁对特征图F_{3_3，l}进行尺度和维度变换得到特征图F_{3_3_u，l}，利用尺度和维度变换操作T₂对特征图F_{4_4，l}进行尺度和维度变换得到特征图F_{4_4_u，l}。

作为优选，F_{3_3_u，l}，F_{4_4_u，l}和，F_{2_2，l}具有相同尺寸。

作为优选，以级联方式连接F_{3_3_u，l}，F_{4_4_u，l}和，F_{2_2，l}得到F_fuse，l。

作为优选，尺度变换操作T₁包含1个{1像素*1像素}的二维卷积操作以及一个上采样操作。其中，卷积操作的卷积核尺寸为{1像素*1像素}，步距为1，边缘填充数为0，卷积操作后进行批量归一化和以ReLU为激活函数的非线性化操作。上采样操作的上采样倍数为2。

定义操作T₁所得特征图为F_{3_3_u，l}。作为优选，F_{3_3_u，l}的通道数C_{3_u}＝128；F_{3_3_u，l}的尺寸为：

即128*64*128

作为优选，尺度变换操作T₂包含1个{1像素*1像素}的卷积操作，以及一个上采样操作。其中，卷积操作的卷积核尺寸为{1像素*1像素}，步距为1，边缘填充数为0，卷积操作后进行批量归一化和以ReLU为激活函数的非线性化操作。上采样操作的上采样倍数为4。

定义操作T₂所得特征图为F_{4_4_u，l}。作为优选，F_{4_4_u，l}的通道数C_{4_u}＝128；F_{4_4_u，l}的尺寸为：

即128*64*128

则经F_{3_3_u，l}，F_{4_4_u，l}和，F_{2_2，l}融合所得的特征图F_fuse，l的尺寸为：

即384*64*128

步骤3.2.10：对F_fuse，l进行维度变换操作T₃，得到左影像的特征提取结果F_l。

作为优选，T₃包含两个卷积操作：第一个卷积操作的卷积核尺寸为{3像素*3像素}，步距为1，边缘填充数为1；卷积操作后进行批量归一化和以ReLU为激活函数的非线性化操作。该卷积操作的输出通道数为128。第二个卷积操作的卷积核尺寸为{1像素*1像素}，步距为1，边缘填充数为0。该卷积操作的输出通道数为32。定义经由T₃操作所得特征图为F_l，则F_l的尺寸为：

即32*64*128

步骤3.2.11：定义右影像大小为C*H*W。对右影像进行如步骤3.2.1至步骤3.2.10的操作，得到右影像的特征提取结果F_r。特征图F_r的尺寸为

即32*64*128

步骤3.3：构建网络的匹配代价体部分。

作为优选，步骤3.3中所述网络匹配代价体部分可定义为：

其中，表示左、右影像经由网络特征提取部分获取的影像特征；d_max表示所给定的左、右影像之间的视差值范围；/>为经由匹配代价体构建过程计算得到的代价体。

当给定视差大小为d(0≤d<d_max)时，当影像行列数为x和y时，经过校正的左、右影像的对应像素之间具有如下关系：

(x_l,y)＝(x_r-d,y)

即左影像的第x列(x≥d)像素对应于右影像的第(x-d)列像素。

进一步地，网络代价体的构建过程如下：

步骤3.3.1：左、右卫星影像经由步骤3.2以权重共享方式得到的影像特征图尺寸为即32*64*128。

作为优选，给定待匹配影像间的视差范围d_max＝192，则所需构建的代价体的大小为：即64*48*64*128。

步骤3.3.2：匹配代价体的计算过程如下：

当视差为d时,从左、右影像特征图中各获取尺寸为的区域构建代价图，则单张代价图尺寸为/>即/>在C₀维度处叠加左、右影像的代价图构建视差为d时的联合代价图，其尺寸为/>该代价图的[0,C₀)通道的代价值根据左影像特征图进行计算，[C₀,2C₀)通道内的代价值根据右影像特征图进行计算。根据视差对应关系，该代价图的[0,C₀)通道的代价值为对应通道特征图的第/>列至第128列；[C₀,2C₀)通道内的代价值为对应通道第1列至第/>列。

步骤3.3.3：作为优选，设定视差d的取值范围为0≤d＜191，则共可获取48张代价图。作为优选，将在不同视差值下获取的联合代价图在维度d处进行叠加，即可得到尺寸为64*48*64*128的代价体。

步骤3.4：构建网络的代价聚合部分。网络代价聚合部分如图3所示：

作为优选，步骤3.4中所述网络代价聚合部分可定义为：

其中，为经由匹配代价体构建过程计算得到的代价体；3CBR和3CB代表两种三维卷积操作；3DC为三维反卷积操作；CA_p为代价聚合模块；N^*表示正整数；Cost_p为利用三维操作和代价聚合模块构建的不同层级的聚合代价。

如不作特别说明，本发明中所使用的三维卷积3CBR，3CB和3DC的卷积核尺寸均为{3像素*3像素*3像素}，边缘填充像素数均为1。三维卷积后，3CBR将进行批量归一化和以ReLU为激活函数的非线性操作；3CB则只进行批量归一化处理。进一步地，网络代价聚合部分的构建过程如下：

步骤3.4.1：首先构建初始聚合代价(第一层级代价)Cost₁。

作为优选，Cost₁由4个步距为1的3CBR构成；其中，4个3CBR中的后两个以跳跃连接方式进行连接。

作为优选，，Cost₁的通道数C_{c_1}＝32，则Cost₁的尺寸为：

即32*48*64*128

步骤3.4.2：利用步骤2.4中定义的CA_p聚合第p(p≥2)个模块匹配代价Cost_{agg_p}。

作为优选，p的最大值为4。则聚合的各层级代价依次为：

Cosr₂＝Cost₁+Cost_{agg_2}；

Cost₃＝Cost₂+Cost_{agg_3}；

Cost₄＝Cost₃+Cost_{agg_4}；

且Cost₂，Cost₃，Cost₄的尺寸均为：即32*48*64*128。

步骤3.5：构建网络的视差回归部分。

步骤3.5中所述网络视差回归部分可定义为：

D＝∑_p∈Nλ_pD_p,p∈N^*

其中，D表示预测的以左影像为基准的视差图；D_p表示对各层级聚合代价进行一系列变换操作及视差回归后得到的各层级视差，λ_p表示D_p对应的比例因子。

步骤3.5.1：使用三维卷积操作Clf进行维度变换。

作为优选，Clf包含两个三维卷积操作，两个卷积操作的卷积核尺寸均为{3像素*3像素*3像素}、边缘填充数均为1、步距均为1。其中，第一个三维卷积操作的输出通道数为32。第二个三维卷积操作的输出通道数为1。

步骤3.5.2：对步骤3.4获取的多层级聚合代价Cost₁，Cost₂，Cost₃，Cost₄依次进行Clf、倍数为4的上采样操作及以[0,1]为范围的回归分析操作，得到对应预测视差D₁，D₂，D₃，D₄。

步骤3.5.3：按照一定的比例因子λ₁，λ₂，λ₃，λ₄对预测的视差D₁，D₂，D₃，D₄进行元素级相加，得到以左影像为基准的预测视差D。作为优选，比例因子分别为λ₁＝0.5；λ₂＝0.5；λ₃＝0.7；λ₄＝1。则预测视差D为：

D＝∑_{p＝1，2，3，4}λ_pD_p＝0.5D₁+0.5D₂+0.7D₃+D₄

步骤3.6所述训练过程中采用的损失函数定义为：

其中，λ_p为权重控制参数，用以调控D_p之间的比例。

作为优选,选择平滑的L1范数作为函数f以计算损失函数。

其中，的计算过程如下：

/>

进一步地，损失函数的计算过程为：

上述训练过程需要迭代进行，通过不断更新网络参数来降低损失函数，提升网络性能，直到满足迭代停止条件。作为优选，迭代停止条件为所有训练数据经过10轮训练。由此得到最优的密集匹配网络

步骤4：固定训练后卷积神经网络模型Φ^*，对经过几何精校正和核线纠正的立体像对进行密集匹配，即可得到以左影像为基准的视差图D。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于，包括以下步骤：

步骤1，将构成立体像对的两景卫星影像通过几何精校正和核线纠正得到处理后的左、右卫星影像，获取以左卫星影像为基准的视差图，通过左、右卫星影像，视差图构建训练集；其中，左、右卫星影像用于预测匹配视差图，训练集给定的视差图将作为真值数据，用于精度验证；

步骤2，定义多尺度特征提取模块、多层级特征融合模块和代价聚合模块，其中，多尺度特征提取模块用以提取不同尺度的影像特征；多层级特征融合模块用于进行不同层级影像特征的融合；代价聚合模块以不同步距的三维卷积进行不同尺度的代价计算、并通过反卷积及代价级联方式实现多尺度代价聚合；

步骤3，利用多尺度特征提取模块、多层级特征融合模块和代价聚合模块构建密集匹配网络，并利用步骤1中构建的训练集训练密集匹配网络；

所述密集匹配网络包括四个部分：特征提取部分，用于利用多尺度特征提取模块、多层级特征融合模块提取输入影像的特征；匹配代价体部分，用于利用提取的影像特征构建匹配代价体；代价聚合部分，用于利用代价聚合模块实现多层级匹配代价聚合；视差回归部分，用于利用多层级匹配代价聚合获取多层级的预测视差图结果，而后对多层级视差图结果进行融合，得到网络的最终输出；

步骤3中所述的密集网络匹配模型为，

其中，I表示输入的立体像对，Θ表示网络参数，表示网络特征提取部分输出的特征图；/>表示构建的匹配代价体；Cost_p表示第p层级的聚合代价；D_p表示经由第p层级聚合代价预测的视差图；

步骤3中通过多尺度特征提取模块、多层级特征融合模块和代价聚合模块构建密集匹配网络的过程具体为：

训练过程中，Φ经由特征提取部分获取左、右卫星影像的特征图和/>利用/>和/>构建匹配代价体/>对/>进行多层级代价聚合，得到Cost_p；对Cost_p进行视差回归，得到对应层级的预测视差D_p；按照一定比例因子对D_p进行元素级相加，得到以左卫星影像为基准的视差图，即视差图D；

进一步地，利用构造的密集匹配网络模型，经由训练集训练密集匹配网络模型的过程包含以下子步骤：

步骤3.1：以训练集作为密集匹配网络的输入，其中，左、右卫星影像数据I_l，i，I_r，i作为密集匹配网络的输入，用于学习预测的视差结果D′_i；视差真值用于和预测视差结果D′_i进行比对，判断预测结果的准确性并通过反向传播机制更新网络；

步骤3.2：构建网络的特征提取部分，步骤3.2中所述网络特征提取部分定义为：

其中，I表示左、右卫星影像，为网络特征提取部分的输入，Conv_a表示需要进行的二维卷积；SFE_b表示使用的多尺度特征提取模块；CSF_c表示使用的多层级特征融合模块；T_d表示需要进行的维度转换或尺度变换操作，下标a，b，c，d表示这些操作和模块均多次使用，N^*表示正整数；分别以左、右影像I_l、I_r为输入，经过特征提取部分，即得到影像对应的输出特征图

步骤3.3：构建网络的匹配代价体部分，步骤3.3中所述网络匹配代价体部分定义为：

其中，表示左、右影像经由网络特征提取部分获取的影像特征；d_max表示给定的左、右影像的视差值范围；/>为经由匹配代价体构建过程得到的代价体；

当给定视差大小为d，影像行列数为x和y时，经过校正的左、右影像的对应像素之间具有如下关系：

(x_l，y)＝(x_r-d，y)

即左影像的第x列像素对应于右影像的第(x-d)列像素；

步骤3.4：构建网络的代价聚合部分，步骤3.4中所述网络代价聚合部分定义为：

其中，为经由匹配代价体构建过程计算得到的代价体；3CBR为需要进行归一化和非线性激活的三维卷积操作；3CB为需要进行归一化的三维卷积操作；3DC为三维反卷积操作；CA_p为代价聚合模块；

步骤3.5：构建网络的视差回归部分，步骤3.5中所述网络视差回归部分定义为：

D＝∑_p∈Nλ_pD_p，p∈N^*

步骤4，利用训练后的卫星影像密集匹配网络对经过几何精校正和核线纠正的左、右卫星影像进行密集匹配，即可获得匹配结果。

2.根据权利要求1所述的一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于：步骤1中，经过几何精校正和核线纠正的第i组左、右卫星影像定义为：{I_l，i、I_r，i}；

视差图中u列第v行的像素值D^*(u，v)＝d说明第i组左、右卫星影像I_l，i和I_r，i在该位置基于左卫星影像的视差大小为d像素；

构成的训练集为：

其中，为经由高精度LiDAR点云或其他辅助高程数据转化生成的、以第i组左、右卫星影像中左卫星影像为基准的视差图真值。

3.根据权利要求1所述的一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于：步骤2中多尺度特征提取模块定义如下：

步骤2.1：定义所使用的基础残差模块为Res_s；其中，下标s表明残差模块的步距为s，s＝1，2，...N，根据特征图尺寸计算公式，当给定尺寸为{I像素＊I像素}的输入特征图，设定卷积核尺寸大小为{k＊k}像素，边缘填充像素数为p像素，则经过残差模块Res_s运算后得到的特征图大小为：

步骤2.2：定义多尺度特征提取模块SFE_m，其中，下标m表示第m个多尺度提取模块，m＝1，2，...N，SFE_m具备双分支结构，分支1由n₁个步距为s₁的残差模块Res_s1和n₂个步距为s₂的残差模块Res_s2构成，分支2由n₃个步距为s₃的残差模块Res_s3和n₄个步距为s₄的残差模块Res_s4构成；

4.根据权利要求3所述的一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于：步骤2中多层级特征融合模块CSF_n定义如下，其中，下标n表示第n个多层级特征融合模块，n＝1，2，...m-1；多尺度特征提取模块SFE的个数为m，则多层级特征融合模块CSF的个数为m-1，CSF_n具有双分支结构，该模块要求SFE_m-1的分支2和SFE_m的分支1具有相同尺度，并以级联方式融合SFE_m-1分支2获取的特征图和SFE_m的分支1获取的特征图；假设待融合特征图的尺寸为{S像素*S像素}，SFE_m分支1的通道数为C₁，SFE_m-1分支2的通道数为C₂，则经过CSF_m融合操作后，所得特征图的尺寸为：

(C₁+C₂)*S。

5.根据权利要求1所述的一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于：步骤2中代价聚合模块CA_p(p＝1，2，...N)定义如下，其中，下标p表示第p个代价聚合模块，p＝1，2，...N；CA_p具有双分支结构，定义三维卷积操作1为3CBR，该卷积操作包含三维卷积、批量归一化和非线性化操作；定义三维卷积操作2为3CB，该卷积操作包含三维卷积和批量归一化操作，定义三维反卷积操作为3DC；

进一步地，代价聚合模块CA_p的构建过程如下；

步骤2.4.1，定义CA_p分支1为Cost_b1，Cost_b1由l₁个步距为q₁的3CBR，l₂个步距为q₂的3CBR和l₃个步距为q₃的3CB构成；定义CA_p分支2为Cost_b2，Cost_b2由l₄个步距为q₄的3CBR；由此，CA_p分支1的尺度将降为初始代价的CA_p分支2的尺度将变为初始代价的为进行不同尺度的代价聚合，CA_p要求：

步骤2.4.2，为实现不同尺度匹配代价的聚合，CA_p分支2利用l₅个步距为的反卷积操作3DC进行尺度变换，经由尺度变换后Cost_b2的尺度降为原尺度的/>

步骤2.4.3，CA_p首先对Cost_b1和Cost_b2进行元素级相加，即要求：

而后，CA_p对叠加后的聚合代价施以l₆个步距为的反卷积操作3DC以及l₇个步距为q₅的3CB，得到和输入代价体具有相同尺寸的聚合代价Cost_agg-p。

6.根据权利要求1所述的一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于：步骤3.2中网络特征提取部分的构建过程如下：

步骤3.2.1：定义左影像大小为C*H*W，其中，C为影像的通道数或波段数，H为影像的高度，W为影像宽度；以左影像数据I_l，i为输入，通过二维卷积操作Conv₁将影像数据转换到特征空间，定义此时获得的特征图为F_0，l，其尺寸为C₀*H₀*W₀；

步骤3.2.2：利用多尺度特征提取模块SFE₁对F_0，l进行多尺度特征提取，定义SFE₁分支1和分支2的输出结果为F_{0_1，l}，F_{0_2，l}；通道数分别为C_{0_1}，C_{0_2}；

步骤3.2.3：利用多尺度特征提取模块SFE₂对F_{0_1，l}进行多尺度特征提取，定义SFE₂分支1和分支2的输出结果为F_{1_2，l}，F_{1_3，l}；通道数分别为C_{1_2}，C_{1_3}；

步骤3.2.4：利用多层级特征融合模块CSF₁对F_{0_2，l}和F_{1_2，l}进行特征融合，定义CSF₁的输出结果为F_{2_2，l}，该模块要求：

则F_{2_2，l}的尺寸为：

步骤3.2.5：利用多尺度特征提取模块SFE₃对F_{2_2，l}进行多尺度特征提取，定义SFE₃分支1和分支2的输出结果为F_{2_3，l}，F_{2_4，l}；通道数分别为C_{2_3}，C_{2_4}；

SFE₃的分支1采用n₉个步距为s₉的残差模块和n₁₀个步距为s₁₀的残差模块/>进行特征提取，所得特征图F_{2_3，l}的尺寸为：

SFE₃的分支2采用n₁₁个步距为s₁₁的残差模块和n₁₂个步距为s₁₂的残差模块/>进行特征提取，所得特征图F_{2_4，l}的尺寸为：

步骤3.2.6：利用多层级特征融合模块CSF₂对F_{1_3，l}和F_{2_3，l}进行特征融合，定义CSF₂的输出结果为F_{3_3，l}；该模块要求：

则F_{3_3，l}的尺寸为：

步骤3.2.7：利用卷积操作Conv₂对F_{s_3，l}进行维度压缩得到F_{3_3_dim，l}，压缩后的通道数为C_{3_3_dim}；F_{3_3_dim，l}经过n₁₃个步距为s₁₃的残差模块Res_s13和n₁₄个步距为s₁₄的残差模块Res_s14得到输出特征图F_{3_4}，F_{3_4，l}的通道数为C_{3_4}，则F_{3_4，l}的尺寸为：

步骤3.2.8：对F_{2_4，l}和F_{3_4，l}进行特征融合，定义CSF₃的输出结果为F_{4_4，l}，要求：

则F_{4_4，l}的尺寸为：

步骤3.2.9：利用尺度变换操作T₁对特征图F_{3_3，l}进行尺度和维度变换，利用尺度和维度变换操作T₂对特征图F_{4_4，l}进行尺度和维度变换，定义变换后的特征图分别为F_{3_3_u，l}，F_{4_4_u，l}，变换后特征图的通道数分别为C_{3_u}，C_{4_u}；

要求F_{3_3_u，l}，F_{4_4_u，l}和F_{2_2，l}具有相同尺寸，并通过级联方式对F_{3_3_u，l}，F_{4_4_u，l}和，F_{2_2，l}进行连接，定义为F_fuse，l，则F_fuse，l的尺寸为：

步骤3.2.10：对F_fuse，l进行卷积操作Conv₃和维度变换操作T₃，得到左影像的特征提取结果F_l，F_l的通道数与F_0，l一致，则特征图F_l的尺寸为：

步骤3.2.11：定义右影像大小为C*H*W，对右影像进行如步骤3.2.1至步骤3.2.10的操作，则得到右影像的特征提取结果F_r；F_r的通道数与F_0，r一致，则特征图F_r的尺寸为

7.根据权利要求1所述的一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于：步骤3.3中网络代价体的构建过程如下：

步骤3.3.1：左、右卫星影像经由步骤3.2以权重共享方式得到的影像特征图的尺寸为给定待匹配影像的视差范围为d_max，则所需构建的代价体的尺寸为：

步骤3.3.2：匹配代价体的计算过程如下：

当视差为d时，从左、右影像特征图中各获取尺寸为的区域构建代价图，则单张代价图尺寸为/>在C₀维度叠加左、右影像的代价图构建视差为d时的联合代价图，其尺寸为/>该代价图[0，C₀)通道的代价值根据左影像特征图进行计算，[C₀，2C₀)通道的代价值根据右影像特征图进行计算；

根据视差对应关系，该代价图的[0，C₀)通道的代价值为：特征图对应通道的第列至第/>列；[C₀，2C₀)通道内的代价值为：特征图对应通道的第1列至第/>列；

步骤3.3.3：设定视差d的取值范围为0≤d＜d_max，则共可获取张代价图，将在不同视差值下获取的联合代价图在维度d处进行叠加，即得到尺寸为/>的代价体。

8.根据权利要求1所述的一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于：步骤3.4中网络代价聚合部分的构建过程如下：

步骤3.4.1：首先构建初始聚合代价Cost₁，Cost₁由m₁个步距为1的3CBR构成；其中，m₁个3CBR中的后m′₁个以跳跃连接方式进行连接，m′₁＜m₁；

Cost₁的通道数为C_{c_1}，则Cost₁的尺寸为：

步骤3.4.2：利用步骤2.3中定义的CA_p聚合第p个模块匹配代价Cost_{agg_p}；则第p层级的代价Cost_p的代价聚合结果为：

Cost_p＝Cost_p-1+Cost_{agg_p}(p≥2)。

9.根据权利要求1所述的一种融合多尺度多层级特征的卫星影像密集匹配方法，其特征在于：步骤3.6中采用的损失函数定义为：

其中，λ_p为权重控制参数，用以调控D_p之间的比例；

上述训练过程需要迭代进行，通过不断更新网络参数来降低损失函数，提升网络性能，直到满足迭代停止条件。