CN116299247B - 一种基于稀疏卷积神经网络的InSAR大气校正方法 - Google Patents
一种基于稀疏卷积神经网络的InSAR大气校正方法 Download PDFInfo
- Publication number
- CN116299247B CN116299247B CN202310569847.0A CN202310569847A CN116299247B CN 116299247 B CN116299247 B CN 116299247B CN 202310569847 A CN202310569847 A CN 202310569847A CN 116299247 B CN116299247 B CN 116299247B
- Authority
- CN
- China
- Prior art keywords
- data
- training
- sample
- saru
- net model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 23
- 238000012937 correction Methods 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 82
- 230000008569 process Effects 0.000 claims abstract description 24
- 238000010606 normalization Methods 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000012795 verification Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 29
- 230000006835 compression Effects 0.000 claims description 14
- 238000007906 compression Methods 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 12
- 230000007246 mechanism Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims description 2
- 238000013135 deep learning Methods 0.000 description 11
- 238000010200 validation analysis Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000005436 troposphere Substances 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005305 interferometry Methods 0.000 description 1
- 239000005433 ionosphere Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000004062 sedimentation Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/02—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
- G01S7/40—Means for monitoring or calibrating
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S13/00—Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
- G01S13/88—Radar or analogous systems specially adapted for specific applications
- G01S13/89—Radar or analogous systems specially adapted for specific applications for mapping or imaging
- G01S13/90—Radar or analogous systems specially adapted for specific applications for mapping or imaging using synthetic aperture techniques, e.g. synthetic aperture radar [SAR] techniques
- G01S13/9021—SAR image post-processing techniques
- G01S13/9023—SAR image post-processing techniques combined with interferometric techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Evolutionary Computation (AREA)
- Radar, Positioning & Navigation (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Astronomy & Astrophysics (AREA)
- Electromagnetism (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于稀疏卷积神经网络的InSAR大气校正方法,获取原始干涉影像,根据原始干涉影像生成训练样本和标签,进一步生成数据样本集;对数据样本集进行归一化处理并划分训练集和验证集;构建sARU‑Net模型;对sARU‑Net模型进行训练,获得最优权重参数。本发明从真实的SAR影像本身出发,基于SAR影像的内部信息精确预测出InSAR数据中的大气噪声并加以去除,高精度;无需对任何数据进行插值处理,在处理中可以节约大量的时间,加速了进程。
Description
技术领域
本发明涉及一种深度学习预测方法,具体涉及一种基于稀疏卷积神经网络的InSAR大气校正方法,利用基于注意力机制的深度残差稀疏U-Net(Sparse Attention-Based Deep Residual U-Net,sARU-Net)深度学习神经网络模型对InSAR大气延迟进行预测以及校正,可为高精度地表形变监测提供支撑,属于深度学习或人工智能预测领域。
背景技术
随着近年来合成孔径雷达干涉测量(InSAR)技术的发展,其在地表形变监测中的应用越来越广泛。然而,雷达卫星发射的微波信号穿过大气层时会附加一个时间延迟,多变的气象条件导致时间延迟具有较强的不确定性。大气延迟给 InSAR数据带来了大量的噪声,严重影响了InSAR地表形变监测的精度,使得大气延迟成为InSAR精密测量中亟待解决的主要问题之一。
大气层中的电离层和对流层是导致大气延迟的主要介质层。其中,对流层(0-50km)占主导地位,对流层包含80%的大气质量和99%的水汽。对流层延迟主要与水汽含量的空间分布有关,可以被分成垂直分层成分和湍流成分。其中垂直分层成分是由每次数据采集时干燥空气压力和温度的变化引起的,随时间变化缓慢;湍流成分是由在短时间和小范围内的对流层水汽分布变化造成的,随时间变化迅速。近年来,国内外许多学者一直在致力于大气延迟校正研究。目前,主流的大气延迟校正方案通常可以归纳为以下两类:一是利用外部数据直接估计大气延迟,如中分辨率成像光谱仪(Moderate-resolution ImagingSpectroradiometer,MODIS)水汽产品、欧洲中期天气预报中心再分析资料(ECMWF Re-Analysis-Interim,ERA Interim)、WRF数值预报模型(Weather Research andForecasting Model)、全球导航卫星系统(Global Navigation Satellite System,GNSS)观测数据等,该类方法由于面临观测时间不同、空间分辨率不高、易受云影响(GNSS观测除外)等问题,降低了其适用性;二是基于InSAR自身数据进行大气延迟校正,对于垂直分层成分通常可以结合地形信息进行有效抑制,对于随机性较强的湍流成分,通常使用时间域滤波的方式抑制。在实际应用中,当湍流噪声占据主导地位(高程差较小的区域)时,使用外部数据通常难以得到精确的大气延迟,而时间域滤波方法(如高斯滤波方法)很大程度上受到参数设定(如滤波器权值设置和滤波窗口大小)的影响。
随着深度学习技术的发展,深度卷积神经网络(Convolutional Neural Network,CNN)在各种遥感任务和InSAR数据处理中的作用越来越重要。最近,Sporthi等将InSAR数据处理中的相位解缠问题转化为深度学习语义分割问题,并成功地利用深度卷积神经网络解决了这个问题。Anantrasirichai等证明了AlexNet模型在监测InSAR干涉数据中的火山形变方面的能力。Sun等利用合成的模拟数据,将深度残差卷积神经网络应用于InSAR相位滤波和相干性估计。Ma等使用深度卷积神经网络预测开垦土地的线性沉降。Chen等提出了一种新的基于深度学习的对流层延迟校正算法,即基于注意力的深度残差U型网络(ARU-Net),该方法已在实际案例中证明具备不错的性能。然而,InSAR数据往往由于数据质量、数据时间间隔长等原因,会导致失相干现象,从而在空间范围内产生大量值为0的数据(0对于InSAR数据通常为缺失数据)。由于卷积神经网络(CNN)通常擅长学习平滑数据,因此这些0值对于卷积神经网络(CNN)的学习是不利的。为解决这一问题,通常采用插值方法来插值缺失数据,但这会增加计算时间和引入新的误差来源。文献“Submanifold SparseConvolutional Networks”提出的子流形稀疏卷积网络非常适合学习这种存在缺失的稀疏数据。因此,基于以上存在的问题,本发明提出基于一种稀疏卷积的神经网络用于InSAR的大气延迟校正,致力于借助稀疏卷积技术进行更快速且高精度的InSAR大气延迟校正。
发明内容
本发明提供一种基于稀疏卷积神经网络的InSAR大气校正方法,用以解决上述背景技术中大气校正方法无法快速高精度校正大气延迟的问题。
本发明的上述目的通过以下技术手段实现:
一种基于稀疏卷积神经网络的InSAR大气校正方法,包括以下步骤:
步骤1、获取原始干涉影像,制作大气样本和形变样本,将大气样本和形变样本随机相加组合成训练样本,同时将对应的形变样本作为该训练样本的标签,训练样本和标签构成数据样本,各个数据样本构成数据样本集;
步骤2、对数据样本集进行归一化处理并划分训练集和验证集;
步骤3、构建sARU-Net模型;
步骤4、对sARU-Net模型进行训练,获得sARU-Net模型的最优权重参数。
如上所述步骤1中获取原始干涉影像包括以下步骤:
下载获取指定区域的SAR影像和SAR影像覆盖范围内的地形数据,首先确定研究区域在SAR影像上的位置并提取SAR影像数据,然后对SAR影像数据进行配准得到预处理后的SAR单视复数影像,根据SAR单视复数影像获得原始干涉影像。
如上所述步骤1中制作大气样本包括以下步骤:
在卫星系统的最短重访周期内没有可观测到形变信号的原始干涉影像作为大气样本;
所述步骤1中制作形变样本包括以下步骤:
从原始干涉图像中筛选平均相干性数值大于0.3的数据,筛选的数据在1千米范围内无大气延迟信号的干扰,利用奇异值分解方法得到形变结果作为形变样本。
如上所述步骤2中对数据样本集进行归一化处理包括以下步骤:
使用最大绝对值缩放将数据样本的数据取值范围调整至区间。
如上所述sARU-Net模型包括重复U-Net模块、注意力模块和残差学习单元,
重复U-Net模块包括左侧的压缩路径和右侧的扩张路径,压缩路径包括多个下采样模块,每个下采样模块包括子流形稀疏卷积层、批量归一化层、整流线性单元和用于下采样的稀疏卷积层;扩张路径包括多个的上采样模块,上采样模块的数目与下采样模块的数目一致,每个上采样模块包括子流形稀疏卷积层、批量归一化层、整流线性单元和用于上采样的转置卷积层;还包括用于桥接压缩路径和扩张路径的瓶颈模块,瓶颈模块包含子流形稀疏卷积层、批量归一化层和整流线性单元;还包括用于直接将特征从压缩路径传递到扩展路径的跳跃连接。
如上所述注意力模块包括交替设置的2个子流形稀疏卷积层和2个激活函数,注意力模块的输入由下采样模块通过跳跃连接传递的特征值和跳转连接对应的上一个上采样模块的输出组成,注意力模块的输出特征值将作为跳转连接对应的下一个上采样模块的输入。
如上所述注意力模块的输出特征值基于以下公式:
,
,
式中,为注意力系数;/>为ReLU函数;/>表示Sigmoid函数;SubMConv为子流形稀疏卷积层;/>为注意力模块的输入;/>为注意力模块的输出特征值;/>为元素相乘运算。
如上所述残差学习单元将训练样本与标签之间的残差图像作为sARU-Net模型学习的目标。
如上所述步骤4对sARU-Net模型进行训练包括以下步骤:
步骤4.1、选择优化器和学习率调整机制,设定损失函数:
,
式中,为sARU-Net模型中的训练参数;/>为损失函数;/>为SSIM算法;/>为第/>对数据样本;/>为标签;/>为训练样本;/>为残差图像;/>为残差图像预测值,/>为常数,N为训练样本总数;
步骤4.2、读取数据样本,对数据样本随机翻转或者90度倍数的旋转;
步骤4.3、进行超参数调整,设置训练轮数Epoch,先使用训练集中所有数据样本训练sARU-Net模型中的训练参数,并得到1个平均的训练损失函数值,该过程中sARU-Net模型的训练参数在更新,接着,使用验证集中所有数据样本对训练后的sARU-Net模型进行评估,得到1个平均的验证损失函数值,该过程中sARU-Net模型的训练参数不进行更新,若没有出现过拟合、欠拟合和不收敛则获得sARU-Net模型的最优权重参数;否则调整超参数并重复本步骤,直至获得sARU-Net模型的最优权重参数。
一种基于稀疏卷积神经网络的InSAR大气校正方法,还包括:
步骤5、将含有大气延迟的InSAR原始干涉影像输入经过步骤4得到最优权重参数的sARU-Net模型中,输出预测的残差图像,从InSAR原始干涉影像中去除该残差图像;
步骤6、使用步骤5中去除残差图像的InSAR原始干涉影像,利用奇异值分解方法得到新的形变结果,更新形变样本,并进一步更新数据样本集,重复步骤2至步骤5。
本发明相对于现有技术,具有如下有益效果:
1、自适应校正。本发明不依赖于外部数据以及时间域滤波方法参数设置的影响。从真实的SAR影像本身出发,基于SAR影像的内部信息精确预测出InSAR数据中的大气噪声并加以去除。
2、高精度。在实施例的测试结果显示,本发明的方法校正大气误差的幅度平均约为77.7%,而传统的方法几乎没有起到校正误差的作用。
3、高效性。采用稀疏卷积构建深度学习的sARU-Net模型,相比传统的卷积方法,无需对任何数据进行插值处理,在处理中可以节约大量的时间,加速了进程。
附图说明
图1是本发明的处理流程示意图;
图2是sARU-Net模型的结构图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
实施例1
参见图1~2,一种基于稀疏卷积神经网络的InSAR大气校正方法,该方法具体包括:
步骤1、数据预处理
步骤1.1、下载获取指定区域的SAR影像和SAR影像覆盖范围内的地形数据。首先确定研究区域在SAR影像上的位置并提取SAR影像数据,然后对SAR影像数据进行配准得到预处理后的SAR单视复数(Single Look Complex, SLC)影像。SAR单视复数影像使用SBAS数据处理方法进行处理。其具体包括根据时间基线和空间基线生成干涉组合、差分干涉处理、自适应滤波以及使用最小费用流(Minimum Cost Flow, MCF)算法进行相位解缠得到原始干涉影像。
步骤1.2、制作大气样本。在较短的时间内,原始干涉影像通常没有可观测到的形变信号。因此,本发明选择了短时间,即TerraSAR-X卫星系统的最短重访周期11天,且没有可观测到形变信号的原始干涉影像作为大气样本。由于数据预处理中可能会出现一些误差,可以对选取的大气样本进行优化,对于明显的错误可以手动进行剔除。
步骤1.3、制作形变样本。本发明在深度学习中缺乏真实InSAR地表形变数据作为监督学习标签的情况下,从原始干涉图像中筛选平均相干性数值大于0.3的数据。同时,筛选的数据在1千米范围内无大气延迟信号的干扰,利用奇异值分解(SVD)方法得到形变结果作为形变样本。
步骤1.4、制作数据样本集。步骤1.2和1.3制作了大气样本和形变样本,用于建立样本映射关系。每对数据样本包括训练样本和标签。具体来说,将大气样本和形变样本随机相加组合成训练样本,同时将对应的形变样本作为该训练样本的标签。本发明使用的稀疏卷积神经网络需要固定尺寸的输入。可以根据需要对成对训练样本进行切片处理,例如分割成64×64像素。此外,还可通过对形变样本进行缩放处理后大气样本相加获得训练样本,以制作更多包含形变信息的数据样本来平衡数据样本集。
步骤2、样本预处理。
步骤2.1、上述得到的数据样本集中,训练样本的数据取值范围可能不同,这可能导致训练过程中出现收敛缓慢等问题。为避免这种问题,通常需要对数据样本集进行归一化处理。数据归一化可以将数据统一调整到大致相同的区间或分布,有利于模型学习样本之间的特征。需要注意的是,目前许多算法中的归一化操作可能会影响到稀疏数据中的0值。例如,某些归一化方法中包含平移操作,这可能会严重破坏稀疏数据。因此,本发明使用最大绝对值缩放将数据样本的数据取值范围调整至区间,以确保不会破坏数据样本集中数据的稀疏性。
步骤2.2、将上述归一化处理后的数据样本集随机划分成训练集(Trainingdataset)和验证集(Validation dataset)。为确保划分具有随机性,一般可采用随机函数进行该操作,排除主观因素的影响。将数据样本集按照80%和20%的比例进行划分,其中80%的数据样本构成训练集,用于模型训练;而剩余的20%的数据样本构成验证集,用于评估模型训练的表现。
步骤3、sARU-Net模型的构建。
本发明采用深度学习稀疏卷积技术构建sARU-Net模型(基于注意力机制的深度残差稀疏U-Nets模型),sARU-Net模型包括重复U-Net模块、注意力模块和残差学习单元三个主要组成部分。此外,sARU-Net模型还包含输入层和输出层结构。
(1)重复U-Net模块:sARU-Net模型的核心,其结构类似于标准的U-Net模型,但实际上在卷积层的数量以及采样结构等方面存在差异。重复U-Net模块包括左侧的压缩路径(Contracting path)和右侧的扩张路径(Expansive path)。压缩路径一般由5个重复的下采样模块组成,每个下采样模块包括子流形稀疏卷积层(SubMConv2d,缩写为SSC)、批量归一化层(BN)、整流线性单元(ReLU)和用于下采样的稀疏卷积层(DownSamping)。扩张路径对应于压缩路径,同样具有5个重复的上采样模块,每个上采样模块包括子流形稀疏卷积层(SubMConv2d)、批量归一化层(BN)、整流线性单元(ReLU)和用于上采样的转置卷积层(UpSamping)。需要注意的是,重复U-Net模块中的下采样模块和上采样模块与标准U-Net模型有所不同。主要区别在于将标准U-Net模型中2个连续的卷积层替换为1个子流形稀疏卷积层(SubMConv2d),并将用于下采样的最大池化(Max-pooling)替换为用于下采样的稀疏卷积层。1个瓶颈模块用于桥接压缩路径和扩张路径,该瓶颈模块包含子流形稀疏卷积层(SubMConv2d)、批量归一化层(BN)、整流线性单元(ReLU)。除瓶颈处通过瓶颈模块连接以外,重复U-Net模块还具有多个跳跃连接(Skip connection)用于直接将特征从压缩路径传递到扩展路径,如图2重复U-Net模块中横跨的连接线所示。
(2)注意力模块:在重复U-Net模块中,每个激活点的权重是平等的,因此该模块无法自主关注某些特征。注意力机制可以调整权重的分布,从而使得重复U-Net模块可以更快速、准确地学习到需要的特征。该机制可以自适应地聚焦于有用的特征,并抑制不相关的局部特征,从而提高模型的表现能力。此外,注意力模块不受先验信息的限制。根据图2,所采用的注意力模块结构十分简洁,由2个子流形稀疏卷积层(SubMConv2d)和2个激活函数(依次为ReLU和Sigmoid函数)交替设置而成。注意力模块的输入由下采样模块通过跳跃连接传递的特征值和跳转连接对应的上一个上采样模块的输出组成。注意力模块的输出特征值将作为跳转连接对应的下一个上采样模块的输入。
式中,为注意力系数;/>为ReLU函数;/>表示Sigmoid函数;SubMConv为子流形稀疏卷积层(SubMConv2d);/>为注意力模块的输入;/>为注意力模块的输出特征值;为元素相乘运算。
(3)残差学习单元:残差学习单元的目的是将训练样本与标签之间的残差图像作为sARU-Net模型学习的目标,该残差图像是训练样本与标签之间的差异。因此,sARU-Net模型优化的目标是将训练样本经过sARU-Net模型后输出的残差图像预测值与真实的残差图像之间的误差最小化。经过残差学习单元的调整,sARU-Net模型的最终输出结果是预测的残差图像,而不是数据样本集中的标签。这种调整可以提高深度神经网络的训练效率和准确性。
(4)输入层和输出层:sARU-Net模型还包括输入层和输出层。输入层包括用于激活每对数据样本中有效点目标的激活输入层、1个将单通道输入数据变换为64通道的子流形稀疏卷积层(SubMConv2d)和1个整流线性单元(ReLU)组成。输出层包括1个将64通道的输出数据变换为单通道的子流形稀疏卷积层(SubMConv2d)和用于将激活点目标重塑回输入训练样本存储形式的层结构组成。实际上,该层结构是激活输入层的相反过程。
步骤4、模型训练。模型训练过程通常可以分为以下几个步骤:
步骤4.1、在模型训练前的准备阶段。主要工作包括选择适合当前深度学习任务的优化器,用于迭代更新模型参数,例如自适应矩估计(Adaptive Moment Estimation,Adam);选择学习率调整机制,如固定步长调整、余弦退火等动态衰减算法;本发明还提出了一种采用基于像素的损失函数和感知指标结构相似性(Structure Similarity IndexMeasure, SSIM)相结合的方式作为损失函数。其具体表达式如下:
式中,为sARU-Net模型中的训练参数;/>为损失函数;/>为SSIM算法;/>为第/>对数据样本;/>为标签;/>为训练样本;/>为残差图像;/>为残差图像预测值。/>为常数。本发明中将/>设置为0.1,保持了损失函数中两部分的贡献大致相当达到平衡,N为训练样本总数。
步骤4.2、数据加载与数据增强。
步骤4.2.1、数据加载:根据数据样本保存的格式,进行相应的读取。
步骤4.2.2、数据增强:对每对数据样本进行了随机翻转或者90度倍数的旋转,这些操作不会对数据进行重采样,也不会破坏稀疏数据的结构。
步骤4.3、训练过程。训练过程包括神经网络的预训练和正式训练两个阶段。通常这两个阶段的具体步骤如下:
步骤4.3.1、预训练:旨在搜索适合的超参数,包括sARU-Net模型训练时的批尺寸(BatchSize)和初始学习率等。然后,通过合理设置这些参数来加速sARU-Net模型的训练过程。这个过程通常被称为超参数调整。
步骤4.3.2、正式训练:在确定超参数范围之后正式开始训练。本实施例在深度学习训练过程中设置训练100轮(Epoch)。其中,完成1次所有数据样本的训练被称为1轮。具体的,在1轮训练中,先使用训练集(Training dataset)中所有数据样本训练sARU-Net模型中的训练参数,并得到1个平均的训练损失函数值,该过程中sARU-Net模型的训练参数在更新。接着,使用验证集(Validation dataset)中所有数据样本对训练后的sARU-Net模型进行评估,得到1个平均的验证损失函数值,该过程中sARU-Net模型的训练参数不进行更新。如没有出现过拟合、欠拟合和不收敛等不良现象,获得sARU-Net模型的最优权重参数;如出现过拟合、欠拟合和不收敛等不良现象,则需要调整超参数调节,重复本步骤,直至获得sARU-Net模型的最优权重参数。其中,过拟合指模型过度适应训练集,导致在验证集上表现较差。可通过得到的平均损失函数值的变化趋势判断,当出现过拟合时,平均训练损失函数值会继续下降,但平均验证损失函数值却不再下降,甚至会上升;欠拟合指模型在训练集上表现不佳,无法很好地拟合数据,也会在验证集上表现较差;不收敛通常指平均损失函数值反复振荡,无法稳定下降。
步骤5、sARU-Net模型预测。将含有大气延迟的InSAR原始干涉影像输入经过步骤4得到最优权重参数的sARU-Net模型中,输出预测的残差图像。该预测的残差图像表示了原始干涉影像中包含的大气延迟量。通过从InSAR原始干涉影像中去除该残差图像,可以完成对大气延迟的校正工作。
步骤6、使用经过步骤5中sARU-Net模型校正过大气延迟的原始干涉影像,利用奇异值分解(SVD)方法得到新的形变结果。使用新的形变结果更新形变样本,并进一步更新数据样本集,重复步骤2至步骤5的操作。最终,获得最优的sARU-Net模型。
实施例2
本实例利用覆盖某机场的28景TerraSAR-spotlight模式SAR影像数据,时间跨度为2008年10月13日至2009年12月27日。
本实施例选用TerraSAR数据中11天的时间间隔进行大气样本选取,并采用上述步骤中的优化方法进行优化。在模型训练过程中,使用1块Nvidia Tesla P100-PCIE-16 GB显卡进行运算,AdamW优化器用于参数更新,其中betas参数为(0.9,0.999),eps参数为1e-8。为了满足模型更新需求,余弦退火策略被用来对学习率进行动态衰减,将学习率从初始值0.001逐渐衰减至初始值的1/100。每次加载的数据批尺寸(BatchSize)为64,训练轮次(Epoch)设置为100。
使用训练后的模型对20张含有大气延迟的干涉影像进行预测,并使用预测的残差图像进行校正。结果表明,经过校正处理后,干涉影像中的大气延迟误差得到了明显的削弱。使用标准差作为评估指标,改正后的影像标准差相较于原始干涉影像有明显减小,20张干涉影像的大气延迟校正幅度约为77.7%。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (4)
1.一种基于稀疏卷积神经网络的InSAR大气校正方法,其特征在于,包括以下步骤:
步骤1、获取原始干涉影像,制作大气样本和形变样本,将大气样本和形变样本随机相加组合成训练样本,同时将对应的形变样本作为该训练样本的标签,训练样本和标签构成数据样本,各个数据样本构成数据样本集;
步骤2、对数据样本集进行归一化处理并划分训练集和验证集;
步骤3、构建sARU-Net模型;
步骤4、对sARU-Net模型进行训练,获得sARU-Net模型的最优权重参数;
步骤5、将含有大气延迟的InSAR原始干涉影像输入经过步骤4得到最优权重参数的sARU-Net模型中,输出预测的残差图像,从InSAR原始干涉影像中去除该残差图像;
步骤6、使用步骤5中去除残差图像的InSAR原始干涉影像,利用奇异值分解方法得到新的形变结果,更新形变样本,并进一步更新数据样本集,重复步骤2至步骤5;
所述sARU-Net模型包括重复U-Net模块、注意力模块和残差学习单元,
重复U-Net模块包括左侧的压缩路径和右侧的扩张路径,压缩路径包括多个下采样模块,每个下采样模块包括子流形稀疏卷积层、批量归一化层、整流线性单元和用于下采样的稀疏卷积层;扩张路径包括多个的上采样模块,上采样模块的数目与下采样模块的数目一致,每个上采样模块包括子流形稀疏卷积层、批量归一化层、整流线性单元和用于上采样的转置卷积层;还包括用于桥接压缩路径和扩张路径的瓶颈模块,瓶颈模块包含子流形稀疏卷积层、批量归一化层和整流线性单元;还包括用于直接将特征从压缩路径传递到扩展路径的跳跃连接,
所述注意力模块包括交替设置的2个子流形稀疏卷积层和2个激活函数,注意力模块的输入由下采样模块通过跳跃连接传递的特征值和跳转连接对应的上一个上采样模块的输出组成,注意力模块的输出特征值将作为跳转连接对应的下一个上采样模块的输入,
所述注意力模块的输出特征值基于以下公式:
,
,
式中,为注意力系数;/>为ReLU函数;/>表示Sigmoid函数;SubMConv为子流形稀疏卷积层;/>为注意力模块的输入;/>为注意力模块的输出特征值;/>为元素相乘运算,
所述残差学习单元将训练样本与标签之间的残差图像作为sARU-Net模型学习的目标,
所述步骤4对sARU-Net模型进行训练包括以下步骤:
步骤4.1、选择优化器和学习率调整机制,设定损失函数:
,
式中,为sARU-Net模型中的训练参数;/>为损失函数;/>为SSIM算法;/>为第/>对数据样本;/>为标签;/>为训练样本;/>为残差图像;为残差图像预测值,/>为常数,N为训练样本总数;
步骤4.2、读取数据样本,对数据样本随机翻转或者90度倍数的旋转;
步骤4.3、进行超参数调整,设置训练轮数Epoch,先使用训练集中所有数据样本训练sARU-Net模型中的训练参数,并得到1个平均的训练损失函数值,该过程中sARU-Net模型的训练参数在更新,接着,使用验证集中所有数据样本对训练后的sARU-Net模型进行评估,得到1个平均的验证损失函数值,该过程中sARU-Net模型的训练参数不进行更新,若没有出现过拟合、欠拟合和不收敛则获得sARU-Net模型的最优权重参数;否则调整超参数并重复本步骤,直至获得sARU-Net模型的最优权重参数。
2.根据权利要求1所述一种基于稀疏卷积神经网络的InSAR大气校正方法,其特征在于,所述步骤1中获取原始干涉影像包括以下步骤:
下载获取指定区域的SAR影像和SAR影像覆盖范围内的地形数据,首先确定研究区域在SAR影像上的位置并提取SAR影像数据,然后对SAR影像数据进行配准得到预处理后的SAR单视复数影像,根据SAR单视复数影像获得原始干涉影像。
3.根据权利要求2所述一种基于稀疏卷积神经网络的InSAR大气校正方法,其特征在于,所述步骤1中制作大气样本包括以下步骤:
在卫星系统的最短重访周期内没有可观测到形变信号的原始干涉影像作为大气样本;
所述步骤1中制作形变样本包括以下步骤:
从原始干涉图像中筛选平均相干性数值大于0.3的数据,筛选的数据在1千米范围内无大气延迟信号的干扰,利用奇异值分解方法得到形变结果作为形变样本。
4.根据权利要求3所述一种基于稀疏卷积神经网络的InSAR大气校正方法,其特征在于,所述步骤2中对数据样本集进行归一化处理包括以下步骤:
使用最大绝对值缩放将数据样本的数据取值范围调整至区间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310569847.0A CN116299247B (zh) | 2023-05-19 | 2023-05-19 | 一种基于稀疏卷积神经网络的InSAR大气校正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310569847.0A CN116299247B (zh) | 2023-05-19 | 2023-05-19 | 一种基于稀疏卷积神经网络的InSAR大气校正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116299247A CN116299247A (zh) | 2023-06-23 |
CN116299247B true CN116299247B (zh) | 2023-08-04 |
Family
ID=86803583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310569847.0A Active CN116299247B (zh) | 2023-05-19 | 2023-05-19 | 一种基于稀疏卷积神经网络的InSAR大气校正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116299247B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116721243B (zh) * | 2023-08-11 | 2023-11-28 | 自然资源部第一海洋研究所 | 一种空谱特征约束的深度学习大气校正方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113379709A (zh) * | 2021-06-16 | 2021-09-10 | 浙江工业大学 | 一种基于稀疏多尺度体素特征融合的三维目标检测方法 |
WO2021174790A1 (zh) * | 2020-03-05 | 2021-09-10 | 重庆大学 | 稀疏量化神经网络编码模式识别方法与系统 |
CN113920499A (zh) * | 2021-10-27 | 2022-01-11 | 江苏大学 | 一种面向复杂交通场景的激光点云三维目标检测模型及方法 |
CN114359292A (zh) * | 2021-12-10 | 2022-04-15 | 南昌大学 | 一种基于多尺度和注意力的医学图像分割方法 |
CN115082674A (zh) * | 2022-07-12 | 2022-09-20 | 西安电子科技大学 | 基于注意力机制的多模态数据融合三维目标检测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020232180A1 (en) * | 2019-05-14 | 2020-11-19 | Dolby Laboratories Licensing Corporation | Method and apparatus for speech source separation based on a convolutional neural network |
US11341650B2 (en) * | 2020-03-19 | 2022-05-24 | At&T Intellectual Property I, L.P. | Method for accelerating three-dimensional object segmentation with point cloud simplifications |
-
2023
- 2023-05-19 CN CN202310569847.0A patent/CN116299247B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021174790A1 (zh) * | 2020-03-05 | 2021-09-10 | 重庆大学 | 稀疏量化神经网络编码模式识别方法与系统 |
CN113379709A (zh) * | 2021-06-16 | 2021-09-10 | 浙江工业大学 | 一种基于稀疏多尺度体素特征融合的三维目标检测方法 |
CN113920499A (zh) * | 2021-10-27 | 2022-01-11 | 江苏大学 | 一种面向复杂交通场景的激光点云三维目标检测模型及方法 |
CN114359292A (zh) * | 2021-12-10 | 2022-04-15 | 南昌大学 | 一种基于多尺度和注意力的医学图像分割方法 |
CN115082674A (zh) * | 2022-07-12 | 2022-09-20 | 西安电子科技大学 | 基于注意力机制的多模态数据融合三维目标检测方法 |
Non-Patent Citations (1)
Title |
---|
"基于注意力机制点卷积网络的机载 LiDAR 点云分类";王利媛等;《激光与光电子学进展》;第59卷(第10期);1-10 * |
Also Published As
Publication number | Publication date |
---|---|
CN116299247A (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109100717B (zh) | 一种多源微波遥感海面风场数据融合方法及其装置 | |
CN112906300B (zh) | 基于双通道卷积神经网络的极化sar土壤湿度反演方法 | |
CN116299247B (zh) | 一种基于稀疏卷积神经网络的InSAR大气校正方法 | |
CN113156439B (zh) | 一种基于数据驱动的sar风场海浪联合反演方法及系统 | |
CN114966685A (zh) | 基于InSAR和深度学习的大坝形变监测及预测方法 | |
CN114966692B (zh) | 基于Transformer的InSAR技术冻土区多变量时序形变预测方法及装置 | |
CN113534159A (zh) | 一种基于sar卫星遥感数据的海面风速反演方法及系统 | |
CN113255972B (zh) | 基于Attention机制的短临降水预测方法 | |
Chen et al. | ARU-net: Reduction of atmospheric phase screen in SAR interferometry using attention-based deep residual U-net | |
CN112180369B (zh) | 基于深度学习的一维综合孔径辐射计海面风速反演方法 | |
CN114219994A (zh) | 一种基于空海协同观测的海洋光学卫星辐射定标方法 | |
CN114819737B (zh) | 公路路域植被的碳储量估算方法、系统及存储介质 | |
CN114117886A (zh) | 一种用于多光谱遥感水深反演方法 | |
Mooneyham et al. | SWRL Net: A spectral, residual deep learning model for improving short-term wave forecasts | |
CN116977311A (zh) | 一种洪涝灾害区域检测方法、系统、电子设备及存储介质 | |
CN117035066A (zh) | 一种耦合地理加权与随机森林的地表温度降尺度方法 | |
CN116883594A (zh) | 融合卫星与浮标观测的海洋三维温度遥感超分重建方法 | |
CN114065931B (zh) | 基于物理模型和神经网络融合的陆地水汽反演方法及系统 | |
CN113627465A (zh) | 基于卷积长短期记忆神经网络的降水数据时空动态融合方法 | |
CN114047563A (zh) | 一种红外高光谱的全天候同化方法 | |
CN116821694B (zh) | 基于多分支神经网络与分段式模型的土壤湿度反演方法 | |
CN116148855B (zh) | 时序InSAR大气相位去除和形变解算的方法及系统 | |
CN111950198B (zh) | 一种基于神经网络的地杂波仿真方法 | |
CN117805826B (zh) | 基于mim网络和雷达拼图的分钟降水估测方法及系统 | |
Jahanmard et al. | Quantification of hydrodynamic model sea level bias utilizing deep learning and synergistic integration of data sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |