CN107480701B

CN107480701B - 基于多通道卷积神经网络的光学图像与雷达图像匹配方法

Info

Publication number: CN107480701B
Application number: CN201710590173.7A
Authority: CN
Inventors: 张绍明; 熊璐; 吴睿泽; 阳群益
Original assignee: Tongji University
Current assignee: Tongji University
Priority date: 2017-07-19
Filing date: 2017-07-19
Publication date: 2020-07-28
Anticipated expiration: 2037-07-19
Also published as: CN107480701A

Abstract

本发明涉及一种基于多通道卷积神经网络的光学图像与雷达图像匹配方法，包括以下步骤：1)采用一个深度卷积神经网络对光学图像进行特征提取，获取光学图像的32×32×32维图像特征数据；2)采用另一个深度卷积神经网络对SAR图像进行特征提取，获取SAR图像的32×32×32维图像特征数据；3)对SAR图像和光学图像提取出的图像特征数据进行级联形成联合特征；4)根据联合特征构建匹配网络，并进行全连接匹配分类并输出匹配结果。与现有技术相比，本发明具有特征级联、匹配稳定等优点。

Description

基于多通道卷积神经网络的光学图像与雷达图像匹配方法

技术领域

本发明涉及遥感数据处理领域，尤其是涉及一种基于多通道卷积神经网络的光学图像与雷达图像匹配方法。

背景技术

目前，在遥感数据处理领域，多光谱光学图像和合成孔径雷达(SyntheticAperture Radar，SAR)图像经过配准后再进行应用处理是使用极为广泛的数据处理式，并且对提升遥感图像的利用价值具有重要意义。在图像的配准中，由于光学图像和SAR图像的成像方式、成像频率、图像通道数量都存在巨大的差异，使二者的高精度配准具有很大的难度。

现有的通用方法大多采用两种方式：

1)将多通道的光学图像整合为单通道灰度图像，之后直接与同等大小的SAR图像计算归一化相关系数，通过归一化相关系数的大小判断二者是否匹配；

2)在光学图像和SAR图像中分别提取边缘、直线、角点等特征，利用特征进行匹配。

第一种方法由于将多通道图像整合为单通道图像，舍弃和浪费了大量图像信息。并且由于光学和SAR的成像方式、波段频率不同，对同一类地物的反射率会具有非常大的差异，因此直接计算相关系数具有非常高的不确定性。

第二种方法避免了两种类型图像反射率不确定的影响，但是两种图像对特征的表达能力不同，经常出现特征在一种类型的图像中存在，而在另外一种类型的图像中不存在的情况。并且两种类型的图像特征之间会存在一定的位移，导致无法精确匹配。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种特征级联、匹配稳定的基于多通道卷积神经网络的光学图像与雷达图像匹配方法。

本发明的目的可以通过以下技术方案来实现：

一种基于多通道卷积神经网络的光学图像与雷达图像匹配方法，包括以下步骤：

1)采用一个深度卷积神经网络对光学图像进行特征提取，获取光学图像的32×32×32维图像特征数据；

2)采用另一个深度卷积神经网络对SAR图像进行特征提取，获取SAR图像的32×32×32维图像特征数据；

3)对SAR图像和光学图像提取出的图像特征数据进行级联形成联合特征；

4)根据联合特征构建匹配网络，并进行全连接匹配分类并输出匹配结果。

所述的步骤1)具体包括以下步骤：

11)将光学图像大小缩放为256×256像素；

12)对图像进行96次7×7卷积，得到96个通道的尺寸为256×256的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

13)对步骤12)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的缩小为128×128；

14)对96个通道的128×128结果进行128次5×5的窗口卷积，得到128个输出通道的128×128的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

15)对步骤14)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道缩小为64×64；

16)对128个通道的64×64结果进行32次3×3窗口卷积，得到32个输出通道的64×64的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出。

17)对步骤16)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的卷积结果缩小为32×32，最终获取的32×32×32维光学图像的特征。

所述的步骤2)具体包括以下步骤：

21)将SAR图像大小缩放到256×256像素；

22)对图像进行12次7×7卷积，得到12个通道的尺寸为256×256的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

23)对步骤22)中神经元输出的卷积结果进行窗口为2×2的均值下采样，将每个通道的缩小为128×128；

24)对12个通道的128×128结果进行24次5×5的窗口卷积，得到24个输出通道的128×128的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

25)对步骤24)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道缩小为64×64；

26)对24个通道的64×64结果进行32次3×3窗口卷积，得到32个输出通道的64×64的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到输出；

27)上对步骤26)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的卷积结果缩小为32×32，此时得到的32×32×32维数据为SAR图像的特征。

所述的步骤3)具体包括以下步骤：

对光学图像和SAR图像对应的32×32×32维图像特征数据进行并联，形成64×32×32维的联合特征。

所述的步骤4)具体包括以下步骤：

41)对64×32×32维的联合特征进行32次3×3卷积，得到32个通道的尺寸为32×32的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU神经元得到并输出；

42)对步骤41)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的缩小为16×16；

43)对32个通道的16×16结果进行32次2×2的窗口卷积，得到32个输出通道的16×16的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

44)对步骤43)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道缩小为8×8，得到32×8×8维光学和SAR图像最终联合特征；

45)对最终联合特征与1000个神经元进行完全连接，并得到1000维输出结果；

46)将步骤45)1000维输出结果再次与1000个神经元进行完全连接，得到输出结果；

47)将步骤46)得到的1000维输出结果连接到1个神经元，得到最终的匹配结果，即：1表示匹配，0表示不匹配。

所述的步骤45)和46)中的神经元的激活函数为ReLU，所述的步骤47)中的神经元的激活函数为Softmax函数。

所述的步骤4)中，匹配网络的训练采用梯度下降法，对训练误差进行后向传播修正网络连接权值。

与现有技术相比，本发明具有以下优点：

一、采用多达96通道的初始卷积层对光学图像进行特征提取，可稳定的提取所有波段的信息，与传统方法相比对图像信息的利用更加充分。

二、采用光学和SAR图像特征级联的方式，避免了人工定义光学与SAR图像的共性特征，可更好的定义图像匹配的特征空间。

三、采用深度卷积神经网络对光学与SAR图像联合特征进行相似性匹配判断，而不是利用现有的欧式距离，可以获得更稳定的匹配结果。

附图说明

图1为本发明的算法流程图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。

实施例

如图1所示，下面以两张1000×1000的图像进行匹配为例，对以下步骤进行详细描述：

在步骤“预处理”中，将光学图像和雷达图像都压缩到256×256，然后执行步骤401和401-1；

在步骤401中，对光学图像进行96次7×7的卷积，将卷积结果输入到ReLU神经元；在步骤401-1中对SAR图像进行12次7×7卷积，将卷积结果输入到ReLU神经元；然后执行步骤402和402-1；

在步骤402中，对步骤401中得到的神经元输出进行2×2的均值下采样；在步骤402-1中，对步骤401-1中得到的神经元输出进行2×2的均值下采样；然后执行步骤403和403-1；

在步骤403中，对光学图像进行128次5×5的卷积，将卷积结果输入到ReLU神经元；在步骤403-1中对SAR图像进行24次5×5卷积，将卷积结果输入到ReLU神经元；然后执行步骤404和404-1；

在步骤404中，对步骤403中得到的神经元输出进行2×2的均值下采样；在步骤404-1中，对步骤403-1中得到的神经元输出进行2×2的均值下采样；然后执行步骤405和405-1；

在步骤405中，对光学图像进行32次3×3的卷积，将卷积结果输入到ReLU神经元；在步骤405-1中对SAR图像进行32次3×3卷积，将卷积结果输入到ReLU神经元；然后执行步骤406和406-1；

在步骤406中，对步骤405中得到的神经元输出进行2×2的均值下采样；在步骤406-1中，对步骤405-1中得到的神经元输出进行2×2的均值下采样；然后执行步骤407；

在步骤407中，将步骤406和步骤406-1中得到的输出进行联合，得到64通道的光学和SAR图像联合特征。然后执行408。

在步骤408中，对光学图像进行32次3×3的卷积，将卷积结果输入到ReLU神经元；然后执行步骤409。

在步骤409中，对步骤408中得到的神经元输出进行2×2的均值下采样；然后执行步骤410。

在步骤410中，对光学图像进行32次2×2的卷积，将卷积结果输入到ReLU神经元；然后执行步骤411。

在步骤411中，对步骤410中得到的神经元输出进行2×2的均值下采样；然后执行步骤412。

在步骤412中，将步骤411中得到的所有输出与1000个ReLU神经元进行全连接，并获得1000个输出。执行步骤413。

在步骤413中，将步骤412中得到的所有输出与1000个ReLU神经元进行全连接，并获得1000个输出。执行步骤414。

在步骤414中，将步骤413中得到的所有输出与1个Softmax神经元进行全连接，并获得1个输出。输出值为1表示匹配，输出值为0表示不匹配。

Claims

1.一种基于多通道卷积神经网络的光学图像与雷达图像匹配方法，其特征在于，包括以下步骤：

1)采用一个深度卷积神经网络对光学图像进行特征提取，获取光学图像的32×32×32维图像特征数据，具体包括以下步骤：

11)将光学图像大小缩放为256×256像素；

12)对图像进行96次7×7卷积，得到96个通道的卷积特征尺寸为256×256的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

13)对步骤12)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的卷积特征尺寸缩小为128×128；

14)对96个通道卷积特征尺寸为128×128的卷积结果进行128次5×5的窗口卷积，得到128个输出通道卷积特征尺寸为128×128的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

15)对步骤14)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的卷积特征尺寸为缩小为64×64；

16)对128个通道卷积特征尺寸为64×64的卷积结果进行32次3×3窗口卷积，得到32个输出通道卷积特征尺寸为64×64的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

17)对步骤16)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的卷积特征尺寸缩小为32×32，最终获取的32×32×32维光学图像的特征；

2.根据权利要求1所述的一种基于多通道卷积神经网络的光学图像与雷达图像匹配方法，其特征在于，所述的步骤2)具体包括以下步骤：

21)将SAR图像大小缩放到256×256像素；

22)对图像进行12次7×7卷积，得到12个通道的卷积特征尺寸为256×256的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

23)对步骤22)中神经元输出的卷积结果进行窗口为2×2的均值下采样，将每个通道的卷积特征尺寸缩小为128×128；

24)对12个通道的128×128结果进行24次5×5的窗口卷积，得到24个输出通道卷积特征尺寸为128×128的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

25)对步骤24)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的卷积特征尺寸缩小为64×64；

26)对24个通道的64×64结果进行32次3×3窗口卷积，得到32个输出通道卷积特征尺寸为64×64的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到输出；

27)上对步骤26)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的卷积特征尺寸缩小为32×32，此时得到的32×32×32维数据为SAR图像的特征。

3.根据权利要求1所述的一种基于多通道卷积神经网络的光学图像与雷达图像匹配方法，其特征在于，所述的步骤3)具体包括以下步骤：

4.根据权利要求1所述的一种基于多通道卷积神经网络的光学图像与雷达图像匹配方法，其特征在于，所述的步骤4)具体包括以下步骤：

41)对64×32×32维的联合特征进行32次3×3卷积，得到32个通道的卷积特征尺寸为32×32的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU神经元得到并输出；

42)对步骤41)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的卷积特征尺寸缩小为16×16；

43)对32个通道的16×16结果进行32次2×2的窗口卷积，得到32个输出通道卷积特征尺寸为16×16的卷积结果，每个通道的每个像素上对应的卷积结果通过激活函数为ReLU的神经元得到并输出；

44)对步骤43)中神经元输出的卷积结果进行窗口为2×2的均值下采样，使每个通道的卷积特征尺寸缩小为8×8，得到32×8×8维光学和SAR图像最终联合特征；

5.根据权利要求4所述的一种基于多通道卷积神经网络的光学图像与雷达图像匹配方法，其特征在于，所述的步骤45)和46)中的神经元的激活函数为ReLU，所述的步骤47)中的神经元的激活函数为Softmax函数。

6.根据权利要求1所述的一种基于多通道卷积神经网络的光学图像与雷达图像匹配方法，其特征在于，所述的步骤4)中，匹配网络的训练采用梯度下降法，对训练误差进行后向传播修正网络连接权值。