CN111914853A

CN111914853A - 一种用于立体匹配的特征提取方法

Info

Publication number: CN111914853A
Application number: CN202010693071.XA
Authority: CN
Inventors: 文斌; 朱晗; 杨超; 李知聪; 曹仁轩
Original assignee: China Three Gorges University CTGU
Current assignee: China Three Gorges University CTGU
Priority date: 2020-07-17
Filing date: 2020-07-17
Publication date: 2020-11-10
Anticipated expiration: 2040-07-17
Also published as: CN111914853B

Abstract

一种用于立体匹配的特征提取方法，将经过校正的、尺寸为W*H*C的原始图像输入到特征提取网络中；通过预处理模块和Resnet提取多个特征图；通过最大值池化操作，对提取到的多个特征图进行不同大小的最大值池化，构建特征金字塔；利用堆叠结构进行特征融合并压缩金字塔尺度范围，得到下一个金字塔，经过多次压缩，直至输出单一的尺度特征。对输出的单一的尺度特征，进行3*3的卷积；通过跳跃连接，将Resnet最后一层特征输出与特征输出在通道维度上进行拼接，然后通过3*3卷积与1*1卷积，构造特征体。本发明能够被用来提取足够的丰富特征，适用于深度立体匹配网络的特征输入。

Description

一种用于立体匹配的特征提取方法

技术领域

本发明涉及数字图像处理领域，具体涉及一种用于立体匹配的特征提取方法。

背景技术

立体匹配是根据双目视差原理获取三维空间深度信息的过程，立体匹配的方法可分为传统的立体匹配方法和基于深度学习的立体匹配方法，由于基于深度学习的方法具有更好的实时性和准确率。因此，目前对于立体匹配的主要注意力已经从对传统匹配方法的研究转移到深度立体匹配网络。目前的深度立体匹配网络研究将过多的注意力放在了匹配过程，而对特征提取部分产生了忽略，所沿用的均是先前工作所提出的，如Resnet，SPP，又或是通过简单的跳跃连接将多尺度特征、深层语义和浅层几何简单的连接起来。然而，深度学习的基础是从特征中学习输入与输出之间的内在关系，特征的丰富程度在一定程度上决定了网络模型整体的性能。

特征提取一直是立体匹配网络中重要的研究问题，传统的立体匹配方法由于手工设计的度量函数不能完整反映像素之间的相似性，使得匹配上存在缺陷。而卷积神经网络的出现很好的解决了这一问题，通过一个深度特征提取网络提取特征，基于这些特征对像素点之间进行相似性度量，弥补手工设计的度量函数其本身固有的缺陷问题，使得立体匹配的准确率大大提升。

发明内容

本发明提供一种用于立体匹配的特征提取方法，该方法提供了一种新的用于立体匹配的特征提取网络，具有自下而上的特征提取结构、多条自上而下的路线、以及一个横向传播的金字塔融合结构，这些结构能够被用来提取足够的丰富特征，适用于深度立体匹配网络的特征输入。

本发明采取的技术方案为：

一种用于立体匹配的特征提取方法，包括以下步骤：

步骤1：将经过畸变校正和极线校正的、尺寸为W*H*C的原始图像输入到特征提取网络中，其中W为图像的宽维度，H为图像的高维度，C为图像的通道维度。

步骤2：通过预处理模块和Resnet提取多个特征图。

步骤3：通过最大值池化操作，对步骤2中提取到的多个特征图进行不同大小的最大值池化，构建特征金字塔。

步骤4：利用堆叠结构进行特征融合并压缩金字塔尺度范围，得到下一个金字塔，经过多次压缩，直至输出单一的尺度特征。

步骤5：对步骤4中输出的单一的尺度特征，进行3*3的卷积。

步骤6：通过跳跃连接，将Resnet最后一层特征输出与步骤5的特征输出在通道维度上进行拼接，然后通过3*3卷积与1*1卷积，构造特征体。

所述步骤2中，预处理模块由3个级联的3×3卷积核构成，3×3卷积核相对于更小的卷积核而言，可以提取到更多的特征；相对于更大的卷积核而言，可以提取到更多的细节特征。此外，用多个3×3的卷积核可以在参数数量和特征提取效果之间做到最优选择。

所述步骤2中，Resnet含有4个残差块组，四个组所包含的残差块数量分别是{3,16,3,3}。

所述步骤4包括以下步骤：

S4.1：将来自高尺度的特征进行反卷积或上采样操作，提升分辨率；

S4.2：将来自其他方向同尺度的特征或低尺度的特征进行卷积操作，使其通道维度与S4.1中操作后的特征通道维度数和尺度相同；

S4.3：将S4.1与S4.2操作后的特征结果进行元素相加，得到融合特征；

S4.4：重复S4.1至S4.3操作，得到不同尺度的融合特征，构造尺度范围压缩后的特征金字塔。

S4.5：重复S4.1至S4.4操作，得到具有不同尺度范围的特征金字塔，直至最后输出单一尺度特征。

本发明一种用于立体匹配的特征提取方法，技术效果如下：

1）自下而上的特征提取结构，能够提取深层高级语义信息。

2）多线路的自上而下的结构，能够将深层高级语义信息补充到浅层，使得语义信息与浅层细节得到充分融合。

3）横向连接的融合结构，将多尺度特征、最深层的高级语义特征以及最浅层的细节特征通过该金字塔结构逐层融合。无论是金字塔塔间还是塔内，均使得特征之间的信息交互达到最大化。

附图说明

图1为本发明方法的特征提取网络结构图。

图2为拼接操作示意图。

具体实施方式

实施例：

一种用于立体匹配的特征提取方法，包括以下步骤：

步骤1：将经过校正的、尺寸为W*H*C的原始图像输入到特征提取网络中，其中W为图像的宽维度，H为图像的高维度，C为图像的通道维度。

步骤2：通过预处理模块和Resnet提取多个特征图。

预处理模块由3个级联的3×3卷积核构成，得到特征图A1，其分辨率为输入图像的1/2。Resnet含有4个残差块组，四个组所包含的残差块数量分别是{3,16,3,3}，残差块组得到的特征图分别是{A2,A3,A4,A5}，分辨率分别是输入图像的{1/2,1/4,1/4,1/4}。

步骤3：通过最大值池化操作，对步骤2中提取到的多个特征图，进行不同大小的最大值池化，构建特征金字塔。

池化因子的大小分别是{2,2,4,8}，得到的特征图分别是{B2,B3,B4,B5}，其分辨率分别是输入图像的{1/4,1/8,1/16,1/32}。A1通过3*3的卷积核得到分辨率为1/2的特征图B1，与{B2,B3,B4,B5}构成特征金字塔B。

步骤4：利用堆叠结构进行特征融合并压缩金字塔尺度范围，得到下一个金字塔，经过多次压缩，直至输出单一的尺度特征，具体分为以下五步：

B5通过反卷积操作将分辨率从1/32提升到1/16；

B4的分辨率为1/16，通过1*1的卷积操作改变通道维度数，但不改变尺度的大小；

将B4与B5进行元素相加，得到融合特征C3；

S4.4：重复上述操作，得到不同尺度的融合特征，构造尺度范围压缩后的特征金字塔；

融合特征C3通过2倍上采样将分辨率提升到1/8，与经过卷积的B3进行元素相加，得到C2。

B1通过1*1卷积将分辨率从1/2降低到1/4，B2经过卷积尺度不变，

将以上两种操作得到的特征与C2经过2倍上采样得到的特征图进行元素相加得到C1，{C1,C2,C3}构成特征金字塔C，金字塔C的范围相对于金字塔B的尺度范围得到减小。

S4.5：重复上述操作，得到具有不同尺度范围的特征金字塔，直至最后输出单一尺度特征；

利用相同的方法，得到特征金字塔D，最后输出单一尺度特征E。

步骤5：对步骤4中输出的单一尺度特征，进行3*3的卷积。

步骤6：通过跳跃连接，将Resnet最后一层特征输出A5与步骤5的特征输出，在通道维度上进行拼接，得到特征量F，再通过3*3卷积与1*1卷积构造特征体。

在通道维度上进行拼接展示如图2所示。

立体匹配可以应用于无人驾驶之中，通过立体匹配获取三维真实世界的深度信息来感知真实世界景物所在的方向，深度立体匹配网络具有高精确度和实时性的特点，本发明所提出的用于立体匹配的特征提取方法,可以使得深度立体匹配网络的性能得到进一步提升，加立体匹配技术在无人驾驶领域中的应用。

Claims

1.一种用于立体匹配的特征提取方法，其特征在于包括以下步骤：

步骤1：将尺寸为W*H*C的原始图像输入到特征提取网络中，其中W为图像的宽维度，H为图像的高维度，C为图像的通道维度；

步骤2：通过预处理模块和Resnet提取多个特征图；

步骤3：通过最大值池化操作，对步骤2中提取到的多个特征图进行不同大小的最大值池化，构建特征金字塔；

步骤4：利用堆叠结构进行特征融合并压缩金字塔尺度范围，得到下一个金字塔，经过多次压缩，直至输出单一的尺度特征；

步骤5：对步骤4中输出的单一的尺度特征，进行3*3的卷积；

2.根据权利要求1所述一种用于立体匹配的特征提取方法，其特征在于：所述步骤2中，预处理模块由3个级联的3×3卷积核构成。

3.根据权利要求1所述一种用于立体匹配的特征提取方法，其特征在于：所述步骤2中，Resnet含有4个残差块组，四个组所包含的残差块数量分别是{3,16,3,3}。

4.根据权利要求1所述一种用于立体匹配的特征提取方法，其特征在于：所述步骤4包括以下步骤：

S4.4：重复S4.1至S4.3操作，得到不同尺度的融合特征，构造尺度范围压缩后的特征金字塔；