CN108681753A

CN108681753A - 一种基于语义分割及神经网络的图像立体匹配方法及系统

Info

Publication number: CN108681753A
Application number: CN201810529435.3A
Authority: CN
Inventors: 曹晶; 陈星辉
Original assignee: Wuhan Huanyu Zhixing Technology Co Ltd
Current assignee: Wuhan Huanyu Zhixing Technology Co Ltd
Priority date: 2018-05-29
Filing date: 2018-05-29
Publication date: 2018-10-19
Anticipated expiration: 2038-05-29
Also published as: CN108681753B

Abstract

本发明公开了一种基于语义分割及神经网络的图像立体匹配方法及系统，其中方法包括：首先获取场景图像的初始视差图；利用语义分割图获取场景图像的感兴趣区域，将感兴趣区域和初始视差图一起输入残差网络中；利用反卷积模块将感兴趣区域映射到视差图中得到精确视差图。本发明中的语义分割图为网络提供了丰富的信息，且只对图像中感兴趣的区域进行了处理，又由于采用了残差网络，使得本发明在匹配精度与速度上，都得到了提升。

Description

一种基于语义分割及神经网络的图像立体匹配方法及系统

技术领域

本发明涉及人工智能技术领域，尤其是涉及一种基于语义分割及神经网络的图像立体匹配方法及系统。

背景技术

图像的立体匹配是场景三维重建等应用的关键步骤，传统的立体匹配算法包括4个步骤：cost computation(匹配代价计算),cost aggregation(代价汇总),disparitycomputation(视差计算),and refinement(视差细化)。cost computation主要计算每个像素在所有可能的视差值上的计算代价；在cost aggregation步骤中，将一定区域内所有像素的计算代价进行聚合；在disparity computation步骤中，使用全局或局部算法计算视差值；最后，在后续处理步骤中对视差进行校正，选择合适的视差。传统的立体匹配算法在计算速度和精度上已经不能满足目前场景三维重建的需要。

发明内容

本发明的目的在于克服上述技术不足，提出一种基于语义分割及神经网络的图像立体匹配方法及系统，解决现有技术中的上述技术问题。

为达到上述技术目的，本发明的技术方案提供一种基于语义分割及神经网络的图像立体匹配方法，包括：

S1、获取场景图像的初始视差图；

S2、利用语义分割图获取场景图像的感兴趣区域，将感兴趣区域和初始视差图一起输入残差网络中；

S3、利用反卷积模块将感兴趣区域映射到视差图中得到精确视差图。

本发明还提供一种基于语义分割及神经网络的图像立体匹配系统，包括：

初始视差图获取模块：用于获取场景图像的初始视差图；

残差网络输入模块：用于利用语义分割图获取场景图像的感兴趣区域，将感兴趣区域和初始视差图一起输入残差网络中；

精确视差图获取模块：用于利用反卷积模块将感兴趣区域映射到视差图中得到精确视差图。

与现有技术相比，本发明的有益效果包括：获取场景图像的初始视差图；利用语义分割图获取场景图像的感兴趣区域，将感兴趣区域和初始视差图一起输入残差网络中；利用反卷积模块将感兴趣区域映射到视差图中得到精确视差图。本发明中的语义分割图为网络提供了丰富的信息，且只对图像中感兴趣的区域进行了处理，又由于采用了残差网络，使得本发明在匹配精度与速度上，都得到了提升。

附图说明

图1是本发明提供的一种基于语义分割及神经网络的图像立体匹配方法流程图；

图2是本发明提供的一种基于语义分割及神经网络的图像立体匹配系统结构框图。

附图中：1、基于语义分割及神经网络的图像立体匹配系统，11、初始视差图获取模块，12、残差网络输入模块，13、精确视差图获取模块。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供了一种基于语义分割及神经网络的图像立体匹配方法，包括：

S1、获取场景图像的初始视差图；

本发明所述的基于语义分割及神经网络的图像立体匹配方法，步骤S3中获取场景图像的精确视差图之后，还包括：

检测精确视差图中像素点的异常值，采取左右一致性检查来减少异常值，并使用双边滤波器对精确视差图进行平滑处理，使得其边缘的模糊程度降低；

具体的，由于精确视差图仍然会存在深度不连续等问题，所以采取检测精确视差图中像素点的异常值，采取左右一致性检查来减少异常值并对精确视差图进行平滑处理，以进一步获取更加精确的视差图。

本发明所述的基于语义分割及神经网络的图像立体匹配方法，步骤S1中获取场景图像的初始视差图的方法为：

将场景图像输入卷积神经网络，卷积神经网络计算场景图像的匹配代价，并输出场景图像的初始视差图；该卷积神经网络包括3x3滤波器、1x1填充层，以及ReLU非线性层。

本发明所述的基于语义分割及神经网络的图像立体匹配方法，残差网络输出精确视差图采用WTA(winner take al l)策略，即残差网络选取像素点匹配代价最小的视差作为最终视差，各像素点的最终视差形成精确视差图。由于残差网络可以训练很深，因此训练并利用残差网络输出的精确视差图的精度较为优异。

本发明所述的基于语义分割及神经网络的图像立体匹配方法，步骤S2中场景图像的语义分割图是基于PSPNet获取的语义分割图。

本发明还提供一种基于语义分割及神经网络的图像立体匹配系统1，包括：

初始视差图获取模块11：用于获取场景图像的初始视差图；

残差网络输入模块12：用于利用语义分割图获取场景图像的感兴趣区域，将感兴趣区域和初始视差图一起输入残差网络中；

精确视差图获取模块13：用于利用反卷积模块将感兴趣区域映射到视差图中得到精确视差图。

本发明所述的基于语义分割及神经网络的图像立体匹配系统1，还包括矫正模块：用于检测精确视差图中像素点的异常值，采取左右一致性检查来减少异常值，并使用双边滤波器对精确视差图进行平滑处理，使得其边缘的模糊程度降低。

本发明所述的基于语义分割及神经网络的图像立体匹配系统1，初始视差图获取模块11用于将场景图像输入卷积神经网络，卷积神经网络计算场景图像的匹配代价，并输出场景图像的初始视差图。

本发明所述的基于语义分割及神经网络的图像立体匹配系统1，精确视差图获取模块13用于利用残差网络选取像素点匹配代价最小的视差作为最终视差，并将各像素点的最终视差形成精确视差图。

本发明所述的基于语义分割及神经网络的图像立体匹配系统1，残差网络输入模块12中场景图像的语义分割图是基于PSPNet获取的语义分割图。

以上所述本发明的具体实施方式，并不构成对本发明保护范围的限定。任何根据本发明的技术构思所做出的各种其他相应的改变与变形，均应包含在本发明权利要求的保护范围内。

Claims

1.一种基于语义分割及神经网络的图像立体匹配方法，其特征在于，包括：

S1、获取场景图像的初始视差图；

2.如权利要求1所述的基于语义分割及神经网络的图像立体匹配方法，其特征在于，步骤S3中获取场景图像的精确视差图之后，还包括：

检测所述精确视差图中像素点的异常值，采取左右一致性检查来减少异常值，并使用双边滤波器对所述精确视差图进行平滑处理，使得其边缘的模糊程度降低。

3.如权利要求1所述的基于语义分割及神经网络的图像立体匹配方法，其特征在于，步骤S1中获取场景图像的初始视差图的方法为：

将所述场景图像输入卷积神经网络，所述卷积神经网络计算场景图像的匹配代价，并输出场景图像的所述初始视差图。

4.如权利要求3所述的基于语义分割及神经网络的图像立体匹配方法，其特征在于，步骤S3中选取像素点匹配代价最小的视差作为最终视差，各像素点的最终视差形成所述精确视差图。

5.如权利要求1所述的基于语义分割及神经网络的图像立体匹配方法，其特征在于，步骤S2中所述语义分割图是基于PSPNet获取的语义分割图。

6.一种基于语义分割及神经网络的图像立体匹配系统，其特征在于，包括：

初始视差图获取模块：用于获取场景图像的初始视差图；

7.如权利要求6所述的基于语义分割及神经网络的图像立体匹配系统，其特征在于，还包括校正模块：用于检测所述精确视差图中像素点的异常值，采取左右一致性检查来减少异常值，并使用双边滤波器对所述精确视差图进行平滑处理，使得其边缘的模糊程度降低。

8.如权利要求6所述的基于语义分割及神经网络的图像立体匹配系统，其特征在于，初始视差图获取模块用于将场景图像输入卷积神经网络，所述卷积神经网络计算场景图像的匹配代价，并输出场景图像的所述初始视差图。

9.如权利要求8所述的基于语义分割及神经网络的图像立体匹配系统，其特征在于，精确视差图获取模块用于选取像素点匹配代价最小的视差作为最终视差，并将各像素点的最终视差形成所述精确视差图。

10.如权利要求6所述的基于语义分割及神经网络的图像立体匹配系统，其特征在于，残差网络输入模块中所述语义分割图是基于PSPNet获取的语义分割图。