CN110533663A

CN110533663A - 一种图像视差确定方法、装置、设备及系统

Info

Publication number: CN110533663A
Application number: CN201810515532.7A
Authority: CN
Inventors: 张奎; 熊江; 杨平; 谢迪
Original assignee: Hangzhou Hikvision Digital Technology Co Ltd
Current assignee: Hangzhou Hikvision Digital Technology Co Ltd
Priority date: 2018-05-25
Filing date: 2018-05-25
Publication date: 2019-12-03
Anticipated expiration: 2038-05-25
Also published as: CN110533663B

Abstract

本申请实施例提供了一种图像视差确定方法、装置、设备及系统，方法包括：利用预设损失函数，基于多对样本图像、以及该多对样本图像的分割结果，对预设结构的初始视差网络进行训练，得到视差网络模型，图像的分割结果包括：图像中每个像素点所属平面的信息；利用该视差网络模型确定图像视差，可以识别像素点所属的平面，对于一些弱纹理区域来说，识别其像素点所属的平面后，便可以较准确地确定弱纹理区域的视差图，因此，本方案提高了视差准确性。

Description

一种图像视差确定方法、装置、设备及系统

技术领域

本申请涉及计算机视觉技术领域，特别是涉及一种图像视差确定方法、装置、设备及系统。

背景技术

对于多目相机来说，通常需要计算其包含的每对双目相机所采集的双目图像之间的视差。计算双目图像之间的视差一般包括：利用SGM(semi-global matching，半全局匹配)算法，计算双目图像之间的初始视差图；再对初始视差图进行降噪、滤波处理，得到最终的视差图。

但是这种方案中，对于双目图像中的一些弱纹理区域来说，如墙面、地面、或反光区域等，弱纹理区域对应的视差图准确性较差。

发明内容

本申请实施例的目的在于提供一种图像视差确定方法、装置、设备及系统，以提高视差准确性。

为达到上述目的，本申请实施例提供了一种图像视差确定方法，包括：

获取至少一对待处理图像；

将所述至少一对待处理图像输入预先训练得到的视差网络模型中，得到每对待处理图像的视差图；

其中，所述视差网络模型为：利用预设损失函数，基于多对样本图像、以及所述多对样本图像的分割结果，对预设结构的初始视差网络进行训练得到的；图像的分割结果包括：图像中每个像素点所属平面的信息。

可选的，采用如下步骤训练得到所述视差网络模型：

将第一组样本图像输入预设结构的初始视差网络，并利用第一预设损失函数，对所述初始视差网络进行训练，得到预训练模型；其中，所述第一预设损失函数中包含一项或多项误差参数；

获取所述第一组样本图像的分割结果；

将所述第一组样本图像、以及所述第一组样本图像的分割结果输入所述预训练模型，并利用第二预设损失函数，对所述预训练模型进行调整，得到视差网络模型；其中，所述第二预设损失函数中包含所述第一预设损失函数中的全部误差参数以及图像的分割结果对应的误差参数。

可选的，所述将所述第一组样本图像、以及所述第一组样本图像的分割结果输入所述预训练模型，包括：

基于所述第一组样本图像的分割结果，从所述第一组样本图像中抽取多对样本图像，作为目标样本图像；

将所述目标样本图像、以及所述目标样本图像的分割结果输入所述预训练模型。

可选的，所述获取所述第一组样本图像的分割结果，包括：

将所述第一组样本图像输入预先训练得到的分割网络模型，得到所述第一组样本图像的分割结果；所述分割网络模型为：以第二组样本图像的分割结果为监督，对预设结构的初始分割网络进行训练得到的；

所述将所述目标样本图像、以及所述目标样本图像的分割结果输入所述预训练模型，包括：

在所述第一组样本图像的分割结果中，得到所述目标样本图像的分割结果，作为第一分割结果；

利用边缘检测算法，对所述目标样本图像进行检测，根据检测结果，对所述第一分割结果中的平面进行分割，得到第二分割结果；

将所述目标样本图像以及所述第二分割结果输入所述预训练模型。

可选的，采用如下步骤训练得到所述分割网络模型：

将第二组样本图像及所述第二组样本图像的分割结果输入预设结构的初始分割网络，并以所述第二组样本图像的分割结果为监督，对所述初始分割网络进行训练，得到分割网络模型；其中，所述第二组样本图像为所述第一组样本图像的子集。

可选的，所述第一预设损失函数包含以下一项或多项误差参数：图像匹配误差参数、视差图平滑性误差参数、视差图左右一致性误差参数、重建图像梯度误差。

可选的，所述预训练模型的输出结果中包括多个不同尺度下的视差图；所述第一预设损失函数为所述多个不同尺度下的视差图的损失值的和；其中，一个尺度下的视差图的损失值＝(图像匹配误差参数*第一权重+视差图平滑性误差*第二权重+视差图左右一致性误差参数*第三权重+重建图像梯度误差参数*第四权重)；其中，所述第一权重、所述第一权重、所述第三权重和第四权重为预先设定的。

可选的，所述图像的分割结果对应的误差参数为：图像中所有平面的梯度参数的平均值，其中一个平面的梯度参数＝该平面中所有像素点的梯度参数的平均值，其中一个像素点的梯度参数＝该像素点的梯度值-该平面中所有像素点的梯度均值。

为达到上述目的，本申请实施例还提供了一种图像视差确定装置，包括：

第一获取模块，用于获取至少一对待处理图像；

第一输入模块，用于将所述至少一对待处理图像输入预先训练得到的视差网络模型中，得到每对待处理图像的视差图；

可选的，所述装置还可以包括：

第一训练模块，用于将第一组样本图像输入预设结构的初始视差网络，并利用第一预设损失函数，对所述初始视差网络进行训练，得到预训练模型；其中，所述第一预设损失函数中包含一项或多项误差参数；

第二获取模块，用于获取所述第一组样本图像的分割结果；

第二输入模块，用于将所述第一组样本图像、以及所述第一组样本图像的分割结果输入所述预训练模型；

调整模块，用于利用第二预设损失函数，对所述预训练模型进行调整，得到视差网络模型；其中，所述第二预设损失函数中包含所述第一预设损失函数中的全部误差参数以及图像的分割结果对应的误差参数。

可选的，所述第二输入模块，可以包括：

抽取子模块，用于基于所述第一组样本图像的分割结果，从所述第一组样本图像中抽取多对样本图像，作为目标样本图像；

输入子模块，用于将所述目标样本图像、以及所述目标样本图像的分割结果输入所述预训练模型。

可选的，所述第二获取模块，具体可以用于：

所述输入子模块，具体可以用于：

可选的，所述装置还可以包括：

第二训练模块，用于将第二组样本图像及所述第二组样本图像的分割结果输入预设结构的初始分割网络，并以所述第二组样本图像的分割结果为监督，对所述初始分割网络进行训练，得到分割网络模型；其中，所述第二组样本图像为所述第一组样本图像的子集。

为达到上述目的，本申请实施例还提供了一种电子设备，包括处理器和存储器；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一种图像视差确定方法。

为达到上述目的，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一种图像视差确定方法。

为达到上述目的，本申请实施例还提供了一种图像视差确定系统，包括：多目相机和处理设备，其中，

所述多目相机，用于采集至少一对待处理图像，并将所述至少一对待处理图像发送至所述处理设备；

所述处理设备，用于接收所述至少一对待处理图像；将所述至少一对待处理图像输入预先训练得到的视差网络模型中，得到每对待处理图像的视差图；其中，所述视差网络模型为：利用预设损失函数，基于多对样本图像、以及所述多对样本图像的分割结果，对预设结构的初始视差网络进行训练得到的；图像的分割结果包括：图像中每个像素点所属平面的信息。

应用本申请实施例，利用预设损失函数，基于多对样本图像、以及该多对样本图像的分割结果，对预设结构的初始视差网络进行训练，得到视差网络模型，图像的分割结果包括：图像中每个像素点所属平面的信息；利用该视差网络模型确定图像视差，可以识别像素点所属的平面，对于一些弱纹理区域来说，识别其像素点所属的平面后，便可以较准确地确定弱纹理区域的视差图，因此，本方案提高了视差准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种图像视差确定方法的流程示意图；

图2为本申请实施例提供的一种训练得到视差网络模型的流程示意图；

图3为本申请实施例提供的一种网络结构示意图；

图4为本申请实施例提供的不同类型的残差卷积块示意图；

图5为本申请实施例提供的一种图像视差确定装置的结构示意图；

图6为本申请实施例提供的一种电子设备的结构示意图；

图7为本申请实施例提供的一种图像视差确定系统的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了解决上述技术问题，本申请实施例提供了一种图像视差确定方法、装置及设备。该方法及装置可以应用于具有图像处理功能的各种电子设备，比如手机、电脑等等，或者也可以应用于具有图像处理功能的相机，具体不做限定。

下面首先对本申请实施例提供的一种图像视差确定方法进行详细说明。

图1为本申请实施例提供的一种图像视差确定方法的流程示意图，包括：

S101：获取至少一对待处理图像。

一对待处理图像即为需要确定视差的图像。举例来说，可以获取多目相机采集的图像，如果多目相机为双目相机，则可以将其采集的双目图像作为一对待处理图像，如果多目相机中的摄像头的数量大于二，则该多目相机包含多个双目相机，相应的，该多目相机采集的图像中也包含多对双目图像，这样也就获取到多对待处理图像。

作为一种实施方式，该多目相机可以为水平双目相机、或者垂直双目相机、或者针孔相机、或者鱼眼相机等等，具体不做限定。本申请实施例的执行主体可以为该多目相机，也可以为与该多目相机通信连接的电子设备。举例来说，多目相机可以通过USB3.0与PC(个人电脑)相连接，由PC对多目相机采集的图像进行处理，这样，可以提高图像处理速度。PC中可以包含英伟达的GPU(Graphics Processing Unit，图形处理器)，如GTX TITAN XP，这样可以进一步提高图像处理速度。

S102：将该至少一对待处理图像输入预先训练得到的视差网络模型中，得到每对待处理图像的视差图。

其中，该视差网络模型为：利用预设损失函数，基于多对样本图像、以及所述多对样本图像的分割结果，对预设结构的初始视差网络进行训练得到的；图像的分割结果包括：图像中每个像素点所属平面的信息。

本实施例中，可以先利用第一预设损失函数，并基于多对样本图像，对预设结构的初始视差网络进行训练，得到预训练模型。

可以将多对样本图像输入预设结构的初始视差网络，并利用第一预设损失函数，对该初始视差网络进行训练；第一预设损失函数中包括一项或多项误差参数，训练过程也就是对该初始视差网络中的网络参数进行迭代调整，使得第一预设损失函数中的误差参数值越来越小；满足迭代结束条件后，停止训练，也就得到了训练完成的预训练模型。该迭代结束条件可以为调整次数达到设定阈值，或者为第一预设损失函数中的误差参数值小于设定阈值，具体不做限定。

在训练得到预训练模型之外，获取上述多对样本图像的分割结果。举例来说，可以将该多对样本图像输入预先训练得到的分割网络模型，输出内容即为该多对样本图像的分割结果。

分割网络模型为：以多对样本图像的分割结果为监督，对预设结构的初始分割网络进行训练得到的。为了区分描述，将预训练模型对应的样本图像称为第一组样本图像，将分割网络模型对应的样本图像称为第二组样本图像。第一组样本图像与第二组样本图像可以针对同一场景。

训练得到预训练模型与训练得到分割网络模型的先后顺序不做限定。

训练得到分割网络模型需要以第二组样本图像的分割结果为监督，一种情况下，需要对第二组样本图像进行人工标定，这种情况下，第二组样本图像的数据量可以少一些，少于第一组样本图像的数据量，这样可以减少人工标定的工作量。

图像的分割结果包括图像中每个像素点所属平面的信息。举例来说，假设图像中包括地面、天花板、墙面、桌面这些平面，还包括桌面上的杯子及其他非平面摆件，还包括人体，则分割结果也就是针对图像中每个像素点所属的平面进行标记，比如，将属于地面的像素点标记为1，将属于天花板的像素点标记为2，将属于墙面的像素点标记为3，将属于桌面的像素点标记为4，将属于杯子、摆件、人体这些非平面的像素点标记为0。

可以将添加了标记的样本图像输入预设结构的初始分割网络，也就是以图像的分割结果为监督，对该初始分割网络进行训练，也就是对该初始分割网络中的网络参数进行迭代调整，使得该初始分割网络的输出结果与作为监督的分割结果越来越相似；满足迭代结束条件后，停止训练，也就得到了训练完成的分割网络模型。该迭代结束条件可以为调整次数达到设定阈值，或者为输出结果与作为监督的分割结果的相似度达到设定阈值，具体不做限定。

训练得到分割网络模型后，将上述第一组样本图像输入该分割网络模型，便得到了第一组样本图像的分割结果。

然后，将上述第一组样本图像以及上述第一组样本图像的分割结果输入预训练模型，并利用第二预设损失函数，对该预训练模型进行训练。或者，也可以从第一组样本图像中抽取一部分，并将所抽取的样本图像及其分割结果输入预训练模型，并利用第二预设损失函数，对该预训练模型进行训练。

第二预设损失函数中包含第一预设损失函数中的全部误差参数以及图像的分割结果对应的误差参数；训练过程也就是对该预训练模型中的网络参数进行迭代调整，使得第二预设损失函数中的误差参数值越来越小；满足迭代结束条件后，停止训练，也就得到了训练完成的视差网络模型。该迭代结束条件可以为调整次数达到设定阈值，或者为第二预设损失函数中的误差参数值小于设定阈值，具体不做限定。

举例来说，所述第一预设损失函数可以包含以下一项或多项误差参数：图像匹配误差参数、视差图平滑性误差参数、视差图左右一致性误差参数、重建图像梯度误差。

预训练模型的输出结果中可以包括多个不同尺度下的视差图；所述第一预设损失函数为所述多个不同尺度下的视差图的损失值的和；其中，一个尺度下的视差图的损失值＝(图像匹配误差参数*第一权重+视差图平滑性误差*第二权重+视差图左右一致性误差参数*第三权重+重建图像梯度误差参数*第四权重)；其中，所述第一权重、所述第一权重、所述第三权重和第四权重为预先设定的。

不同尺度下的视差图的分辨率是不同的，其中，高分辨率的视差图可以更好的保留图像中的细节信息，低分辨率的视差图可以更好的恢复视差图的全局结构信息。也就是说，将S101中获取的待处理图像输入至视差网络模型中，可以输出不同尺度下的视差图，既可以保留图像中的细节信息，又可以恢复视差图的全局结构信息。

如果一对待处理图像包括左图像和右图像，则所述图像匹配误差参数＝左图像的图像匹配误差参数+右图像的图像匹配误差参数；所述视差图平滑性误差参数＝左图像的视差图平滑性误差参数+右图像的视差图平滑性误差参数；所述视差图左右一致性误差参数＝左图像的视差图左右一致性误差参数+右图像的视差图左右一致性误差参数；所述重建图像梯度误差参数＝左图像的重建图像梯度误差参数+右图像的重建图像梯度误差参数。

下面对训练得到视差网络模型的过程进行详细介绍：

图2为本申请实施例提供的一种训练得到视差网络模型的流程示意图，包括：

S201：将第一组样本图像输入预设结构的初始视差网络，并利用第一预设损失函数，对该初始视差网络进行训练，得到预训练模型；其中，第一预设损失函数中包含一项或多项误差参数。

为了与后面内容中的其他样本图像相区分，这里将预训练模型对应的样本图像称为第一组样本图像。举例来说，可以获取2万对样本图像，作为第一组样本图像，将这2万对样本图像输入预设结构的初始视差网络。

初始视差网络可以为编码解码(Ecoder-Decoder)网络，初始视差网络的网络结构可以如图3所示，图3中，layer表示层的名称，chns表示层的输入输出通道数量，I/O表示层的采样尺度，k表示层中卷积核的大小，s表示层中卷积操作的步长，input表示层的输入数据，+表示数据在通道上的叠加，*表示尺度为2的上采样操作；conv表示二维的卷积操作，iconv表示二维的反卷积操作，upconv表示上采样和二维卷积操作的集合，disp表示不同采样尺度的视差图。

图3中通过大小为3、步长为1的二维卷积获取视差，并使用sigmoid作为激活函数，或者说，解码网络中的视差获取层中包含大小为3、步长为1的二维卷积，并使用sigmoid作为激活函数。

编码网络中每一个卷积层后都可以跟随一个BN(Batch Normalization)层，另外，编码网络中除最后一个卷积层外其他卷积层在BN层之后还可以跟随一个ELU(ExponentialLinear Unit，指数线性单元)层，解码网络中除视差获取层外其他卷积层之后也可以跟随一个ELU层。

图3中的res_bi表示残差卷积块，图4展示了两种不同的残差卷积块block1和block2，图4中表示卷积核大小为k，步长为s的二维卷积操作。

如上所述，将2万对样本图像分别输入图3中的初始视差网络，并利用第一预设损失函数，对该初始视差网络进行训练。图3中的初始视差网络输出4个不同尺度的视差图，第一预设损失函数为这4个不同尺度下的视差图的损失值的和，假设一对待处理图像包括左图像和右图像，则一个尺度下的视差图的损失值可以为：

其中，L_n表示上述4个视差图中的一张视差图，n可以1、2、3、4；w_im表示第一权重，w_ds表示第二权重，w_lr表示第三权重，w_g表示第四权重，举例来说，第一权重可以为1.0，第二权重可以为0.1，第三权重可以为1.0，第四权重可以为0.1；表示左图像的图像匹配误差参数，表示右图像的图像匹配误差参数，表示左图像的视差图平滑性误差参数，表示右图像的视差图平滑性误差参数，表示左图像的视差图左右一致性误差参数，表示右图像的视差图左右一致性误差参数，表示左图像的重建图像梯度误差参数，表示右图像的重建图像梯度误差参数。

具体的，左图像的图像匹配误差参数可以为：

其中，N表示左图像中所有像素点的数量，ij表示一个像素点的坐标，α表示左图像SSIM(structural similarity index measurement，一种衡量两幅图像结构相似度的指标)损失值和一阶图像差异损失值之间的权重；表示左图像，表示根据右图像及输出的左视差图生成的左视图重建图像，表示左图像与该重建左图像的一阶颜色值差异。

根据右图像及输出的左视差图，生成左视图重建图像的过程可以如下式所示：表示右图像，表示视差值。视差值可以为浮点型数据，图像重建时可以使用双线性插值方法。

右图像匹配误差参数与左图像匹配误差参数的计算过程类似，不再赘述。

左图像的视差图平滑性误差参数可以为：

其中，N表示左图像中所有像素点的数量，ij表示一个像素点的坐标，表示水平一阶梯度，表示垂直一阶梯度。

损失函数中设置视差图平滑性误差参数的目的在于，使得视差图尽量平滑，也就是视差图的梯度和尽量最小。但由于图像边缘部分的视差不连续性，也就是视差存在跳变，因此，这里的视差图平滑性误差参数对左图像和右图像的梯度做了加权。右图像的视差图平滑性误差参数与左图像的视差图平滑性误差参数的计算过程类似，不再赘述。

左图像的视差图左右一致性误差参数可以为：

其中，N表示左图像中所有像素点的数量，ij表示一个像素点的坐标，表示左图像的视差图，表示右图像的视差图。右图像的视差图左右一致性误差参数与左图像的视差图左右一致性误差参数的计算过程类似，不再赘述。

损失函数中设置视差图左右一致性误差参数的目的在于，使得初始视差网络输出的左右图像的视差图尽量一致。

可以对损失函数中的各项损失值求导，并利用Adam参数优化方法对初始视差网络的网络参数进行迭代更新。训练过程中，损失函数的值越来越小。举例来说，可以设定训练次数，当达到训练次数的情况下，训练完成，得到预训练模型。

举例来说，可以使用使用RMSProp参数优化方法，学习率固定为1e-3，batch(批处理量)的大小为训练时使用的GPU的数量乘以4。利用2万对待处理图像对初始视差网络进行训练，可以训练50轮，之后得到的即为预训练模型。

S202：获取该第一组样本图像的分割结果。

S201与S202的执行顺序不做限定，可以先执行S201再执行S202，也可以先执行S202再执行S201，也可以同时执行。

举例来说，可以将所述第一组样本图像输入预先训练得到的分割网络模型，得到所述第一组样本图像的分割结果；所述分割网络模型为：以第二组样本图像的分割结果为监督，对预设结构的初始分割网络进行训练得到的。

举例来说，训练得到分割网络模型的过程可以包括：将第二组样本图像及所述第二组样本图像的分割结果输入预设结构的初始分割网络，并以所述第二组样本图像的分割结果为监督，对所述初始分割网络进行训练，得到分割网络模型；其中，所述第二组样本图像为所述第一组样本图像的子集。

举例来说，可以从上述2万对样本图像中选取2500对样本图像，作为第二组样本图像。一种情况下，可以对第二组样本图像进行人工标定，得到第二组样本图像的分割结果。

举例来说，假设图像中包括地面、天花板、墙面、桌面这些平面，还包括桌面上的杯子及其他非平面摆件，还包括人体，则分割结果也就是针对图像中每个像素点所属的平面进行标记，比如，将属于地面的像素点标记为1，将属于天花板的像素点标记为2，将属于墙面的像素点标记为3，将属于桌面的像素点标记为4，将属于杯子、摆件、人体这些非平面的像素点标记为0。

可以对上述2500对第二组样本图像进行标记，将标记结果也就是分割结果作为监督，对该初始分割网络进行训练，也就是对该初始分割网络中的网络参数进行迭代调整，使得该初始分割网络的输出结果与作为监督的分割结果越来越相似；满足迭代结束条件后，停止训练，也就得到了训练完成的分割网络模型。该迭代结束条件可以为调整次数达到设定阈值，或者为输出结果与作为监督的分割结果的相似度达到设定阈值，具体不做限定。

S203：将该第一组样本图像、以及该第一组样本图像的分割结果输入该预训练模型，并利用第二预设损失函数，对该预训练模型进行调整，得到视差网络模型。

其中，所述第二预设损失函数中包含所述第一预设损失函数中的全部误差参数以及图像的分割结果对应的误差参数。

可以将上述2万对样本图像都输入该预训练模型，也可以从这2万对样本图像中抽取一部分输入该预训练模型。举例来说，可以从这2万对样本图像中抽取约1/15的数据输入该预训练模型。

作为一种实施方式，可以基于所述第一组样本图像的分割结果，从所述第一组样本图像中抽取多对样本图像，作为目标样本图像；将所述目标样本图像、以及所述目标样本图像的分割结果输入所述预训练模型。

比如，可以将这2万对样本图像输入分割网络模型，得到每对样本图像对应的分割结果，基于分割结果中属于平面的像素点的数量，对这2万对样本图像进行排序，具体的，可以按照数量由多到少的顺序排列，并选择前1400对样本图像，作为目标样本图像。

作为一种实施方式，将目标样本图像、以及所述目标样本图像的分割结果输入预训练模型，可以包括：。

举例来说，假设样本图像中存在一个方形桌面，可以理解，方形桌面存在6个平面，但是分割网络模型通常将这6个平面中的像素点识别为同一平面，这种情况下，可以利用边缘检测算法，对分割网络模型输出的分割结果作进一步分割，这样，便可以将上述识别出的一个平面细分为6个桌面，提高了分割结果的准确性。

如上所述，第二预设损失函数在第一预设损失函数的基础上，增加一项误差参数：图像的分割结果对应的误差参数，具体可以为：图像中所有平面的梯度参数的平均值，其中一个平面的梯度参数＝该平面中所有像素点的梯度参数的平均值，其中一个像素点的梯度参数＝该像素点的梯度值-该平面中所有像素点的梯度均值。

第二预设损失函数可以表示为其中，L表示第二预设损失函数，Lp表示第一预设损失函数，表示图像的分割结果对应的误差参数。

作为一种实施方式，其中，p表示像素点，P表示平面，p∈P表示像素点p属于平面P，N表示图像中所包含的平面的数量，|p|表示一个平面中像素点的数量，i表示一个平面中的第i个像素点，为第i个像素点的梯度，表示一个平面内所有像素点的梯度均值。

延续上述例子，可以从这2万对样本图像中抽取1400对样本图像，将这1400对样本图像输入该预训练模型，可以对这1400对样本图像进行30轮训练，之后得到的即为视差网络模型。

对预训练模型进行训练得到视差网络模型的过程，也可以理解为对预训练模型进行微调的过程，该过程的计算量小于训练得到预训练模型的计算量。

一般来说，对于墙面、地面、或反光区域等弱纹理区域的像素点来说，通常较难确定这些像素点对应的视差，而本实施例中，识别出这些弱纹理区域的像素点，并确定这些像素点所在的平面，基于这些像素点所在的平面，确定这些像素点对应的视差，准确度较高。

应用本申请所示实施例，利用预设损失函数，基于多对样本图像、以及该多对样本图像的分割结果，对预设结构的初始视差网络进行训练，得到视差网络模型，图像的分割结果包括：图像中每个像素点所属平面的信息；利用该视差网络模型确定图像视差，可以识别像素点所属的平面，对于一些弱纹理区域来说，识别其像素点所属的平面后，便可以较准确地确定弱纹理区域的视差图，因此，本方案提高了视差准确性。

与上述方法实施例相对应，本申请实施例还提供一种图像视差确定装置，如图5所示，包括：

第一获取模块501，用于获取至少一对待处理图像；

第一输入模块502，用于将所述至少一对待处理图像输入预先训练得到的视差网络模型中，得到每对待处理图像的视差图；

作为一种实施方式，所述装置还可以包括：第一训练模块、第二获取模块、第二输入模块和调整模块(图中未示出)，其中，

第二获取模块，用于获取所述第一组样本图像的分割结果；

作为一种实施方式，所述第二输入模块，可以包括：

作为一种实施方式，所述第二获取模块，可以具体用于：

所述输入子模块，具体可以用于：

作为一种实施方式，所述装置还可以包括：

第二训练模块(图中未示出)，用于将第二组样本图像及所述第二组样本图像的分割结果输入预设结构的初始分割网络，并以所述第二组样本图像的分割结果为监督，对所述初始分割网络进行训练，得到分割网络模型；其中，所述第二组样本图像为所述第一组样本图像的子集。

作为一种实施方式，所述第一预设损失函数包含以下一项或多项误差参数：图像匹配误差参数、视差图平滑性误差参数、视差图左右一致性误差参数、重建图像梯度误差。

作为一种实施方式，所述预训练模型的输出结果中包括多个不同尺度下的视差图；所述第一预设损失函数为所述多个不同尺度下的视差图的损失值的和；其中，一个尺度下的视差图的损失值＝(图像匹配误差参数*第一权重+视差图平滑性误差*第二权重+视差图左右一致性误差参数*第三权重+重建图像梯度误差参数*第四权重)；其中，所述第一权重、所述第一权重、所述第三权重和第四权重为预先设定的。

作为一种实施方式，所述一对待处理图像包括左图像和右图像；所述图像匹配误差参数＝左图像的图像匹配误差参数+右图像的图像匹配误差参数；所述视差图平滑性误差参数＝左图像的视差图平滑性误差参数+右图像的视差图平滑性误差参数；所述视差图左右一致性误差参数＝左图像的视差图左右一致性误差参数+右图像的视差图左右一致性误差参数；所述重建图像梯度误差参数＝左图像的重建图像梯度误差参数+右图像的重建图像梯度误差参数。

作为一种实施方式，所述图像的分割结果对应的误差参数为：图像中所有平面的梯度参数的平均值，其中一个平面的梯度参数＝该平面中所有像素点的梯度参数的平均值，其中一个像素点的梯度参数＝该像素点的梯度值-该平面中所有像素点的梯度均值。

应用本申请图5所示实施例，利用预设损失函数，基于多对样本图像、以及该多对样本图像的分割结果，对预设结构的初始视差网络进行训练，得到视差网络模型，图像的分割结果包括：图像中每个像素点所属平面的信息；利用该视差网络模型确定图像视差，可以识别像素点所属的平面，对于一些弱纹理区域来说，识别其像素点所属的平面后，便可以较准确地确定弱纹理区域的视差图，因此，本方案提高了视差准确性。

本申请实施例还提供了一种电子设备，如图6所示，包括处理器601和存储器602，

存储器602，用于存放计算机程序；

处理器601，用于执行存储器602上所存放的程序时，实现上述任一种图像视差确定方法。

上述电子设备提到的存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一种图像视差确定方法。

本申请实施例还提供一种图像视差确定系统，如图7所示，包括：多目相机和处理设备，其中，

该多目相机可以为双目相机、三目相机等等，多目相机中包括的摄像头数量不做限定。该多目相机可以为针孔相机、鱼眼相机等等，具体不做限定。

该处理设备可以为PC，PC可以通过USB3.0与该多目相机相连接，或者，也可以通过其他有线或无线的连接方式相连接，具体不做限定。该处理设备还可以执行上述任一种图像视差确定方法。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于图5所示的图像视差确定装置实施例、图6所示的电子设备实施例、上述计算机可读存储介质实施例、以及图7所示的图像视差确定系统实施例而言，由于其基本相似于图1-4所示的图像视差确定方法实施例，所以描述的比较简单，相关之处参见图1-4所示的图像视差确定方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

Claims

1.一种图像视差确定方法，其特征在于，包括：

获取至少一对待处理图像；

2.根据权利要求1所述的方法，其特征在于，采用如下步骤训练得到所述视差网络模型：

获取所述第一组样本图像的分割结果；

3.根据权利要求2所述的方法，其特征在于，所述将所述第一组样本图像、以及所述第一组样本图像的分割结果输入所述预训练模型，包括：

4.根据权利要求3所述的方法，其特征在于，所述获取所述第一组样本图像的分割结果，包括：

5.根据权利要求4所述的方法，其特征在于，采用如下步骤训练得到所述分割网络模型：

6.根据权利要求1所述的方法，其特征在于，所述第一预设损失函数包含以下一项或多项误差参数：图像匹配误差参数、视差图平滑性误差参数、视差图左右一致性误差参数、重建图像梯度误差。

7.根据权利要求6所述的方法，其特征在于，所述预训练模型的输出结果中包括多个不同尺度下的视差图；所述第一预设损失函数为所述多个不同尺度下的视差图的损失值的和；其中，一个尺度下的视差图的损失值＝(图像匹配误差参数*第一权重+视差图平滑性误差*第二权重+视差图左右一致性误差参数*第三权重+重建图像梯度误差参数*第四权重)；其中，所述第一权重、所述第一权重、所述第三权重和第四权重为预先设定的。

8.根据权利要求1所述的方法，其特征在于，所述图像的分割结果对应的误差参数为：图像中所有平面的梯度参数的平均值，其中一个平面的梯度参数＝该平面中所有像素点的梯度参数的平均值，其中一个像素点的梯度参数＝该像素点的梯度值-该平面中所有像素点的梯度均值。

9.一种图像视差确定装置，其特征在于，包括：

第一获取模块，用于获取至少一对待处理图像；

10.根据权利要求9所述的装置，其特征在于，所述装置还包括：

第二获取模块，用于获取所述第一组样本图像的分割结果；

11.根据权利要求10所述的装置，其特征在于，所述第二输入模块，包括：

12.根据权利要求11所述的装置，其特征在于，所述第二获取模块，具体用于：

所述输入子模块，具体用于：

13.根据权利要求12所述的装置，其特征在于，所述装置还包括：

14.根据权利要求9所述的装置，其特征在于，所述第一预设损失函数包含以下一项或多项误差参数：图像匹配误差参数、视差图平滑性误差参数、视差图左右一致性误差参数、重建图像梯度误差。

15.根据权利要求14所述的装置，其特征在于，所述预训练模型的输出结果中包括多个不同尺度下的视差图；所述第一预设损失函数为所述多个不同尺度下的视差图的损失值的和；其中，一个尺度下的视差图的损失值＝(图像匹配误差参数*第一权重+视差图平滑性误差*第二权重+视差图左右一致性误差参数*第三权重+重建图像梯度误差参数*第四权重)；其中，所述第一权重、所述第一权重、所述第三权重和第四权重为预先设定的。

16.根据权利要求9所述的装置，其特征在于，所述图像的分割结果对应的误差参数为：图像中所有平面的梯度参数的平均值，其中一个平面的梯度参数＝该平面中所有像素点的梯度参数的平均值，其中一个像素点的梯度参数＝该像素点的梯度值-该平面中所有像素点的梯度均值。

17.一种图像视差确定系统，其特征在于，包括：多目相机和处理设备，其中，