WO2023272524A1

WO2023272524A1 - 双目拍摄装置及确定其观测深度的方法、装置、可移动平台

Info

Publication number: WO2023272524A1
Application number: PCT/CN2021/103269
Authority: WO
Inventors: 戴玉超; 樊斌; 王珂; 周游; 刘洁; 叶长春
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2023-01-05

Abstract

一种确定双目拍摄装置的观测深度的方法，包括：获取双目拍摄装置中的第一拍摄装置拍摄的第一图像和第二拍摄装置拍摄的第二图像，其中，第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的(S110)；根据第一图像和第二图像，确定双目拍摄装置的初始观测深度(S120)；根据初始观测深度确定曝光过程中双目拍摄装置的第一运动(S130)；根据确定的双目拍摄装置的第一运动，对第一图像和第二图像进行去畸变处理(S140)；根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定双目拍摄装置的观测深度(S150)。本申请能够基于卷帘快门相机较好的实现双目视觉系统。还提供了双目拍摄装置、确定装置、可移动平台和存储介质。

Description

双目拍摄装置及确定其观测深度的方法、装置、可移动平台

技术领域

本申请涉及深度估计技术领域，尤其涉及一种双目拍摄装置及确定其观测深度的方法、装置、可移动平台。

背景技术

双目视觉系统作为计算机视觉的一个分支，是计算机视觉领域十分重要的研究方向。双目视觉系统能获得更丰富的场景信息和三维感知信息，在机器人导航、三维重建和自动驾驶中扮演着重要角色。而双目深度估计技术作为双目视觉系统的基础，是双目视觉技术研究的核心工作，近年来也有许多比较经典的方案被提出，比如SGM、SPS-Stereo等。他们主要效力于全局快门双目相机，即使左右相机之间存在小的标定误差，也可以事先通过双目校正(rect i fy)得到满足“极线水平”这一特性的全局快门双目图像。

目前卷帘快门相机不能较好的实现双目视觉系统。

发明内容

本申请提供了一种双目拍摄装置及确定其观测深度的方法、装置、可移动平台，能够基于卷帘快门相机较好的实现双目视觉系统。

第一方面，本申请实施例提供了一种确定双目拍摄装置的观测深度的方法，包括：

获取双目拍摄装置中的第一拍摄装置拍摄的第一图像和第二拍摄装置拍摄的第二图像，其中，所述第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的；

根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度；

根据所述初始观测深度确定曝光过程中所述双目拍摄装置的第一运动；

根据确定的所述双目拍摄装置的第一运动，对所述第一图像和所述第二图像进行去畸变处理；

根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定所述双目拍摄装置的观测深度。

第二方面，本申请实施例提供了一种双目拍摄装置，包括第一拍摄装置和第二拍摄装置，所述第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的；

所述双目拍摄装置还包括一个或多个处理器，单独地或共同地工作，用于执行如下步骤：

获取所述第一拍摄装置拍摄的第一图像和所述第二拍摄装置拍摄的第二图像，其中，所述第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的；

第三方面，本申请实施例提供了一种观测深度确定装置，包括一个或多个处理器，单独地或共同地工作，用于执行前述的确定双目拍摄装置的观测深度的方法的步骤。

第四方面，本申请实施例提供了一种可移动平台，搭载第一拍摄装置和第二拍摄装置，所述第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的；

所述可移动平台还包括一个或多个处理器，单独地或共同地工作，用于执行前述的确定双目拍摄装置的观测深度的方法的步骤。

第五方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现上述的方法的步骤。

本申请实施例提供了一种双目拍摄装置及确定其观测深度的方法、装置、可移动平台，方法包括：获取卷帘快门双目相机拍摄的第一图像和第二图像，根据第一图像和第二图像，确定双目拍摄装置的初始观测深度；根据初始观测深度确定曝光过程中双目拍摄装置的第一运动；根据确定的双目拍摄装置的第一运动，对第一图像和第二图像进行去畸变处理；根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定双目拍摄装置的观测深度，可以实现和提升基于卷帘快门双目相机的深度感知。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请实施例的公开内容。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的确定双目拍摄装置的观测深度的方法的流程示意图；

图2是图1中方法的一种实施场景的示意图；

图3是卷帘快门相机曝光的示意图；

图4是三角化测量法的原理示意图；

图5是第一拍摄装置和第二拍摄装置运动关系的示意图；

图6是本申请实施例提供的一种双目拍摄装置的示意性框图；

图7是本申请实施例提供的一种观测深度确定装置的示意性框图；

图8是本申请实施例提供的一种可移动平台的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

传统的双目深度估计算法旨在最优化匹配代价值的基础上获得双目图像中精确的匹配像素点，进而得到准确的视差值和深度值。双目视差值的计算步骤可以概括为：匹配代价计算、代价聚合、视差计算与视差优化。他们多围绕匹配代价计算和视差优化等进行展开，一般使用局部或者全局的方式为每个像素分配视差值，并且设计良好的匹配代价函数表示像素之间的相似度。但是传统算法往往无法对低纹理甚至无纹理的区域得到比较好的视差估计结果。并且在传统算法中，经验参数的选择对匹配结果的影响较大。近年来，基于深度学习的深度估计算法可以通过卷积、池化等操作提取到图像的局部信息特征，并且提取图像的多层特征用于代价计算，然后通过上采样操作提取图像的全局特征和完成代价聚合等步骤，得到了准确的双目深度估计结果。但是，这些双目深度估计算法都是基于校正后的全局快门双目图像，即左、右目图像满足“极线水平”的特性。目前卷帘快门相机不能较好的实现双目视觉系统。

请参阅图1，图1是本申请实施例提供的一种确定双目拍摄装置的观测深度的方法的流程示意图。所述方法可以应用在双目视觉系统中，双目视觉系统搭载第一拍摄装置和第二拍摄装置以及处理器，处理器用于执行所述方法的步骤，根据第一拍摄装置和第二拍摄装置拍摄的图像确定观测深度。所述方法也可以应用在不包括拍摄装置的设备，如观测深度确定装置中，该设备可以与双目的拍摄装置通信连接，获取双目的拍摄装置拍摄的图像，以及根据获取的图像确定拍摄装置的观测深度。举例而言，双目视觉系统包括搭载第一拍摄装置和第二拍摄装置的双目拍摄装置或者搭载第一拍摄装置和第二拍摄装置的可移动平台。举例而言，观测深度确定装置可以包括终端设备或服务器。其中终端设备可以包括手机、平板电脑、笔记本电脑、台式电脑、个人数字助理、穿戴式设备、遥控器等中的至少一项；可移动平台可以包括无人飞行器、云台、无人车等中的至少一种。进一步而言，无人飞行器可以为旋翼型无人机，例如四旋翼无人机、六旋翼无人机、八旋翼无人机，也可以是固定翼无人机。

在一些实施方式中，确定双目拍摄装置的观测深度的方法可以应用于无人机、智能机器人、无人驾驶汽车或者全景深度相机等设备中，以便实现对设备周围场景的三维形状的感知和位置距离的测量。

在一些实施方式中，请参阅图2，可移动平台10搭载两个相邻设置的拍摄装置11，可移动平台10能够与终端设备20进行通信，以将拍摄装置11获取的图像传输给终端设备20，终端设备20可以根据接收的图像确定拍摄装置11的观测深度。示例性的，终端设备20例如可以对所述观测深度进行可视化处理。

在一些实施方式中，请参阅图2，可移动平台10搭载两个相邻设置的拍摄装置11，可移动平台10能够根据拍摄装置11获取的图像确定拍摄装置11的观测深度，以及将确定的观测深度传输给终端设备20，终端设备20例如可以对观测深度进行可视化处理。

如图1所示，本申请实施例的确定双目拍摄装置的观测深度的方法包括步骤S110至步骤S150。

S110、获取双目拍摄装置中的第一拍摄装置拍摄的第一图像和第二拍摄装置拍摄的第二图像，其中，所述第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的。

在一些实施方式中，获取双目拍摄装置中的第一拍摄装置可以称为左目相机、第二拍摄装置可以称为右目相机，当然也不限于此，例如第一拍摄装置可以称为右目相机、第二拍摄装置可以称为左目相机。可以理解的，第一拍摄装置和第二拍摄装置采集相同场景的图像，例如，安装在固定位置的两个拍摄装置从不同角度同时采集同一场景的数字图像。

在一些实施方式中，第一拍摄装置和第二拍摄装置可以包括卷帘快门(rolling shutter)相机，双目拍摄装置可以称为卷帘快门双目相机。

如图3所示，由于卷帘快门相机的逐行曝光机制会导致卷帘快门相机获取的图像存在严重的几何畸变，会损害匹配代价的计算，且当左右相机之间存在小的标定误差时获取的卷帘快门双目图像无法简单地通过双目校正实现“极线水平”，请参阅图3，卷帘快门相机获取的图像每行对应的相机位姿都各不相同，这导致了双目校正方法无法直接应用于卷帘快门双目图像校正，即无法真正地实现卷帘快门左右目图像之间的“极线水平”。因此目前用于全局快门的双目深度估计方法直接用于卷帘快门双目相机时难以得到令人满意的结果，难以获得卷帘快门双目相机的深度的准确估计。本申请的发明人对确定双目拍摄装置的观测深度的方法进行改进，以提升卷帘快门双目相机系统的深度感知能力。

S120、根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度。

示例性的，可以基于三角化测量法，根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度。请参阅图4，G代表世界坐标系(或者称为大地坐标系，Ground)下的原点，C0、C1、C2是三个不同的相机位姿，从不同角度位姿来拍摄位置P的同一个蜜蜂，可以看到对于蜜蜂蛰在图像上的点不一样，分别是P0、P1、P2。R表示两个位姿之间的旋转变换,T表示两个位姿之间的位移变换；在已经确定几个相机位姿的情况下，可以求解得到蜜蜂P的真实三维位置，得到蜜蜂P与相机的广信之间的距离，或者称为深度信息。

在一些实施方式中，所述根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度，包括：确定所述第一图像和所述第二图像上匹配(stereo match)的像素；根据所述匹配的像素在所述第一图像上的位置和在所述第二图像上的位置，确定所述匹配的像素之间的光流；根据所述匹配的像素之间的光流，确定所述双目拍摄装置的初始观测深度。

虽然卷帘快门图像存在视觉失真，比如倾斜、摇晃等，但是不太影响光流的估计，忽略卷帘快门的影响，可以直接基于事先标定的双目相机的内参、外参利用三角化技术估计出初始的卷帘快门双目深度图(粗略的深度图)。

示例性的，对于第一图像上的第一像素，在第二图像上确定所述第一像素匹配的第二像素，第一像素和匹配的第二像素能够对应拍摄场景中的同一位置。根据第一像素在所述第一图像上的位置和第二像素在所述第二图像上的位置的偏移量确定第一像素和第二像素之间的光流，或者称为视差。

在一些实施方式中，所述根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度，包括：对所述匹配的像素之间的光流进行三角化处理，得到所述匹配的像素对应的深度值。

示例性的，可以根据预先标定的卷帘快门双目相机的内参和外参，以及匹配的像素之间的光流，确定所述双目拍摄装置的观测深度，由于卷帘快门相机拍摄的图像存在视觉失真，比如倾斜、摇晃等，所述确定的双目拍摄装置的观测深度不够精确，可以称为初始观测深度。示例性的，所述外参例如包括第一拍摄装置和第二拍摄装置的位姿之间的旋转变换R和位移变换T，所述内参例如包括相机矩阵(calibration matrix)，也可称为相机内参矩阵(camera instrinsic)。

示例性的，所述确定所述第一图像和所述第二图像上匹配的像素，包括：在所述第二图像上确定与所述第一图像上每个像素匹配的像素。通过对所述第一图像和所述第二图像进行稠密光流匹配，可以确定在所述第二图像上确定与所述第一图像上每个像素匹配的像素，以及确定每个像素的光流，可以得到分辨率更高的初始观测深度。例如每个像素都有一个深度值，例如分辨率640×480的第一图像可以确定640×480个深度值。

示例性的，可以通过机器学习模型，如深度神经网络PWC-Net对所述第一图像和所述第二图像进行稠密光流匹配，当然也不限于此。

在一些实施方式中，所述根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度，包括：将所述第一图像和所述第二图像输入预设的光流估计网络模型，得到所述第一图像和所述第二图像上匹配的像素之间的光流；根据所述匹配的像素之间的光流，确定所述双目拍摄装置的初始观测深度。

示例性的，可以通过基于卷积神经网络的光流估计模型，确定所述第一图像和所述第二图像上匹配的像素之间的光流。举例而言，可以所述光流估计模型可以包括FlowNet网络模型，当然也不限于此。

S130、根据所述初始观测深度确定曝光过程中所述双目拍摄装置的第一运动。

请参阅图5，曝光过程中所述双目拍摄装置的第一运动包括第一拍摄装置的第一运动和第二拍摄装置的第一运动，示例性的，基于第一拍摄装置和第二拍摄装置的位姿之间的旋转变换R(Rotation Matrix)和位移变换T(Translation Matrix)，可以根据第一拍摄装置的第一运动确定第二拍摄装置的第一运动。

在一些实施方式中，所述第一运动的运动模型可以包括匀速(Uniform)运动模型，当然也不限于此，例如还可以包括加速运动模型。示例性的，所述匀速运动模型的运动参数包括线速度和/或角速度，所述加速运动模型的运动参数可以包括线加速度和/或角加速度。

示例性的，所述第一运动的运动时长是根据所述第一拍摄装置的曝光时长和/或所述第二拍摄装置的曝光时长确定的，例如所述匀速运动模型对应的运动时长是根据所述第一拍摄装置的曝光时长和/或所述第二拍摄装置的曝光时长确定的。例如，第一运动的运动时长为第一拍摄装置从开始曝光(即第一行开始曝光时刻)到最后一行像素曝光所经过的时间，例如为第一拍摄装置图像传感器中的感测单元像素的总行数与每行曝光时间的乘积。

在一些实施方式中，所述根据所述初始观测深度确定曝光过程中所述双目拍摄装置的第一运动，包括：初始化所述第一运动的运动参数；对所述第一运动的运动参数以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数。

示例性的，基于所述第一图像和所述第二图像中包含的信息，对所述第一运动的运动参数以及所述初始观测深度进行优化。实现了卷帘快门双目相机自运动的优化求解方法，能够更准确地估计卷帘快门双目相机的自运动。

示例性的，由于极短的曝光时间内双目相机的自运动通常较小，所述第一运动的初始化值可以为零向量，例如初始化第一拍摄装置的第一运动的线速度、角速度和第二拍摄装置的第一运动的线速度、角速度均为零。当然也不限于此。

示例性的，所述获取所述第一运动的初始化值，包括：根据相邻帧的所述第一图像，确定所述相邻帧的时间段内所述双目拍摄装置的第二运动；根据所述第二运动确定所述第一运动的初始化值。示例性的，根据前后时刻左目图像之间的帧匹配(frame match)得到初始的运动估计，即第一运动的运动参数的初始化值。可以提高优化效率，加快优化速度。

根据初始观测深度和初始化的第一运动的运动参数进行优化，可以得到更加精准的运动状态，即所述双目拍摄装置的第一运动。

在一些实施方式中，对所述第一运动的运动参数以及所述初始观测深度进行优化的目标为：根据优化后的所述第一运动的运动参数以及优化后的所述初始观测深度确定的重投影误差收敛或者小于预设的误差阈值。

在一些实施方式中，所述对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数，包括：基于预设的卷帘快门双目相机的重投影误差模型，对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数。

示例性的，将所述第一运动的初始化值以及所述初始观测深度输入所述卷帘快门双目相机的重投影误差模型，确定所述第一图像对应的重投影误差；根据所述重投影误差调整所述第一运动的运动参数和所述初始观测深度，将调整后的第一运动的运动参数和所述初始观测深度再次输入所述卷帘快门双目相机的重投影误差模型，确定调整后的重投影误差，经过多次迭代调整，第一图像对应的重投影误差收敛或者小于预设的误差阈值时，可以得到优化后的所述第一运动的运动参数以及优化后的所述初始观测深度。

示例性的，所述卷帘快门双目相机的重投影误差模型根据是根据双目相机的投影方程和所述第一运动的运动模型确定的，能更好地指示卷帘快门双目图像匹配点之间的几何约束。

示例性的，双目相机的投影方程包括第一拍摄装置和第二拍摄装置的针孔相机投影模型。

示例性的，双目相机的投影方程用于指示所述第一图像上第一像素的位置、所述第一像素对应的观测深度、所述第一像素对应的空间位置X、所述第一拍摄装置的内参、外参之间的关系，以及用于指示所述第二图像上第二像素的位置、所述第二像素对应的观测深度、所述第二像素对应的空间位置X、所述第二拍摄装置的内参、外参、所述第一拍摄装置和第二拍摄装置的位姿之间的旋转变换R、位移变换T之间的关系。其中，第一拍摄装置的外参，如第一拍摄装置的相机坐标系与世界坐标系之间的旋转变换Rl与位移变换T l可以根据第一运动的运动模型确定，例如根据第一拍摄装置的线速度、角速度和运动时长确定；第二拍摄装置的外参，如第二拍摄装置的相机坐标系与世界坐标系之间的旋转变换Rr与位移变换Tr可以根据第一运动的运动模型确定，例如根据第二拍摄装置的线速度、角速度和运动时长确定。

示例性的，将所述第一运动的初始化值、所述初始观测深度以及所述第一图像和所述第二图像上匹配的像素的位置输入所述重投影误差模型，根据重投影误差模型确定的重投影误差对所述第一运动的运动参数以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数。

在一些实施方式中，所述对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数，包括：基于卷帘快门双目相机的投影方程，根据所述第一运动的运动参数以及所述初始观测深度，确定所述第一图像上的像素在所述第二图像(第二图像对应的相机位姿的归一化平面)上的重投影；根据所述第二图像上的重投影的位置和所述第二图像上对应的像素的位置，确定重投影误差；根据所述重投影误差对所述第一运动的初始化值以及所述初始观测深度进行优化。

示例性的，所述卷帘快门双目相机的投影方程是根据双目相机的投影方程和所述第一运动的运动模型确定的。

示例性的，对于第一图像上的第一像素，在第二图像上确定所述第一像素匹配的第二像素，由于第一像素和匹配的第二像素对应拍摄场景中的同一位置(公共3D点)，如X，可以根据所述第一运动的运动参数、所述初始观测深度以及所述第一像素的位置确定所述拍摄场景中的同一位置X重投影在所述第二图像上的位置，根据位置X重投影在所述第二图像上的位置以及所述第二像素在所述第二图像上的实际位置确定重投影误差。示例性的，根据每个第一像素对应的重投影误差之和确定所述第一图像对应的重投影误差。根据所述第一图像对应的重投影误差调整所述第一运动的运动参数和调整后的初始观测深度，以及根据调整后的第一运动的运动参数和调整后的初始观测深度确定确定调整后的重投影误差，经过多次迭代调整，第一图像对应的重投影误差收敛或者小于预设的误差阈值时，可以得到优化后的所述第一运动的运动参数以及优化后的所述初始观测深度。

示例性的，所述确定所述第一图像上的像素在所述第二图像上的重投影，包括：确定所述第一图像上的特征点，所述特征点的数目少于所述第一图像上像素的数目；确定所述第一图像上的特征点在所述第二图像上的重投影；根据所述第一图像上的特征点在所述第二图像上的重投影，通过插值确定所述第一图像上除所述特征点之外的像素在所述第二图像上的重投影。

举例而言，所述特征点可以包括Harris角点，当然也不限于此，例如包括SIFT特征点、SURF特征点、ORB特征点中的一种或多种。

示例性的，通过在第一图像上提取更具区分性的特征点，然后根据稠密光流得到这些特征点在第二图像上的匹配点，然后通过插值确定其余像素的重投影。通过根据特征点确定重投影，可以减少计算量，实现稀疏化计算。

示例性的，以第一图像为基准图像，根据前后时刻的第一图像提取第一图像的特征点，例如通过KLT特征跟踪匹配算法(Kanade–Lucas–Tomasi feature tracker)等进行特征点匹配，得到这些特征点在第二图像上的匹配点。

S140、根据确定的所述双目拍摄装置的第一运动，对所述第一图像和所述第二图像进行去畸变处理。

根据双目拍摄装置的第一运动，可以更高效地补偿卷帘快门相机的运动，补偿双目拍摄装置运动引起的卷帘快门失真，从而估计更准确的观测深度(深度图)。

在一些实施方式中，可以根据确定的所述双目拍摄装置的第一运动以及所述第一图像中各行像素的行号，对所述第一图像中的各行像素进行校正；以及根据确定的所述双目拍摄装置的第一运动以及所述第二图像中各行像素的行号，对所述第二图像中的各行像素进行校正；其中所述校正包括旋转和/或平移。

示例性的，请参阅图3，卷帘快门相机曝光时，越晚曝光的行相较于第一行的偏移越多。以第一行像素为基准时，行号越大的像素所需的校正幅度也越大。示例性的，所述第一运动的运动参数包括角速度和/或线速度，所述角速度用于指示所述第一图像和/或所述第二图像中的各行像素进行旋转，所述线速度用于指示所述第一图像和/或所述第二图像中的各行像素进行平移。通过对图像中的各行像素进行旋转和/或平移等校正，实现对第一图像和所述第二图像进行去畸变处理。

S150、根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定所述双目拍摄装置的观测深度。

基于去畸变处理后的第一图像和第二图像，可以确定更准确的观测深度。示例性的，可以基于三角化测量法，根据去畸变处理后的第一图像和第二图像，确定所述双目拍摄装置的观测深度，具体可以参照步骤S120中根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度的原理和流程。

示例性的，所述根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定所述双目拍摄装置的观测深度，包括：将去畸变处理后的第一图像和去畸变处理后第二图像输入预设的光流估计网络模型，得到去畸变处理后第一图像和去畸变处理后第二图像上匹配的像素之间的光流；根据所述匹配的像素之间的光流，确定所述双目拍摄装置的观测深度。

本申请实施例提供的确定双目拍摄装置的观测深度的方法，包括：获取卷帘快门双目相机拍摄的第一图像和第二图像，根据第一图像和第二图像，确定双目拍摄装置的初始观测深度；根据初始观测深度确定曝光过程中双目拍摄装置的第一运动；根据确定的双目拍摄装置的第一运动，对第一图像和第二图像进行去畸变处理；根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定双目拍摄装置的观测深度，可以实现和提升基于卷帘快门双目相机的深度感知。

请结合上述实施例参阅图6，图6是本申请实施例提供的双目拍摄装置600的示意性框图。

举例而言，双目拍摄装置600可以包括双目相机，例如包括一体式的双目相机，当然也可以是包括两个能够分离的相机。

如图6所示，该双目拍摄装置600包括第一拍摄装置610和第二拍摄装置620，第一拍摄装置610和第二拍摄装置620的图像传感器中的感测单元是逐行曝光的。在一些实施方式中，第一拍摄装置和第二拍摄装置可以包括卷帘快门(rolling shutter)相机，双目拍摄装置可以称为卷帘快门双目相机。

该双目拍摄装置600包括一个或多个处理器601，一个或多个处理器601单独地或共同地工作，用于执行前述的确定双目拍摄装置的观测深度的方法的步骤。

示例性的，双目拍摄装置600还包括存储器602。

示例性的，处理器601和存储器602通过总线603连接，该总线603比如为I2C(Inter-integrated Circuit)总线。

具体地，处理器601可以是微控制单元(Micro-controller Unit，MCU)、中央处理单元(Central Processing Unit，CPU)或数字信号处理器(Digital Signal Processor，DSP)等。

具体地，存储器602可以是Flash芯片、只读存储器(ROM，Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。

其中，所述处理器601用于运行存储在存储器602中的计算机程序，并在执行所述计算机程序时实现前述的确定双目拍摄装置的观测深度的方法的步骤。

示例性的，所述处理器601用于运行存储在存储器602中的计算机程序，并在执行所述计算机程序时实现如下步骤：

本申请实施例提供的双目拍摄装置的具体原理和实现方式均与前述实施例的确定双目拍摄装置的观测深度的方法类似，此处不再赘述。

请结合前述实施例参阅图7，图7是本申请实施例提供的观测深度确定装置700的示意性框图。

该观测深度确定装置700包括一个或多个处理器701，一个或多个处理器701单独地或共同地工作，用于执行前述的确定双目拍摄装置的观测深度的方法的步骤。

示例性的，观测深度确定装置700还包括存储器702。

示例性的，处理器701和存储器702通过总线703连接，该总线703比如为I2C(Inter-integrated Circuit)总线。

具体地，处理器701可以是微控制单元(Micro-controller Unit，MCU)、中央处理单元(Central Processing Unit，CPU)或数字信号处理器(Digital Signal Processor，DSP)等。

具体地，存储器702可以是Flash芯片、只读存储器(ROM，Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。

其中，所述处理器701用于运行存储在存储器702中的计算机程序，并在执行所述计算机程序时实现前述的确定双目拍摄装置的观测深度的方法的步骤。

示例性的，所述处理器701用于运行存储在存储器702中的计算机程序，并在执行所述计算机程序时实现如下步骤：

本申请实施例提供的观测深度确定装置的具体原理和实现方式均与前述实施例的确定双目拍摄装置的观测深度的方法类似，此处不再赘述。

请结合前述实施例参阅图8，图8是本申请实施例提供的可移动平台800的示意性框图。示例性的，所述可移动平台可以包括无人飞行器、云台、无人车等中的至少一种。进一步而言，无人飞行器可以为旋翼型无人机，例如四旋翼无人机、六旋翼无人机、八旋翼无人机，也可以是固定翼无人机。

该可移动平台800包括一个或多个处理器801，一个或多个处理器801单独地或共同地工作，用于执行前述的确定双目拍摄装置的观测深度的方法的步骤。

示例性的，可移动平台800还包括存储器802。

示例性的，处理器801和存储器802通过总线803连接，该总线803比如为I2C(Inter-integrated Circuit)总线。

具体地，处理器801可以是微控制单元(Micro-controller Unit，MCU)、中央处理单元(Central Processing Unit，CPU)或数字信号处理器(Digital Signal Processor，DSP)等。

具体地，存储器802可以是Flash芯片、只读存储器(ROM，Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。

其中，所述处理器801用于运行存储在存储器802中的计算机程序，并在执行所述计算机程序时实现前述的确定双目拍摄装置的观测深度的方法的步骤。

示例性的，所述处理器801用于运行存储在存储器802中的计算机程序，并在执行所述计算机程序时实现如下步骤：

本申请实施例提供的可移动平台的具体原理和实现方式均与前述实施例的确定双目拍摄装置的观测深度的方法类似，此处不再赘述。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序中包括程序指令，所述计算机程序被处理器执行时使所述处理器实现上述实施例提供的确定双目拍摄装置的观测深度的方法的步骤。

其中，所述计算机可读存储介质可以是前述任一实施例所述的双目拍摄装置、观测深度确定装置或可移动平台的内部存储单元，例如是所述可移动平台的硬盘或内存。所述计算机可读存储介质也可以是所述双目拍摄装置、观测深度确定装置或可移动平台的外部存储设备，例如是所述可移动平台上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

应当理解，在此本申请中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。

还应当理解，在本申请和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种确定双目拍摄装置的观测深度的方法，其特征在于，包括：

获取双目拍摄装置中的第一拍摄装置拍摄的第一图像和第二拍摄装置拍摄的第二图像，其中，所述第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的；

根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度；

根据所述初始观测深度确定曝光过程中所述双目拍摄装置的第一运动；

根据确定的所述双目拍摄装置的第一运动，对所述第一图像和所述第二图像进行去畸变处理；

根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定所述双目拍摄装置的观测深度。
根据权利要求1所述的方法，其特征在于，所述根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度，包括：

确定所述第一图像和所述第二图像上匹配的像素；

根据所述匹配的像素在所述第一图像上的位置和在所述第二图像上的位置，确定所述匹配的像素之间的光流；

根据所述匹配的像素之间的光流，确定所述双目拍摄装置的初始观测深度。
根据权利要求2所述的方法，其特征在于，所述确定所述第一图像和所述第二图像上匹配的像素，包括：

在所述第二图像上确定与所述第一图像上每个像素匹配的像素。
根据权利要求1所述的方法，其特征在于，所述根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度，包括：

将所述第一图像和所述第二图像输入预设的光流估计网络模型，得到所述第一图像和所述第二图像上匹配的像素之间的光流；

根据所述匹配的像素之间的光流，确定所述双目拍摄装置的初始观测深度。
根据权利要求2-4中任一项所述的方法，其特征在于，所述根据所述匹配的像素之间的光流，确定所述双目拍摄装置的初始观测深度，包括：

对所述匹配的像素之间的光流进行三角化处理，得到所述匹配的像素对应的深度值。
根据权利要求1所述的方法，其特征在于，所述根据所述初始观测深度确定曝光过程中所述双目拍摄装置的第一运动，包括：

初始化所述第一运动的运动参数；

对所述第一运动的运动参数以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数。
根据权利要求6所述的方法，其特征在于，所述对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数，包括：

基于预设的卷帘快门双目相机的重投影误差模型，对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数。
根据权利要求7所述的方法，其特征在于，所述基于预设的卷帘快门双目相机的重投影误差模型，对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数，包括：

将所述第一运动的初始化值、所述初始观测深度以及所述第一图像和所述第二图像上匹配的像素的位置输入所述重投影误差模型，得到优化后的所述第一运动的运动参数。
根据权利要求7所述的方法，其特征在于，所述卷帘快门双目相机的重投影误差模型根据是根据双目相机的投影方程和所述第一运动的运动模型确定的。
根据权利要求6所述的方法，其特征在于，所述对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数，包括：

基于卷帘快门双目相机的投影方程，根据所述第一运动的运动参数以及所述初始观测深度，确定所述第一图像上的像素在所述第二图像上的重投影；

根据所述第二图像上的重投影的位置和所述第二图像上对应的像素的位置，确定重投影误差；

根据所述重投影误差对所述第一运动的初始化值以及所述初始观测深度进行优化。
根据权利要求10所述的方法，其特征在于，所述卷帘快门双目相机的投影方程是根据双目相机的投影方程和所述第一运动的运动模型确定的。
根据权利要求10所述的方法，其特征在于，所述确定所述第一图像上的像素在所述第二图像上的重投影，包括：

确定所述第一图像上的特征点，所述特征点的数目少于所述第一图像上像素的数目；

确定所述第一图像上的特征点在所述第二图像上的重投影；

根据所述第一图像上的特征点在所述第二图像上的重投影，通过插值确定所述第一图像上除所述特征点之外的像素在所述第二图像上的重投影。
根据权利要求9或11所述的方法，其特征在于，所述第一运动的运动模型包括匀速运动模型，所述匀速运动模型的运动参数包括线速度和/或角速度。
根据权利要求13所述的方法，其特征在于，所述匀速运动模型对应的运动时长是根据所述第一拍摄装置的曝光时长和/或所述第二拍摄装置的曝光时长确定的。
根据权利要求6-14中任一项所述的方法，其特征在于，对所述第一运动的运动参数以及所述初始观测深度进行优化的目标为：

根据优化后的所述第一运动的运动参数以及优化后的所述初始观测深度确定的重投影误差收敛或者小于预设的误差阈值。
根据权利要求6-14中任一项所述的方法，其特征在于，所述第一运动的初始化值为零向量。
根据权利要求6-14中任一项所述的方法，其特征在于，所述获取所述第一运动的初始化值，包括：

根据相邻帧的所述第一图像，确定所述相邻帧的时间段内所述双目拍摄装置的第二运动；

根据所述第二运动确定所述第一运动的初始化值。
根据权利要求1所述的方法，其特征在于，所述根据确定的所述双目拍摄装置的第一运动，对所述第一图像和所述第二图像进行去畸变处理，包括：

根据确定的所述双目拍摄装置的第一运动以及所述第一图像中各行像素的行号，对所述第一图像中的各行像素进行校正；以及

根据确定的所述双目拍摄装置的第一运动以及所述第二图像中各行像素的行号，对所述第二图像中的各行像素进行校正；

其中所述校正包括旋转和/或平移。
根据权利要求18所述的方法，其特征在于，所述第一运动的运动参数包括角速度和/或线速度，所述角速度用于指示所述第一图像和/或所述第二图像中的各行像素进行旋转，所述线速度用于指示所述第一图像和/或所述第二图像中的各行像素进行平移。
根据权利要求1所述的方法，其特征在于，所述根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定所述双目拍摄装置的观测深度，包括：

将去畸变处理后的第一图像和去畸变处理后第二图像输入预设的光流估计网络模型，得到去畸变处理后第一图像和去畸变处理后第二图像上匹配的像素之间的光流；

根据所述匹配的像素之间的光流，确定所述双目拍摄装置的观测深度。
一种双目拍摄装置，其特征在于，包括第一拍摄装置和第二拍摄装置，所述第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的；

所述双目拍摄装置还包括一个或多个处理器，单独地或共同地工作，用于执行如下步骤：

获取所述第一拍摄装置拍摄的第一图像和所述第二拍摄装置拍摄的第二图像，其中，所述第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的；

根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度；

根据所述初始观测深度确定曝光过程中所述双目拍摄装置的第一运动；

根据确定的所述双目拍摄装置的第一运动，对所述第一图像和所述第二图像进行去畸变处理；

根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定所述双目拍摄装置的观测深度。
根据权利要求21所述的双目拍摄装置，其特征在于，所述处理器执行所述根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度时，用于执行：

确定所述第一图像和所述第二图像上匹配的像素；

根据所述匹配的像素在所述第一图像上的位置和在所述第二图像上的位置，确定所述匹配的像素之间的光流；

根据所述匹配的像素之间的光流，确定所述双目拍摄装置的初始观测深度。
根据权利要求22所述的双目拍摄装置，其特征在于，所述处理器执行所述确定所述第一图像和所述第二图像上匹配的像素时，用于执行：

在所述第二图像上确定与所述第一图像上每个像素匹配的像素。
根据权利要求21所述的双目拍摄装置，其特征在于，所述处理器执行所述根据所述第一图像和所述第二图像，确定所述双目拍摄装置的初始观测深度时，用于执行：

将所述第一图像和所述第二图像输入预设的光流估计网络模型，得到所述第一图像和所述第二图像上匹配的像素之间的光流；

根据所述匹配的像素之间的光流，确定所述双目拍摄装置的初始观测深度。
根据权利要求22-24中任一项所述的双目拍摄装置，其特征在于，所述处理器执行所述根据所述匹配的像素之间的光流，确定所述双目拍摄装置的初始观测深度时，用于执行：

对所述匹配的像素之间的光流进行三角化处理，得到所述匹配的像素对应的深度值。
根据权利要求21所述的双目拍摄装置，其特征在于，所述处理器执行所述根据所述初始观测深度确定曝光过程中所述双目拍摄装置的第一运动时，用于执行：

初始化所述第一运动的运动参数；

对所述第一运动的运动参数以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数。
根据权利要求26所述的双目拍摄装置，其特征在于，所述处理器执行所述对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数时，用于执行：

基于预设的卷帘快门双目相机的重投影误差模型，对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数。
根据权利要求27所述的双目拍摄装置，其特征在于，所述处理器执行所述基于预设的卷帘快门双目相机的重投影误差模型，对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数时，用于执行：

将所述第一运动的初始化值、所述初始观测深度以及所述第一图像和所述第二图像上匹配的像素的位置输入所述重投影误差模型，得到优化后的所述第一运动的运动参数。
根据权利要求27所述的双目拍摄装置，其特征在于，所述卷帘快门双目相机的重投影误差模型根据是根据双目相机的投影方程和所述第一运动的运动模型确定的。
根据权利要求26所述的双目拍摄装置，其特征在于，所述处理器执行所述对所述第一运动的初始化值以及所述初始观测深度进行优化，得到优化后的所述第一运动的运动参数时，用于执行：

基于卷帘快门双目相机的投影方程，根据所述第一运动的运动参数以及所述初始观测深度，确定所述第一图像上的像素在所述第二图像上的重投影；

根据所述第二图像上的重投影的位置和所述第二图像上对应的像素的位置，确定重投影误差；

根据所述重投影误差对所述第一运动的初始化值以及所述初始观测深度进行优化。
根据权利要求30所述的双目拍摄装置，其特征在于，所述卷帘快门双目相机的投影方程是根据双目相机的投影方程和所述第一运动的运动模型确定的。
根据权利要求30所述的双目拍摄装置，其特征在于，所述处理器执行所述确定所述第一图像上的像素在所述第二图像上的重投影时，用于执行：

确定所述第一图像上的特征点，所述特征点的数目少于所述第一图像上像素的数目；

确定所述第一图像上的特征点在所述第二图像上的重投影；

根据所述第一图像上的特征点在所述第二图像上的重投影，通过插值确定所述第一图像上除所述特征点之外的像素在所述第二图像上的重投影。
根据权利要求29或31所述的双目拍摄装置，其特征在于，所述第一运动的运动模型包括匀速运动模型，所述匀速运动模型的运动参数包括线速度和/或角速度。
根据权利要求33所述的双目拍摄装置，其特征在于，所述匀速运动模型对应的运动时长是根据所述第一拍摄装置的曝光时长和/或所述第二拍摄装置的曝光时长确定的。
根据权利要求26-34中任一项所述的双目拍摄装置，其特征在于，对所述第一运动的运动参数以及所述初始观测深度进行优化的目标为：

根据优化后的所述第一运动的运动参数以及优化后的所述初始观测深度确定的重投影误差收敛或者小于预设的误差阈值。
根据权利要求26-34中任一项所述的双目拍摄装置，其特征在于，所述第一运动的初始化值为零向量。
根据权利要求26-34中任一项所述的双目拍摄装置，其特征在于，所述处理器执行所述获取所述第一运动的初始化值时，用于执行：

根据相邻帧的所述第一图像，确定所述相邻帧的时间段内所述双目拍摄装置的第二运动；

根据所述第二运动确定所述第一运动的初始化值。
根据权利要求21所述的双目拍摄装置，其特征在于，所述处理器执行所述根据确定的所述双目拍摄装置的第一运动，对所述第一图像和所述第二图像进行去畸变处理时，用于执行：

根据确定的所述双目拍摄装置的第一运动以及所述第一图像中各行像素的行号，对所述第一图像中的各行像素进行校正；以及

根据确定的所述双目拍摄装置的第一运动以及所述第二图像中各行像素的行号，对所述第二图像中的各行像素进行校正；

其中所述校正包括旋转和/或平移。
根据权利要求38所述的双目拍摄装置，其特征在于，所述第一运动的运动参数包括角速度和/或线速度，所述角速度用于指示所述第一图像和/或所述第二图像中的各行像素进行旋转，所述线速度用于指示所述第一图像和/或所述第二图像中的各行像素进行平移。
根据权利要求21所述的双目拍摄装置，其特征在于，所述处理器执行所述根据去畸变处理后的第一图像和去畸变处理后的第二图像，确定所述双目拍摄装置的观测深度时，用于执行：

将去畸变处理后的第一图像和去畸变处理后第二图像输入预设的光流估计网络模型，得到去畸变处理后第一图像和去畸变处理后第二图像上匹配的像素之间的光流；

根据所述匹配的像素之间的光流，确定所述双目拍摄装置的观测深度。
一种观测深度确定装置，其特征在于，包括一个或多个处理器，单独地或共同地工作，用于执行如权利要求1-20中任一项所述的确定双目拍摄装置的观测深度的方法的步骤。
一种可移动平台，其特征在于，搭载第一拍摄装置和第二拍摄装置，所述第一拍摄装置和第二拍摄装置的图像传感器中的感测单元是逐行曝光的；

所述可移动平台还包括一个或多个处理器，单独地或共同地工作，用于执行如权利要求1-20中任一项所述的确定双目拍摄装置的观测深度的方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如权利要求1-20中任一项所述的确定双目拍摄装置的观测深度的方法的步骤。