WO2021217444A1

WO2021217444A1 - 深度图生成方法、电子设备、计算处理设备及存储介质

Info

Publication number: WO2021217444A1
Application number: PCT/CN2020/087569
Authority: WO
Inventors: 周游; 刘洁; 徐彪
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2020-04-28
Filing date: 2020-04-28
Publication date: 2021-11-04
Also published as: CN113994382A

Abstract

一种深度图生成方法、电子设备、设备和存储介质。所述方法包括：获取至少三个拍摄装置所拍摄的至少三个图像（101），计算目标图像上的目标像素点与其他图像上匹配的像素点之间的至少两个匹配度（102），将至少两个匹配度进行融合，基于各个目标像素点的融合后的匹配度，生成第一深度图；或，根据至少两个匹配度分别确定深度值，得到各个像素点对应的至少两个深度值，根据各个像素点所对应的至少两个深度值，生成第二深度图（103），使得至少两个匹配度不仅是基于基线方向进行匹配得到的结果，或者结合至少两个深度值来生成深度图，实现了对计算结果的结合，解决了两个拍摄装置之间在基线方向有时会匹配错误的问题，从而提高了深度图的准确度。

Description

深度图生成方法、电子设备、计算处理设备及存储介质

技术领域

本申请涉及数据处理技术领域，具体涉及一种深度图生成方法、一种电子设备、一种计算处理设备、一种计算机可读存储介质。

背景技术

计算机视觉是依靠成像系统代替视觉器官作为输入敏感手段，最常用的是摄像头，由双摄像头即可组成一个基础的视觉系统，称为Stereo Vision(立体视觉)。

双目摄像头系统(Stereo Vision System)通过两个摄像头，拍摄同一时刻，不同角度的两张照片，再通过两张照片的差异，以及双摄像头之间的位置、角度关系，利用三角关系，即可计算出场景与摄像头的距离关系，画在一张图上即为Depth Map(景深图或深度图)。

常用的深度计算方法是用Stereo Matching(双目立体匹配)算法，其中，需要在两张图片中在双摄像头的基线方向搜索最匹配的块。经研究发现，如果图片中有重复纹理，或是弱纹理的情况下，由于高度相似的特征点描述向量接近，扫描时难以正确判断哪一个是对应的特征点，基线方向搜索就容易出错，继而难以得到准确的Depth Map。

发明内容

鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的深度图生成方法、电子设备、计算处理设备、计算机可读存储介质。

依据本申请的一个方面，提供了一种深度图生成方法，包括：

获取至少三个拍摄装置所拍摄的至少三个图像；

计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度；

对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图；或者，根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图。

可选地，所述对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合包括：

对于同一个所述目标像素点，将其所对应的所述至少两个匹配度作求和运算，得到所述目标像素点所对应的融合后的匹配度。

可选地，所述根据各个所述目标像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图包括：

在同一个所述像素点所对应的所述至少两个深度值中，选择最小的深度值作为所述像素点的第一深度值；

基于各个所述目标像素点对应的第一深度值，生成所述目标图像对应的第二深度图。

可选地，所述基于所述目标图像上各个像素点对应的第一深度值，生成所述目标图像对应的第二深度图包括：

对所述目标图像上各个像素点对应的第一深度值进行滤波处理；

根据所述目标图像上各个像素点对应的滤波处理后的第一深度值，生成所述目标图像对应的第二深度图。

可选地，在所述计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度之前，所述方法还包括：

分别对所述目标图像和所要匹配的图像进行矫正，得到矫正后的目标图像和所要匹配的图像，以及矫正后的目标图像和所述目标图像之间的映射关系。

可选地，所述计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度包括：

将所述矫正后的目标图像上目标像素点和所述目标图像的矫正后的所要匹配的图像上的像素点进行匹配，分别计算所述矫正后的目标图像上各个所述目标像素点与矫正后的其所匹配的图像上匹配的像素点之间的匹配度。

可选地，所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述方法还包括：

根据所述第一映射关系和第二映射关系，确定与所述第一图像对应的矫正后的目标图像和与所述第二图像对应的矫正后的目标图像之间的第三映射关系；

根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的匹配度转换为与所述第一图像对应的矫正后的目标图像对应的匹配度。

可选地，所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述方法还包括：

根据所述第四映射关系，将与所述第三图像对应的矫正后的目标图像对应的匹配度转换为所述目标图像对应的匹配度。

可选地，所述根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值包括：

根据所述矫正后的目标图像上各个目标像素点与矫正后的其所匹配的图像上匹配的像素点之间的匹配度，分别计算深度值，得到所述目标图像上各个像素点所对应的至少两个深度值。

可选地，所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述方法还包括：

根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的深度值转换为与所述第一图像对应的矫正后的目标图像对应的深度值。

可选地，所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述方法还包括：

根据所述第四映射关系，将与所述第三图像对应的矫正后的目标图像对应的深度值转换为所述目标图像对应的深度值。

可选地，所述拍摄装置为三个，所述拍摄装置之间的位置关系包括品字形、或L形中的任意一种。

可选地，所述至少三个拍摄装置设置在电子设备上，所述电子设备包括可移动平台、移动终端、虚拟现实终端、或增强现实终端中的任意一种。

可选地，所述至少三个拍摄装置设置在可移动平台上，所述方法还包括：

根据所述第一深度图或第二深度图，确定所述可移动平台的运动轨迹或所述可移动平台上的机械臂的操作轨迹。

依据本申请的另一个方面，提供了一种电子设备，所述电子设备包括处理器、存储器和至少三个拍摄装置；

所述处理器用于：获取至少三个拍摄装置所拍摄的至少三个图像；计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度；对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图；或者，根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图。

可选地，所述处理器在对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合时，用于：

可选地，所述处理器在根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图时，用于：

基于所述目标图像上各个像素点对应的第一深度值，生成所述目标图像对应的第二深度图。

可选地，所述处理器在基于所述目标图像上各个像素点对应的第一深度值，生成所述目标图像对应的第二深度图时，用于：

可选地，在所述处理器计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度之前，所述处理器还用于：

可选地，所述处理器在计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度时，用于：

可选地，所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述处理器对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述处理器还用于：

可选地，所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述处理器对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述处理器还用于：

可选地，所述处理器根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值时，用于：

根据所述矫正后的目标图像上各个目标像素点与其所匹配的图像上匹配的像素点之间的匹配度，分别计算深度值，得到所述目标图像上各个像素点所对应的至少两个深度值。

可选地，所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述处理器根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述处理器还用于：

可选地，所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述处理器根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述处理器还用于：

可选地，所述电子设备包括可移动平台、移动终端、虚拟现实终端、或增强现实终端中的任意一种。

可选地，所述电子设备为可移动平台，所述处理器还用于：

可选地，所述电子设备包括显示器，所述显示器用于：

对所述第一深度图或第二深度图进行显示。

可选地，所述处理器还用于：

将所述第一深度图或第二深度图发送给所述电子设备的控制设备，以供所述控制设备对所述第一深度图或第二深度图进行显示或根据所述第一深度图或第二深度图生成对所述电子设备的控制指令。

依据本申请的另一个方面，提供了一种计算机程序，包括计算机可读代码，当所述计算机可读代码在计算处理设备上运行时，导致所述计算处理设备执行上述的深度图生成方法。

依据本申请的另一个方面，提供了一种计算机可读介质，其中存储了如上所述的计算机程序。

依据本发明实施例，通过获取至少三个拍摄装置所拍摄的至少三个图像，计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度，对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图；或者，根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图，使得至少两个匹配度不仅仅是基于两个拍摄装置之间的基线方向进行匹配得到的结果，对至少两个匹配度进行融合后生成深度图，或者结合至少两个匹配度对应确定的深度值来生成深度图，实现了对至少两个计算结果的结合，解决了两个拍摄装置之间在基线方向有时会匹配错误的问题，从而提高了深度图的准确度。

进一步，通过在同一个像素点所对应的至少两个深度值中，选择最小的深度值作为像素点的第一深度值，基于目标图像上各个像素点对应的第一深度值，生成目标图像对应的第二深度图，在进行自主避障时，避免选择更大的深度值所导致的不必要的碰撞或其他事故，选择最小的深度值更加保险，提高了自主避障的成功率。

进一步，通过对目标图像上各个像素点对应的第一深度值进行滤波处理，根据目标图像上各个像素点对应的滤波处理后的第一深度值，生成目标图像对应的第二深度图，对目标图像上各个像素点对应的第一深度值进行滤波处理，可以滤除一些错误的深度值，获得更加精确地深度图。

进一步，通过根据第一深度图或第二深度图，确定可移动平台的运动轨迹或所述可移动平台上的机械臂的操作轨迹，避免可移动平台与周围物体发生碰撞或者发生跌落等情况。在可移动平台上有机械臂时，还可以确定出机械臂与周围物体之间的距离，生成机械臂的操作轨迹，避免机械臂与周围物体发生碰撞，或者实现机械臂对周围目标物体的操作。

进一步，通过至少三个拍摄装置设置在飞行器、车、机器人等上时，采用本发明实施例的技术方案得到的深度图更加准确，因此，飞行器可以进行更好的自主避障、尤其是旋翼飞行器非常需要准确和敏捷的自主避障，避免飞行器发生坠机或碰撞等事故，提高飞行器的安全性；车也可以进行更好的自主避障，避免车与其他物体或人发生碰撞，使得车具有更高的安全性；机器人也可以进行更好的自主避障，机器人的机械臂可以更准确的对物体进行操作，尤其是扫地机器人可以减少与家具和移动物体的碰撞，不留死角的对所有可达到的位置进行清扫等，提高了机器人的工作能力。

进一步，通过分别对所述目标图像和所要匹配的图像进行矫正，得到矫正后的目标图像和所要匹配的图像，针对矫正后的图像进行基于基线方向的搜索可以获得更加精确地结果。

进一步，通过对所述第一深度图或第二深度图进行显示，通过显示所述深度图，可以使操作人员及时地、直观地了解到电子设备周围的环境信息，例如电子设备周围有哪些物体，哪些物体距离电子设备较近，哪些物体距离电子设备较远，从而及时的电子设备的移动、作业、或其他操作进行控制。需要注意的是，所述电子设备包括显示器并不限制于所述显示器必须设置在所述电子设备上，所说显示器也可以与所述电子设备以通信方式进行连接，例如，所述显示器可以与所述可移动平台通过蓝牙、移动网络、或WiFi连接，所述显示器可以设置在远程的遥控器上，也可以设置在远程的计算机上，本发明对此不作限制。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本发明一个实施例的一种深度图生成方法的步骤流程图；

图2示出了一种呈品字形构型的拍摄装置所拍摄的三个图像的示意图；

图3示出了另一种呈品字形构型的拍摄装置所拍摄的三个图像的示意图；

图4示出了一种呈L形构型的拍摄装置所拍摄的三个图像的示意图；

图5示出了左右两个图像中同一个点的示意图；

图6示出了本发明另一实施例的一种深度图生成方法的步骤流程图；

图7示出了图像矫正技术的示意图；

图8示出了本发明又一实施例的一种深度图生成方法的步骤流程图；

图9示出了深度值生成的示意图；

图10示出了深度图结合的示意图；

图11示出了本发明再一实施例的一种电子设备的示意图；

图12示意性地示出了用于执行根据本发明的方法的计算处理设备的框图；以及

图13示意性地示出了用于保持或者携带实现根据本发明的方法的程序代码的存储单元。

具体实施例

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为使本领域技术人员更好地理解本发明，以下对本发明涉及的概念进行说明：

拍摄装置包括但不限于摄像头，一般由双拍摄装置即可组成一个基础的视觉系统，为实现本发明的技术方案需要至少三个拍摄装置。

目标图像可以为至少三个图像中的任意一个图像，该目标图像可以为预先选定的某个拍摄装置所拍摄的图像，或者可以为随机确定的图像，本发明实施例对此不做限制。

从目标图像上选择多个像素点，记为目标像素点。在图像处理中，特征点指的是图像灰度值发生剧烈变化的点或者在图像边缘上曲率较大的点(即两个边缘的交点)。特征点能够反映图像本质特征，能够标识图像中目标物体，因此，通过特征点的匹配能够完成图像的匹配。提取图像的特征点，可以作为目标像素点，或者其他任意适用的像素点作为目标像素点，本发明实施例对此不做限制。例如，提取图像的特征点，一般选用角点，可选的Corner Detection Algorithm(角点检测算法)包括：FAST(Features From Accelerated Segment Test，加速分割测试特征)、SUSAN(一种角点检测算法)、以及Harris operator(一种角点检测算法)等。

像素点对应的深度值可以是拍摄装置与该像素点对应的实物之间的距离，图像对应的深度图可以是用于表示图像中各个像素点的深度值的图像，例如，深度图中每个像素点利用不同的颜色或者灰度值来表示该像素点的深度值。在目标图像与另一个图像之间建立像素点之间的对应关系，在根据对应点的视差计算出深度值。

例如，在采用Stereo Matching算法时，在特征点匹配后可以直接使用SGM(semi-global matching，半全局匹配)算法来生成深度图。而在采用Plane-Sweeping(平面扫描)算法时，在特征点匹配后需要采用BA(Bundle Adjustment，集束调整)算法估算每个图像的拍摄装置的位姿，然后采用Plane-Sweeping算法计算像素点之间相对的距离，进一步来做半全局优化调整，使用SGM算法来生成深度图。

在确定其他图像上与目标图像上的目标像素点匹配的像素点时，可以得到目标像素点与其他图像上匹配的像素点之间的匹配度，匹配度表示两个像素点之间的相似程度。单个像素点进行比较鲁棒性很差，很容易受到光照变化和视角不同的影响，其中一种常用方式是基于滑动窗口来进行匹配，对于目标图像中以目标像素点为中心的一个窗口内的像素，在另一个图像中从左到右用一个同尺寸滑动窗口内的像素和它计算Cost Values(代价值)，两个窗口越相似，代价值越小，代价值越小代表匹配度越高，因此可以用Cost Values(代价值)的倒数作为匹配度。匹配度最大的位置对应的像素点就是最佳的匹配结果，即其他图像上与目标像素点匹配的像素点。需要注意的是，在实际应用中，也可以直接用Cost Values(代价值)作为匹配度，因而计算结果与匹配度的高低是相反的，在其他对匹配度判断的步骤对应调整即可。对于具体选用哪些参数作为匹配度，本申请对此不作限制，凡是能够表征匹配程度的参数，均属于本申请的保护范围。

例如，在计算每个目标像素点与其他图像上的像素点之间的匹配度时，可以使用MAD(Mean Absolute Differences，平均绝对差)算法、SSD(Sum of Squared Differences，误差平方和)算法、SAD(Sum of Absolute Difference，绝对误差和)算法、NCC(Normalized Cross Correlation，归一化积相关)算法、SSDA(Sequential Similiarity Detection Algorithm，序贯相似性检测算法)、或者SATD(Sum of Absolute Transformed Difference，绝对变换误差和)算法等，具体可以根据实际需要选择其中任意一种算法，本发明实施例对此不做限制。

根据本发明的一种实施例，在双目立体匹配的过程中，如果图片中有重复纹理，或是弱纹理的情况下，为了避免难以得到准确的深度图的问题。本发明提供了一种深度图生成机制，通过获取至少三个拍摄装置所拍摄的至少三个图像，计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度，对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图；或者，根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图，使得至少两个匹配度不仅仅是基于两个拍摄装置之间的基线方向进行匹配得到的结果，对至少两个匹配度进行融合后生成深度图，或者结合至少两个匹配度对应确定的深度值来生成深度图，实现了对至少两个计算结果的结合，解决了两个拍摄装置之间在基线方向有时会匹配错误的问题，从而提高了深度图的准确度。

参照图1，示出了本发明实施例的一种深度图生成方法的步骤流程图，具体可以包括如下步骤：

步骤101，获取至少三个拍摄装置所拍摄的至少三个图像。

在本发明实施例中，在进行拍摄时，每一个拍摄装置分别拍摄得到一个图像，即至少三个拍摄装置对应有至少三个图像。拍摄装置之间的位置关系可以根据实际需要设置，例如，四个拍摄装置之间的位置关系包括平行四边形、梯形等，五个拍摄装置之间的位置关系包括正五边形等，不同位置关系的至少三个拍摄装置都可以应用本发明的技术方案，本发明实施例对此不做限制。

在本发明实施例中，不同拍摄装置拍摄得到的不同图像的边之间可以相互平行或垂直，也可以相互之间成任意的角度，本发明实施例对此不做限制。

可选地，当拍摄装置为三个时，拍摄装置之间的位置关系包括品字形、或L形中的任意一种。

例如，如图2所示的一种呈品字形构型的拍摄装置所拍摄的三个图像的示意图，上图位于左图和右图之间连线的中垂线上，上图、左图和右图的长边之间相互平行。如图3所示的另一种呈品字形构型的拍摄装置所拍摄的三个图像的示意图，上图、左图和右图的位置呈对称三角形，不同图像的长边之间成60度角。如图4所示的一种呈L形构型的拍摄装置所拍摄的三个图像的示意图，上图位于左图的上方，右图位于左图的右侧，上图、左图和右图的长边之间相互平行。

步骤102，计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度。

在本发明实施例中，在至少三个图像中的目标图像上，先确定多个目标像素点，例如，提取特征点。然后对于每个目标像素点，在另一个图像上寻找和该目标像素点最匹配的像素点，并计算得到该目标像素点与该另一个图像上匹配的像素点之间的匹配度。由于分别对至少三个图像中的目标图像和其他各个图像之间进行像素点匹配，因此每个目标像素点会有对应的比图像数量少一个的匹配度，例如，若是三个图像，则计算得到两个匹配度。至少三个图像，对应得到的匹配度为至少两个。

在本发明实施例中，因为安装有偏差，或是制造工艺精度不够，两个拍摄装置之间可能存在不完全平行的情况，对于两个水平安装的拍摄装置，同一个点在左右两个图像中可能不会处于同一个水平线，对于两个垂直安装的拍摄装置，同一个点在上下两个图像中也可能不会处于同一个垂直线。如图5所示的左右两个图像中同一个点的示意图，五角星在左右两个图中不在同一个水平线上。

在本发明实施例中，一些像素点匹配算法需要同一个点在两个图像中处于同一个水平线或垂直线，才能在水平线或垂直线上搜索就能寻找到与目标像素点匹配的像素点，例如，Stereo Matching算法，而一些像素点匹配算法则不需要同一个点在两个图像中处于同一个水平线或垂直线，例如Plane-Sweeping算法。并非所有的目标图像和所要匹配的图像都需要进行矫正，只有采用的像素点匹配算法需要时，才对目标图像和所要匹配的图像进行矫正。

例如，如图2所示的一种呈品字构型的三个拍摄装置所拍摄的三个图像，左图和右图之间采用Stereo Matching算法进行像素点匹配，需要对左图和右图进行矫正，上图和左图之间采用Plane-Sweeping算法进行像素点匹配，不需要对上图和左图进行矫正。如图3所示的另一种呈品字形构型的拍摄装置所拍摄的三个图像的示意图，上图和左图之间、左图和右图之间都采用Plane-Sweeping算法进行像素点匹配，上图、左图和右图都不需要进行矫正。如图4所示的一种呈L形构型的拍摄装置所拍摄的三个图像的示意图，上图和左图之间、左图和右图之间都采用Stereo Matching算法进行像素点匹配，需要对上图和左图，以及左图和右图分别进行矫正。

步骤103，对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图；或者，根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图。

在本发明实施例中，对多个计算结果的结合有两种策略，一种策略是过程中融合匹配度的策略，另一种策略是结合深度值的策略。两种策略任意一种都可以结合多个计算结果，从而得到更加准确的深度图。

下面先对过程中融合匹配度的策略进行介绍，每个目标像素点都会有对应的至少两个匹配度，将同一个目标像素点所对应的至少两个匹配度进行融合，得到该目标像素点所对应的融合后的匹配度，最终得到目标图像上的各个目标像素点所对应的融合后的匹配度。至少两个匹配度进行融合的方式可以包括多种，例如，对至少两个匹配度作求和运算，或者将至少两个匹配度分别于各自的系数相乘后再作求和运算，或者其他任意适用的融合方式，本发明实施例对此不做限制。通过对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图，使得至少两个匹配度不仅仅是基于两个拍摄装置之间的基线方向进行匹配得到的结果，对至少两个匹配度进行融合后生成深度图，实现了对至少两个计算结果的结合，解决了两个拍摄装置之间在基线方向有时会匹配错误的问题，从而提高了深度图的准确度。

可选地，对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合的一种实现方式可以包括：对于同一个所述目标像素点，将其所对应的所述至少两个匹配度作求和运算，得到所述目标像素点所对应的融合后的匹配度。例如，Stereo Matching算法，或是Plane-Sweeping算法，每个特征点都会有Cost Value(代价值)，将每个特征点的至少两个Cost Value相加，相加后得到总的Cost Value。

将匹配度融合之后，基于各个目标像素点所对应的融合后的匹配度，生成目标图像对应的深度图，记为第一深度图。例如，采用SGM算法生成第一深度图，在根据SGBM(Semi-Global Block Matching，半全局块匹配)算法构造的代价函数中，使用上述相加后的总的Cost Value进行计算。SGBM算法就是将每一个代价值进行成块计算后再用SGM算法进行视差优化，而在SGM算法中，视差计算采用赢家通吃的方式，每个目标像素点选择最小聚合代价值所对应的视差值作为最终视差，视差计算的结果是和目标图像相同尺寸的视差图，存储每个像素点的视差值，在图像内外参数已知的情况下，视差图可以转换为深度图，存储每个像素点的深度值，表示每个像素点在空间中的位置。

下面再对结合深度值的策略进行介绍，根据各个目标像素点所对应的至少两个匹配度分别确定深度值，得到目标图像上各个像素点所对应的至少两个深度值，即根据目标图像和另一个图像得到的各个目标像素点所对应的匹配度后，直接根据该匹配度生成深度图，对于其他各个图像，都生成一个深度图。例如，采用SGM算法，使用目标像素点的各个匹配度分别生成深度图，即确定目标图像上各个像素点的深度值。这样，目标图像上每个像素点对应有至少两个深度值。

然后根据目标图像上各个像素点所对应的至少两个深度值，生成目标图像对应的深度图，记为第二深度图。根据至少两个深度值，生成第二深度图的实现方式可以包括多种，例如，对于同一个像素点，在至少两个深度值中选择最小的深度值作为该像素点的第一深度值，聚合所有像素点的第一深度值，得到第二深度图；或者对于同一个像素点，计算该像素点的至少两个深度值的平均值，以该平均值生成第二深度图，或者其他任意适用的方式，本发明实施例对此不做限制。通过根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图，使得至少两个匹配度不仅仅是基于两个拍摄装置之间的基线方向进行匹配得到的结果，结合至少两个匹配度对应确定的深度值来生成深度图，实现了对至少两个计算结果的结合，解决了两个拍摄装置之间在基线方向有时会匹配错误的问题，从而提高了深度图的准确度。

可选地，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图的一种实现方式可以包括：在同一个像素点所对应的至少两个深度值中，选择最小的深度值作为像素点的第一深度值，基于目标图像上各个像素点对应的第一深度值，生成目标图像对应的第二深度图。

每个像素点都对应有至少两个深度值，在其中选择最小的深度值作为该像素点的第一深度值，得到目标图像上各个像素点对应的第一深度值，即以此组成目标图像对应的第二深度图。选择最小的深度值作为该像素点的第一深度值的好处至少包括：在进行自主避障时，避免选择更大的深度值所导致的不必要的碰撞或其他事故，选择最小的深度值更加保险，提高了自主避障的成功率。

可选地，基于所述目标图像上各个像素点对应的第一深度值，生成所述目标图像对应的第二深度图的一种实现方式可以包括：对目标图像上各个像素点对应的第一深度值进行滤波处理，根据目标图像上各个像素点对应的滤波处理后的第一深度值，生成目标图像对应的第二深度图，对目标图像上各个像素点对应的第一深度值进行滤波处理，可以滤除一些错误的深度值，获得更加精确地深度图。

为了滤除一些像素点错误的深度值，需要对目标图像上各个像素点对应的第一深度值进行滤波处理，例如，采用Speckles Filter(斑点过滤器)对各个像素点对应的第一深度值进行滤波处理。然后采用目标图像上各个像素点对应的滤波处理后的第一深度值，生成目标图像对应的第二深度图。

可选地，至少三个拍摄装置设置在可移动平台上时，在生成第一深度图或第二深度图后，还可以包括：根据第一深度图或第二深度图，确定可移动平台的运动轨迹或所述可移动平台上的机械臂的操作轨迹。第一深度图或第二深度图存储着可移动平台周围物体与可移动平台上拍摄装置的距离，继而可以根据拍摄装置在可移动平台上的位置，确定出可移动平台的各个部分与周围物体之间的距离，因此，根据第一深度图或第二深度图可以确定出可移动平台的运动轨迹，避免可移动平台与周围物体发生碰撞或者发生跌落等情况。在可移动平台上有机械臂时，还可以确定出机械臂与周围物体之间的距离，生成机械臂的操作轨迹，避免机械臂与周围物体发生碰撞，或者实现机械臂对周围目标物体的操作。

可选地，至少三个拍摄装置设置在电子设备上，所述设置包括搭载、安装、连接或其他设置方式。所述电子设备包括可移动平台、移动终端、虚拟现实终端、增强现实终端等，或者其他任意适用的电子设备，本发明实施例对此不做限制。

其中，所述可移动平台包括但不限于飞行器、车、机器人等。所述飞行器包括无人驾驶飞行器，如旋翼飞行器，或固定翼飞行器，或者其他任意适用的飞行器，本发明实施例对此不做限制。车包括有人驾驶汽车、无人驾驶汽车、以及遥控车，或者其他任意适用的车，本发明实施例对此不做限制。机器人包括扫地机器人、用于运输的货物的机器人、以及用于监测的机器人等，或者其他任意适用的机器人，本发明实施例对此不做限制。至少三个拍摄装置设置在飞行器、车、机器人等上时，采用本发明实施例的技术方案得到的深度图更加准确，因此，飞行器可以进行更好的自主避障、尤其是旋翼飞行器非常需要准确和敏捷的自主避障，避免飞行器发生坠机或碰撞等事故，提高飞行器的安全性；车也可以进行更好的自主避障，避免车与其他物体或人发生碰撞，使得车具有更高的安全性；机器人也可以进行更好的自主避障，机器人的机械臂可以更准确的对物体进行操作，尤其是扫地机器人可以减少与家具和移动物体的碰撞，不留死角的对所有可达到的位置进行清扫等，提高了机器人的工作能力。

移动终端包括手机、平板电脑、笔记本电脑等，或者其他任意适用的移动终端，本发明实施例对此不做限制。虚拟现实(VR，Virtual Reality)终端包括外接头戴式设备、一体机头显等，或者其他任意适用的虚拟现实终端，本发明实施例对此不做限制。增强现实(AR，Augmented Reality)终端包括透视式头盔、增强现实眼镜等，或者其他任意适用的增强现实终端，本发明实施例对此不做限制。

参照图6，示出了本发明另一实施例的一种深度图生成方法的步骤流程图，具体可以包括如下步骤：

步骤201，获取至少三个拍摄装置所拍摄的至少三个图像。

步骤202，分别对所述目标图像和所要匹配的图像进行矫正，得到矫正后的目标图像和所要匹配的图像，以及矫正后的目标图像和所述目标图像之间的映射关系。

在本发明实施例中，对目标图像和所要匹配的图像进行矫正，使得目标图像和所要匹配的图像上同一个像素点处于同一个水平线或垂直线，针对矫正后的图像进行基于基线方向的搜索可以获得更加精确地结果。如图7所示的图像矫正技术的示意图，在(1)中左右两个摄像头分别拍摄图像，对两个图像进行矫正，使得两个图像发生从(1)到(2)的变化，两个图像上， Corresponding Point(对应点)应该在平行的Epipolar Line(极线)上，如(2)中树顶的点在同一个水平线上，这样只需要在水平线上搜索就能找到匹配的像素点。对目标图像和所要匹配的图像进行矫正，得到矫正后的目标图像，矫正后的所要匹配的图像，以及矫正后的目标图像和目标图像之间的映射关系，矫正后的所要匹配的图像和所要匹配的图像之间的映射关系。

步骤203，将所述矫正后的目标图像上目标像素点和所述目标图像的矫正后的所要匹配的图像上的像素点进行匹配，分别计算所述矫正后的目标图像上各个所述目标像素点与矫正后的其所匹配的图像上匹配的像素点之间的匹配度。

在本发明实施例中，在对目标图像和所要匹配的图像进行矫正后，对矫正后的图像中的像素点进行匹配，即将矫正后的目标图像上目标像素点和目标图像的矫正后的所要匹配的图像上的像素点进行匹配，对于每个目标像素点，在另一个图像上寻找和该目标像素点最匹配的像素点，并计算得到该目标像素点与该另一个图像上匹配的像素点之间的匹配度。

步骤204，根据所述第一映射关系和第二映射关系，确定与所述第一图像对应的矫正后的目标图像和与所述第二图像对应的矫正后的目标图像之间的第三映射关系。

在本发明实施例中，以三个图像为例，目标图像分别于第一图像和第二图像进行像素点匹配，因此，矫正后的目标图像与目标图像之间的映射关系包括对目标图像和第一图像进行矫正得到的第一映射关系和对目标图像和第二图像进行矫正得到的第二映射关系。

由于与第一图像对应的矫正后的目标图像和与第二图像对应的矫正后的目标图像并不相同，也不是原始的目标图像，因此无法直接将基于与第一图像对应的矫正后的目标图像的匹配度和基于与第二图像对应的矫正后的目标图像的匹配度进行融合，需要先通过映射关系，将两个匹配度对应到同一个图像上。由于第一映射关系和第二映射关系都与原始的目标图像的映射关系，因此通过第一映射关系和第二映射关系可以计算出与第一图像对应的矫正后的目标图像和与第二图像对应的矫正后的目标图像之间的第三映射关系。

步骤205，根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的匹配度转换为与所述第一图像对应的矫正后的目标图像对应的匹配度。

现有技术中由于只有两个拍摄装置，因此可以直接对两个拍摄装置拍摄的两个图像进行计算获得一个匹配度，进而获得深度值。而本发明实施例由于至少需要三个拍摄装置，至少三个拍摄装置拍摄至少获得三个拍摄图像，因此当选择一个目标图像分别与另外的至少两个图像进行匹配时，对于目标图像上的同一个像素点会获得至少两个匹配度，要想对所述至少两个匹配度进行融合操作，则要求所述至少两个匹配度对应的是同一张图像。由前述可知，为了获得更加精确的结果，对至少三个拍摄图像进行了矫正操作，由此计算获得的匹配度所对应的矫正后的图像并不是同一个图像，因此，在本发明实施例中，利用第三映射关系，可以将与第二图像对应的矫正后的目标图像对应的匹配度转换为与第一图像对应的矫正后的目标图像对应的匹配度，使得目标像素点的匹配度都与基于同一个图像，以便后续可以进行融合。

可选地，只有采用的像素点匹配算法需要矫正时，才对目标图像和所要匹配的图像进行矫正。映射关系包括对目标图像和第三图像进行矫正得到的第四映射关系；在所述对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，还可以包括：根据第四映射关系，将与第三图像对应的矫正后的目标图像对应的匹配度转换为目标图像对应的匹配度。

例如，目标图像和第三图像之间采用Stereo Matching算法进行像素点的匹配，因此需要对目标像素和第三图像进行矫正，得到的匹配度是与第三图像对应的矫正后的目标图像对应的匹配度，而目标图像和其他图像之间采用Plane-Sweeping算法进行像素点匹配，不需要矫正，得到的匹配度是与目标图像对应的匹配度，因此将不是与目标图像对应的匹配度都转换为与目标图像对应的匹配度。

步骤206，对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图。

依据本发明实施例，通过获取至少三个拍摄装置所拍摄的至少三个图像，分别对所述目标图像和所要匹配的图像进行矫正，得到矫正后的目标图像和所要匹配的图像，以及矫正后的目标图像和所述目标图像之间的映射关系，将所述矫正后的目标图像上目标像素点和所述目标图像所要匹配的图像上的像素点进行匹配，分别计算所述矫正后的目标图像上各个所述目标像素点与其所匹配的图像上匹配的像素点之间的匹配度，根据所述第一映射关系和第二映射关系，确定与所述第一图像对应的矫正后的目标图像和与所述第二图像对应的矫正后的目标图像之间的第三映射关系，根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的匹配度转换为与所述第一图像对应的矫正后的目标图像对应的匹配度，对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图，使得至少两个匹配度不仅仅是基于两个拍摄装置之间的基线方向进行匹配得到的结果，对至少两个匹配度进行融合后生成深度图，实现了对至少两个计算结果的结合，解决了两个拍摄装置之间在基线方向有时会匹配错误的问题，从而提高了深度图的准确度。

参照图8，示出了本发明又一实施例的一种深度图生成方法的步骤流程图，具体可以包括如下步骤：

步骤301，获取至少三个拍摄装置所拍摄的至少三个图像。

步骤302，分别对所述目标图像和所要匹配的图像进行矫正，得到矫正后的目标图像和所要匹配的图像，以及矫正后的目标图像和所述目标图像之间的映射关系。

步骤303，将所述矫正后的目标图像上目标像素点和所述目标图像所要匹配的图像上的像素点进行匹配，分别计算所述矫正后的目标图像上各个所述目标像素点与其所匹配的图像上匹配的像素点之间的匹配度。

步骤304，根据所述矫正后的目标图像上各个目标像素点与矫正后的其所匹配的图像上匹配的像素点之间的匹配度，分别计算深度值，得到所述目标图像上各个像素点所对应的至少两个深度值。

在本发明实施例中，若目标图像和所要匹配的图像不需要进行矫正，则根据至少两个匹配度分别确定深度值，得到目标图像上各个像素点所对应的至少两个深度值，若目标图像和所要匹配的图像需要进行矫正，则根据矫正后的目标图像上各个目标像素点与矫正后的其所要匹配的图像之间的匹配度，分别计算深度值，得到目标图像上各个像素点所对应的至少两个深度值。计算深度值的方法与不需要矫正时的方式相同，此处不另赘述。

例如，如图9所示的深度值生成的示意图。对上图和左图进行矫正时，上图矫正后得到上图1，左图矫正后得到左图1，对上图和右图进行矫正时，上图矫正后得到上图2，右图矫正后得到右图1。深度图1是基于左图1的深度图，深度图2是基于左图2的深度图。所以深度图1和深度图2实际上并不能直接结合，需要先找到映射关系，一一对应起来才能结合。

步骤305，根据所述第一映射关系和第二映射关系，确定与所述第一图像对应的矫正后的目标图像和与所述第二图像对应的矫正后的目标图像之间的第三映射关系。

步骤306，根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的深度值转换为与所述第一图像对应的矫正后的目标图像对应的深度值。

在本发明实施例中，利用第三映射关系，可以将与第二图像对应的矫正后的目标图像对应的深度值转换为与第一图像对应的矫正后的目标图像对应的深度值，使得像素点的深度值都与基于同一个图像，以便后续可以进行集合。

例如，如图10所示的深度图结合的示意图，maphex1代表左图与左图1之间的映射关系(即第一映射关系)，maphex2代表左图与左图2之间的映射关系(即第二映射关系)，所以通过maphex1与maphex2可以计算出左图2到左图1的映射关系maphex3(即第三映射关系)，利用maphex3就能将深度图2的深度值映射到左图1上，这样深度图1和深度图2都是基于左图1的，然后用上述的深度值结合的策略，最终结合得到深度图4。

可选地，只有采用的像素点匹配算法需要时，才对目标图像和所要匹配的图像进行矫正。映射关系包括对目标图像和第三图像进行矫正得到的第四映射关系；在根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，还可以包括：根据所述第四映射关系，将与所述第三图像对应的矫正后的目标图像对应的深度值转换为所述目标图像对应的深度值。

例如，目标图像和第三图像之间采用Stereo Matching算法进行像素点的匹配，因此需要对目标像素和第三图像进行矫正，得到的深度值是与第三图像对应的矫正后的目标图像对应的深度值，而目标图像和其他图像之间采用 Plane-Sweeping算法进行像素点匹配，不需要矫正，得到的匹配度是与目标图像对应的深度值，因此将不是与目标图像对应的深度值都转换为与目标图像对应的深度值，需要注意的是，以上算法仅仅是示例性的，并不对本发明构成限制，为了实现本发明所述的方法，也可以采用其他算法进行实现。

步骤307，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图。

依据本发明实施例，通过获取至少三个拍摄装置所拍摄的至少三个图像，分别对所述目标图像和所要匹配的图像进行矫正，得到矫正后的目标图像和所要匹配的图像，以及矫正后的目标图像和所述目标图像之间的映射关系，将所述矫正后的目标图像上目标像素点和所述目标图像所要匹配的图像上的像素点进行匹配，分别计算所述矫正后的目标图像上各个所述目标像素点与其所匹配的图像上匹配的像素点之间的匹配度，根据所述矫正后的目标图像上各个目标像素点与其所匹配的图像上匹配的像素点之间的匹配度，分别计算深度值，得到所述目标图像上各个像素点所对应的至少两个深度值，根据所述第一映射关系和第二映射关系，确定与所述第一图像对应的矫正后的目标图像和与所述第二图像对应的矫正后的目标图像之间的第三映射关系，根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的深度值转换为与所述第一图像对应的矫正后的目标图像对应的深度值，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图，使得至少两个匹配度不仅仅是基于两个拍摄装置之间的基线方向进行匹配得到的结果，结合至少两个深度值生成深度图，实现了对至少两个计算结果的结合，解决了两个拍摄装置之间在基线方向有时会匹配错误的问题，从而提高了深度图的准确度。

参照图11，示出了本发明再一实施例的一种电子设备的示意图，所述电子设备包括处理器401、存储器402和至少三个拍摄装置403；

所述处理器在对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合时，用于：

所述处理器在根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图时，用于：

所述处理器在基于所述目标图像上各个像素点对应的第一深度值，生成所述目标图像对应的第二深度图时，用于：

在所述处理器计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度之前，所述处理器还用于：

所述处理器在计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度时，用于：

所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述处理器对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述处理器还用于：

所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述处理器对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述处理器还用于：

所述处理器根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值时，用于：

所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述处理器根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述处理器还用于：

所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述处理器根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述处理器还用于：

所述拍摄装置为三个，所述拍摄装置之间的位置关系包括品字形、或L形中的任意一种。

所述电子设备包括可移动平台、移动终端、虚拟现实终端、或增强现实终端中的任意一种。所述可移动平台包括飞行棋、车、或机器人等。所述飞行器包括无人驾驶飞行器，如旋翼飞行器，或固定翼飞行器，或者其他任意适用的飞行器，本发明实施例对此不做限制。车包括有人驾驶汽车、无人驾驶汽车、以及遥控车，或者其他任意适用的车，本发明实施例对此不做限制。机器人包括扫地机器人、用于运输的货物的机器人、以及用于监测的机器人等，或者其他任意适用的机器人，本发明实施例对此不做限制。

所述处理器还用于：

所述电子设备包括显示器，所述显示器用于：

对所述第一深度图或第二深度图进行显示，通过显示所述深度图，可以使操作人员及时地、直观地了解到电子设备周围的环境信息，例如电子设备周围有哪些物体，哪些物体距离电子设备较近，哪些物体距离电子设备较远，从而及时的电子设备的移动、作业、或其他操作进行控制。需要注意的是，所述电子设备包括显示器并不限制于所述显示器必须设置在所述电子设备上，所说显示器也可以与所述电子设备以通信方式进行连接，例如，所述显示器可以与所述可移动平台通过蓝牙、移动网络、或WiFi连接，所述显示器可以设置在远程的遥控器上，也可以设置在远程的计算机上，本发明对此不作限制。

所述处理器还用于：

将所述第一深度图或第二深度图发送给所述可移动平台的控制设备，以供所述控制设备对所述第一深度图或第二深度图进行显示或根据所述第一深度图或第二深度图生成对所述可移动平台的控制指令。

其中，控制设备可以通过蓝牙、无线网络、5G网络等方式与可移动平台进行通信，控制设备可以对第一深度图或第二深度图进行实时显示，或者控制设备可以根据第一深度图或第二深度图生成控制指令，例如，由控制设备根据第一深度图或第二深度图，确定可移动平台的运动轨迹或可移动平台上的机械臂的操作轨迹，并根据运动轨迹或操作轨迹生成相应的控制指令，再将控制指令发送给可移动平台。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的计算处理设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

例如，图12示出了可以实现根据本发明的方法的计算处理设备。该计算处理设备传统上包括处理器1010和以存储器1020形式的计算机程序产品或者计算机可读介质。存储器1020可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器1020具有用于执行上述方法中的任何方法步骤的程序代码1031的存储空间1030。例如，用于程序代码的存储空间1030可以包括分别用于实现上面的方法中的各种步骤的各个程序代码1031。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为如参考图13所述的便携式或者固定存储单元。该存储单元可以具有与图12的计算处理设备中的存储器1020类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元包括计算机可读代码1031’，即可以由例如诸如1010之类的处理器读取的代码，这些代码当由计算处理设备运行时，导致该计算处理设备执行上面所描述的方法中的各个步骤。

本文中所称的“一个实施例”、“实施例”或者“一个或者多个实施例”意味着，结合实施例描述的特定特征、结构或者特性包括在本发明的至少一个实施例中。此外，请注意，这里“在一个实施例中”的词语例子不一定全指同一个实施例。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

一种深度图生成方法，其特征在于，包括：

获取至少三个拍摄装置所拍摄的至少三个图像；

计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度；

对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图；或者，根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图。
根据权利要求1所述的方法，其特征在于，所述对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合包括：

对于同一个所述目标像素点，将其所对应的所述至少两个匹配度作求和运算，得到所述目标像素点所对应的融合后的匹配度。
根据权利要求1所述的方法，其特征在于，所述根据各个所述目标像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图包括：

在同一个所述像素点所对应的所述至少两个深度值中，选择最小的深度值作为所述像素点的第一深度值；

基于各个所述目标像素点对应的第一深度值，生成所述目标图像对应的第二深度图。
根据权利要求3所述的方法，其特征在于，所述基于所述目标图像上各个像素点对应的第一深度值，生成所述目标图像对应的第二深度图包括：

对所述目标图像上各个像素点对应的第一深度值进行滤波处理；

根据所述目标图像上各个像素点对应的滤波处理后的第一深度值，生成所述目标图像对应的第二深度图。
根据权利要求1所述的方法，其特征在于，在所述计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度之前，所述方法还包括：

分别对所述目标图像和所要匹配的图像进行矫正，得到矫正后的目标图像和所要匹配的图像，以及矫正后的目标图像和所述目标图像之间的映射关系。
根据权利要求5所述的方法，其特征在于，所述计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度包括：

将所述矫正后的目标图像上目标像素点和所述目标图像的矫正后的所要匹配的图像上的像素点进行匹配，分别计算所述矫正后的目标图像上各个所述目标像素点与矫正后的其所匹配的图像上匹配的像素点之间的匹配度。
根据权利要求6所述的方法，其特征在于，所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述方法还包括：

根据所述第一映射关系和第二映射关系，确定与所述第一图像对应的矫正后的目标图像和与所述第二图像对应的矫正后的目标图像之间的第三映射关系；

根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的匹配度转换为与所述第一图像对应的矫正后的目标图像对应的匹配度。
根据权利要求6所述的方法，其特征在于，所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述方法还包括：

根据所述第四映射关系，将与所述第三图像对应的矫正后的目标图像对应的匹配度转换为所述目标图像对应的匹配度。
根据权利要求6所述的方法，其特征在于，所述根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值包括：

根据所述矫正后的目标图像上各个目标像素点与矫正后的其所匹配的图像上匹配的像素点之间的匹配度，分别计算深度值，得到所述目标图像上各个像素点所对应的至少两个深度值。
根据权利要求9所述的方法，其特征在于，所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述方法还包括：

根据所述第一映射关系和第二映射关系，确定与所述第一图像对应的矫正后的目标图像和与所述第二图像对应的矫正后的目标图像之间的第三映射关系；

根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的深度值转换为与所述第一图像对应的矫正后的目标图像对应的深度值。
根据权利要求9所述的方法，其特征在于，所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述方法还包括：

根据所述第四映射关系，将与所述第三图像对应的矫正后的目标图像对应的深度值转换为所述目标图像对应的深度值。
根据权利要求1所述的方法，其特征在于，所述拍摄装置为三个，所述拍摄装置之间的位置关系包括品字形、或L形中的任意一种。
根据权利要求1所述的方法，其特征在于，所述至少三个拍摄装置设置在电子设备上，所述电子设备包括可移动平台、移动终端、虚拟现实终端、或增强现实终端中的任意一种。
根据权利要求1所述的方法，其特征在于，所述至少三个拍摄装置设置在可移动平台上，所述方法还包括：

根据所述第一深度图或第二深度图，确定所述可移动平台的运动轨迹或所述可移动平台上的机械臂的操作轨迹。
一种电子设备，其特征在于，所述电子设备包括处理器、存储器和至少三个拍摄装置；

所述处理器用于：获取至少三个拍摄装置所拍摄的至少三个图像；计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度；对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合，基于各个所述目标像素点所对应的融合后的匹配度，生成所述目标图像对应的第一深度图；或者，根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值，根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图。
根据权利要求15所述的电子设备，其特征在于，所述处理器在对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合时，用于：

对于同一个所述目标像素点，将其所对应的所述至少两个匹配度作求和运算，得到所述目标像素点所对应的融合后的匹配度。
根据权利要求15所述的电子设备，其特征在于，所述处理器在根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图时，用于：

在同一个所述像素点所对应的所述至少两个深度值中，选择最小的深度值作为所述像素点的第一深度值；

基于所述目标图像上各个像素点对应的第一深度值，生成所述目标图像对应的第二深度图。
根据权利要求17所述的电子设备，其特征在于，所述处理器在基于所述目标图像上各个像素点对应的第一深度值，生成所述目标图像对应的第二深度图时，用于：

对所述目标图像上各个像素点对应的第一深度值进行滤波处理；

根据所述目标图像上各个像素点对应的滤波处理后的第一深度值，生成所述目标图像对应的第二深度图。
根据权利要求15所述的电子设备，其特征在于，在所述处理器计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度之前，所述处理器还用于：

分别对所述目标图像和所要匹配的图像进行矫正，得到矫正后的目标图像和所要匹配的图像，以及矫正后的目标图像和所述目标图像之间的映射关系。
根据权利要求19所述的电子设备，其特征在于，所述处理器在计算所述至少三个图像中目标图像上的目标像素点与其他各个图像上匹配的像素点之间的至少两个匹配度时，用于：

将所述矫正后的目标图像上目标像素点和所述目标图像的矫正后的所要匹配的图像上的像素点进行匹配，分别计算所述矫正后的目标图像上各个所述目标像素点与矫正后的其所匹配的图像上匹配的像素点之间的匹配度。
根据权利要求20所述的电子设备，其特征在于，所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述处理器对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述处理器还用于：

根据所述第一映射关系和第二映射关系，确定与所述第一图像对应的矫正后的目标图像和与所述第二图像对应的矫正后的目标图像之间的第三映射关系；

根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的匹配度转换为与所述第一图像对应的矫正后的目标图像对应的匹配度。
根据权利要求20所述的电子设备，其特征在于，所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述处理器对于同一个所述目标像素点，将其所对应的所述至少两个匹配度进行融合之前，所述处理器还用于：

根据所述第四映射关系，将与所述第三图像对应的矫正后的目标图像对应的匹配度转换为所述目标图像对应的匹配度。
根据权利要求20所述的电子设备，其特征在于，所述处理器根据所述至少两个匹配度分别确定深度值，得到所述目标图像上各个像素点所对应的至少两个深度值时，用于：

根据所述矫正后的目标图像上各个目标像素点与其所匹配的图像上匹配的像素点之间的匹配度，分别计算深度值，得到所述目标图像上各个像素点所对应的至少两个深度值。
根据权利要求23所述的电子设备，其特征在于，所述映射关系包括对所述目标图像和第一图像进行矫正得到的第一映射关系和对所述目标图像和第二图像进行矫正得到的第二映射关系；在所述处理器根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述处理器还用于：

根据所述第一映射关系和第二映射关系，确定与所述第一图像对应的矫正后的目标图像和与所述第二图像对应的矫正后的目标图像之间的第三映射关系；

根据所述第三映射关系，将与所述第二图像对应的矫正后的目标图像对应的深度值转换为与所述第一图像对应的矫正后的目标图像对应的深度值。
根据权利要求23所述的电子设备，其特征在于，所述映射关系包括对所述目标图像和第三图像进行矫正得到的第四映射关系；在所述处理器根据所述目标图像上各个像素点所对应的至少两个深度值，生成所述目标图像对应的第二深度图之前，所述处理器还用于：

根据所述第四映射关系，将与所述第三图像对应的矫正后的目标图像对应的深度值转换为所述目标图像对应的深度值。
根据权利要求15所述的电子设备，其特征在于，所述拍摄装置为三个，所述拍摄装置之间的位置关系包括品字形、或L形中的任意一种。
根据权利要求15所述的电子设备，其特征在于，所述电子设备包括可移动平台、移动终端、虚拟现实终端、或增强现实终端中的任意一种。
根据权利要求15所述的电子设备，其特征在于，所述电子设备为可移动平台，所述处理器还用于：

根据所述第一深度图或第二深度图，确定所述可移动平台的运动轨迹或所述可移动平台上的机械臂的操作轨迹。
根据权利要求15所述的电子设备，其特征在于，所述电子设备包括显示器，所述显示器用于：

对所述第一深度图或第二深度图进行显示。
根据权利要求15所述的电子设备，其特征在于，所述处理器还用于：

将所述第一深度图或第二深度图发送给所述电子设备的控制设备，以供所述控制设备对所述第一深度图或第二深度图进行显示或根据所述第一深度图或第二深度图生成对所述电子设备的控制指令。
一种计算机程序，包括计算机可读代码，当所述计算机可读代码在计算处理设备上运行时，导致所述计算处理设备执行根据权利要求1-14中的任一个所述的深度图生成方法。
一种计算机可读介质，其中存储了如权利要求31所述的计算机程序。