CN114463409A

CN114463409A - 图像深度信息的确定方法、装置、电子设备和介质

Info

Publication number: CN114463409A
Application number: CN202210129100.9A
Authority: CN
Inventors: 毋戈; 周宇
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-02-11
Filing date: 2022-02-11
Publication date: 2022-05-10
Anticipated expiration: 2042-02-11
Also published as: US20230260144A1; CN114463409B; US11783501B2; EP4227904A2; EP4227904A3

Abstract

本公开提供了一种图像深度信息的确定方法、装置、电子设备和介质，涉及图像处理技术领域，尤其涉及三维点云、云计算及云服务技术领域。具体实现方案为：获取第一预测层输出的目标图像中像素点的第一深度信息；根据所述第一深度信息生成所述目标图像的点云模型，并根据所述点云模型确定在第二预测层中所述目标图像中像素点的初始深度信息；根据所述初始深度信息进行传播优化，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息；其中，所述第一预测层位于所述第二预测层之前。本公开实现了提高确定图像深度信息的精准度和完整度的效果。

Description

图像深度信息的确定方法、装置、电子设备和介质

技术领域

本公开涉及图像处理技术领域，尤其涉及三维点云、云计算及云服务技术领域，特别涉及一种图像深度信息的确定方法、装置、电子设备和介质。

背景技术

多视图立体视觉一直是计算机视觉研究的一个热点。它的目的是根据多个已知相机姿态的图像的对应关系，建立稠密的三维点云重建结果。

多视图立体视觉一般采用两个步骤重建三维点云。首先为每幅图像估计其深度图，然后将这些深度图融合得到统一的点云表示。其中，如何估计深度图是该流程的关键。

发明内容

本公开提供了一种用于提高确定图像深度信息的精准度和完整度的方法、装置、电子设备和介质。

根据本公开的一方面，提供了一种图像深度信息的确定方法，包括：

获取第一预测层输出的目标图像中像素点的第一深度信息；

根据所述第一深度信息生成所述目标图像的点云模型，并根据所述点云模型确定在第二预测层中所述目标图像中像素点的初始深度信息；

根据所述初始深度信息进行传播优化，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息；

其中，所述第一预测层位于所述第二预测层之前。

根据本公开的另一方面，提供了一种图像深度信息的确定装置，包括：

第一深度信息获取模块，用于获取第一预测层输出的目标图像中像素点的第一深度信息；

初始深度信息确定模块，用于根据所述第一深度信息生成所述目标图像的点云模型，并根据所述点云模型确定在第二预测层中所述目标图像中像素点的初始深度信息；

第二深度信息确定模块，用于根据所述初始深度信息进行传播优化，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息；

其中，所述第一预测层位于所述第二预测层之前。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开中任一项所述的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行本公开中任一项所述的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行本公开中任一项所述的方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开实施例公开的一些图像深度信息的确定方法的流程图；

图2A是根据本公开实施例公开的另一些图像深度信息的确定方法的流程图；

图2B是根据本公开实施例公开的一些三角化的示意图；

图2C是根据本公开实施例公开的一些初始深度信息的对比示意图；

图3A是根据本公开实施例公开的另一些图像深度信息的确定方法的流程图；

图3B是根据本公开实施例公开的一些图像采集的示意图；

图3C是根据本公开实施例公开的一些确定图像深度信息的步骤示意图；

图3D是根据本公开实施例公开的另一些确定图像深度信息的步骤示意图；

图4是根据本公开实施例公开的一些图像深度信息的确定装置的结构示意图；

图5是用来实现本公开实施例公开的图像深度信息的确定方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

申请人在研发过程中发现，当图像的显示质量不佳时，例如图像存在弱纹理、遮挡或反射等问题，现有方法无法准确且完整的确定出图像中各像素点的深度信息，导致图像的深度图经常会出现较大面积的孔洞。从而导致后续根据深度图重建得到的三维点云效果不佳。

因此如何完整且准确的确定图像的深度信息仍然是一个亟需解决的问题。

图1是根据本公开实施例公开的一些图像深度信息的确定方法的流程图，本实施例可以适用于确定图像中各像素点的深度信息的情况。本实施例方法可以由本公开实施例公开的图像深度信息的确定装置来执行，所述装置可采用软件和/或硬件实现，并可集成在任意的具有计算能力的电子设备上。

如图1所示，本实施例公开的图像深度信息的确定方法可以包括：

S101、获取第一预测层输出的目标图像中像素点的第一深度信息。

其中，目标图像表示通过相机对需要进行三维点云重建的物体进行拍摄得到的拍摄图像，通常情况下拍摄图像为相机在不同位姿下进行拍摄得到的，而目标图像可以为相机在任一位姿下的拍摄图像，目标图像的类型包括但不限于RGB图像、HSV图像或者CMY图像等，本实施例并不对目标图像的具体类型进行限定。像素点的深度信息包括像素点的深度值以及像素点的深度方向，其中像素点的深度值表示存储像素点所用的位数，像素点的深度方向表示像素点的法向量方向。

预测层表示对目标图像中像素点的深度信息进行预测，所采用的算法步骤的集合。在本实施例中设置有至少两层预测层，每一层预测层都会输出一次目标图像中像素点的深度信息，并且该深度信息还会输入至该预测层之后的预测层中用于辅助预测，直至最后一层预测层输出最终预测得到的深度信息。第一预测层表示除最后一层预测层以外的任一预测层，例如总共设置N层(N≥2)预测层，则第一预测层可以为1层、……、N-1层中的任一预测层。

在一种实施方式中，若第一预测层为第一层，则可以采用包括如下方式输出第一深度信息：

获取通过对同一物体采集得到的图像序列，并采用稀疏重建算法对图像序列中的所有图像进行点云重建，生成稀疏点云模型。将稀疏点云模型中各点投影到图像序列中的目标图像中，并在目标图像中对投影像素点进行三角化和线性插值，确定第一预测层中目标图像中像素点的初始深度信息。根据初始深度信息进行传播优化，得到对初始深度信息进行优化后的优化深度信息，并将优化深度信息作为第一预测层输出的目标图像中像素点的第一深度信息。

通过获取第一预测层输出的目标图像中像素点的第一深度信息，为后续确定第二预测层中目标图像中像素点的初始深度信息，奠定了数据基础。

S102、根据所述第一深度信息生成所述目标图像的点云模型，并根据所述点云模型确定在第二预测层中所述目标图像中像素点的初始深度信息。

其中，第二预测层表示除第一层预测层以外的任一预测层，例如总共设置N层(N≥2)预测层，则第二预测层可以为2层、……、N层中的任一预测层。目标图像的点云模型表示目标图像的像素点在世界坐标系下构成的三维点云。初始深度信息表示目标图像中像素点在各预测层中设置的初始迭代值，用于后续在各预测层中进行传播优化，得到最终输出的深度信息。

在一种实施方式中，获取第一预测层输出的目标图像中像素点的第一深度信息之后，获取目标图像中像素点的图像坐标信息，以及采集目标图像的相机的内参信息，并确定第一深度信息与图像坐标信息之间的矩阵乘积，进而根据矩阵乘积与内参信息之间的矩阵比值，确定目标图像中像素点在世界坐标系下的世界坐标信息，并根据世界坐标信息生成目标图像的点云模型。最终将目标图像的点云模型中各点投影到目标图像中，并在目标图像中对投影像素点进行三角化和线性插值，确定第二预测层中目标图像中像素点的初始深度信息。

通过根据第一预测层输出的第一深度信息，确定第二预测层中目标图像中像素点的初始深度信息，由于第二预测层的初始深度信息是在第一预测层输出的第一深度信息的基础上开展的，因此能够取得一个较好的初始深度信息。

S103、根据所述初始深度信息进行传播优化，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息；其中，所述第一预测层位于所述第二预测层之前。

在一种实施方式中，确定图像序列中与目标图像对应最佳的匹配图像，并确定目标图像与匹配图像之间像素点的对应关系。根据目标图像中各像素点的初始深度信息，以及目标图像与匹配图像中对应像素点之间的相似性，对各像素点的初始深度信息进行传播优化。传播优化可以包括三个过程：空间传播、平面传播和视图传播。

在空间传播过程中，确定目标图像中当前像素点的当前初始深度信息，以及当前像素点在目标图像中的相邻像素点的相邻初始深度信息。并且，确定当前像素点在匹配图像中对应的匹配像素点，进而分别确定当前像素点为当前初始深度信息时和相邻初始深度信息时，与匹配像素点的相似性，并选取相似性最大时对应的初始深度信息，作为当前像素点优化后的优化深度信息。其中，当前像素点表示目标图像中的任一像素点。

在平面传播过程中，根据当前像素点的优化深度信息确定一个深度信息区间，并遍历确定当前像素点为深度信息区间中各深度信息时，分别与匹配像素点的相似性，并选取相似性最大时对应的初始深度信息，作为第二预测层输出的当前像素点的第二深度信息。

通过空间传播和平面传播对目标图像中所有的像素点进行遍历，从而确定第二预测层输出的目标图像中像素点的第二深度信息。

在视图传播过程中，将通过空间传播和平面传播得到的目标图像中像素点的第二深度信息，赋予给匹配图像中对应的像素点，从而无需再对匹配图像的深度信息进行预测，提高了确定图像序列各图像中像素点的深度信息的效率。

在确定第二预测层输出的目标图像中像素点的第二深度信息之后，若第二预测层不是最后一层预测层，则继续根据第二深度信息确定在第二预测层之后预测层中，目标图像中像素点的初始深度信息，直至最后一层预测层得到输出的深度信息为止。

本公开通过获取第一预测层输出的目标图像中像素点的第一深度信息，根据第一深度信息生成目标图像的点云模型，并根据点云模型确定在第二预测层中目标图像中像素点的初始深度信息，进而根据初始深度信息进行传播优化，确定第二预测层输出的目标图像中像素点的第二深度信息，由于第二预测层的初始深度信息是在第一预测层输出的第一深度信息的基础上开展的，因此能够取得一个较完整且准确的初始深度信息，进一步使得对初始深度信息进行传播优化得到的第二深度信息也更加完整且准确。并且，相比现有技术中仅设置一层预测层进行深度信息预测，本公开设置有至少两层预测层，且每层预测层输出的深度信息会用于辅助后续预测层的预测，从而使得最终预测得到的图像中像素点的深度信息，更加准确且完整，即可以预测出更多像素点的深度信息，且预测出的深度信息更加准确。

图2A是根据本公开实施例公开的另一些图像深度信息的确定方法的流程图，基于上述技术方案进一步优化与扩展，并可以与上述各个可选实施方式进行结合。

如图2A所示，本实施例公开的图像深度信息的确定方法可以包括：

S201、获取第一预测层输出的目标图像中像素点的第一深度信息。

S202、获取所述目标图像中像素点的图像坐标信息，以及采集所述目标图像的相机的内参信息和外参信息。

其中，像素点的图像坐标信息表示像素点在图像坐标系下的二维坐标。内参信息表示相机的内部参数，包括但不限于焦距、畸变系数、切向畸变、径向畸变和相机镜头畸变等等。外参信息包括相机拍摄目标图像时在世界坐标系下的位置信息和姿态信息。

S203、根据所述图像坐标信息、所述内参信息、所述外参信息和所述第一深度信息，确定所述目标图像中像素点的世界坐标信息，并根据所述世界坐标信息生成所述目标图像的点云模型。

在一种实施方式中，采用如下等式确定目标图像中像素点的世界坐标信息：

Z×W＝K×P×V

其中，Z表示第一深度信息，W表示图像坐标信息，K表示内参信息，P表示外参信息，V表示像素点的世界坐标信息。

确定目标图像中像素点的世界坐标信息后，根据世界坐标信息对各像素点进行三维点云重建，得到目标图像的点云模型。

S204、确定所述点云模型中各点在所述目标图像中的投影像素点，并根据所述投影像素点的深度信息，确定在第二预测层中所述目标图像中像素点的初始深度信息。

在一种实施方式中，将点云模型中各三维点向目标图像进行投影，确定在目标图像中的至少一个投影像素点，而投影像素点的深度信息即为其在点云模型中对应三维点的深度信息。在目标图像中对投影像素点进行三角化和线性插值，确定第二预测层中目标图像中像素点的初始深度信息。

可选的，S204包括以下步骤A和B：

A、在所述目标图像中对所述投影像素点进行三角化，确定在所述目标图像中所述投影像素点构成的至少一个三角区域。

其中，点云模型中各点的深度信息是已知的，而投影像素点与其在点云模型中对应点的深度信息相同。因此投影像素点是目标图像中已知深度信息的像素点，而目标图像中除投影像素点之外的其他像素点，深度信息是未知的，需要根据已知深度信息的投影像素点来推测其他像素点的深度信息。

在一种实施方式中，在目标图像中对投影像素点进行三角化，得到以投影像素点为顶点的不存在交集的至少一个三角区域。

示例性的，图2B是根据本公开实施例公开的一些三角化的示意图，如图2B所示，200表示目标图像，201表示目标图像的点云模型在目标图像中的投影像素点，则对投影像素点201进行三角化，确定至少一个三角区域202。

B、根据所述投影像素点的深度信息，对所述三角区域中的像素点进行线性插值，并根据插值结果确定在第二预测层中所述目标图像中像素点的初始深度信息。

在一种实施方式中，将目标图像上由投影像素点组成的三角区域离散化得到像素点，并根据投影像素点的深度信息计算三角区域的平面方程，进而将这些像素点线性插值到对应的像素坐标上，每插入一个像素点会算出对应的初始深度信息，从而根据插值结果确定在第二预测层中目标图像中像素点的初始深度信息。

通过在目标图像中对投影像素点进行三角化，确定在目标图像中投影像素点构成的至少一个三角区域，并根据投影像素点的深度信息，对三角区域中的像素点进行线性插值，并根据插值结果确定在第二预测层中目标图像中像素点的初始深度信息，实现了根据目标图像的点云模型确定目标图像中像素点的初始深度信息的效果，为后续进行传播优化奠定了数据基础。

图2C是根据本公开实施例公开的一些初始深度信息的对比示意图，如图2C所示，203为根据第一预测层中目标图像中像素点的初始深度信息，生成的初始深度图，204为根据第二预测层中目标图像中像素点的初始深度信息，生成的初始深度图。对比可见，第二预测层的初始深度图相比第一预测层的初始深度图，像素点的深度信息更加完整且准确。

S205、根据所述初始深度信息进行传播优化，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息；其中，所述第一预测层位于所述第二预测层之前。

本公开通过获取目标图像中像素点的图像坐标信息，以及采集目标图像的相机的内参信息和外参信息，并根据图像坐标信息、内参信息、外参信息和第一深度信息，确定目标图像中像素点的世界坐标信息，并根据世界坐标信息生成目标图像的点云模型，由于目标图像的点云模型是在第一预测层输出的第一深度信息的基础上构建得到的，因此能够取得一个较完整且准确的点云模型，进一步使得根据点云模型确定的初始深度信息也更加完整且准确；通过确定点云模型中各点在目标图像中的投影像素点，并根据投影像素点的深度信息，确定在第二预测层中目标图像中像素点的初始深度信息，实现了根据点云模型确定初始深度信息的效果，为后续根据初始深度信息进行传播优化，奠定了数据基础。

图3A是根据本公开实施例公开的另一些图像深度信息的确定方法的流程图，对上述技术方案中“根据所述初始深度信息进行传播优化，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息”进行进一步优化与扩展，并可以与上述各个可选实施方式进行结合。

如图3A所示，本实施例公开的图像深度信息的确定方法可以包括：

S301、采用双目视觉算法，从所述目标图像所属的图像序列中确定所述目标图像的匹配图像；其中，所述图像序列通过对同一物体采集得到的。

其中，图像序列中的图像是相机对同一物体采用不同的位姿采集得到的。图3B是根据本公开实施例公开的一些图像采集的示意图，如图3B所示，围绕目标物体300周围的每个阴影区域表示相机进行采集时对应的位姿。

在一种实施方式中，将相机看作人的眼睛，那么相机在一个位姿采集到的图像，在图像序列中存在另一个位姿采集到的图像，能与其构成双目视觉。在图像序列中采用双目视觉算法，将目标图像与除目标图像以外的图像进行匹配，将匹配度最高的图像作为目标图像对应的匹配图像。

S302、根据采集所述目标图像的相机的外参信息和内参信息，以及采集所述匹配图像的相机的外参信息和内参信息，确定所述目标图像中像素点与所述匹配图像中像素点的对应关系。

在一种实施方式中，由于目标图像与匹配图像均是对同一物体采集得到的，而目标物体在世界坐标系下的世界坐标信息是固定的，因此目标图像与匹配图像的对应像素的世界坐标信息是相同的。因此根据目标图像中任一像素点的图像坐标信息，以及采集目标图像的相机的外参信息和内参信息，可以确定该像素点的世界坐标信息，基于该世界坐标信息以及采集匹配图像的相机的外参信息和内参信息，可以反推出匹配图像中与该像素点对应的像素点。

S303、根据对应像素点之间的相似性，对所述目标图像中像素点的初始深度信息进行优化传播，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息。

其中，当目标图像和匹配图像中对应像素点之间的相似性越高，则表示目标图像中像素点的深度信息更准确。本实施例中对应像素点之间的相似性可以根据代价计算的方式来确定，本实施例并不对具体采用何种代价计算公式进行限定。

在一种实施方式中，确定目标图像中当前像素点的当前初始深度信息，以及当前像素点在目标图像中的相邻像素点的相邻初始深度信息。并且，确定当前像素点在匹配图像中对应的匹配像素点，进而分别确定当前像素点为当前初始深度信息时和相邻初始深度信息时，与匹配像素点的相似性，根据相似性确定第二预测层输出的当前像素点的第二深度信息。

可选的，S303中“根据对应像素点之间的相似性，对所述目标图像中像素点的初始深度信息进行优化传播，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息”，包括以下步骤：

A、根据所述对应关系，确定所述目标图像中当前像素点在所述匹配图像中对应的匹配像素点。

其中，当前像素点可以为目标图像中的任一像素点。

B、确定所述当前像素点的当前初始深度信息，以及所述当前像素点在所述目标图像中的相邻像素点的相邻初始深度信息。

其中，相邻像素点可以为位于当前像素点左侧或右侧的像素点。本实施例中优化传播的迭代次数可以为多次，即从目标图像左上角像素点开始延Z字形顺序依次向下开始传播，直至传播到右下角像素点完成一次优化传播，并继续从图像右下角延Z字形顺序依次向上开始第二次优化传播。可见，当为奇数次传播时相邻像素点是当前像素点右侧相邻的像素点，当为偶数次传播时相邻像素点是当前像素点左侧相邻的像素点。

C、确定所述当前像素点为所述当前初始深度信息时，与所述匹配像素点之间的第一相似性，以及所述当前像素点为所述相邻初始深度信息时，与所述匹配像素点之间的第二相似性。

在一种实施方式中，采用代价计算方式确定赋予当前像素点为当前初始深度信息时，当前像素点与匹配像素点之间的第一相似性，并继续采用代价计算方式确定赋予当前像素点为相邻初始深度信息时，当前像素点与匹配像素点之间的第二相似性。

D、根据所述第一相似性和所述第二相似性，确定所述第二预测层输出的所述当前像素点的第二深度信息。

在一种实施方式中，比较第一相似性和第二相似性之间的大小，并选取相似性较大的初始深度信息作为第二预测层输出的当前像素点的第二深度信息。

通过根据对应关系，确定目标图像中当前像素点在匹配图像中对应的匹配像素点，确定当前像素点的当前初始深度信息，以及当前像素点在目标图像中的相邻像素点的相邻初始深度信息，确定当前像素点为当前初始深度信息时，与匹配像素点之间的第一相似性，以及当前像素点为相邻初始深度信息时，与匹配像素点之间的第二相似性，根据第一相似性和第二相似性，确定第二预测层输出的当前像素点的第二深度信息，实现了根据对应像素点的相似性，来实现优化传播的效果，保证了第二深度信息确定的精准度。

可选的，步骤D包括：

D1、在所述第一相似性大于所述第二相似性的情况下，将所述当前初始深度信息作为所述当前像素点的优化深度信息，在所述第一相似性小于所述第二相似性的情况下，将所述相邻初始深度信息作为所述当前像素点的优化深度信息。

示例性的，假设第一相似性为0.9，第二相似性为0.8，则将当前初始深度信息作为当前像素点的优化深度信息；假设第一相似性为0.8，第二相似性为0.9，则将相邻初始深度信息作为当前像素点的优化深度信息。

D2、根据所述优化深度信息确定所述第二预测层输出的所述当前像素点的第二深度信息。

在一种实施方式中，直接将优化深度信息作为第二预测层输出的当前像素点的第二深度信息。

在另一种实施方式中，对优化深度信息进行微调，并将得到的调整深度信息作为第二预测层输出的当前像素点的第二深度信息。

通过在第一相似性大于第二相似性的情况下，将当前初始深度信息作为当前像素点的优化深度信息，在第一相似性小于第二相似性的情况下，将相邻初始深度信息作为当前像素点的优化深度信息，并根据优化深度信息确定第二预测层输出的当前像素点的第二深度信息，实现了根据初始深度信息进行传播优化的效果，提高了确定第二深度信息的精准度。

可选的，步骤D2包括：

D21、根据所述优化深度信息确定深度信息区间，并根据所述深度信息区间确定至少一个调整深度信息。

在一种实施方式中，将预设深度值范围内任意一个值加到优化深度值上，并将预设深度方向范围内随机一个值加到优化深度方向上，得到深度值区间和深度方向区间，作为深度信息区间。将深度信息区间中的所有深度信息作为调整深度信息。

D22、确定所述当前像素点为各所述调整深度信息时，与所述匹配像素点之间的第三相似性。

在一种实施方式中，采用代价计算方式确定赋予当前像素点分别为各调整深度信息时，当前像素点与匹配像素点之间的第三相似性。

D23、根据所述第三相似性以及各所述调整深度信息，确定所述第二预测层输出的所述当前像素点的第二深度信息。

在一种实施方式中，选取第三相似性最大时当前像素点对应的调整深度信息，作为第二预测层输出的当前像素点的第二深度信息。

示例性的，假设当前像素点为调整深度信息A、调整深度信息B和调整深度信息C时，与匹配像素点之间的第三相似性分别为0.9、0.8和0.7，则将调整深度信息A作为第二预测层输出的当前像素点的第二深度信息。

通过根据优化深度信息确定深度信息区间，并根据深度信息区间确定至少一个调整深度信息，并确定当前像素点为各调整深度信息时，与匹配像素点之间的第三相似性，进而根据第三相似性以及各调整深度信息，确定第二预测层输出的当前像素点的第二深度信息，实现了对优化深度信息进行区间微调的效果，进一步使得最终输出的第二深度信息的精准度更高。

本公开通过采用双目视觉算法，从目标图像所属的图像序列中确定目标图像的匹配图像；其中，图像序列通过对同一物体采集得到的，并根据采集目标图像的相机的外参信息和内参信息，以及采集匹配图像的相机的外参信息和内参信息，确定目标图像中像素点与匹配图像中像素点的对应关系，进而根据对应像素点之间的相似性，对目标图像中像素点的初始深度信息进行优化传播，确定第二预测层输出的目标图像中像素点的第二深度信息，实现了通过优化传播的方式对初始深度信息进行优化调整，提高了第二预测层输出的目标图像中像素点的第二深度信息的精准度。

图3C是根据本公开实施例公开的一些确定图像深度信息的步骤示意图，如图3C所示，在第一预测层中，确定输入的目标图像中像素点的初始深度信息，再对初始深度信息进行传播优化，确定第一预测层输出的目标图像中像素点的第一深度信息。

在第二预测层中，根据第一深度信息确定在第二预测层中目标图像中像素点的初始深度信息，并对初始深度信息进行传播优化，确定第二预测层输出的目标图像中像素点的第二深度信息。

图3D是根据本公开实施例公开的另一些确定图像深度信息的步骤示意图，如图3D所示，若预测层仅包含两层，则在第一预测层中，首先对输入的目标图像进行下采样，确定下采样后的目标图像中像素点的初始深度信息，再对初始深度信息进行传播优化，并通过一致性检查和视差填充等方式对传播优化结果进行细化，最终根据细化结果确定第一预测层输出的目标图像中像素点的第一深度信息。

在第二预测层中，首先对第一深度信息进行上采样，并根据上采样后的第一深度信息确定在第二预测层中目标图像中像素点的初始深度信息，再对初始深度信息进行传播优化，并通过一致性检查和视差填充等方式对传播优化结果进行细化，最终根据细化结果确定第二预测层输出的目标图像中像素点的第二深度信息。

通过对第一预测层输入的目标图像进行下采样，可以减少目标图像的分辨率，从而缩短了第一预测层的运算时间；通过对第一预测层输出的第一深度信息进行上采样，可以提高第二深度信息的精准度；通过一致性检查和视差填充等方式对传播优化结果进行细化，使得第一深度信息和第二深度信息更加精准、联系和完整。

上述各步骤的具体实现方式见本公开方法实施例的描述，此处不再赘述。

图4是根据本公开实施例公开的一些图像深度信息的确定装置的结构示意图，可以适用于确定图像中各像素点的深度信息的情况。本实施例装置可采用软件和/或硬件实现，并可集成在任意的具有计算能力的电子设备上。

如图4所示，本实施例公开的图像深度信息的确定装置40可以包括第一深度信息获取模块41、初始深度信息确定模块42和第二深度信息确定模块43，其中：

第一深度信息获取模块41，用于获取第一预测层输出的目标图像中像素点的第一深度信息；

初始深度信息确定模块42，用于根据所述第一深度信息生成所述目标图像的点云模型，并根据所述点云模型确定在第二预测层中所述目标图像中像素点的初始深度信息；

第二深度信息确定模块43，用于根据所述初始深度信息进行传播优化，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息；

其中，所述第一预测层位于所述第二预测层之前。

可选的，所述初始深度信息确定模块42，具体用于：

获取所述目标图像中像素点的图像坐标信息，以及采集所述目标图像的相机的内参信息和外参信息；

根据所述图像坐标信息、所述内参信息、所述外参信息和所述第一深度信息，确定所述目标图像中像素点的世界坐标信息，并根据所述世界坐标信息生成所述目标图像的点云模型。

可选的，所述初始深度信息确定模块42，具体还用于：

确定所述点云模型中各点在所述目标图像中的投影像素点；

根据所述投影像素点的深度信息，确定在第二预测层中所述目标图像中像素点的初始深度信息。

可选的，所述初始深度信息确定模块42，具体还用于：

在所述目标图像中对所述投影像素点进行三角化，确定在所述目标图像中所述投影像素点构成的至少一个三角区域；

根据所述投影像素点的深度信息，对所述三角区域中的像素点进行线性插值，并根据插值结果确定在第二预测层中所述目标图像中像素点的初始深度信息。

可选的，所述第二深度信息确定模块43，具体用于：

采用双目视觉算法，从所述目标图像所属的图像序列中确定所述目标图像的匹配图像；其中，所述图像序列通过对同一物体采集得到的；

根据采集所述目标图像的相机的外参信息和内参信息，以及采集所述匹配图像的相机的外参信息和内参信息，确定所述目标图像中像素点与所述匹配图像中像素点的对应关系；

根据对应像素点之间的相似性，对所述目标图像中像素点的初始深度信息进行优化传播，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息。

可选的，所述第二深度信息确定模块43，具体还用于：

根据所述对应关系，确定所述目标图像中当前像素点在所述匹配图像中对应的匹配像素点；

确定所述当前像素点的当前初始深度信息，以及所述当前像素点在所述目标图像中的相邻像素点的相邻初始深度信息；

确定所述当前像素点为所述当前初始深度信息时，与所述匹配像素点之间的第一相似性，以及所述当前像素点为所述相邻初始深度信息时，与所述匹配像素点之间的第二相似性；

根据所述第一相似性和所述第二相似性，确定所述第二预测层输出的所述当前像素点的第二深度信息。

可选的，所述第二深度信息确定模块43，具体还用于：

在所述第一相似性大于所述第二相似性的情况下，将所述当前初始深度信息作为所述当前像素点的优化深度信息，在所述第一相似性小于所述第二相似性的情况下，将所述相邻初始深度信息作为所述当前像素点的优化深度信息；

根据所述优化深度信息确定所述第二预测层输出的所述当前像素点的第二深度信息。

可选的，所述第二深度信息确定模块43，具体还用于：

根据所述优化深度信息确定深度信息区间，并根据所述深度信息区间确定至少一个调整深度信息；

确定所述当前像素点为各所述调整深度信息时，与所述匹配像素点之间的第三相似性；

根据所述第三相似性以及各所述调整深度信息，确定所述第二预测层输出的所述当前像素点的第二深度信息。

本公开实施例所公开的图像深度信息的确定装置40可执行本公开实施例所公开的图像深度信息的确定方法，具备执行方法相应的功能模块和有益效果。本实施例中未详尽描述的内容可以参考本公开方法实施例中的描述。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图5示出了可以用来实施本公开的实施例的示例电子设备500的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图5所示，设备500包括计算单元501，其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序，来执行各种适当的动作和处理。在RAM 503中，还可存储设备500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

设备500中的多个部件连接至I/O接口505，包括：输入单元506，例如键盘、鼠标等；输出单元507，例如各种类型的显示器、扬声器等；存储单元508，例如磁盘、光盘等；以及通信单元509，例如网卡、调制解调器、无线通信收发机等。通信单元509允许设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理，例如图像深度信息的确定方法。例如，在一些实施例中，图像深度信息的确定方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元508。在一些实施例中，计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到设备500上。当计算机程序加载到RAM 503并由计算单元501执行时，可以执行上文描述的图像深度信息的确定方法的一个或多个步骤。备选地，在其他实施例中，计算单元501可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行图像深度信息的确定方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种图像深度信息的确定方法，包括：

获取第一预测层输出的目标图像中像素点的第一深度信息；

其中，所述第一预测层位于所述第二预测层之前。

2.根据权利要求1所述的方法，其中，所述根据所述第一深度信息生成所述目标图像的点云模型，包括：

3.根据权利要求1所述的方法，其中，所述根据所述点云模型确定在第二预测层中所述目标图像中像素点的初始深度信息，包括：

确定所述点云模型中各点在所述目标图像中的投影像素点；

4.根据权利要求3所述的方法，其中，所述根据所述投影像素点的深度信息，确定在第二预测层中所述目标图像中像素点的初始深度信息，包括：

5.根据权利要求1所述的方法，其中，所述根据所述初始深度信息进行传播优化，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息，包括：

6.根据权利要求5所述的方法，其中，所述根据对应像素点之间的相似性，对所述目标图像中像素点的初始深度信息进行优化传播，确定所述第二预测层输出的所述目标图像中像素点的第二深度信息，包括：

7.根据权利要求6所述的方法，其中，所述根据所述第一相似性和所述第二相似性，确定所述第二预测层输出的所述当前像素点的第二深度信息，包括：

8.根据权利要求7所述的方法，其中，所述根据所述优化深度信息确定所述第二预测层输出的所述当前像素点的第二深度信息，包括：

9.一种图像深度信息的确定装置，包括：

其中，所述第一预测层位于所述第二预测层之前。

10.根据权利要求9所述的装置，其中，所述初始深度信息确定模块，具体用于：

11.根据权利要求9所述的装置，其中，所述初始深度信息确定模块，具体还用于：

确定所述点云模型中各点在所述目标图像中的投影像素点；

12.根据权利要求11所述的装置，其中，所述初始深度信息确定模块，具体还用于：

13.根据权利要求9所述的装置，其中，所述第二深度信息确定模块，具体用于：

14.根据权利要求13所述的装置，其中，所述第二深度信息确定模块，具体还用于：

15.根据权利要求14所述的装置，其中，所述第二深度信息确定模块，具体还用于：

16.根据权利要求15所述的装置，其中，所述第二深度信息确定模块，具体还用于：

17.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。

19.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。