CN111369571A

CN111369571A - 三维物体位姿准确性判断方法、装置及电子设备

Info

Publication number: CN111369571A
Application number: CN202010124820.7A
Authority: CN
Inventors: 刘赵梁; 陈思利
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-02-27
Filing date: 2020-02-27
Publication date: 2020-07-03
Anticipated expiration: 2040-02-27
Also published as: CN111369571B

Abstract

本申请提出一种三维物体位姿准确性判断方法、装置及电子设备，属于计算机视觉技术领域。其中，该方法包括：获取待校验的目标物体的网格模型、目标物体所在的场景图像及目标物体在场景图像中的第一位姿；根据第一位姿，将目标物体的网格模型进行投影，获取目标物体当前对应的投影，其中，投影中包括外轮廓及内部结构线条；判断投影与场景图像的贴合度是否大于或等于第一阈值；若是，则确定第一位姿准确。由此，通过这种三维物体位姿准确性判断方法，根据由第一位姿确定的目标物体对应的投影，对第一位姿的准确度进行校验，提高了三维物体位姿判准的准确性。

Description

三维物体位姿准确性判断方法、装置及电子设备

技术领域

本申请涉及图像处理技术领域，尤其涉及计算机视觉技术领域，提出一种三维物体位姿准确性判断方法、装置及电子设备。

背景技术

三维物体位姿估计技术是计算机视觉中的一项基础技术，主要目标是获得场景图像中三维物体的6个自由度(Six Degrees of Freedom，简称6DoF)位姿，其中，三维物体的6DoF位姿指三维物体在场景中的三维位置及旋转姿态。三维物体的6DoF位姿具有广泛的应用场景，比如，在获取到三维物体的6DoF位姿后，可以根据该位姿在场景图像中添加虚拟物体、互动特效，以实现增强现实效果；或者，可以根据该位姿确定该三维物体在场景中的实际位置，驱动机械臂抓取实际物体或提示移动机器人躲避障碍等，以实现机器人与场景之间的互动。

三维物体位姿判准技术是三维物体位姿估计技术的一项重要后处理步骤，主要目标是判断三维物体位姿估计技术输出的6DoF位姿是否准确，以为后续的增强现实等步骤是否进行提供判断依据。

相关技术中，三维物体位姿估计技术通常可以输出三维物体的6DoF位姿及其置信度，并将位姿本身的置信度作为6DoF位姿的准确度得分。但是，由于6DoF位姿估计方法的局限性，导致确定的6DoF位姿的置信度不准确，从而使得三维物体位姿判准的准确性较低。

发明内容

本申请提出的三维物体位姿准确性判断方法、装置及电子设备，用于解决相关技术中，由于6DoF位姿估计方法的局限性，导致确定的6DoF位姿的置信度不准确，从而使得通过位姿置信度对三维物体位姿进行判准的方法的准确性较低的问题。

本申请一方面实施例提出的三维物体位姿准确性判断方法，包括：获取待校验的目标物体的网格模型、所述目标物体所在的场景图像及所述目标物体在所述场景图像中的第一位姿；根据所述第一位姿，将所述目标物体的网格模型进行投影，获取所述目标物体当前对应的投影，其中，所述投影中包括外轮廓及内部结构线条；判断所述投影与所述场景图像的贴合度是否大于或等于第一阈值；若是，则确定所述第一位姿准确。

本申请另一方面实施例提出的三维物体位姿准确性判断装置，包括：第一获取模块，用于获取待校验的目标物体的网格模型、所述目标物体所在的场景图像及所述目标物体在所述场景图像中的第一位姿；第二获取模块，用于根据所述第一位姿，将所述目标物体的网格模型进行投影，获取所述目标物体当前对应的投影，其中，所述投影中包括外轮廓及内部结构线条；判断模块，用于判断所述投影与所述场景图像的贴合度是否大于或等于第一阈值；确定模块，用于若是，则确定所述第一位姿准确。

本申请再一方面实施例提出的电子设备，其包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如前所述的三维物体位姿准确性判断方法。

本申请又一方面实施例提出的存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行如前所述的三维物体位姿准确性判断方法。

上述申请中的任一个实施例具有如下优点或有益效果：通过根据待校验的目标物体在场景图像中的第一位姿，将目标物体的网格模型投影至目标物体所在的场景图像中，以根据目标物体对应的投影与场景图像的贴合度，确定第一位姿的准确度，从而通过根据由第一位姿确定的目标物体对应的投影，对第一位姿的准确度进行校验，提高了三维物体位姿判准的准确性。因为采用了通过获取待校验的目标物体的网格模型、目标物体所在的场景图像及目标物体在场景图像中的第一位姿，并根据第一位姿，将目标物体的网格模型进行投影，获取目标物体当前对应的投影，其中，投影中包括外轮廓及内部结构线条，进而在投影与场景图像的贴合度大于或等于第一阈值时，确定第一位姿准确的技术手段，所以克服了通过位姿置信度对三维物体位姿进行判准的方法的准确性较低的问题，进而达到了通过根据由第一位姿确定的目标物体对应的投影，对第一位姿的准确度进行校验，提高三维物体位姿判准的准确性的技术效果。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1为本申请实施例所提供的一种三维物体位姿准确性判断方法的流程示意图；

图2为本申请实施例所提供的另一种三维物体位姿准确性判断方法的流程示意图；

图3为本申请实施例提供的一种三维物体位姿准确性判断装置的结构示意图；

图4为本申请实施例提供的电子设备的结构示意图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本申请实施例针对相关技术中，由于6DoF位姿估计方法的局限性，导致确定的6DoF位姿的置信度不准确，从而使得通过位姿置信度对三维物体位姿进行判准的方法的准确性较低的问题，提出一种三维物体位姿准确性判断方法。

下面参考附图对本申请提供的三维物体位姿准确性判断方法、装置、电子设备及存储介质进行详细描述。

图1为本申请实施例所提供的一种三维物体位姿准确性判断方法的流程示意图。

如图1所示，该三维物体位姿准确性判断方法，包括以下步骤：

步骤101，获取待校验的目标物体的网格模型、目标物体所在的场景图像及目标物体在场景图像中的第一位姿。

需要说明的是，本申请实施例的三维物体位姿准确性判断方法可以应用在三维物体位姿估计的后续步骤中，以对三维物体位姿估计过程确定的三维物体位姿的准确性进行判断。

其中，三维物体位姿，可以是任意一种三维物体位姿，本申请实施例对此不做限定。比如，可以为3DoF位姿、6DoF位姿、9DoF位姿等。本申请实施例以三维物体位姿为6DoF位姿进行具体说明。

其中，待校验的目标物体，是指已经利用三维物体位姿估计算法确定出其在场景图像中的位姿、并需要对其位姿的准确性进行判断的三维物体。实际使用时，待校验的目标物体可以是在三维物体位姿估计过程中，从场景图像中识别出的任意三维物体。

其中，目标物体的网格模型，可以是预先设置的，也可以是在三维物体位姿估计过程中建立的。比如，目标物体为“鸡蛋”，则目标物体的网格模型可以为“椭球体”。

其中，第一位姿，是指利用三维物体位姿估计算法确定的目标物体在场景图像中的位姿。比如，可以为6DoF位姿估计算法确定的目标物体在场景图像中的6DoF位姿。

在本申请实施例中，由于本申请实施例的三维物体位姿准确性判断方法，用于对通过三维物体位姿估计算法确定的三维物体位姿的准确性进行判断，并可以应用在三维物体位姿估计的后续步骤中，而目标物体的网格模型、目标物体所在的场景图像及目标物体在场景图像中的第一位姿，都是进行三维物体位姿估计后所获得的已知数据，从而可以直接根据三维物体位姿的估计结果，确定待校验的目标物体的网格模型、目标物体所在的场景图像及目标物体在场景图像中的第一位姿。

步骤102，根据第一位姿，将目标物体的网格模型进行投影，获取目标物体当前对应的投影，其中，投影中包括外轮廓及内部结构线条。

在本申请实施例中，可以根据目标物体的第一位姿将目标物体的网格模型投影至场景图像所在的平面，以生成目标物体当前对应的投影，投影中可以包括目标物体的外轮廓及内部结构线条。需要说明的是，根据第一位姿确定的目标物体在场景图像平面中的投影，可以反映出利用三维物体位姿估计算法确定的目标物体在场景图像中的估计位置。

可选的，可以根据目标物体的第一位姿，将目标物体的网格模型中的顶点及其连线投影在场景图像上，形成目标物体的线框图。即在本申请实施例一种可能的实现形式中，上述步骤102，可以包括：

根据第一位姿，将目标物体的网格模型中的顶点及连线进行投影，形成目标物体的线框图；

将所述线框图进行二值化及边缘跟踪拓扑结构分析，确定目标物体当前对应的外轮廓；

根据目标物体的网格模型中相邻面片的法向量差值，确定相邻面片的角度差异；

将角度差异大于第二阈值的相邻面片间的交线，在线框图中对应的线条确定为目标物体当前对应的内部结构线条。

其中，网格模型中相邻面片的法向量差值，是指相邻面片的法向量在同一坐标系中的角度差值。

作为一种可能的实现方式，在生成目标物体在场景图像中的投影时，可以根据第一位姿将目标物体的网格模型中的顶点及连线投影至场景图像所在的平面，以形成目标物体的线框图。之后将目标物体的线框图进行二值化处理，生成目标物体的线框图对应的二值图，进而利用边缘跟踪拓扑结构分析(Topological Structural Analysis ofDigitized Binary Image by Border Following)算法对二值图进行分析，以确定目标物体当前对应的外轮廓。

比如，目标物体为“鸡蛋”，目标物体的网格模型为“椭球体”，则生成的目标物体在场景图像中的投影为“椭圆形”，则该“椭圆形”的边缘即为该目标物体当前对应的外轮廓。

相应的，在通过生成目标物体的线框图形成目标物体在场景图像中的投影时，由于目标物体的网格模型中相邻面片的法向量差值越大，表明相邻面片的角度差异越大，即表面相邻面片的交线为目标物体中包含的边缘的概率越大。从而在本申请实施例中，可以依次确定目标物体的网格模型中每对相邻面片的法向量的角度差值，并将每对相邻面片的法向量的角度差值，确定为每对相邻面片的角度差异。进而将角度差异大于第二阈值的向量面片间的交线，在目标物体的线框图中对应的线条确定为目标物体当前对应的内部结构线条。

需要说明的是，本申请实施例所提及的内部结构线条可以是指目标物体当前对应的内部重要结构线条。因此，实际使用时，可以根据实际需要或具体的应用场景，确定第二阈值的具体取值，本申请实施例对此不做限定。

可选的，还可以通过生成目标物体的深度图的方式，形成目标物体在场景图像中的投影。即在本申请实施例一种可能的实现形式中，上述步骤102，可以包括：

根据第一位姿，将目标物体的网格模型中的面片进行投影，形成目标物体当前对应的深度图；

将深度图进行二值化及边缘跟踪拓扑结构分析，确定目标物体当前对应的外轮廓；

对深度图进行边缘检测算子处理，确定深度图中包含的边缘；

确定边缘中非外轮廓外的边缘，为目标物体当前对应的内部结构线条。

其中，深度图中每个位置上的取值是物体表面到相机成像平面的最近距离。

作为一种可能的实现方式，可以根据目标物体的第一位姿，将目标物体的网格模型中的面片投影至场景图像所在的平面，以形成目标物体当前对应的深度图，进而根据目标物体对应的深度图确定目标物体当前对应的外轮廓及内部结构线条。

具体的，可以根据目标物体的第一位姿将目标物体的网格模型中包括的所有面片(包括在当前视角不可见的面片，如网格模型内部的面片、远离相机一侧的最外层面片等)均投影至场景图像所在的平面，进而从投影至场景图像所在平面中同一位置的深度值中，选取最小深度值确定为深度图中该位置的深度值，以形成目标物体当前对应的深度图。或者，还可以在进行投影之前，首先确定目标物体的网格模型中的不可见面片，进而仅将靠近相机一侧最外层面片投影至场景图像所在的平面，以形成目标物体当前对应的深度图，从而节省了计算时间。

需要说明的是，确定目标物体当前对应的深度图的方式，可以包括但不限于以上列举的情形。实际使用时，可以根据实际需要及具体的应用场景，选择合适的确定深度图的方式，本申请实施例对此不做限定。

相应的，在确定出目标物体当前对应的深度图之后，可以对目标物体当前对应的深度图进行二值化处理，以生成二值图，进而利用边缘跟踪拓扑结构分析算法对二值图进行分析，以确定目标物体当前对应的外轮廓。

相应的，在确定出目标物体当前对应的深度图之后，可以利用边缘检测算子(如Canny算子、Prewitt算子等)对目标物体当前对应的深度图进行边缘检测，以确定深度图中包含的边缘，进而从深度图中包含的边缘中去除目标物体当前对应的外轮廓，以深度图中包含的非外轮廓边缘，确定为目标物体当前对应的内部结构线条。

需要说明的是，将目标物体的网格模型投影至场景图像所在平面的方式，可以包括但不限于以上列举的情形。实际使用时，可以根据实际需要及具体的应用场景，选择合适的方式对目标物体的网格模型进行投影，本申请实施例对此不做限定。

步骤103，判断投影与场景图像的贴合度是否大于或等于第一阈值。

在本申请实施例中，目标物体当前对应的投影与场景图像的贴合度，可以包括目标物体当前对应的外轮廓与场景图像的贴合度与目标物体当前对应的内部结构线条与场景图像的贴合度两个方面。

作为一种可能的实现方式，可以在目标物体当前对应的外轮廓与场景图像的贴合度大于或等于第一阈值，且目标物体当前对应的内部结构线条与场景图像的贴合度大于或等于第一阈值时，确定目标物体当前对应的投影与场景图像的贴合度大于或等于第一阈值；在目标物体当前对应的外轮廓与场景图像的贴合度小于第一阈值，和/或目标物体当前对应的内部结构线条与场景图像的贴合度小于第一阈值时，确定目标物体当前对应的投影与场景图像的贴合度小于第一阈值。

步骤104，若是，则确定第一位姿准确。

在本申请实施例中，若确定目标物体当前对应的投影与场景图像的贴合度大于或等于第一阈值，则可以确定利用第一位姿确定的目标物体在场景图像中的投影，与目标物体在场景图像中的真实位置相同或非常相近，从而可以确定第一位姿准确；反之，若确定目标物体当前对应的投影与场景图像的贴合度小于第一阈值，则可以确定利用第一位姿确定的目标物体在场景图像中的投影，与目标物体在场景图像中的真实位置相差较大，从而可以确定第一位姿不准确。

根据本申请实施例的技术方案，通过获取待校验的目标物体的网格模型、目标物体所在的场景图像及目标物体在场景图像中的第一位姿，并根据第一位姿，将目标物体的网格模型进行投影，获取目标物体当前对应的投影，其中，投影中包括外轮廓及内部结构线条，进而在投影与场景图像的贴合度大于或等于第一阈值时，确定第一位姿准确。由此，通过根据待校验的目标物体在场景图像中的第一位姿，将目标物体的网格模型投影至目标物体所在的场景图像中，以根据目标物体对应的投影与场景图像的贴合度，确定第一位姿的准确度，从而通过根据由第一位姿确定的目标物体对应的投影，对第一位姿的准确度进行校验，提高了三维物体位姿判准的准确性。

在本申请一种可能的实现形式中，可以将目标物体当前对应的外轮廓与内部结构线条进行分段处理，并根据场景图像在各线段处的梯度值及梯度方向，目标物体当前对应的外轮廓及内部结构线条与场景图像的贴合度。

下面结合图2，对本申请实施例提供的三维物体位姿准确性判断方法进行进一步说明。

图2为本申请实施例所提供的另一种三维物体位姿准确性判断方法的流程示意图。

如图2所示，该三维物体位姿准确性判断方法，包括以下步骤：

步骤201，获取待校验的目标物体的网格模型、目标物体所在的场景图像及目标物体在场景图像中的第一位姿。

步骤202，根据第一位姿，将目标物体的网格模型进行投影，获取目标物体当前对应的投影，其中，投影中包括外轮廓及内部结构线条。

上述步骤201-202的具体实现过程及原理，可以参照上述实施例的详细描述，此处不再赘述。

步骤203，按照预设的规则，将外轮廓进行分段处理，确定外轮廓中包括的各线段。

需要说明的是，在本申请实施例中，可以从目标物体当前对应的外轮廓与场景图像的贴合度与目标物体当前对应的内部结构线条与场景图像的贴合度两个方面，判断目标物体当前对应的投影与场景图像的贴合度是否大于或等于第一阈值。

作为一种可能的实现方式，可以分别对目标物体当前对应的外轮廓及内部结构线条进行分段处理，并根据目标物体当前对应的外轮廓包括的各线段分别与场景图像的贴合度，确定外轮廓与场景图像的贴合度；以及根据目标物体当前对应的内部结构线条包括的各线段分别与场景图像的贴合度，确定内部结构线条与场景图像的贴合度。

其中，预设的规则，是指可以将目标物体当前对应的外轮廓划分为多个近似直线的分段规则。

可选的，预设的规则可以是按照预设的步长对目标物体当前对应的外轮廓进行均匀分段，以确定外轮廓中包括的各线段。

需要说明的是，在对外轮廓进行均匀分段时，预设的步长可以为较小的值，以保证分段后外轮廓中包括的各线段均为近似直线。

可选的，预设的规则还可以是根据外轮廓中各点的法线方向，对外轮廓进行分段处理，以保证对外轮廓进行分段后，外轮廓包括的每个线段内各处的法线方向近似或相等。

步骤204，根据场景图像在各线段处的梯度值及梯度方向，依次判断各线段是否与场景图像贴合。

在本申请实施例中，可以根据场景图像在外轮廓中各线段处的梯度值、梯度方向与各线段的法线方向差及梯度方向的杂乱程度三个方面，判断各线段是否与场景图像贴合。即在本申请实施例一种可能的实现形式中，上述步骤204，可以包括：

判断场景图像在第一线段处度的梯度值，是否大于或等于第三阈值；

若是，则判断场景图像在第一线段处的梯度方向，与第一线段的法线方向差是否小于或等于第四阈值；

若是，则判断场景图像在第一线段处的梯度方向的杂乱程度，是否小于或等于第五阈值；

若是，则确定第一线段与场景图像贴合。

其中，第一线段，是指外轮廓中包含的任意一条线段。

在本申请实施例中，可以首先确定出场景图像中各像素点分别对应的梯度值及梯度方向，进而根据场景图像在第一线段处各像素点分别对应的梯度值，确定场景图像在第一线段处的梯度值，以判断场景图像在第一线段处的梯度值是否大于或等于第三阈值。

作为一种可能的实现方式，可以将场景图像在第一线段处各像素点分别对应的梯度值的加权均值，确定为场景图像在第一线段处的梯度值。即在本申请实施例一种可能的实现形式中，上述判断场景图像在第一线段处的梯度值，是否大于或等于第三阈值之前，还可以包括：

将场景图像的第二线段中各点的梯度值的加权均值，确定为场景图像在第一线段处的梯度值，其中第二线段为目标物体在场景图像中与第一线段对应的线段。

实际使用时，在确定场景图像在第一线段处的梯度值时，可以根据实际需要及具体的应用场景，确定第二线段中各点的梯度值对应的权值，本申请实施例对此不做限定。比如，可以将场景图像的第二线段中各点的梯度值的均值，确定为场景图像在第一线段处的梯度值。

在本申请实施例中，若确定场景图像在第一线段处的梯度值大于或等于第三阈值，则可以继续判断场景图像在第一线段处的梯度方向，与第一线段的法线方向差是否小于或等于第四阈值。

可选的，可以根据场景图像的第二线段中各点的梯度方向的加权均值，确定为场景图像在第一线段处的梯度方向，进而判断场景图像在第一线段处的梯度方向与第一线段的法线方向在同一坐标系中的角度差值，是否小于或等于第四阈值。

可选的，还可以首先生成场景图像对应的梯度图，并利用边缘检测算法对场景图像对应的梯度图进行边缘提取，以确定场景图像对应的梯度图中包含的边缘，进而计算第一线段分别与梯度图中包含的各边缘间的平均距离，进而在该平均距离小于或等于距离阈值时，确定场景图像在第一线段处的梯度方向，与第一线段的法线方向差小于或等于第四阈值。

在本申请实施例中，若确定场景图像在第一线段处的梯度方向，与第一线段的法线方向差小于或等于第四阈值，则可以继续判断场景图像在第一线段处的梯度方向的杂乱程度，是否小于或等于第五阈值。

作为一种可能的实现方式，可以根据场景图像在第一线段处的梯度方向的方差，确定场景图像在第一线段处的梯度方向的杂乱程度。即在本申请实施例一种可能的实现形式中，上述判断场景图像在第一线段处的梯度方向的杂乱程度，是否小于或等于第五阈值之前，还可以包括：

确定场景图像的第二线段中各点的梯度方向，分别对应的单位圆坐标值，其中第二线段为目标物体在场景图像中与第一线段对应的线段；

根据各单位圆坐标值的加权均值，确定场景图像在第一线段处的梯度方向的杂乱程度。

在本申请实施例中，可以将场景图像的第二线段中各点的梯度方向，转换为单位圆坐标进行表示，即确定第二线段中各点的梯度方向分别对应的单位圆坐标值。比如，若第二线段中一个点的梯度方向为θ，则该梯度方向对应的单位圆坐标值为(cosθ,sinθ)。在确定出第二线段中各点的梯度方向分别对应的单位圆坐标值，可以确定出各单位圆坐标值的加权均值(∑_iω_i·cosθ_i,∑_iω_i·sinθ_i)，其中，θ_i为第二线段中第i个点的梯度方向，ω_i为第二线段中第i个点的梯度方向对应的权重，i为第二线段中各点的序号。之后，可以确定出(∑_iω_i·cosθ_i,∑_iω_i·sinθ_i)的向量模长

进而根据该向量模长，确定场景图像在第一线段处的梯度方向的杂乱程度。

具体的，由于上述向量模长越小，场景图像在第一线段处的梯度方向的离散程度越大，即场景图像在第一线段处的梯度方向的杂乱程度越大；上述向量模长越大，场景图像在第一线段处的梯度方向的离散程度越小，即场景图像在第一线段处的梯度方向的杂乱程度越小。从而，可以将上述向量模长的倒数，确定为场景图像在第一线段处的梯度方向的杂乱程度。

在本申请实施例中，若确定场景图像在第一线段处度的梯度值大于或等于第三阈值，且确定场景图像在第一线段处的梯度方向，与第一线段的法线方向差是否小于或等于第四阈值，且确定场景图像在第一线段处的梯度方向的杂乱程度小于或等于第五阈值，则可以确定第一线段与场景图像贴合。

进一步的，若场景图像在第一线段处的梯度值与梯度方向不满足上述三个条件中的任意一个，则可以确定第一线段与场景图像不贴合。即在上述实施例一种可能的实现形式中，上述判断场景图像在第一线段处度的梯度值，是否大于或等于第三阈值之后，还可以包括：

若否，则确定第一线段与场景图像未贴合。

在本申请实施例中，若确定场景图像在第一线段处度的梯度值小于第三阈值，则可以直接确定第一线段与场景图像未贴合，而无需继续判断场景图像在第一线段处的梯度方向，与第一线段的法线方向差是否小于或等于第四阈值，以及无需判断场景图像在第一线段处的梯度方向的杂乱程度，是否小于或等于第五阈值。

进一步的，若场景图像在第一线段处的梯度值与梯度方向不满足上述三个条件中的任意一个，则可以确定第一线段与场景图像不贴合。即在上述实施例一种可能的实现形式中，上述判断场景图像在第一线段处的梯度方向，与第一线段的法线方向差是否小于或等于第四阈值之后，还可以包括：

若否，则确定第一线段与场景图像未贴合。

在本申请实施例中，若确定场景图像在第一线段处的梯度方向与第一线段的法线方向差是否大于第四阈值，则可以直接确定第一线段与场景图像未贴合，而无需继续场景图像在第一线段处的梯度方向的杂乱程度，是否小于或等于第五阈值。

进一步的，若场景图像在第一线段处的梯度值与梯度方向不满足上述三个条件中的任意一个，则可以确定第一线段与场景图像不贴合。即在上述实施例一种可能的实现形式中，上述判断场景图像在第一线段处的梯度方向的杂乱程度，是否小于或等于第五阈值之后，还可以包括：

若否，则确定第一线段与场景图像未贴合。

在本申请实施例中，若确定场景图像在第一线段处的梯度方向的杂乱程度大于第五阈值，则可以确定第一线段与场景图像未贴合。

需要说明的是，对于场景图像在第一线段处的梯度值与梯度方向是否满足上述三个条件的判定顺序可以是任意的，本申请实施例对此不做限定。

步骤205，判断与场景图像贴合的各线段的总长度，与外轮廓总长度的比值是否大于或等于第一阈值，若是，则执行步骤206；否则，执行步骤208。

在本申请实施例中，确定出外轮廓中包括的所有与场景图像贴合的线段后，可以确定出与场景图像贴合的各线段的总长度，若与场景图像贴合的各线段的总长度与外轮廓总长度的比值大于或等于第一阈值，则继续判断内部结构线条是否与场景图像贴合；若场景图像贴合的各线段的总长度与外轮廓总长度的比值小于第一阈值，则可以确定第一位姿不准确。

步骤206，判断内部结构线条中与场景图像贴合的各线段的总长度，与内部结构线条总长度的比值是否大于或等于第一阈值，若是，则执行步骤207；否则，执行步骤208。

在本申请实施例中，判断对内部结构线条进行分段处理，以及判断内部结构线条中包含的各线段是否与场景图像贴合的方式，与外轮廓相同，此处不再赘述。

在本申请实施例中，若与场景图像贴合的各线段的总长度与外轮廓总长度的比值大于或等于第一阈值，且内部结构线条中场景图像贴合的各线段的总长度与内部结构线条总长度的比值大于或等于第一阈值，则可以确定第一位姿准确；若与场景图像贴合的各线段的总长度与外轮廓总长度的比值小于第一阈值，和/或内部结构线条中场景图像贴合的各线段的总长度与内部结构线条总长度的比值小于第一阈值，则可以确定第一位姿不准确。

需要说明的是，本申请实施例对判断外轮廓与场景图像是否贴合，以及判断内部结构线条与场景图像是否贴合的先后顺序不做限定。实际使用时，可以根据实际需要及具体的应用场景，选择两者的先后顺序。

步骤207，确定第一位姿准确。

步骤208，确定第一位姿不准确。

上述步骤207-208的具体实现过程及原理，可以参照上述实施例的详细描述，此处不再赘述

根据本申请实施例的技术方案，通过获取待校验的目标物体的网格模型、目标物体所在的场景图像及目标物体在场景图像中的第一位姿，并根据目标物体在场景图像中的第一位姿，将目标物体的网格模型投影至场景图像，获取目标物体当前对应的投影，并按照预设的规则将外轮廓进行分段处理，确定外轮廓中包括的各线段，以及根据场景图像在各线段处的梯度值及梯度方向，依次判断各线段是否与场景图像贴合，进而在与场景图像贴合的各线段的总长度与外轮廓总长度的比值大于或等于第一阈值，且内部结构线条中与场景图像贴合的各线段的总长度与内部结构线条总长度的比值大于或等于第一阈值时，确定第一位姿准确。由此，通过根据目标物体对应的投影中外轮廓与内部结构线条分别与场景图像的贴合度，确定第一位姿的准确度，从而通过多个方面对第一位姿的准确度进行校验，进一步提高了三维物体位姿判准的准确性。

为了实现上述实施例，本申请还提出一种三维物体位姿准确性判断装置。

图3为本申请实施例提供的一种三维物体位姿准确性判断装置的结构示意图。

如图3所示，该三维物体位姿准确性判断装置30，包括：

第一获取模块31，用于获取待校验的目标物体的网格模型、目标物体所在的场景图像及目标物体在场景图像中的第一位姿；

第二获取模块32，用于根据第一位姿，将目标物体的网格模型进行投影，获取目标物体当前对应的投影，其中，投影中包括外轮廓及内部结构线条；

判断模块33，用于判断投影与场景图像的贴合度是否大于或等于第一阈值；

确定模块34，用于若是，则确定第一位姿准确。

在实际使用时，本申请实施例提供的三维物体位姿准确性判断装置，可以被配置在任意电子设备中，以执行前述三维物体位姿准确性判断方法。

在本申请一种可能的实现形式中，上述第二获取模块32，包括：

第一形成单元，用于根据第一位姿，将目标物体的网格模型中的顶点及连线进行投影，形成目标物体的线框图；

第一确定单元，用于将线框图进行二值化及边缘跟踪拓扑结构分析，确定目标物体当前对应的外轮廓；

第二确定单元，用于根据目标物体的网格模型中相邻面片的法向量差值，确定相邻面片的角度差异；

第三确定单元，用于将角度差异大于第一阈值的相邻面片间的交线，在线框图中对应的线条确定为目标物体当前对应的内部结构线条。

进一步的，在本申请另一种可能的实现形式中，上述第二获取模块32，包括：

第二形成单元，用于根据第一位姿，将目标物体的网格模型中的面片进行投影，形成目标物体当前对应的深度图；

第四确定单元，用于将深度图进行二值化及边缘跟踪拓扑结构分析，确定目标物体当前对应的外轮廓；

第五确定单元，用于对深度图进行边缘检测算子处理，确定深度图中包含的边缘；

第六确定单元，用于确定边缘中非外轮廓外的边缘，为目标物体当前对应的内部结构线条。

在本申请一种可能的实现形式中，上述判断模块33，包括：

第七确定单元，用于按照预设的规则，将外轮廓进行分段处理，确定外轮廓中包括的各线段；

第一判断单元，用于根据场景图像在各线段处的梯度值及梯度方向，依次判断各线段是否与场景图像贴合；

第二判断单元，用于判断与场景图像贴合的各线段的总长度，与外轮廓总长度的比值是否大于或等于第一阈值。

进一步的，在本申请另一种可能的实现形式中，上述第一判断单元，具体用于：

判断场景图像在第一线段处度的梯度取值，是否大于或等于第三阈值；

若是，则确定第一线段与场景图像贴合。

进一步的，在本申请再一种可能的实现形式中，上述第一判断单元，还用于：

进一步的，在本申请又一种可能的实现形式中，上述第一判断单元，还用于：

根据各二维坐标值的加权均值，确定场景图像在第一线段处的梯度方向的杂乱程度。

若场景图像在第一线段处度的梯度取值小于第三阈值，则确定第一线段与场景图像未贴合。

进一步的，在本申请另一种可能的实现形式中，上述第一判断单元，还用于：

若场景图像在第一线段处的梯度方向与第一线段的法线方向差大于第四阈值，则确定第一线段与场景图像未贴合。

若场景图像在第一线段处的梯度方向的杂乱程度大于第五阈值，则确定第一线段与场景图像未贴合。

需要说明的是，前述对图1、图2所示的三维物体位姿准确性判断方法实施例的解释说明也适用于该实施例的三维物体位姿准确性判断装置30，此处不再赘述。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图4所示，是根据本申请实施例的三维物体位姿准确性判断方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图4所示，该电子设备包括：一个或多个处理器401、存储器402，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个电子设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图4中以一个处理器401为例。

存储器402即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的三维物体位姿准确性判断方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的三维物体位姿准确性判断方法。

存储器402作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的三维物体位姿准确性判断方法对应的程序指令/模块(例如，附图3所示的第一获取模块31、第二获取模块32、判断模块33及确定模块34)。处理器401通过运行存储在存储器402中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的三维物体位姿准确性判断方法。

存储器402可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据三维物体位姿准确性判断方法的电子设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器402可选包括相对于处理器401远程设置的存储器，这些远程存储器可以通过网络连接至三维物体位姿准确性判断方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

三维物体位姿准确性判断方法的电子设备还可以包括：输入装置403和输出装置404。处理器401、存储器402、输入装置403和输出装置404可以通过总线或者其他方式连接，图4中以通过总线连接为例。

输入装置403可接收输入的数字或字符信息，以及产生与三维物体位姿准确性判断方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置404可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种三维物体位姿准确性判断方法，其特征在于，包括：

获取待校验的目标物体的网格模型、所述目标物体所在的场景图像及所述目标物体在所述场景图像中的第一位姿；

根据所述第一位姿，将所述目标物体的网格模型进行投影，获取所述目标物体当前对应的投影，其中，所述投影中包括外轮廓及内部结构线条；

判断所述投影与所述场景图像的贴合度是否大于或等于第一阈值；

若是，则确定所述第一位姿准确。

2.如权利要求1所述的方法，其特征在于，所述根据所述第一位姿，将所述目标物体的网格模型进行投影，获取所述目标物体当前对应的投影，包括：

根据所述第一位姿，将所述目标物体的网格模型中的顶点及连线进行投影，形成所述目标物体的线框图；

将所述线框图进行二值化及边缘跟踪拓扑结构分析，确定所述目标物体当前对应的外轮廓；

根据所述目标物体的网格模型中相邻面片的法向量差值，确定相邻面片的角度差异；

将角度差异大于第二阈值的相邻面片间的交线，在所述线框图中对应的线条确定为所述目标物体当前对应的内部结构线条。

3.如权利要求1所述的方法，其特征在于，所述根据所述第一位姿，将所述目标物体的网格模型进行投影，获取所述目标物体当前对应的投影，包括：

根据所述第一位姿，将所述目标物体的网格模型中的面片进行投影，形成所述目标物体当前对应的深度图；

将所述深度图进行二值化及边缘跟踪拓扑结构分析，确定所述目标物体当前对应的外轮廓；

对所述深度图进行边缘检测算子处理，确定所述深度图中包含的边缘；

确定所述边缘中非外轮廓外的边缘，为所述目标物体当前对应的内部结构线条。

4.如权利要求1-3任一所述的方法，其特征在于，所述判断所述投影与所述场景图像的贴合度是否大于或等于第一阈值，包括：

按照预设的规则，将所述外轮廓进行分段处理，确定所述外轮廓中包括的各线段；

根据所述场景图像在各线段处的梯度值及梯度方向，依次判断各线段是否与所述场景图像贴合；

判断与场景图像贴合的各线段的总长度，与所述外轮廓总长度的比值是否大于或等于第一阈值。

5.如权利要求4所述的方法，其特征在于，所述根据所述场景图像在各线段处的梯度值及梯度方向，依次判断各线段是否与所述场景图像贴合，包括：

判断所述场景图像在第一线段处度的梯度值，是否大于或等于第三阈值；

若是，则判断所述场景图像在所述第一线段处的梯度方向，与所述第一线段的法线方向差是否小于或等于第四阈值；

若是，则判断所述场景图像在所述第一线段处的梯度方向的杂乱程度，是否小于或等于第五阈值；

若是，则确定所述第一线段与所述场景图像贴合。

6.如权利要求5所述的方法，其特征在于，所述判断所述场景图像在第一线段处度的梯度值，是否大于或等于第三阈值之前，还包括：

将所述场景图像的第二线段中各点的梯度值的加权均值，确定为所述场景图像在所述第一线段处的梯度值，其中所述第二线段为所述目标物体在所述场景图像中与所述第一线段对应的线段。

7.如权利要求5所述的方法，其特征在于，所述判断所述场景图像在所述第一线段处的梯度方向的杂乱程度，是否小于或等于第五阈值之前，还包括：

确定所述场景图像的第二线段中各点的梯度方向，分别对应的单位圆坐标值，其中所述第二线段为所述目标物体在所述场景图像中与所述第一线段对应的线段；

根据各单位圆坐标值的加权均值，确定所述场景图像在所述第一线段处的梯度方向的杂乱程度。

8.如权利要求5-7任一所述的方法，其特征在于，所述判断所述场景图像在第一线段处度的梯度值，是否大于或等于第三阈值之后，还包括：

若否，则确定所述第一线段与所述场景图像未贴合。

9.如权利要求5-7任一所述的方法，其特征在于，所述判断所述场景图像在所述第一线段处的梯度方向，与所述第一线段的法线方向差是否小于或等于第四阈值之后，还包括：

若否，则确定所述第一线段与所述场景图像未贴合。

10.如权利要求5-7任一所述的方法，其特征在于，所述判断所述场景图像在所述第一线段处的梯度方向的杂乱程度，是否小于或等于第五阈值之后，还包括：

若否，则确定所述第一线段与所述场景图像未贴合。

11.一种三维物体位姿准确性判断装置，其特征在于，包括：

第一获取模块，用于获取待校验的目标物体的网格模型、所述目标物体所在的场景图像及所述目标物体在所述场景图像中的第一位姿；

第二获取模块，用于根据所述第一位姿，将所述目标物体的网格模型进行投影，获取所述目标物体当前对应的投影，其中，所述投影中包括外轮廓及内部结构线条；

判断模块，用于判断所述投影与所述场景图像的贴合度是否大于或等于第一阈值；

确定模块，用于若是，则确定所述第一位姿准确。

12.如权利要求11所述的装置，其特征在于，所述第二获取模块，包括：

第一形成单元，用于根据所述第一位姿，将所述目标物体的网格模型中的顶点及连线进行投影，形成所述目标物体的线框图；

第一确定单元，用于将所述线框图进行二值化及边缘跟踪拓扑结构分析，确定所述目标物体当前对应的外轮廓；

第二确定单元，用于根据所述目标物体的网格模型中相邻面片的法向量差值，确定相邻面片的角度差异；

第三确定单元，用于将角度差异大于第一阈值的相邻面片间的交线，在所述线框图中对应的线条确定为所述目标物体当前对应的内部结构线条。

13.如权利要求11所述的装置，其特征在于，所述第二获取模块，包括：

第二形成单元，用于根据所述第一位姿，将所述目标物体的网格模型中的面片进行投影，形成所述目标物体当前对应的深度图；

第四确定单元，用于将所述深度图进行二值化及边缘跟踪拓扑结构分析，确定所述目标物体当前对应的外轮廓；

第五确定单元，用于对所述深度图进行边缘检测算子处理，确定所述深度图中包含的边缘；

第六确定单元，用于确定所述边缘中非外轮廓外的边缘，为所述目标物体当前对应的内部结构线条。

14.如权利要求11-13任一所述的装置，其特征在于，所述判断模块，包括：

第七确定单元，用于按照预设的规则，将所述外轮廓进行分段处理，确定所述外轮廓中包括的各线段；

第一判断单元，用于根据所述场景图像在各线段处的梯度值及梯度方向，依次判断各线段是否与所述场景图像贴合；

第二判断单元，用于判断与场景图像贴合的各线段的总长度，与所述外轮廓总长度的比值是否大于或等于第一阈值。

15.如权利要求14所述的装置，其特征在于，所述第一判断单元，具体用于：

判断所述场景图像在第一线段处度的梯度取值，是否大于或等于第三阈值；

若是，则确定所述第一线段与所述场景图像贴合。

16.如权利要求15所述的装置，其特征在于，所述第一判断单元，还用于：

17.如权利要求15所述的装置，其特征在于，所述第一判断单元，还用于：

根据各二维坐标值的加权均值，确定所述场景图像在所述第一线段处的梯度方向的杂乱程度。

18.如权利要求15-17任一所述的装置，其特征在于，所述第一判断单元，还用于：

若所述场景图像在第一线段处度的梯度取值小于第三阈值，则确定所述第一线段与所述场景图像未贴合。

19.如权利要求15-17任一所述的装置，其特征在于，所述第一判断单元，还用于：

若所述场景图像在所述第一线段处的梯度方向与所述第一线段的法线方向差大于第四阈值，则确定所述第一线段与所述场景图像未贴合。

20.如权利要求15-17任一所述的装置，其特征在于，所述第一判断单元，还用于：

若所述场景图像在所述第一线段处的梯度方向的杂乱程度大于第五阈值，则确定所述第一线段与所述场景图像未贴合。

21.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。