WO2022252487A1

WO2022252487A1 - 位姿获取方法及装置、电子设备、存储介质和程序

Info

Publication number: WO2022252487A1
Application number: PCT/CN2021/127307
Authority: WO
Inventors: 黄鸿; 钟凡; 秦学英; 宋修强
Original assignee: 浙江商汤科技开发有限公司; 山东大学
Priority date: 2021-06-04
Filing date: 2021-10-29
Publication date: 2022-12-08
Also published as: KR20230073331A; JP2023549069A; CN113407027B; CN113407027A

Abstract

本申请公开了一种位姿获取方法及装置、电子设备、存储介质和程序，其中，位姿获取方法包括：获取拍摄图像中位于搜索线段上的若干采样点；其中，搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓；获取采样点的属性信息，以及获取采样点的参考权重；其中，属性信息表示采样点属于目标物体的可能性；基于采样点的属性信息和参考权重，构建目标函数；基于目标函数，得到拍摄图像中目标物体的位姿参数。

Description

位姿获取方法及装置、电子设备、存储介质和程序

相关申请的交叉引用

本专利申请要求2021年06月07日提交的中国专利申请号为202110626207.X、申请人为浙江商汤科技开发有限公司和山东大学，申请名称为“位姿获取方法及装置和电子设备、存储介质”的专利申请的优先权，该申请的全文以引用的方式并入本申请中。

技术领域

本申请涉及计算机视觉技术领域，涉及但不限于一种位姿获取方法及装置、电子设备、存储介质和程序。

背景技术

随着信息技术的发展，位姿参数已经在诸如增强现实系统、机器人手眼标定、互动游戏、人机交互等诸多场景受到越来越广泛的应用。例如，在增强现实系统中，根据位姿参数可以将虚拟物体渲染并叠加至视频图像中现实物体上，以实现具有空间和几何一致性的虚实融合效果。

目前，在实际场景中，由于诸如局部遮挡、相似颜色等干扰因素，位姿参数的精度往往受到严重影响。有鉴于此，如何提高位姿参数的精度成为亟待解决的问题。

发明内容

本申请实施例提供一种位姿获取方法及装置、电子设备、存储介质和程序。

本申请实施例第一方面提供了一种位姿获取方法，应用于电子设备中，包括：

获取拍摄图像中位于搜索线段上的若干采样点；其中，搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓；获取采样点的属性信息，以及获取采样点的参考权重；其中，属性信息表示采样点属于目标物体的可能性；基于采样点的属性信息和参考权重，构建目标函数；基于目标函数，得到拍摄图像中目标物体的位姿参数。

因此，获取拍摄图像中位于搜索线段上的若干采样点，且搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓，基于此再获取采样点的属性信息，以及获取采样点的参考权重，且属性信息表示采样点属于目标物体的可能性，从而，基于采样点的属性信息和参考权重，构建目标函数，并基于目标函数，得到拍摄图像中目标物体的位姿参数。由于目标函数是基于采样点的属性信息和参考权重两者而构建的，其中，属性信息能够反映采样点属于目标物体的可能性，参考权重能够反映采样点在后续求解位姿参数过程中的参考价值，因此，在基于采样点的属性信息和参考权重构建目标函数时，能够降低干扰因素对于位姿求解的影响，有利于提高位姿参数的精度。

在一种实现方式中，获取采样点的参考权重，包括：在搜索线段上的若干采样点中搜索目标点，得到搜索结果；其中，目标点用于表示目标物体的物体轮廓点；基于搜索结果，分别获取搜索线段上的若干采样点的权重信息；其中，权重信息包括第一权重和第二权重中至少一者，第一权重与目标点的预测概率值相关，预测概率值表示采样点作为物体轮廓点的可能性，且第二权重与目标点至采样点的第一距离相关；基于权重信息，得到采样点的参考权重。

因此，在搜索线段上的若干采样点中搜索目标点，得到搜索结果，且目标点用于表示目标物体的物体轮廓点，并基于搜索结果，分别获取搜索线段上的若干采样点的权重信息，且权重信息包括第一权重和第二权重中至少一者，第一权重与目标点的预测概率值相关，预测概率值表示采样点作为物体轮廓点的可能性，而第二权重与目标点至采样点的第一距离相关，故第一权重和第二权重能够从不同角度表征采样点的参考价值，进而基于此再基于权重信息，得到采样点的参考权重，能够提高参考权重在后续求解位姿参数过程中的参考价值。

在一种实现方式中，属性信息包括：采样点属于目标物体的第一概率值；在搜索线段上的若干采样点中搜索目标点，得到搜索结果，包括：对于每条搜索线段，将若干采样点分别作为当前点，在当前点的参考概率差值满足第一条件的情况下，将当前点作为候选点，并选取预测代价值满足第二条件的候选点作为目标点。其中，当前点的参考概率差值为与当前点具有预设位置关系的两个采样点的第一概率值之差，预测代价值包括第一代价值和第二代价值中至少一者，第一代价值与候选点的预测概率值相关，第二代价值与候选点至搜索线段上的投影轮廓点的第二距离相关。

因此，属性信息包括采样点属于目标物体的第一概率值，并对于每条搜索线段，将若干采样点分别作为当前点，在当前点的参考概率差值满足第一条件的情况下，将当前点作为候选点，以及选取预测代价值满足第二条件的候选点作为目标点，且当前点的参考概率差值为与当前点具有预设位置关系的两个采样点的第一概率值之差，预测代价值包括第一代价值和第二代价值中至少一者，第一代价值与候选点的预测概率值相关，第二代价值与候选点至搜索线段上的投影轮廓点的第二距离相关，即第一代价值和第二代价值分别不同角度表征候选点视为物体轮廓点的代价，故通过参考概率差值先粗选得到候选点，再基于预测代价值细选得到目标点，能够有利于提高筛选目标点的效率和精度。

在一种实现方式中，在选取预测代价值满足第二条件的候选点作为目标点之前，方法还包括：过滤预测概率值满足第三条件的候选点。

因此，在从候选点中细选得到目标点之前，先过滤预测概率值满足第三条件的候选点，而由于预测概率值表示采样点作为物体轮廓点的可能性，故能够有利于进一步提高目标点的筛选效率。

在一种实现方式中，预设位置关系为与当前点相邻；和/或，第二条件包括预测代价值最小；和/或，第一代价值与候选点的预测概率值负相关，且第二代价值与第二距离正相关。

因此，通过将预设位置关系设置为与当前点相邻，能够有利于准确评估每一采样点的第一概率值突变情况，有利于提高候选点的准确性；而通过将第二条件设置为包括预测代价值最小，能够有利于进一步尽可能地缓解干扰因素对于选取目标点的影响，提高位姿参数的精度；而通过将第一代价值设置为与候选点的预测概率值负相关，且第二代价值与第二距离正相关，能够有利于提高第一代价值和第二代价值的准确性。

在一种实现方式中，权重信息包括第一权重；基于搜索结果，分别获取搜索线段上的若干采样点的权重信息，包括：在搜索结果包括搜索到目标点的情况下，基于目标点的预测概率值确定采样点的第一权重，其中，第一权重与目标点的预测概率值正相关；和/或，在搜索结果包括未搜索到目标点的情况下，将第一权重确定为第一数值；其中，第一数值为在搜索结果包括搜索到目标点的情况下第一权重的下限值。

因此，权重信息包括第一权重，且在搜索结果包括搜索到目标点的情况下，基于目标点的预测概率值确定采样点的第一权重，且第一权重与目标点的预测概率值正相关，在搜索结果包括未搜索到目标点的情况下，将第一权重确定为第一数值，且第一数值为搜索结果包括搜索到目标点的情况下第一权重的下限值，能够以搜索线段整体为维度，确定搜索线段上各个采样点的第一权重，有利于提高获取第一权重的效率。

在一种实现方式中，权重信息包括第二权重；基于搜索结果，分别获取搜索线段上的若干采样点的权重信息，包括：在搜索结果包括搜索到目标点的情况下，基于采样点对应的第一距离确定采样点的第二权重，其中，第二权重与第一距离负相关；和/或，在搜索结果包括未搜索到目标点的情况下，将第二权重确定为第二数值；其中，第二数值为在搜索结果包括搜索到目标点的情况下第二权重的上限值。

因此，权重信息包括第二权重，且在搜索结果包括搜索到目标点的情况下，基于采样点对应的第一距离确定采样点的第二权重，且第二权重与第一距离负相关，在搜索结果包括未搜索到目标点的情况下，将第二权重确定为第二数值，且第二数值为在搜索到目标点的情况下第二权重的上限值，能够以搜索线段整体为维度，确定搜索线段上各个采样点的第二权重，有利于提高获取第二权重的效率。

在一种实现方式中，权重信息包括第一权重和第二权重，且第一权重、第二权重均与参考权重正相关。

因此，将权重信息设置为同时包含第一权重和第二权重，且第一权重、第二权重均与参考权重正相关，故能够同时从第一权重、第二权重两种不同维度表征采样点在后续求解位姿参数过程中的参考价值，有利于提高参考权重本身的参考价值。

在一种实现方式中，属性信息包括：采样点属于目标物体的第一概率值和第一可信度，以及采样点不属于目标物体的第二概率值和第二可信度；基于采样点的属性信息和参考权重，构建目标函数，包括：获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积，并基于第一积和第二积之和，得到采样点的联合概率值；基于各个采样点的参考权重对联合概率值的加权结果，得到目标函数。

因此，属性信息包括采样点属于目标物体的第一概率值和第一可信度，以及采样点不属于目标物体的第二概率值和第二可信度，在此基础上，获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积，并基于第一积和第二积之和，得到采样点的联合概率值，从而能够从采样点属于目标物体和采样点不属于目标物体两种角度来表征采样点的联合概率值，并以此通过各个采样点的参考权重对联合概率值的加权结果来构建得到目标函数，能够提高目标函数的准确性，有利于提高参考位姿的精度。

在一种实现方式中，第一可信度与第二可信度为负相关关系，采样点的第一可信度与相应投影轮廓点至采样点的有向欧氏距离为负相关关系，相应投影轮廓点与采样点位于相同搜索线段上。

因此，第一可信度与第二可信度为负相关关系，且采样点的第一可信度与相应投影轮廓点至采样点的有向欧氏距离为负相关关系，相应投影轮廓点与采样点位于相同搜索线段上，即有向欧氏距离越小，采样点属于目标物体的第一可信度越高，而采样点不属于目标物体的第二可信度越低，能够有利于尽可能地缓解诸如局部遮挡等干扰因素的影响。

在一种实现方式中，拍摄图像包括基于投影轮廓划分的前景区域和背景区域；在获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积之前，方法还包括：在采样点的有向欧氏距离大于第一距离值，且采样点属于前景区域的情况下，过滤采样点；和/或，在采样点的有向欧氏距离小于第二距离值，且采样点属于背景区域的情况下，过滤采样点。

因此，拍摄图像包括基于投影轮廓划分的前景区域和背景区域，在计算联合概率值之前，先检测有向欧氏距离大于第一距离值且属于前景区域的采样点，即可将其视为干扰点，并将其过滤，有利于尽可能地降低干扰点对于后续求解位姿参数的影响，而先检测有向欧氏距离小于第二距离值且属于背景区域的采样点，即可将其视为干扰点，并将其过滤，有利于尽可能地降低干扰点对于后续求解位姿参数的影响。

在一种实现方式中，投影轮廓是利用目标物体的参考位姿投影得到的；在获取拍摄图像中位于搜索线段上的若干采样点之前，方法包括：对拍摄图像进行降采样，得到若干种分辨率的金字塔图像；按照分辨率由小到大，依次选择金字塔图像作为当前拍摄图像，并对当前拍摄图像执行获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤；其中，本次执行所采用的参考位姿为上一次执行得到的位姿参数，最后一次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数。

因此，投影轮廓是利用目标物体的参考位姿投影得到的，从而在投影采样之前，先对拍摄图像进行降采样，以得到若干种分辨率的金字塔图像，并按照分辨率由小到大，依次选择金字塔图像作为当前拍摄图像，以及对当前拍摄图像执行上述获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤，且本次执行所采用的参考位姿为上一次执行得到的位姿参数，最后一次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数，从而能够在位姿参数的获取过程中，由粗到细地进行位姿估计，进而能够有利于提高位姿参数的获取效率和精度。

在一种实现方式中，投影轮廓是利用目标物体的参考位姿投影得到的；基于目标函数，得到拍摄图像中目标物体的位姿参数，包括：对目标函数进行求解，得到参考位姿的更新参数；利用更新参数对参考位姿进行优化，得到位姿参数。

因此，投影轮廓是利用目标物体的参考位姿投影得到的，参考位姿是参考图像中目标物体的位姿参数，且参考图像是在拍摄图像之前拍摄得到的，并对目标函数进行求解，得到参考位姿的更新参数，以及利用更新参数对参考位姿进行优化，得到位姿参数，有利于在对目标物体拍摄过程中，准确地对位姿参数进行持续跟踪。

本申请实施例第二方面提供了一种位姿获取装置，应用于电子设备中，包括：

投影采样模块、信息获取模块、函数构建模块和位姿求解模块，投影采样模块配置为获取拍摄图像中位于搜索线段上的若干采样点；其中，搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓；信息提取模块配置为获取采样点的属性信息，以及获取采样点的参考权重；其中，属性信息表示采样点属于目标物体的可能性；函数构建模块配置为基于采样点的属性信息和参考权重，构建目标函数；位姿求解模块配置为基于目标函数，得到拍摄图像中目标物体的位姿参数。

本申请实施例第三方面提供了一种电子设备，包括相互耦接的存储器和处理器，处理器用于执行存储器中存储的程序指令，以实现上述第一方面中的位姿获取方法。

本申请实施例第四方面提供了一种计算机可读存储介质，其上存储有程序指令，程序指令被处理器执行时实现上述第一方面中的位姿获取方法。

本申请实施例第五方面提供了一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行用于实现上述任意一种位姿获取方法。

上述方案，获取拍摄图像中位于搜索线段上的若干采样点，且搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓，基于此再获取采样点的属性信息，以及获取采样点的参考权重，且属性信息表示采样点属于目标物体的可能性，从而，基于采样点的属性信息和参考权重，构建目标函数，并基于目标函数，得到拍摄图像中目标物体的位姿参数。由于目标函数是基于采样点的属性信息和参考权重两者而构建的，其中，属性信息能够反映采样点属于目标物体的可能性，参考权重能够反映采样点在后续求解位姿参数过程中的参考价值，因此，在基于采样点的属性信息和参考权重构建目标函数时，能够降低干扰因素对于位姿求解的影响，有利于提高位姿参数的精度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本公开实施例。根据下面参考附图对示例性实施例的详细说明，本公开实施例的其它特征及方面将变得清楚。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。

图1是本申请位姿获取方法一实施例的流程示意图；

图2是轮廓掩码一实施例的示意图；

图3是投影轮廓和搜索线段一实施例的示意图；

图4a是拍摄图像一实施例的示意图；

图4b是掩码图像另一实施例的示意图；

图4c是搜索线段一实施例的示意图；

图5a是拍摄图像另一实施例的示意图；

图5b是布局区域一实施例的示意图；

图5c是局部区域另一实施例的示意图；

图6是图1中步骤S12一实施例的流程示意图；

图7a是图3中搜索线段的集束图像；

图7b是图3中搜索线段上各个采样点的第一概率值的集束图像；

图8是本申请位姿获取方法另一实施例的流程示意图；

图9是本申请位姿获取装置一实施例的框架示意图；

图10是本申请电子设备一实施例的框架示意图；

图11是本申请计算机可读存储介质一实施例的框架示意图。

具体实施方式

下面结合说明书附图，对本申请实施例的方案进行详细说明。

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、接口、技术之类的具体细节，以便透彻理解本申请。

本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。

本申请实施例提供的位姿获取方法，可以应用于增强现实系统。在增强现实系统中，需要准确估计现实物体相对于相机的位姿，才能根据位姿参数将虚拟物体准确地渲染并叠加到视频中的现实物体上，实现具有空间和几何一致性的虚实融合效果。

然而，在实际应用中，复杂环境下存在局部遮挡和相似颜色，容易产生对现实物体的跟踪偏移和跟踪失败，导致虚拟物体与真实物体的配准产生偏移。

为了解决上述技术问题，本申请实施例提供的位姿获取方法，通过检测并处理被局部遮挡和相似颜色干扰的像素点，提高物体的位姿估计精度，实现精确的虚实配准和几何一致的虚实融合效果。

以下，对本申请实施例提供的位姿获取方法进行详细介绍。

请参阅图1，图1是本申请位姿获取方法一实施例的流程示意图。具体而言，可以包括如下步骤：

步骤S11：获取拍摄图像中位于搜索线段上的若干采样点。

本公开实施例中，搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓。

在一个实施场景中，投影轮廓是利用目标物体的参考位姿投影得到的，而参考位姿是参考图像中目标物体的位姿参数，且参考图像是在拍摄图像之前拍摄得到的。例如，在现实场景中，可以对目标物体拍摄视频数据，视频数据可以包含多帧图像，则对于其中第t-1帧图像而言，可以采样本公开实施例中步骤得到目标物体在第t-1帧图像中的位姿参数T _t-1，在获取其中第t帧图像中目标物体的位姿参数时，可以将T _t-1作为参考位姿，并利用本公开实施例中步骤得到目标物体在第t帧图像中的位姿参数T _t，以此类推，在此不再一一举例。

在一个实施场景中，为了提高投影便利性，可以预先对目标物体进行三维建模，得到目标物体的三维模型。

应理解，三维模型可以包括若干顶点以及连接顶点的边。三维建模的具体过程，可以参阅三维建模的相关技术细节，在此不再赘述。

在一个实施场景中，为了便于描述，参考位姿可以记为T，其可以表示为一个4*4的齐次矩阵：

上述公式(1)中，

表示特殊欧氏群，R表示旋转参数，t表示平移参数，且R为

(即特殊正交群)，t为实数矩阵。在此基础上，可以利用相机内参K以及上述参考位姿T将目标物体上的三维点X投影至拍摄图像中，得到三维点X对应于拍摄图像中的像素点x：

上述公式(2)中，π(X)＝[X/Z,Y/Z] ^T，

表示三维点X的齐次坐标，即

三维点X的普通坐标表示为

此外，在如前述持续跟踪场景下，帧间相对位姿△T可以利用李代数由六维捻度矢量(即twist vector)表示，即p＝[w ₁ w ₂ w ₃ v ₁ v ₂ v ₃]。

在一个实施场景中，为了便于后续确定各个像素点的相关属性，可以基于目标物体的投影结果，得到轮廓掩码，且该轮廓掩码中每个像素点分别对应于拍摄图像中相同位置的像素点。请结合参阅图2，图2是轮廓掩码一实施例的示意图。如图2所示，目标物体经投影之后，可以得到投影轮廓，拍摄图像基于投影轮廓划分为前景区域(即图2中前景区域Ω _f)和背景区域(即图2中背景区域Ω _b)。

在一个实施场景中，可以构造经过投影轮廓上投影轮廓点m _i的搜索线段l _i。搜索线段具体可以沿投影轮廓在投影轮廓点m _i处的法向量n _i进行构造。在此基础上，可以在搜索线段上提取得到若干采样点。例如，可以提取搜索线段l _i上的投影轮廓点m _i以及分别位于投影轮廓点m _i两侧的N个(如，7个、8个、9个)像素点，作为搜索线段l _i上的若干采样点(即图2中实心圆点)。

应理解，图2所示仅仅为实际应用过程中，可能存在的一种投影轮廓，并不因此而限定投影轮廓的具体行程，其他情况可以以此类推，在此不再一一举例。

在一个实施场景中，请结合参阅图3，图3是投影轮廓和搜索线段一实施例的示意图。如图3所示，在现实场景中，可以基于投影轮廓上各个投影轮廓点，构造多条搜索线段。其他拍摄图像可以以此类推，在此不再一一举例。

步骤S12：获取采样点的属性信息，以及获取采样点的参考权重。

本公开实施例中，属性信息表示采样点属于目标物体的可能性。例如，属性信息可以包括采样点属于目标物体的第一概率值和第一可信度，以及采样点不属于目标物体的第二概率值和第二可信度。

应理解，上述第一可信度可以表示第一概率值的可信程度，上述第二可信度可以表示第二概率值可信程度。此外，若采样点属于目标物体，则可以认为该采样点属于拍摄图像中实际的前景区域，反之，若采样点不属于目标物体，则可以认为该采样点属于拍摄图像中实际的背景区域。

在一个实施场景中，为了便于描述，搜索线段l _i上第j个采样点可以记为x _ij，采样点x _ij的第一概率值可以记为P _f(x _ij)，采样点x _ij的第二概率值可以记为P _b(x _ij)。

应理解，第一概率值和第二概率值可以通过时间连续的局部颜色直方图来确定，第一概率值和第二概率值的具体获取过程，可以参阅时间连续的局部颜色直方图的具体技术细节，在此不再赘述。

在一个实施场景中，第一可信度与第二可信度为负相关关系，即第一可信度越高，第二可信度越低，反之，第一可信度越低，第二可信度越高。此外，采样点的第一可信度与相应投影轮廓点至采样点的有向欧氏距离为负相关关系，且相应投影轮廓点与采样点位于相同搜索线段上。请结合参阅图2，以搜索线段l _i为例，该搜索线段l _i上某一采样点的第一可信度与该采样点至搜索线段l _i上投影轮廓点m _i的有向欧氏距离负相关，其他搜索线段上各个采样点可以以此类推获取其第一可信度，在此不再一一举例。

在一个具体的实施场景中，可以基于采样点的第一坐标、相应投影轮廓点的第二坐标以及前述法向量，获取采样点至相应投影轮廓点的有向欧氏距离。仍以搜索线段l _i上第j个采样点x _ij为例，其有向欧氏距离d(x _ij)可以表示为：

上述公式(3)中，m _i表示搜索线段l _i上的投影轮廓点，

表示投影轮廓在投影轮廓点m _i处的法向量的转置。

在另一个具体的实施场景中，为了平滑第一可信度，可以采用光滑可导的阶跃函数(如，Heaviside函数)处理有向欧氏距离，得到第一可信度。仍以搜索线段l _i上第j个采样点x _ij为例，其第一可信度He(d(x _ij))可以表示为：

上述公式(4)中，s表示平滑因子，s越大，第一可信度He(d(x _ij))随有向欧氏距离d(x _ij)变化越趋于剧烈；反之，s越小，第一可信度He(d(x _ij))随有向欧氏距离d(x _ij)变化越趋于平缓。

在又一个实施场景中，第一可信度与第二可信度之和可以为1。仍以搜索线段l _i上第j个采样点x _ij为例，在得到采样点x _ij的第一可信度He(d(x _ij))之后，可以将1-He(d(x _ij))作为采样点x _ij的第二可信度。

在一个实施场景中，对于每条搜索线段而言，可以在搜索线段上的若干采样点中搜索目标点，得到搜索结果，且目标点用于表示目标物体的物体轮廓点。在此基础上，可以基于搜索结果，分别获取搜索线段上的若干采样点的权重信息，且权重信息包括第一权重和第二权重中至少一者，第一权重与目标点的预测概率值相关，预测概率值表示采样点作为物体轮廓点的可能性，而第二权重与目标点至采样点的第一距离相关，从而可以基于权重信息，得到采样点的参考权重。

应理解，目标点的搜索过程以及预测概率值的计算过程，可以参阅下述公开实施例中相关描述，在此暂不赘述。此外，物体轮廓点为目标物体在拍摄图像中实际轮廓点，如图2所示，搜索线段l _i上采样点s _i同时也位于物体轮廓(即图2中物体轮廓)，则该采样点s _i同时也为目标物体在拍摄图像中实际轮廓点。

在一个具体的实施场景中，权重信息可以包括第一权重，则在搜索结果包括搜索到目标点的情况下，可以基于目标点的预测概率值确定采样点的第一权重，且第一权重与目标点的预测概率值正相关，而在搜索结果包括未搜索到目标点的情况下，可以将第一权重确定为第一数值，且第一数值为在搜索结果包括搜索到目标点的情况下第一权重的下限值。仍以搜索线段l _i上第j个采样点x _ij为例，第一权重w _c(x _ij)可以表示为：

上述公式(5)中，

表示搜索线段l _i能够搜索到目标点s _i，P(s _i|C)表示目标点s _i的预测概率值，即表示目标点s _i为物体轮廓点的可能性，目标点s _i的预测概率值越大，目标点s _i为物体轮廓点的可能性越高，反之，目标点s _i的预测概率值越小，目标点s _i为物体轮廓点的可能性越低。此外，k ₁表示一个负常数，用于控制第一权重随预测概率值的衰减速度，具体可以根据应用需要进行设置，如可以设置为-1.25等，在此不做限定。

如公式(5)所示，当目标点s _i的预测概率值为1时，表明目标点s _i为物体轮廓点的可能性最高，此时目标点s _i具有最大的第一权重(即1)，而当目标点s _i的预测概率值为0时，表明目标点s _i为物体轮廓点的可能性最低，此时目标点s _i具有最小的第一权重(即exp(k ₁))，该第一权重即为在搜索结果包括搜索到目标点的情况下第一权重的下限值。

应理解，若目标点s _i预测概率值P(s _i|C)过小，则该目标点s _i所在的搜索线段l _i很可能出于被干扰状态(如，处于被局部遮挡的状态、处于被相似颜色干扰的局部区域内)，则通过调小该目标点s _i所在的搜索线段l _i上各个采样点的第一权重，可以调低这些采样点在后续位姿参数获取过程中的参考价值，以尽可能地缓解干扰因素对于位姿参数的影响，提高位姿参数的精度。

在另一个具体的实施场景中，权重信息可以包括第二权重，则在搜索结果包括搜索到目标点的情况下，可以基于采样点对应的第一距离确定采样点的第二权重，且第二权重与第一距离负相关，而在搜索结果包括未搜索到目标点的情况下，可以将第二权重确定为第二数值，且第二数值为在搜索结果包括搜索到目标点的情况下第二权重的上限值。仍以搜索线段l _i上第j个采样点x _ij为例，第二权重w _d(x _ij)可以表示为：

上述公式(6)中，

表示搜索线段l _i能够搜索到目标点s _i，D(x _ij,s _i)表示采样点x _ij对应的第一距离，即目标点s _i至采样点x _ij之间的距离。具体地，第一距离D(x _ij,s _i)可以基于采样点x _ij的第一坐标、目标点s _i的第三坐标以及采样点x _ij所在的搜索线段l _i的长度N _i(即搜索线段l _i所包含的采样点个数)计算得到，如D(x _ij,s _i)＝||x _ij-s _i||/N _i。

此外，k ₂表示一个负常数，用于控制第二权重随第一距离的衰减速度，具体可以根据应用需要进行设置，如可以设置为-3.5等，在此不做限定。如公式(6)所示，当采样点x _ij与目标点s _i为同一采样点的情况下，两者之间的第一距离D(x _ij,s _i)达到最小(即0)。

在此情况下，目标点s _i具有最大的第二权重(即1)，而当采样点x _ij与目标点s _i分别处于搜索线段l _i两个末端的情况下，两者之间的第一距离D(x _ij,s _i)达到最大(即1)，此时目标点s _i具有最小的第二权重(即exp(k ₂))。

应理解，采样点x _ij距离目标点s _i越远，采样点x _ij越容易处于被干扰状态(如，被复杂背景干扰、被相似颜色干扰)，则通过调小该采样点x _ij的第二权重，可以调低该采样点x _ij在后续位姿参数获取过程中的参考价值，以尽可能地缓解干扰因素对于位姿参数的影响，提高位姿参数的精度。

在又一个具体的实施场景中，采样点的权重信息可以同时包含第一权重和第二权重，在此情况下，第一权重和第二权重的获取过程，可以分别参阅前述第一权重、第二权重的获取方式，在此不再赘述。此外，在权重信息同时包含第一权重和第二权重的情况下，第一权重、第二权重均与参考权重正相关。

例如，可以将第一权重与第二权重之积作为参考权重。仍以搜索线段l _i上第j个采样点x _ij为例，可以将第一权重w _c(x _ij)与第二权重w _d(x _ij)之积作为采样点x _ij的参考权重w(x _ij)。其他采样点可以以此类推，在此不再一一举例。

步骤S13：基于采样点的属性信息和参考权重，构建目标函数。

在一个实施场景中，如前所述，采样点的属性信息可以包括：采样点属于目标物体的第一概率值和第一可信度，以及采样点不属于目标物体的第二概率值和第二可信度，则可以获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积，并基于第一积和第二积，得到采样点的联合概率值，在此基础上，再基于各个采样点的参考权重对联合概率值的加权结合，得到目标函数。

在一个具体的实施场景中，可以对第一积和第二积之和取对数，得到联合概率值，并对各个采样点的参考权重对联合概率值的加权结果求和，得到目标函数E(p)：

上述公式(7)中，He(d(x _ij))表示第一可信度，P _f(x _ij)表示第一概率值，1-He(d(x _ij))表示第二可信度，P _b(x _ij)表示第二概率值，w(x _ij)表示参考权重，具体获取过程，可以参阅前述相关描述，在此不再赘述。此外，L表示所有搜索线段上采样点的集合。

在另一个具体的实施场景中，请结合参阅图2，拍摄图像包括基于投影轮廓(即图2中投影轮廓)划分的前景区域(即图2中前景区域Ω _f)和背景区域(即图2中背景区域Ω _b)，则在构造目标函数之前，还可以进一步对搜索线段上各个采样点进行校验。以投影轮廓点处的法向量的方向为从前景区域指向背景区域为例，则在采样点的有向欧氏距离大于第一距离值(如，0)时，可以认为该采样点属于背景区域。

若该采样点实际属于前景区域，则可以将其过滤，即从上述采样点集合L中过滤，如图2中最下侧搜索线段，位于该搜索线段最左侧两个采样点其有向欧氏距离均大于第一距离值(如，0)，故可以认为这两个采样点属于背景区域，而实际上这两个采样点属于前景区域，则可以将这两个采样点过滤。

类似地，在采样点的有向欧氏距离小于第二距离值(如，0)时，可以认为该采样点属于前景区域，若干采样点实际属于背景区域，则可以将其过滤，即从上述采样点集合L中过滤，如图2中左上角搜索线段，位于该搜索线段最右侧两个采样点其有向欧氏距离均小于第二距离值(如，0)，故可以认为这两个采样点属于前景区域，而实际上这两个采样点属于背景区域，则可以将这两个采样点过滤。

步骤S14：基于目标函数，得到拍摄图像中目标物体的位姿参数。

在一个实施场景中，如前所述，投影轮廓是利用目标物体的参考位姿投影得到的，参考位姿是参考图像中目标物体的位姿参数，且参考图像是在拍摄图像之前拍摄得到的，则可以对目标函数进行求解，得到参考位姿的更新参数，并利用更新参数对参考位姿进行优化，得到拍摄图像中目标物体的位姿参数。

例如，参考图像可以是拍摄图像之前一帧图像，如参考图像可以为视频数据中第t-1帧图像，而拍摄图像可以为视频数据中第t帧图像，具体可以参阅前述相关描述，在此不再赘述。

在一个具体的实施场景中，为了便于使用非线性算法最小化目标函数，可以将目标函数改写为非线性加权最小二乘问题的标准形式：

F(x _ij,p)＝-log[He(d(x _ij))P _f(x _ij)+(1-He(d(x _ij)))P _f(x _ij)]……(9)

上述公式(8)中，ψ(x _ij)＝1/F(x _ij,p)。在此基础上，可以通过高斯牛顿算法迭代解决优化问题，将雅可比向量定义为：

上述公式(12)中，

表示平滑的狄拉克δ函数，可以由第一可信度He(d(x _ij))引出，具体可以参阅前述公式(4)。此外，

可以由前述公式(2)推导，具体推导过程可以参阅高斯牛顿算法的相关细节，在此不再赘述。基于上述雅可比向量以及高斯牛顿算法，可以推导得到更新参数△p：

在另一个具体的实施场景中，上述更新参数△p采用李代数表达，为了便于优化参考位姿，可以将△p转换为欧式变换矩阵△T，具体转换过程可以参阅李群、李代数相关技术细节，在此不再赘述。在此基础上，拍摄图像中目标物体的位姿参数T′可以表示为：

T′＝△T·T……(14)

在一个实施场景中，在存在多个目标物体的情况下，若多个目标物体彼此之间互不遮挡，则各个目标物体在拍摄图像中的位姿参数可以利用本公开实施例中步骤分别获取得到。反之，若多个目标物体彼此之间存在遮挡，则可以使用前述掩码图像I _s和深度图像I _d来过滤处于被干扰状态(如，被遮挡)的采样点。

在一个具体的实施场景中，深度图像I _d可以是对拍摄图像进行渲染得到的，具体渲染过程在此不再赘述。深度图像I _d具体可以包括拍摄图像中各个像素点的深度值。

在另一个具体的实施场景中，在获取第k个目标物体在拍摄图像中的位姿参数过程中，可以先搜索位于第k个目标物体对应的背景区域

内且与所在搜索线段的投影轮廓点m _i毗邻的采样点x _ij，并校验I _s(x _ij)是否等于另一目标物体的索引，且采样点x _ij的深度值I _d(x _ij)小于所在搜索线段的投影轮廓点m _i的深度值I _d(m _i)，若是，则可以认为该采样点x _ij所在搜索线段l _i处于被干扰状态(如，被遮挡)，则可以过滤这条搜索线段l _i上所有采样点。

请结合参阅图4a至图4c，其中，图4a是拍摄图像一实施例的示意图，图4b是掩码图像另一实施例的示意图，图4c是搜索线段一实施例的示意图。

如图4a至4c所示，拍摄图像中存在鸭子和松鼠两个目标物体，且鸭子被松鼠遮挡，故在获取鸭子在拍摄图像中的位姿参数过程中，可以过滤遮挡的投影轮廓附近的搜索线段，以尽可能地环节诸如布局遮挡等干扰因素对获取位姿参数的负面影响，有利于提高位姿参数的精度。

在一个实施场景中，前述局部颜色直方图是基于围绕物体轮廓的局部区域而构造得到的，与此同时，为了增强时间连续性，每个局部区域对应于一个模型顶点。然而，目标物体的三维模型所包含的顶点较少(如，少于50个)的情况下，这些局部区域并不能完全覆盖物体轮廓，从而影响上述第一概率值P _f和第二概率值P _b的准确性。

有鉴于此，在目标物体的三维模型所包含的顶点少于预设阈值(如，50)的情况下，可以在三维模型的每条边增加若干(如，4个)顶点，以提升局部区域的数量，从而尽可能地使得局部区域能够覆盖物体轮廓。

请结合参阅图5a至图5c，其中，图5a是拍摄图像另一实施例的示意图，图5b是布局区域一实施例的示意图，图5c是局部区域另一实施例的示意图。

如图5a至图5c所示，在顶点(如图中实心圆所示)数量较少(如图5b中仅有4个)的情况下，局部区域(如图中空心圆所示)并不完全覆盖目标物体的物体轮廓，在此情况下，通过在每条边上增加顶点(如，增加至8个)，局部区域可以完全覆盖物体轮廓。

在一个实施场景中，拍摄图像中目标物体的位姿参数可以是通过多次迭代(如，7次迭代)得到的。具体地，在第一次迭代过程中，可以将参考图像中目标物体的位姿参数作为参考位置，并执行本公开实施例中步骤，得到第一次次迭代时拍摄图像中目标物体的位姿参数，并将其作为第二次迭代的参考位姿，并重新执行本公开实施例中步骤，得到第二次迭代时拍摄图像中目标物体的位姿参数。

以此类推，在第i次迭代时，将第i-1次迭代所得到的位姿参数作为参考位姿，并执行本公开实施例中步骤，得到第i次迭代时拍摄图像中目标物体的位姿参数，直至最后一次迭代，可以直接将最后一次迭代时拍摄图像中目标物体的位姿参数，作为拍摄图像中目标物体最终的位姿参数。

上述方案，获取拍摄图像中位于搜索线段上的若干采样点，且搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓，基于此再获取采样点的属性信息，以及获取采样点的参考权重，且属性信息表示采样点属于目标物体的可能性，从而基于采样点的属性信息和参考权重，构建目标函数，并基于目标函数，得到拍摄图像中目标物体的位姿参数。

应理解，由于目标函数是基于采样点的属性信息和参考权重两者而构建的，故一方面得益于属性信息能够参考采样点属于目标物体的可能性，另一方面得益于参考权重能够参考采样点在后续求解位姿参数过程中的参考价值，进而能够有利于尽可能地缓解干扰因素对于位姿求解的影响，有利于提高位姿参数的精度。

请参阅图6，图6是图1中步骤S12一实施例的流程示意图。具体而言，可以包括如下步骤：

步骤S61：在搜索线段上的若干采样点中搜索目标点，得到搜索结果。

本公开实施例中，目标点用于表示目标物体的物体轮廓点。请结合参阅图2，仍以搜索线段l _i为例，搜索线段l _i上采样点s _i可以用于表示物体轮廓点，其他情况可以以此类推，在此不再一一举例。

在一个实施场景中，对于每条搜索线段，可以将该搜索线段上若干采样点分别作为当前点，在当前点的参考概率差值满足第一条件的情况下，可以将当前点作为候选点，并选取预测代价值满足第二条件的候选点作为目标点。上述方式，可以先基于参考概率差值进行粗选，再基于预测代价值进行细选，有利于提高筛选目标点的效率和准确性。

在一个具体的实施场景中，当前点的参考概率差值可以为与当前点具有预设位置关系(如，与当前点相邻)的两个采样点的第一概率值之差。为了提高访问不同采样点的第一概率值的便利性，如图7a所示，可以将图3中所有搜索线段按行堆叠，构造得到搜索线段的集束图像I _b，以及如图7b所示，将图3中所有搜索线段上各个采样点的第一概率值也按行堆叠，构建得到关于第一概率值的集束图像I _p。

如前述公开实施例所述，搜索线段包含2*N+1个采样点，其中中间位置的采样点为投影轮廓点，投影轮廓点一侧对应于前景区域，投影轮廓点的另一侧对应于背景区域，故集束图像I _b中间一列对应投影轮廓，中间一列的一侧对应前景区域，中间一列的另一侧对应背景区域。

在另一个具体的实施场景中，第一条件可以包括参考概率差值大于预设阈值，则在构造得到上述集束图像I _p之后，可以利用预设卷积核(如，f＝[-1 0 1])在集束图像I _p每行分别进行滑动卷积，并将卷积响应高于预设阈值ε(如，0.3)的采样点作为候选点。

在又一个具体的实施场景中，上述候选点有可能存在三种情况，即候选点可能为物体轮廓点，候选点也可能为前景干扰点，候选点还可能为背景干扰点。为了提高分类准确性，对于搜索线段l _i上第j个采样点x _ij而言，可以在搜索线段l _i指向背景区域的一段选取若干连续采样点，构成第一采样点集

(如，可以包括x _i,j-1,x _i,j-2,x _i,j-3)，并在搜索线段l _i指向前景区域的一段选取若干连续采样点，构成第二采样点集

(如，可以包括x _i,j+1,x _i,j+2,x _i,j+3)。

故此，在采样点为物体轮廓点的情况下，第一采样点集

理论上应属于背景区域，而第二采样点集

理论上应属于前景区域，故采样点作为物体轮廓点的概率值P(h _ij|C)可以表示为：

应理解，在h _ij为候选点的情况下，P(h _ij|C)即为候选点作为物体轮廓点的预测概率值；而如前述公开实施例所述，在候选点h _ij可作为目标点s _i的情况下，P(h _ij|C)可以写作P(s _i|C)，即可以作为目标点可作为物体轮廓点的预测概率值。

类似地，在采样点为前景干扰点的情况下，第一采样点集

和第二采样点集

理论上应均属于前景区域，故采样点作为前景干扰点的概率值P(h _ij|F)可以表示为：

应理解，在h _ij为候选点的情况下，P(h _ij|F)即为候选点作为前景干扰点的预测概率值。

类似地，在采样点为背景干扰点的情况下，一采样点集

和第二采样点集

理论上应均属于背景区域，故采样点作为背景干扰点的概率值P(h _ij|B)可以表示为：

应理解，在h _ij为候选点的情况下，P(h _ij|B)即为候选点作为背景干扰点的预测概率值。

在此基础上，可以进一步定义采样点作为物体轮廓点的归一化概率值P _c(h _ij)：

应理解，在h _ij为候选点的情况下，P _c(h _ij)即为候选点作为物体轮廓点的归一化概率值。

在又一个具体的实施场景中，上述预测代价值可以包括第一代价值和第二代价值中至少一者，如可以同时包括第一代价值和第二代价值，也可以仅包括第一代价值，或者仅包括第二代价值。第一代价值可以与候选点的预测概率值相关，如第一代价值可以与候选点的预测概率值负相关，为了便于描述，第一代价值可以记为E _d(h _ij)，则第一代价值E _d(h _ij)可以表示为：

如公式(19)所示，候选点h _ij的预测概率值P(h _ij|C)越大，其作为目标点的第一代价值E _d(h _ij)越小。

此外，第二代价值与候选点至搜索线段上的投影轮廓点的第二距离相关，如第二代价值可以与上述第二距离正相关，为了便于描述，第二代价值可以记为E _S(h _ij)，则第二代价值E _S(h _ij)可以表示为：

E _S(h _ij)＝||h _ij-m _i|| ²……(20)

如公式(20)所示，候选点h _ij至搜索线段l _i上的投影轮廓点m _i的第二距离||h _ij-m _i||越大，其作为目标点的第二代价值E _S(h _ij)越大。

应理解，在预测代价值同时包含第一代价值和第二代价值的情况下，可以将第一代价值和第二代价值进行加权处理，作为预测代价值E(h _ij)：

E(h _ij)＝E _d(h _ij)+λE _s(h _ij,m _i)……(21)

上述公式(21)中，λ表示加权因子，具体可以根据实际应用需要进行设置，如可以设置为0.015，在此不做限定。上述第二条件具体可以包括预测代价值最小，即在目标物体或相机的帧间运动较为平和的情况下，第二代价值会对离投影轮廓较远的候选点施加额外惩罚，以优先选择离投影轮廓较近的候选点作为目标点。

应理解，在上述筛选过程中，搜索线段l _i上可能搜索不到目标点，则此时可以对于该搜索线段l _i，可以标记

以表示对于搜索线段l _i而言，其搜索结果包括未搜索到目标点。

步骤S62：基于搜索结果，分别获取搜索线段上的若干采样点的权重信息。

本公开实施例中，权重信息包括第一权重和第二权重中至少一者，第一权重与目标点的预测概率值相关，预测概率值表示采样点作为物体轮廓点的可能性，且第二权重与目标点至采样点的第一距离相关。具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S63：基于权重信息，得到采样点的参考权重。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

上述方案，在搜索线段上的若干采样点中搜索目标点，得到搜索结果，且目标点用于表示目标物体的物体轮廓点，并基于搜索结果，分别获取搜索线段上的若干采样点的权重信息，且权重信息包括第一权重和第二权重中至少一者，第一权重与目标点的预测概率值相关，预测概率值表示采样点作为物体轮廓点的可能性，而第二权重与目标点至采样点的第一距离相关，故第一权重和第二权重能够从不同角度表征采样点的参考价值，进而基于此再基于权重信息，得到采样点的参考权重，能够提高参考权重在后续求解位姿参数过程中的参考价值。

请参阅图8，图8是本申请位姿获取方法另一实施例的流程示意图。具体可以包括如下步骤：

步骤S801：对拍摄图像进行降采样，得到若干种分辨率的金字塔图像。

例如，可以将2作为降采样倍率，以对拍摄图像进行降采样处理，得到1/4分辨率的金字塔图像、1/2分辨率的金字塔图像以及原始分辨率的金字塔图像(即拍摄图像本身)。其他情况可以以此类推，在此不再一一举例。

步骤S802：按照分辨率由小到大，依次选择金字塔图像作为当前拍摄图像。

例如，可以先选择1/4分辨率的金字塔图像作为当前拍摄图像，并执行下述步骤以得到1/4分辨率的金字塔图像中目标物体的位姿参数，自此之后再选择1/2分辨率的金字塔图像作为当前拍摄图像，如此循环，在此不再一一举例。

步骤S803：获取当前拍摄图像中位于搜索线段上的若干采样点。

本公开实施例中，搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓，且投影轮廓是利用目标物体的参考位姿投影得到的。具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S804：获取采样点的属性信息，以及获取采样点的参考权重。

本公开实施例中，属性信息表示采样点属于目标物体的可能性。具体可以参阅前述公开实施例中相关描述，在此不再赘述。

应理解，属性信息包括：采样点属于目标物体的第一概率值和第一可信度，以及采样点不属于目标物体的第二概率值和第二可信度，且第一可信度的计算过程可以参阅前述公开实施例中公式(4)及相关描述，且公式(4)中平滑因子s与负相关。例如，对于1/4分辨率的金字塔图像而言，平滑因子s可以设置为1.2，而对于1/2分辨率的金字塔图像而言，平滑因子s可以设置为0.8，对于原始分辨率的金字塔图像(即拍摄图像本身)而言，平滑因子s可以设置为0.6，在此不做限定。

步骤S805：基于采样点的属性信息和参考权重，构建目标函数。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S806：基于目标函数，得到当前拍摄图像中目标物体的位姿参数。

具体可以参阅前述公开实施例中相关描述，在此不再赘述。

应理解，如前述公开实施例所述，对于拍摄图像而言可以通过多次迭代，得到拍摄图像中目标物体的位姿参数。类似地，对于金字塔图像而言，可以经过若干次迭代，得到金字塔图像中目标物体的位姿参数，且金字塔图像分辨率越低，迭代次数越多。例如，对于1/4分辨率的金字塔图像而言，可以迭代4次，对于1/2分辨率的金字塔图像而言，可以迭代2次，对于原始分辨率的金字塔图像(即拍摄图像本身)而言，可以迭代1次。具体的迭代过程，可以参阅前述公开实施例中相关描述，在此不再赘述。

步骤S807：判断当前拍摄图像是否为最后一帧金字塔图像，若否，则执行步骤S808，否则执行步骤S810。

在当前拍摄图像为最后一帧金字塔图像的情况下，即可将最后一帧金字塔图像中目标物体的位姿参数，作为拍摄图像中目标物体最终的位姿参数，否则可以继续进行迭代过程。

步骤S808：将本次执行得到的位姿参数作为参考位姿。

在当前拍摄图像不为最后一帧金字塔图像的情况下，可以将本次执行得到的位姿参数作为参考位姿，并对下一帧金字塔图像进行执行迭代操作。

步骤S809：重新执行步骤S802以及后续步骤。

即在当前拍摄图像不为最后一帧金字塔图像的情况下，对下一帧金字塔图像进行执行迭代操作。

步骤S810：将本次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数。

在当前拍摄图像为最后一帧金字塔图像的情况下，可以结束迭代操作，得到拍摄图像中目标物体最终的位姿参数。

上述方案，投影轮廓是利用目标物体的参考位姿投影得到的，从而在投影采样之前，先对拍摄图像进行降采样，以得到若干种分辨率的金字塔图像，并按照分辨率由小到大，依次选择金字塔图像作为当前拍摄图像，以及对当前拍摄图像执行上述获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤，且本次执行所采用的参考位姿为上一次执行得到的位姿参数，最后一次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数，从而能够在位姿参数的获取过程中，由粗到细地进行位姿估计，进而能够有利于提高位姿参数的获取效率和精度。

请参阅图9，图9是本申请位姿获取装置90一实施例的框架示意图。位姿获取装置90应用于电子设备中，包括：投影采样模块91、信息提取模块92、函数构建模块93和位姿求解模块94，投影采样模块91配置为获取拍摄图像中位于搜索线段上的若干采样点；其中，搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓；信息提取模块92配置为获取采样点的属性信息，以及获取采样点的参考权重；其中，属性信息表示采样点属于目标物体的可能性；函数构建模块93配置为基于采样点的属性信息和参考权重，构建目标函数；位姿求解模块94配置为基于目标函数，得到拍摄图像中目标物体的位姿参数。

在一些公开实施例中，信息提取模块92包括目标点搜索子模块，配置为在搜索线段上的若干采样点中搜索目标点，得到搜索结果；其中，目标点配置为表示目标物体的物体轮廓点；信息提取模块92包括权重信息获取子模块，配置为基于搜索结果，分别获取搜索线段上的若干采样点的权重信息；其中，权重信息包括第一权重和第二权重中至少一者，第一权重与目标点的预测概率值相关，预测概率值表示采样点作为物体轮廓点的可能性，且第二权重与目标点至采样点的第一距离相关；信息提取模块92包括参考权重获取子模块，配置为基于权重信息，得到采样点的参考权重。

在一些公开实施例中，属性信息包括：采样点属于目标物体的第一概率值；目标点搜索子模块包括当前点获取单元，配置为对于每条搜索线段，将若干采样点分别作为当前点，目标点搜索子模块包括候选点获取单元，配置为在当前点的参考概率差值满足第一条件的情况下，将当前点作为候选点，目标点搜索子模块包括目标点获取单元，配置为选取预测代价值满足第二条件的候选点作为目标点；其中，当前点的参考概率差值为与当前点具有预设位置关系的两个采样点的第一概率值之差，预测代价值包括第一代价值和第二代价值中至少一者，第一代价值与候选点的预测概率值相关，第二代价值与候选点至搜索线段上的投影轮廓点的第二距离相关。

在一些公开实施例中，目标点搜索子模块包括候选点过滤单元，配置为过滤预测概率值满足第三条件的候选点。

在一些公开实施例中，预设位置关系为与当前点相邻；和/或，第二条件包括预测代价值最小；和/或，第一代价值与候选点的预测概率值负相关，且第二代价值与第二距离正相关。

在一些公开实施例中，权重信息包括第一权重；权重信息获取子模块包括第一确定单元，配置为在搜索结果包括搜索到目标点的情况下，基于目标点的预测概率值确定采样点的第一权重，其中，第一权重与目标点的预测概率值正相关；权重信息获取子模块包括第二确定单元，配置为在搜索结果包括未搜索到目标点的情况下，将第一权重确定为第一数值；其中，第一数值为在搜索结果包括搜索到目标点的情况下第一权重的下限值。

在一些公开实施例中，权重信息包括第二权重；权重信息获取子模块包括第三确定单元，配置为在搜索结果包括搜索到目标点的情况下，基于采样点对应的第一距离确定采样点的第二权重，其中，第二权重与第一距离负相关；权重信息获取子模块包括第四确定单元，配置为在搜索结果包括未搜索到目标点的情况下，将第二权重确定为第二数值；其中，第二数值为在搜索结果包括搜索到目标点的情况下第二权重的上限值。

在一些公开实施例中，权重信息包括第一权重和第二权重，且第一权重、第二权重均与参考权重正相关。

在一些公开实施例中，属性信息包括：采样点属于目标物体的第一概率值和第一可信度，以及采样点不属于目标物体的第二概率值和第二可信度；函数构建模块93包括联合概率计算子模块，配置为获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积，并基于第一积和第二积之和，得到采样点的联合概率值；函数构建模块93包括联合概率加权子模块，配置为基于各个采样点的参考权重对联合概率值的加权结果，得到目标函数。

在一些公开实施例中，第一可信度与第二可信度为负相关关系，采样点的第一可信度与相应投影轮廓点至采样点的有向欧氏距离为负相关关系，相应投影轮廓点与采样点位于相同搜索线段上。

在一些公开实施例中，拍摄图像包括基于投影轮廓划分的前景区域和背景区域；函数构建模块93包括第一过滤子模块，配置为在采样点的有向欧氏距离大于第一距离值，且采样点属于前景区域的情况下，过滤采样点；函数构建模块93包括第二过滤子模块，配置为在采样点的有向欧氏距离小于第二距离值，且采样点属于背景区域的情况下，过滤采样点。

在一些公开实施例中，投影轮廓是利用目标物体的参考位姿投影得到的；位姿获取装置90包括降采样模块，配置为对拍摄图像进行降采样，得到若干种分辨率的金字塔图像；位姿获取装置90包括图像选择模块，配置为按照分辨率由小到大，依次选择金字塔图像作为当前拍摄图像，投影采样模块91、信息提取模块92、函数构建模块93和位姿求解模块94配置为对当前拍摄图像执行获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤；其中，本次执行所采用的参考位姿为上一次执行得到的位姿参数，最后一次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数。

在一些公开实施例中，投影轮廓是利用目标物体的参考位姿投影得到的，参考位姿是参考图像中目标物体的位姿参数，且参考图像是在拍摄图像之前拍摄得到的；位姿求解模块94包括函数求解子模块，配置为对目标函数进行求解，得到参考位姿的更新参数；位姿求解模块94包括位姿优化子模块，配置为利用更新参数对参考位姿进行优化，得到位姿参数。

请参阅图10，图10是本申请电子设备100一实施例的框架示意图。电子设备100包括相互耦接的存储器101和处理器102，处理器102用于执行存储器101中存储的程序指令，以实现上述任一位姿获取方法实施例的步骤。在一个具体的实施场景中，电子设备100可以包括但不限于：微型计算机、服务器，此外，电子设备100还可以包括笔记本电脑、平板电脑等移动设备，在此不做限定。

具体而言，处理器102用于控制其自身以及存储器101以实现上述任一位姿获取方法实施例的步骤。处理器102还可以称为CPU(Central Processing Unit，中央处理单元)。处理器102可能是一种集成电路芯片，具有信号的处理能力。处理器102还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器102可以由集成电路芯片共同实现。

请参阅图11，图11为本申请计算机可读存储介质110一实施例的框架示意图。计算机可读存储介质110存储有能够被处理器运行的程序指令111，程序指令111用于实现上述任一位姿获取方法实施例的步骤。

上述方案，能够有利于尽可能地缓解干扰因素对于位姿求解的影响，有利于提高位姿参数的精度。

本公开实施例提供了一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行用于实现上述任意一种位姿获取方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的方法和装置，可以通过其它的方式实现。例如，以上所描述的装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性、机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

工业实用性

本申请实施例公开了一种位姿获取方法及装置、电子设备、存储介质和程序，其中，位姿获取方法包括：获取拍摄图像中位于搜索线段上的若干采样点；其中，搜索线段经过拍摄图像中目标物体的投影轮廓点，投影轮廓点位于目标物体的投影轮廓；获取采样点的属性信息，以及获取采样点的参考权重；其中，属性信息表示采样点属于目标物体的可能性；基于采样点的属性信息和参考权重，构建目标函数；基于目标函数，得到拍摄图像中目标物体的位姿参数。上述方案，能够提高位姿参数的精度。

Claims

一种位姿获取方法，应用于电子设备中，包括：

获取拍摄图像中位于搜索线段上的若干采样点；其中，所述搜索线段经过所述拍摄图像中目标物体的投影轮廓点，所述投影轮廓点位于所述目标物体的投影轮廓；

获取所述采样点的属性信息，以及获取所述采样点的参考权重；其中，所述属性信息表示所述采样点属于所述目标物体的可能性；

基于所述采样点的所述属性信息和所述参考权重，构建目标函数；

基于所述目标函数，得到所述拍摄图像中所述目标物体的位姿参数。
根据权利要求1所述的方法，其中，所述获取所述采样点的参考权重，包括：

在所述搜索线段上的所述若干采样点中搜索目标点，得到搜索结果；其中，所述目标点用于表示所述目标物体的物体轮廓点；

基于所述搜索结果，分别获取所述搜索线段上的所述若干采样点的权重信息；其中，所述权重信息包括第一权重和第二权重中至少一者，所述第一权重与所述目标点的预测概率值相关，所述预测概率值表示所述采样点作为所述物体轮廓点的可能性，且所述第二权重与所述目标点至所述采样点的第一距离相关；

基于所述权重信息，得到所述采样点的参考权重。
根据权利要求2所述的方法，其中，所述属性信息包括：所述采样点属于所述目标物体的第一概率值；所述在所述搜索线段上的所述若干采样点中搜索目标点，得到搜索结果，包括：

对于每条所述搜索线段，将所述若干采样点分别作为当前点，在所述当前点的参考概率差值满足第一条件的情况下，将所述当前点作为候选点，并选取预测代价值满足第二条件的候选点作为所述目标点；

其中，所述当前点的参考概率差值为与所述当前点具有预设位置关系的两个所述采样点的所述第一概率值之差，所述预测代价值包括第一代价值和第二代价值中至少一者，所述第一代价值与所述候选点的预测概率值相关，所述第二代价值与所述候选点至所述搜索线段上的投影轮廓点的第二距离相关。
根据权利要求3所述的方法，其中，在所述选取预测代价值满足第二条件的候选点作为所述目标点之前，所述方法还包括：

过滤所述预测概率值满足第三条件的候选点。
根据权利要求3所述的方法，其中，所述预设位置关系为与所述当前点相邻；

和/或，所述第二条件包括所述预测代价值最小；

和/或，所述第一代价值与所述候选点的预测概率值负相关，且所述第二代价值与所述第二距离正相关。
根据权利要求2所述的方法，其中，所述权重信息包括所述第一权重；所述基于所述搜索结果，分别获取所述搜索线段上的所述若干采样点的权重信息，包括：

在所述搜索结果包括搜索到所述目标点的情况下，基于所述目标点的预测概率值确定所述采样点的第一权重，其中，所述第一权重与所述目标点的预测概率值正相关；

和/或，在所述搜索结果包括未搜索到所述目标点的情况下，将所述第一权重确定为第一数值；其中，所述第一数值为在所述搜索结果包括搜索到所述目标点的情况下所述第一权重的下限值。
根据权利要求2所述的方法，其中，所述权重信息包括所述第二权重；所述基于所述搜索结果，分别获取所述搜索线段上的所述若干采样点的权重信息，包括：

在所述搜索结果包括搜索到所述目标点的情况下，基于所述采样点对应的所述第一距离确定所述采样点的第二权重，其中，所述第二权重与所述第一距离负相关；

和/或，在所述搜索结果包括未搜索到所述目标点的情况下，将所述第二权重确定为第二数值；其中，所述第二数值为在所述搜索结果包括搜索到所述目标点的情况下所述第二权重的上限值。
根据权利要求2至7任一项所述的方法，其中，所述权重信息包括第一权重和第二权重，且所述第一权重、所述第二权重均与所述参考权重正相关。
根据权利要求1所述的方法，其中，所述属性信息包括：所述采样点属于所述目标物体的第一概率值和第一可信度，以及所述采样点不属于所述目标物体的第二概率值和第二可信度；所述基于所述采样点的所述属性信息和所述参考权重，构建目标函数，包括：

获取所述第一可信度与所述第一概率值的第一积以及所述第二可信度与所述第二概率值的第二积，并基于所述第一积和第二积之和，得到所述采样点的联合概率值；

基于各个所述采样点的参考权重对所述联合概率值的加权结果，得到目标函数。
根据权利要求9所述的方法，其中，所述第一可信度与所述第二可信度为负相关关系，所述采样点的第一可信度与相应所述投影轮廓点至所述采样点的有向欧氏距离为负相关关系，相应所述投影轮廓点与所述采样点位于相同所述搜索线段上。
根据权利要求10所述的方法，其中，所述拍摄图像包括基于所述投影轮廓划分的前景区域和背景区域；在所述获取所述第一可信度与所述第一概率值的第一积以及所述第二可信度与所述第二概率值的第二积之前，所述方法还包括：

在所述采样点的所述有向欧氏距离大于第一距离值，且所述采样点属于所述前景区域的情况下，过滤所述采样点；

和/或，在所述采样点的所述有向欧氏距离小于第二距离值，且所述采样点属于所述背景区域的情况下，过滤所述采样点。
根据权利要求1至11任一项所述的方法，其中，所述投影轮廓是利用所述目标物体的参考位姿投影得到的；在所述获取拍摄图像中位于搜索线段上的若干采样点之前，所述方法包括：

对所述拍摄图像进行降采样，得到若干种分辨率的金字塔图像；

按照所述分辨率由小到大，依次选择所述金字塔图像作为当前所述拍摄图像，并对当前所述拍摄图像执行所述获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤；其中，本次执行所采用的所述参考位姿为上一次执行得到的所述位姿参数，最后一次执行得到的所述位姿参数作为所述拍摄图像中所述目标物体最终的所述位姿参数。
根据权利要求1至12任一项所述的方法，其中，所述投影轮廓是利用所述目标物体的参考位姿投影得到的，所述参考位姿是参考图像中所述目标物体的位姿参数，且所述参考图像是在所述拍摄图像之前拍摄得到的；所述基于所述目标函数，得到所述拍摄图像中所述目标物体的位姿参数，包括：

对所述目标函数进行求解，得到所述参考位姿的更新参数；

利用所述更新参数对所述参考位姿进行优化，得到所述位姿参数。
一种位姿获取装置，应用于电子设备中，包括：

投影采样模块，配置为获取拍摄图像中位于搜索线段上的若干采样点；其中，所述搜索线段经过所述拍摄图像中目标物体的投影轮廓点，所述投影轮廓点位于所述目标物体的投影轮廓；

信息提取模块，配置为获取所述采样点的属性信息，以及获取所述采样点的参考权重；其中，所述属性信息表示所述采样点属于所述目标物体的可能性；

函数构建模块，配置为基于所述采样点的所述属性信息和所述参考权重，构建目标函数；

位姿求解模块，配置为基于所述目标函数，得到所述拍摄图像中所述目标物体的位姿参数。
一种电子设备，包括相互耦接的存储器和处理器，所述处理器用于执行所述存储器中存储的程序指令，以实现权利要求1至13任一项所述的位姿获取方法。
一种计算机可读存储介质，其上存储有程序指令，所述程序指令被处理器执行时实现权利要求1至13任一项所述的位姿获取方法。
一种计算机程序，包括计算机可读代码，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行用于实现权利要求1至13中任一所述的图像处理方法。