CN113407027A - 位姿获取方法及装置和电子设备、存储介质 - Google Patents

位姿获取方法及装置和电子设备、存储介质 Download PDF

Info

Publication number
CN113407027A
CN113407027A CN202110626207.XA CN202110626207A CN113407027A CN 113407027 A CN113407027 A CN 113407027A CN 202110626207 A CN202110626207 A CN 202110626207A CN 113407027 A CN113407027 A CN 113407027A
Authority
CN
China
Prior art keywords
point
weight
sampling
pose
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110626207.XA
Other languages
English (en)
Other versions
CN113407027B (zh
Inventor
黄鸿
钟凡
秦学英
宋修强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Zhejiang Shangtang Technology Development Co Ltd
Original Assignee
Shandong University
Zhejiang Shangtang Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University, Zhejiang Shangtang Technology Development Co Ltd filed Critical Shandong University
Priority to CN202110626207.XA priority Critical patent/CN113407027B/zh
Publication of CN113407027A publication Critical patent/CN113407027A/zh
Priority to JP2023525620A priority patent/JP2023549069A/ja
Priority to PCT/CN2021/127307 priority patent/WO2022252487A1/zh
Priority to KR1020237014463A priority patent/KR20230073331A/ko
Application granted granted Critical
Publication of CN113407027B publication Critical patent/CN113407027B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/01Indexing scheme relating to G06F3/01
    • G06F2203/012Walk-in-place systems for allowing a user to walk in a virtual environment while constraining him to a given position in the physical environment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种位姿获取方法及装置和电子设备、存储介质,其中,位姿获取方法包括:获取拍摄图像中位于搜索线段上的若干采样点;其中,搜索线段经过拍摄图像中目标物体的投影轮廓点,投影轮廓点位于目标物体的投影轮廓;获取采样点的属性信息,以及获取采样点的参考权重;其中,属性信息表示采样点属于目标物体的可能性;基于采样点的属性信息和参考权重,构建目标函数;基于目标函数,得到拍摄图像中目标物体的位姿参数。上述方案,能够提高位姿参数的精度。

Description

位姿获取方法及装置和电子设备、存储介质
技术领域
本申请涉及计算机视觉技术领域,特别是涉及一种位姿获取方法及装置和电子设备、存储介质。
背景技术
随着信息技术的发展,位姿参数已经在诸如增强现实系统、机器人手眼标定、互动游戏、人机交互等诸多场景受到越来越广泛的应用。例如,在增强现实系统中,根据位姿参数可以将虚拟物体渲染并叠加至视频图像中现实物体上,以实现具有空间和几何一致性的虚实融合效果。
目前,在实际场景中,由于诸如局部遮挡、相似颜色等干扰因素,位姿参数的精度往往受到严重影响。有鉴于此,如何提高位姿参数的精度成为亟待解决的问题。
发明内容
本申请提供一种位姿获取方法及装置和电子设备、存储介质。
本申请第一方面提供了一种位姿获取方法,包括:获取拍摄图像中位于搜索线段上的若干采样点;其中,搜索线段经过拍摄图像中目标物体的投影轮廓点,投影轮廓点位于目标物体的投影轮廓;获取采样点的属性信息,以及获取采样点的参考权重;其中,属性信息表示采样点属于目标物体的可能性;基于采样点的属性信息和参考权重,构建目标函数;基于目标函数,得到拍摄图像中目标物体的位姿参数。
因此,获取拍摄图像中位于搜索线段上的若干采样点,且搜索线段经过拍摄图像中目标物体的投影轮廓点,投影轮廓点位于目标物体的投影轮廓,基于此再获取采样点的属性信息,以及获取采样点的参考权重,且属性信息表示采样点属于目标物体的可能性,从而基于采样点的属性信息和参考权重,构建目标函数,并基于目标函数,得到拍摄图像中目标物体的位姿参数,由于目标函数是基于采样点的属性信息和参考权重两者而构建的,故一方面得益于属性信息能够参考采样点属于目标物体的可能性,另一方面得益于参考权重能够参考采样点在后续求解位姿参数过程中的参考价值,进而能够有利于尽可能地缓解干扰因素对于位姿求解的影响,有利于提高位姿参数的精度。
其中,获取采样点的参考权重,包括:在搜索线段上的若干采样点中搜索目标点,得到搜索结果;其中,目标点用于表示目标物体的物体轮廓点;基于搜索结果,分别获取搜索线段上的若干采样点的权重信息;其中,权重信息包括第一权重和第二权重中至少一者,第一权重与目标点的预测概率值相关,预测概率值表示采样点作为物体轮廓点的可能性,且第二权重与目标点至采样点的第一距离相关;基于权重信息,得到采样点的参考权重。
因此,在搜索线段上的若干采样点中搜索目标点,得到搜索结果,且目标点用于表示目标物体的物体轮廓点,并基于搜索结果,分别获取搜索线段上的若干采样点的权重信息,且权重信息包括第一权重和第二权重中至少一者,第一权重与目标点的预测概率值相关,预测概率值表示采样点作为物体轮廓点的可能性,而第二权重与目标点至采样点的第一距离相关,故第一权重和第二权重能够从不同角度表征采样点的参考价值,进而基于此再基于权重信息,得到采样点的参考权重,能够提高参考权重在后续求解位姿参数过程中的参考价值。
其中,属性信息包括:采样点属于目标物体的第一概率值;在搜索线段上的若干采样点中搜索目标点,得到搜索结果,包括:对于每条搜索线段,将若干采样点分别作为当前点,在当前点的参考概率差值满足第一条件的情况下,将当前点作为候选点,并选取预测代价值满足第二条件的候选点作为目标点。其中,当前点的参考概率差值为与当前点具有预设位置关系的两个采样点的第一概率值之差,预测代价值包括第一代价值和第二代价值中至少一者,第一代价值与候选点的预测概率值相关,第二代价值与候选点至搜索线段上的投影轮廓点的第二距离相关。
因此,属性信息包括采样点属于目标物体的第一概率值,并对于每条搜索线段,将若干采样点分别作为当前点,在当前点的参考概率差值满足第一条件的情况下,将当前点作为候选点,以及选取预测代价值满足第二条件的候选点作为目标点,且当前点的参考概率差值为与当前点具有预设位置关系的两个采样点的第一概率值之差,预测代价值包括第一代价值和第二代价值中至少一者,第一代价值与候选点的预测概率值相关,第二代价值与候选点至搜索线段上的投影轮廓点的第二距离相关,即第一代价值和第二代价值分别不同角度表征候选点视为物体轮廓点的代价,故通过参考概率差值先粗选得到候选点,再基于预测代价值细选得到目标点,能够有利于提高筛选目标点的效率和精度。
其中,在选取预测代价值满足第二条件的候选点作为目标点之前,方法还包括:过滤预测概率值满足第三条件的候选点。
因此,在从候选点中细选得到目标点之前,先过滤预测概率值满足第三条件的候选点,而由于预测概率值表示采样点作为物体轮廓点的可能性,故能够有利于进一步提高目标点的筛选效率。
其中,预设位置关系为与当前点相邻;和/或,第二条件包括预测代价值最小;和/或,第一代价值与候选点的预测概率值负相关,且第二代价值与第二距离正相关。
因此,通过将预设位置关系设置为与当前点相邻,能够有利于准确评估每一采样点的第一概率值突变情况,有利于提高候选点的准确性;而通过将第二条件设置为包括预测代价值最小,能够有利于进一步尽可能地缓解干扰因素对于选取目标点的影响,提高位姿参数的精度;而通过将第一代价值设置为与候选点的预测概率值负相关,且第二代价值与第二距离正相关,能够有利于提高第一代价值和第二代价值的准确性。
其中,权重信息包括第一权重;基于搜索结果,分别获取搜索线段上的若干采样点的权重信息,包括:在搜索结果包括搜索到目标点的情况下,基于目标点的预测概率值确定采样点的第一权重,其中,第一权重与目标点的预测概率值正相关;和/或,在搜索结果包括未搜索到目标点的情况下,将第一权重确定为第一数值;其中,第一数值为在搜索结果包括搜索到目标点的情况下第一权重的下限值。
因此,权重信息包括第一权重,且在搜索结果包括搜索到目标点的情况下,基于目标点的预测概率值确定采样点的第一权重,且第一权重与目标点的预测概率值正相关,在搜索结果包括未搜索到目标点的情况下,将第一权重确定为第一数值,且第一数值为搜索结果包括搜索到目标点的情况下第一权重的下限值,能够以搜索线段整体为维度,确定搜索线段上各个采样点的第一权重,有利于提高获取第一权重的效率。
其中,权重信息包括第二权重;基于搜索结果,分别获取搜索线段上的若干采样点的权重信息,包括:在搜索结果包括搜索到目标点的情况下,基于采样点对应的第一距离确定采样点的第二权重,其中,第二权重与第一距离负相关;和/或,在搜索结果包括未搜索到目标点的情况下,将第二权重确定为第二数值;其中,第二数值为在搜索结果包括搜索到目标点的情况下第二权重的上限值。
因此,权重信息包括第二权重,且在搜索结果包括搜索到目标点的情况下,基于采样点对应的第一距离确定采样点的第二权重,且第二权重与第一距离负相关,在搜索结果包括未搜索到目标点的情况下,将第二权重确定为第二数值,且第二数值为在搜索到目标点的情况下第二权重的上限值,能够以搜索线段整体为维度,确定搜索线段上各个采样点的第二权重,有利于提高获取第二权重的效率。
其中,权重信息包括第一权重和第二权重,且第一权重、第二权重均与参考权重正相关。
因此,将权重信息设置为同时包含第一权重和第二权重,且第一权重、第二权重均与参考权重正相关,故能够同时从第一权重、第二权重两种不同维度表征采样点在后续求解位姿参数过程中的参考价值,有利于提高参考权重本身的参考价值。
其中,属性信息包括:采样点属于目标物体的第一概率值和第一可信度,以及采样点不属于目标物体的第二概率值和第二可信度;基于采样点的属性信息和参考权重,构建目标函数,包括:获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积,并基于第一积和第二积之和,得到采样点的联合概率值;基于各个采样点的参考权重对联合概率值的加权结果,得到目标函数。
因此,属性信息包括采样点属于目标物体的第一概率值和第一可信度,以及采样点不属于目标物体的第二概率值和第二可信度,在此基础上,获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积,并基于第一积和第二积之和,得到采样点的联合概率值,从而能够从采样点属于目标物体和采样点不属于目标物体两种角度来表征采样点的联合概率值,并以此通过各个采样点的参考权重对联合概率值的加权结果来构建得到目标函数,能够提高目标函数的准确性,有利于提高参考位姿的精度。
其中,第一可信度与第二可信度为负相关关系,采样点的第一可信度与相应投影轮廓点至采样点的有向欧氏距离为负相关关系,相应投影轮廓点与采样点位于相同搜索线段上。
因此,第一可信度与第二可信度为负相关关系,且采样点的第一可信度与相应投影轮廓点至采样点的有向欧氏距离为负相关关系,相应投影轮廓点与采样点位于相同搜索线段上,即有向欧氏距离越小,采样点属于目标物体的第一可信度越高,而采样点不属于目标物体的第二可信度越低,能够有利于尽可能地缓解诸如局部遮挡等干扰因素的影响。
其中,拍摄图像包括基于投影轮廓划分的前景区域和背景区域;在获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积之前,方法还包括:在采样点的有向欧氏距离大于第一距离值,且采样点属于前景区域的情况下,过滤采样点;和/或,在采样点的有向欧氏距离小于第二距离值,且采样点属于背景区域的情况下,过滤采样点。
因此,拍摄图像包括基于投影轮廓划分的前景区域和背景区域,在计算联合概率值之前,先检测有向欧氏距离大于第一距离值且属于前景区域的采样点,即可将其视为干扰点,并将其过滤,有利于尽可能地降低干扰点对于后续求解位姿参数的影响,而先检测有向欧氏距离小于第二距离值且属于背景区域的采样点,即可将其视为干扰点,并将其过滤,有利于尽可能地降低干扰点对于后续求解位姿参数的影响。
其中,投影轮廓是利用目标物体的参考位姿投影得到的;在获取拍摄图像中位于搜索线段上的若干采样点之前,方法包括:对拍摄图像进行降采样,得到若干种分辨率的金字塔图像;按照分辨率由小到大,依次选择金字塔图像作为当前拍摄图像,并对当前拍摄图像执行获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤;其中,本次执行所采用的参考位姿为上一次执行得到的位姿参数,最后一次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数。
因此,投影轮廓是利用目标物体的参考位姿投影得到的,从而在投影采样之前,先对拍摄图像进行降采样,以得到若干种分辨率的金字塔图像,并按照分辨率由小到大,依次选择金字塔图像作为当前拍摄图像,以及对当前拍摄图像执行上述获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤,且本次执行所采用的参考位姿为上一次执行得到的位姿参数,最后一次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数,从而能够在位姿参数的获取过程中,由粗到细地进行位姿估计,进而能够有利于提高位姿参数的获取效率和精度。
其中,投影轮廓是利用目标物体的参考位姿投影得到的;基于目标函数,得到拍摄图像中目标物体的位姿参数,包括:对目标函数进行求解,得到参考位姿的更新参数;利用更新参数对参考位姿进行优化,得到位姿参数。
因此,投影轮廓是利用目标物体的参考位姿投影得到的,参考位姿是参考图像中目标物体的位姿参数,且参考图像是在拍摄图像之前拍摄得到的,并对目标函数进行求解,得到参考位姿的更新参数,以及利用更新参数对参考位姿进行优化,得到位姿参数,有利于在对目标物体拍摄过程中,准确地对位姿参数进行持续跟踪。
本申请第二方面提供了一种位姿获取装置,包括:投影采样模块、信息获取模块、函数构建模块和位姿求解模块,投影采样模块用于获取拍摄图像中位于搜索线段上的若干采样点;其中,搜索线段经过拍摄图像中目标物体的投影轮廓点,投影轮廓点位于目标物体的投影轮廓;信息提取模块用于获取采样点的属性信息,以及获取采样点的参考权重;其中,属性信息表示采样点属于目标物体的可能性;函数构建模块用于基于采样点的属性信息和参考权重,构建目标函数;位姿求解模块用于基于目标函数,得到拍摄图像中目标物体的位姿参数。
本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述第一方面中的位姿获取方法。
本申请第四方面提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述第一方面中的位姿获取方法。
上述方案,获取拍摄图像中位于搜索线段上的若干采样点,且搜索线段经过拍摄图像中目标物体的投影轮廓点,投影轮廓点位于目标物体的投影轮廓,基于此再获取采样点的属性信息,以及获取采样点的参考权重,且属性信息表示采样点属于目标物体的可能性,从而基于采样点的属性信息和参考权重,构建目标函数,并基于目标函数,得到拍摄图像中目标物体的位姿参数,由于目标函数是基于采样点的属性信息和参考权重两者而构建的,故一方面得益于属性信息能够参考采样点属于目标物体的可能性,另一方面得益于参考权重能够参考采样点在后续求解位姿参数过程中的参考价值,进而能够有利于尽可能地缓解干扰因素对于位姿求解的影响,有利于提高位姿参数的精度。
附图说明
图1是本申请位姿获取方法一实施例的流程示意图;
图2是轮廓掩码一实施例的示意图;
图3是投影轮廓和搜索线段一实施例的示意图;
图4a是拍摄图像一实施例的示意图;
图4b是掩码图像另一实施例的示意图;
图4c是搜索线段一实施例的示意图;
图5a是拍摄图像另一实施例的示意图;
图5b是布局区域一实施例的示意图;
图5c是局部区域另一实施例的示意图;
图6是图1中步骤S12一实施例的流程示意图;
图7a是图3中搜索线段的集束图像;
图7b是图3中搜索线段上各个采样点的第一概率值的集束图像;
图8是本申请位姿获取方法另一实施例的流程示意图;
图9是本申请位姿获取装置一实施例的框架示意图;
图10是本申请电子设备一实施例的框架示意图;
图11是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请位姿获取方法一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S11:获取拍摄图像中位于搜索线段上的若干采样点。
本公开实施例中,搜索线段经过拍摄图像中目标物体的投影轮廓点,投影轮廓点位于目标物体的投影轮廓。
在一个实施场景中,投影轮廓是利用目标物体的参考位姿投影得到的,而参考位姿是参考图像中目标物体的位姿参数,且参考图像是在拍摄图像之前拍摄得到的。例如,在现实场景中,可以对目标物体拍摄视频数据,视频数据可以包含多帧图像,则对于其中第t-1帧图像而言,可以采样本公开实施例中步骤得到目标物体在第t-1帧图像中的位姿参数Tt-1,在获取其中第t帧图像中目标物体的位姿参数时,可以将Tt-1作为参考位姿,并利用本公开实施例中步骤得到目标物体在第t帧图像中的位姿参数Tt,以此类推,在此不再一一举例。
在一个实施场景中,为了提高投影便利性,可以预先对目标物体进行三维建模,得到目标物体的三维模型。需要说明的是,三维模型可以包括若干顶点以及连接顶点的边。三维建模的具体过程,可以参阅三维建模的相关技术细节,在此不再赘述。
在一个实施场景中,为了便于描述,参考位姿可以记为T,其可以表示为一个4*4的齐次矩阵:
Figure BDA0003102165670000051
上述公式(1)中,
Figure BDA0003102165670000052
表示特殊欧氏群,R表示旋转参数,t表示平移参数,且R为
Figure BDA0003102165670000061
(即特殊正交群),t为实数矩阵。在此基础上,可以利用相机内参K以及上述参考位姿T将目标物体上的三维点X投影至拍摄图像中,得到三维点X对应于拍摄图像中的像素点x:
Figure BDA0003102165670000062
上述公式(2)中,π(X)=[X/Z,Y/Z]T
Figure BDA0003102165670000063
表示三维点X的齐次坐标,即
Figure BDA0003102165670000064
需要说明的是,三维点X的普通坐标表示为
Figure BDA0003102165670000065
此外,在如前述持续跟踪场景下,帧间相对位姿ΔT可以利用李代数由六维捻度矢量(即twistvector)表示,即p=[w1 w2 w3 v1 v2 v3]。
在一个实施场景中,为了便于后续确定各个像素点的相关属性,可以基于目标物体的投影结果,得到轮廓掩码,且该轮廓掩码中每个像素点分别对应于拍摄图像中相同位置的像素点。请结合参阅图2,图2是轮廓掩码一实施例的示意图。如图2所示,目标物体经投影之后,可以得到投影轮廓,拍摄图像基于投影轮廓划分为前景区域(即图2中前景区域Ωf)和背景区域(即图2中背景区域Ωb)。进一步地,可以构造经过投影轮廓上投影轮廓点mi的搜索线段li。搜索线段具体可以沿投影轮廓在投影轮廓点mi处的法向量ni进行构造。在此基础上,可以在搜索线段上提取得到若干采样点。例如,可以提取搜索线段li上的投影轮廓点mi以及分别位于投影轮廓点mi两侧的N个(如,7个、8个、9个)像素点,作为搜索线段li上的若干采样点(即图2中实心圆点)。需要说明的是,图2所示仅仅为实际应用过程中,可能存在的一种投影轮廓,并不因此而限定投影轮廓的具体行程,其他情况可以以此类推,在此不再一一举例。
在一个实施场景中,请结合参阅图3,图3是投影轮廓和搜索线段一实施例的示意图。如图3所示,在现实场景中,可以基于投影轮廓上各个投影轮廓点,构造多条搜索线段。其他拍摄图像可以以此类推,在此不再一一举例。
步骤S12:获取采样点的属性信息,以及获取采样点的参考权重。
本公开实施例中,属性信息表示采样点属于目标物体的可能性。具体地,属性信息可以包括采样点属于目标物体的第一概率值和第一可信度,以及采样点不属于目标物体的第二概率值和第二可信度。需要说明的是,上述第一可信度可以表示第一概率值的可信程度,上述第二可信度可以表示第二概率值可信程度。此外,若采样点属于目标物体,则可以认为该采样点属于拍摄图像中实际的前景区域,反之,若采样点不属于目标物体,则可以认为该采样点属于拍摄图像中实际的背景区域。
在一个实施场景中,为了便于描述,搜索线段li上第j个采样点可以记为xij,采样点xij的第一概率值可以记为Pf(xij),采样点xij的第二概率值可以记为Pb(xij)。需要说明的是,第一概率值和第二概率值可以通过时间连续的局部颜色直方图来确定,第一概率值和第二概率值的具体获取过程,可以参阅时间连续的局部颜色直方图的具体技术细节,在此不再赘述。
在一个实施场景中,第一可信度与第二可信度为负相关关系,即第一可信度越高,第二可信度越低,反之,第一可信度越低,第二可信度越高。此外,采样点的第一可信度与相应投影轮廓点至采样点的有向欧氏距离为负相关关系,且相应投影轮廓点与采样点位于相同搜索线段上。请结合参阅图2,以搜索线段li为例,该搜索线段li上某一采样点的第一可信度与该采样点至搜索线段li上投影轮廓点mi的有向欧氏距离负相关,其他搜索线段上各个采样点可以以此类推获取其第一可信度,在此不再一一举例。
在一个具体的实施场景中,可以基于采样点的第一坐标、相应投影轮廓点的第二坐标以及前述法向量,获取采样点至相应投影轮廓点的有向欧氏距离。仍以搜索线段li上第j个采样点xij为例,其有向欧氏距离d(xij)可以表示为:
Figure BDA0003102165670000071
上述公式(3)中,mi表示搜索线段li上的投影轮廓点,
Figure BDA0003102165670000072
表示投影轮廓在投影轮廓点mi处的法向量的转置。
在另一个具体的实施场景中,为了平滑第一可信度,可以采用光滑可导的阶跃函数(如,Heaviside函数)处理有向欧氏距离,得到第一可信度。仍以搜索线段li上第j个采样点xij为例,其第一可信度He(d(xij))可以表示为:
Figure BDA0003102165670000073
上述公式(4)中,s表示平滑因子,s越大,第一可信度He(d(xij))随有向欧氏距离d(xij)变化越趋于剧烈;反之,s越小,第一可信度He(d(xij))随有向欧氏距离d(xij)变化越趋于平缓。
在又一个实施场景中,第一可信度与第二可信度之和可以为1。仍以搜索线段li上第j个采样点xij为例,在得到采样点xij的第一可信度He(d(xij))之后,可以将1-He(d(xij))作为采样点xij的第二可信度。
在一个实施场景中,对于每条搜索线段而言,可以在搜索线段上的若干采样点中搜索目标点,得到搜索结果,且目标点用于表示目标物体的物体轮廓点。在此基础上,可以基于搜索结果,分别获取搜索线段上的若干采样点的权重信息,且权重信息包括第一权重和第二权重中至少一者,第一权重与目标点的预测概率值相关,预测概率值表示采样点作为物体轮廓点的可能性,而第二权重与目标点至采样点的第一距离相关,从而可以基于权重信息,得到采样点的参考权重。需要说明的是,目标点的搜索过程以及预测概率值的计算过程,可以参阅下述公开实施例中相关描述,在此暂不赘述。此外,物体轮廓点为目标物体在拍摄图像中实际轮廓点,如图2所示,搜索线段li上采样点si同时也位于物体轮廓(即图2中物体轮廓),则该采样点si同时也为目标物体在拍摄图像中实际轮廓点。
在一个具体的实施场景中,权重信息可以包括第一权重,则在搜索结果包括搜索到目标点的情况下,可以基于目标点的预测概率值确定采样点的第一权重,且第一权重与目标点的预测概率值正相关,而在搜索结果包括未搜索到目标点的情况下,可以将第一权重确定为第一数值,且第一数值为在搜索结果包括搜索到目标点的情况下第一权重的下限值。仍以搜索线段li上第j个采样点xij为例,第一权重wc(xij)可以表示为:
Figure BDA0003102165670000074
上述公式(5)中,
Figure BDA0003102165670000075
表示搜索线段li能够搜索到目标点si,P(si|C)表示目标点si的预测概率值,即表示目标点si为物体轮廓点的可能性,目标点si的预测概率值越大,目标点si为物体轮廓点的可能性越高,反之,目标点si的预测概率值越小,目标点si为物体轮廓点的可能性越低。此外,k1表示一个负常数,用于控制第一权重随预测概率值的衰减速度,具体可以根据应用需要进行设置,如可以设置为-1.25等,在此不做限定。如公式(5)所示,当目标点si的预测概率值为1时,表明目标点si为物体轮廓点的可能性最高,此时目标点si具有最大的第一权重(即1),而当目标点si的预测概率值为0时,表明目标点si为物体轮廓点的可能性最低,此时目标点si具有最小的第一权重(即exp(k1)),该第一权重即为在搜索结果包括搜索到目标点的情况下第一权重的下限值。需要说明的是,若目标点si预测概率值P(si|C)过小,则该目标点si所在的搜索线段li很可能出于被干扰状态(如,处于被局部遮挡的状态、处于被相似颜色干扰的局部区域内),则通过调小该目标点si所在的搜索线段li上各个采样点的第一权重,可以调低这些采样点在后续位姿参数获取过程中的参考价值,以尽可能地缓解干扰因素对于位姿参数的影响,提高位姿参数的精度。
在另一个具体的实施场景中,权重信息可以包括第二权重,则在搜索结果包括搜索到目标点的情况下,可以基于采样点对应的第一距离确定采样点的第二权重,且第二权重与第一距离负相关,而在搜索结果包括未搜索到目标点的情况下,可以将第二权重确定为第二数值,且第二数值为在搜索结果包括搜索到目标点的情况下第二权重的上限值。仍以搜索线段li上第j个采样点xij为例,第二权重wd(xij)可以表示为:
Figure BDA0003102165670000081
上述公式(6)中,
Figure BDA0003102165670000082
表示搜索线段li能够搜索到目标点si,D(xij,si)表示采样点xij对应的第一距离,即目标点si至采样点xij之间的距离。具体地,第一距离D(xij,si)可以基于采样点xij的第一坐标、目标点si的第三坐标以及采样点xij所在的搜索线段li的长度Ni(即搜索线段li所包含的采样点个数)计算得到,如D(xij,si)=||xij-si||/Ni。此外,k2表示一个负常数,用于控制第二权重随第一距离的衰减速度,具体可以根据应用需要进行设置,如可以设置为-3.5等,在此不做限定。如公式(6)所示,当采样点xij与目标点si为同一采样点的情况下,两者之间的第一距离D(xij,si)达到最小(即0),此时目标点si具有最大的第二权重(即1),而当采样点xij与目标点si分别处于搜索线段li两个末端的情况下,两者之间的第一距离D(xij,si)达到最大(即1),此时目标点si具有最小的第二权重(即exp(k2))。需要说明的是,采样点xij距离目标点si越远,采样点xij越容易处于被干扰状态(如,被复杂背景干扰、被相似颜色干扰),则通过调小该采样点xij的第二权重,可以调低该采样点xij在后续位姿参数获取过程中的参考价值,以尽可能地缓解干扰因素对于位姿参数的影响,提高位姿参数的精度。
在又一个具体的实施场景中,采样点的权重信息可以同时包含第一权重和第二权重,在此情况下,第一权重和第二权重的获取过程,可以分别参阅前述第一权重、第二权重的获取方式,在此不再赘述。此外,在权重信息同时包含第一权重和第二权重的情况下,第一权重、第二权重均与参考权重正相关。例如,可以将第一权重与第二权重之积作为参考权重。仍以搜索线段li上第j个采样点xij为例,可以将第一权重wc(xij)与第二权重wd(xij)之积作为采样点xij的参考权重w(xij)。其他采样点可以以此类推,在此不再一一举例。
步骤S13:基于采样点的属性信息和参考权重,构建目标函数。
在一个实施场景中,如前所述,采样点的属性信息可以包括:采样点属于目标物体的第一概率值和第一可信度,以及采样点不属于目标物体的第二概率值和第二可信度,则可以获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积,并基于第一积和第二积,得到采样点的联合概率值,在此基础上,再基于各个采样点的参考权重对联合概率值的加权结合,得到目标函数。
在一个具体的实施场景中,可以对第一积和第二积之和取对数,得到联合概率值,并对各个采样点的参考权重对联合概率值的加权结果求和,得到目标函数E(p):
Figure BDA0003102165670000091
上述公式(7)中,He(d(xij))表示第一可信度,Pf(xij)表示第一概率值,1-He(d(xij))表示第二可信度,Pb(xij)表示第二概率值,w(xij)表示参考权重,具体获取过程,可以参阅前述相关描述,在此不再赘述。此外,L表示所有搜索线段上采样点的集合。
在另一个具体的实施场景中,请结合参阅图2,拍摄图像包括基于投影轮廓(即图2中投影轮廓)划分的前景区域(即图2中前景区域Ωf)和背景区域(即图2中背景区域Ωb),则在构造目标函数之前,还可以进一步对搜索线段上各个采样点进行校验。以投影轮廓点处的法向量的方向为从前景区域指向背景区域为例,则在采样点的有向欧氏距离大于第一距离值(如,0)时,可以认为该采样点属于背景区域,若该采样点实际属于前景区域,则可以将其过滤,即从上述采样点集合L中过滤,如图2中最下侧搜索线段,位于该搜索线段最左侧两个采样点其有向欧氏距离均大于第一距离值(如,0),故可以认为这两个采样点属于背景区域,而实际上这两个采样点属于前景区域,则可以将这两个采样点过滤;类似地,在采样点的有向欧氏距离小于第二距离值(如,0)时,可以认为该采样点属于前景区域,若干采样点实际属于背景区域,则可以将其过滤,即从上述采样点集合L中过滤,如图2中左上角搜索线段,位于该搜索线段最右侧两个采样点其有向欧氏距离均小于第二距离值(如,0),故可以认为这两个采样点属于前景区域,而实际上这两个采样点属于背景区域,则可以将这两个采样点过滤。
步骤S14:基于目标函数,得到拍摄图像中目标物体的位姿参数。
在一个实施场景中,如前所述,投影轮廓是利用目标物体的参考位姿投影得到的,参考位姿是参考图像中目标物体的位姿参数,且参考图像是在拍摄图像之前拍摄得到的,则可以对目标函数进行求解,得到参考位姿的更新参数,并利用更新参数对参考位姿进行优化,得到拍摄图像中目标物体的位姿参数。具体地,参考图像可以是拍摄图像之前一帧图像,如参考图像可以为视频数据中第t-1帧图像,而拍摄图像可以为视频数据中第t帧图像,具体可以参阅前述相关描述,在此不再赘述。
在一个具体的实施场景中,为了便于使用非线性算法最小化目标函数,可以将目标函数改写为非线性加权最小二乘问题的标准形式:
Figure BDA0003102165670000101
F(xij,p)=-log[He(d(xij))Pf(xij)+(1-He(d(xij)))Pf(xij)]……(9)
上述公式(8)中,ψ(xij)=1/F(xij,p)。在此基础上,可以通过高斯牛顿算法迭代解决优化问题,将雅可比向量定义为:
Figure BDA0003102165670000102
Figure BDA0003102165670000103
Figure BDA0003102165670000104
上述公式(12)中,
Figure BDA0003102165670000105
表示平滑的狄拉克δ函数,可以由第一可信度He(d(xij))引出,具体可以参阅前述公式(4)。此外,
Figure BDA0003102165670000106
可以由前述公式(2)推导,具体推导过程可以参阅高斯牛顿算法的相关细节,在此不再赘述。基于上述雅可比向量以及高斯牛顿算法,可以推导得到更新参数Δp:
Figure BDA0003102165670000107
在另一个具体的实施场景中,上述更新参数Δp采用李代数表达,为了便于优化参考位姿,可以将Δp转换为欧式变换矩阵ΔT,具体转换过程可以参阅李群、李代数相关技术细节,在此不再赘述。在此基础上,拍摄图像中目标物体的位姿参数T′可以表示为:
T′=ΔT·T……(14)
在一个实施场景中,在存在多个目标物体的情况下,若多个目标物体彼此之间互不遮挡,则各个目标物体在拍摄图像中的位姿参数可以利用本公开实施例中步骤分别获取得到。反之,若多个目标物体彼此之间存在遮挡,则可以使用前述掩码图像Is和深度图像Id来过滤处于被干扰状态(如,被遮挡)的采样点。
在一个具体的实施场景中,深度图像Id可以是对拍摄图像进行渲染得到的,具体渲染过程在此不再赘述。深度图像Id具体可以包括拍摄图像中各个像素点的深度值。
在另一个具体的实施场景中,在获取第k个目标物体在拍摄图像中的位姿参数过程中,可以先搜索位于第k个目标物体对应的背景区域
Figure BDA0003102165670000108
内且与所在搜索线段的投影轮廓点mi毗邻的采样点xij,并校验Is(xij)是否等于另一目标物体的索引,且采样点xij的深度值Id(xij)小于所在搜索线段的投影轮廓点mi的深度值Id(mi),若是,则可以认为该采样点xij所在搜索线段li处于被干扰状态(如,被遮挡),则可以过滤这条搜索线段li上所有采样点。请结合参阅图4a至图4c,图4a是拍摄图像一实施例的示意图,图4b是掩码图像另一实施例的示意图,图4c是搜索线段一实施例的示意图。如图4a至4c所示,拍摄图像中存在鸭子和松鼠两个目标物体,且鸭子被松鼠遮挡,故在获取鸭子在拍摄图像中的位姿参数过程中,可以过滤遮挡的投影轮廓附近的搜索线段,以尽可能地环节诸如布局遮挡等干扰因素对获取位姿参数的负面影响,有利于提高位姿参数的精度。
在一个实施场景中,需要说明的是,前述局部颜色直方图是基于围绕物体轮廓的局部区域而构造得到的,与此同时,为了增强时间连续性,每个局部区域对应于一个模型顶点。然而,目标物体的三维模型所包含的顶点较少(如,少于50个)的情况下,这些局部区域并不能完全覆盖物体轮廓,从而影响上述第一概率值Pf和第二概率值Pb的准确性。有鉴于此,在目标物体的三维模型所包含的顶点少于预设阈值(如,50)的情况下,可以在三维模型的每条边增加若干(如,4个)顶点,以提升局部区域的数量,从而尽可能地使得局部区域能够覆盖物体轮廓。请结合参阅图5a至图5c,图5a是拍摄图像另一实施例的示意图,图5b是布局区域一实施例的示意图,图5c是局部区域另一实施例的示意图。如图5a至图5c所示,在顶点(如图中实心圆所示)数量较少(如图5b中仅有4个)的情况下,局部区域(如图中空心圆所示)并不完全覆盖目标物体的物体轮廓,在此情况下,通过在每条边上增加顶点(如,增加至8个),局部区域可以完全覆盖物体轮廓。
在一个实施场景中,拍摄图像中目标物体的位姿参数可以是通过多次迭代(如,7次迭代)得到的。具体地,在第一次迭代过程中,可以将参考图像中目标物体的位姿参数作为参考位置,并执行本公开实施例中步骤,得到第一次次迭代时拍摄图像中目标物体的位姿参数,并将其作为第二次迭代的参考位姿,并重新执行本公开实施例中步骤,得到第二次迭代时拍摄图像中目标物体的位姿参数,以此类推,在第i次迭代时,将第i-1次迭代所得到的位姿参数作为参考位姿,并执行本公开实施例中步骤,得到第i次迭代时拍摄图像中目标物体的位姿参数,直至最后一次迭代,可以直接将最后一次迭代时拍摄图像中目标物体的位姿参数,作为拍摄图像中目标物体最终的位姿参数。
上述方案,获取拍摄图像中位于搜索线段上的若干采样点,且搜索线段经过拍摄图像中目标物体的投影轮廓点,投影轮廓点位于目标物体的投影轮廓,基于此再获取采样点的属性信息,以及获取采样点的参考权重,且属性信息表示采样点属于目标物体的可能性,从而基于采样点的属性信息和参考权重,构建目标函数,并基于目标函数,得到拍摄图像中目标物体的位姿参数,由于目标函数是基于采样点的属性信息和参考权重两者而构建的,故一方面得益于属性信息能够参考采样点属于目标物体的可能性,另一方面得益于参考权重能够参考采样点在后续求解位姿参数过程中的参考价值,进而能够有利于尽可能地缓解干扰因素对于位姿求解的影响,有利于提高位姿参数的精度。
请参阅图6,图6是图1中步骤S12一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S61:在搜索线段上的若干采样点中搜索目标点,得到搜索结果。
本公开实施例中,目标点用于表示目标物体的物体轮廓点。请结合参阅图2,仍以搜索线段li为例,搜索线段li上采样点si可以用于表示物体轮廓点,其他情况可以以此类推,在此不再一一举例。
在一个实施场景中,对于每条搜索线段,可以将该搜索线段上若干采样点分别作为当前点,在当前点的参考概率差值满足第一条件的情况下,可以将当前点作为候选点,并选取预测代价值满足第二条件的候选点作为目标点。上述方式,可以先基于参考概率差值进行粗选,再基于预测代价值进行细选,有利于提高筛选目标点的效率和准确性。
在一个具体的实施场景中,当前点的参考概率差值可以为与当前点具有预设位置关系(如,与当前点相邻)的两个采样点的第一概率值之差。为了提高访问不同采样点的第一概率值的便利性,如图7a所示,可以将图3中所有搜索线段按行堆叠,构造得到搜索线段的集束图像Ib,以及如图7b所示,将图3中所有搜索线段上各个采样点的第一概率值也按行堆叠,构建得到关于第一概率值的集束图像Ip。如前述公开实施例所述,搜索线段包含2*N+1个采样点,其中中间位置的采样点为投影轮廓点,投影轮廓点一侧对应于前景区域,投影轮廓点的另一侧对应于背景区域,故集束图像Ib中间一列对应投影轮廓,中间一列的一侧对应前景区域,中间一列的另一侧对应背景区域。
在另一个具体的实施场景中,第一条件可以包括参考概率差值大于预设阈值,则在构造得到上述集束图像Ip之后,可以利用预设卷积核(如,f=[-1 0 1])在集束图像Ip每行分别进行滑动卷积,并将卷积响应高于预设阈值ε(如,0.3)的采样点作为候选点。
在又一个具体的实施场景中,上述候选点有可能存在三种情况,即候选点可能为物体轮廓点,候选点也可能为前景干扰点,候选点还可能为背景干扰点。为了提高分类准确性,对于搜索线段li上第j个采样点xij而言,可以在搜索线段li指向背景区域的一段选取若干连续采样点,构成第一采样点集
Figure BDA0003102165670000121
(如,可以包括xi,j-1,xi,j-2,xi,j-3),并在搜索线段li指向前景区域的一段选取若干连续采样点,构成第二采样点集
Figure BDA0003102165670000122
(如,可以包括xi,j+1,xi,j+2,xi,j+3)。故此,在采样点为物体轮廓点的情况下,第一采样点集
Figure BDA0003102165670000123
理论上应属于背景区域,而第二采样点集
Figure BDA0003102165670000124
理论上应属于前景区域,故采样点作为物体轮廓点的概率值P(hij|C)可以表示为:
Figure BDA0003102165670000125
需要说明的是,在hij为候选点的情况下,P(hij|C)即为候选点作为物体轮廓点的预测概率值;而如前述公开实施例所述,在候选点hij可作为目标点si的情况下,P(hij|C)可以写作P(si|C),即可以作为目标点可作为物体轮廓点的预测概率值。
类似地,在采样点为前景干扰点的情况下,第一采样点集
Figure BDA0003102165670000126
和第二采样点集
Figure BDA0003102165670000127
理论上应均属于前景区域,故采样点作为前景干扰点的概率值P(hij|F)可以表示为:
Figure BDA0003102165670000128
需要说明的是,在hij为候选点的情况下,P(hij|F)即为候选点作为前景干扰点的预测概率值。
类似地,在采样点为背景干扰点的情况下,一采样点集
Figure BDA0003102165670000129
和第二采样点集
Figure BDA00031021656700001210
理论上应均属于背景区域,故采样点作为背景干扰点的概率值P(hij|B)可以表示为:
Figure BDA00031021656700001211
需要说明的是,在hij为候选点的情况下,P(hij|B)即为候选点作为背景干扰点的预测概率值。
在此基础上,可以进一步定义采样点作为物体轮廓点的归一化概率值Pc(hij):
Figure BDA0003102165670000131
需要说明的是,在hij为候选点的情况下,Pc(hij)即为候选点作为物体轮廓点的归一化概率值。
在又一个具体的实施场景中,在获取候选点作为物体轮廓点的预测概率值P(hij|C)或者在获取候选点作为物体轮廓点的归一化概率值Pc(hij)之后,可以进一步过滤预测概率值P(hij|C)满足第三条件的候选点。例如,可以过滤预测概率值P(hij|C)小于前述概率值P(hij|F)和概率值P(hij|B)两者中最大值的候选点,即对于候选点hij,若满足P(hij|C)<max(P(hij|B),P(hij|F)),则可以将该候选点hij过滤;或者,可以如前所述,基于预测概率值P(hij|C)得到归一化概率值Pc(hij),并过滤归一化概率值Pc(hij)小于预设阈值(如,0.5)的候选点,在此不做限定。
在又一个具体的实施场景中,上述预测代价值可以包括第一代价值和第二代价值中至少一者,如可以同时包括第一代价值和第二代价值,也可以仅包括第一代价值,或者仅包括第二代价值。第一代价值可以与候选点的预测概率值相关,如第一代价值可以与候选点的预测概率值负相关,为了便于描述,第一代价值可以记为Ed(hij),则第一代价值Ed(hij)可以表示为:
Figure BDA0003102165670000132
如公式(19)所示,候选点hij的预测概率值P(hij|C)越大,其作为目标点的第一代价值Ed(hij)越小。
此外,第二代价值与候选点至搜索线段上的投影轮廓点的第二距离相关,如第二代价值可以与上述第二距离正相关,为了便于描述,第二代价值可以记为ES(hij),则第二代价值ES(hij)可以表示为:
ES(hij)=||hij-mi||2……(20)
如公式(20)所示,候选点hij至搜索线段li上的投影轮廓点mi的第二距离||hij-mi||越大,其作为目标点的第二代价值ES(hij)越大。
需要说明的是,在预测代价值同时包含第一代价值和第二代价值的情况下,可以将第一代价值和第二代价值进行加权处理,作为预测代价值E(hij):
E(hij)=Ed(hij)+λEs(hij,mi)……(21)
上述公式(21)中,λ表示加权因子,具体可以根据实际应用需要进行设置,如可以设置为0.015,在此不做限定。上述第二条件具体可以包括预测代价值最小,即在目标物体或相机的帧间运动较为平和的情况下,第二代价值会对离投影轮廓较远的候选点施加额外惩罚,以优先选择离投影轮廓较近的候选点作为目标点。
需要说明的是,在上述筛选过程中,搜索线段li上可能搜索不到目标点,则此时可以对于该搜索线段li,可以标记
Figure BDA0003102165670000141
以表示对于搜索线段li而言,其搜索结果包括未搜索到目标点。
步骤S62:基于搜索结果,分别获取搜索线段上的若干采样点的权重信息。
本公开实施例中,权重信息包括第一权重和第二权重中至少一者,第一权重与目标点的预测概率值相关,预测概率值表示采样点作为物体轮廓点的可能性,且第二权重与目标点至采样点的第一距离相关。具体可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S63:基于权重信息,得到采样点的参考权重。
具体可以参阅前述公开实施例中相关描述,在此不再赘述。
上述方案,在搜索线段上的若干采样点中搜索目标点,得到搜索结果,且目标点用于表示目标物体的物体轮廓点,并基于搜索结果,分别获取搜索线段上的若干采样点的权重信息,且权重信息包括第一权重和第二权重中至少一者,第一权重与目标点的预测概率值相关,预测概率值表示采样点作为物体轮廓点的可能性,而第二权重与目标点至采样点的第一距离相关,故第一权重和第二权重能够从不同角度表征采样点的参考价值,进而基于此再基于权重信息,得到采样点的参考权重,能够提高参考权重在后续求解位姿参数过程中的参考价值。
请参阅图8,图8是本申请位姿获取方法另一实施例的流程示意图。具体可以包括如下步骤:
步骤S801:对拍摄图像进行降采样,得到若干种分辨率的金字塔图像。
例如,可以将2作为降采样倍率,以对拍摄图像进行降采样处理,得到1/4分辨率的金字塔图像、1/2分辨率的金字塔图像以及原始分辨率的金字塔图像(即拍摄图像本身)。其他情况可以以此类推,在此不再一一举例。
步骤S802:按照分辨率由小到大,依次选择金字塔图像作为当前拍摄图像。
例如,可以先选择1/4分辨率的金字塔图像作为当前拍摄图像,并执行下述步骤以得到1/4分辨率的金字塔图像中目标物体的位姿参数,自此之后再选择1/2分辨率的金字塔图像作为当前拍摄图像,如此循环,在此不再一一举例。
步骤S803:获取当前拍摄图像中位于搜索线段上的若干采样点。
本公开实施例中,搜索线段经过拍摄图像中目标物体的投影轮廓点,投影轮廓点位于目标物体的投影轮廓,且投影轮廓是利用目标物体的参考位姿投影得到的。具体可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S804:获取采样点的属性信息,以及获取采样点的参考权重。
本公开实施例中,属性信息表示采样点属于目标物体的可能性。具体可以参阅前述公开实施例中相关描述,在此不再赘述。
需要说明的是,属性信息包括:采样点属于目标物体的第一概率值和第一可信度,以及采样点不属于目标物体的第二概率值和第二可信度,且第一可信度的计算过程可以参阅前述公开实施例中公式(4)及相关描述,且公式(4)中平滑因子s与负相关。例如,对于1/4分辨率的金字塔图像而言,平滑因子s可以设置为1.2,而对于1/2分辨率的金字塔图像而言,平滑因子s可以设置为0.8,对于原始分辨率的金字塔图像(即拍摄图像本身)而言,平滑因子s可以设置为0.6,在此不做限定。
步骤S805:基于采样点的属性信息和参考权重,构建目标函数。
具体可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S806:基于目标函数,得到当前拍摄图像中目标物体的位姿参数。
具体可以参阅前述公开实施例中相关描述,在此不再赘述。
需要说明的是,如前述公开实施例所述,对于拍摄图像而言可以通过多次迭代,得到拍摄图像中目标物体的位姿参数。类似地,对于金字塔图像而言,可以经过若干次迭代,得到金字塔图像中目标物体的位姿参数,且金字塔图像分辨率越低,迭代次数越多。例如,对于1/4分辨率的金字塔图像而言,可以迭代4次,对于1/2分辨率的金字塔图像而言,可以迭代2次,对于原始分辨率的金字塔图像(即拍摄图像本身)而言,可以迭代1次。具体的迭代过程,可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S807:判断当前拍摄图像是否为最后一帧金字塔图像,若否,则执行步骤S808,否则执行步骤S810。
在当前拍摄图像为最后一帧金字塔图像的情况下,即可将最后一帧金字塔图像中目标物体的位姿参数,作为拍摄图像中目标物体最终的位姿参数,否则可以继续进行迭代过程。
步骤S808:将本次执行得到的位姿参数作为参考位姿。
在当前拍摄图像不为最后一帧金字塔图像的情况下,可以将本次执行得到的位姿参数作为参考位姿,并对下一帧金字塔图像进行执行迭代操作。
步骤S809:重新执行步骤S802以及后续步骤。
即在当前拍摄图像不为最后一帧金字塔图像的情况下,对下一帧金字塔图像进行执行迭代操作。
步骤S810:将本次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数。
在当前拍摄图像为最后一帧金字塔图像的情况下,可以结束迭代操作,得到拍摄图像中目标物体最终的位姿参数。
上述方案,投影轮廓是利用目标物体的参考位姿投影得到的,从而在投影采样之前,先对拍摄图像进行降采样,以得到若干种分辨率的金字塔图像,并按照分辨率由小到大,依次选择金字塔图像作为当前拍摄图像,以及对当前拍摄图像执行上述获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤,且本次执行所采用的参考位姿为上一次执行得到的位姿参数,最后一次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数,从而能够在位姿参数的获取过程中,由粗到细地进行位姿估计,进而能够有利于提高位姿参数的获取效率和精度。
请参阅图9,图9是本申请位姿获取装置90一实施例的框架示意图。位姿获取装置90包括:投影采样模块91、信息提取模块92、函数构建模块93和位姿求解模块94,投影采样模块91用于获取拍摄图像中位于搜索线段上的若干采样点;其中,搜索线段经过拍摄图像中目标物体的投影轮廓点,投影轮廓点位于目标物体的投影轮廓;信息提取模块92用于获取采样点的属性信息,以及获取采样点的参考权重;其中,属性信息表示采样点属于目标物体的可能性;函数构建模块93用于基于采样点的属性信息和参考权重,构建目标函数;位姿求解模块94用于基于目标函数,得到拍摄图像中目标物体的位姿参数。
在一些公开实施例中,信息提取模块92包括目标点搜索子模块,用于在搜索线段上的若干采样点中搜索目标点,得到搜索结果;其中,目标点用于表示目标物体的物体轮廓点;信息提取模块92包括权重信息获取子模块,用于基于搜索结果,分别获取搜索线段上的若干采样点的权重信息;其中,权重信息包括第一权重和第二权重中至少一者,第一权重与目标点的预测概率值相关,预测概率值表示采样点作为物体轮廓点的可能性,且第二权重与目标点至采样点的第一距离相关;信息提取模块92包括参考权重获取子模块,用于基于权重信息,得到采样点的参考权重。
在一些公开实施例中,属性信息包括:采样点属于目标物体的第一概率值;目标点搜索子模块包括当前点获取单元,用于对于每条搜索线段,将若干采样点分别作为当前点,目标点搜索子模块包括候选点获取单元,用于在当前点的参考概率差值满足第一条件的情况下,将当前点作为候选点,目标点搜索子模块包括目标点获取单元,用于选取预测代价值满足第二条件的候选点作为目标点;其中,当前点的参考概率差值为与当前点具有预设位置关系的两个采样点的第一概率值之差,预测代价值包括第一代价值和第二代价值中至少一者,第一代价值与候选点的预测概率值相关,第二代价值与候选点至搜索线段上的投影轮廓点的第二距离相关。
在一些公开实施例中,目标点搜索子模块包括候选点过滤单元,用于过滤预测概率值满足第三条件的候选点。
在一些公开实施例中,预设位置关系为与当前点相邻;和/或,第二条件包括预测代价值最小;和/或,第一代价值与候选点的预测概率值负相关,且第二代价值与第二距离正相关。
在一些公开实施例中,权重信息包括第一权重;权重信息获取子模块包括第一确定单元,用于在搜索结果包括搜索到目标点的情况下,基于目标点的预测概率值确定采样点的第一权重,其中,第一权重与目标点的预测概率值正相关;权重信息获取子模块包括第二确定单元,用于在搜索结果包括未搜索到目标点的情况下,将第一权重确定为第一数值;其中,第一数值为在搜索结果包括搜索到目标点的情况下第一权重的下限值。
在一些公开实施例中,权重信息包括第二权重;权重信息获取子模块包括第三确定单元,用于在搜索结果包括搜索到目标点的情况下,基于采样点对应的第一距离确定采样点的第二权重,其中,第二权重与第一距离负相关;权重信息获取子模块包括第四确定单元,用于在搜索结果包括未搜索到目标点的情况下,将第二权重确定为第二数值;其中,第二数值为在搜索结果包括搜索到目标点的情况下第二权重的上限值。
在一些公开实施例中,权重信息包括第一权重和第二权重,且第一权重、第二权重均与参考权重正相关。
在一些公开实施例中,属性信息包括:采样点属于目标物体的第一概率值和第一可信度,以及采样点不属于目标物体的第二概率值和第二可信度;函数构建模块93包括联合概率计算子模块,用于获取第一可信度与第一概率值的第一积以及第二可信度与第二概率值的第二积,并基于第一积和第二积之和,得到采样点的联合概率值;函数构建模块93包括联合概率加权子模块,用于基于各个采样点的参考权重对联合概率值的加权结果,得到目标函数。
在一些公开实施例中,第一可信度与第二可信度为负相关关系,采样点的第一可信度与相应投影轮廓点至采样点的有向欧氏距离为负相关关系,相应投影轮廓点与采样点位于相同搜索线段上。
在一些公开实施例中,拍摄图像包括基于投影轮廓划分的前景区域和背景区域;函数构建模块93包括第一过滤子模块,用于在采样点的有向欧氏距离大于第一距离值,且采样点属于前景区域的情况下,过滤采样点;函数构建模块93包括第二过滤子模块,用于在采样点的有向欧氏距离小于第二距离值,且采样点属于背景区域的情况下,过滤采样点。
在一些公开实施例中,投影轮廓是利用目标物体的参考位姿投影得到的;位姿获取装置90包括降采样模块,用于对拍摄图像进行降采样,得到若干种分辨率的金字塔图像;位姿获取装置90包括图像选择模块,用于按照分辨率由小到大,依次选择金字塔图像作为当前拍摄图像,投影采样模块91、信息提取模块92、函数构建模块93和位姿求解模块94用于对当前拍摄图像执行获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤;其中,本次执行所采用的参考位姿为上一次执行得到的位姿参数,最后一次执行得到的位姿参数作为拍摄图像中目标物体最终的位姿参数。
在一些公开实施例中,投影轮廓是利用目标物体的参考位姿投影得到的,参考位姿是参考图像中目标物体的位姿参数,且参考图像是在拍摄图像之前拍摄得到的;位姿求解模块94包括函数求解子模块,用于对目标函数进行求解,得到参考位姿的更新参数;位姿求解模块94包括位姿优化子模块,用于利用更新参数对参考位姿进行优化,得到位姿参数。
请参阅图10,图10是本申请电子设备100一实施例的框架示意图。电子设备100包括相互耦接的存储器101和处理器102,处理器102用于执行存储器101中存储的程序指令,以实现上述任一位姿获取方法实施例的步骤。在一个具体的实施场景中,电子设备100可以包括但不限于:微型计算机、服务器,此外,电子设备100还可以包括笔记本电脑、平板电脑等移动设备,在此不做限定。
具体而言,处理器102用于控制其自身以及存储器101以实现上述任一位姿获取方法实施例的步骤。处理器102还可以称为CPU(Central Processing Unit,中央处理单元)。处理器102可能是一种集成电路芯片,具有信号的处理能力。处理器102还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器102可以由集成电路芯片共同实现。
上述方案,能够有利于尽可能地缓解干扰因素对于位姿求解的影响,有利于提高位姿参数的精度。
请参阅图11,图11为本申请计算机可读存储介质110一实施例的框架示意图。计算机可读存储介质110存储有能够被处理器运行的程序指令111,程序指令111用于实现上述任一位姿获取方法实施例的步骤。
上述方案,能够有利于尽可能地缓解干扰因素对于位姿求解的影响,有利于提高位姿参数的精度。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (16)

1.一种位姿获取方法,其特征在于,包括:
获取拍摄图像中位于搜索线段上的若干采样点;其中,所述搜索线段经过所述拍摄图像中目标物体的投影轮廓点,所述投影轮廓点位于所述目标物体的投影轮廓;
获取所述采样点的属性信息,以及获取所述采样点的参考权重;其中,所述属性信息表示所述采样点属于所述目标物体的可能性;
基于所述采样点的所述属性信息和所述参考权重,构建目标函数;
基于所述目标函数,得到所述拍摄图像中所述目标物体的位姿参数。
2.根据权利要求1所述的方法,其特征在于,所述获取所述采样点的参考权重,包括:
在所述搜索线段上的所述若干采样点中搜索目标点,得到搜索结果;其中,所述目标点用于表示所述目标物体的物体轮廓点;
基于所述搜索结果,分别获取所述搜索线段上的所述若干采样点的权重信息;其中,所述权重信息包括第一权重和第二权重中至少一者,所述第一权重与所述目标点的预测概率值相关,所述预测概率值表示所述采样点作为所述物体轮廓点的可能性,且所述第二权重与所述目标点至所述采样点的第一距离相关;
基于所述权重信息,得到所述采样点的参考权重。
3.根据权利要求2所述的方法,其特征在于,所述属性信息包括:所述采样点属于所述目标物体的第一概率值;所述在所述搜索线段上的所述若干采样点中搜索目标点,得到搜索结果,包括:
对于每条所述搜索线段,将所述若干采样点分别作为当前点,在所述当前点的参考概率差值满足第一条件的情况下,将所述当前点作为候选点,并选取预测代价值满足第二条件的候选点作为所述目标点;
其中,所述当前点的参考概率差值为与所述当前点具有预设位置关系的两个所述采样点的所述第一概率值之差,所述预测代价值包括第一代价值和第二代价值中至少一者,所述第一代价值与所述候选点的预测概率值相关,所述第二代价值与所述候选点至所述搜索线段上的投影轮廓点的第二距离相关。
4.根据权利要求3所述的方法,其特征在于,在所述选取预测代价值满足第二条件的候选点作为所述目标点之前,所述方法还包括:
过滤所述预测概率值满足第三条件的候选点。
5.根据权利要求3所述的方法,其特征在于,所述预设位置关系为与所述当前点相邻;
和/或,所述第二条件包括所述预测代价值最小;
和/或,所述第一代价值与所述候选点的预测概率值负相关,且所述第二代价值与所述第二距离正相关。
6.根据权利要求2所述的方法,其特征在于,所述权重信息包括所述第一权重;所述基于所述搜索结果,分别获取所述搜索线段上的所述若干采样点的权重信息,包括:
在所述搜索结果包括搜索到所述目标点的情况下,基于所述目标点的预测概率值确定所述采样点的第一权重,其中,所述第一权重与所述目标点的预测概率值正相关;
和/或,在所述搜索结果包括未搜索到所述目标点的情况下,将所述第一权重确定为第一数值;其中,所述第一数值为在所述搜索结果包括搜索到所述目标点的情况下所述第一权重的下限值。
7.根据权利要求2所述的方法,其特征在于,所述权重信息包括所述第二权重;所述基于所述搜索结果,分别获取所述搜索线段上的所述若干采样点的权重信息,包括:
在所述搜索结果包括搜索到所述目标点的情况下,基于所述采样点对应的所述第一距离确定所述采样点的第二权重,其中,所述第二权重与所述第一距离负相关;
和/或,在所述搜索结果包括未搜索到所述目标点的情况下,将所述第二权重确定为第二数值;其中,所述第二数值为在所述搜索结果包括搜索到所述目标点的情况下所述第二权重的上限值。
8.根据权利要求2至7任一项所述的方法,其特征在于,所述权重信息包括第一权重和第二权重,且所述第一权重、所述第二权重均与所述参考权重正相关。
9.根据权利要求1所述的方法,其特征在于,所述属性信息包括:所述采样点属于所述目标物体的第一概率值和第一可信度,以及所述采样点不属于所述目标物体的第二概率值和第二可信度;所述基于所述采样点的所述属性信息和所述参考权重,构建目标函数,包括:
获取所述第一可信度与所述第一概率值的第一积以及所述第二可信度与所述第二概率值的第二积,并基于所述第一积和第二积之和,得到所述采样点的联合概率值;
基于各个所述采样点的参考权重对所述联合概率值的加权结果,得到目标函数。
10.根据权利要求9所述的方法,其特征在于,所述第一可信度与所述第二可信度为负相关关系,所述采样点的第一可信度与相应所述投影轮廓点至所述采样点的有向欧氏距离为负相关关系,相应所述投影轮廓点与所述采样点位于相同所述搜索线段上。
11.根据权利要求10所述的方法,其特征在于,所述拍摄图像包括基于所述投影轮廓划分的前景区域和背景区域;在所述获取所述第一可信度与所述第一概率值的第一积以及所述第二可信度与所述第二概率值的第二积之前,所述方法还包括:
在所述采样点的所述有向欧氏距离大于第一距离值,且所述采样点属于所述前景区域的情况下,过滤所述采样点;
和/或,在所述采样点的所述有向欧氏距离小于第二距离值,且所述采样点属于所述背景区域的情况下,过滤所述采样点。
12.根据权利要求1至11任一项所述的方法,其特征在于,所述投影轮廓是利用所述目标物体的参考位姿投影得到的;在所述获取拍摄图像中位于搜索线段上的若干采样点之前,所述方法包括:
对所述拍摄图像进行降采样,得到若干种分辨率的金字塔图像;
按照所述分辨率由小到大,依次选择所述金字塔图像作为当前所述拍摄图像,并对当前所述拍摄图像执行所述获取拍摄图像中位于搜索线段上的若干采样点的步骤以及后续步骤;其中,本次执行所采用的所述参考位姿为上一次执行得到的所述位姿参数,最后一次执行得到的所述位姿参数作为所述拍摄图像中所述目标物体最终的所述位姿参数。
13.根据权利要求1至12任一项所述的方法,其特征在于,所述投影轮廓是利用所述目标物体的参考位姿投影得到的,所述参考位姿是参考图像中所述目标物体的位姿参数,且所述参考图像是在所述拍摄图像之前拍摄得到的;所述基于所述目标函数,得到所述拍摄图像中所述目标物体的位姿参数,包括:
对所述目标函数进行求解,得到所述参考位姿的更新参数;
利用所述更新参数对所述参考位姿进行优化,得到所述位姿参数。
14.一种位姿获取装置,其特征在于,包括:
投影采样模块,用于获取拍摄图像中位于搜索线段上的若干采样点;其中,所述搜索线段经过所述拍摄图像中目标物体的投影轮廓点,所述投影轮廓点位于所述目标物体的投影轮廓;
信息提取模块,用于获取所述采样点的属性信息,以及获取所述采样点的参考权重;其中,所述属性信息表示所述采样点属于所述目标物体的可能性;
函数构建模块,用于基于所述采样点的所述属性信息和所述参考权重,构建目标函数;
位姿求解模块,用于基于所述目标函数,得到所述拍摄图像中所述目标物体的位姿参数。
15.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至13任一项所述的位姿获取方法。
16.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至13任一项所述的位姿获取方法。
CN202110626207.XA 2021-06-04 2021-06-04 位姿获取方法及装置和电子设备、存储介质 Active CN113407027B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202110626207.XA CN113407027B (zh) 2021-06-04 2021-06-04 位姿获取方法及装置和电子设备、存储介质
JP2023525620A JP2023549069A (ja) 2021-06-04 2021-10-29 位置姿勢取得方法及びその装置、電子機器、記憶媒体並びにプログラム
PCT/CN2021/127307 WO2022252487A1 (zh) 2021-06-04 2021-10-29 位姿获取方法及装置、电子设备、存储介质和程序
KR1020237014463A KR20230073331A (ko) 2021-06-04 2021-10-29 포즈 획득 방법 및 장치, 전자 기기, 저장 매체 및 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110626207.XA CN113407027B (zh) 2021-06-04 2021-06-04 位姿获取方法及装置和电子设备、存储介质

Publications (2)

Publication Number Publication Date
CN113407027A true CN113407027A (zh) 2021-09-17
CN113407027B CN113407027B (zh) 2023-03-03

Family

ID=77676442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110626207.XA Active CN113407027B (zh) 2021-06-04 2021-06-04 位姿获取方法及装置和电子设备、存储介质

Country Status (4)

Country Link
JP (1) JP2023549069A (zh)
KR (1) KR20230073331A (zh)
CN (1) CN113407027B (zh)
WO (1) WO2022252487A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114937125A (zh) * 2022-07-25 2022-08-23 深圳大学 可重建度量信息预测方法、装置、计算机设备和存储介质
WO2022252487A1 (zh) * 2021-06-04 2022-12-08 浙江商汤科技开发有限公司 位姿获取方法及装置、电子设备、存储介质和程序

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542945B (zh) * 2023-05-11 2024-01-05 哈尔滨工业大学重庆研究院 晶圆图像分割处理方法、电子设备及存储介质
CN116684748B (zh) * 2023-08-01 2023-09-26 世优(北京)科技有限公司 摄影构图框的生成方法、装置及摄影设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015096806A1 (zh) * 2013-12-29 2015-07-02 刘进 智能机姿态测定、全景影像生成及目标识别方法
US20180137651A1 (en) * 2016-11-16 2018-05-17 Seiko Epson Corporation Hybrid corner and edge-based tracking
CN109712172A (zh) * 2018-12-28 2019-05-03 哈尔滨工业大学 一种初始位姿测量结合目标追踪的位姿测量方法
CN110689573A (zh) * 2019-09-06 2020-01-14 重庆邮电大学 一种基于边缘模型的增强现实无标识跟踪注册方法及装置
CN111369571A (zh) * 2020-02-27 2020-07-03 北京百度网讯科技有限公司 三维物体位姿准确性判断方法、装置及电子设备
CN112614161A (zh) * 2020-12-28 2021-04-06 之江实验室 一种基于边缘置信度的三维物体跟踪方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407893B (zh) * 2016-08-29 2019-11-22 东软集团股份有限公司 一种检测车道线的方法、装置和设备
CN107704821B (zh) * 2017-09-29 2020-06-09 河北工业大学 一种弯道的车辆位姿计算方法
CN110706285A (zh) * 2019-10-08 2020-01-17 中国人民解放军陆军工程大学 基于cad模型的物体位姿预测方法
CN113407027B (zh) * 2021-06-04 2023-03-03 浙江商汤科技开发有限公司 位姿获取方法及装置和电子设备、存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015096806A1 (zh) * 2013-12-29 2015-07-02 刘进 智能机姿态测定、全景影像生成及目标识别方法
US20180137651A1 (en) * 2016-11-16 2018-05-17 Seiko Epson Corporation Hybrid corner and edge-based tracking
CN109712172A (zh) * 2018-12-28 2019-05-03 哈尔滨工业大学 一种初始位姿测量结合目标追踪的位姿测量方法
CN110689573A (zh) * 2019-09-06 2020-01-14 重庆邮电大学 一种基于边缘模型的增强现实无标识跟踪注册方法及装置
CN111369571A (zh) * 2020-02-27 2020-07-03 北京百度网讯科技有限公司 三维物体位姿准确性判断方法、装置及电子设备
CN112614161A (zh) * 2020-12-28 2021-04-06 之江实验室 一种基于边缘置信度的三维物体跟踪方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022252487A1 (zh) * 2021-06-04 2022-12-08 浙江商汤科技开发有限公司 位姿获取方法及装置、电子设备、存储介质和程序
CN114937125A (zh) * 2022-07-25 2022-08-23 深圳大学 可重建度量信息预测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
WO2022252487A1 (zh) 2022-12-08
CN113407027B (zh) 2023-03-03
KR20230073331A (ko) 2023-05-25
JP2023549069A (ja) 2023-11-22

Similar Documents

Publication Publication Date Title
CN113407027B (zh) 位姿获取方法及装置和电子设备、存储介质
CN109544677B (zh) 基于深度图像关键帧的室内场景主结构重建方法及系统
CN110363817B (zh) 目标位姿估计方法、电子设备和介质
CN111328396A (zh) 用于图像中的对象的姿态估计和模型检索
US9417700B2 (en) Gesture recognition systems and related methods
CN109521879B (zh) 交互式投影控制方法、装置、存储介质及电子设备
CN111667535B (zh) 一种针对遮挡场景下的六自由度位姿估计方法
CN111062263B (zh) 手部姿态估计的方法、设备、计算机设备和存储介质
JP2022547288A (ja) 画像処理を使用したシーン表示
CN112562000A (zh) 基于特征点检测和误匹配筛选的机器人视觉定位方法
CN113269689B (zh) 一种基于法向量和高斯权重约束的深度图像补全方法及系统
CN116740126A (zh) 目标跟踪方法、高速相机及存储介质
JP2024508024A (ja) 画像データの処理方法及び装置
CN113240656B (zh) 视觉定位方法及相关装置、设备
CN114066814A (zh) 一种ar设备的手势3d关键点检测方法、电子设备
KR101107735B1 (ko) 카메라 포즈 결정 방법
CN116363205A (zh) 基于深度学习的空间目标位姿解算方法及计算机程序产品
KR20230083212A (ko) 객체 자세 추정 장치 및 방법
EP4374328A1 (en) Focused computer detection of objects in images
Dadgostar et al. Gesture-based human–machine interfaces: a novel approach for robust hand and face tracking
CN114612545A (zh) 图像分析方法及相关模型的训练方法、装置、设备和介质
CN113570535A (zh) 视觉定位方法及相关装置、设备
CN115578461B (zh) 基于双向rgb-d特征融合的物体姿态估计方法及装置
CN113570667B (zh) 视觉惯导补偿方法、装置及存储介质
Gollapudi et al. Motion Analysis and Object Tracking

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40051278

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant