WO2023025175A1

WO2023025175A1 - 用于空间定位的方法及装置

Info

Publication number: WO2023025175A1
Application number: PCT/CN2022/114388
Authority: WO
Inventors: 吕宪伟
Original assignee: 优奈柯恩(北京)科技有限公司
Priority date: 2021-08-25
Filing date: 2022-08-24
Publication date: 2023-03-02
Also published as: CN113658278A

Abstract

本公开提供了一种用于空间定位的方法及装置。在该方法中，采集第二设备的第一图像，第一图像包括第二设备的2D点和2D点对应的描述子；利用第二设备的3D模型上的3D点对应的描述子和2D点对应的描述子对第二设备的2D点和第二设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系，第二设备的3D模型包括3D点和3D点对应的描述子；根据第二设备在世界坐标系中的定位以及第二设备与3D模型之间的第二对应关系，确定第二设备的3D模型在世界坐标系中的定位；以及根据第二设备的3D模型在世界坐标系中的定位以及第一对应关系，确定第一设备在世界坐标系中的位姿。

Description

用于空间定位的方法及装置

技术领域

本公开涉及信息技术领域，具体地，涉及用于空间定位的方法及装置。

背景技术

随着计算机和通信等各种技术的快速发展，增强现实(Augmented Reality，AR)等技术也随之迅速发展。具体而言，在AR技术中，可以利用计算机技术来将虚拟信息应用到真实世界，也就是将真实场景和虚拟图像(例如，虚拟物体、虚拟场景等等)实时地叠加在同一画面下，使得人眼同时观看到真实场景和虚拟图像的混合图像，从而达到增强现实的效果。

用户可以通过交互设备与AR场景中的虚拟对象进行交互，以产生期望的效果。例如，用户可以移动交互设备，而交互设备的空间移动可以被转化为AR场景中的虚拟对象的移动，从而达到控制虚拟对象的目的。因此，在AR场景的交互过程中需要确定交互设备的空间定位，如何精确地确定交互设备在空间中的定位成为亟待解决的问题。

发明内容

鉴于上述，本公开提供了一种用于空间定位的方法及装置。

根据本公开的一个方面，提供了一种用于空间定位的方法，所述方法由第一设备执行，所述方法包括：采集第二设备的设备图像，所述设备图像包括所述第二设备的2D点和2D点对应的描述子；利用所述第二设备的3D模型上的3D点对应的描述子和所述2D点对应的描述子对所述第二设备的2D点和所述第二设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的所述第二设备的2D点与所述第二设备的3D模型的3D点之间的第一对应关系，所述第二设备的3D模型包括3D点和3D点对应的描述子；根据所述第二设备在世界坐标系中的定位以及所述第二设备与所述3D模型之间的第二对应关系，确定所述第二设备的3D模型在所述世界坐标系中的定位；以及根据所述第二设备的3D模型在所述世界坐标系中的定位以及所述第一对应关系，确定所述第一设备在所述世界坐标系中的位姿。

根据本公开的另一方面，还提供一种电子设备，包括：至少一个处理器；以及存储器，所述存储器存储指令，当所述指令被所述至少一个处理器执行时，使得所述至少一个处理器执行如上所述的用于空间定位的方法。

根据本公开的另一方面，还提供一种非易失性机器可读存储介质，其存储有可执行指令，所述指令当被执行时使得所述机器执行如上所述的用于空间定位的方法。

附图说明

通过参照下面的附图，可以实现对于本公开内容的本质和优点的进一步理解。在附图中，类似组件或特征可以具有相同的附图标记。

图1示出了根据本公开的空间定位方法的应用场景的一个示例的示意图。

图2示出了根据本公开的空间定位方法的一个示例的流程图。

图3示出了根据本公开的第二设备的3D模型的一个示例的示意图。

图4示出了根据本公开的第一图像中的2D点与3D模型的3D点之间的映射关系的一个示例的示意图。

图5示出了根据本公开的空间定位方法的另一个示例的流程图。

图6示出了根据本公开的第二设备、3D模型以及世界坐标系三者之间的一个示例的关系示意图。

图7示出了根据本公开的空间定位方法的另一个示例的流程图。

图8示出了根据本公开的空间定位装置的一个示例的方框图。

图9示出了根据本公开的空间定位装置的另一个示例的方框图。

图10示出了根据本公开的空间定位装置的另一个示例的方框图。

图11示出了本公开的实施例的用于实现空间定位方法的电子设备的方框图。

具体实施方式

以下将参考示例实施方式讨论本文描述的主题。应该理解，讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题，并非是对本公开中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下，对所讨论的元素的功能和排列进行改变。各个示例可以根据需要，省略、替代或者添加各种过程或组件。另外，相对一些示例所描述的特征在其它例子中也可以进行组合。

如本文中使用的，术语“包括”及其变型表示开放的术语，含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义，无论是明确的还是隐含的。除非上下文中明确地指明，否则一个术语的定义在整个说明书中是一致的。

在目前增强现实(Augmented Reality，AR)技术的应用中，可以是终端设备(比如，手机、个人电脑、平板电脑等移动终端)与AR眼镜连接，终端设备可以作为手柄用于控制通过AR眼镜显示的虚拟对象。终端设备在空间中移动，以对AR眼镜中显示的虚拟对象进行相应的操作，例如位置移动、姿态变化、界面切换、选择、取消、进入、退出等等。基于此，终端设备在空间中的定位在AR场景中很重要，直接影响了与AR场景中的虚拟对象的交互。

目前，终端设备通过内置的IMU(Inertial Measurement Unit)来进行姿态解算。一般用于消费类产品的IMU只能实现3DOF(degree of freedom)的功能，3DOF仅包括偏航、俯仰和侧倾。基于此，终端设备只能通过偏航、俯仰和侧倾三个自由度来进行姿态解算。偏航、俯仰和侧倾三个自由度有一定的局限性，如果仅使用该IMU进行6DOF的空间定位，则导致终端设备的空间定位不准，进而影响与AR场景中的虚拟对象的交互。

鉴于上述，本公开提供了一种用于空间定位的方法及装置。在该方法中，采集第二设备的第一图像，第一图像可以包括第二设备的2D点和2D点对应的描述子。可以利用第二设备的3D模型上的3D点对应的描述子和2D点对应的描述子对第二设备的2D点和第二设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系。第二设备的3D模型可以包括3D点和3D点对应的描述子。根据第二设备在世界坐标系中的定位以及第二设备与3D模型之间的第二对应关系，可以确定第二设备的3D模型在世界坐标系中的定位。可以根据第二设备的3D模型在世界坐标系中的定位以及第一对应关系，确定第一设备在世界坐标系中的位姿。通过本公开的技术方案，提高了第一设备的空间定位的精确度。例如，上述“第一图像”也可以称之为“设备图像”。

本公开还提供了另一种用于定位第一设备的方法。在该方法中，通过第一设备采集第二设备的设备图像，设备图像包括第二设备的2D点和2D点对应的描述子。利用第二设备的3D模型上的3D点对应的描述子和2D点对应的描述子对第二设备的2D点和第二设备的3D模型上的3D点进行特征点匹配，以得到第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系。根据第一对应关系计算第一设备在第二设备的3D模型坐标系中的第一位姿。根据第二设备在世界坐标系中的位姿以及第二设备与3D模型之间的第二对应关系，确定第二设备的3D模型在世界坐标系中的位姿。根据第二设备的3D模型在世界坐标系中的位姿以及第一位姿，确定第一设备在世界坐标系中的第二位姿。

本公开还提供了一种用于确定手持设备的位姿的方法，手持设备与头戴式设备通信连接，手持设备被配置为向头戴式设备提供待显示的虚拟对象和控制通过头戴式设备显示的虚拟对象。在该方法中，通过手持设备采集头戴式设备的第一图像，第一图像包括头戴式设备的2D点和2D点对应的描述子。利用头戴式设备的3D模型上的3D点对应的描述子和2D点对应的描述子对头戴式设备的2D点和头戴式设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的头戴式设备的2D点与头戴式设备的3D模型的3D点之间的第一对应关系，头戴式设备的3D模型包括3D点和3D点对应的描述子。根据头戴式设备在世界坐标系中的位姿以及头戴式设备与3D模型之间的第二对应关系，确定头戴式设备的3D模型在世界坐标系中的位姿。根据头戴式设备的3D模型在世界坐标系中的位姿以及第一对应关系，确定第一设备在世界坐标系中的位姿。

如图1所示，空间定位方法的应用场景中至少包括有第二设备和第一设备。第二设备与第一设备之间可以通信连接。

第二设备能够确定自身在全局坐标系中的空间定位，该空间定位可以是位置，还可以是位姿。第二设备可以通过SLAM(simultaneous localization and mapping，同步定位与建图)、动作捕捉系统、外向内追踪技术(outside-in tracking)等方式来获取空间定位。在第二设备具备SLAM功能时，第二设备可以至少包括一个摄像头和至少一个IMU。在一个示例中，第二设备可以包括头戴式设备，头戴式设备可以用于显示第一设备提供的虚拟对象。例如，第二设备可以包括智能眼镜，比如，AR眼镜、虚拟现实(virtual reality,VR)眼镜等。

可以理解的是，本文中的术语“位置”可以利用空间直角坐标系表示，而本文中的术语“位姿”描述的是物体的位置和姿态，例如用欧拉角、四元数等来表示姿态。

第一设备可以是具有用于采集图像的摄像装置的终端设备，第一设备可以包括手持设备，比如，手机，或个人电脑、平板电脑等。手持设备可以用于控制通过头戴式设备显示的虚拟对象并包括用于采集第一图像的摄像设备。

本公开提供的空间定位方法的执行主体可以是第二设备，还可以是第一设备，也可以是第二设备和第一设备共同来执行。例如，在手机连接AR眼镜的应用场景中，可以由手机来执行空间定位方法，这样可以节省AR眼镜的算力，降低AR眼镜的功耗。下面以第二设备是AR眼镜、第一设备是手机为例进行说明。

图2示出了根据本公开的空间定位方法的一个示例200的流程图。图2所示的空间定位方法可以由第一设备执行。

如图2所示，在210，可以获取第二设备和第二设备的3D模型之间的第二对应关系。

在本公开中，3D模型可以包括3D点和3D点对应的描述子。描述子是各个特征点的描述信息，描述子可以用于区分各个特征点，从而根据各个描述子可以确定对应的特征点。在本公开中，描述子可以是3D描述子，还可以是2D描述子。

第二设备的3D模型可以由各个3D点构成，所有3D点构成的3D模型可以用来表征第二设备。图3示出了根据本公开的第二设备的3D模型的一个示例的示意图。例如，第二设备是AR眼镜，所形成的3D模型如图3所示，用于表征该AR眼镜。

基于3D模型可以表征第二设备，3D模型上的各个3D点与第二设备上的各个特征点一一对应，针对一一对应的3D点和特征点，该3D点在3D模型上的位置与该特征点在第二设备上的位置相同。例如，第二设备是AR眼镜，一个特征点位于AR眼镜的鼻梁正中间，一个3D点位于3D模型所表征的AR眼镜的鼻梁正中间，则AR眼镜上的该特征点与3D模型上的该3D点一一对应。

第二对应关系可以用于表征第二设备与3D模型之间的映射关系。例如，一一对应的3D点和特征点之间可以构成第二对应关系。所确定出的第二对应关系可以包括所有或部分AR眼镜上的特征点与3D模型上的3D点的第二对应关系。

在本公开中，第二设备的3D模型可以对应有3D模型坐标系，3D模型坐标系可以用于确定3D模型上的各个3D点的相对位置。3D模型坐标系可以是基于3D模型构建的，3D模型坐标系可以是空间直角坐标系。

3D模型坐标系可以以第二设备为参照物所创建的，可以将第二设备上的一个固定位置点(以下称为：第一位置点)作为3D模型坐标系中的一个位置点(以下称为：第二位置点)，然后基于两个位置点的对应关系来创建3D模型坐标系。在一个示例中，可以将3D模型坐标系中的坐标原点确定为第二位置点。

在一个示例中，可以将第二设备中的传感器确定为第一位置点。传感器可以是第二设备用于执行SLAM的传感器，例如，IMU、摄像头等。在另一个示例中，可以将第二设备上与传感器有固定相对位置关系的其他位置点确定为第一位置点。

在本公开的一个示例中，第二设备的3D模型可以是预先创建的，预先创建3D模型的设备可以是第二设备以外的其他设备。

在本公开的另一个示例中，第二设备的3D模型可以是由该第二设备创建，第二设备可以实时创建3D模型。第二设备在需要创建3D模型时，可以先在第二设备上确定一个固定位置点作为3D模型坐标系中的一个位置点，例如，可以将第二设备上的摄像头作为3D模型坐标系中的坐标原点。然后，基于所确定的位置点来建立3D模型坐标系中，再利用第二设备上的传感器在3D模型坐标系中创建第二设备的3D模型。

创建完成的3D模型可以预存在第二设备中，也可以预存在第一设备中，还可以预存在能与第二设备和/或第一设备通信联系的其它设备、服务器或云中。在需要使用第二设备的3D模型时，可以从相应的存储中获取该3D模型。

可以理解的，在210获取第二设备和第二设备的3D模型之间的第二对应关系的步骤可以不是执行本申请方法的固定步骤。

在获取第二对应关系的一个示例中，第二对应关系可以是预先创建的，创建完成的第二对应关系可以预存在第二设备中，也可以预存在第一设备中，还可以预存在能与第二设备和/或第一设备通信联系的其它设备、服务器或云中。在该示例中，可以从相应的存储中直接获取第二对应关系。

在获取第二对应关系的另一个示例中，第二对应关系可以是实时创建的。在该示例中，在需要获取第二对应关系时，可以先确定第二设备上的特征点以及3D模型上的3D点，然后建立第二设备上的特征点与3D模型上的3D点之间的对应关系，该对应关系即为第二对应关系。

在220，可以采集第二设备的第一图像。

在本公开中，通过第一设备采集到的第二设备的第一图像中可以包括完整的第二设备，还可以包括第二设备的一部分。第一图像可以包括第二设备的2D点和2D点对应的描述子，第一图像的各个图像点可以用2D点和该2D点对应的描述子来表示，基于此，第一图像中的第二设备可以由多个2D点组成。

在本公开中，第二设备的第一图像与第二设备的3D模型都用于表示同一个物体(即，第二设备)，则第一图像中的第二设备上的2D点可以与3D模型上的3D点对应。对应的2D点和3D点表示第二设备上的同一位置点。

在本公开中，第一设备可以仅拍摄一张图像，即第一图像，还可以连续拍摄，第一图像是连续多帧图像中的其中一帧图像。在第一设备进行连续拍摄时，第一图像可以是第一帧图像，还可以是第一帧图像之后所生成的帧图像，此时，在生成第一图像之前存在先前帧图像。例如，第一图像是第五帧图像，则先前帧图像包括第一帧至第四帧图像，第四帧图像是第一图像的前一帧图像。

在本公开的一个示例中，在第一图像不是第一帧图像时，第一图像的先前帧图像与第一图像可以是连续帧图像，各个先前帧图像中也包括有第二设备。连续帧图像可以连续记录第二设备的位置变化，第二设备的位置变化在连续帧图像中连续变化。基于此，可以根据第一图像的先前帧图像中第二设备的位置在第一图像中进行搜索，以在第一图像中确定第二设备的2D点的当前位置。

在该示例中，所使用的先前帧图像可以是第一图像的前一帧图像，还可以包括多张连续的先前帧图像，该多张先前帧图像与第一图像可以是连续帧图像。可以确定先前帧图像中第二设备的位置。在使用的先前帧图像包括有多帧图像时，先前帧图像中的每帧图像均可以确定出相应的第二设备的位置。下面以一张先前帧图像为例进行说明。

可以根据第一设备的预定移动速度和先前帧图像中第二设备的位置，确定第一设备的预估移动范围。第一设备的预定移动速度可以由第一设备中的IMU来获取。

在通过第一设备的IMU确定第一设备的预定移动速度后，可以确定图像帧之间的时间间隔。将预定移动速度和时间间隔相乘可以得到第一设备从先前帧图像的时刻到第一图像的时刻的移动距离。该移动距离可以等效于第二设备在先前帧图像中的位置与在第一图像中的位置之间的距离。

根据第一设备的移动距离和先前帧图像中第二设备的位置可以确定第一设备的预估移动范围，可以以先前帧图像中第二设备的位置为圆点，以第一设备的移动距离为半径所确定的圆的范围即为第一设备的预估移动范围。

可以在第一图像中的预估移动范围内进行搜索，以在第一图像中确定第二设备的2D点的当前位置。例如，可以确定第二设备在先前帧图像中的位置，以及该位置在第一图像中的相对位置。例如，在先前帧图像中，第二设备位于正中间位置，则先前帧图像中的第二设备在第一图像中的相对位置也是正中间位置。然后在第一图像中以所确定的相对位置为中心的预估移动范围内进行搜索，以在第一图像中确定第二设备的2D点的当前位置。

在该示例中，第一图像中的预估移动范围小于整个第一图像的搜索范围，缩小了搜索的范围，从而减少了数据处理量，进而提高了从第一图像中确定第二设备的2D点的效率。

在一个示例中，可以根据第一设备的预定移动速度、移动方向和先前帧图像中第二设备的位置，确定第一设备的预估移动范围。

在该示例中，第一设备的移动方向可以由第一设备上的IMU来获取。第一设备的移动方向是在空间中移动方向，第一设备的移动方向与第二设备在第一设备采集的图像上的移动方向相反。例如，第一设备在空间中向上移动，则第二设备在第一设备采集的图像上向下移动，比如，第二设备在第一图像中的位置相对于在先前帧图像中的位置来说是向下移动的。

基于第一设备的移动方向，所确定的预估移动范围可以位于先前帧图像中第二设备的位置的与第一设备的移动方向相反的方向上。从而，进一步地减小了预估移动范围，进而进一步地缩小了搜索的范围。

在本公开的另一个示例中，可以根据第二设备在世界坐标系中的位置和第一设备在世界坐标系中的位置，确定第二设备和第一设备的相对位置，该相对位置是相对于世界坐标系来说的。

可以通过第二设备和第一设备的相对位置，计算第二设备的2D点在第一图像中的预估范围。例如，通过第二设备和第一设备的相对位置可以确定第二设备与第一设备之间的相对距离。根据第一设备的位姿和第一设备上的摄像头的位置，可以确定第一设备上的摄像头的拍摄朝向。根据摄像头的拍摄朝向和摄像头的视场角范围可以确定摄像头的拍摄范围，该拍摄范围可以是以摄像头为顶点的锥形区域范围。在摄像头的拍摄范围内，在与第一设备距离不同的位置处，该位置所属的与摄像头的镜头平面平行的平面内的平面拍摄范围不同，与第一设备距离越远，平面拍摄范围越大。根据第二设备与第一设备之间的相对距离以及摄像头的拍摄范围，可以确定第二设备所在的平面内的平面拍摄范围。可以根据所确定出的平面拍摄范围和第二设备在空间中的位置，确定出第二设备在平面拍摄范围内的位置，可以将第二设备在平面范围内的位置以及以该位置为中心的指定距离所确定的范围确定为第二设备的2D点在第一图像中的预估范围。

在确定出第二设备的2D点在第一图像中的预估范围后，可以在第一图像中的预估范围内进行搜索，以在第一图像中确定第二设备的2D点的当前位置。

通过上述两个示例，通过预估第二设备的2D点在第一图像中的范围，仅需在第一图像中的预估范围内进行搜索，缩小了局部搜索的范围，从而减少了数据处理量，进而提高了从第一图像中确定第二设备的2D点的效率。

回到图2，在230，利用第二设备的3D模型上的3D点的描述子和2D点对应的描述子对第二设备的2D点和第二设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系。

在本公开中，可以通过特征点匹配的方式来确定第一图像中的第二设备上的各个2D点所对应的3D模型上的3D点，2D点与对应的3D点之间构成第一对应关系。可以通过特征点匹配的方式确定出至少三个不共线的2D点与3D点的之间对应关系。

例如，第二设备为AR眼镜，AR眼镜上的三个不共线的位置点可以分别为：两个镜框的底部的位置点A和B，和鼻梁中间的位置点C。第一图像中的第二设备上的用于表示两个镜框的底部的位置点的2D点分别为A1和B1，用于表示鼻梁中间的位置点的2D点分别为C1。第二设备的3D模型上的用于表示两个镜框的底部的位置点的3D点分别为A2和B2，用于表示鼻梁中间的位置点的3D点分别为C2。则用于表示同一个镜框的底部的位置点的A1和A2可以构成一个第一对应关系，用于表示同一个镜框的都不的位置点的B1和B2可以构成另一个第一对应关系，用于表示鼻梁中间的位置点的C1和C2可以构成再一个第一对应关系。

图4示出了根据本公开的第一图像中的2D点与3D模型的3D点之间的映射关系的一个示例的示意图。如图4所示，F1、F2和F3是3D模型上的3D点，f1、f2和f3是第一图像上的第二设备的2D点，f1、f2和f3三者不共线。F1和f1表征第二设备上的同一个位置点，F1与f1相互映射成第一对应关系。F2和f2表征第二设备上的同一个位置点，F2和f2相互映射成第一对应关系。F3和f3表征第二设备上的同一个位置点，F3和f3相互映射成第一对应关系。

在一个示例中，可以根据特征点的描述子来进行特征点匹配。可以在第一图像中的第二设备上的各个2D点的描述子中确定与该描述子匹配的3D模型的3D点的描述子，相互匹配的两个描述子分别对应的2D点与3D点相互匹配，相互匹配的2D点和3D点构成第一对应关系。相同或相似的两个描述子可以认为是相互匹配的。在另一个示例中，特征点匹配的方式可以包括fast-orb、sift等。

需要说明的是，上述210与220和230的操作顺序可以不限定。可以按照图2的顺序执行；还可以先执行220和230的操作，再执行210的操作；还可以在执行220和230的操作的同时，执行210的操作。

在240，根据第二设备在世界坐标系中的定位以及第二设备与所述3D模型之间的第二对应关系，确定第二设备的3D模型在世界坐标系中的定位。

在本公开中，第二设备在世界坐标系中的定位可以是位姿，相应地，所确定的3D模型在世界坐标系中的定位是位姿。下面结合附图5进行详细说明。

第二设备在世界坐标系中的定位还可以是位置，相应地，所确定的3D模型在世界坐标系中的定位是位置。下面结合附图7进行详细说明。

可以理解的，第二设备可以通过自身的传感器(IMU、摄像头等)采集的数据实时计算第二设备在世界坐标系中的定位。

在250，根据第二设备的3D模型在世界坐标系中的定位以及第一对应关系，确定第一设备在世界坐标系中的位姿。

所确定出的第一设备的位姿可以是6DOF(degree of freedom)位姿，包括前后、上下、左右、俯仰、偏摆以及翻滚六个自由度。通过6DOF位姿来表示与第二设备交互的第一设备的空间定位，提高了第一设备的空间定位的精确度。

图5示出了根据本公开的空间定位方法的另一个示例500的流程图。图5所示的空间定位方法可以由第一设备执行。

如图5所示，在510，可以采集第二设备的第一图像，第一图像包括第二设备的2D点和2D点对应的描述子。

在520，利用第二设备的3D模型上的3D点对应的描述子和2D点对应的描述子对第二设备的2D点和第二设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系。

图5中的510和520的操作分别与上述图2中的220和230的操作相似，在此不再描述。

在530，根据第二设备在世界坐标系中的位姿以及第二对应关系，确定第二设备的3D模型在世界坐标系中的位姿。

在本公开中，第二设备可以具备SLAM计算能力，从而第二设备可以通过SLAM方式计算出第二设备的位姿。在一个示例中，第二设备可以实时地通过SLAM方式计算出第二设备的实时位姿，在需要第二设备的位姿信息时，可以直接从第二设备处获取。在另一个示例中，可以通过触发的方式来触发第二设备执行SLAM计算，在不触发时第二设备不执行SLAM计算。

第二对应关系是第二设备上的特征点与第二设备的3D模型上的3D点之间的对应关系，即，第二对应关系用于表示第二设备与3D模型之间的对应关系。在获取到第二设备在世界坐标系中的位姿后，基于第二对应关系以及第二设备在世界坐标系中的位姿，可以确定第二设备、3D模型以及世界坐标系三者之间的关系。如图6所示，示出了根据本公开的第二设备、3D模型以及世界坐标系三者之间的一个示例的关系示意图。如图6所示，L1表示第二设备在世界坐标系中的位姿，L2表示3D模型在世界坐标系中的位姿，则由L1和已知的第二对应关系，可以确定出L2。

需要说明的是，530的操作可以作为空间定位方法中的一个步骤来执行，即，在每次执行空间定位方法的过程中，执行530的操作。在另一个示例中，530的操作可以由其他设备来执行，例如，当本公开的空间定位方法由第一设备来执行时，530的操作可以由第二设备来执行，第一设备需要3D模型在世界坐标系中的位姿信息时，可以从第二设备获取。当本公开的空间定位方法由第二设备来执行时，530的操作可以由第一设备来执行，第二设备需要3D模型在世界坐标系中的位姿信息时，可以从第一设备获取。此外，530的操作还可以由除第二设备和第一设备以外的其他设备来执行。

在540，使用PnP(perspective-n-point)算法根据第一对应关系计算第一设备在3D模型坐标系中的位姿。

在本公开中，第一对应关系是第一图像中的2D点与3D模型的3D点之间的对应关系。

在本公开中，PnP算法可以包括P3P算法、EPnP(Efficient PnP)算法、aP3P(Algebraic Solution to the Perspective-Three-Point)算法等。在一个示例中，本公开中所使用的PnP算法可以是基于最小二乘法的PnP算法。

在已知第一对应关系的基础上，可以得到符合第一对应关系的至少三对2D点和3D点的点对。通过PnP算法，根据2D点在相机坐标系下的坐标与3D点在3D模型坐标系下的坐标，可以计算出第一设备在3D模型坐标系中的位姿。

在一个示例中，可以使用RANSAC(random sample consensus，随机抽样一致性)算法从第一图像中的至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系确定内点。

在第一对应关系的所有点中随机假设多个内点作为初始值，将该多个内点拟合成一个模型，该模型适用于该作为初始值的多个内点，并且，该模型的参数由该多个内点计算得到。使用模型来测试第一对应关系中的其他特征点，若其他特征点中的一个特征点适用于该模型，则可以确定该特征点是内点，否则，则可以认为该特征点不是内点。通过该方式，可以扩充内点的数量。在测试完所有的特征点后，使用所有被确定为内点的特征点对模型进行重新评估，以对模型进行更新。评估的方式可以是利用模型的错误率来进行评估。上述过程为一次迭代过程，经过多次迭代，在每一次迭代过程中，若内点太少，不如上一次迭代中的模型，则可以舍弃该次迭代的模型。若迭代产生的模型相比于上一次迭代的模型更好，则可以保留该次迭代的模型，并进行下一次迭代。

在确定出内点后，可以使用PnP算法根据内点来计算第一设备在第二设备的3D模型坐标系中的位姿。

通过该示例中的RANSAC算法，可以从第一对应关系中的特征点匹配的所有特征点中筛选出匹配度更高的特征点作为内点。经过RANSAC算法，筛选出的内点不仅特征点匹配度更高，而且用于PnP算法的特征点更少，从而在提高位姿计算精确度的基础上，减少了数据的计算量。

回到图5，在550，基于第一设备在第二设备的3D模型坐标系中的位姿以及第二设备的3D模型在世界坐标系中的位姿，得到第一设备在世界坐标系中的位姿。

在本公开中，3D模型坐标系根据3D模型所构建，3D模型坐标系与3D模型的相对位置固定。根据第一设备在3D模型坐标系中的位姿和3D模型坐标系与3D模型的相对位置关系，可以确定出第一设备相对于3D模型的位姿。基于第一设备相对于3D模型的位姿和3D模型在世界坐标系中的位姿，可以得到第一设备在世界坐标系中的位姿。

图7示出了根据本公开的空间定位方法的另一个示例700的流程图。图7所示的空间定位方法可以由第一设备执行。

如图7所示，在710，可以采集第二设备的第一图像，第一图像包括第二设备的2D点和2D点对应的描述子。

在720，利用第二设备的3D模型上的3D点对应的描述子和2D点对应的描述子对第二设备的2D点和第二设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系。

图7中的710和720的操作分别与上述图2中的220和230的操作相似，在此不再描述。

在730，根据第二设备在世界坐标系中的位置以及第二对应关系，确定第二设备的3D模型的3D点在世界坐标系中的位置。

在该示例中，第二设备在世界坐标系中的位置可以包括前后、上下、左右3个自由度。例如，在直角坐标系中，第二设备的位置可以用X轴、Y轴以及Z轴上的值来表示。

在该示例中，第二设备可以具有定位能力，比如，GPS、北斗等，第二设备可以通过定位来获取自身在世界坐标系中的位置信息。

在确定出3D模型在世界坐标系中的位置后，在740，根据第一对应关系和符合第一对应关系的第二设备的3D模型的3D点在世界坐标系中的位置，使用PnP算法计算第一设备在世界坐标系中的位姿。

在该示例中，PnP算法所针对的3D点均以世界坐标系为参照，从而所得到的第一设备的位姿也是以世界坐标系为参照。在一个示例中，使用的PnP算法可以是基于最小二乘法的PnP算法。

在一个示例中，可以针对第一对应关系中的所有或者部分3D点，确定出该所有或者部分3D点在世界坐标系中的位置。针对以世界坐标系为参照的3D点进行PnP算法计算，以得到第一设备在世界坐标系中的位姿。

在一个示例中，在执行740的操作之前，可以使用RANSAC算法从第一图像中的至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系确定内点。将所确定的内点确定为第一对应关系应用于PnP算法时待使用的点，即，根据所确定的内点的第一对应关系和第二设备的3D模型的3D点中的内点在世界坐标系中的位置，使用PnP算法计算第一设备在世界坐标系中的位姿。

在本公开的一个示例中，当第一设备拍摄不到包括第二设备的第一图像时，可以确定第一设备采集到的第一图像中不包括至少三个不共线的第二设备的2D点。此外，第一设备可以拍摄到包括第二设备的第一图像，所拍摄到的第一图像中的第二设备的2D点少于三个，或者第一图像中的第二设备的不少于三个的2D点共线，则可以确定第一设备采集到的第一图像中不包括至少三个不共线的第二设备的2D点。

在第一设备采集到的第一图像中不包括至少三个不共线的第二设备的2D点的情况下，第一设备可以拍摄包括指定对象的第二图像。第二图像可以包括可作为关键点的指定对象的2D点，指定对象与第二设备的相对位置固定。例如，上述“第二图像”也可以称之为“指定对象图像”。

在一个示例中，第二设备可以包括头戴设备，此时，指定对象可以包括人脸。在用户佩戴头戴设备时，头戴设备与用户的人脸具有固定的相对位置。在另一个示例中，指定对象还可以包括人脸上的指定器官，比如，眼睛、鼻子、耳朵、嘴巴等。

在一个示例中，指定对象所包括的人脸可以包括通用型人脸，利用该通用型人脸建立使用该头戴设备的用户的人脸3D模型，不管是谁佩戴头戴设备，均使用该通用的人脸3D模型，可以节省为用户的脸部建模的操作。在另一个示例中，指定对象所包括的人脸可以包括指定用户的脸部，指定用户可以是使用第二设备的用户，也即，需要为每一位佩戴头戴设备的用户建立专属的人脸3D模型。

在该示例中，可以预先构建指定对象的3D模型，并存储该3D模型。在一个示例中，所存储的3D模型可以包括3D点以及对应的描述子。

由于指定对象与第二设备的相对位置固定，可以基于该相对位置建立预存的指定对象的3D模型与第二设备的3D模型之间的相对位置关系。例如，该第二设备为头戴设备，该指定对象为人脸，在用户佩戴头戴设备时，人脸和头戴设备之间的相对位置差异为L，则可以确定人脸的3D模型和头戴设备的3D模型之间的位置差异为L1。通过计算头戴设备3D模型在世界坐标系中的位置或位姿后，可以通过L1计算得到人脸3D模型在世界坐标系中的位置或位姿。

在第二图像中对至少三个不共线的指定对象的2D点进行关键点检测，以得到至少三个不共线的指定对象的2D点和指定对象的3D模型的3D点之间的匹配关系，以得到指定对象的3D模型与第二图像之间的第三对应关系。

在该示例中，指定对象的关键点可以是指定的。例如，指定对象是人脸时，人脸上指定的关键点可以包括嘴角、鼻尖等位置处的特征点。

在通过关键点检测方式检测出指定对象上的关键点对应的2D点后，可以将关键点对应的2D点与指定对象的3D模型的3D点进行匹配，建立匹配关系。

在一个示例中，可以对第二图像中的各个关键点对应的2D点的描述子与指定对象的3D模型上各个3D点的描述子进行匹配，描述子相匹配的2D点与3D点表征指定对象上的同一关键点，该2D点与该3D点构成匹配关系。

将各个关键点对应的匹配关系结合得到指定对象的3D模型与第二图像之间的第三对应关系。

通过上述示例，在拍摄不到第二设备或者第一设备所采集到的第一图像中不包括至少三个不共线的第二设备的2D点的情况下，可以通过拍摄与第二设备的相对位置固定的指定对象来计算出第一设备在世界坐标系中的位姿，这样提高了空间定位的鲁棒性。

在本公开的另一个示例中，在第一设备采集的第一图像包括有指定对象和第二设备的情况下，第一图像中可以包括可作为关键点的指定对象的2D点。指定对象与第二设备的相对位置固定。

在该示例中，在第二图像中对至少三个不共线的指定对象的2D点进行关键点检测，得到至少三个不共线的指定对象的2D点和指定对象的3D模型的3D点之间的匹配关系。指定对象的3D模型包括3D点和3D点对应的关键点。所得到的匹配关系是针对指定对象的关键点的匹配关系。

在得到关键点对应的匹配关系后，可以使用PnP算法根据第一对应关系和匹配关系计算第一设备在第二设备的3D模型坐标系中的位姿，再基于第一设备在第二设备的3D模型坐标系中的位姿以及第二设备的3D模型在世界坐标系中的位姿，得到第一设备在所述世界坐标系中的位姿。

在一个示例中，在使用PnP算法之前，可以依据预存的指定对象的3D模型与第二设备的3D模型之间的相对位置关系，将指定对象的3D模型的坐标系转换为第二设备的3D模型的坐标系。从而使得指定对象与第二设备的3D模型统一为在第二设备的3D模型的坐标系中，便于进行PnP算法。

通过上述示例，将利用第二设备计算出的位姿与利用指定对象计算出的位姿进行综合，可以得到更精确的位姿。

在本公开的一个示例中，第一设备可以配置有IMU，通过自身的IMU可以实时采集IMU数据。第一设备可以使用采集的IMU数据实时计算该第一设备在世界坐标系中的位姿(以下称为位姿a)。

第一设备在不同时刻的位姿不同，从而在不同时刻根据IMU数据所计算出的位姿a可以不同。

第一设备在拍摄第一图像时可以根据当前采集的IMU数据计算当前的位姿a。然后，在通过本公开的实施例根据第一图像确定出第一设备在世界坐标系中的位姿(以下称为位姿b)，将位姿a和位姿b进行融合处理，以得到所述第一设备的位姿。融合的方式可以包括平均等。

在一个示例中，也可以直接用采集的IMU数据和根据第一图像确定出第一设备在世界坐标系中的位姿进行融合。

在该示例中，通过融合由两种不同方式计算出的位姿，提高了第一设备的位姿的精确度。此外，IMU数据是连续的，由第一图像所确定的位姿是间断的，在本公开提供的方法所得到的位姿的基础上，融合由IMU数据计算得到的位姿，可以得到更高频率的位姿，降低数据延迟。

图8示出了根据本公开的空间定位装置800的一个示例的方框图。空间定位装置800可以应用于第一设备。

如图8所示，空间定位装置800包括图像采集单元810、特征点匹配单元820、定位单元830和位姿确定单元840。

图像采集单元810被配置为采集第二设备的第一图像，第一图像包括第二设备的2D点和2D点对应的描述子。

特征点匹配单元820被配置为利用第二设备的3D模型上的3D点对应的描述子和2D点对应的描述子对第二设备的2D点和第二设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系，第二设备的3D模型包括3D点和3D点对应的描述子。

定位单元830被配置为根据第二设备在世界坐标系中的定位以及第二设备与3D模型之间的第二对应关系，确定第二设备的3D模型在世界坐标系中的定位。

位姿确定单元840被配置为根据第二设备的3D模型在世界坐标系中的定位以及第一对应关系，确定第一设备在世界坐标系中的位姿。

在一个示例中，空间定位装置800还包括关键点匹配单元。所述图像采集单元，被配置为在第一设备采集到的第一图像中不包括至少三个不共线的第二设备的2D点时，采集包括指定对象的第二图像，第二图像包括可作为关键点的指定对象的2D点，指定对象与第二设备的相对位置固定。定位单元，被配置为基于第二设备的3D模型在世界坐标系中的定位和预存的指定对象的3D模型与第二设备的3D模型之间的相对位置关系，确定指定对象的3D模型在世界坐标系中的定位，其中，指定对象的3D模型包括3D点和3D点对应的关键点。关键点匹配单元，被配置为在第二图像中对至少三个不共线的指定对象的2D点进行关键点检测，得到至少三个不共线的指定对象的2D点和指定对象的3D模型的3D点之间的匹配关系，以得到第二图像和指定对象的3D模型之间的第三对应关系。位姿确定单元，被配置为基于指定对象的3D模型在世界坐标系中的定位和第三对应关系，确定第一设备在世界坐标系中的位姿。

在一个示例中，空间定位装置800还包括关键点匹配单元，关键点匹配单元，被配置为在第二图像中对至少三个不共线的指定对象的2D点进行关键点检测，得到至少三个不共线的指定对象的2D点和指定对象的3D模型的3D点之间的匹配关系，其中，指定对象的3D模型包括3D点和3D点对应的关键点。位姿确定单元被配置为：使用PnP算法根据第一对应关系和匹配关系计算第一设备在第二设备的3D模型坐标系中的位姿；和基于第一设备在第二设备的3D模型坐标系中的位姿以及第二设备的3D模型在世界坐标系中的位姿，得到第一设备在世界坐标系中的位姿。

在一个示例中，空间定位装置800还包括坐标系转换单元，坐标系转换单元被配置为依据预存的指定对象的3D模型与第二设备的3D模型之间的相对位置关系，将指定对象的3D模型的坐标系转换为第二设备的3D模型的坐标系。

在一个示例中，所述图像采集单元被配置为：确定先前帧图像中第二设备的位置；根据第一设备的预定移动速度和先前帧图像中第二设备的位置，确定第一设备的预估移动范围；和在第一图像中的预估移动范围内进行搜索，以在第一图像中确定第二设备的2D点的当前位置。

在一个示例中，所述图像采集单元被配置为：根据第二设备在世界坐标系中的位置和第一设备在世界坐标系中的位置，确定第二设备和第一设备的相对位置；通过第二设备和第一设备的相对位置，计算第二设备的2D点在第一图像中的预估范围；和在第一图像中的预估范围内进行搜索，以在第一图像中确定第二设备的2D点的当前位置。

图9示出了根据本公开的空间定位装置800的另一个示例的方框图。

如图9所示，定位单元830可以包括第一位姿确定模块831，位姿确定模块831被配置为：根据第二设备在世界坐标系中的位姿以及第二对应关系，确定第二设备的3D模型在世界坐标系中的位姿。

位姿确定单元840可以包括第二位姿确定模块841和第三位姿确定模块842。第二位姿确定模块841可以被配置为：使用PnP算法根据第一对应关系计算第一设备在第二设备的3D模型坐标系中的位姿。第三位姿确定模块842可以被配置为：基于第一设备在第二设备的3D模型坐标系中的位姿以及第二设备的3D模型在世界坐标系中的位姿，得到第一设备在世界坐标系中的位姿。

在该示例中，位姿确定模块831、第二位姿确定模块841和第三位姿确定模块842可以是由同一个模块，还可以是不同模块。

在一个示例中，空间定位装置800还可以包括内点确定单元，内点确定单元，被配置为使用随机抽样一致性算法从第一图像中的至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系中确定内点；以及将内点确定为第一对应关系应用于PnP算法时待使用的点。

图10示出了根据本公开的空间定位装置800的另一个示例的方框图。

如图10所示，定位单元830可以包括位置确定模块832，位置确定模块832可以被配置为：根据第二设备在世界坐标系中的位置以及第二对应关系，确定第二设备的3D模型的3D点在世界坐标系中的位置。

位姿确定单元840可以包括第四位姿确定模块843，第四位姿确定模块843可以被配置为：根据第一对应关系和符合第一对应关系的第二设备的3D模型的3D点在世界坐标系中的位置，使用PnP算法计算第一设备在世界坐标系中的位姿。

以上参照图1到图10，对根据本公开的用于空间定位的方法及装置的实施例进行了描述。

本公开的用于空间定位的装置可以采用硬件实现，也可以采用软件或者硬件和软件的组合来实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在设备的处理器将存储器中对应的计算机程序指令读取到内存中运行形成的。在本公开中，用于空间定位的装置例如可以利用电子设备实现。

图11示出了本公开的实施例的用于实现空间定位方法的电子设备1100的方框图。

如图11所示，电子设备1100可以包括至少一个处理器1110、存储器(例如，非易失性存储器)1120、内存1130和通信接口1140，并且至少一个处理器1110、存储器1120、内存1130和通信接口1140经由总线1150连接在一起。至少一个处理器1110执行在存储器中存储或编码的至少一个计算机可读指令(即，上述以软件形式实现的元素)。

在一个实施例中，在存储器中存储计算机可执行指令，其当执行时使得至少一个处理器1110：采集第二设备的第一图像，第一图像包括第二设备的2D点和2D点对应的描述子；利用第二设备的3D模型上的3D点对应的描述子和2D点对应的描述子对第二设备的2D点和第二设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的第二设备的2D点与第二设备的3D模型的3D点之间的第一对应关系，第二设备的3D模型包括3D点和3D点对应的描述子；根据第二设备在世界坐标系中的定位以及第二设备与3D模型之间的第二对应关系，确定第二设备的3D模型在世界坐标系中的定位；以及根据第二设备的3D模型在世界坐标系中的定位以及第一对应关系，确定第一设备在世界坐标系中的位姿。

应该理解，在存储器中存储的计算机可执行指令当执行时使得至少一个处理器1110进行本公开的各个实施例中以上结合图1-10描述的各种操作和功能。

根据一个实施例，提供了一种例如机器可读介质的程序产品。机器可读介质可以具有指令(即，上述以软件形式实现的元素)，该指令当被机器执行时，使得机器执行本公开的各个实施例中以上结合图1-10描述的各种操作和功能。

可以提供配有可读存储介质的系统或者装置，在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。

在这种情况下，从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。

本公开各部分操作所需的计算机程序代码可以用任意一种或多种程序语言编写，包括面向对象编程语言，如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB、NET以及Python等，常规程序化编程语言如C语言、Visual Basic 2003、Perl、COBOL 2002、PHP以及ABAP，动态编程语言如Python、Ruby和Groovy，或者其他编程语言等。该程序编码可以在用户计算机上运行，或者作为独立的软件包在用户计算机上运行，或者部分在用户计算机上运行另一部分在远程计算机运行，或者全部在远程计算机或服务器上运行。在后一种情况下，远程计算机可以通过任何网络形式与用户计算机连接，比如局域网(LAN)或广域网(WAN)，或连接至外部计算机(例如通过因特网)，或者在云计算环境中，或者作为服务使用，比如软件即服务(SaaS)。

可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上或云上下载程序代码。

上述对本公开特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

上述各流程和各系统结构图中不是所有的步骤和单元都是必须的，可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的，可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构，也可以是逻辑结构，即，有些单元可能由同一物理实体实现，或者，有些单元可能分由多个物理实体实现，或者，可以由多个独立设备中的某些部件共同实现。

在整个本公开中使用的术语“示例性”意味着“用作示例、实例或例示”，并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的，具体实施方式包括具体细节。然而，可以在没有这些具体细节的情况下实施这些技术。在一些实例中，为了避免对所描述的实施例的概念造成难以理解，公知的结构和装置以框图形式示出。

以上结合附图详细描述了本公开的实施例的可选实施方式，但是，本公开的实施例并不限于上述实施方式中的具体细节，在本公开的实施例的技术构思范围内，可以对本公开的实施例的技术方案进行多种简单变型，这些简单变型均属于本公开的实施例的保护范围。

本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说，对本公开内容进行的各种修改是显而易见的，并且，也可以在不脱离本公开内容的保护范围的情况下，将本文所定义的一般性原理应用于其它变型。因此，本公开内容并不限于本文所描述的示例和设计，而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims

一种用于空间定位的方法，所述方法由第一设备执行，所述方法包括：

采集第二设备的设备图像，所述设备图像包括所述第二设备的2D点和2D点对应的描述子；

利用所述第二设备的3D模型上的3D点对应的描述子和所述2D点对应的描述子对所述第二设备的2D点和所述第二设备的3D模型上的3D点进行特征点匹配，以得到至少三个不共线的所述第二设备的2D点与所述第二设备的3D模型的3D点之间的第一对应关系，所述第二设备的3D模型包括3D点和3D点对应的描述子；

根据所述第二设备在世界坐标系中的定位以及所述第二设备与所述3D模型之间的第二对应关系，确定所述第二设备的3D模型在所述世界坐标系中的定位；以及

根据所述第二设备的3D模型在所述世界坐标系中的定位以及所述第一对应关系，确定所述第一设备在所述世界坐标系中的位姿。
如权利要求1所述的方法，其中，所述第二设备在世界坐标系中的定位包括位姿，

根据所述第二设备在世界坐标系中的定位以及所述第二对应关系，确定所述第二设备的3D模型在所述世界坐标系中的定位包括：

根据所述第二设备在世界坐标系中的位姿以及所述第二对应关系，确定所述第二设备的3D模型在所述世界坐标系中的位姿；以及

根据所述第二设备的3D模型在所述世界坐标系中的定位以及所述第一对应关系，确定所述第一设备在所述世界坐标系中的位姿包括：

使用PnP算法根据所述第一对应关系计算所述第一设备在所述第二设备的3D模型坐标系中的位姿；和

基于所述第一设备在所述第二设备的3D模型坐标系中的位姿以及所述第二设备的3D模型在所述世界坐标系中的位姿，得到所述第一设备在所述世界坐标系中的位姿。
如权利要求1所述的方法，其中，所述第二设备在世界坐标系中的定位包括位置，

根据所述第二设备在世界坐标系中的定位以及所述第二对应关系，确定所述第二设备的3D模型在所述世界坐标系中的定位包括：

根据所述第二设备在世界坐标系中的位置以及所述第二对应关系，确定所述第二设备的3D模型的3D点在所述世界坐标系中的位置；以及

根据所述第二设备的3D模型在所述世界坐标系中的定位以及所述第一对应关系，确定所述第一设备在所述世界坐标系中的位姿包括：

根据所述第一对应关系和符合所述第一对应关系的所述第二设备的3D模型的3D点在所述世界坐标系中的位置，使用PnP算法计算所述第一设备在所述世界坐标系中的位姿。
如权利要求1至3中任一项所述的方法，其中，所述第二设备包括头戴式设备，所述头戴式设备用于显示所述第一设备提供的虚拟对象，所述第一设备包括手持设备，所述手持设备用于控制通过头戴式设备显示的虚拟对象并包括用于采集设备图像的摄像设备。
如权利要求1至4中任一项所述的方法，还包括：

在所述第一设备采集到的设备图像中不包括至少三个不共线的所述第二设备的2D点时，采集包括指定对象的指定对象图像，所述指定对象图像包括可作为关键点的所述指定对象的2D点，所述指定对象与所述第二设备的相对位置固定；

基于所述第二设备的3D模型在所述世界坐标系中的定位和预存的所述指定对象的3D模型与所述第二设备的3D模型之间的相对位置关系，确定所述指定对象的3D模型在所述世界坐标系中的定位，其中，所述指定对象的3D模型包括3D点和3D点对应的关键点；

在所述指定对象图像中对至少三个不共线的所述指定对象的2D点进行关键点检测，得到至少三个不共线的所述指定对象的2D点和所述指定对象的3D模型的3D点之间的匹配关系，以得到所述指定对象图像和所述指定对象的3D模型之间的第三对应关系；

基于所述指定对象的3D模型在所述世界坐标系中的定位和所述第三对应关系，确定所述第一设备在所述世界坐标系中的位姿。
如权利要求1至4中任一项所述的方法，其中，所述设备图像还包括有指定对象，所述设备图像还包括可作为关键点的所述指定对象的2D点，所述指定对象与所述第二设备的相对位置固定，所述方法还包括：

在所述指定对象图像中对至少三个不共线的所述指定对象的2D点进行关键点检测，得到至少三个不共线的所述指定对象的2D点和指定对象的3D模型的3D点之间的匹配关系，其中，所述指定对象的3D模型包括所述3D点和3D点对应的关键点；以及

根据所述第二设备的3D模型在所述世界坐标系中的定位以及所述第一对应关系，确定所述第一设备在所述世界坐标系中的位姿包括：

使用PnP算法根据所述第一对应关系和所述匹配关系计算所述第一设备在所述第二设备的3D模型坐标系中的位姿；和

基于所述第一设备在所述第二设备的3D模型坐标系中的位姿以及所述第二设备的3D模型在所述世界坐标系中的位姿，得到所述第一设备在所述世界坐标系中的位姿。
如权利要求6所述的方法，其中，在所述使用PnP算法根据所述第一对应关系和所述匹配关系计算所述第一设备在所述第二设备的3D模型坐标系中的位姿之前，所述方法还包括：

依据预存的所述指定对象的3D模型与所述第二设备的3D模型之间的相对位置关系，将所述指定对象的3D模型的坐标系转换为所述第二设备的3D模型的坐标系。
如权利要求6或7所述的方法，其中，在所述第二设备包括头戴式设备时，所述指定对象包括人脸。
如权利要求1至8中任一项所述的方法，其中，采集所述第二设备的设备图像包括：

确定先前帧图像中所述第二设备的位置；

根据所述第一设备的预定移动速度和所述先前帧图像中所述第二设备的位置，确定所述第一设备的预估移动范围；和

在所述设备图像中的所述预估移动范围内进行搜索，以在所述设备图像中确定所述第二设备的2D点的当前位置。
如权利要求9所述的方法，其中，所述根据所述第一设备的预定移动速度和所述先前帧图像中所述第二设备的位置，确定所述第一设备的预估移动范围，包括：

根据第一设备的惯性测量单元获取的预定移动速度和移动方向，以及所述先前帧图像中所述第二设备的位置，确定所述第一设备的预估移动范围。
如权利要求1至8中任一项所述的方法，其中，采集所述第二设备的设备图像包括：

根据所述第二设备在世界坐标系中的位置和所述第一设备在所述世界坐标系中的位置，确定所述第二设备和所述第一设备的相对位置；

通过所述第二设备和所述第一设备的相对位置，计算所述第二设备的2D点在所述设备图像中的预估范围；和

在所述设备图像中的所述预估范围内进行搜索，以在所述设备图像中确定所述第二设备的2D点的当前位置。
如权利要求1至11所述的方法，其中，在使用PnP算法之前，所述方法还包括：

使用随机抽样一致性算法从所述设备图像中的至少三个不共线的所述第二设备的2D点与所述第二设备的3D模型的3D点之间的第一对应关系中确定内点；以及

将所述内点确定为所述第一对应关系应用于PnP算法时待使用的点。
如权利要求1至12所述的方法，其中，所述根据所述第二设备在世界坐标系中的定位以及所述第二设备与所述3D模型之间的第二对应关系，确定所述第二设备的3D模型在所述世界坐标系中的定位，包括：

通过所述第二设备采集的数据实时计算所述第二设备在世界坐标系中的定位，

获取预先建立的所述第二设备与所述3D模型之间的第二对应关系，

确定所述第二设备的3D模型在所述世界坐标系中的定位。
一种电子设备，包括：至少一个处理器，以及与所述至少一个处理器耦合的存储器，所述存储器存储指令，当所述指令被所述至少一个处理器执行时，使得所述至少一个处理器执行如权利要求1到13中任一所述的方法。
一种非易失性计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-13中任一所述的方法。