CN117746276A

CN117746276A - 确定共视关键帧的方法、装置、设备、介质和程序产品

Info

Publication number: CN117746276A
Application number: CN202211119435.9A
Authority: CN
Inventors: 王欣
Original assignee: Beijing Zitiao Network Technology Co Ltd
Current assignee: Beijing Zitiao Network Technology Co Ltd
Priority date: 2022-09-13
Filing date: 2022-09-13
Publication date: 2024-03-22

Abstract

本公开提供的一种确定共视关键帧的方法、装置、设备、介质和程序产品，通过获取当前帧图像对应的物理空间的多个体素，从多个体素中确定可视体素，该可视体素中包括多个地图点。然后根据这些地图点的物理坐标确定当前帧图像的可视地图点，在存储的关键帧集合中确定当前帧图像的可视地图点所在的关键帧图像为当前帧图像的共视关键帧图像，不需要先确定关键帧，然后再遍历所有的关键帧来寻找共视关键帧，保证了视觉SLAM系统的实时性，同时，也减少了位姿漂移提高了定位精度。

Description

确定共视关键帧的方法、装置、设备、介质和程序产品

技术领域

本公开涉及计算机视觉技术领域，尤其涉及一种确定共视关键帧的方法、装置、设备、介质和程序产品。

背景技术

同时定位与地图构建(Simultaneous Localization and Mapping，简称SLAM)是一种可以在周围环境未知的情况下，在运动过程中建立周围环境的模型，同时估计自己的运动的计算机视觉技术，SLAM技术可以应用在无人机、机器人和自动驾驶车辆等实时设备中以实现导航功能。

SLAM技术的定位精度，通常取决于当前帧与地图中所有关键帧建立联系的能力，在现有技术中，通常需要在所有帧中确定关键帧，然后再遍历所有的关键帧，来寻找共视关键帧。可视地图点所在的帧称为共视关键帧，当共视关键帧中的可视地图点越多说明相机的位姿漂移越小，定位精度越高。

而遍历所有关键帧来寻找共视关键帧，导致视觉SLAM系统的耗时随着运行时间以及运行范围的增加而线性增加，无法满足视觉SLAM系统的实时性。

发明内容

本公开提供一种确定共视关键帧的方法、装置、设备、介质和程序产品，用以解决现有技术中遍历所有关键帧来寻找共视关键帧，导致视觉SLAM系统的耗时随着运行时间以及运行范围的增加而线性增加，无法满足视觉SLAM系统的实时性的问题。

第一方面，本公开提供一种确定共视关键帧的方法，包括：

获取当前帧图像对应的物理空间的多个体素；

从所述多个体素中确定可视体素，所述可视体素内包含多个地图点；

根据所述可视体素中的地图点的物理坐标确定所述当前帧图像的可视地图点，所述当前帧图像的可视地图点包括所述可视体素中可以投影到所述当前帧图像中的地图点；

在存储的关键帧集合中确定所述当前帧图像的可视地图点所在的关键帧图像，将所述当前帧图像的可视地图点所在的关键帧图像确定为所述当前帧图像的共视关键帧图像

第二方面，本公开提供一种确定共视关键帧的装置，包括：

获取模块，用于获取当前帧图像对应的物理空间的多个体素；

第一确定模块，用于从所述多个体素中确定可视体素，所述可视体素内包含多个地图点；

第二确定模块，用于根据所述可视体素中的地图点的物理坐标确定所述当前帧图像的可视地图点，所述当前帧图像的可视地图点包括所述可视体素中可以投影到所述当前帧图像中的地图点；

第三确定模块，用于在存储的关键帧集合中确定所述当前帧图像的可视地图点所在的关键帧图像，将所述当前帧图像的可视地图点所在的关键帧图像确定为所述当前帧图像的共视关键帧图像。

第三方面，本公开提供一种电子设备，包括：处理器，以及与所述处理器通信连接的存储器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，以实现如第一方面所述的确定共视关键帧的方法。

第四方面，本公开提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如第一方面所述的确定共视关键帧的方法。

第五方面，本公开提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现第一方面所述的确定共视关键帧的方法。

本公开提供的一种确定共视关键帧的方法、装置、设备、介质和程序产品，通过获取当前帧图像对应的物理空间的多个体素，然后从多个体素中确定可视体素，该可视体素中包括多个地图点。然后根据这些地图点的物理坐标确定当前帧图像的可视地图点，在存储的关键帧集合中确定当前帧图像的可视地图点所在的关键帧图像为当前帧图像的共视关键帧图像，不需要先确定关键帧，然后再遍历所有的关键帧来寻找共视关键帧，保证了视觉SLAM系统的实时性，同时，也减少了位姿漂移提高了定位精度。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1为本公开实施例一提供的一种确定共视关键帧的方法的流程示意图；

图2为示例的可视体素的示意图；

图3为示例的体素划分的示意图；

图4为本公开实施例二提供的一种确定共视关键帧的装置的结构框图；

图5为本公开实施例二提供的一种电子设备的结构示意图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

SLAM技术的定位精度，通常取决于当前帧与地图中所有关键帧建立联系的能力，在现有技术中，通常需要在所有帧中确定关键帧，然后再遍历所有的关键帧，来寻找共视关键帧。

其中，共视关键帧为可视地图点所在的帧，所谓地图点，是包含视觉类传感器(例如相机)采集或者观测到的三维空间内某个点的位姿信息(位置和姿态，例如旋转角、朝向等)等，可视地图点可以理解为当前帧图像所能观测到的地图点。当共视关键帧中的可视地图点越多说明相机的位姿漂移越小，定位精度越高。

上述共视关键帧是相机视锥(光心与相机平面四角连接线的延长线可以构成的椎体)在空间中有交集的体素(三维空间的像素)中包含的可以被相机观测到地图点(即可视地图点)对应的关键帧，可以理解，共视关键帧为关键帧的子集。

而遍历所有关键帧来寻找共视关键帧，导致视觉SLAM系统的耗时随着运行时间以及运行范围的增加而线性增加，无法满足该系统的实时性。或者，为了保证该系统的实时性，可以只对某个时间范围或者某个空间范围内的部分关键帧进行遍历，但是这种方式会损失部分可视地图点，导致相机的位姿漂移变大。

考虑到体素在物理空间中的数量是固定的，不会随着关键帧的数量变化而变化，在满足系统实时性的同时，可以减少位姿漂移。

所以，本申请提出一种确定共视关键帧的方法、装置、设备、介质和程序产品，通过寻找当前帧图像所在物理空间的可视体素，然后判断可视体素中的地图点是否为可视地图点，即这些地图点是否可以投影到当前帧图像中，可视地图点所在关键帧可以确定为共视关键帧，不需要先确定关键帧，然后再遍历所有的关键帧来寻找共视关键帧，保证了视觉SLAM系统的实时性，同时，也减少了位姿漂移提高了定位精度。

本公开的应用场景可以是集成了相机和视觉SLAM系统的智能设备，该设备可以是虚拟现实头盔、无人机或者机器人，也可以是自动驾驶车辆等，以及其他使用SLAM技术进行导航的设备。可以理解，本公开所提供的共视关键帧的快速查找方法，包括但不限于以上应用场景。

下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以独立存在，也可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本公开的实施例进行描述。

参考图1，图1为本公开实施例一提供的一种确定共视关键帧的方法的流程示意图，该方法可以由确定共视关键帧的装置执行，该装置中设置有相机，具体由装置中集成的视觉SLAM系统执行，以下简称系统，该方法包括如下步骤。

S101、获取当前帧图像对应的物理空间的多个体素。

视觉SLAM系统为了实现导航，需要为当前帧图像寻找尽可能多的可视地图点，才能保证定位的准确性。系统获取到相机中拍摄到的当前帧图像。

系统获取到相机拍摄的当前帧图像后，可以从当前帧图像对应的物理空间的所有体素中确定可视体素，该可视体素内包括多个地图点，具体实现如下：

系统在确定可视体素之前，系统可以根据关键帧集合中的关键帧图像的特殊地图点，将该物理空间以预设大小进行划分，得到多个体素，示例性的，该预设大小可以为1m×1m×1m(米)，图2为将该物理空间以预设大小划分后的示意图，图中的地图点和体素的数量和位置仅为示例，图中的地图点为图像的特殊地图点。可选的，上述特殊地图点可以包括图像的中心点和四个顶点。

得到多个体素后，确定每个体素的各个顶点的物理坐标，也就是八个顶点的物理坐标，该物理坐标可以理解为空间的三维坐标。关键帧集合是根据当前帧图像之前的每一帧图像确定得到的，有关关键帧集合的具体描述可以参考步骤S104。

S102、从多个体素中确定可视体素，可视体素内包含多个地图点。

系统确定可视体素后，可以通过如下操作从多个体素中确定可视体素：

系统以相机光心为原点，将该原点与当前帧图像的四个顶点连接起来，构成四条射线，可以理解，这四条射线的函数表达式是确定的，然后将每个体素的顶点的物理坐标代入到四条射线的函数表达式中，以确定地图点是否经过射线，也就是说，当某个顶点的物理坐标满足一条射线的函数表达式，则确定该顶点经过该射线。那么，系统可以确定在至少一条射线上的顶点，也就是说，该顶点可以同时在多条射线上。

确定在至少一条射线的顶点后，系统可以从这些顶点的物理坐标中，确定各个坐标值(即x，y和z)中的最大值和最小值。示例性的，从这些顶点的各个x坐标值中确定最大值为x₁，最小值为x₂；从这些顶点的各个y坐标值中确定最大值y₁，最小值为y₂；从这些顶点的各个z坐标值中确定最大值为z₁，最小值为z₂。

然后根据在至少一条射线的顶点的物理坐标的各个坐标值中的最大值和最小值，确定各个坐标值的最大值与最小值范围内的体素，示例性的，可以确定最小值为x₂到最大值为x₁、最小值为y₂到最大值为y₁、和最小值为z₂到最大值为z₁范围内的体素。

然后，系统可以将在各个坐标值的最大值与最小值范围内的体素，以及经过至少一条射线的顶点所在的体素确定为可视体素。示例性的，可视体素的示意图可以参考图3。

S103、根据可视体素中的地图点的物理坐标确定当前帧图像的可视地图点。

系统确定可视体素后，可以根据可视体素内的地图点的坐标，确定各个可视体素中可以投影到当前帧图像中的地图点，下面把这些地图点称为可视地图点。

具体的，系统可以按照公式(1)将每个可视体素中的各个地图点的物理坐标转换为相机坐标。

其中，W表示物理坐标系，C表示相机坐标系，为地图点i的物理系坐标，/>为物理坐标系转换到相机坐标系的矩阵参数。

确定可视体素中地图点的相机坐标后，系统可以通过公式(2)，根据相机坐标和当前帧的像素大小确定可视体素中的可视地图点。

其中，为地图点i的相机系坐标，K为相机内参，/>为地图点i的像素坐标，在公式(2)的基础上，根据公式(3)判断地图点是否为可视地图点。

其中，w和h是当前帧图片的像素大小。

当确定各个可视体素中的可视地图点，可以得到当前帧图像的可视地图点，这些可视地图点是可以投影到当前帧图像的地图点。

S104、在存储的关键帧集合中确定当前帧图像的可视地图点所在的关键帧图像，将当前帧图像的可视地图点所在的关键帧图像确定为当前帧图像的共视关键帧图像。

系统在确定当前帧图像的可视地图点后，在存储的关键帧集合中确定当前帧图像的可视地图点所在的关键帧图像为当前帧图像的共视关键帧图像。

可选的，系统可以根据可视地图点或者共视关键帧图像的数量，确定当前帧图像是否为关键帧。具体的，当可视地图点的数量小于第一预设阈值，或者，共视关键帧的数量小于第二预设阈值时，将当前帧图像作为关键帧。也就是说，此时当前帧图像可视的地图点较少，也就是说还有不少数量的其他的地图点不可视，那么可以将当前帧图像作为关键帧。

然后系统可以将当前帧图像添加到关键帧集合中进行存储，以提供给后续帧图像在确定共视关键帧时使用。

如果当前帧图像为关键帧，系统也可以以此关键帧生成新的地图点，以增加地图点的数量，以增加后续帧图像的共视关键帧数量，提高系统的定位精度。

具体的，系统从当前帧图像中提取随机像素坐标(u，v)对应的点为新地图点，系统可以根据当前帧的可视地图点的物理坐标，确定新地图点的初始深度z，如使用新地图点像素坐标附近可视地图点的平均深度，然后根据新地图点深度z和像素坐标(u，v)，由上述公式(1)和公式(2)得到新的地图点的物理坐标。

得到新的地图点后，系统可以根据新的地图点，更新当前帧图像对应的物理空间的体素。

具体的，系统根据新的地图点的物理坐标，确定这些新的地图点所属的体素，然后将新的地图点插入到其所属的体素中。当该体素中仅包括新的地图点，说明该体素相对于步骤S102中的当前帧图像对应的物理空间的体素，是新的体素，而这些新的体素，用于后续帧图像在确定共视帧图像时，作为步骤S102中确定可视体素的所有体素中一个。也就是说，增加了当前帧图像对应的物理空间的体素的数量。

在本实施例中，系统通过当前帧图像对应的物理空间的多个体素，然后从多个体素中确定可视体素，该可视体素中包括多个地图点。然后根据这些地图点的物理坐标确定当前帧图像的可视地图点，在存储的关键帧集合中确定当前帧图像的可视地图点所在的关键帧图像为当前帧图像的共视关键帧图像，不需要先确定关键帧，然后再遍历所有的关键帧来寻找共视关键帧，保证了视觉SLAM系统的实时性，同时，也减少了位姿漂移提高了定位精度。

对应于上文实施例的确定共视关键帧的方法，图4为本公开实施例二提供的一种确定共视关键帧的装置的结构框图。为了便于说明，仅示出了与本公开实施例相关的部分。

参照图4，装置40包括：获取模块401、第一确定模块402、第二确定模块403和第三确定模块404。

其中，获取模块401，用于获取当前帧图像对应的物理空间的多个体素。

第一确定模块402，用于从多个体素中确定可视体素，可视体素内包含多个地图点。

第二确定模块403，用于根据可视体素中的地图点的物理坐标确定当前帧图像的可视地图点，当前帧图像的可视地图点包括所有可视体素中可以投影到当前帧图像中的地图点。

第三确定模块404，用于在存储的关键帧集合中确定当前帧图像的可视地图点所在的关键帧图像，将当前帧图像的可视地图点所在的关键帧图像确定为当前帧图像的共视关键帧图像。

可选的，第一确定模块402具体用于：

以相机光心为原点，将原点与当前帧图像的四个顶点连接构成四条射线。

根据多个体素的顶点的物理坐标，从多个体素的多个顶点中确定在至少一条射线上的顶点。

根据在至少一条射线上的顶点的物理坐标的各个坐标值中的最大值和最小值，确定各个坐标值的最大值与最小值范围内的体素。

将各个坐标值的最大值与最小值范围内的体素，以及经过至少一条射线的顶点所在的体素确定为可视体素。

可选的，第二确定模块403具体用于：

将可视体素中地图点的物理坐标转换为相机坐标。

根据相机坐标和当前帧图像的像素大小确定可视体素中可以投影到当前帧图像中的地图点，将可以投影到当前帧图像中的地图点确定为当前帧图像的可视地图点。

可选的，装置40还包括：生成模块，

生成模块具体用于：在将当前帧图像的可视地图点所在的关键帧图像确定为当前帧图像的共视关键帧图像之后，根据可视地图点或者共视关键帧图像的数量，确定当前帧图像为关键帧。

根据当前帧图像的可视地图点的物理坐标，生成新的地图点。

根据新的地图点，更新当前帧图像对应的物理空间的体素。

可选的，生成模块具体用于：当可视地图点的数量小于第一预设阈值时，或者，共视关键帧图像的数量小于第二预设阈值时，则确定当前帧图像为关键帧。

可选的，装置40还包括：存储模块，将关键帧存储到关键帧集合中。

可选的，获取模块401具体用于：根据关键帧集合中的关键帧图像的特殊地图点，将物理空间以预设大小划分，得到多个体素以及体素的各个顶点的物理坐标，体素中包括关键帧集合中任意一个关键帧的特殊地图点，特殊地图点为图像的部分地图点，关键帧集合是根据当前帧图像之前的图像确定得到的。

可选的，特殊地图点包括图像的中心点和四个顶点。

本实施例的装置，可用于执行实施例一中的一种确定共视关键帧的方法的步骤，具体实现方式和技术效果类似，这里不再赘述。

参考图5，本公开实施例三提供的一种电子设备50的结构示意图，该电子设备50可以为集成了相机和视觉SLAM系统的智能设备。其中，智能设备可以包括但不限于诸如虚拟现实头盔、无人机、机器人和自动驾驶车辆等需要导航功能的设备。图5示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图5所示，电子设备50可以包括处理装置(例如中央处理器、图形处理器等)501，其可以根据存储在只读存储器(Read Only Memory，简称ROM)502中的程序或者从存储装置508加载到随机访问存储器(Random Access Memory，简称RAM)503中的程序而执行各种适当的动作和处理。在RAM503中，还存储有电子设备50操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

通常，以下装置可以连接至I/O接口505：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506；包括例如液晶显示器(Liquid CrystalDisplay，简称LCD)、扬声器、振动器等的输出装置507；包括例如磁带、硬盘等的存储装置508；以及通信装置509。通信装置509可以允许电子设备50与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备50，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

本发明实施例四提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，该计算机执行指令包含用于执行实施例一中的方法的程序代码，在这样的实施例中，该计算机执行指令可以通过通信装置509从网络上被下载和安装，或者从存储装置508被安装，或者从ROM 502被安装。在该计算机执行指令被处理装置501执行时，执行本公开实施例的方法中限定的上述功能。具体实现方式和技术效果类似，这里不再赘述。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

本发明实施例五提供一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时，实现如上述实施例一的一种洗衣机撞桶后的处理方法步骤，具体实现方式和技术效果类似，这里不再赘述。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

1.一种确定共视关键帧的方法，其特征在于，所述方法包括：

获取当前帧图像对应的物理空间的多个体素；

在存储的关键帧集合中确定所述当前帧图像的可视地图点所在的关键帧图像，将所述当前帧图像的可视地图点所在的关键帧图像确定为所述当前帧图像的共视关键帧图像。

2.根据权利要求1所述的方法，其特征在于，从所述多个体素中确定可视体素，包括：

以相机光心为原点，将所述原点与所述当前帧图像的四个顶点连接构成四条射线；

根据所述多个体素的顶点的物理坐标，从所述多个体素的多个顶点中确定在至少一条射线上的顶点；

根据所述在至少一条射线的顶点的物理坐标的各个坐标值中的最大值和最小值，确定所述各个坐标值的最大值与最小值范围内的体素；

将所述各个坐标值的最大值与最小值范围内的体素，以及所述在至少一条射线上的顶点所在的体素确定为可视体素。

3.根据权利要求2所述的方法，其特征在于，所述根据所述可视体素中的地图点的物理坐标确定所述当前帧图像的可视地图点，包括：

将所述可视体素中地图点的物理坐标转换为相机坐标；

根据所述相机坐标和所述当前帧图像的像素大小确定所述可视体素中可以投影到所述当前帧图像中的地图点，将所述可以投影到所述当前帧图像中的地图点确定为所述当前帧图像的可视地图点。

4.根据权利要求1-3任一项所述的方法，其特征在于，所述将所述当前帧图像的可视地图点所在的关键帧图像确定为所述当前帧图像的共视关键帧图像之后，还包括：

根据所述可视地图点或者所述共视关键帧图像的数量，确定所述当前帧图像为关键帧；

根据所述当前帧图像的可视地图点的物理坐标，生成新的地图点；

根据所述新的地图点，更新所述当前帧图像对应的物理空间的体素。

5.根据权利要求4所述的方法，其特征在于，所述根据所述可视地图点或者所述共视关键帧图像的数量，确定所述当前帧图像为关键帧，包括：

当所述可视地图点的数量小于第一预设阈值时，或者，所述共视关键帧图像的数量小于第二预设阈值时，则确定所述当前帧图像为关键帧。

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

将所述关键帧存储到所述关键帧集合中。

7.根据权利要求5或6所述的方法，其特征在于，获取当前帧图像对应的物理空间的多个体素，包括：

根据所述关键帧集合中的关键帧图像的特殊地图点，将所述物理空间以预设大小划分，得到多个体素以及所述体素的各个顶点的物理坐标，所述体素中包括所述关键帧集合中任意一个关键帧的特殊地图点，所述特殊地图点为图像的部分地图点，所述关键帧集合是根据所述当前帧图像之前的图像确定得到的。

8.根据权利要求7所述的方法，其特征在于，所述特殊地图点包括图像的中心点和四个顶点。

9.一种确定共视关键帧的装置，其特征在于，包括：

10.一种电子设备，其特征在于，包括：处理器，以及与所述处理器通信连接的存储器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，以实现如权利要求1-8中任一项所述的确定共视关键帧的方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1-8任一项所述的确定共视关键帧的方法。

12.一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序被处理器执行时实现权利要求1-8中任一项所述的确定共视关键帧的方法。