WO2021249401A1

WO2021249401A1 - 模型生成方法、图像透视图确定方法、装置、设备及介质

Info

Publication number: WO2021249401A1
Application number: PCT/CN2021/098942
Authority: WO
Inventors: 李艳丽; 刘冬冬
Original assignee: 北京京东乾石科技有限公司
Priority date: 2020-06-08
Filing date: 2021-06-08
Publication date: 2021-12-16
Also published as: US20230351677A1; EP4131145A4; CN113763231B; CN113763231A; JP2023522442A; KR20230015446A; JP7461504B2; EP4131145A1

Abstract

一种模型生成方法、图像透视图确定方法、装置、设备及介质。该模型生成方法包括：基于预设采集系统采集点云数据和多帧图像透视图，得到点云数据的坐标数据，以及与多帧图像透视图一一对应的多个图像采集时间点（S110）；确定与多个图像采集时间点中的每个图像采集时间点对应的位姿矩阵，根据所述每个图像采集时间点对应的位姿矩阵和坐标数据生成所述每个图像采集时间点下的点云透视图（S120）；将所述每个图像采集时间点下的点云透视图和所述每个图像采集时间点下的图像透视图作为一组训练样本，基于多组训练样本对原始神经网络模型进行训练，生成用于将点云透视图转换为图像透视图的图像转换模型（S130）。

Description

模型生成方法、图像透视图确定方法、装置、设备及介质

本申请要求在2020年6月8日提交中国专利局、申请号为202010514388.2的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及数据处理技术领域，例如涉及一种模型生成方法、图像透视图确定方法、装置、设备及介质。

背景技术

随着虚拟仿真、高精地图制作、机器人、自动驾驶等行业的推进和发展，点云建图的应用越来越广泛。点云建图是基于激光雷达设备采集每个时刻的待建图场景下的点云数据，并基于测绘方式或者同时定位和地图构建(simultaneous localization and mapping，SLAM)方式获取每个时刻的点云数据的三维坐标，进而根据该三维坐标将多个时刻的点云数据进行投影和拼合。

单纯的点云建图仅能获取到多个时刻的点云数据的三维坐标，信息比较单一。为解决这一问题，在点云建图过程中通过搭建摄像头可以同步采集数据以生成相应时刻的图像透视图，从而利用多数据源融合开展更多应用。例如，在仿真重建中通过对激光雷达设备和摄像头进行时空标定以获取彩色点云数据，在制图过程中利用图像透视图辅助观看真实场景，在智能感知中借助图像透视图来提高车道、行人等动态物体的识别。

相关技术中存在以下技术问题：上述图像透视图的获取过程较为耗时耗力，首先，其需要搭建复杂的激光雷达设备和摄像头同步系统，并对二者进行时空标定，这一时空标定过程往往比较繁琐；其次，为了获取高质量且全方位的图像透视图，所采用的摄像头往往价格不菲，如一个360度的全景Ladybug3的费用高达二十多万；再者，经由摄像头采集到的图像透视图的质量容易受到天气、光照、阴影等环境因素影响，如在暗光环境下采集到的图像透视图的图像亮度偏低，车速过快容易出现抖动模糊。

发明内容

本申请实施例提供了一种模型生成方法、图像透视图确定方法、装置、设备及介质，解决了图像透视图的获取过程较为耗时耗力的问题。

第一方面，本申请实施例提供了一种模型生成方法，可以包括：

基于预设采集系统采集点云数据和多帧图像透视图，得到点云数据的坐标数据，以及与所述多帧图像透视图一一对应的多个图像采集时间点；

确定与多个图像采集时间点中的每个图像采集时间点对应的位姿矩阵，根据所述每个图像采集时间点对应的位姿矩阵和坐标数据生成所述每个图像采集时间点下的点云透视图；

将所述每个图像采集时间点下的点云透视图和所述每个图像采集时间点下的图像透视图作为一组训练样本，基于多组训练样本对原始神经网络模型进行训练，生成用于将点云透视图转换为图像透视图的图像转换模型。

第二方面，本申请实施例还提供了一种图像透视图确定方法，可以包括：

基于预设采集系统采集点云数据，得到点云数据的坐标数据以及点云采集时间点，确定与点云采集时间点对应的位姿矩阵，并根据位姿矩阵和坐标数据生成点云采集时间点下的点云透视图；

获取按照本申请任意实施例所提供的模型生成方法生成的图像转换模型，并将点云透视图输入至图像转换模型中，根据图像转换模型的输出结果，确定出点云采集时间点下的图像透视图。

第三方面，本申请实施例还提供了一种模型生成装置，可以包括：

数据采集模块，设置为基于预设采集系统采集点云数据和多帧图像透视图，得到点云数据的坐标数据，以及与所述多帧图像透视图一一对应的多个图像采集时间点；

第一生成模块，设置为确定与多个所述图像采集时间点中的每个图像采集时间点对应的位姿矩阵，根据所述每个图像采集时间点对应的位姿矩阵和坐标数据生成所述每个图像采集时间点下的点云透视图；

第二生成模块，设置为将所述每个图像采集时间点下的点云透视图和所述每个图像采集时间点下的图像透视图作为一组训练样本，基于多组训练样本对原始神经网络模型进行训练，生成用于将点云透视图转换为图像透视图的图像转换模型。

第四方面，本申请实施例还提供了一种图像透视图确定装置，可以包括：

第三生成模块，设置为基于预设采集系统采集点云数据，得到点云数据的坐标数据以及点云采集时间点，确定与点云采集时间点对应的位姿矩阵，并根据位姿矩阵和坐标数据生成点云采集时间点下的点云透视图；

图像透视图确定模块，设置为获取按照本申请任意实施例所提供的模型生成方法生成的图像转换模型，并将点云透视图输入至图像转换模型中，根据图像转换模型的输出结果，确定出点云采集时间点下的图像透视图。

第五方面，本申请实施例还提供了一种设备，该设备可以包括：

至少一个处理器；

存储器，设置为存储至少一个程序；

当至少一个程序被至少一个处理器执行，使得至少一个处理器实现本申请任意实施例所提供的模型生成方法或是图像透视图确定方法。

第六方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现本申请任意实施例所提供的模型生成方法或是图像透视图确定方法。

附图说明

图1是本申请实施例一中的一种模型生成方法的流程图；

图2是本申请实施例一中的一种模型生成方法中点云建图的第一示意图；

图3a是本申请实施例一中的一种模型生成方法中点云建图的第二示意图；

图3b是本申请实施例一中的一种模型生成方法中点云透视图的示意图；

图4a是本申请实施例一中的一种模型生成方法中用于单帧转换的原始神经网络模型的示意图；

图4b是本申请实施例一中的一种模型生成方法中用于序列帧转换的原始神经网络模型的示意图；

图5是本申请实施例二中的一种模型生成方法的流程图；

图6是本申请实施例三中的一种模型生成装置的结构框图；

图7是本申请实施例四中的一种图像透视图确定装置的结构框图；

图8是本申请实施例五中的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作详细说明。

实施例一

图1是本申请实施例一中提供的一种模型生成方法的流程图。本实施例可适用于生成用于将点云透视图转换为图像透视图的图像转换模型的情况。该方法可以由本申请实施例提供的模型生成装置来执行，该装置可以由软件和/或硬件的方式实现，该装置可以集成在各种用户终端或服务器上。

参见图1，本申请实施例的方法包括如下步骤：

S110、基于预设采集系统采集点云数据和多帧图像透视图，得到点云数据的坐标数据，以及与多帧图像透视图一一对应的多个图像采集时间点。

其中，点云数据是基于预设采集系统中的点云采集设备采集到的待建图场景下的数据，如基于激光雷达扫描设备、虚构场景抽稀设备或是多视图重建设备采集到的点云数据；图像透视图是基于预设采集系统中的图像采集设备采集到的透视图，该图像采集设备可以是球面全景相机、广角相机、普通无畸变的透视相机等，相应的，由此采集到的图像透视图可以是球面全景图像、广角图像、普通无畸变的透视图像等，在此未做限定。在采集到点云数据之后，可以对点云数据进行建图，如图2所示，并在建图过程中得到多个点云数据的坐标数据，建图方式可以是测绘方式、SLAM方式等，在此未做限定；相应的，在采集到图像透视图之后，可以获取到每帧图像透视图的图像采集时间点，该图像采集时间点是采集到图像透视图时的时间点。

S120、确定与多个图像采集时间点中的每个图像采集时间点对应的位姿矩阵，根据所述每个图像采集时间点对应的位姿矩阵和坐标数据生成所述每个图像采集时间点下的点云透视图。

其中，位姿矩阵是点云采集设备在某图像采集时间点时、且在点云数据的坐标数据所在的坐标系下的矩阵，该位姿矩阵包括旋转矩阵和平移向量。在实际应用中，若基于测绘方式建图，位姿矩阵可以从组合惯导数据中获取；若基于SLAM方式建图，位姿矩阵可以由SLAM算法提供。在获取到位姿矩阵后，根据该位姿矩阵可以得到图像采集设备在该图像采集时间点时的局部坐标系，或是说，根据该位姿矩阵可以得到图像采集设备在该图像采集时间点时所在的图像采集位置上的局部坐标系，以便将点云数据的坐标数据转换到该局部坐标系下，由此一来，根据已转换完成的坐标数据可以得到该图像采集时间点下的点云透视图。例如，经过点云建图后得到的待建图场景下的点云数据如图3a所示，基于该点云数据和相应的位姿矩阵合成的点云透视图如图3b所示。

可选的，上述位姿矩阵可以通过如下步骤确定：根据点云数据得到预设采集系统的位姿轨迹，该位姿轨迹可以是在点云数据的建图过程中得到，其可以呈现出预设采集系统在移动过程中的位姿的变化情况，该位姿可以包括位置和姿态。在实际应用中，若基于测绘方式建图，可以基于预设采集系统中的组合惯导获取到预设采集系统在多个采集时间点下的位姿；若基于SLAM方式建图，可以基于SLAM算法获取预设采集系统在多个采集时间点下的位姿。进而，基于多个图像采集时间点对位姿轨迹进行采样，根据采样结果得到与每个图像采集时间点分别对应的位姿矩阵。

S130、将所述每个图像采集时间点下的点云透视图和所述每个图像采集时间点下的图像透视图作为一组训练样本，基于多组训练样本对原始神经网络模型进行训练，生成用于将点云透视图转换为图像透视图的图像转换模型。

其中，由于每个图像采集时间点下均存在一个点云透视图和一个图像透视图，可以将二者作为一组训练样本，点云透视图作为实际输入数据，图像透视图作为期望输出数据，由此，可基于多组训练样本对原始神经网络模型进行训练，生成用于将点云透视图转换为图像透视图的图像转换模型。

需要说明的是，原始神经网络模型是任意的未经训练的可以将点云透视图转换为图像透视图的卷积神经网络模型，一种可选的原始神经网络模型的示意图如图4a所示，其是一种单帧点云透视图到单帧图像透视图的图像转换模型。示例性的，实线为数据层，数据层中的Mt是点云透视图，其维度是H*W*C，C可以是点云数据的属性信息的个数，例如，在属性信息是强度信息和语义信息时，C＝2，再例如，在属性信息是色彩信息(R/G/B)时，C＝3；数据层中的It是图像透视图，其维度是H*W*3,3是色彩信息(R/G/B)。虚线为网络层，该网络层中的神经元可以包括卷积层cxx_kx_sx、激励层leakyPeLU、卷积块层ResnetXtBlock_cxx_xx、上采样层PixelShuffle、激励层tanh等等。示例性的，卷积层c32_k3_s2是用3x3尺寸(k3)的步长2(s2)的32个卷积核进行卷积，其余卷积层的含义类似，在此不再赘述；激励层leakyPeLU的参数可以为0.2，也可以为其余数值；卷积块层ResnetXtBlock_c256_x10是用10套ResnetXtBlock顺序串联而得，其内部的卷积层可以统一用3x3尺寸(k3)的步长为2(s2)的卷积核，也可以用其余卷积核，c256是卷积核数量，其余的卷积块层的含义类似，在此不再赘述；PixelShuffle可以是上采样的2倍。

本申请实施例的技术方案，基于预设采集系统采集到的点云数据和多帧图像透视图，可以得到点云数据的坐标数据以及与多帧图像透视图一一对应的多个图像采集时间点；进而，在确定出与多个图像采集时间点中的每个图像采集时间点对应的位姿矩阵后，可以根据所述每个图像采集时间点对应的位姿矩阵和坐标数据生成所述每个图像采集时间点下的点云透视图，即将三维场景点的点云数据投影到图像采集时刻点时的虚拟相机下形成点云透视图；由此，将所述每个图像采集时间点下的点云透视图和所述每个图像采集时间点下的图像透视图作为一组训练样本，基于多组训练样本对原始神经网络模型进行训练，可以生成用于将点云透视图转换为图像透视图的图像转换模型。上述技术方案，可以基于点云数据投影出的点云透视图引导合成图像透视图，解决了图像透视图的获取过程较为耗时耗力的问题，达到了以操作简单且成本较低的方式获取到高质量的图像透视图的效果。

一种可选的技术方案，在生成点云透视图之后，可以获取到点云透视图中与点云数据对应的像素点，并将点云数据的属性信息赋值给像素点，该属性信息可以是强度信息、语义信息、色彩信息等等，示例性的，强度信息可以根据激光雷达扫描设备反射获取，语义信息可以基于点云解析获取。上述步骤设置的好处在于，考虑到相机成像过程是待建图场景的三维场景点在相机底片投影的过程，投影后得到的图像透视图中的每个像素点记录了该三维场景点的色彩信息(R/G/B)；相应的，点云透视图是重构三维场景点在相机底片投影的过程，点云透视图中的每个像素点记录了该三维场景点的属性信息，这意味着点云透视图和图像透视图间具有强烈的相关性，这种相关性提高了基于点云透视图合成图像透视图的合成精度。

考虑到待建图场景中的点云数据投影到点云透视图中的像素点可能是多对一的关系，若多个点云数据对应于一个像素点，那么可以将距离相机最近的点云数据的属性信息赋值给该像素点，这符合人眼的观看规律，当前面的三维场景点挡住后面的三维场景点时，人眼只能看到前面的三维场景点(即，多个点云数据中距离相机最近的点云数据)，而无法看到后面被遮挡住的三维场景点(即，多个点云数据中除距离相机最近的点云数据以外的点云数据)。

一种可选的技术方案，考虑到点云透视图的合成过程是将真实相机或是虚拟相机周围一定范围内的点云数据都投影到相机底片上，从而模拟出真实的三维场景点的成像过程，比如，以相机所在位置为中心，将500米半径的圆周内的全部点云数据都投影到相机底片上。换言之，根据摄影几何理论可知，点云透视图为根据透视关系将真实的三维场景点投影到相片底片后形成的透视图。由此，图像采集设备可以是预设相机，也可以是球面全景相机，该预设相机可以是透视相机或是广角相机，在点云采集设备和图像采集设备的位姿相一致时，根据每个图像采集时间点对应的位姿矩阵和坐标数据生成所述每个图像采集时间点下的点云透视图，可以包括：图像透视图是基于预设采集系统中的预设相机采集得到，根据如下公式将点云数据在世界坐标系下的三维坐标数据P _{W_3d}投影到在图像采集时间点t _C采集到的预设相机坐标系下的二维坐标数据P _{C_2d}(t _C)，并根据多个P _{C_2d}(t _C)生成t _C下的点云透视图：P _{C_2d}(t _C)＝K _cM _W→L(t _C)P _{W_3d}，其中，M _W→L(t _C)是预设采集系统中的点云采集设备在t _C时的世界坐标系下的位姿矩阵，K _c是预设相机的内参矩阵，P _{C_2d}(t _C)是三维坐标数据为P _{W_3d}的点云数据投影在点云透视图上的像素点的二维坐标数据，因此，根据多个像素点的二维坐标数据可以生成点云透视图。

类似的，若图像透视图是基于预设采集系统中的球面全景相机采集得到，三维场景点会投影到一个球面上，将球表面按照经纬度展开就是球面全景图，因此，可根据如下公式将点云数据的P _{W_3d}投影到在t _C采集到的球面全景相机坐标系下的P _{C_2d}(t _C)，并根据多个P _{C_2d}(t _C)生成t _C下的点云透视图：

P _3d＝M _W→L(t _C)P _{W_3d}，P _3d＝[x _3d,y _3d,z _3d]，

其中，R是球面全景相机的球体半径，P _{C_2d}(t _C)是三维坐标数据为P _{W_3d}的点云数据投影在点云透视图(即，球体全景图)上的像素点的二维坐标数据。

一种可选的技术方案，在基于点云透视图引导合成图像透视图时，为了保证时空相关性，避免独立帧一对一解析导致的时序跳变，可以将至少两个图像采集时间下的点云透视图、以及该至少两个图像采集时间下的点云透视图对应的图像透视图共同作为训练样本，以对原始神经网络模型进行训练。示例性的，可以将多个图像采集时间点中的当前图像采集时间点下的点云透视图作为第一点云透视图，以及当前图像采集时间点下的图像透视图作为第一图像透视图；将在当前图像采集时间点之前的至少一个图像采集时间点下的点云透视图作为第二点云透视图，且将在当前图像采集时间点之前的至少一个图像采集时间点下的所述点云透视图对应的图像透视图作为第二图像透视图，第二点云透视图的数量为至少一个，第二图像透视图的数量为至少一个，至少一个第二点云透视图和至少一个第二图像透视图为一一对应关系；将第一点云透视图、第二点云透视图、第一图像透视图和第二图像透视图作为一组训练样本，其中，第一点云透视图、第二点云透视图和第二图像透视图是实际输入数据，第一图像透视图是期望输出数据。

在此基础上，与上述训练样本配合的原始神经网络模型可以包括点云卷积激励模块、图像卷积激励模块以及合并处理模块，由此，基于多组训练样本对原始神经网络模型进行训练，可以包括：将训练样本输入至原始神经网络模型中；经由点云卷积激励模块对第一点云透视图和第二点云透视图的通道级联结果进行处理，得到点云特征图，且经由图像卷积激励模块对第二图像透视图进行处理，得到图像特征图，当然，若第二图像透视图的数量是至少两个，则可以先对至少两个第二图像透视图进行通道级联，再对第二图像透视图的通道级联结果进行处理；经由合并处理模块将点云特征图和图像特征图进行合并处理，并根据合并处理结果生成第三图像透视图，该第三图像透视图是实际输出数据；由此，根据第三图像透视图和第一图像透视图调节原始神经网络模型的网络参数，如根据二者的差异性计算损失函数，并根据计算结果调节网络参数。

下面结合具体示例对本实施例的原始神经网络模型进行示例性的说明。示例性的，在将第一点云透视图、第二点云透视图、第一图像透视图和第二图像透视图作为一组训练样本时，为与该训练样本相互配合，原始神经网络模型的示意图如图4b所示，其是一种序列帧点云透视图到单帧图像透视图的图像转换模型。相较于图4a所示的原始神经网络模型，图4b所示的原始神经网络模型的网络层中的神经元还可以包括级联层concat，数据层中的Mt是第一点云透视图，Mt-2和Mt-1均是第二点云透视图，It是第一图像透视图，It-2是第二图像透视图，其与Mt-2隶属于同一图像采集时间点下的透视图，It-1也是第二图像透视图，其与Mt-1隶属于同一图像采集时间点下的透视图。另外，Mt-2、Mt-1和Mt的通道级联结果的维度是H*W*(3*C)，且It-2和It-1的通道级联结果的维度是H*W*6。

示例性的，以多个图像采集时间点的时间间隔是1秒为例，若Mt和It分别是第10秒时的点云透视图和图像透视图，则Mt-1和It-1分别是第9秒时的点云透视图和图像透视图，且Mt-2和It-2分别是第8秒时的点云透视图和图像透视图，此时，第8-10秒的3个点云透视图和第8-9秒的2个图像透视图作为实际输入数据，第10秒的图像透视图作为期望输出数据，共同输入到原始神经网络模型中以进行模型训练。

需要说明的是，在基于如图4b所示的原始神经网络模型训练得到图像转换模型之后，在图像转换模型的应用阶段，任一帧图像透视图都是未知的，这意味着无法基于前3帧点云透视图和前2帧图像透视图预测出第3帧图像透视图。为解决这一问题，一种可选方案是，在对原始神经网络模型进行训练时，将前两帧点云透视图设置为空、随机数等等，并从第三帧点云透视图开始进行训练，这样一来，在图像转换模型的应用阶段，也可以直接将前两帧图像透视图设置为空、随机数等等，并从第三帧图像透视图开始进行预测。

实施例二

图5是本申请实施例二中提供的一种图像透视图确定方法的流程图。本实施例可适用于基于点云数据和预先生成的图像转换模型合成图像透视图的情况，该方法可以由本申请实施例提供的图像透视图确定装置来执行，该装置可以由软件和/或硬件的方式实现，该装置可以集成在各种用户终端或服务器上。

参见图5，本申请实施例的方法包括步骤S210至S220。

S210、基于预设采集系统采集点云数据，得到点云数据的坐标数据以及点云采集时间点，确定与点云采集时间点对应的位姿矩阵，并根据位姿矩阵和坐标数据生成点云采集时间点下的点云透视图。

其中，点云采集时间点模拟出了图像透视图的图像采集时间点，根据与点云采集时间点对应的位姿矩阵，以及点云数据的坐标数据，可以合成点云采集时间点下的点云透视图。可选的，位姿矩阵可以通过如下步骤确定：对已采集的点云数据进行建图，在建图过程中得到预设采集系统的位姿轨迹；示例性的，按照点云采集时间点对位姿轨迹进行时序采样，根据时序采样结果获取每个点云采集时间点对应的位姿矩阵。

S220、获取按照本申请任意实施例所提供的模型生成方法生成的图像转换模型，并将点云透视图输入至图像转换模型中，根据图像转换模型的输出结果，确定出点云采集时间点下的图像透视图。

上述技术方案首先，预设采集系统中只需要设置点云采集设备，无需设置价格昂贵的图像采集设备，成本较低；其次，只需要将点云透视图输入至已训练完成的图像转换模型中，即可预测出同一采集时间点下的图像透视图，无需进行任何时空标定，操作较为简单；再者，通过提高训练样本的质量，可以保证经由图像转换模型得到高质量的图像透视图。

本申请实施例的技术方案，基于预设采集系统采集到的点云数据，可以得到点云数据的坐标数据以及点云采集时间点，该点云采集时间点模拟出了图像透视图的图像采集时间点；进而，在确定出与点云采集时间点对应的位姿矩阵后，可以根据位姿矩阵和坐标数据生成点云采集时间点下的点云透视图，即将三维场景点的点云数据投影到点云采集时间点时的虚拟相机下形成点云透视图；由此，在将点云透视图输入至预先生成的图像转换模型后，根据图像转换模型的输出结果，可以确定出点云采集时间点下的图像透视图。上述技术方案，可以基于点云数据投影出的点云透视图引导合成图像透视图，解决了图像透视图的获取过程较为耗时耗力的问题，达到了以操作简单且成本较低的方式获取到高质量的图像透视图的效果。

实施例三

图6为本申请实施例三提供的模型生成装置的结构框图，该装置设置为执行上述任意实施例所提供的模型生成方法。该装置与上述各实施例的模型生成方法属于同一个发明构思，在模型生成装置的实施例中未详尽描述的细节内容，可以参考上述模型生成方法的实施例。参见图6，该装置可包括：数据采集模块310、第一生成模块320和第二生成模块330。

其中，数据采集模块310，设置为基于预设采集系统采集点云数据和多帧图像透视图，得到点云数据的坐标数据，以及与所述多帧图像透视图一一对应的多个图像采集时间点；

第一生成模块320，设置为确定与多个图像采集时间点中的每个图像采集时间点对应的位姿矩阵，根据所述每个图像采集时间点对应的位姿矩阵和所述每个图像采集时间点对应的坐标数据生成所述每个图像采集时间点下的点云透视图；

第二生成模块330，设置为将所述每个图像采集时间点下的点云透视图和所述每个图像采集时间点下的图像透视图作为一组训练样本，基于多组训练样本对原始神经网络模型进行训练，生成用于将点云透视图转换为图像透视图的图像转换模型。

可选的，第一生成模块320，可以包括：

位姿轨迹得到单元，设置为根据点云数据得到预设采集系统的位姿轨迹；

位姿矩阵得到单元，设置为基于多个图像采集时间点对位姿轨迹进行采样，得到与多个图像采集时间点中的每个图像采集时间点对应的位姿矩阵。

可选的，第一生成模块320，是设置为：

若图像透视图是基于预设采集系统中的预设相机采集得到，预设相机包括透视相机或是广角相机，则根据如下公式将点云数据在世界坐标系下的三维坐标数据P _{W_3d}投影到在每个图像采集时间点t _C采集到的预设相机坐标系下的二维坐标数据P _{C_2d}(t _C)，并根据多个P _{C_2d}(t _C)生成t _C下的点云透视图：

P _{C_2d}(t _C)＝K _cM _W→L(t _C)P _{W_3d}

其中，M _W→L(t _C)是预设采集系统中的点云采集设备在t _C时的世界坐标系下的位姿矩阵，K _c是预设相机的内参矩阵；

若图像透视图是基于预设采集系统中的球面全景相机，则根据如下公式将点云数据的P _{W_3d}投影到在t _C采集到的球面全景相机坐标系下的P _{C_2d}(t _C)，并根据多个P _{C_2d}(t _C)生成t _C下的点云透视图：

P _3d＝M _W→L(t _C)P _{W_3d}，P _3d＝[x _3d,y _3d,z _3d]

其中，R是球面全景相机的球体半径。

可选的，该装置还可包括：

属性信息赋值模块，设置为获取点云透视图中与点云数据对应的像素点，将点云数据的属性信息赋值给像素点。

可选的，第二生成模块330还设置为：

将至少两个图像采集时间点下的所述点云透视图和所述至少两个图像采集时间点下的所述点云透视图对应的所述图像透视图共同作为一组训练样本。

可选的，第二生成模块330，可以包括：

第一得到单元，设置为将多图像采集时间点中的当前图像采集时间点下的点云透视图作为第一点云透视图，以及所述当前图像采集时间点下的图像透视图作为第一图像透视图；

第二得到单元，设置为将在当前图像采集时间点之前的至少一个图像采集时间点下的点云透视图作为第二点云透视图，且将所述当前图像采集时间点之前的至少一个图像采集时间点下的所述点云透视图对应的图像透视图作为第二图像透视图；

训练样本得到单元，设置为将第一点云透视图、第二点云透视图、第一图像透视图和第二图像透视图作为一组训练样本，其中，第一点云透视图、第二点云透视图和第二图像透视图是实际输入数据，第一图像透视图是期望输出数据。

可选的，第二生成模块330，还可以包括：

输入单元，设置为原始神经网络模型包括点云卷积激励模块、图像卷积激励模块以及合并处理模块，将训练样本输入至原始神经网络模型中；

特征图得到单元，设置为经由点云卷积激励模块对第一点云透视图和第二点云透视图的通道级联结果进行处理，得到点云特征图，且经由图像卷积激励模块对第二图像透视图进行处理，得到图像特征图；

网络参数调节单元，设置为经由合并处理模块将点云特征图和图像特征图进行合并处理，并根据合并处理结果生成第三图像透视图，根据第三图像透视图和第一图像透视图调节原始神经网络模型的网络参数。

本申请实施例三提供的模型生成装置，通过数据采集模块基于预设采集系统采集到的点云数据和多帧图像透视图，可以得到点云数据的坐标数据以及与多帧图像透视图一一对应的多个图像采集时间点；进而，第一生成模块在确定出与与多个所述图像采集时间点中的每个图像采集时间点对应的位姿矩阵后，可以根据所述每个图像采集时间点对应的位姿矩阵和坐标数据生成所述每个图像采集时间点下的点云透视图，即将三维场景点的点云数据投影到图像采集时刻点时的虚拟相机下形成点云透视图；由此，第二生成模块将所述每个图像采集时间点下的点云透视图和所述每个图像采集时间点下的图像透视图作为一组训练样本，基于多组训练样本对原始神经网络模型进行训练，可以生成用于将点云透视图转换为图像透视图的图像转换模型。上述装置，可以基于点云数据投影出的点云透视图引导合成图像透视图，解决了图像透视图的获取过程较为耗时耗力的问题，达到了以操作简单且成本较低的方式获取到高质量的图像透视图的效果。

本申请实施例所提供的模型生成装置可执行本申请任意实施例所提供的模型生成方法，具备执行方法相应的功能模块。

值得注意的是，上述模型生成装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的名称也只是为了便于相互区分，并不用于限制本申请的保护范围。

实施例四

图7为本申请实施例四提供的图像透视图确定装置的结构框图，该装置设置为执行上述任意实施例所提供的图像透视图确定方法。该装置与上述各实施例的图像透视图确定方法属于同一个申请构思，在图像透视图确定装置的实施例中未详尽描述的细节内容，可以参考上述图像透视图确定方法的实施例。参见图7，该装置可包括：第三生成模块410和图像透视图确定模块420。

其中，第三生成模块410，设置为基于预设采集系统采集点云数据，得到点云数据的坐标数据以及点云采集时间点，确定与点云采集时间点对应的位姿矩阵，并根据位姿矩阵和坐标数据生成点云采集时间点下的点云透视图；

图像透视图确定模块420，设置为获取按照本申请任意实施例所提供的模型生成方法生成的图像转换模型，并将点云透视图输入至图像转换模型中，根据图像转换模型的输出结果，确定出点云采集时间点下的图像透视图。

本申请实施例四提供的图像透视图确定装置，通过第三生成模块基于预设采集系统采集到的点云数据，可以得到点云数据的坐标数据以及点云采集时间点，该点云采集时间点模拟出了图像透视图的图像采集时间点，而且，在确定出与点云采集时间点对应的位姿矩阵后，可以根据位姿矩阵和坐标数据生成点云采集时间点下的点云透视图，即将三维场景点的点云数据投影到点云采集时间点时的虚拟相机下形成点云透视图；图像透视图确定模块在将点云透视图输入至预先生成的图像转换模型后，根据图像转换模型的输出结果，可以确定出点云采集时间点下的图像透视图。上述装置，基于点云数据投影出的点云透视图引导合成图像透视图，解决了图像透视图的获取过程较为耗时耗力的问题，达到了以操作简单且成本较低的方式获取到高质量的图像透视图的效果。

本申请实施例所提供的图像透视图确定装置可执行本申请任意实施例所提供的图像透视图确定方法，具备执行方法相应的功能模块。

值得注意的是，上述图像透视图确定装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的名称也只是为了便于相互区分，并不用于限制本申请的保护范围。

实施例五

图8为本申请实施例五提供的一种设备的结构示意图，如图8所示，该设备包括存储器510、处理器520、输入装置530和输出装置540。设备中的处理器520的数量可以是至少一个，图8中以一个处理器520为例；设备中的存储器510、处理器520、输入装置530和输出装置540可以通过总线或其它方式连接，图8中以通过总线550连接为例。

存储器510作为一种计算机可读存储介质，可设置为存储软件程序、计算机可执行程序以及模块，如本申请实施例中的模型生成方法对应的程序指令/模块(例如，模型生成装置中的数据采集模块310、第一生成模块320和第二生成模块330)，或是，如本申请实施例中的图像透视图确定方法对应的程序指令/模块(例如，图像透视图确定装置中的第三生成模块410和图像透视图确定模块420)。处理器520通过运行存储在存储器510中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的模型生成方法或是图像透视图确定方法。

存储器510可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据设备的使用所创建的数据等。此外，存储器510可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器510可包括相对于处理器520远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置530可设置为接收输入的数字或字符信息，以及产生与装置的用户设置以及功能控制有关的键信号输入。输出装置540可包括显示屏等显示设备。

实施例六

本申请实施例六提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种模型生成方法，该方法包括：

基于预设采集系统采集点云数据和图多帧像透视图，得到点云数据的坐标数据，以及与所述多帧图像透视图一一对应的多个图像采集时间点；

将每个图像采集时间点下的点云透视图和图像透视图作为一组训练样本，基于多组训练样本对原始神经网络模型进行训练，生成用于将点云透视图转换为图像透视图的图像转换模型。

当然，本申请实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本申请任意实施例所提供的模型生成方法中的相关操作。

实施例七

本申请实施例七提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种图像透视图确定方法，该方法包括：

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本申请可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现。依据这样的理解，本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

Claims

一种模型生成方法，包括：

基于预设采集系统采集点云数据和多帧图像透视图，得到所述点云数据的坐标数据，以及与所述多帧所述图像透视图一一对应的多个图像采集时间点；

确定与多个所述图像采集时间点中的每个图像采集时间点对应的位姿矩阵，根据所述每个图像采集时间点对应的位姿矩阵和所述坐标数据生成所述每个图像采集时间点下的点云透视图；

将所述每个图像采集时间点下的所述点云透视图和所述每个图像采集时间点下的所述图像透视图作为一组训练样本，基于多组所述训练样本对原始神经网络模型进行训练，生成用于将所述点云透视图转换为所述图像透视图的图像转换模型。
根据权利要求1所述的方法，其中，所述确定与多个所述图像采集时间点中的每个图像采集时间点对应的位姿矩阵，包括：

根据所述点云数据得到所述预设采集系统的位姿轨迹；

基于多个所述图像采集时间点对所述位姿轨迹进行采样，得到与多个所述图像采集时间点中的每个图像采集时间点对应的位姿矩阵。
根据权利要求1所述的方法，其中，所述根据所述每个图像采集时间点对应的位姿矩阵和所述坐标数据生成所述每个图像采集时间点下的点云透视图，包括：

在所述图像透视图是基于所述预设采集系统中的预设相机采集得到的情况下，所述预设相机包括透视相机或广角相机，则根据如下公式将所述点云数据在世界坐标系下的三维坐标数据P _{W_3d}投影到在所述每个图像采集时间点t _C采集到的预设相机坐标系下的二维坐标数据P _{C_2d}(t _C)，并根据多个P _{C_2d}(t _C)生成t _C下的点云透视图：

P _{C_2d}(t _C)＝K _cM _W→L(t _C)P _{W_3d}

其中，M _W→L(t _C)是所述预设采集系统中的点云采集设备在t _C时的所述世界坐标系下的所述位姿矩阵，K _c是所述预设相机的内参矩阵；

在所述图像透视图是基于所述预设采集系统中的球面全景相机的情况下，根据如下公式将所述点云数据的P _{W_3d}投影到在t _C采集到的球面全景相机坐标系下的P _{C_2d}(t _C)，并根据多个P _{C_2d}(t _C)生成t _C下的点云透视图：

P _3d＝M _W→L(t _C)P _{W_3d}，P _3d＝[x _3d,y _3d,z _3d]，

其中，R是所述球面全景相机的球体半径。
根据权利要求1所述的方法，还包括：

获取所述点云透视图中与所述点云数据对应的像素点，将所述点云数据的属性信息赋值给所述像素点。
根据权利要求1所述的方法，还包括，将至少两个图像采集时间点下的所述点云透视图和所述至少两个图像采集时间点下的所述点云透视图对应的所述图像透视图共同作为一组训练样本。
根据权利要求5所述的方法，其中，将至少两个图像采集时间点下的所述点云透视图和所述至少两个图像采集时间点下的所述点云透视图对应的所述图像透视图共同作为一组训练样本，包括：

将多个所述图像采集时间点中的当前图像采集时间点下的所述点云透视图作为第一点云透视图，以及所述当前图像采集时间点下的所述图像透视图作为第一图像透视图；

将在所述当前图像采集时间点之前的至少一个图像采集时间点下的所述点云透视图作为第二点云透视图，且将所述当前图像采集时间点之前的至少一个图像采集时间点下的所述点云透视图对应的所述图像透视图作为第二图像透视图；

将所述第一点云透视图、所述第二点云透视图、所述第一图像透视图和所述第二图像透视图作为一组训练样本，其中，所述第一点云透视图、所述第二点云透视图和所述第二图像透视图是实际输入数据，所述第一图像透视图是期望输出数据。
根据权利要求6所述的方法，其中，所述原始神经网络模型包括点云卷积激励模块、图像卷积激励模块以及合并处理模块，所述基于多组所述训练样本对原始神经网络模型进行训练，包括：

将所述训练样本输入至所述原始神经网络模型中；

所述点云卷积激励模块对所述第一点云透视图和所述第二点云透视图的通道级联结果进行处理，得到点云特征图，且所述图像卷积激励模块对所述第二图像透视图进行处理，得到图像特征图；

所述合并处理模块将所述点云特征图和所述图像特征图进行合并处理，并根据合并处理结果生成第三图像透视图，根据所述第三图像透视图和所述第一图像透视图调节所述原始神经网络模型的网络参数。
一种图像透视图确定方法，包括：

基于预设采集系统采集点云数据，得到所述点云数据的坐标数据以及点云采集时间点，确定与所述点云采集时间点对应的位姿矩阵，并根据所述位姿矩阵和所述坐标数据生成所述点云采集时间点下的点云透视图；

获取按照权利要求1-7中任一项的模型生成方法生成的图像转换模型，并将所述点云透视图输入至所述图像转换模型中，根据所述图像转换模型的输出结果，确定出所述点云采集时间点下的图像透视图。
一种模型生成装置，包括：

数据采集模块，设置为基于预设采集系统采集点云数据和多帧图像透视图，得到所述点云数据的坐标数据，以及与所述多帧图像透视图一一对应的多个图像采集时间点；

第一生成模块，设置为确定与多个所述图像采集时间点中的每个图像采集时间点对应的位姿矩阵，根据所述每个图像采集时间点对应的位姿矩阵和所述坐标数据生成所述每个图像采集时间点下的点云透视图；

第二生成模块，设置为将所述每个所述图像采集时间点下的所述点云透视图和所述每个所述图像采集时间点下的所述图像透视图作为一组训练样本，基于多组所述训练样本对原始神经网络模型进行训练，生成用于将所述点云透视图转换为所述图像透视图的图像转换模型。
一种图像透视图确定装置，包括：

生成模块，设置为基于预设采集系统采集点云数据，得到所述点云数据的坐标数据以及点云采集时间点，确定与所述点云采集时间点对应的位姿矩阵，并根据所述位姿矩阵和所述坐标数据生成所述点云采集时间点下的点云透视图；

图像透视图确定模块，设置为获取按照权利要求1-7中任一项的模型生成方法生成的图像转换模型，并将所述点云透视图输入至所述图像转换模型中，根据所述图像转换模型的输出结果，确定出所述点云采集时间点下的图像透视图。
一种设备，包括：

至少一个处理器；

存储器，设置为存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1-7中任一所述的模型生成方法，或者如权利要求8中所述的图像透视图确定方法。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的模型生成方法，或者如权利要求8中所述的图像透视图确定方法。