CN113160382B

CN113160382B - 基于隐式模板映射的单视图车辆重建方法和装置

Info

Publication number: CN113160382B
Application number: CN202110309292.7A
Authority: CN
Inventors: 刘烨斌; 赵笑晨; 于涛
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2021-03-23
Filing date: 2021-03-23
Publication date: 2022-10-28
Anticipated expiration: 2041-03-23
Also published as: CN113160382A

Abstract

本申请提出一种基于隐式模板映射的单视图车辆重建方法和装置，涉及计算机视觉中的三维重建技术领域，方法包括：对获取三维车辆模型数据库中每个原始三维车辆模型进行随机纹理赋值获取三维带纹理车辆模型；对三维带纹理车辆模型进行渲染获取原始图片数据集，对每个原始三维车辆模型提取符号距离场；将原始图片数据集和符号距离场输入网络模型进行训练获取输出彩色图片，对输出彩色图片和原始渲染彩色图片进行计算调整网络模型的网络参数，获取已训练的网络模型；获取待处理车辆彩色图片输入已训练的网络模型获取车辆网格模型。由此，只需要使用渲染得到的虚拟数据库，基于隐式模板映射的生成式对抗网络在预测车辆几何结构的同时获得纹理特征。

Description

基于隐式模板映射的单视图车辆重建方法和装置

技术领域

本申请涉及计算机视觉中的三维重建技术领域，尤其涉及一种基于隐式模板映射的单视图车辆重建方法和装置。

背景技术

随着计算机视觉领域中的三维重建技术和自动驾驶技术的不断发展，对于道路场景中机动车辆的三维重建成为了计算机室领域中的一个研究热点。利用已知参数的相机采集单视图彩色图片，进而预测车辆的形状和外表目前正成为研究工作中的重要方向。

目前流行的基于单图像的车辆重建方法主要分为重建参数化车辆模型以及重建非参数化表示的车辆模型。常用的参数化模型是通过对多个已建模车辆的三维模型进行特征提取，获得用于描述车辆形状的有限参数。针对单图片重建问题，先从图片估计车辆朝向，再通过重投影误差来实现优化得到参数，进而得到车辆模型。重建非参数化表示的车辆模型，近期受到关注的方法是通过符号距离场(Signed Distance Field)来训练一个MLP网络表示隐式函数来表示物体三维模型。

尽管基于单图片重建三维车辆模型技术已经有了很大的发展，但目前重建带纹理特征三维车辆模型的工作仍比较少，现有的工作在基于隐式函数表示三维几何的基础上，利用类似的隐式函数方法预测车辆纹理，但由于车辆几何形状的多样性，几何与纹理信息未能显式分离，导致结果对车辆表面纹理细节的表现能力有限。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的第一个目的在于提出一种基于隐式模板映射的单视图车辆重建方法，对于精细的车辆三维模型数据库，利用高真实感渲染的方法得到的逼真的彩色数据及对应的深度数据，对车辆模型提取符号距离场(Signed Distance Field)。通过搭建基于隐式模板映射的生成式对抗神经网络，实现将三维颜色分布约束到二维表面颜色分布，从而在已知相机参数的彩色相机采集道路上车辆的RGB图片作为输入，网络即可输出包含纹理特征的车辆网格模型。

本申请的第二个目的在于提出一种基于隐式模板映射的单视图车辆重建装置。

为达上述目的，本申请第一方面实施例提出了一种基于隐式模板映射的单视图车辆重建方法，包括：

获取不同类型车辆的三维车辆模型数据库，对所述三维车辆模型数据库中每个原始三维车辆模型的不同部件进行随机纹理赋值，获取三维带纹理车辆模型；

对所述三维带纹理车辆模型在多个不同场景下进行渲染，获取原始图片数据集，并对所述每个原始三维车辆模型进行处理，提取符号距离场；

将所述原始图片数据集和所述符号距离场输入网络模型进行训练，获取输出彩色图片，并通过能量函数对所述输出彩色图片和原始渲染彩色图片进行计算，调整所述网络模型的网络参数，获取已训练的网络模型；

获取待处理车辆彩色图片输入所述已训练的网络模型，获取车辆网格模型。

本申请实施例的基于隐式模板映射的单视图车辆重建方法，通过获取不同类型车辆的三维车辆模型数据库，对三维车辆模型数据库中每个原始三维车辆模型的不同部件进行随机纹理赋值，获取三维带纹理车辆模型；对三维带纹理车辆模型在多个不同场景下进行渲染，获取原始图片数据集，并对每个原始三维车辆模型进行处理，提取符号距离场；将原始图片数据集和符号距离场输入网络模型进行训练，获取输出彩色图片，并通过能量函数对输出彩色图片和原始渲染彩色图片进行计算，调整网络模型的网络参数，获取已训练的网络模型；获取待处理车辆彩色图片输入已训练的网络模型，获取车辆网格模型。由此，只需要使用渲染得到的虚拟数据库，基于隐式模板映射的生成式对抗网络在预测车辆几何结构的同时获得纹理特征。

可选地，在本申请的一个实施例中，所述获取不同类型车辆的三维车辆模型数据库，包括：

对所述不同类型车辆进行三维建模，获取所述三维车辆模型数据库。

可选地，在本申请的一个实施例中，所述对所述三维带纹理车辆模型在多个不同场景下进行渲染，获取原始图片数据集，包括：

对所述三维带纹理车辆模型在不同视角，不同光照条件下进行渲染，获取多个渲染彩色图片作为所述原始图片数据集。

可选地，在本申请的一个实施例中，还包括：

获取所述原始图片数据集中每张原始图片对应的深度图片和相机内外参数；

将所述深度图片、所述相机内外参数和所述符号距离场作为所述网络模型训练的原始数据。

可选地，在本申请的一个实施例中，所述将所述原始图片数据集和所述符号距离场输入网络模型进行训练，获取输出彩色图片，并通过能量函数对所述输出彩色图片和原始渲染彩色图片进行计算，调整所述网络模型的网络参数，获取已训练的网络模型，包括：

搭建编码器解码器网络，其中，所述编码器解码器网络包含隐式模板映射网络；

将所述编码器解码器网络的输出彩色图片和原始渲染彩色图片输入监督网络，约束所述监督网络逐卷积层提取的特征图满足预设条件；

利用构建的带纹理模型数据库和所述能量函数对生成式对抗神经网络中的生成器和鉴别器的参数权重进行迭代回归优化，直至权重收敛，获取所述已训练的网络模型。

为达上述目的，本申请第二方面实施例提出了一种基于隐式模板映射的单视图车辆重建装置，包括：

第一获取模块，用于获取不同类型车辆的三维车辆模型数据库；

第二获取模块，用于对所述三维车辆模型数据库中每个原始三维车辆模型的不同部件进行随机纹理赋值，获取三维带纹理车辆模型；

获取提取模块，用于对所述三维带纹理车辆模型在多个不同场景下进行渲染，获取原始图片数据集，并对所述每个原始三维车辆模型进行处理，提取符号距离场；

训练模块，用于将所述原始图片数据集和所述符号距离场输入网络模型进行训练，获取输出彩色图片，并通过能量函数对所述输出彩色图片和原始渲染彩色图片进行计算，调整所述网络模型的网络参数，获取已训练的网络模型；

处理模块，用于获取待处理车辆彩色图片输入所述已训练的网络模型，获取车辆网格模型。

本申请实施例的基于隐式模板映射的单视图车辆重建装置，通过获取不同类型车辆的三维车辆模型数据库，对三维车辆模型数据库中每个原始三维车辆模型的不同部件进行随机纹理赋值，获取三维带纹理车辆模型；对三维带纹理车辆模型在多个不同场景下进行渲染，获取原始图片数据集，并对每个原始三维车辆模型进行处理，提取符号距离场；将原始图片数据集和符号距离场输入网络模型进行训练，获取输出彩色图片，并通过能量函数对输出彩色图片和原始渲染彩色图片进行计算，调整网络模型的网络参数，获取已训练的网络模型；获取待处理车辆彩色图片输入已训练的网络模型，获取车辆网格模型。由此，只需要使用渲染得到的虚拟数据库，基于隐式模板映射的生成式对抗网络在预测车辆几何结构的同时获得纹理特征。

可选地，在本申请的一个实施例中，所述第一获取模块，具体用于：

可选地，在本申请的一个实施例中，所述第二获取模块，具体用于：

可选地，在本申请的一个实施例中，还包括：

第三获取模块，用于获取所述原始图片数据集中每张原始图片对应的深度图片和相机内外参数，将所述深度图片、所述相机内外参数和所述符号距离场作为所述网络模型训练的原始数据。

可选地，在本申请的一个实施例中，所述训练模块，具体用于：

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为本申请实施例所提供的一种基于隐式模板映射的单视图车辆重建方法的流程示意图；

图2为本申请实施例所提供的一种基于隐式模板映射的单视图车辆重建装置的结构示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的基于隐式模板映射的单视图车辆重建方法和装置。

图1为本申请实施例所提供的一种基于隐式模板映射的单视图车辆重建方法的流程示意图。

具体地，本申请涉及基于隐式模板映射的单视图车辆重建算法，作为计算机视觉的三维重建领域与自动驾驶领域的交叉研究，道路场景带纹理特征的车辆三维重建备受关注。本申请基于隐式模板映射的单视图车辆重建方法，包括通过三维建模，获取高精度的不同类型车辆三维模型数据库；通过对车辆模型不同部件进行随机纹理赋值，获取高精度带纹理车辆三维模型数据库；对原始三维模型进行不同视角，不同光照条件下的渲染，得到图片作为网络训练时的原始数据；对车辆三维模型进行处理，提取符号距离场(SignedDistance Field)；基于Pytorch深度学习平台搭建编码器解码器网络，其中包含隐式模板映射网络；设计基于L1范数的RGB loss、SDF loss作为主要约束的能量函数，辅助以对于模板映射环节的邻域位移平滑约束；为了增强网络的学习能力，设计监督网络，将网络输出结果的彩色图片与真实渲染得到的彩色图片输入监督网络，约束监督网络逐卷积层提取的特征图趋近；利用构建的带纹理模型数据库和合理的能量函数对生成式对抗神经网络中的生成器和鉴别器的参数权重进行迭代回归优化，直至权重基本收敛；将利用已知相机参数采集的真实场景下车辆彩色图片作为输入，网络即可输出包含纹理特征的车辆网格模型。

如图1所示，该基于隐式模板映射的单视图车辆重建方法包括以下步骤：

步骤101，获取不同类型车辆的三维车辆模型数据库，对三维车辆模型数据库中每个原始三维车辆模型的不同部件进行随机纹理赋值，获取三维带纹理车辆模型。

在本申请实施例中，对不同类型车辆进行三维建模，获取三维车辆模型数据库，即通过三维建模，获取高精度的不同类型车辆三维模型数据库。

步骤102，对三维带纹理车辆模型在多个不同场景下进行渲染，获取原始图片数据集，并对每个原始三维车辆模型进行处理，提取符号距离场。

在本申请实施例中，对三维带纹理车辆模型在不同视角，不同光照条件下进行渲染，获取多个渲染彩色图片作为原始图片数据集，即通过对车辆模型不同部件进行随机纹理赋值，获取高精度带纹理车辆三维模型数据库，L.对原始三维模型进行不同视角，不同光照条件下的渲染，得到图片作为网络训练时的原始数据，以及M.对车辆三维模型进行处理，提取符号距离场。

在本申请实施例中，获取原始图片数据集中每张原始图片对应的深度图片和相机内外参数；将深度图片、相机内外参数和符号距离场作为网络模型训练的原始数据。

步骤103，将原始图片数据集和符号距离场输入网络模型进行训练，获取输出彩色图片，并通过能量函数对输出彩色图片和原始渲染彩色图片进行计算，调整网络模型的网络参数，获取已训练的网络模型。

在本申请实施例中，搭建编码器解码器网络，其中，编码器解码器网络包含隐式模板映射网络；将编码器解码器网络的输出彩色图片和原始渲染彩色图片输入监督网络，约束监督网络逐卷积层提取的特征图满足预设条件；利用构建的带纹理模型数据库和能量函数对生成式对抗神经网络中的生成器和鉴别器的参数权重进行迭代回归优化，直至权重收敛，获取已训练的网络模型。

具体地，基于Pytorch深度学习平台搭建编码器解码器网络，其中包含隐式模板映射网络，设计基于L1范数的RGB loss、SDF loss作为主要约束的能量函数，辅助以对于模板映射环节的邻域位移平滑约束，为了增强网络的学习能力，设计监督网络，将网络输出结果的彩色图片与真实渲染得到的彩色图片输入监督网络，约束监督网络逐卷积层提取的特征图趋近，利用构建的带纹理模型数据库和合理的能量函数对生成式对抗神经网络中的生成器和鉴别器的参数权重进行迭代回归优化，直至权重基本收敛。

也就是说，初始数据为三维带纹理车辆模型，通过高真实感渲染方法得到接近自然光照条件下的RGB图片，上述数据作为网络驱动，网络中的隐式模板映射网络模块实现将颜色预测从三维空间分布约束到二维模板车辆表面分布，生成式对抗网络结构将监督网络的各层特征图作为约束，这一方式有效促进网络训练收敛以及结果精细化。

步骤104，获取待处理车辆彩色图片输入已训练的网络模型，获取车辆网格模型。

具体地，将利用已知相机参数采集的真实场景下车辆彩色图片作为输入，网络即可输出包含纹理特征的车辆网格模型。

举例而言，采集训练部分，通过三维建模，建立包含800个左右精细的不同彩色纹理的车辆三维模型数据库，在不同视角和不同光照条件下进行渲染，得到数目大约有5000张的原始图片数据集，同时获取原始图片对应的深度图片和相机内外参数，以及通过车辆几何获取的符号距离场(Signed Distance Field)，作为对生成式对抗神经网络训练时的原始数据。使用基于Pytorch深度学习平台搭建的神经网络结构进行训练，直至网络中的权重值基本收敛；测试和使用部分。利用已知相机参数的彩色相机采集道路上车辆的RGB图片，将其作为训练好的网络模型的输入部分，网络中的生成器部分就可以输出包含彩色纹理车辆三维几何。

由此，对于精细的车辆三维模型数据库，利用多视角深度图渲染方法获取其符号距离场(Signed Distance Field)，并利用高真实感渲染得到逼真的彩色数据及对应深度数据。通过搭建基于隐式模板映射的生成式对抗神经网络，实现将三维颜色分布约束到二维表面颜色分布。已知相机参数的彩色相机采集道路上车辆的RGB图片作为输入，网络即可输出包含纹理特征的车辆网格模型。

为了实现上述实施例，本申请还提出一种基于隐式模板映射的单视图车辆重建装置。

图2为本申请实施例提供的一种基于隐式模板映射的单视图车辆重建装置的结构示意图。

如图2所示，该基于隐式模板映射的单视图车辆重建装置包括：第一获取模块210、第二获取模块220、获取提取模块230、训练模块240和处理模块250。

第一获取模块210，用于获取不同类型车辆的三维车辆模型数据库。

第二获取模块220，用于对所述三维车辆模型数据库中每个原始三维车辆模型的不同部件进行随机纹理赋值，获取三维带纹理车辆模型。

获取提取模块230，用于对所述三维带纹理车辆模型在多个不同场景下进行渲染，获取原始图片数据集，并对所述每个原始三维车辆模型进行处理，提取符号距离场。

训练模块240，用于将所述原始图片数据集和所述符号距离场输入网络模型进行训练，获取输出彩色图片，并通过能量函数对所述输出彩色图片和原始渲染彩色图片进行计算，调整所述网络模型的网络参数，获取已训练的网络模型。

处理模块250，用于获取待处理车辆彩色图片输入所述已训练的网络模型，获取车辆网格模型。

在本申请实施例中，第一获取模块210，具体用于：对所述不同类型车辆进行三维建模，获取所述三维车辆模型数据库。

在本申请实施例中，第二获取模块220，具体用于：对所述三维带纹理车辆模型在不同视角，不同光照条件下进行渲染，获取多个渲染彩色图片作为所述原始图片数据集。

在本申请实施例中，第三获取模块，用于获取所述原始图片数据集中每张原始图片对应的深度图片和相机内外参数，将所述深度图片、所述相机内外参数和所述符号距离场作为所述网络模型训练的原始数据。

在本申请实施例中，训练模块，具体用于：搭建编码器解码器网络，其中，所述编码器解码器网络包含隐式模板映射网络；将所述编码器解码器网络的输出彩色图片和原始渲染彩色图片输入监督网络，约束所述监督网络逐卷积层提取的特征图满足预设条件；利用构建的带纹理模型数据库和所述能量函数对生成式对抗神经网络中的生成器和鉴别器的参数权重进行迭代回归优化，直至权重收敛，获取所述已训练的网络模型。

需要说明的是，前述对基于隐式模板映射的单视图车辆重建方法实施例的解释说明也适用于该实施例的基于隐式模板映射的单视图车辆重建装置，此处不再赘述。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于隐式模板映射的单视图车辆重建方法，其特征在于，包括:

获取待处理车辆彩色图片输入所述已训练的网络模型，获取车辆网格模型；

其中，所述将所述原始图片数据集和所述符号距离场输入网络模型进行训练，获取输出彩色图片，并通过能量函数对所述输出彩色图片和原始渲染彩色图片进行计算，调整所述网络模型的网络参数，获取已训练的网络模型，包括：

2.如权利要求1所述的方法，其特征在于，所述获取不同类型车辆的三维车辆模型数据库，包括：

3.如权利要求1所述的方法，其特征在于，所述对所述三维带纹理车辆模型在多个不同场景下进行渲染，获取原始图片数据集，包括：

4.如权利要求1所述的方法，其特征在于，还包括：

5.一种基于隐式模板映射的单视图车辆重建装置，其特征在于，包括:

处理模块，用于获取待处理车辆彩色图片输入所述已训练的网络模型，获取车辆网格模型；

其中，所述训练模块，具体用于：

6.如权利要求5所述的装置，其特征在于，所述第一获取模块，具体用于：

7.如权利要求5所述的装置，其特征在于，所述第二获取模块，具体用于：

8.如权利要求5所述的装置，其特征在于，还包括：