CN114998405A

CN114998405A - 基于图像驱动的数字化人体模型构建方法

Info

Publication number: CN114998405A
Application number: CN202210790323.XA
Authority: CN
Inventors: 戴翘楚; 吴翼天; 曹静萍
Original assignee: Hangzhou Yilan Technology Co ltd
Current assignee: Hangzhou Yilan Technology Co ltd
Priority date: 2022-07-06
Filing date: 2022-07-06
Publication date: 2022-09-02

Abstract

本发明公开了基于图像驱动的数字化人体模型构建方法，包括使用成像设备进行人体拍摄，得到人体在不同姿势下的图像；将得到的图像与标准化的人体参数化模型进行对齐，得到对齐后的形状姿势参数；构建初始神经网络并进行训练，得到将对齐后的模型图像向三维模型转换的神经网络；将拍摄得到的单视角RGB‑D序列导入训练后的神经网络中得到动态人体三维模型序列。

Description

基于图像驱动的数字化人体模型构建方法

技术领域

本申请涉及计算机视觉与计算机图形学领域，特别涉及基于图像驱动的数字化人体模型构建方法。

背景技术

单视角人体动态重建是计算机图形学和计算机视觉领域的重点问题。高质量的人体重建序列在影视娱乐、人体数字化等领域有着广泛的应用前景和重要的应用价值。但是高质量、高拟真度的人体动态序列获取通常依靠价格昂贵的激光扫描仪或者多相机阵列系统对人体建模来实现。

虽然效果较为真实，但是也显著存在着一些缺点：第一，设备复杂，这些方法往往需要多相机阵列的搭建；第二，建模速度慢，重建一个三维人体模型往往需要至少10分钟到数小时的时间，而重建人体动态序列则需要更久的时间。

发明内容

本申请实施例提出了基于图像驱动的数字化人体模型构建方法，借助单个RGBD相机的拍摄数据即可在实际应用中方便地生成人体动态模型序列，简化了建模所需的设备规模；同时由于处理数据的规模减少，因此也缩短了建模时长。

具体的，本申请实施例提出的基于图像驱动的数字化人体模型构建方法，包括：

S1，使用成像设备进行人体拍摄，得到人体在不同姿势下的图像；

S2，将得到的图像与标准化的人体参数化模型进行对齐，得到对齐后的形状姿势参数；

S3，构建初始神经网络并进行训练，结合已得到的形状姿势参数得到将对齐后的模型图像向三维模型转换的神经网络；

S4，将拍摄得到的单视角RGB-D序列导入训练后的神经网络中得到动态人体三维模型序列。

可选的，所述S2包括：

S21，构建对应人体参数化模型的能量函数；

S22，对能量函数进行最优化求解，得到对应人体参数化模型的形状姿势参数。

可选的，所述S21包括：

构建如公式一所示的能量函数

表达式，

，公式一；

其中，姿势函数表达式

，形状参数表达式

，

是人体参数化模型的顶点坐标，

是人体参数化模型的法向，

是扫描模型上的最近邻对应点，

分别是待求解人体参数化模型的姿势参数、形状参数。

可选的，所述S3包括：

S31，采用卷积神经网络提取输入图像的特征图

，构建对应特征图

的神经网络；

S32，建立对应神经网络的损失函数表达式，对表达式进行求解，得到损失最小情况下的神经网络。

可选的，所述S31包括：

在人体参数化模型上采样

个节点，每个节点定义一个局部编码器来编码空间点的位置信息以及当前人体姿势信息；

对于三维空间中任意点

进行编码分别获得图像特征

以及相对坐标特征

：

，公式二；

，公式三；

其中，

分别是点

所对应的图像特征以及位置与姿势特征，

表示向二维图像平面的投影函数，

是加权权重，代表了节点

对点

的影响权重，

是点

相对于节点

的相对坐标，

是参数化人体模型的姿势参数；

通过小网络

将级联之后的特征映射到占用值函数场，得到如公式四所示的神经网络表达式，

，公式四。

可选的，所述S32包括：

通过图像和扫描模型数据进行端到端的训练，其损失函数定义为

其中，

为真实占用值，由扫描数据获得。

可选的，所述S4包括：

S41，将单视角RGB-D序列按深度信息逐步导入训练后的神经网络中；

S42，在神经网络中按深度信息对图像中的RGB信息进行转换，得到与姿势相关的动态数据序列。

有益效果：

通过构建图像到三维模型转换的神经网络，代替了现有技术中使用大量样本图像构建人体三维模型的复杂方案，同时由于仅需使用单个相机拍摄的RGB-D图像序列，代替现有技术中使用多相机阵列构成的图像采集系统，从而在大幅简化系统结构的同时也降低了构建成本。

附图说明

为了更清楚地说明本申请的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提出的基于图像驱动的数字化人体模型构建方法的流程图。

具体实施方式

为使本申请的结构和优点更加清楚，下面将结合附图对本申请的结构作进一步地描述。

本申请实施例提出一种图像驱动的数字人体化身模型构建方法，应用于单视角人体动态重建，相较于其他重建方法，该方法可以重建更加动态、并且与姿势相关的人体动态模型序列。

具体的，本申请实施例提出的基于图像驱动的数字化人体模型构建方法，如图1所示，包括：

在实施中，基于密集多视点相机系统采集人体多个姿势下的三维模型，基于深度学习的方法构建单视角图像到模型的映射关系，在使用过程中只需输入单视角RGBD图像序列，神经网络就会推测出动态连续的人体三维模型序列。该方法主要包括以下步骤：使用包括多相机系统或扫描仪等设备在内的成像设备对单个人体采集不同姿势下的高质量模型；然后对每个模型对齐人体参数化模型；随后构建从图像到模型映射的神经网络，并对进行网络训练；训练完成后，可以获得一个训练好的、由图像驱动的端到端的映射网络；最后，可以通过同一人体拍摄的单视角RGBD序列生成与之对应的动态人体三维模型序列。

在实际应用过程中，通过同一人体拍摄的单视角RGBD序列生成与之对应的动态人体三维模型序列，并且该序列具有姿势相关的动态几何细节。

根据本发明实施例的图像驱动的人体三维模型，利用多相机系统或扫描仪获得同一人体的不同姿势下的模型，通过神经网络建立图像到模型的映射关系，在实际应用中可以方便快捷地仅适用单个RGBD图像即可重建相应的动态人体三维模型序列。该方法所需的输入信息非常容易采集，拥有广阔的应用前景，可以在PC机或工作站等硬件系统上快速实现。