CN116246010A

CN116246010A - 一种基于图像的人体三维重建方法

Info

Publication number: CN116246010A
Application number: CN202211546047.9A
Authority: CN
Inventors: 陈瑞; 杨航; 牟洋
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2022-12-05
Filing date: 2022-12-05
Publication date: 2023-06-09

Abstract

本发明公开一种基于图像的人体三维重建方法，由姿态融合三维人体重建网络与图神经辐射场三维人体重建网络各自对输入图像进行处理重建后，再进行融合实现最终的三维重建；姿态融合三维人体重建网络包括表面法向图生成模块、表面法向图特征编码模块、人体姿态特征编码模块、特征解码重建模块、背面图像生成模块以及纹理映射模块，图神经辐射场三维人体重建网络包括姿态优化模块、人体图像编码模块、特征解码模块以及集成模块。本发明提高了人体三维模型与人体新视角图像的重建质量。

Description

一种基于图像的人体三维重建方法

技术领域

本发明涉及三维重建技术领域，特别是涉及姿态融合三维人体重建网络与图神经辐射场三维人体重建网络的人体三维重建方法。

背景技术

基于图像的人体三维重建是指从单张或多张人体二维图像中重建出人体三维模型的过程，是计算机视觉中研究价值较高的一个方向。

深度学习背景下的人体三维重建方法利用大量数据建立先验知识，将三维重建的过程转变为编码与解码，直接从二维图像中对人体进行三维重建。早期的人体三维重建方法通过重建人体参数化模型进行人体三维重建，但人体参数化模型只能表示人体的三维姿态，无法表示衣服等细节信息。为了获得更加良好的人体三维重建的重建表现和泛化能力，基于隐式函数的人体三维重建方法使用堆叠沙漏网络对图像进行编码，通过多层感知机解码隐式函数，预测三维点在人体模型的内部和外部的分布，构建点标签形式的隐式函数，使用提取算法从隐式表示中提取网格信息，重建人体模型。

基于神经辐射场的三维重建方法在多个视角上聚合图像特征，通过解码器获取颜色和体密度值，以体渲染的方式进行图像渲染。基于神经辐射场的方法在多个场景或特定的目标类上进行训练，从一个或多个视角的图像中进行三维重建。一些研究将人体参数化模型与神经辐射场相结合，从人体视频中建立神经辐射场并渲染出人体的其他视角的图像。然而，全局特征编码器对全局姿态敏感，只使用全局特征编码器的方法对复杂的人体姿态的重建效果较差，使用多层感知机进行特征解码的方式忽略了三维点之间的相互关系，对人体细节部位的重建效果较差。而准确提取图像特征和人体姿态特征并进行高效的特征解码，提升不同姿态的泛化能力是提高人体三维重建表现的关键。

发明内容

本发明的目的是针对现有技术中存在的重建表现较差和泛化能力不足的问题，提供一种基于图像的人体三维重建方法，旨在高效提取人体图像中的特征，获得具有良好质量的人体三维模型。

为实现本发明的目的所采用的技术方案是：

基于图像的人体三维重建方法，由姿态融合三维人体重建网络与图神经辐射场三维人体重建网络各自对输入图像进行处理三维重建后再进行融合实现最终的三维重建；其中，姿态融合三维人体重建网络包括表面法向图生成模块、表面法向图特征编码模块、人体姿态特征编码模块、特征解码重建模块、背面图像生成模块以及纹理映射模块；图神经辐射场三维人体重建网络包括姿态优化模块、人体图像编码模块、特征解码模块以及集成模块；

处理步骤如下：

由人体图像X_i通过姿态估计方法预测人体参数化模型M_smp，送入到可微渲染器得到人体参数化模型正面法向图N_sf和人体参数化模型背面法向图N_sb，与人体图像X_i共同送入表面法向图生成模块，获取人体正面法向图N_cf和人体背面法向图N_cb，送入表面法向图特征编码模块提取人体表面法向图特征f_i；将人体参数化模型M_smp送入人体姿态特征编码模块，提取局部特征编码f_lo和体积特征编码f_v，与人体表面法向图特征f_i共同送入特征解码重建模块，获取符号距离函数值s_d并重建无色彩纹理的人体三维模型Y_s输出；人体图像X_i和人体背面法向图N_cb共同送入背面图像生成模块生成人体背面图像X_b，人体图像X_i、人体背面图像X_b和无色彩纹理的人体三维模型Y_s共同送入纹理映射模块重建具有正面色彩纹理和背面色彩纹理的人体三维模型Y_c输出；

由人体图像编码模块提取人体图像X_i的图像特征f_r，图像特征f_r与人体图像X_i分别进行网格采样插值并进行特征拼接，获取图像特征编码f_ca；将人体图像X_i的像素转换为神经辐射场中的三维点坐标p，附加位置编码，获取具有位置编码的三维点特征f_l并将姿态特征f_s送入姿态优化模块获取优化后的姿态编码f_rs；由相机参数计算出三维点的方向编码f_v，与图像特征编码f_ca、姿态特征f_rs和三维点特征f_l共同送入特征解码模块，获取颜色值c和形状特征f_σ；将符号距离函数值s_d和形状特征f_σ共同送入集成模块获取体密度值σ，渲染输出相机参数所对应的人体预设视角图像Y_n。

本发明采用表面法向图特征编码模块来进行特征提取，使用堆叠网络单元对人体表面法向图进行编码，增加网络的深度并融合不同阶段的特征，在残差编码中加入通道注意力层并使用Transformer网络编码捕获长距离依赖关系，获取人体表面法向图的不同部位之间的关系，提高特征提取信息的效率。

本发明采用人体姿态特征编码模块提取人体参数化模型的局部特征编码和体积特征编码，计算人体参数化模型的符号距离函数获取人体参数化模型的局部特征编码，将人体参数化模型进行体素化，通过三维残差编码获取人体参数化模型的体积特征编码，结合人体参数化模型的局部特征编码和体积特征编码，重建具有较高的精细度和完整度的人体三维模型。

本发明采用特征解码重建模块进行特征解码，将人体表面法向图特征、局部特征编码和体积特征编码共同送入特征解码器，获取人体三维模型的符号距离函数值，通过行进立方体算法重建无色彩纹理的人体三维模型。特征解码器由图卷积编码和一维卷积编码构成，利用KNN算法构建三维点的图结构，获取相邻三维点之间关系，更加高效地进行特征解码。

本发明采用纹理映射模块，使用网格采样插值提取人体模型颜色编码，将网格模型光栅化，选择不重复值获取人体模型可见性，利用人体模型颜色编码和人体模型可见性获取三维模型的正面色彩纹理和背面色彩纹理，同时利用人体图像和人体背面图像进行纹理映射，提高重建纹理的完整度，获取具有正面色彩纹理和背面色彩纹理的人体三维模型。

本发明采用姿态优化模块，使用KNN算法构建高维姿态特征所对应的姿态特征图结构，将姿态特征图结构送入图卷积编码，获取高维的姿态优化特征，提高了姿态优化的效果。

本发明采用人体图像编码模块，使用堆叠网络单元对人体图像进行编码，增加网络的深度并融合不同阶段的特征，将图像特征分为多个部分并使用KNN算法构建图像特征的图结构，获取人体图像的不同部位之间的关系，提高特征提取信息的效率，为生成人体新视角的图像提供更加准确的人体图像特征，提高生成人体新视角的图像的效果。

其中，由人体图像X_i通过姿态估计方法预测人体参数化模型M_smp，送入到可微渲染器得到人体参数化模型正面法向图N_sf和人体参数化模型背面法向图N_sb，表述如下：

其中，G_s(·)表示姿态估计的操作，R_f(·),R_b(·)表示渲染人体参数化模型正面法向图、背面法向图的操作。

所述将人体图像X_i、人体参数化模型正面法向图N_sf和人体参数化模型人体背面法向图N_sb共同送入表面法向图生成模块，得到人体正面法向图N_cf和人体背面法向图N_cb的步骤如下：

将人体图像X_i与人体参数化模型正面法向图N_sf进行特征拼接后，送入图像编码器处理，得到表示人体参数化模型正面法向图编码特征f_sf，将人体图像X_i与人体参数化模型正面法向图N_sf进行特征拼接后，送入图像编码器处理，得到人体参数化模型背面法向图编码特征f_sb，对人体参数化模型正面法向图编码特征和人体参数化模型背面法向图编码特征f_sf,f_sb分别送入残差编码器进行处理后上采样操作，得到人体正面法向图N_cf和人体背面法向图N_cb；表示如下：

其中，f_sf,f_sb分别表示人体参数化模型正面法向图编码特征和人体参数化模型背面法向图编码特征，E_s(·)表示图像编码器操作，图像编码器由卷积层、实例归一化与Relu激活函数组成，F_cat(·)表示特征拼接操作，E_res(·)表示残差编码器操作，残差编码器由卷积层、通道注意力层、批量归一化与Relu激活函数组成，F_up(·)表示上采样操作，上采样由转置卷积层、批量归一化与Relu激活函数组成。

其中，所述表面法向图特征编码模块提取人体表面法向图特征f_i的步骤如下：

分别对人体正面法向图和人体背面法向图进行编码，获取人体正面法向图特征编码和人体背面法向图特征编码，将特征编码拼接后进行网格采样插值获取人体表面法向图特征f_i：

其中，E_c(·)表示表面法向图编码模块的人体表面法向图编码操作，表面法向图编码模块由堆叠网络单元、残差单元和卷积层组成，其中堆叠网络单元包含最大池化层、Transformer网络编码层和上采样层，Transformer网络编码层包含多头注意力层、层归一化及多层感知层，残差单元包含卷积层与Relu激活函数，f_cf表示人体正面法向图特征编码，f_cb表示人体背面法向图特征编码，F_cat(·)表示特征拼接的操作，F_grid(·)表示网格采样插值。

其中，所述人体姿态特征编码模块提取局部特征编码f_lo和体积特征编码f_v具体步骤如下：

计算人体参数化模型的符号距离函数，获取人体参数化模型的符号距离函数编码，将人体参数化模型进行体素化，通过三维残差单元获取体素化后人体参数化模型的三维特征编码，通过网格采样插值，基于符号距离函数编码获取局部特征编码和基于三维特征编码提取体积特征编码：

其中，F_sdf(·)表示计算人体参数化模型M_smp的符号距离函数的操作，F_vol(·)表示网格模型体素化的操作，E_3d(·)表示通过三维残差单元获取体素化后人体参数化模型M_smp的三维特征编码的操作，F_grid(·)表示网格采样插值，f_lo表示局部特征编码，f_v表示体积特征编码。

其中，所述特征解码重建无色彩纹理的人体三维模型Y_s输出的处理步骤如下：

将人体表面法向图特征f_i、局部特征编码f_lo和体积特征编码f_v共同送入特征解码器，获取三维模型的符号距离函数值s_d，基于符号距离函数值通过行进立方体算法重建无色彩纹理的人体三维模型Y_s：

其中，F_cat(·)表示特征拼接操作，E_g(·)表示图卷积解码器的操作，图卷积解码器由图卷积层、一维卷积层、批量归一化与Relu激活函数组成，s_d表示符号距离函数值，F_mc(·)表示行进立方体算法的操作，Y_s表示无色彩纹理的三维模型。

其中，所述背面图像生成模块生成人体背面图像x_b的处理步骤如下：

将人体图像X_i和人体背面法向图N_cb进行拼接编码获取人体背面编码特征，送入图像编码进行编码，形成人体背面编码特征，然后送入通道注意力残差单元进行编码，并经过上采样后获取人体背面图像x_b：

其中，f_bf表示人体背面编码特征，E_s(·)表示图像编码器的操作，图像编码器由卷积层、实例归一化与Relu激活函数组成，F_cat(·)表示特征拼接，E_res(·)表示通道注意力残差单元的操作，通道注意力残差单元由卷积层、通道注意力层、批量归一化与Relu激活函数组成，F_up(·)表示上采样的操作，上采样由转置卷积层、批量归一化与Relu激活函数组成。

其中，所述纹理映射的处理步骤如下：

使用网格采样插值值对人体图像X_i提取人体模型颜色编码，将人体模型颜色编码通过网格模型光栅化，选择不重复值获取人体模型可见性；基于无色彩纹理的人体三维模型Y_s，利用人体模型颜色编码和人体模型可见性得到具有正面色彩纹理的三维模型；使用网格采样插值对人体背面图像X_b提取人体背面模型颜色编码，将人体背面模型颜色编码通过网格模型光栅化，并选择不重复值获取人体背面模型可见性，得到人体背面模型可见性；基于具有正面色彩的三维模型、人体背面模型颜色编码以及人体背面模型可见性，利用人体图像X_i和人体背面图像X_b进行纹理映射，得到具有正面色彩纹理和背面色彩纹理的人体三维模型Y_c：

其中，F_grid(·)表示网格采样插值，f_fc表示人体正面模型颜色编码，F_ras(·)表示网格模型光栅化，F_u(·)表示选择不重复值的操作，f_fv表示人体正面模型可见性，Y_cf表示具有正面色彩纹理的三维模型，f_bc表示人体背面模型颜色编码，f_bv表示人体背面模型可见性，Y_c表示具有正面色彩纹理和背面色彩纹理的三维模型。

其中，所述姿态优化模块的处理步骤如下：

将姿态特征送入线性层，获取高维度的姿态特征，使用KNN算法构建高维度的姿态特征所对应的姿态特征图结构，将姿态特征图结构送入图卷积单元和线性层，获取姿态优化特征，利用罗德里格旋转公式计算优化后的姿态特征：

其中，f_s表示姿态特征，E_l(·)表示线性层的操作，F_knn(·)表示KNN算法的操作，g_f表示姿态特征图结构，E_g(·)表示图卷积单元的操作，f_gs表示姿态优化特征，f_rs表示优化后的姿态特征，F_rod(·)表示罗德里格旋转操作，具体公式如下：

F_rod(r)＝cosθI+(1-cosθ)nn^T+sinθn^

其中，I是单位矩阵，n是向量r的单位向量，θ是向量r的模长，n^T表示n的转置矩阵，n^表示n的反对称矩阵。

其中，所述人体图像编码模块的处理步骤如下：

人体图像编码模块对人体图像X_i提取图像特征f_r，图像特征f_r与人体图像X_i分别进行网格采样插值并进行特征拼接，获取图像特征编码f_c：

其中，E_c(·)表示人体图像编码模块的操作，人体图像编码模块由堆叠网络单元、残差单元和卷积层组成，其中堆叠网络单元包含池化层、图卷积块和上采样层，图卷积块包含图卷积层、线性层与Relu激活函数。

本发明的方法提出了姿态融合三维人体重建网络与图神经辐射场三维人体重建网络，通过姿态融合三维人体重建网络重建360度视角的网格形式人体三维模型，通过图神经辐射场三维人体重建网络从人体图像中重建符合精度人体神经辐射场，渲染得到人体任意角度的图像。

本发明同时考虑局部特征和全局特征，将融合的特征送入特征解码重建模块重建人体形状三维模型，由人体图像和表面法向图获取人体背面生成图像，利用人体图像和人体背面生成图像进行纹理映射，取得了良好的形状重建效果和颜色纹理重建效果，进一步提高了人体三维模型的重建质量。

附图说明

图1为本发明实施例的三维重建方法流程图；

图2为本发明实施例的表面法向图生成模块的结构图；

图3为本发明实施例的表面法向图特征编码模块的结构图；

图4为本发明实施例的特征解码重建模块和纹理映射模块的结构图；

图5为本发明实施例的人体图像编码模块的结构图。

具体实施方式

以下结合附图和具体实施例对本发明作进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本发明实施例的基于图像的人体三维重建方法，由姿态融合三维人体重建网络与图神经辐射场三维人体重建网络处理实现，姿态融合三维人体重建网络的输入条件为单张图像，至少4张图像，姿态融合三维人体重建网络重建360度视角的网格形式人体三维模型；图神经辐射场三维人体重建网络从人体图像(如500张以上)中重建符合精度人体神经辐射场，渲染得到人体任意角度的图像。

其中，所述姿态融合三维人体重建网络包括表面法向图生成模块、表面法向图特征编码模块、人体姿态特征编码模块、特征解码重建模块、背面图像生成模块以及纹理映射模块，所述图神经辐射场三维人体重建网络包括人体图像编码模块、姿态优化模块、特征解码模块以及集成模块。

所述姿态融合三维人体重建网络重建时，首先通过表面法向图生成模块获取表面法向图，由表面法向图特征编码模块获取表面法向图特征编码，从人体参数化模型中提取局部特征编码和体积特征编码，将融合的特征送入特征解码重建模块重建人体形状三维模型，由人体图像和表面法向图获取人体背面生成图像，然后基于纹理映射模块利用人体图像和人体背面生成图像进行纹理映射；

所述图神经辐射场三维人体重建网络重建时，首先通过人体图像编码模块提取人体图像的图像特征，与人体图像分别进行网格采样插值并进行特征拼接，获取图像特征编码，将人体图像的像素转换为神经辐射场中的三维点，将三维点附加位置编码并将姿态特征送入姿态优化模块获取优化后的姿态编码，由相机参数计算出三维点的方向编码，与图像特征编码、姿态编码和三维点特征共同送入特征解码模块，获取颜色值和形状特征；将符号距离函数值和形状特征共同送入集成模块获取体密度值，渲染输出人体新视角图像。

本发明采用表面法向图特征编码模块来进行特征提取，使用堆叠网络对人体表面法向图进行编码，增加网络的深度并融合不同阶段的特征，在残差编码中加入通道注意力层并使用Transformer网络编码捕获长距离依赖关系，获取人体表面法向图的不同部位之间的关系，提高特征提取信息的效率。

本发明采用个人体图像编码模块，使用堆叠网络对人体图像进行编码，增加网络的深度并融合不同阶段的特征，将图像特征分为多个部分并使用KNN算法构建图像特征的图结构，获取人体图像的不同部位之间的关系，提高特征提取信息的效率，为生成人体新视角的图像提供更加准确的人体图像特征，提高生成人体新视角的图像的效果。

本发明提出的人体三维重建方法整体流程如图1所示，其中，姿态融合三维人体重建网络的流程包括表面法向图生成模块、表面法向特征编码模块、人体姿态特征编码模块、特征解码重建模块、纹理映射模块；图神经辐射场三维人体重建网络的流程包括姿态优化模块、人体图像编码模块、特征解码模块以及集成模块。

由人体图像X_i通过姿态估计方法预测人体参数化模型M_smp，送入到可微渲染器得到人体参数化模型正面法向图N_sf和人体参数化模型背面法向图N_sb，与人体图像X_i共同送入表面法向图生成模块，获取人体正面法向图N_cf和人体背面法向图N_cb，送入表面法向图特征编码模块提取人体表面法向图特征f_i；将人体参数化模型M_smp送入人体姿态特征编码模块，提取局部特征编码f_lo和体积特征编码f_v，与人体表面法向图特征f_i共同送入特征解码重建模块，获取符号距离函数值s_d并重建无色彩纹理的人体三维模型Y_s输出；人体图像X_i和人体背面法向图N_cb共同送入背面图像生成模块生成人体背面图像X_b，人体图像X_i、人体背面图像和无色彩纹理的人体三维模型Y_s共同送入纹理映射模块重建出具有正面色彩纹理和背面色彩纹理的人体三维模型Y_c输出。

由人体图像编码模块提取人体图像X_i的图像特征f_r，图像特征f_r与人体图像X_i分别进行网格采样插值并进行特征拼接，获取图像特征编码f_ca；将人体图像X_i的像素转换为神经辐射场中的三维点坐标p，附加位置编码，获取具有位置编码的三维点特征f_l并将姿态特征f_s送入姿态优化模块获取优化后的姿态编码f_rs；由相机参数计算出三维点的方向编码f_v，与图像特征编码f_ca、姿态编码f_rs和三维点特征f_l共同送入特征解码模块，获取颜色值c和形状特征f_σ，将符号距离函数值s_d和形状特征f_σ共同送入集成模块获取体密度值σ，渲染输出相机参数所对应的人体新视角图像Y_n。

本发明设计的表面法向图生成模块更加高效地进行表面法向图生成，由图像X_i通过姿态估计方法预测人体参数化模型M_smp，送入到可微渲染器得到人体参数化模型正面法向图N_sf和人体参数化模型背面法向图N_sb：

其中，G_s(·)表示姿态估计的操作，R_f(·),R_b(·)表示渲染人体参数化模型正面、背面法向图的操作，然后将人体正面图像、人体参数化模型正面法向图和人体参数化模型人体背面法向共同送入表面法向图生成模块，得到人体正面法向图N_cf和人体背面法向图N_cb：

其中，f_sf,f_sb分别表示人体参数化模型正面法向图编码特征和背面法向图编码特征，E_s(·)表示图像编码器的编码操作，图像编码器依次由卷积层、实例归一化与Relu激活函数组成，F_cat(·)表示特征拼接操作，E_res(·)表示残差编码器的编码操作，F_up(·)表示上采样操作，上采样层由转置卷积层、批量归一化与Relu激活函数组成。参见图2所示，所述表面法向图生成模块依次包括卷积层-残差单元1-残差单元2-残差单元3-残差单元4-残差单元5-残差单元6-残差单元7-残差单元8-残差单元9-上采样层构成，其中，其中的残差单元依次由Conv+Relu层,Conv+Relu层，Conv层，最大池化层，Conv+Relu层，Conv层以及Sigmoid激活层构成，前一级的Conv层的输出作为最大池化层的输入，同时与Sigmoid激活层的输出相加后，再与残差单元的输入一起作为残差单元的输出。

本发明设计的表面法向图特征编码模块分别对人体正面法向图和人体背面法向图进行编码，获取人体正面法向图特征编码和人体背面法向图特征编码，将特征编码拼接后进行网格采样插值获取人体表面法向图特征f_i：

其中，E_c(·)表示表面法向图特征编码模块的人体表面法向图编码的操作，表面法向图特征编码模块由堆叠网络单元、残差单元和卷积层组成，其中堆叠网络单元包含多级结构的最大池化层(AvgPool)、Transformer网络编码层和上采样层(upsamlpe),具体的，如四层结构的最大池化层、三个上采样层以及五个Transformer网络编码模块，最大池化层依次连接后通过最后一层的最大池化层通过一个Transformer网络编码模块与依次连接的三个上采样层的第一个上采样层连接，其它每个Transformer网络编码模块的输入为上一个最大池的输出，最后一个Transformer网络编码模块的输入为堆叠网络单元的输入，其它每个Transformer网络编码模块的输出同时作为每个上采样层的输入，最后一个Transformer网络编码模块的输出与最后一级的上采样层的输出作为堆叠网络单元的输出；所述Transformer网络编码模块依次包含层归一化层、多头注意力层W-MSA、层归一化层、多层感知层MLP，Transformer网络编码层的输入与多头注意力层W-MSA的输出作为下层的层归一化层的输入，下层的层归一化层的输入与多层感知层MLP的输出作为ransformer网络编码层的输出；残差单元依次包含Con+Relu层、Con+Relu层以及一个卷积层Con，残差单元的输入同时与其一个卷积层Con的输出作为表面法向图特征编码模块中与残差单元相邻的卷积层的输入；f_cf表示人体正面法向图特征编码，f_cb表示人体背面法向图特征编码，F_cat(·)表示特征拼接的操作，F_grid(·)表示网格采样插值。参见图3所示，表面法向图特征编码模块依次由堆叠网络单元-残差单元-卷积层-卷积层-卷积层-堆叠网络单元-残差单元-卷积层组成，第二堆叠网络单元的输入包括其上一级的卷积层的输出以及再上一级的卷积层的输出；

参见图1所示，本发明的人体姿态特征编码模块包括符号距离计算单元，模型体素化单元以及三维残差单元，本发明的人体姿态特征编码模块提取人体参数化模型的局部特征编码和体积特征编码，计算人体参数化模型的符号距离函数获取人体参数化模型的符号距离函数编码，将人体参数化模型进行体素化，通过三维残差单元获取人体参数化模型的三维特征编码，分别对符号距离函数编码和三维特征编码进行网格采样插值获取局部特征编码和体积特征编码：

其中，F_sdf(·)表示计算人体参数化模型的符号距离函数的操作，由符号距离计算单元进行处理，F_vol(·)表示网格模型体素化的操作，由模型体素化单元进行，E_3d(·)表示三维残差单元的操作，三维残差单元由三维卷积层、三维批量归一化与Relu激活函数组成，F_grid(·)表示网格采样插值，f_lo表示局部特征编码，f_v表示体积特征编码。

本发明设计的特征解码重建模块将人体表面法向图特征、局部特征编码和体积特征编码共同送入特征解码器，获取三维模型的符号距离函数值，通过行进立方体算法重建无色彩纹理的人体三维模型：

参见图4所示，本发明设计的特征解码重建模块依次由图卷积块--图卷积块-线性层—线性层构成，下级的图卷积块的输出同时作为两个线性层的输入，且下级的线性层的输入还包括上级的线性层的输出，其中，图卷积块依次由图卷积层GCN，Relu激活层，线性层Liner以及Relu激活层构成，线性层Liner的输入包括前一个Relu激活层的输出与图卷积块或是图卷积层GCN的输入，线性层Liner的输入与后一级Relu激活层的输出作为图卷积块的输出。

本发明设计的背面图像生成模块将人体图像和人体背面法向图进行拼接编码获取人体背面编码特征，送入通道注意力残差编码获取人体背面图像x_b：

其中，f_bf表示人体背面编码特征，E_s(·)表示图像编码器的操作，该图像编码器由卷积层、实例归一化与Relu激活函数组成，F_cat(·)表示特征拼接，E_res(·)表示残差单元的操作，该残差单元由卷积层、通道注意力层、批量归一化与Relu激活函数组成，F_up(·)表示上采样的操作，上采样层由转置卷积层、批量归一化与Relu激活函数组成。参见图4所示，所述背面图像生成模块依次包括卷积层-Relu激活层—残差单元以及上采样层依次连接组成，输入图像与人体背面法向图相加后作为该背面图像生成模块的卷积层的输入。

本发明设计的纹理映射模块，使用网格采样插值提取人体模型颜色编码，将网格模型光栅化，选择不重复值获取人体模型可见性，利用人体模型颜色编码和人体模型可见性获取三维模型的正面色彩纹理和背面色彩纹理，同时利用人体图像和人体背面图像进行纹理映射，提高重建纹理的完整度，获取具有正面色彩纹理和背面色彩纹理的人体三维模型：

本发明设计的姿态优化模块包括线性层单元以及图卷积单元，线性层单元的输出作为图卷积单元的输入，将姿态特征送入线性层单元，获取更高维度的姿态特征，使用KNN算法构建高维度的姿态特征所对应的姿态特征图结构，将姿态特征图结构送入图卷积单元进行卷积处理后再送入线性层单元进行处理，获取姿态优化特征；利用罗德里格旋转公式计算优化后的姿态特征：

其中，f_s表示姿态特征，E_l(·)表示线性层单元的操作，F_knn(·)表示KNN算法的操作，g_f表示姿态特征图结构，E_g(·)表示图卷积单元的操作，图卷积单元可以是由图卷积层、批量归一化与Relu激活函数组成，f_gs表示姿态优化特征，f_gs表示优化后的姿态特征，F_rod(·)表示罗德里格旋转操作，具体公式如下：

F_rod(r)＝cosθI+(1-cosθ)nn^T+sinθn^

本发明设计的人体图像编码模块，将人体图像X_i送入人体图像编码模块提取图像特征f_r，然后将图像特征与人体图像分别进行网格采样插值并进行特征拼接，获取图像特征编码f_c：

其中，E_c(·)表示人体图像编码模块的编码操作，人体图像编码模块由堆叠网络单元、残差单元和卷积层组成，参见图5所示，其网络结构依次是堆叠网络单元-残差单元-卷积层-卷积层-卷积层-堆叠网络单元--残差单元-卷积层的结构，第二个堆叠网络单元的输入来自于前级的卷积层的输出及再前一级卷积层的输出；其中堆叠网络单元包含池化层、图卷积块和上采样层，池化层及上采样层均为多层级的结构，如四层，图卷积块为多个，一个池化层的输出同时对应作为一个图卷积块的输入，一个图卷积块的输出同时作为一个上采样层的输入，下级的上采样层的输入还包括上一级的上采样层的输出，下级的池化层的输入还包括上一级的池化层的输出，第一个上采样层的输入包括两个图卷积块的输出，堆叠网络单元的输入通过一个图卷积块后，其输出同时与最后一级的上采样层的输出相加，成为所述堆叠网络单元的输出。所述图卷积块依次包含图卷积层、Relu激活函数、线性层与Relu激活函数，图卷积层的输入与其前一级Relu激活函数的输出作为其线性层的输入，同时其线性层的输入与后一级Relu激活函数的输出作为图卷积块的输出，残差单元依次包括卷积层Con+Relu激活层-卷积层Con+Relu激活层-卷积层Con，残差单元的输入为堆叠网络单元的输出，残差单元的卷积层Con的输出与残差单元的输入作为人体图像编码模块的接收残差单元的输出的卷积层的输入。

以上所述仅是本发明的优选实施方式，应当指出的是，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.基于图像的人体三维重建方法，其特征在于，由姿态融合三维人体重建网络与图神经辐射场三维人体重建网络各自对输入图像进行处理重建后，再进行融合实现最终的三维重建；其中，姿态融合三维人体重建网络包括表面法向图生成模块、表面法向图特征编码模块、人体姿态特征编码模块、特征解码重建模块、背面图像生成模块以及纹理映射模块，图神经辐射场三维人体重建网络包括姿态优化模块、人体图像编码模块、特征解码模块以及集成模块；人体三维重建方法的处理步骤如下：

由人体图像X_i通过姿态估计方法预测人体参数化模型M_smp，送入到可微渲染器得到人体参数化模型正面法向图N_sf和人体参数化模型背面法向图N_sb，与人体图像X_i共同送入表面法向图生成模块，获取人体正面法向图N_cf和人体背面法向图N_cb，送入表面法向图特征编码模块提取人体表面法向图特征f_i；将人体参数化模型M_smp送入人体姿态特征编码模块，提取局部特征编码f_lo和体积特征编码f_v，与人体表面法向图特征f_i共同送入特征解码重建模块，获取符号距离函数值s_d并重建无色彩纹理的人体三维模型Y_s输出；人体图像X_i和人体背面法向图N_cb共同送入背面图像生成模块生成人体背面图像X_b，人体图像X_i、人体背面图像X_b和无色彩纹理的人体三维模型Y_s共同送入纹理映射模块重建出具有正面色彩纹理和背面色彩纹理的人体三维模型Y_c输出；

2.根据权利要求1所述基于图像的人体三维重建方法，其特征在于，所述表面法向图生成模块获得人体正面法向图N_cf和人体背面法向图N_cb的步骤如下：

其中，f_sf,f_sb分别表示人体参数化模型正面法向图编码特征和人体参数化模型背面法向图编码特征，E_s(·)表示图像编码器的编码操作，F_cat(·)表示特征拼接操作，E_res(·)表示残差编码器的操作，F_up(·)表示上采样操作。

3.根据权利要求2所述基于图像的人体三维重建方法，其特征在于，所述表面法向图特征编码模块提取人体表面法向图特征f_i的步骤如下：

分别对人体正面法向图N_cf和人体背面法向图N_cb进行编码，获取人体正面法向图特征编码和人体背面法向图特征编码，将特征编码拼接后进行网格采样插值获取人体表面法向图特征f_i：

其中，E_c(·)表示表面法向图特征编码模块的人体表面法向图编码操作，f_cf表示人体正面法向图特征编码，f_cb表示人体背面法向图特征编码，F_cat(·)表示特征拼接的操作，F_grid(·)表示网格采样插值。

4.根据权利要求3所述基于图像的人体三维重建方法，其特征在于，所述人体姿态特征编码模块提取局部特征编码f_lo和体积特征编码f_v的步骤如下：

计算人体参数化模型M_smp的符号距离函数，获取人体参数化模型M_smp的符号距离函数编码f_sdf，将人体参数化模型M_smp进行体素化，通过三维残差单元获取体素化后人体参数化模型M_smp的三维特征编码，通过网格采样插值基于符号距离函数编码f_sdf获取局部特征编码f_lo以及基于三维特征编码提取体积特征编码f_v：

5.根据权利要求4所述基于图像的人体三维重建方法，其特征在于，所述特征解码重建模块重建无色彩纹理的人体三维模型Y_s输出的处理步骤如下：

将人体表面法向图特征f_i、局部特征编码f_lo和体积特征编码f_v进行特征拼接后共同送入图卷积解码器，获取三维模型的符号距离函数值s_d，基于符号距离函数值通过行进立方体算法重建无色彩纹理的人体三维模型Y_s：

其中，F_cat(·)表示特征拼接操作，E_g(·)表示图卷积解码器的操作，s_d表示符号距离函数值，F_mc(·)表示行进立方体算法的操作，Y_s表示无色彩纹理的人体三维模型。

6.根据权利要求5所述基于图像的人体三维重建方法，其特征在于，所述背面图像生成模块生成人体背面图像x_b的处理步骤如下：

将人体图像X_i和人体背面法向图N_cb进行拼接编码获取人体背面编码特征，送入图像编码器进行编码，形成人体背面编码特征，然后送入通道注意力残差单元进行编码，并经过上采样后获取人体背面图像x_b：

其中，f_bf表示人体背面编码特征，E_s(·)表示图像编码器的操作，F_cat(·)表示特征拼接的操作，E_res(·)表示通道注意力残差单元的操作，F_up(·)表示上采样的操作。

7.根据权利要求6所述基于图像的人体三维重建方法，其特征在于，所述纹理映射模块的处理步骤如下：

使用网格采样插值对人体图像X_i提取人体模型颜色编码，将人体模型颜色编码通过网格模型光栅化，并选择不重复值获取人体模型可见性；基于无色彩纹理的人体三维模型Y_s，利用人体模型颜色编码和人体模型可见性得到具有正面色彩的三维模型；使用网格采样插值对人体背面图像X_b提取人体背面模型颜色编码，将人体背面模型颜色编码通过网格模型光栅化，并选择不重复值获取人体背面模型可见性，得到人体背面模型可见性；基于具有正面色彩的三维模型、人体背面模型颜色编码以及人体背面模型可见性，利用人体图像X_i和人体背面图像X_b进行纹理映射，得到具有正面色彩纹理和背面色彩纹理的人体三维模型Y_c：

8.根据权利要求7所述基于图像的人体三维重建方法，其特征在于，所述姿态优化模块的处理步骤如下：

将姿态特征送入线性层，获取高维度的姿态特征，使用KNN算法构建高维度的姿态特征所对应的姿态特征图结构，将姿态特征图结构送入图卷积单元处理后再送入线性层处理，获取姿态优化特征，利用罗德里格旋转公式计算优化后的姿态特征：

其中，f_s表示姿态特征，E_l(·)表示线性层操作，F_knn(·)表示KNN算法的操作，g_f表示姿态特征图结构，E_g(·)表示图卷积单元的操作，f_gs表示姿态优化特征，f_rs表示优化后的姿态特征，F_rod(·)表示罗德里格旋转操作，具体公式如下：

F_rod(r)＝cosθI+(1-cosθ)nn^T+sinθn^

其中，I是单位矩阵，n是向量r的单位向量，θ是向量r的模长，n^T表示n

的转置矩阵，n^{^}表示n的反对称矩阵。

9.根据权利要求8所述基于图像的人体三维重建方法，其特征在于，所述人体图像编码模块的处理步骤如下：

人体图像编码模块对人体图像X_i提取图像特征f_r，图像特征f_r与人体图像X_i分别进行网格采样插值并进行特征拼接，获取图像特征编码f_ca：

其中，E_c(·)表示人体图像编码模块的操作，F_grid(·)表示网格采样插值。