CN111402407B

CN111402407B - 基于单幅rgbd图像的高精度肖像模型快速生成方法

Info

Publication number: CN111402407B
Application number: CN202010208688.8A
Authority: CN
Inventors: 秦昊; 李冬平; 卢奕渲
Original assignee: Faceunity Technology Co ltd
Current assignee: Faceunity Technology Co ltd
Priority date: 2020-03-23
Filing date: 2020-03-23
Publication date: 2023-05-02
Anticipated expiration: 2040-03-23
Also published as: CN111402407A

Abstract

本发明公开了一种基于单幅RGBD图像的高精度肖像模型快速生成方法，该方法首先利用输入RGBD图像的RGB通道生成头发掩膜和人脸深度，对输入图像中的D通道进行处理，生成基本形状；然后生成降噪平滑图像和细节增强图像，基于彩色图像生成法向图的方法，生成所述降噪平滑图像和细节增强图像对应的两个子法向图，并结合所述头发掩膜生成完整法向图；最后基于所述基本形状和所述完整法向图，计算深度增量图，并与所述基本形状相加，生成高精度肖像模型。本发明可以快速、全自动地由单幅RGBD图像生成高精度肖像模型，无需用户进行交互。

Description

基于单幅RGBD图像的高精度肖像模型快速生成方法

技术领域

本发明涉及图像处理及三维重建领域，尤其涉及一种基于单幅RGBD图像的高精度肖像模型快速生成方法。

背景技术

近十几年来，随着技术的飞速发展，手机已不仅仅是作为人们沟通联络的工具。如今的手机集拍照、娱乐等功能于一体，是每个人不可或缺的智能终端。作为手机的主要功能之一的拍照功能也得到各大手机厂商的重视，纷纷着力提升手机的拍照效果。2017年，随着某手机厂商推出的第一款带有深度传感器的手机，配备深度传感器的手机开始受到消费者的关注。在接下来的几年，我们可以预见将有大量的消费者拥有带有深度传感器的手机。随着带有深度传感器的手机的普及，人们获取深度信息的门槛大大降低，深度信息的应用成为众多研究者的研究热点。

目前主流的肖像展示形式为普通的二维图像。随着近年来三维打印技术、虚拟现实(Virtual Reality，VR)技术的兴起以及数字娱乐时代的到来，人们对肖像的其他展示形式有着浓厚的兴趣。对肖像进行三维重建，得到高精度肖像模型便是一种可行的方式。三维重建(3D Reconstruction)技术一直以来都是计算机图形学领域和计算机视觉领域的热门研究方向。在消费级的深度传感器面世之前，由于对深度信息的高度依赖，三维重建技术只能应用于各种专业领域中。而随着深度传感器的普及，三维重建技术也逐渐出现在各种消费级应用当中。

高精度肖像建模的目标是通过三维重建技术恢复出图像中的人物。重建的高精度肖像模型的应用场景十分广泛。我们可以借助高精度肖像模型实现肖像的重打光、将肖像做成立体相片，以2.5D的形式展示，甚至可以通过三维打印(3D Printing)将照片打印成2.5D的立体照片等等。这些应用，大大扩展了肖像的展示形式。

目前市面上出现的带有深度传感器的手机，均采用通过结构光获取深度的解决方案。深度传感器通过红外线发射器发射特定图形的散斑或者点阵的激光红外图案，红外线CMOS摄像头捕捉到被测物体反射回来的图案，计算上面散斑或者点的大小，然后跟原始的尺寸对比，最终测算出被测物体到摄像头之间的距离。由于红外线容易受到强自然光的影响以及深度值精度的问题，深度传感器得到的单帧深度图往往是带有噪声的、低精度的。

人脸是我们分辨一个人的重要依据。重建的人脸与图像中的人脸是否相像至关重要。另外，作为影响个人相貌、气质的头发，其细节的恢复程度对肖像建模的效果有着十分巨大的影响。因此，我们需要对从深度传感器获取的深度图进行相关的后处理，才能生成高精度的肖像模型。

发明内容

本发明的目的在于针对现有技术的不足，提供一种基于单幅RGBD图像的高精度肖像模型快速生成方法。

本发明的目的是通过以下技术方案来实现的：一种基于单幅RGBD图像的高精度肖像模型快速生成方法，包括以下步骤：

(1)输入RGBD图像。

(2)基本形状生成阶段：利用步骤(1)输入的RGBD图像的RGB通道生成头发掩膜和人脸深度，对输入图像中的D通道进行处理，生成基本形状。

(3)法向图生成阶段：利用步骤(1)输入的RGBD图像的RGB通道生成降噪平滑图像和细节增强图像，基于彩色图像生成法向图的方法，生成所述降噪平滑图像和细节增强图像对应的两个子法向图，并结合所述头发掩膜生成完整法向图。

(4)高精度肖像模型生成阶段：基于步骤(1)生成的基本形状和步骤(2)生成的完整法向图计算深度增量图，并与所述基本形状相加生成高精度肖像模型。

进一步地，所述步骤(2)包括以下子步骤：

(2.1)首先采用头发分割方法对所述RGBD图像中的RGB通道进行分割，获得所述RGBD图像的头发掩膜；

(2.2)然后采用人脸特征点检测方法对所述RGBD图像中的RGB通道进行检测，获得所述RGBD图像中的人脸特征点；

(2.3)接着采用人脸网格模型数据库对人脸特征点进行拟合，获得人脸网格模型、摄像机矩阵、投影矩阵；

(2.4)根据所述摄像机矩阵和投影矩阵将所述人脸网格模型投影到图像空间，生成人脸深度并得到脸部区域和非脸部区域；

(2.5)利用步骤(2.1)所述头发掩膜，将所述RGBD图像中的D通道的非头发区域的深度替换为所述人脸深度中非头发区域的深度；

(2.6)根据步骤(2.1)所述头发掩膜计算所述人脸深度中头发区域的深度增量δd：

δd＝-0.4*h+65

其中，h是人脸深度中头发区域的平均高度；将δd加到RGBD图像D通道的头发区域；

(2.7)将步骤(2.5)得到的RGBD图像中的D通道的非头发区域的高度场和步骤(2.6)得到的RGBD图像D通道的头发区域的高度场组成基本形状。

进一步地，所述步骤(3)包括以下子步骤：

(3.1)对所述RGBD图像中的RGB通道进行一维双边滤波，生成降噪平滑图像；

(3.2)对所述RGBD图像中的RGB通道分别进行细节提取和多次的一维双边滤波，并将生成的两幅图像合并到一起，生成细节增强图像；

(3.3)对所述降噪平滑图像和细节增强图像均以不同大小的高斯核进行高斯模糊，生成两组不同清晰度的图像；

(3.4)将所述不同清晰度的图像视作高度场，结合像素点的坐标转化为三维网格模型，计算每个像素点的法向量，生成两组不同清晰度的图像的法向图；

(3.5)将步骤(3.4)得到的同一组法向图以叠加混合的方式，生成分别对应所述降噪平滑图像和细节增强图像的两个子法向图；

(3.6)利用步骤(3.1)所述头发掩膜，将对应所述降噪平滑图像的子法向图中的非头发区域和对应所述细节增强图像的子法向图中的头发区域合并到一起，生成完整法向图。

进一步地，所述步骤(3.2)中细节提取为先对所述RGBD图像中的RGB通道沿梯度方向进行一维高斯差分滤波，再进行一维高斯滤波。

进一步地，所述步骤(3.5)具体为：以一组法向图中的第一张图作为底图I_base，依次逐个选取剩余的法向图作为待叠加图像I_blend进行叠加混合，根据下式计算混合后的图像的像素值C_new：

其中，Cⁱ的右上角标表示像素值C的第i个通道，i＝1～3，依次表示R、G、B通道；C_base、C_blend分别为I_base、I_blend上的像素点；每次混合后的图像作为新的底图I_base与下一个待叠加图像I_blend再次叠加混合，当混合至仅剩一张底图I_base时，该图为该组的子法向图。

进一步地，所述步骤(4)包括以下子步骤：

(4.1)通过以下能量方程求解使E_n最小的深度增量δD，构成深度增量图：

其中，c表示图像上的点；W、H分别为图像的宽、高；ω_c为点c对应的权重；c±表示c的上下左右四邻域点；D_base shape为基本形状；N为完整法向图；δD构成的深度增量图与所述基本形状生成阶段生成的基本形状相加后，得到的高度场的法向与所述法向图生成阶段生成的完整法向图中的法向相同。

(4.2)将步骤(4.1)得到的深度增量图与所述基本形状生成阶段生成的基本形状逐像素直接相加，得到高精度肖像模型。

进一步地，所述步骤(4.1)中当点c为位于脸部区域时，权重ω_c取值为0.5，当点c为非脸部区域时，权重ω_c取值为0.1。

本发明具有的有益效果为：本发明利用输入RGBD图像生成头发掩膜、人脸深度和基本形状；利用降噪平滑图像和细节增强图生成完整法向图；利用基本形状和完整法向图计算深度增量图，并与基本形状相加生成高精度肖像模型。本发明可以快速、全自动地由单幅RGBD图像生成高精度肖像模型，无需用户进行交互；在iPhone X上生成一个分辨率为600*800的高精度肖像模型耗时在2秒以内。

附图说明

图1是基于单幅RGBD图像的高精度肖像模型快速生成方法的流程示意图；

图2是输入的单幅RGBD图像样例示意图；其中，(a)是RGB通道示意图，(b)是RGBD图像的深度图；

图3是头发掩膜以及对应的人脸深度示意图；其中，(a)是头发掩膜，(b)是人脸深度图；

图4是基本形状图；

图5是降噪平滑图；

图6是细节增强图；

图7是完整法向图；

图8是最终生成的高精度肖像模型示意图。

具体实施方式

本实施例采用人脸网格模型数据库(FaceWarehouse，Cao C,Weng Y,Zhou S,etal.Facewarehouse:A 3d facial expression database for visual computing[J].IEEETransactions on Visualization and Computer Graphics,2014,20(3):413-425.)。

本实施例提供的基于单幅RGBD图像的高精度肖像模型快速生成方法，如图1所示，包括以下三个步骤：

(1)基本形状生成阶段：输入RGBD图像，利用RGBD图像的RGB通道生成头发掩膜和人脸深度，对RGBD图像中的D通道进行处理，生成基本形状，具体包括以下子步骤：

(1.1)生成头发掩膜和人脸深度具体为：首先，采用头发分割方法对RGBD图像(图2)中的RGB通道进行分割，获得RGBD图像的头发掩膜；然后，采用人脸特征点检测方法对RGBD图像中的RGB通道进行检测，获得RGBD图像中的人脸特征点；最后，采用人脸网格模型数据库及人脸拟合方法对人脸特征点进行拟合，获得人脸网格模型、摄像机矩阵、投影矩阵，并根据摄像机矩阵和投影矩阵将人脸网格模型投影到图像空间，生成人脸深度(图3)，并得到脸部区域和非脸部区域。

(1.2)利用步骤(1.1)生成的头发掩膜和人脸深度，对RGBD图像中的D通道进行处理，生成基本形状，具体为：首先，根据头发掩膜将人脸深度中非头发区域的深度拷贝至RGBD图像D通道中对应的非头发区域替换原来的深度；然后，根据头发掩膜计算人脸深度中头发区域的深度增量δd＝-0.4*h+65，其中h是头发区域的平均高度；并将δd加到RGBD图像D通道中的头发区域上；最后，RGBD图像D通道非头发区域和头发区域的高度场组成基本形状D_base shape。本实施例中，采用上述方法生成的基本形状D_base shape如图4所示，基本形状D_base shape为脸部五官完整、缺少脸部和头发细节的高度场。

(2)法向图生成阶段：利用步骤(1)输入的RGBD图像生成降噪平滑图像和细节增强图像，基于RGBD图像中的RGB通道生成法向图的方法，生成降噪平滑图像和细节增强图像对应的两个子法向图，并结合步骤(1)生成的头发掩膜生成完整法向图N。

(2.1)生成降噪平滑图像和细节增强图像，包括以下子步骤：

(2.1.1)将步骤(1)输入的RGBD图像中的RGB通道变换到Lab颜色空间，得到Lab图像I，使用以下滤波器Sobel_x、Sobel_y对Lab图像I的每个像素点I(c)进行卷积操作，得到其沿x、y方向的偏导数[L_x a_x b_x]、[L_y a_y b_y]：

其中，Sobel_x是x方向的滤波器，Sobel_y是y方向的滤波器；L_x是L通道沿x方向的偏导数，a_x是a通道沿x方向的偏导数，b_x是b通道沿x方向的偏导数，L_y是L通道沿y方向的偏导数，a_y是a通道沿y方向的偏导数，b_y是b通道沿y方向的偏导数；

(2.1.2)根据下式计算每个像素点I(c)的结构张量S_2×2：

其中，E＝L_x*L_x+a_x*a_x+b_x*b_x，F＝L_x*L_y+a_x*a_y+b_x*b_y，G＝L_y*L_y+a_y*a_y+b_y*b_y；

(2.1.3)根据下式计算结构张量S_2×2的两个特征值λ₁、λ₂；

(2.1.4)根据下式计算结构张量S_2×2的两个特征向量，即Lab图像I的梯度方向v₁和切线方向v₂：

v₁＝(F，λ₁-E)

v₂＝(λ₂-G，F)

计算Lab图像I每个像素点I(c)的梯度方向v1和切线方向v2，分别组成梯度图I_grd、切线图I_tan。

(2.1.5)根据下式，先后对Lab图像I的每个像素点I(c)沿梯度方向v₁和切线方向v₂进行一维双边滤波，得到如图5所示的降噪平滑图像I_smooth：

I_{smooth_0}(c0)＝Bilateral(c₀，δ(I_grd(c₀))，I)

I_smooth(c₀)＝Bilateral(c₀，6(I_tan(c₀))，I_{smooth_0})

其中，c₀是滤波的中心；采样方向函数δ(·)定义如下：

其中，d_x为向量d的x值，d_y为向量d的y值；函数Bilateral(·)表示一维双边滤波处理：

其中，t为采样方向；I_s为被滤波对象；k_s为归一化参数，取值为

c_i＝c₀+it；函数G_σ(·)定义如下：

其中，σ为高斯函数的标准差；本实施例中σ_d＝3，σ_r＝0.04；

(2.1.6)根据下式，对Lab图像I的每个像素点I(c)沿梯度方向v₁进行一次一维高斯差分(Difference ofGaussian，DoG)滤波，得到高斯差分滤波图像I_DoG：

I_DoG(c₀)＝Gaussian(c₀，σ₀)-τGaussian(c₀，σ₁)

其中，c₀为DoG滤波中心；τ控制DoG滤波结果中边缘的强度，τ越大，边缘越清晰，此处取值为0.99；函数Gaussian(.)定义如下：

其中，k_D为归一化参数，取值为

cj＝c₀+iI_grd(c₀)；本实施例中σ₀＝1.5，σ₁＝2.5。

(2.1.7)根据下式，对步骤(2.1.6)得到的高斯差分滤波图像I_DoG的每个像素点进行一次一维高斯滤波，得到基于流的高斯差分(Flow-based Difference of Gaussian，FDoG)滤波图像I_FDoG：

其中，c₀为滤波中心；Sample函数定义如下：

t_k＝sgn(<I_tan(c_k-1)，t_k-1>)I_tan(c_k-1)

c_k＝c_k-1+l_kt_k

其中，t₀是初始采样方向，为I_tan(c₀)或-I_tan(c₀)，t_k为第k次采样方向；k_F为归一化参数，取值为

分别表示c_k-1、t_k的x坐标；

分别表示c_k-1、t_k的y坐标；sgn表示取符号；<a，b>表示向量a与向量b点乘；

表示取a的下整；本实施例中σ_m＝8。

(2.1.8)对RGBD图像中的RGB通道迭代地进行4次一维双边滤波，得到图像I_blur，并与FDoG滤波图像I_FDoG通过以下公式合并在一起，至此，生成细节增强图像I_enhance(图6)：

I_enhance(c)＝C_edge(1-w(c))+w(c)I_blur(c)

其中，C_edge为边缘颜色，取值为黑色；w(c)为I_FDoG(c)的L通道的0.5次幂。

(2.2)基于RGBD图像中的RGB通道分别生成降噪平滑图像I_smooth和细节增强图像I_enhance对应的子法向图A和子法向图B，并结合步骤(1)得到的头发掩膜标识的头发区域与非头发区域，将子法向图A的非头发区域和子法向图B的头发区域合并到一起，生成完整法向图N(图7)，包括以下子步骤：

(2.2.1)将生成的降噪平滑图像I_smooth和细节增强图像I_enhance以σ＝1、2、4、8、16、32的高斯函数进行高斯模糊，分别生成对应I_smooth和I_enhance的两组不同清晰度的图像。

(2.2.2)将步骤(2.2.1)得到两组不同清晰度的图像视作高度场计算其法向图，具体为：将两组不同清晰度的图像每个像素点的像素值作为高度，结合像素点的x、y坐标，将两组不同清晰度的图像转化为三维网格模型，根据通用的法向计算方法，计算每个像素点的法向量，得到两组不同清晰度图像的法向图；

(2.2.3)将步骤(2.2.2)得到的两组不同清晰度图像的法向图分别以叠加混合的方式进行混合，得到I_smooth对应的子法向图A和I_enhance对应的子法向图B，具体为：以每组法向图中的第一张图作为底图I_base，依次选取剩余的法向图逐个作为待叠加图像I_blend，根据以下式子，对I_base、I_blend两幅图像上的每个像素点C_base、C_blend，计算混合后的图像上对应位置的像素值C_new。每次混合后的图像作为新的底图I_base，当每组混合至仅剩一张底图I_base时，即为该组的子法向图。

其中，Cⁱ的右上角标表示像素值C的第i个通道，i＝1～3，分别为r，g，b通道。

(2.2.4)结合步骤(1)得到的头发掩膜标识的头发区域与非头发区域，将步骤(2.2.3)得到的子法向图A的非头发区域和子法向图B的头发区域合并到一起，生成完整法向图N。

(3)高精度肖像模型生成阶段：基于步骤(1)生成的基本形状D_base shape和步骤(2)生成的完整法向图N，计算每个像素点的深度增量，并与基本形状D_base shape相加，生成高精度肖像模型。

(3.1)根据待求解的每个像素点的深度增量与步骤(1)得到的基本形状D_base shape相加后，与步骤(2)得到的完整法向图N中对应位置的法线相垂直的目标，列出以下能量方程：

其中，c表示图像上的点；ω_c为点c对应的权重，当点c为由人脸深度与头发掩模得到的脸部区域时，取值为0.5，当点c为非脸部区域时，取值为0.1；c±表示c的上下左右四邻域点；δD为所有像素点的深度增量；W、H分别为图像的宽、高。

(3.2)得到使步骤(3.1)中能量方程E_n最小的深度增量8D，计算深度增量图，将基本形状D_base shape与深度增量图逐像素直接相加，得到高精度肖像模型，如图8是一个结果样例的侧面视图。所述深度增量图满足步骤(1)生成的基本形状D_base shape与该深度增量图相加后，得到的高度场的法向与步骤(2)生成的完整法向图N中的法向相同。

Claims

1.一种基于单幅RGBD图像的高精度肖像模型快速生成方法，其特征在于，包括以下步骤：

(1)输入RGBD图像；

(2)基本形状生成阶段：利用步骤(1)输入的RGBD图像的RGB通道生成头发掩膜和人脸深度，对输入图像中的D通道进行处理，生成基本形状；

(3)法向图生成阶段：利用步骤(1)输入的RGBD图像的RGB通道生成降噪平滑图像和细节增强图像，基于彩色图像生成法向图的方法，生成所述降噪平滑图像和细节增强图像对应的两个子法向图，并结合所述头发掩膜生成完整法向图；

所述步骤(3)包括以下子步骤：

(3.6)利用步骤(3.1)所述头发掩膜，将对应所述降噪平滑图像的子法向图中的非头发区域和对应所述细节增强图像的子法向图中的头发区域合并到一起，生成完整法向图；

(4)高精度肖像模型生成阶段：基于步骤(2)生成的基本形状和步骤(3)生成的完整法向图计算深度增量图，并与所述基本形状相加生成高精度肖像模型；

所述步骤(4)包括以下子步骤：

其中，c表示图像上的点；W、H分别为图像的宽、高；ω_c为点c对应的权重；c^±表示c的上下左右四邻域点；D_base为基本形状；N为完整法向图；δD构成的深度增量图与所述基本形状生成阶段生成的基本形状相加后，得到的高度场的法向与所述法向图生成阶段生成的完整法向图中的法向相同；

2.如权利要求1所述的基于单幅RGBD图像的高精度肖像模型快速生成方法，其特征在于，所述步骤(2)包括以下子步骤：

δd＝-0.4*h+65

3.如权利要求1所述的基于单幅RGBD图像的高精度肖像模型快速生成方法，其特征在于，所述步骤(3.2)中细节提取为先对所述RGBD图像中的RGB通道沿梯度方向进行一维高斯差分滤波，再进行一维高斯滤波。

4.如权利要求1所述的基于单幅RGBD图像的高精度肖像模型快速生成方法，其特征在于，所述步骤(3.5)具体为：以一组法向图中的第一张图作为底图I_base，依次逐个选取剩余的法向图作为待叠加图像I_blend进行叠加混合，根据下式计算混合后的图像的像素值C_new：

其中，Cⁱ的右上角标表示像素值C的第i个通道，i＝1～3，依次表示R、G、B通道；C_base、C_blend分别为I_base、I_blend上的像素点；每次混合后的图像作为新的底图I_base与下一个待叠加图像I_blend再次叠加混合，当混合至仅剩一张底图I_base时，该图为这一组的子法向图。

5.如权利要求1所述的基于单幅RGBD图像的高精度肖像模型快速生成方法，其特征在于，

所述步骤(4.1)中当点c为位于脸部区域时，权重ω_c取值为0.5，当点c为非脸部区域时，

权重ω_c取值为0.1。