CN110349268B - 一种三维人体姿态、表情及手势的重构方法 - Google Patents
一种三维人体姿态、表情及手势的重构方法 Download PDFInfo
- Publication number
- CN110349268B CN110349268B CN201910499359.0A CN201910499359A CN110349268B CN 110349268 B CN110349268 B CN 110349268B CN 201910499359 A CN201910499359 A CN 201910499359A CN 110349268 B CN110349268 B CN 110349268B
- Authority
- CN
- China
- Prior art keywords
- mesh model
- reconstructed
- dimensional human
- human body
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
- G06T17/20—Finite element generation, e.g. wire-frame surface description, tesselation
Abstract
本发明公开了一种三维人体姿态、表情及手势的重构方法,包括步骤:1)用参数化模型来表示待重构的三维人体网格模型;2)通过最小化能量获得三维人体网格模型;3)采用改进的离散壳变形方法对步骤2)中的能量进行优化。本发明可以从给定特定几何形状的约束中,求解出带重构的三维人体网格模型的形状与姿态参数,使得所确定的形状逼近所给的数据。
Description
技术领域
本发明涉及三维人体姿态、表情及手势重构的技术领域,尤其是指一种三维人体姿态、表情及手势的重构方法。
背景技术
目前已经存在大量的文献分别研究了对身体姿态、面部表情和手势的参数化模型表示。但是重构完全人体动态几何的问题仍是开放性问题,由于不同部位运动的尺度不同,建立完全人体参数化模型并未引起注意,相关文献较少.大部分现有的参数化表示仅针对身体、脸部、手部运动中的一种。
三维可变形模型。SCAPE结合了姿态的运动数据和蒙皮权重描述形态和运动变化。使用三角形的变形梯度捕捉姿态变化,将每个三角形的变形分解为形状变形、位姿相关变形和校正变形。目前的研究中,SCAPE被广泛应用于运动捕捉和三维人体重建。但是SCAPE很难描述不同个体在做相同姿态时的细微差异。此外基于SCAPE的方法可能导致严重的视觉伪影,类似于骨骼蒙皮。加上难以捕捉小规模的动态几何图形,如面部表情和手势。
基于骨骼蒙皮模型。SMPL利用顶点坐标的PCA基对人体的形状和姿态变化进行编码,并利用基于顶点坐标的混合蒙皮技术表示姿态变形。与基于SCAPE的模型相比,该模型快速、直观。近年来,它被广泛应用于许多领域,如深度地图、图像或视频的运动捕捉和三维重建。然而,SMPL在发生较大扭转的关节附近会发生严重的塌陷。受Zuffi and Black基于部分的缝制木偶模型的启发,Joo等人提出了Frankenstein模型来表示人脸、手和身体的变形。他们使用SMPL来描述身体和手的变化,利用双线性模型来模拟面部表情。但是Frankenstein模型既没有建立一个统一的参数模型,也没有产生一个单一的网格,只是对其他部分进行变形,使之与主体部分兼容。
人脸静态模型。Blendshape是早期面部动画最流行的表现形式。它为每个面部特征点创建顶点位移基,并通过混合这些基来表示个性化中立人脸的动画。然而,这个模型没有捕捉到形状的变化。相反,由Blanz and Vetter设计的3DMM(3D morphable model)侧重于表现不同的面部形状,但是无法支持表情。Amberg等人使用更多的数据集对模型进行训练,从而增强了模型。结合这两种模型,Weise等人设计了一个实时的基于性能的面部动画系统。Bouaziz等在3DMM基础上建立自适应DEM(Dynamic Expression Model),同时捕捉面部形态和表情变化。Cao等提出了FaceWarehouse训练双线性人脸模型,用于表示人脸形状和表情的变化。Garrido等建立了基于3DMM和DEM的综合人脸模型。
手的参数模型。大多数人手部参数模型是针对手部运动跟踪而不是精确的几何重建的,骨骼蒙皮技术经常被用来做这件事。另一方面,基于骨骼网格的隐式表示也很受欢迎,它可以提供更优越的跟踪性能。然而,上述大多数方法都不是基于统计的。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种三维人体姿态、表情及手势的重构方法,从给定特定几何形状的约束中,求解出带重构的三维人体网格模型的形状与姿态参数,使得所确定的形状逼近所给的数据。
为实现上述目的,本发明所提供的技术方案为:一种三维人体姿态、表情及手势的重构方法,包括以下步骤:
1)用参数化模型来表示待重构的三维人体网格模型;
2)通过最小化能量获得三维人体网格模型;
3)采用改进的离散壳变形方法对步骤2)中的能量进行优化。
在步骤1)中,令待重构的三维人体网格模型的顶点坐标构成的3NV(其中NV为待重构的三维人体网格模型的顶点数目)维列向量为(其中V是重构网格的顶点向量,v1为第一个顶点的坐标,为第NV个顶点的坐标,T为转置符号),于是表示待重构的三维人体网格模型即为最小化以下能量:
ε(V,α,β)=εS(V,α,β)+εB(V,α,β)+εG(V,α)+λεC(V,α,β)
其中,α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,λ为数据项的权重,ε(V,α,β)为重构的三维人体网格模型的最小化能量,该能量包括四项:εS(V,α,β)为拉伸项、εB(V,α,β)为弯曲项、εG(V,α)为体积项和εC(V,α,β)为数据项;待重构三维人体网格模型的姿态表示为BP(α,β),则拉伸项、弯曲项和体积项的作用是将待重构网格的边长、二面角和体积约束在BP(α,β)所张成的子空间内。
在步骤2)中,定义待重构的三维人体网格模型的边长向量、二面角向量和体积分别为L(V)、A(V)和G(V);BS(α)为待重构的三维人体网格模型的形状,BP(α,β)为待重构的三维人体网格模型的姿态,L(α)和A(α)分别为BS(α)的LA向量的边长向量和二面角向量;
拉伸项εS(V,α,β)是限制每条边e的边长,表示为以下形式:
其中,|E|为待重构的三维人体网格模型中边的条数,L(l)(V)为待重构的三维人体网格模型的第l条边的边长,为RLA向量XL(α,β)的第l项,L(l)(α)为LA向量L(α)的第l项,wS,l表示能量的权重,取值为 表示平均形状中第l条边的边长,为表示方便,定义第l条边的能量函数fS,l(V,α,β)为:
弯曲项εB(V,α,β)用于限制待重构的三维人体网格模型的二面角,表示为以下形式:
其中,A(l)(V)为待重构的三维人体网格模型的第l条边的二面角,为RLA向量XA(α,β)的第l项,A(l)(α)为LA向量A(α)的第l项,wB,l表示能量的权重,取值 表示平均形状中与第l条边相邻的两个三角形的面积,为了表示方便,定义第l条边的能量函数fB,l(V,α,β)为:
体积项εG(V,α)用于约束待重构的三维人体网格模型的体积大小,表示为以下形式:
其中,αi为三维人体网格模型的第i个形状参数,G(i)表示第i个形状基的体积,G(0)为标准姿态的体积,NSB为形状基的总个数,WG表示能量的权重,取值为为了表示方便,定义体积项能量函数fG(V,α)为:
则体积项εG(V,α)重写为εG(V,α)=WGfG(V,α);
数据项εC(V,α,β)约束根据应用的不同而在形式上有所区别,但所有数据项最终都能够用如下能量项进行约束:
其中,Ncon为数据约束个数,WC,i为第i个数据约束的权重,fC,i(V,α,β)为第i个数据约束的约束函数。
在步骤3)中,记f为如下定义的多元函数,其自变量由待重构的三维人体网格顶点坐标、形状参数和运动参数构成,即:
其中,x为自变量表示符号,V是重构网格的顶点向量α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,NSB为形状基的总个数,为第一个顶点的x坐标,为第一个顶点的y坐标,为第一个顶点的z坐标,为第NV个顶点的x坐标,为第NV个顶点的y坐标,为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,为三维人体网格模型的第NSB个形状参数,β1为三维人体网格模型的第一个姿态参数,为三维人体网格模型的第NMC个姿态参数,则映射关系为:
其中,|E|为边的条数,fS,1(V,α,β)、fB,1(V,α,β)为步骤2)中定义的第一条边的能量函数,即定义第l条边的能量函数fS,l(V,α,β)为定义第l条边的能量函数fB,l(V,α,β)为fS,|E|(V,α,β)、fB,|E|(V,α,β)为步骤2)中定义的第|E|条边的能量函数,wS,1、wB,1、wS,|E|、wB,|E|为对应能量函数的权重,fG(V,α)为步骤2)中定义的体积项能量函数,即WG为对应体积项能量函数的权重,Ncon为数据约束个数,fC,1(V,α,β)为步骤2)中定义的第一个数据约束的约束函数,为步骤2)中定义的第Ncon个数据约束的约束函数,wC,1为对应第一个数据约束的权重,为对应第Ncon个数据约束的权重;
3.1)固定待重构的三维人体网格模型的形状参数α,用高斯牛顿梯度下降法对待重构的三维人体网格模型的姿态参数和顶点坐标求解最小化:
此时,f(x)的未知量为其中x1为此时的自变量形式,V是重构网格的顶点向量β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,为第一个顶点的x坐标,为第一个顶点的y坐标,为第一个顶点的z坐标,为第NV个顶点的x坐标,为第NV个顶点的y坐标,为第NV个顶点的z坐标,β1为三维人体网格模型的第一个姿态参数,为三维人体网格模型的第NMC个姿态参数;采用高斯牛顿梯度下降法最小化f,假设已求得第h次迭代的解那么第h+1次迭代的解的公式为:
其中,J1为函数f关于x1的雅可比矩阵,J1 T为矩阵J1的转置矩阵,(J1 TJ1)-1表示求矩阵J1 TJ1的逆;为求雅可比矩阵,需求函数f的各个分量关于x1各分量的偏导,具体如下所示:
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,ML(i,j)为ML的第i行第j列的元素,MA为对RLA向量中的二面角进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,MA(i,j)为MA的第i行第j列的元素,RL(α,β)为MLP网络输出的相对边长分量,为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,为RA(α,β)的第l个分量,BS(α)为待重构的三维人体网格模型的形状,L(α)为BS(α)的LA向量的边长向量,L(l)(α)表示L(α)第l个元素,为函数fS,l(V,α,β)对βi的偏导数,为函数对βi的偏导数,为函数fB,l(V,α,β)对βi的偏导数,为函数对βi的偏导数;考虑到脸部表情和手势的变化小于其它身体姿态部位的变化,将优先重构脸部表情,然后求解身体姿态,最后求解手势;
3.2)固定待重构的三维人体网格模型的姿态参数β,用高斯牛顿梯度下降法求解待重构的三维人体网格模型的形状参数和顶点坐标:
此时,f(x)的未知量为其中x2为此时的自变量形式,V是重构网格的顶点向量α为三维人体网格模型的形状参数,NV为待重构的三维人体网格模型的顶点个数,NSB为形状基的总个数,为第一个顶点的x坐标,为第一个顶点的y坐标,为第一个顶点的z坐标,为第NV个顶点的x坐标,为第NV个顶点的y坐标,为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,为三维人体网格模型的第NSB个形状参数;利用高斯牛顿梯度下降法最小化f,假设已找到第h次迭代的解那么第h+1次迭代的解的公式为:
其中,J2为函数f关于x2的雅可比矩阵,J2 T为矩阵J2的转置矩阵,(J2 TJ2)-1表示求矩阵J2 TJ2的逆;
同样,J2由函数f的各分量关于x2各个分量的偏导组成,具体偏导如下所示:
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,为ML的第l个的列向量,RL(α,β)为MLP网络输出的相对边长分量,为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,为RA(α,β)的第l个分量,L(α)为待重构的三维人体网格模型的边长向量,L(l)(α)表示L(α)第l个元素,βL为稀疏局部基的相对边长的系数向量,为函数fS,l(V,α,β)对αi的偏导数,为函数L(l)(α)对αi的偏导数,为函数对αi的偏导数,为函数fB,l(V,α,β)对αi的偏导数,为函数对αi的偏导数,为函数fG(V,α)对αi的偏导数;
3.3)重复步骤3.1)和3.2),直至函数收敛或者达到最大迭代次数,输出当前最优的参数解。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明采用参数化模型进行重构,克服不同人体部位运动的尺度不同的难点,能有效的重构出人体的形状、姿态、脸部表情和手势。
2、本发明是一个完全人体运动的重构方法,区别于之前只针对身体、脸部或手部运动中的一种进行重构后再进行组合的重构方法,能够同时重构出人体的完全运动包括身体姿态、脸部表情和手势。
3、本发明的重构方法能够有效的避免严重的关节扭曲问题,使得重构出来的三维人体网格模型看上去更加自然。
附图说明
图1是具体网络拟合时候,选取的12个锚三角形的分布图。
图2是MLP网络结构图。
图3是从不同类型数据中自然地合成身体运动、脸部表情和手部姿态的示意图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本实施例所提供的三维人体姿态、表情及手势的重构方法,包括以下步骤:
1)用参数化模型来表示待重构的三维人体网格模型
令待重构的三维人体网格模型的顶点坐标构成的3NV(其中NV为待重构的三维人体网格模型的顶点数目)维列向量为(其中V是重构网格的顶点向量,v1为第一个顶点的坐标,为第NV个顶点的坐标,T为转置符号),于是表示待重构的三维人体网格模型即为最小化以下能量:
ε(V,α,β)=εS(V,α,β)+εB(V,α,β)+εG(V,α)+λεC(V,α,β)
其中,α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,λ为数据项的权重,ε(V,α,β)为重构的三维人体网格模型的最小化能量,该能量包括四项:εS(V,α,β)为拉伸项、εB(V,α,β)为弯曲项、εG(V,α)为体积项和εC(V,α,β)为数据项;待重构三维人体网格模型的姿态表示为BP(α,β),则拉伸项、弯曲项和体积项的作用是将待重构网格的边长、二面角和体积约束在BP(α,β)所张成的子空间内。
2)通过最小化能量获得三维人体网格模型
定义待重构的三维人体网格模型的边长向量、二面角向量和体积分别为L(V)、A(V)和G(V);BS(α)为待重构的三维人体网格模型的形状,BP(α,β)为待重构的三维人体网格模型的姿态,L(α)和A(α)分别为BS(α)的LA向量的边长向量和二面角向量;
拉伸项εS(V,α,β)是限制每条边e的边长,表示为以下形式:
其中,|E|为待重构的三维人体网格模型中边的条数,L(l)(V)为待重构的三维人体网格模型的第l条边的边长,为RLA向量XL(α,β)的第l项,L(l)(α)为LA向量L(α)的第l项,wS,l表示能量的权重,取值为 表示平均形状中第l条边的边长,为表示方便,定义第l条边的能量函数fS,l(V,α,β)为:
弯曲项εB(V,α,β)用于限制待重构的三维人体网格模型的二面角,表示为以下形式:
其中,A(l)(V)为待重构的三维人体网格模型的第l条边的二面角,为RLA向量XA(α,β)的第l项,A(l)(α)为LA向量A(α)的第l项,wB,l表示能量的权重,取值 表示平均形状中与第l条边相邻的两个三角形的面积,为了表示方便,定义第l条边的能量函数fB,l(V,α,β)为:
体积项εG(V,α)用于约束待重构的三维人体网格模型的体积大小,表示为以下形式:
其中,αi为三维人体网格模型的第i个形状参数,G(i)表示第i个形状基的体积,G(0)为标准姿态的体积,NSB为形状基的总个数,WG表示能量的权重,取值为为了表示方便,定义体积项能量函数fG(V,α)为:
则体积项εG(V,α)重写为εG(V,α)=WGfG(V,α);
数据项εC(V,α,β)约束根据应用的不同而在形式上有所区别,但所有数据项最终都能够用如下能量项进行约束:
其中,Ncon为数据约束个数,WC,i为第i个数据约束的权重,fC,i(V,α,β)为第i个数据约束的约束函数。
3)采用改进的离散壳变形方法对步骤2)中的能量进行优化
记f为如下定义的多元函数,其自变量由待重构的三维人体网格顶点坐标、形状参数和运动参数构成,即:
其中,x为自变量表示符号,V是重构网格的顶点向量α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,NSB为形状基的总个数,为第一个顶点的x坐标,为第一个顶点的y坐标,为第一个顶点的z坐标,为第NV个顶点的x坐标,为第NV个顶点的y坐标,为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,为三维人体网格模型的第NSB个形状参数,β1为三维人体网格模型的第一个姿态参数,为三维人体网格模型的第NMC个姿态参数则映射关系为:
其中,|E|为边的条数,fS,1(V,α,β)、fB,1(V,α,β)为步骤2)中定义的第一条边的能量函数,即定义第l条边的能量函数fS,l(V,α,β)为定义第l条边的能量函数fB,l(V,α,β)为fS,|E|(V,α,β)、fB,|E|(V,α,β)为步骤2)中定义的第|E|条边的能量函数,wS,1、wB,1、wS,|E|、wB,|E|为对应能量函数的权重,fG(V,α)为步骤2)中定义的体积项能量函数,即WG为对应体积项能量函数的权重,Ncon为数据约束个数,fC,1(V,α,β)为步骤2)中定义的第一个数据约束的约束函数,为步骤2)中定义的第Ncon个数据约束的约束函数,wC,1为对应第一个数据约束的权重,为对应第Ncon个数据约束的权重;
3.1)固定待重构的三维人体网格模型的形状参数α,用高斯牛顿梯度下降法对待重构的三维人体网格模型的姿态参数和顶点坐标求解最小化:
此时,f(x)的未知量为其中x1为此时的自变量形式,V是重构网格的顶点向量β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,为第一个顶点的x坐标,为第一个顶点的y坐标,为第一个顶点的z坐标,为第NV个顶点的x坐标,为第NV个顶点的y坐标,为第NV个顶点的z坐标,β1为三维人体网格模型的第一个姿态参数,为三维人体网格模型的第NMC个姿态参数;采用高斯牛顿梯度下降法最小化f,假设已求得第h次迭代的解那么第h+1次迭代的解的公式为:
其中,J1为函数f关于x1的雅可比矩阵,J1 T为矩阵J1的转置矩阵,(J1 TJ1)-1表示求矩阵J1 TJ1的逆;为求雅可比矩阵,需求函数f的各个分量关于x1各分量的偏导,具体如下所示:
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,ML(i,j)为ML的第i行第j列的元素,MA为对RLA向量中的二面角进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,MA(i,j)为MA的第i行第j列的元素,RL(α,β)为MLP网络输出的相对边长分量,为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,为RA(α,β)的第l个分量,BS(α)为待重构的三维人体网格模型的形状,L(α)为BS(α)的LA向量的边长向量,L(l)(α)表示L(α)第l个元素,为函数fS,l(V,α,β)对βi的偏导数,为函数对βi的偏导数,为函数fB,l(V,α,β)对βi的偏导数,为函数对βi的偏导数;考虑到脸部表情和手势的变化小于其它身体姿态部位的变化,将优先重构脸部表情,然后求解身体姿态,最后求解手势;
3.2)固定待重构的三维人体网格模型的姿态参数β,用高斯牛顿梯度下降法求解待重构的三维人体网格模型的形状参数和顶点坐标:
此时,f(x)的未知量为其中x2为此时的自变量形式,V是重构网格的顶点向量,α为三维人体网格模型的形状参数,NV为待重构的三维人体网格模型的顶点个数,NSB为形状基的总个数,为第一个顶点的x坐标,为第一个顶点的y坐标,为第一个顶点的z坐标,为第NV个顶点的x坐标,为第NV个顶点的y坐标,为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,为三维人体网格模型的第NSB个形状参数;利用高斯牛顿梯度下降法最小化f,假设已找到第h次迭代的解那么第h+1次迭代的解的公式为:
其中,J2为函数f关于x2的雅可比矩阵,J2 T为矩阵J2的转置矩阵,(J2 TJ2)-1表示求矩阵J2 TJ2的逆;
同样,J2由函数f的各分量关于x2各个分量的偏导组成,具体偏导如下所示:
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,为ML的第l个的列向量,RL(α,β)为MLP网络输出的相对边长分量,为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,为RA(α,β)的第l个分量,L(α)为待重构的三维人体网格模型的边长向量,L(l)(α)表示L(α)第l个元素,βL为稀疏局部基的相对边长的系数向量,为函数fS,l(V,α,β)对αi的偏导数,为函数L(l)(α)对αi的偏导数,为函数对αi的偏导数,为函数fB,l(V,α,β)对αi的偏导数,为函数对αi的偏导数,为函数fG(V,α)对αi的偏导数;
3.3)重复步骤3.1)和3.2),直至函数收敛或者达到最大迭代次数,输出当前最优的参数解。
对于我们的重构任务来说,一个好的初始解非常重要。根据不同的重构任务,一旦确定形状参数α和姿态参数β,可计算出LA向量L(α,β)和A(α,β)。我们利用合成数据库的丰富信息来建立形状参数α和姿态参数β与模型上某些特殊的标架之间的关系。为了直接从形状和运动参数得到锚定三角形标架信息,我们选取了锚定三角形,利用用多层感知机(MLP)来预测这些三角形的局部正交标架。如图1所示,选取了12个三角形,分布在人体的脸部、上下肢、躯干、腿部的区域。图2则给出了所采用的MLP的网络结构图:输入数据为形状参数α和姿态参数β,包含3层隐藏层,每层分别包含100、200、400个隐含因子,最终输出12个正交标架。其每层的激活函数为Sigmoid函数。我们用FA(α,β)表示该MLP输出。然后根据步骤2)进行能量式的优化:
a、固定待重构的三维人体网格模型的形状参数α,用高斯牛顿梯度下降法对待重构的三维人体网格模型的姿态参数和顶点坐标求解最小值;
b、固定待重构的三维人体网格模型的姿态参数β,用高斯牛顿梯度下降法对待重构的三维人体网格模型的形状参数和顶点坐标求解最小值;
c、重复a和b,至能量式函数收敛或者达到最大迭代次数,输出当前最优的参数解(α,β)。
最终重构的三维人体网格模型如图3所示,每个例子中,左图对应待合成的身体运动数据,中间两个场景分别表示待合成的脸部表情和手势,右图为合成后的结果从图中可以看出,本发明方法能够有效用于从不同类型数据中自然地合成身体运动、脸部表情和手部姿态,值得推广。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
Claims (1)
1.一种三维人体姿态、表情及手势的重构方法,其特征在于,包括以下步骤:
1)用参数化模型来表示待重构的三维人体网格模型;
令待重构的三维人体网格模型的顶点坐标构成的3NV维列向量为其中NV为待重构的三维人体网格模型的顶点数目,V是重构网格的顶点向量,v1为第一个顶点的坐标,为第NV个顶点的坐标,T为转置符号;于是表示待重构的三维人体网格模型即为最小化以下能量:
ε(V,α,β)=εS(V,α,β)+εB(V,α,β)+εG(V,α)+λεC(V,α,β)
其中,α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,λ为数据项的权重,ε(V,α,β)为重构的三维人体网格模型的最小化能量,该能量包括四项:εS(V,α,β)为拉伸项、εB(V,α,β)为弯曲项、εG(V,α)为体积项和εC(V,α,β)为数据项;待重构三维人体网格模型的姿态表示为BP(α,β),则拉伸项、弯曲项和体积项的作用是将待重构网格的边长、二面角和体积约束在BP(α,β)所张成的子空间内;
2)通过最小化能量获得三维人体网格模型;
定义待重构的三维人体网格模型的边长向量、二面角向量和体积分别为L(V)、A(V)和G(V);BS(α)为待重构的三维人体网格模型的形状,BP(α,β)为待重构的三维人体网格模型的姿态,L(α)和A(α)分别为BS(α)的LA向量的边长向量和二面角向量;
拉伸项εS(V,α,β)是限制每条边e的边长,表示为以下形式:
其中,|E|为待重构的三维人体网格模型中边的条数,L(l)(V)为待重构的三维人体网格模型的第l条边的边长,为RLA向量XL(α,β)的第l项,L(l)(α)为LA向量L(α)的第l项,wS,l表示能量的权重,取值为 表示平均形状中第l条边的边长,为表示方便,定义第l条边的能量函数fS,l(V,α,β)为:
弯曲项εB(V,α,β)用于限制待重构的三维人体网格模型的二面角,表示为以下形式:
其中,A(l)(V)为待重构的三维人体网格模型的第l条边的二面角,为RLA向量XA(α,β)的第l项,A(l)(α)为LA向量A(α)的第l项,wB,l表示能量的权重,取值 表示平均形状中与第l条边相邻的两个三角形的面积,为了表示方便,定义第l条边的能量函数fB,l(V,α,β)为:
体积项εG(V,α)用于约束待重构的三维人体网格模型的体积大小,表示为以下形式:
其中,αi为三维人体网格模型的第i个形状参数,G(i)表示第i个形状基的体积,G(0)为标准姿态的体积,NSB为形状基的总个数,WG表示能量的权重,取值为为了表示方便,定义体积项能量函数fG(V,α)为:
则体积项εG(V,α)重写为εG(V,α)=WGfG(V,α);
数据项εC(V,α,β)约束根据应用的不同而在形式上有所区别,但所有数据项最终都能够用如下能量项进行约束:
其中,Ncon为数据约束个数,WC,i为第i个数据约束的权重,fC,i(V,α,β)为第i个数据约束的约束函数;
3)采用改进的离散壳变形方法对步骤2)中的能量进行优化;
记f为如下定义的多元函数,其自变量由待重构的三维人体网格顶点坐标、形状参数和运动参数构成,即:
其中,x为自变量表示符号,V是重构网格的顶点向量α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,NSB为形状基的总个数,为第一个顶点的x坐标,为第一个顶点的y坐标,为第一个顶点的z坐标,为第NV个顶点的x坐标,为第NV个顶点的y坐标,为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,为三维人体网格模型的第NSB个形状参数,β1为三维人体网格模型的第一个姿态参数,为三维人体网格模型的第NMC个姿态参数,则映射关系为:
其中,|E|为边的条数,fS,1(V,α,β)、fB,1(V,α,β)为步骤2)中定义的第一条边的能量函数,即定义第l条边的能量函数fS,l(V,α,β)为定义第l条边的能量函数fB,l(V,α,β)为fS,|E|(V,α,β)、fB,|E|(V,α,β)为步骤2)中定义的第|E|条边的能量函数,wS,1、wB,1、wS,|E|、wB,|E|为对应能量函数的权重,fG(V,α)为步骤2)中定义的体积项能量函数,即WG为对应体积项能量函数的权重,Ncon为数据约束个数,fC,1(V,α,β)为步骤2)中定义的第一个数据约束的约束函数,为步骤2)中定义的第Ncon个数据约束的约束函数,wC,1为对应第一个数据约束的权重,为对应第Ncon个数据约束的权重;
3.1)固定待重构的三维人体网格模型的形状参数α,用高斯牛顿梯度下降法对待重构的三维人体网格模型的姿态参数和顶点坐标求解最小化:
此时,f(x)的未知量为其中x1为此时的自变量形式,V是重构网格的顶点向量β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,为第一个顶点的x坐标,为第一个顶点的y坐标,为第一个顶点的z坐标,为第NV个顶点的x坐标,为第NV个顶点的y坐标,为第NV个顶点的z坐标,β1为三维人体网格模型的第一个姿态参数,为三维人体网格模型的第NMC个姿态参数;采用高斯牛顿梯度下降法最小化f,假设已求得第h次迭代的解那么第h+1次迭代的解的公式为:
其中,J1为函数f关于x1的雅可比矩阵,J1 T为矩阵J1的转置矩阵,(J1 TJ1)-1表示求矩阵J1 TJ1的逆;为求雅可比矩阵,需求函数f的各个分量关于x1各分量的偏导,具体如下所示:
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,ML(i,j)为ML的第i行第j列的元素,MA为对RLA向量中的二面角进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,MA(i,j)为MA的第i行第j列的元素,RL(α,β)为MLP网络输出的相对边长分量,为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,为RA(α,β)的第l个分量,BS(α)为待重构的三维人体网格模型的形状,L(α)为BS(α)的LA向量的边长向量,L(l)(α)表示L(α)第l个元素,为函数fS,l(V,α,β)对βi的偏导数,为函数对βi的偏导数,为函数fB,l(V,α,β)对βi的偏导数,为函数对βi的偏导数;考虑到脸部表情和手势的变化小于其它身体姿态部位的变化,将优先重构脸部表情,然后求解身体姿态,最后求解手势;
3.2)固定待重构的三维人体网格模型的姿态参数β,用高斯牛顿梯度下降法求解待重构的三维人体网格模型的形状参数和顶点坐标:
此时,f(x)的未知量为其中x2为此时的自变量形式,V是重构网格的顶点向量,α为三维人体网格模型的形状参数,NV为待重构的三维人体网格模型的顶点个数,NSB为形状基的总个数,为第一个顶点的x坐标,为第一个顶点的y坐标,为第一个顶点的z坐标,为第NV个顶点的x坐标,为第NV个顶点的y坐标,为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,为三维人体网格模型的第NSB个形状参数;利用高斯牛顿梯度下降法最小化f,假设已找到第h次迭代的解那么第h+1次迭代的解的公式为:
其中,J2为函数f关于x2的雅可比矩阵,J2 T为矩阵J2的转置矩阵,(J2 TJ2)-1表示求矩阵J2 TJ2的逆;
同样,J2由函数f的各分量关于x2各个分量的偏导组成,具体偏导如下所示:
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,为ML的第l个的列向量,RL(α,β)为MLP网络输出的相对边长分量,为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,为RA(α,β)的第l个分量,L(α)为待重构的三维人体网格模型的边长向量,L(l)(α)表示L(α)第l个元素,βL为稀疏局部基的相对边长的系数向量,为函数fS,l(V,α,β)对αi的偏导数,为函数L(l)(α)对αi的偏导数,为函数对αi的偏导数,为函数fB,l(V,α,β)对αi的偏导数,为函数对αi的偏导数,为函数fG(V,α)对αi的偏导数;
3.3)重复步骤3.1)和3.2),直至函数收敛或者达到最大迭代次数,输出当前最优的参数解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910499359.0A CN110349268B (zh) | 2019-06-11 | 2019-06-11 | 一种三维人体姿态、表情及手势的重构方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910499359.0A CN110349268B (zh) | 2019-06-11 | 2019-06-11 | 一种三维人体姿态、表情及手势的重构方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110349268A CN110349268A (zh) | 2019-10-18 |
CN110349268B true CN110349268B (zh) | 2021-03-30 |
Family
ID=68181766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910499359.0A Active CN110349268B (zh) | 2019-06-11 | 2019-06-11 | 一种三维人体姿态、表情及手势的重构方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110349268B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111462306B (zh) * | 2020-03-17 | 2022-04-22 | 华南理工大学 | 基于体向量场稀疏局部化分解的三维头发参数化模型方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184861B (zh) * | 2015-10-20 | 2019-02-12 | 南京大学 | 一种自动人体三维重建系统 |
CN106683169B (zh) * | 2016-12-09 | 2019-10-18 | 华南理工大学 | 一种关节运动感知的稀疏局部分解及重构算法 |
CN109408037A (zh) * | 2018-09-13 | 2019-03-01 | 昆明理工大学 | 一种非接触的基于“手+脸表情+头部姿态”的混合控制方法 |
CN109859255B (zh) * | 2019-01-31 | 2023-08-04 | 天津大学 | 大动作运动物体的多视角非同时采集与重建方法 |
CN109840940B (zh) * | 2019-02-11 | 2023-06-27 | 清华-伯克利深圳学院筹备办公室 | 动态三维重建方法、装置、设备、介质和系统 |
-
2019
- 2019-06-11 CN CN201910499359.0A patent/CN110349268B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110349268A (zh) | 2019-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11017577B2 (en) | Skinned multi-person linear model | |
Wilhelms et al. | Anatomically based modeling | |
US6476804B1 (en) | System and method for generating computer animated graphical images of an exterior patch surface layer of material stretching over an understructure | |
Merry et al. | Animation space: A truly linear framework for character animation | |
US7515155B2 (en) | Statistical dynamic modeling method and apparatus | |
Schumacher et al. | Efficient simulation of example-based materials | |
Nedel et al. | Modeling and deformation of the human body using an anatomically-based approach | |
Jiang et al. | Transferring and fitting fixed-sized garments onto bodies of various dimensions and postures | |
Chen et al. | Lattice-based skinning and deformation for real-time skeleton-driven animation | |
Nedel et al. | Anatomic modeling of deformable human bodies | |
CN110363833B (zh) | 一种基于局部稀疏表示的完全人体运动参数化表示方法 | |
CN110349268B (zh) | 一种三维人体姿态、表情及手势的重构方法 | |
Yan et al. | Skeleton-based shape deformation using simplex transformations | |
KR20110070736A (ko) | 근육 및 외형 곡면 기반 개체 표준 메쉬 모델의 파라메트릭 제어를 통한 자동 리깅 및 형상 전이 방법 | |
CN105321205B (zh) | 一种基于稀疏关键点的参数化人体模型重建方法 | |
Chen et al. | Skeleton-driven surface deformation through lattices for real-time character animation | |
US6483506B1 (en) | System and method for generating computer animated graphical images of a vascular structure attached to an anatomical structure | |
Tejera et al. | Learning part-based models for animation from surface motion capture | |
Li et al. | Anatomical human musculature modeling for real-time deformation | |
Chen et al. | A data-driven approach to efficient character articulation | |
Magnenat-Thalmann et al. | Automatic modeling of animatable virtual humans-a survey | |
Aubel et al. | MuscleBuilder: a modeling tool for human anatomy | |
Schneider et al. | Hybrid anatomically based modelling of animals | |
Huang et al. | Interactive mesh deformation with pseudo material effects | |
de Aguiar et al. | Representing and manipulating mesh-based character animations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |