CN110349268B - 一种三维人体姿态、表情及手势的重构方法 - Google Patents

一种三维人体姿态、表情及手势的重构方法 Download PDF

Info

Publication number
CN110349268B
CN110349268B CN201910499359.0A CN201910499359A CN110349268B CN 110349268 B CN110349268 B CN 110349268B CN 201910499359 A CN201910499359 A CN 201910499359A CN 110349268 B CN110349268 B CN 110349268B
Authority
CN
China
Prior art keywords
mesh model
reconstructed
dimensional human
human body
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910499359.0A
Other languages
English (en)
Other versions
CN110349268A (zh
Inventor
李桂清
姚秀秀
王宇攀
邹歆仪
聂勇伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201910499359.0A priority Critical patent/CN110349268B/zh
Publication of CN110349268A publication Critical patent/CN110349268A/zh
Application granted granted Critical
Publication of CN110349268B publication Critical patent/CN110349268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation

Abstract

本发明公开了一种三维人体姿态、表情及手势的重构方法,包括步骤:1)用参数化模型来表示待重构的三维人体网格模型;2)通过最小化能量获得三维人体网格模型;3)采用改进的离散壳变形方法对步骤2)中的能量进行优化。本发明可以从给定特定几何形状的约束中,求解出带重构的三维人体网格模型的形状与姿态参数,使得所确定的形状逼近所给的数据。

Description

一种三维人体姿态、表情及手势的重构方法
技术领域
本发明涉及三维人体姿态、表情及手势重构的技术领域,尤其是指一种三维人体姿态、表情及手势的重构方法。
背景技术
目前已经存在大量的文献分别研究了对身体姿态、面部表情和手势的参数化模型表示。但是重构完全人体动态几何的问题仍是开放性问题,由于不同部位运动的尺度不同,建立完全人体参数化模型并未引起注意,相关文献较少.大部分现有的参数化表示仅针对身体、脸部、手部运动中的一种。
三维可变形模型。SCAPE结合了姿态的运动数据和蒙皮权重描述形态和运动变化。使用三角形的变形梯度捕捉姿态变化,将每个三角形的变形分解为形状变形、位姿相关变形和校正变形。目前的研究中,SCAPE被广泛应用于运动捕捉和三维人体重建。但是SCAPE很难描述不同个体在做相同姿态时的细微差异。此外基于SCAPE的方法可能导致严重的视觉伪影,类似于骨骼蒙皮。加上难以捕捉小规模的动态几何图形,如面部表情和手势。
基于骨骼蒙皮模型。SMPL利用顶点坐标的PCA基对人体的形状和姿态变化进行编码,并利用基于顶点坐标的混合蒙皮技术表示姿态变形。与基于SCAPE的模型相比,该模型快速、直观。近年来,它被广泛应用于许多领域,如深度地图、图像或视频的运动捕捉和三维重建。然而,SMPL在发生较大扭转的关节附近会发生严重的塌陷。受Zuffi and Black基于部分的缝制木偶模型的启发,Joo等人提出了Frankenstein模型来表示人脸、手和身体的变形。他们使用SMPL来描述身体和手的变化,利用双线性模型来模拟面部表情。但是Frankenstein模型既没有建立一个统一的参数模型,也没有产生一个单一的网格,只是对其他部分进行变形,使之与主体部分兼容。
人脸静态模型。Blendshape是早期面部动画最流行的表现形式。它为每个面部特征点创建顶点位移基,并通过混合这些基来表示个性化中立人脸的动画。然而,这个模型没有捕捉到形状的变化。相反,由Blanz and Vetter设计的3DMM(3D morphable model)侧重于表现不同的面部形状,但是无法支持表情。Amberg等人使用更多的数据集对模型进行训练,从而增强了模型。结合这两种模型,Weise等人设计了一个实时的基于性能的面部动画系统。Bouaziz等在3DMM基础上建立自适应DEM(Dynamic Expression Model),同时捕捉面部形态和表情变化。Cao等提出了FaceWarehouse训练双线性人脸模型,用于表示人脸形状和表情的变化。Garrido等建立了基于3DMM和DEM的综合人脸模型。
手的参数模型。大多数人手部参数模型是针对手部运动跟踪而不是精确的几何重建的,骨骼蒙皮技术经常被用来做这件事。另一方面,基于骨骼网格的隐式表示也很受欢迎,它可以提供更优越的跟踪性能。然而,上述大多数方法都不是基于统计的。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种三维人体姿态、表情及手势的重构方法,从给定特定几何形状的约束中,求解出带重构的三维人体网格模型的形状与姿态参数,使得所确定的形状逼近所给的数据。
为实现上述目的,本发明所提供的技术方案为:一种三维人体姿态、表情及手势的重构方法,包括以下步骤:
1)用参数化模型来表示待重构的三维人体网格模型;
2)通过最小化能量获得三维人体网格模型;
3)采用改进的离散壳变形方法对步骤2)中的能量进行优化。
在步骤1)中,令待重构的三维人体网格模型的顶点坐标构成的3NV(其中NV为待重构的三维人体网格模型的顶点数目)维列向量为
Figure GDA0002776529460000031
(其中V是重构网格的顶点向量,v1为第一个顶点的坐标,
Figure GDA0002776529460000032
为第NV个顶点的坐标,T为转置符号),于是表示待重构的三维人体网格模型即为最小化以下能量:
ε(V,α,β)=εS(V,α,β)+εB(V,α,β)+εG(V,α)+λεC(V,α,β)
其中,α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,λ为数据项的权重,ε(V,α,β)为重构的三维人体网格模型的最小化能量,该能量包括四项:εS(V,α,β)为拉伸项、εB(V,α,β)为弯曲项、εG(V,α)为体积项和εC(V,α,β)为数据项;待重构三维人体网格模型的姿态表示为BP(α,β),则拉伸项、弯曲项和体积项的作用是将待重构网格的边长、二面角和体积约束在BP(α,β)所张成的子空间内。
在步骤2)中,定义待重构的三维人体网格模型的边长向量、二面角向量和体积分别为L(V)、A(V)和G(V);BS(α)为待重构的三维人体网格模型的形状,BP(α,β)为待重构的三维人体网格模型的姿态,L(α)和A(α)分别为BS(α)的LA向量的边长向量和二面角向量;
拉伸项εS(V,α,β)是限制每条边e的边长,表示为以下形式:
Figure GDA0002776529460000033
其中,|E|为待重构的三维人体网格模型中边的条数,L(l)(V)为待重构的三维人体网格模型的第l条边的边长,
Figure GDA0002776529460000034
为RLA向量XL(α,β)的第l项,L(l)(α)为LA向量L(α)的第l项,wS,l表示能量的权重,取值为
Figure GDA0002776529460000035
Figure GDA0002776529460000036
表示平均形状
Figure GDA0002776529460000037
中第l条边的边长,为表示方便,定义第l条边的能量函数fS,l(V,α,β)为:
Figure GDA0002776529460000038
则拉伸项εS(V,α,β)重写为
Figure GDA0002776529460000041
弯曲项εB(V,α,β)用于限制待重构的三维人体网格模型的二面角,表示为以下形式:
Figure GDA0002776529460000042
其中,A(l)(V)为待重构的三维人体网格模型的第l条边的二面角,
Figure GDA0002776529460000043
为RLA向量XA(α,β)的第l项,A(l)(α)为LA向量A(α)的第l项,wB,l表示能量的权重,取值
Figure GDA0002776529460000044
Figure GDA0002776529460000045
表示平均形状
Figure GDA0002776529460000046
中与第l条边相邻的两个三角形的面积,为了表示方便,定义第l条边的能量函数fB,l(V,α,β)为:
Figure GDA0002776529460000047
则弯曲项εB(V,α,β)重写为
Figure GDA0002776529460000048
体积项εG(V,α)用于约束待重构的三维人体网格模型的体积大小,表示为以下形式:
Figure GDA0002776529460000049
其中,αi为三维人体网格模型的第i个形状参数,G(i)表示第i个形状基的体积,G(0)为标准姿态的体积,NSB为形状基的总个数,WG表示能量的权重,取值为
Figure GDA00027765294600000410
为了表示方便,定义体积项能量函数fG(V,α)为:
Figure GDA00027765294600000411
则体积项εG(V,α)重写为εG(V,α)=WGfG(V,α);
数据项εC(V,α,β)约束根据应用的不同而在形式上有所区别,但所有数据项最终都能够用如下能量项进行约束:
Figure GDA0002776529460000051
其中,Ncon为数据约束个数,WC,i为第i个数据约束的权重,fC,i(V,α,β)为第i个数据约束的约束函数。
在步骤3)中,记f为如下定义的多元函数,其自变量由待重构的三维人体网格顶点坐标、形状参数和运动参数构成,即:
Figure GDA0002776529460000052
其中,x为自变量表示符号,V是重构网格的顶点向量
Figure GDA0002776529460000053
α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,NSB为形状基的总个数,
Figure GDA0002776529460000054
为第一个顶点的x坐标,
Figure GDA0002776529460000055
为第一个顶点的y坐标,
Figure GDA0002776529460000056
为第一个顶点的z坐标,
Figure GDA0002776529460000057
为第NV个顶点的x坐标,
Figure GDA0002776529460000058
为第NV个顶点的y坐标,
Figure GDA0002776529460000059
为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,
Figure GDA00027765294600000510
为三维人体网格模型的第NSB个形状参数,β1为三维人体网格模型的第一个姿态参数,
Figure GDA00027765294600000511
为三维人体网格模型的第NMC个姿态参数,则映射关系为:
Figure GDA00027765294600000512
Figure GDA00027765294600000513
Figure GDA00027765294600000514
Figure GDA00027765294600000515
其中,|E|为边的条数,fS,1(V,α,β)、fB,1(V,α,β)为步骤2)中定义的第一条边的能量函数,即定义第l条边的能量函数fS,l(V,α,β)为
Figure GDA00027765294600000516
定义第l条边的能量函数fB,l(V,α,β)为
Figure GDA0002776529460000061
fS,|E|(V,α,β)、fB,|E|(V,α,β)为步骤2)中定义的第|E|条边的能量函数,wS,1、wB,1、wS,|E|、wB,|E|为对应能量函数的权重,fG(V,α)为步骤2)中定义的体积项能量函数,即
Figure GDA0002776529460000062
WG为对应体积项能量函数的权重,Ncon为数据约束个数,fC,1(V,α,β)为步骤2)中定义的第一个数据约束的约束函数,
Figure GDA0002776529460000063
为步骤2)中定义的第Ncon个数据约束的约束函数,wC,1为对应第一个数据约束的权重,
Figure GDA0002776529460000064
为对应第Ncon个数据约束的权重;
于是最小化能量
Figure GDA0002776529460000065
其中,f(x)T表示为f(x)的转置;求得x=(V,α,β)的具体求解步骤如下:
3.1)固定待重构的三维人体网格模型的形状参数α,用高斯牛顿梯度下降法对待重构的三维人体网格模型的姿态参数和顶点坐标求解最小化:
此时,f(x)的未知量为
Figure GDA0002776529460000066
其中x1为此时的自变量形式,V是重构网格的顶点向量
Figure GDA0002776529460000067
β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,
Figure GDA0002776529460000068
为第一个顶点的x坐标,
Figure GDA0002776529460000069
为第一个顶点的y坐标,
Figure GDA00027765294600000610
为第一个顶点的z坐标,
Figure GDA00027765294600000611
为第NV个顶点的x坐标,
Figure GDA00027765294600000612
为第NV个顶点的y坐标,
Figure GDA00027765294600000613
为第NV个顶点的z坐标,β1为三维人体网格模型的第一个姿态参数,
Figure GDA00027765294600000614
为三维人体网格模型的第NMC个姿态参数;采用高斯牛顿梯度下降法最小化f,假设已求得第h次迭代的解
Figure GDA00027765294600000615
那么第h+1次迭代的解的公式为:
Figure GDA00027765294600000616
其中,J1为函数f关于x1的雅可比矩阵,J1 T为矩阵J1的转置矩阵,(J1 TJ1)-1表示求矩阵J1 TJ1的逆;为求雅可比矩阵,需求函数f的各个分量关于x1各分量的偏导,具体如下所示:
Figure GDA0002776529460000071
Figure GDA0002776529460000072
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,ML(i,j)为ML的第i行第j列的元素,MA为对RLA向量中的二面角进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,MA(i,j)为MA的第i行第j列的元素,RL(α,β)为MLP网络输出的相对边长分量,
Figure GDA0002776529460000073
为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,
Figure GDA0002776529460000074
为RA(α,β)的第l个分量,BS(α)为待重构的三维人体网格模型的形状,L(α)为BS(α)的LA向量的边长向量,L(l)(α)表示L(α)第l个元素,
Figure GDA0002776529460000075
为函数fS,l(V,α,β)对βi的偏导数,
Figure GDA0002776529460000076
为函数
Figure GDA0002776529460000077
对βi的偏导数,
Figure GDA0002776529460000078
为函数fB,l(V,α,β)对βi的偏导数,
Figure GDA0002776529460000079
为函数
Figure GDA00027765294600000710
对βi的偏导数;考虑到脸部表情和手势的变化小于其它身体姿态部位的变化,将优先重构脸部表情,然后求解身体姿态,最后求解手势;
3.2)固定待重构的三维人体网格模型的姿态参数β,用高斯牛顿梯度下降法求解待重构的三维人体网格模型的形状参数和顶点坐标:
此时,f(x)的未知量为
Figure GDA00027765294600000711
其中x2为此时的自变量形式,V是重构网格的顶点向量
Figure GDA00027765294600000712
α为三维人体网格模型的形状参数,NV为待重构的三维人体网格模型的顶点个数,NSB为形状基的总个数,
Figure GDA0002776529460000081
为第一个顶点的x坐标,
Figure GDA0002776529460000082
为第一个顶点的y坐标,
Figure GDA0002776529460000083
为第一个顶点的z坐标,
Figure GDA0002776529460000084
为第NV个顶点的x坐标,
Figure GDA0002776529460000085
为第NV个顶点的y坐标,
Figure GDA0002776529460000086
为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,
Figure GDA0002776529460000087
为三维人体网格模型的第NSB个形状参数;利用高斯牛顿梯度下降法最小化f,假设已找到第h次迭代的解
Figure GDA0002776529460000088
那么第h+1次迭代的解的公式为:
Figure GDA0002776529460000089
其中,J2为函数f关于x2的雅可比矩阵,J2 T为矩阵J2的转置矩阵,(J2 TJ2)-1表示求矩阵J2 TJ2的逆;
同样,J2由函数f的各分量关于x2各个分量的偏导组成,具体偏导如下所示:
Figure GDA00027765294600000810
Figure GDA00027765294600000811
Figure GDA00027765294600000812
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,
Figure GDA00027765294600000813
为ML的第l个的列向量,RL(α,β)为MLP网络输出的相对边长分量,
Figure GDA00027765294600000814
为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,
Figure GDA00027765294600000815
为RA(α,β)的第l个分量,L(α)为待重构的三维人体网格模型的边长向量,L(l)(α)表示L(α)第l个元素,βL为稀疏局部基的相对边长的系数向量,
Figure GDA00027765294600000816
为函数fS,l(V,α,β)对αi的偏导数,
Figure GDA00027765294600000817
为函数L(l)(α)对αi的偏导数,
Figure GDA0002776529460000091
为函数
Figure GDA0002776529460000092
对αi的偏导数,
Figure GDA0002776529460000093
为函数fB,l(V,α,β)对αi的偏导数,
Figure GDA0002776529460000094
为函数
Figure GDA0002776529460000095
对αi的偏导数,
Figure GDA0002776529460000096
为函数fG(V,α)对αi的偏导数;
3.3)重复步骤3.1)和3.2),直至函数收敛或者达到最大迭代次数,输出当前最优的参数解。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明采用参数化模型进行重构,克服不同人体部位运动的尺度不同的难点,能有效的重构出人体的形状、姿态、脸部表情和手势。
2、本发明是一个完全人体运动的重构方法,区别于之前只针对身体、脸部或手部运动中的一种进行重构后再进行组合的重构方法,能够同时重构出人体的完全运动包括身体姿态、脸部表情和手势。
3、本发明的重构方法能够有效的避免严重的关节扭曲问题,使得重构出来的三维人体网格模型看上去更加自然。
附图说明
图1是具体网络拟合时候,选取的12个锚三角形的分布图。
图2是MLP网络结构图。
图3是从不同类型数据中自然地合成身体运动、脸部表情和手部姿态的示意图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本实施例所提供的三维人体姿态、表情及手势的重构方法,包括以下步骤:
1)用参数化模型来表示待重构的三维人体网格模型
令待重构的三维人体网格模型的顶点坐标构成的3NV(其中NV为待重构的三维人体网格模型的顶点数目)维列向量为
Figure GDA0002776529460000101
(其中V是重构网格的顶点向量,v1为第一个顶点的坐标,
Figure GDA0002776529460000102
为第NV个顶点的坐标,T为转置符号),于是表示待重构的三维人体网格模型即为最小化以下能量:
ε(V,α,β)=εS(V,α,β)+εB(V,α,β)+εG(V,α)+λεC(V,α,β)
其中,α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,λ为数据项的权重,ε(V,α,β)为重构的三维人体网格模型的最小化能量,该能量包括四项:εS(V,α,β)为拉伸项、εB(V,α,β)为弯曲项、εG(V,α)为体积项和εC(V,α,β)为数据项;待重构三维人体网格模型的姿态表示为BP(α,β),则拉伸项、弯曲项和体积项的作用是将待重构网格的边长、二面角和体积约束在BP(α,β)所张成的子空间内。
2)通过最小化能量获得三维人体网格模型
定义待重构的三维人体网格模型的边长向量、二面角向量和体积分别为L(V)、A(V)和G(V);BS(α)为待重构的三维人体网格模型的形状,BP(α,β)为待重构的三维人体网格模型的姿态,L(α)和A(α)分别为BS(α)的LA向量的边长向量和二面角向量;
拉伸项εS(V,α,β)是限制每条边e的边长,表示为以下形式:
Figure GDA0002776529460000103
其中,|E|为待重构的三维人体网格模型中边的条数,L(l)(V)为待重构的三维人体网格模型的第l条边的边长,
Figure GDA0002776529460000104
为RLA向量XL(α,β)的第l项,L(l)(α)为LA向量L(α)的第l项,wS,l表示能量的权重,取值为
Figure GDA0002776529460000105
Figure GDA0002776529460000106
表示平均形状
Figure GDA0002776529460000111
中第l条边的边长,为表示方便,定义第l条边的能量函数fS,l(V,α,β)为:
Figure GDA0002776529460000112
则拉伸项εS(V,α,β)重写为
Figure GDA0002776529460000113
弯曲项εB(V,α,β)用于限制待重构的三维人体网格模型的二面角,表示为以下形式:
Figure GDA0002776529460000114
其中,A(l)(V)为待重构的三维人体网格模型的第l条边的二面角,
Figure GDA0002776529460000115
为RLA向量XA(α,β)的第l项,A(l)(α)为LA向量A(α)的第l项,wB,l表示能量的权重,取值
Figure GDA0002776529460000116
Figure GDA0002776529460000117
表示平均形状
Figure GDA0002776529460000118
中与第l条边相邻的两个三角形的面积,为了表示方便,定义第l条边的能量函数fB,l(V,α,β)为:
Figure GDA0002776529460000119
则弯曲项εB(V,α,β)重写为
Figure GDA00027765294600001110
体积项εG(V,α)用于约束待重构的三维人体网格模型的体积大小,表示为以下形式:
Figure GDA00027765294600001111
其中,αi为三维人体网格模型的第i个形状参数,G(i)表示第i个形状基的体积,G(0)为标准姿态的体积,NSB为形状基的总个数,WG表示能量的权重,取值为
Figure GDA00027765294600001112
为了表示方便,定义体积项能量函数fG(V,α)为:
Figure GDA00027765294600001113
则体积项εG(V,α)重写为εG(V,α)=WGfG(V,α);
数据项εC(V,α,β)约束根据应用的不同而在形式上有所区别,但所有数据项最终都能够用如下能量项进行约束:
Figure GDA0002776529460000121
其中,Ncon为数据约束个数,WC,i为第i个数据约束的权重,fC,i(V,α,β)为第i个数据约束的约束函数。
3)采用改进的离散壳变形方法对步骤2)中的能量进行优化
记f为如下定义的多元函数,其自变量由待重构的三维人体网格顶点坐标、形状参数和运动参数构成,即:
Figure GDA0002776529460000122
其中,x为自变量表示符号,V是重构网格的顶点向量
Figure GDA0002776529460000123
α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,NSB为形状基的总个数,
Figure GDA0002776529460000124
为第一个顶点的x坐标,
Figure GDA0002776529460000125
为第一个顶点的y坐标,
Figure GDA0002776529460000126
为第一个顶点的z坐标,
Figure GDA0002776529460000127
为第NV个顶点的x坐标,
Figure GDA0002776529460000128
为第NV个顶点的y坐标,
Figure GDA0002776529460000129
为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,
Figure GDA00027765294600001210
为三维人体网格模型的第NSB个形状参数,β1为三维人体网格模型的第一个姿态参数,
Figure GDA00027765294600001211
为三维人体网格模型的第NMC个姿态参数则映射关系为:
Figure GDA00027765294600001212
Figure GDA00027765294600001213
Figure GDA00027765294600001214
Figure GDA00027765294600001215
其中,|E|为边的条数,fS,1(V,α,β)、fB,1(V,α,β)为步骤2)中定义的第一条边的能量函数,即定义第l条边的能量函数fS,l(V,α,β)为
Figure GDA0002776529460000131
定义第l条边的能量函数fB,l(V,α,β)为
Figure GDA00027765294600001315
fS,|E|(V,α,β)、fB,|E|(V,α,β)为步骤2)中定义的第|E|条边的能量函数,wS,1、wB,1、wS,|E|、wB,|E|为对应能量函数的权重,fG(V,α)为步骤2)中定义的体积项能量函数,即
Figure GDA0002776529460000132
WG为对应体积项能量函数的权重,Ncon为数据约束个数,fC,1(V,α,β)为步骤2)中定义的第一个数据约束的约束函数,
Figure GDA0002776529460000133
为步骤2)中定义的第Ncon个数据约束的约束函数,wC,1为对应第一个数据约束的权重,
Figure GDA0002776529460000134
为对应第Ncon个数据约束的权重;
于是最小化能量
Figure GDA0002776529460000135
其中,f(x)T表示为f(x)的转置;求得x=(V,α,β)的具体求解步骤如下:
3.1)固定待重构的三维人体网格模型的形状参数α,用高斯牛顿梯度下降法对待重构的三维人体网格模型的姿态参数和顶点坐标求解最小化:
此时,f(x)的未知量为
Figure GDA0002776529460000136
其中x1为此时的自变量形式,V是重构网格的顶点向量
Figure GDA0002776529460000137
β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,
Figure GDA0002776529460000138
为第一个顶点的x坐标,
Figure GDA0002776529460000139
为第一个顶点的y坐标,
Figure GDA00027765294600001310
为第一个顶点的z坐标,
Figure GDA00027765294600001311
为第NV个顶点的x坐标,
Figure GDA00027765294600001312
为第NV个顶点的y坐标,
Figure GDA00027765294600001313
为第NV个顶点的z坐标,β1为三维人体网格模型的第一个姿态参数,
Figure GDA00027765294600001314
为三维人体网格模型的第NMC个姿态参数;采用高斯牛顿梯度下降法最小化f,假设已求得第h次迭代的解
Figure GDA0002776529460000141
那么第h+1次迭代的解的公式为:
Figure GDA0002776529460000142
其中,J1为函数f关于x1的雅可比矩阵,J1 T为矩阵J1的转置矩阵,(J1 TJ1)-1表示求矩阵J1 TJ1的逆;为求雅可比矩阵,需求函数f的各个分量关于x1各分量的偏导,具体如下所示:
Figure GDA0002776529460000143
Figure GDA0002776529460000144
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,ML(i,j)为ML的第i行第j列的元素,MA为对RLA向量中的二面角进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,MA(i,j)为MA的第i行第j列的元素,RL(α,β)为MLP网络输出的相对边长分量,
Figure GDA0002776529460000145
为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,
Figure GDA0002776529460000146
为RA(α,β)的第l个分量,BS(α)为待重构的三维人体网格模型的形状,L(α)为BS(α)的LA向量的边长向量,L(l)(α)表示L(α)第l个元素,
Figure GDA0002776529460000147
为函数fS,l(V,α,β)对βi的偏导数,
Figure GDA0002776529460000148
为函数
Figure GDA0002776529460000149
对βi的偏导数,
Figure GDA00027765294600001410
为函数fB,l(V,α,β)对βi的偏导数,
Figure GDA00027765294600001411
为函数
Figure GDA00027765294600001412
对βi的偏导数;考虑到脸部表情和手势的变化小于其它身体姿态部位的变化,将优先重构脸部表情,然后求解身体姿态,最后求解手势;
3.2)固定待重构的三维人体网格模型的姿态参数β,用高斯牛顿梯度下降法求解待重构的三维人体网格模型的形状参数和顶点坐标:
此时,f(x)的未知量为
Figure GDA0002776529460000151
其中x2为此时的自变量形式,V是重构网格的顶点向量,α为三维人体网格模型的形状参数,NV为待重构的三维人体网格模型的顶点个数,NSB为形状基的总个数,
Figure GDA0002776529460000152
为第一个顶点的x坐标,
Figure GDA0002776529460000153
为第一个顶点的y坐标,
Figure GDA0002776529460000154
为第一个顶点的z坐标,
Figure GDA0002776529460000155
为第NV个顶点的x坐标,
Figure GDA0002776529460000156
为第NV个顶点的y坐标,
Figure GDA0002776529460000157
为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,
Figure GDA0002776529460000158
为三维人体网格模型的第NSB个形状参数;利用高斯牛顿梯度下降法最小化f,假设已找到第h次迭代的解
Figure GDA0002776529460000159
那么第h+1次迭代的解的公式为:
Figure GDA00027765294600001510
其中,J2为函数f关于x2的雅可比矩阵,J2 T为矩阵J2的转置矩阵,(J2 TJ2)-1表示求矩阵J2 TJ2的逆;
同样,J2由函数f的各分量关于x2各个分量的偏导组成,具体偏导如下所示:
Figure GDA00027765294600001511
Figure GDA00027765294600001512
Figure GDA00027765294600001513
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,
Figure GDA00027765294600001514
为ML的第l个的列向量,RL(α,β)为MLP网络输出的相对边长分量,
Figure GDA00027765294600001515
为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,
Figure GDA00027765294600001516
为RA(α,β)的第l个分量,L(α)为待重构的三维人体网格模型的边长向量,L(l)(α)表示L(α)第l个元素,βL为稀疏局部基的相对边长的系数向量,
Figure GDA0002776529460000161
为函数fS,l(V,α,β)对αi的偏导数,
Figure GDA0002776529460000162
为函数L(l)(α)对αi的偏导数,
Figure GDA0002776529460000163
为函数
Figure GDA0002776529460000164
对αi的偏导数,
Figure GDA0002776529460000165
为函数fB,l(V,α,β)对αi的偏导数,
Figure GDA0002776529460000166
为函数
Figure GDA0002776529460000167
对αi的偏导数,
Figure GDA0002776529460000168
为函数fG(V,α)对αi的偏导数;
3.3)重复步骤3.1)和3.2),直至函数收敛或者达到最大迭代次数,输出当前最优的参数解。
对于我们的重构任务来说,一个好的初始解非常重要。根据不同的重构任务,一旦确定形状参数α和姿态参数β,可计算出LA向量L(α,β)和A(α,β)。我们利用合成数据库的丰富信息来建立形状参数α和姿态参数β与模型上某些特殊的标架之间的关系。为了直接从形状和运动参数得到锚定三角形标架信息,我们选取了锚定三角形,利用用多层感知机(MLP)来预测这些三角形的局部正交标架。如图1所示,选取了12个三角形,分布在人体的脸部、上下肢、躯干、腿部的区域。图2则给出了所采用的MLP的网络结构图:输入数据为形状参数α和姿态参数β,包含3层隐藏层,每层分别包含100、200、400个隐含因子,最终输出12个正交标架。其每层的激活函数为Sigmoid函数。我们用FA(α,β)表示该MLP输出。然后根据步骤2)进行能量式的优化:
a、固定待重构的三维人体网格模型的形状参数α,用高斯牛顿梯度下降法对待重构的三维人体网格模型的姿态参数和顶点坐标求解最小值;
b、固定待重构的三维人体网格模型的姿态参数β,用高斯牛顿梯度下降法对待重构的三维人体网格模型的形状参数和顶点坐标求解最小值;
c、重复a和b,至能量式函数收敛或者达到最大迭代次数,输出当前最优的参数解(α,β)。
最终重构的三维人体网格模型如图3所示,每个例子中,左图对应待合成的身体运动数据,中间两个场景分别表示待合成的脸部表情和手势,右图为合成后的结果从图中可以看出,本发明方法能够有效用于从不同类型数据中自然地合成身体运动、脸部表情和手部姿态,值得推广。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (1)

1.一种三维人体姿态、表情及手势的重构方法,其特征在于,包括以下步骤:
1)用参数化模型来表示待重构的三维人体网格模型;
令待重构的三维人体网格模型的顶点坐标构成的3NV维列向量为
Figure FDA0002776529450000011
其中NV为待重构的三维人体网格模型的顶点数目,V是重构网格的顶点向量,v1为第一个顶点的坐标,
Figure FDA0002776529450000012
为第NV个顶点的坐标,T为转置符号;于是表示待重构的三维人体网格模型即为最小化以下能量:
ε(V,α,β)=εS(V,α,β)+εB(V,α,β)+εG(V,α)+λεC(V,α,β)
其中,α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,λ为数据项的权重,ε(V,α,β)为重构的三维人体网格模型的最小化能量,该能量包括四项:εS(V,α,β)为拉伸项、εB(V,α,β)为弯曲项、εG(V,α)为体积项和εC(V,α,β)为数据项;待重构三维人体网格模型的姿态表示为BP(α,β),则拉伸项、弯曲项和体积项的作用是将待重构网格的边长、二面角和体积约束在BP(α,β)所张成的子空间内;
2)通过最小化能量获得三维人体网格模型;
定义待重构的三维人体网格模型的边长向量、二面角向量和体积分别为L(V)、A(V)和G(V);BS(α)为待重构的三维人体网格模型的形状,BP(α,β)为待重构的三维人体网格模型的姿态,L(α)和A(α)分别为BS(α)的LA向量的边长向量和二面角向量;
拉伸项εS(V,α,β)是限制每条边e的边长,表示为以下形式:
Figure FDA0002776529450000013
其中,|E|为待重构的三维人体网格模型中边的条数,L(l)(V)为待重构的三维人体网格模型的第l条边的边长,
Figure FDA0002776529450000021
为RLA向量XL(α,β)的第l项,L(l)(α)为LA向量L(α)的第l项,wS,l表示能量的权重,取值为
Figure FDA0002776529450000022
Figure FDA0002776529450000023
表示平均形状
Figure FDA0002776529450000024
中第l条边的边长,为表示方便,定义第l条边的能量函数fS,l(V,α,β)为:
Figure FDA0002776529450000025
则拉伸项εS(V,α,β)重写为
Figure FDA0002776529450000026
弯曲项εB(V,α,β)用于限制待重构的三维人体网格模型的二面角,表示为以下形式:
Figure FDA0002776529450000027
其中,A(l)(V)为待重构的三维人体网格模型的第l条边的二面角,
Figure FDA0002776529450000028
为RLA向量XA(α,β)的第l项,A(l)(α)为LA向量A(α)的第l项,wB,l表示能量的权重,取值
Figure FDA0002776529450000029
Figure FDA00027765294500000210
表示平均形状
Figure FDA00027765294500000211
中与第l条边相邻的两个三角形的面积,为了表示方便,定义第l条边的能量函数fB,l(V,α,β)为:
Figure FDA00027765294500000212
则弯曲项εB(V,α,β)重写为
Figure FDA00027765294500000213
体积项εG(V,α)用于约束待重构的三维人体网格模型的体积大小,表示为以下形式:
Figure FDA00027765294500000214
其中,αi为三维人体网格模型的第i个形状参数,G(i)表示第i个形状基的体积,G(0)为标准姿态的体积,NSB为形状基的总个数,WG表示能量的权重,取值为
Figure FDA0002776529450000031
为了表示方便,定义体积项能量函数fG(V,α)为:
Figure FDA0002776529450000032
则体积项εG(V,α)重写为εG(V,α)=WGfG(V,α);
数据项εC(V,α,β)约束根据应用的不同而在形式上有所区别,但所有数据项最终都能够用如下能量项进行约束:
Figure FDA0002776529450000033
其中,Ncon为数据约束个数,WC,i为第i个数据约束的权重,fC,i(V,α,β)为第i个数据约束的约束函数;
3)采用改进的离散壳变形方法对步骤2)中的能量进行优化;
记f为如下定义的多元函数,其自变量由待重构的三维人体网格顶点坐标、形状参数和运动参数构成,即:
Figure FDA0002776529450000034
其中,x为自变量表示符号,V是重构网格的顶点向量
Figure FDA0002776529450000035
α为三维人体网格模型的形状参数,β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,NSB为形状基的总个数,
Figure FDA0002776529450000036
为第一个顶点的x坐标,
Figure FDA0002776529450000037
为第一个顶点的y坐标,
Figure FDA0002776529450000038
为第一个顶点的z坐标,
Figure FDA0002776529450000039
为第NV个顶点的x坐标,
Figure FDA00027765294500000310
为第NV个顶点的y坐标,
Figure FDA00027765294500000311
为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,
Figure FDA00027765294500000312
为三维人体网格模型的第NSB个形状参数,β1为三维人体网格模型的第一个姿态参数,
Figure FDA00027765294500000313
为三维人体网格模型的第NMC个姿态参数,则映射关系为:
Figure FDA0002776529450000041
其中,|E|为边的条数,fS,1(V,α,β)、fB,1(V,α,β)为步骤2)中定义的第一条边的能量函数,即定义第l条边的能量函数fS,l(V,α,β)为
Figure FDA0002776529450000042
定义第l条边的能量函数fB,l(V,α,β)为
Figure FDA0002776529450000043
fS,|E|(V,α,β)、fB,|E|(V,α,β)为步骤2)中定义的第|E|条边的能量函数,wS,1、wB,1、wS,|E|、wB,|E|为对应能量函数的权重,fG(V,α)为步骤2)中定义的体积项能量函数,即
Figure FDA0002776529450000044
WG为对应体积项能量函数的权重,Ncon为数据约束个数,fC,1(V,α,β)为步骤2)中定义的第一个数据约束的约束函数,
Figure FDA0002776529450000045
为步骤2)中定义的第Ncon个数据约束的约束函数,wC,1为对应第一个数据约束的权重,
Figure FDA0002776529450000046
为对应第Ncon个数据约束的权重;
于是最小化能量
Figure FDA0002776529450000047
其中,f(x)T表示为f(x)的转置;求得x=(V,α,β)的具体求解步骤如下:
3.1)固定待重构的三维人体网格模型的形状参数α,用高斯牛顿梯度下降法对待重构的三维人体网格模型的姿态参数和顶点坐标求解最小化:
此时,f(x)的未知量为
Figure FDA0002776529450000048
其中x1为此时的自变量形式,V是重构网格的顶点向量
Figure FDA0002776529450000049
β为三维人体网格模型的姿态参数,NV为待重构的三维人体网格模型的顶点个数,NMC为从数据集中提取到的基的总个数,
Figure FDA00027765294500000410
为第一个顶点的x坐标,
Figure FDA00027765294500000411
为第一个顶点的y坐标,
Figure FDA0002776529450000051
为第一个顶点的z坐标,
Figure FDA0002776529450000052
为第NV个顶点的x坐标,
Figure FDA0002776529450000053
为第NV个顶点的y坐标,
Figure FDA0002776529450000054
为第NV个顶点的z坐标,β1为三维人体网格模型的第一个姿态参数,
Figure FDA0002776529450000055
为三维人体网格模型的第NMC个姿态参数;采用高斯牛顿梯度下降法最小化f,假设已求得第h次迭代的解
Figure FDA0002776529450000056
那么第h+1次迭代的解的公式为:
Figure FDA0002776529450000057
其中,J1为函数f关于x1的雅可比矩阵,J1 T为矩阵J1的转置矩阵,(J1 TJ1)-1表示求矩阵J1 TJ1的逆;为求雅可比矩阵,需求函数f的各个分量关于x1各分量的偏导,具体如下所示:
Figure FDA0002776529450000058
Figure FDA0002776529450000059
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,ML(i,j)为ML的第i行第j列的元素,MA为对RLA向量中的二面角进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,MA(i,j)为MA的第i行第j列的元素,RL(α,β)为MLP网络输出的相对边长分量,
Figure FDA00027765294500000510
为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,
Figure FDA00027765294500000511
为RA(α,β)的第l个分量,BS(α)为待重构的三维人体网格模型的形状,L(α)为BS(α)的LA向量的边长向量,L(l)(α)表示L(α)第l个元素,
Figure FDA00027765294500000512
为函数fS,l(V,α,β)对βi的偏导数,
Figure FDA00027765294500000513
为函数
Figure FDA00027765294500000514
对βi的偏导数,
Figure FDA00027765294500000515
为函数fB,l(V,α,β)对βi的偏导数,
Figure FDA00027765294500000516
为函数
Figure FDA00027765294500000517
对βi的偏导数;考虑到脸部表情和手势的变化小于其它身体姿态部位的变化,将优先重构脸部表情,然后求解身体姿态,最后求解手势;
3.2)固定待重构的三维人体网格模型的姿态参数β,用高斯牛顿梯度下降法求解待重构的三维人体网格模型的形状参数和顶点坐标:
此时,f(x)的未知量为
Figure FDA0002776529450000061
其中x2为此时的自变量形式,V是重构网格的顶点向量,α为三维人体网格模型的形状参数,NV为待重构的三维人体网格模型的顶点个数,NSB为形状基的总个数,
Figure FDA0002776529450000062
为第一个顶点的x坐标,
Figure FDA0002776529450000063
为第一个顶点的y坐标,
Figure FDA0002776529450000064
为第一个顶点的z坐标,
Figure FDA0002776529450000065
为第NV个顶点的x坐标,
Figure FDA0002776529450000066
为第NV个顶点的y坐标,
Figure FDA0002776529450000067
为第NV个顶点的z坐标,α1为三维人体网格模型的第一个形状参数,
Figure FDA0002776529450000068
为三维人体网格模型的第NSB个形状参数;利用高斯牛顿梯度下降法最小化f,假设已找到第h次迭代的解
Figure FDA0002776529450000069
那么第h+1次迭代的解的公式为:
Figure FDA00027765294500000610
其中,J2为函数f关于x2的雅可比矩阵,J2 T为矩阵J2的转置矩阵,(J2 TJ2)-1表示求矩阵J2 TJ2的逆;
同样,J2由函数f的各分量关于x2各个分量的偏导组成,具体偏导如下所示:
Figure FDA00027765294500000611
Figure FDA00027765294500000612
Figure FDA00027765294500000613
其中,ML为对RLA向量中的边长进行自适应稀疏局部化分解得到的具有NMC个局部运动基的矩阵,
Figure FDA0002776529450000071
为ML的第l个的列向量,RL(α,β)为MLP网络输出的相对边长分量,
Figure FDA0002776529450000072
为RL(α,β)的第l个分量,RA(α,β)为MLP网络输出的相对二面角分量,
Figure FDA0002776529450000073
为RA(α,β)的第l个分量,L(α)为待重构的三维人体网格模型的边长向量,L(l)(α)表示L(α)第l个元素,βL为稀疏局部基的相对边长的系数向量,
Figure FDA0002776529450000074
为函数fS,l(V,α,β)对αi的偏导数,
Figure FDA0002776529450000075
为函数L(l)(α)对αi的偏导数,
Figure FDA0002776529450000076
为函数
Figure FDA0002776529450000077
对αi的偏导数,
Figure FDA0002776529450000078
为函数fB,l(V,α,β)对αi的偏导数,
Figure FDA0002776529450000079
为函数
Figure FDA00027765294500000710
对αi的偏导数,
Figure FDA00027765294500000711
为函数fG(V,α)对αi的偏导数;
3.3)重复步骤3.1)和3.2),直至函数收敛或者达到最大迭代次数,输出当前最优的参数解。
CN201910499359.0A 2019-06-11 2019-06-11 一种三维人体姿态、表情及手势的重构方法 Active CN110349268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910499359.0A CN110349268B (zh) 2019-06-11 2019-06-11 一种三维人体姿态、表情及手势的重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910499359.0A CN110349268B (zh) 2019-06-11 2019-06-11 一种三维人体姿态、表情及手势的重构方法

Publications (2)

Publication Number Publication Date
CN110349268A CN110349268A (zh) 2019-10-18
CN110349268B true CN110349268B (zh) 2021-03-30

Family

ID=68181766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910499359.0A Active CN110349268B (zh) 2019-06-11 2019-06-11 一种三维人体姿态、表情及手势的重构方法

Country Status (1)

Country Link
CN (1) CN110349268B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111462306B (zh) * 2020-03-17 2022-04-22 华南理工大学 基于体向量场稀疏局部化分解的三维头发参数化模型方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184861B (zh) * 2015-10-20 2019-02-12 南京大学 一种自动人体三维重建系统
CN106683169B (zh) * 2016-12-09 2019-10-18 华南理工大学 一种关节运动感知的稀疏局部分解及重构算法
CN109408037A (zh) * 2018-09-13 2019-03-01 昆明理工大学 一种非接触的基于“手+脸表情+头部姿态”的混合控制方法
CN109859255B (zh) * 2019-01-31 2023-08-04 天津大学 大动作运动物体的多视角非同时采集与重建方法
CN109840940B (zh) * 2019-02-11 2023-06-27 清华-伯克利深圳学院筹备办公室 动态三维重建方法、装置、设备、介质和系统

Also Published As

Publication number Publication date
CN110349268A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
US11017577B2 (en) Skinned multi-person linear model
Wilhelms et al. Anatomically based modeling
US6476804B1 (en) System and method for generating computer animated graphical images of an exterior patch surface layer of material stretching over an understructure
Merry et al. Animation space: A truly linear framework for character animation
US7515155B2 (en) Statistical dynamic modeling method and apparatus
Schumacher et al. Efficient simulation of example-based materials
Nedel et al. Modeling and deformation of the human body using an anatomically-based approach
Jiang et al. Transferring and fitting fixed-sized garments onto bodies of various dimensions and postures
Chen et al. Lattice-based skinning and deformation for real-time skeleton-driven animation
Nedel et al. Anatomic modeling of deformable human bodies
CN110363833B (zh) 一种基于局部稀疏表示的完全人体运动参数化表示方法
CN110349268B (zh) 一种三维人体姿态、表情及手势的重构方法
Yan et al. Skeleton-based shape deformation using simplex transformations
KR20110070736A (ko) 근육 및 외형 곡면 기반 개체 표준 메쉬 모델의 파라메트릭 제어를 통한 자동 리깅 및 형상 전이 방법
CN105321205B (zh) 一种基于稀疏关键点的参数化人体模型重建方法
Chen et al. Skeleton-driven surface deformation through lattices for real-time character animation
US6483506B1 (en) System and method for generating computer animated graphical images of a vascular structure attached to an anatomical structure
Tejera et al. Learning part-based models for animation from surface motion capture
Li et al. Anatomical human musculature modeling for real-time deformation
Chen et al. A data-driven approach to efficient character articulation
Magnenat-Thalmann et al. Automatic modeling of animatable virtual humans-a survey
Aubel et al. MuscleBuilder: a modeling tool for human anatomy
Schneider et al. Hybrid anatomically based modelling of animals
Huang et al. Interactive mesh deformation with pseudo material effects
de Aguiar et al. Representing and manipulating mesh-based character animations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant