CN106157372A - 一种基于视频图像的3d人脸网格重构方法 - Google Patents

一种基于视频图像的3d人脸网格重构方法 Download PDF

Info

Publication number
CN106157372A
CN106157372A CN201610589294.5A CN201610589294A CN106157372A CN 106157372 A CN106157372 A CN 106157372A CN 201610589294 A CN201610589294 A CN 201610589294A CN 106157372 A CN106157372 A CN 106157372A
Authority
CN
China
Prior art keywords
face
rigid
mark
model
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610589294.5A
Other languages
English (en)
Other versions
CN106157372B (zh
Inventor
夏春秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Vision Technology Co Ltd
Original Assignee
Shenzhen Vision Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Vision Technology Co Ltd filed Critical Shenzhen Vision Technology Co Ltd
Priority to CN201610589294.5A priority Critical patent/CN106157372B/zh
Publication of CN106157372A publication Critical patent/CN106157372A/zh
Application granted granted Critical
Publication of CN106157372B publication Critical patent/CN106157372B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/30Polynomial surface description
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/04Indexing scheme for image data processing or generation, in general involving 3D image data

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明中提出的一种基于视频图像的3D人脸网格重构方法,其主要内容包括:视频中2维人脸图像输入;建立线性形状模型;通过级联回归估算人脸标志点;通过3D模型进行匹配;对人脸进行3D重建。建立线性形状模型,估计标志点的位置和清晰度,通过匹配局部3D模型重建脸部形状,采用3D级联回归,动作变化中面中标志保持一致,通过选择致密的3D点集,脸部被完全标记,避免标志的位置发生变化,解决了动作变化定位点不一致和自封闭的问题;此外,采用3D标志进行2D投影,使计算花费大大减小。3D网格不含背景,通用性强,而且实时效果好。

Description

一种基于视频图像的3D人脸网格重构方法
技术领域
本发明涉及图像处理,尤其是指利用图像数据分析对采集到的视频图像进行3D人脸网格重构。
背景技术
基于视频图像的3D人脸网格重构方法,可以用于罪犯监控,在不需要罪犯指纹或者身份信息的情况下进行人脸重构,还可以用于三维打印,另外还可以用于三维人脸建模。动画制作等领域中,对各领域的影响重大。人脸识别的方法可以分为两类,2D识别方法和3D识别方法。2D识别方法定位形状和外观的定位点很少,3D方法有较强的可区分性和鲁棒性,但是匹配高分辨3D模型,计算花费大,需要人工初始化。
近些年2D识别方法和3D识别方法被广泛使用,Blanz和Vetter建立了3D形变模型减小视频图片和合成结果之前的强度差异,M.Dimitrijevic曾建立了3D形变模型降低识别的光照敏感度,而2D方法随着形状回归方法的使用使得该方法变得成熟,已经有许多研究使用2级联回归建立脸部形状。但是使用级联回归应用在3D方法中却一直被忽略。本发明将级联回归应用于3D方法中,将2D方法和3D方法结合使用,建立线性形状模型,估计特征点的位置和清晰度,通过匹配局部3D模型重建脸部形状,采用3D级联回归,动作变化中面中标志保持一致,通过选择致密的3D点集,脸部被完全标记,避免标志的位置发生变化,解决了动作变化定位点不一致和自封闭的问题;此外,采用3D标志进行2D投影,使计算花费大大减小。3D网格不含背景,通用性强,而且实时效果好,
发明内容
为解决上述问题,本发明提供一种基于视频图像的3D人脸网格重构方法,其主要内容包括:
(一)视频中2维人脸图像输入;
(二)建立线性形状模型;
(三)通过级联回归估算人脸特征点;
(四)通过3D模型进行匹配;
(五)对人脸进行3D重建。
其中,所述对于视频中2维人脸图像输入(一)包括对各类视频图像中人脸图像的输入;
其中,所述建立一个密集的线性形状模型(二)包括由一个三维网格和三维顶点(特征点)组成;
进一步地,所述三维网格和三维顶点,把3D形状看成3D顶点坐标形成的网格结构,3D点分布模型描述形状的线性变化:
x=[x1;y1;z1;…;xM;yM;zM]
xi(p,q)代表ith标志的位置,p=(s,α,β,γ,t)代表了模型的刚性参数,包括球形比例s,3维旋转角度R=R1(α)R2(β)R3(γ)和变化率t;非刚性参数用q表示,代表ith标志的平均位置,d部分的3M立体基向量用表示;向量q代表了在3M×d三维线性子空间的人脸的变形。
进一步地,3D脸部变形可以分为两个独立的子集:刚性(面部的形状)和非刚性(面部表情)部分。
其中,所述通过级联回归估算人脸特征点(三),主要步骤为:
1)在训练阶段,在图中确定b的位置区域,我们将他定义为y*,我们对训练图像进行了人脸检测,提供了标志的初始配置(y0)在这个框架中,使下列函数中的Δy最小化获得脸部定位
2)给定图像的其中一个像素点d∈Ra+1,d(y)∈Rb+1,其中指标b定位在图像中,令h作为特征提取函数,提取长度F的特征,则h(d(y))∈RFb+1
f ( y 0 + y ) = | | h ( d ( y 0 + Δ y ) ) - β * | | 2 2
其中β*=h(d(y*))代表图像标记的特征值
3)使特征提取函数(h)高度非线性,我们使用一系列线性回归矩阵(Mi),这样,在训练数据中产生一系列从y0到y*的更新
Δyi=Ri-1βi-1+bi-1
yi=yi-1+Δyi→y*
4)在这里,y由3D标志的二维投影的位置和相应的视觉信息组成,
y=[x1;y1;v1;...;xM;yM;yM]
其中,vi∈[0,1]表明3D标志是否可见,可见(vi=1),不可见(vi=0)。
进一步地,自动人脸定位需要大量的图像的训练实例,每个图片计算相应的旋转3D标志和2D投影标志,3D网格不含背景,在最后的2D图像中可以任意选择没有人脸的图像来提高多样性,这样产生被标注的图像用来训练密集级联回归,最后训练集中使用超过300000个网格。
其中,所述通过3D模型进行匹配(四)主要步骤为:
1)迭代算法细化对应关系
之前的级联回归提供了3D标志的二维投影的位置,从二维形状重建三维形状,需要使重构误差最小化
arg min p , r , s Σ i = 1 M | | Px i ( p , r , s ) - z i | | 2 2
这里的P代表了矩阵在二维的投影,z是目标的二维形状,迭代方法在2D标志上注册3D模型,细化了3D形状和3D动作的结合,建立了刚性(p={s,α,β,γ,t})和非刚性(r和s)的转换
2)通过矩阵进行矫正
假定在2D和3D标志之间有语义对应,采用矩阵的形式来选择正确的3D对应2D的标志,这里的语义对应在建模阶段已经建立,3D标志的二维投影标志通过级联回归获得
3)约束可见标志
此通过约束可见标志的过程,级联回归评估了标志的清晰度
arg min p , r , s Σ i ∈ ξ | | Px i ( p , r , s ) - z i | | 2 2
ξ={j|vj=1}表明标志指标的子集是可见的
4)二维测量
进入时间同步的二维测量(z(1),...,z(C)),所有的C测量代表相同的三维人脸,但是从不同的角度,通过对所有测量的重建的限制,将上式进行扩展:
arg min p ( 1 ) , ... , p ( C ) , Σ k = 1 C Σ i ∈ ξ ( k ) | | Px i ( p ( k ) , r , s ) - z i ( k ) | | 2 2
上标(k)代表kth次测量,能见度设置为ξ(k),因为我们观察的是相同的人脸但是是从不同角度,整体刚性(r)和部分非刚性(s)的测量方法都相同
5)确定刚性、非刚性参数
假定人脸的刚性结构变化很小(参数r),只有表情会有变化(参数s),为了解决这种情况,在时间域中进行解决,第一步,我们计算刚性变型参数:
arg min r τ Σ t ∈ τ Σ i ∈ ξ ( t ) | | Px i ( p ( t ) , r τ , 0 ) - z i ( t ) | | 2 2
T={z(t)|t=1,...,T}代表时间测量的设置,rт代表从т计算出的刚性变型参数,这一步里的非刚性参数设置为0
第二步,在任意时间帧计算刚性变型参数t∈[1,...,T],
arg min p ( t ) , s ( t ) Σ i ∈ ξ ( t ) | | Px i ( p ( t ) , r τ , s ( t ) ) - z i ( t ) | | 2 2 .
进一步地,顶点数量的增加对重建错误率的降低效果微弱,而且顶点数量增加影响回归模型和匹配速度,顶点数量取较低值;迭代算法次数的增加对对重建错误率的降低效果显著,对模型尺寸的影响不大,所以迭代算法次数取较大值。
进一步地,使用单目照相机图像时,对应公式有多个解,避免产生3D幻觉,在这里同时使用多个图像帧。
其中,所述对人脸进行3D重建(五)在一个参数向量中
q:p(q)∝N(q;0,Λ)
参数的优先原则遵循一个平均值为0、方差为Λ的正态分布,使用主成份分析法确定3维基向量的d部分,则:
我们分别对刚性和非刚性这两部分进行建模,
x i = ( p , r , s ) = s R ( x ‾ i + θ i r + ψ i s ) + t ( i = 1 , ... , M )
其中3维基向量的d部分(θ=[θ1;...;θM]∈R3M×d)描述刚性变形,3维基向量的e部分(ψ=[ψ1;...;ψM]∈R3M×d)描述了非刚性变形
进一步地,建立刚性部分,我们从每个视频中选择中间帧,应用主成份分析法确定基向量(θ)和平均值提供了一个整体的线性子空间,描述了人脸形状的变化
进一步地,建立描述非刚性变形(ψ)的线性子空间目标是建立一个模型,由自主训练并共享软边界的PCA模型集合组成,建立基于部分的模型,使顶点高度相关,形成密集的区域,由于这些区域将更好通过PCA压缩,为了找到面部表情数据驱动分割,使用了数据集中选出的6000帧,数据集D∈R6000×3072由6000帧和1024三维顶点组成;把D分为三个子集Dx,Dy,Dz∈R6000×1024每个包含顶点对应的空间坐标,描述顶点之间的相关测量,通过Dx,Dy,Dz计算相关矩阵归一化,然后平均成一个相关矩阵C;相同区域的顶点也应该在人脸表面互相接近,因此,我们利用计算了模型顶点间距离形成距离矩阵G归一化到[0,1]范围,这两个矩阵整合成一个矩阵。
附图说明
图1是本发明一种基于视频图像的3D人脸网格重构方法的系统流程图。
图2是本发明一种基于视频图像的3D人脸网格重构方法的级联回归估算人脸特征点流程图。
图3是本发明一种基于视频图像的3D人脸网格重构方法的通过3D模型进行匹配流程图。
图4是本发明一种基于视频图像的3D人脸网格重构方法的迭代次数和定点数量对重建错误率的关系曲线图。
图5是本发明一种基于视频图像的3D人脸网格重构方法的对人脸进行3D重建流程图。
图6是本发明一种基于视频图像的3D人脸网格重构方法的人脸重构图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。
图1是本发明一种基于视频图像的3D人脸网格重构方法和装置的系统流程图。如图1所示,本发明提供一种基于视频图像的3D人脸网格重构方法,其主要内容包括:
(一)视频中2维人脸图像输入;
(二)建立线性形状模型;
(三)通过级联回归估算人脸特征点;
(四)通过3D模型进行匹配;
(五)对人脸进行3D重建。
视频中2维人脸图像输入包括对各类视频图像中人脸图像的输入;
建立一个密集的线性形状模型(二)包括由一个三维网格和三维顶点(特征点)组成,把3D形状看成3D顶点坐标形成的网格结构,3D点分布模型描述形状的线性变化:
x=[x1;y1;z1;...;xM;yM;zM]
xi(p,q)代表ith标志的位置,p=(s,α,β,γ,t)代表了模型的刚性参数,包括球形比例s,3维旋转角度R=R1(α)R2(β)R3(γ)和变化率t;非刚性参数用q表示,代表ith标志的平均位置,d部分的3M立体基向量用表示;向量q代表了在3M×d三维线性子空间的人脸的变形。3D脸部变形可以分为两个独立的子集:刚性(面部的形状)和非刚性(面部表情)部分。
图2是本发明一种基于视频图像的3D人脸网格重构方法的级联回归估算人脸特征点流程图,主要步骤为:
1)在训练阶段,在图中确定b的位置区域,我们将他定义为y*,我们对训练图像进行了人脸检测,提供了标志的初始配置(y0)在这个框架中,使下列函数中的Δy最小化获得脸部定位
2)给定图像的其中一个像素点d∈Ra+1,d(y)∈Rb+1,其中指标b定位在图像中,令h作为特征提取函数,提取长度F的特征,则h(d(y))∈RFb+1
f ( y 0 + y ) = | | h ( d ( y 0 + Δ y ) ) - β * | | 2 2
其中β*=h(d(y*))代表图像标记的特征值
3)使特征提取函数(h)高度非线性,我们使用一系列线性回归矩阵(Mi),这样,在训练数据中产生一系列从y0到y*的更新
Δyi=Ri-1βi-1+bi-1
yi=yi-1+Δyi→y*
4)在这里,y由3D标志的二维投影的位置和相应的视觉信息组成,
y=[x1;y1;v1;...;xM;yM;yM]
其中,vi∈[0,1]表明3D标志是否可见,可见(vi=1),不可见(vi=0)。
自动人脸定位需要大量的图像的训练实例,每个图片计算相应的旋转3D标志和2D投影标志,3D网格不含背景,在最后的2D图像中可以任意选择没有人脸的图像来提高多样性,这样产生被标注的图像用来训练密集级联回归,最后训练集中使用超过300000个网格。
图3是本发明一种基于视频图像的3D人脸网格重构方法的通过3D模型进行匹配流程图,主要步骤为:
1)迭代算法细化对应关系
之前的级联回归提供了3D标志的二维投影的位置,从二维形状重建三维形状,需要使重构误差最小化
arg min p , r , s Σ i = 1 M | | Px i ( p , r , s ) - z i | | 2 2
这里的P代表了矩阵在二维的投影,z是目标的二维形状,迭代方法在2D标志上注册3D模型,细化了3D形状和3D动作的结合,建立了刚性(p={s,α,β,γ,t})和非刚性(r和s)的转换
2)通过矩阵进行矫正
假定在2D和3D标志之间有语义对应,采用矩阵的形式来选择正确的3D对应2D的标志,这里的语义对应在建模阶段已经建立,3D标志的二维投影标志通过级联回归获得
3)约束可见标志
此通过约束可见标志的过程,级联回归评估了标志的清晰度
arg min p , r , s Σ i ∈ ξ | | Px i ( p , r , s ) - z i | | 2 2
ξ={j|vj=1}表明标志指标的子集是可见的
4)二维测量
进入时间同步的二维测量(z(1),...,z(C)),所有的C测量代表相同的三维人脸,但是从不同的角度,通过对所有测量的重建的限制,将上式进行扩展:
arg min p ( 1 ) , ... , p ( C ) , Σ k = 1 C Σ i ∈ ξ ( k ) | | Px i ( p ( k ) , r , s ) - z i ( k ) | | 2 2
上标(k)代表kth次测量,能见度设置为ξ(k),因为我们观察的是相同的人脸但是是从不同角度,整体刚性(r)和部分非刚性(s)的测量方法都相同
5)确定刚性、非刚性参数
假定人脸的刚性结构变化很小(参数r),只有表情会有变化(参数s),为了解决这种情况,在时间域中进行解决,第一步,我们计算刚性变型参数:
arg min r τ Σ t ∈ τ Σ i ∈ ξ ( t ) | | Px i ( p ( t ) , r τ , 0 ) - z i ( t ) | | 2 2
T={z(t)|t=1,...,T}代表时间测量的设置,rт代表从т计算出的刚性变型参数,这一步里的非刚性参数设置为0
第二步,在任意时间帧计算刚性变型参数t∈[1,...,T],
arg min p ( t ) , s ( t ) Σ i ∈ ξ ( t ) | | Px i ( p ( t ) , r τ , s ( t ) ) - z i ( t ) | | 2 2 .
图4是本发明一种基于视频图像的3D人脸网格重构方法的迭代次数和定点数量对重建错误率的关系曲线图。可以看出,顶点数量的增加对重建错误率的降低效果微弱,而且顶点数量增加影响回归模型和匹配速度,顶点数量取较低值;迭代算法次数的增加对对重建错误率的降低效果显著,对模型尺寸的影响不大,所以迭代算法次数取较大值。使用单目照相机图像时,对应公式有多个解,避免产生3D幻觉,在这里同时使用多个图像帧。
图5是本发明一种基于视频图像的3D人脸网格重构方法的对人脸进行3D重建流程图。
q:p(q)∝N(q;0,Λ)
参数的优先原则遵循一个平均值为0、方差为Λ的正态分布,使用主成份分析法确定3维基向量的d部分,则:
我们分别对刚性和非刚性这两部分进行建模,
x i = ( p , r , s ) = s R ( x ‾ i + θ i r + ψ i s ) + t ( i = 1 , ... , M )
其中3维基向量的d部分(θ=[θ1;...;θM]∈R3M×d)描述刚性变形,3维基向量的e部分(ψ=[ψ1;...;ψM]∈R3M×d)描述了非刚性变形
进一步地,建立刚性部分,我们从每个视频中选择中间帧,应用主成份分析法确定基向量(θ)和平均值提供了一个整体的线性子空间,描述了人脸形状的变化
进一步地,建立描述非刚性变形(ψ)的线性子空间目标是建立一个模型,由自主训练并共享软边界的PCA模型集合组成,建立基于部分的模型,使顶点高度相关,形成密集的区域,由于这些区域将更好通过PCA压缩,为了找到面部表情数据驱动分割,使用了数据集中选出的6000帧,数据集D∈R6000×3072由6000帧和1024三维顶点组成;把D分为三个子集Dx,Dy,Dz∈R6000×1024每个包含顶点对应的空间坐标,描述顶点之间的相关测量,通过Dx,Dy,Dz计算相关矩阵归一化,然后平均成一个相关矩阵C;相同区域的顶点也应该在人脸表面互相接近,因此,我们利用计算了模型顶点间距离形成距离矩阵G归一化到[0,1]范围,这两个矩阵整合成一个矩阵。
图6是本发明一种基于视频图像的3D人脸网格重构方法的人脸重构图。可以看出,采用多帧视频图像,获得3D网格顶点,3D点集将脸部完全覆盖,动作变化定位点保持一致,并且成功完成人脸重建。
对于本领域技术人员,本发明不限制于上述实施例的细节,在不背离本发明的精神和范围的情况下,能够以其他具体形式实现本发明。此外,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围,这些改进和变型也应视为本发明的保护范围。因此,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

Claims (10)

1.一种基于视频图像的3D人脸网格重构方法,其特征在于,主要内容包括:
(一)视频中2维人脸图像输入;
(二)建立线性形状模型;
(三)通过级联回归估算人脸特征点;
(四)通过3D模型进行匹配;
(五)对人脸进行3D重建。
2.基于权利要求书1所述的视频中2维人脸图像输入(一),其特征在于,包括对视频图像中人脸图像的输入。
3.基于权利要求书1所述的建立一个密集的线性形状模型(二),其特征在于,由一个三维网格和三维顶点(特征点)组成,把3D形状看成3D顶点坐标形成的网格结构,3D点分布模型描述形状的线性变化:
x=[x1;y1;z1;…;xM;yM;zM]
xi(p,q)代表ith标志的位置,p=(s,α,β,γ,t)代表了模型的刚性参数,包括球形比例s,3维旋转角度R=R1(α)R2(β)R3(γ)和变化率t;非刚性参数用q表示,代表ith标志的平均位置,d部分的3M立体基向量用表示;向量q代表了在3M×d三维线性子空间的人脸的变形。
4.基于权利要求书3所述的3D脸部的变形,其特征在于,脸部变形可以分为两个独立的子集:刚性(面部的形状)和非刚性(面部表情)部分。
5.基于权利要求书1所述的通过级联回归估算人脸特征点(三),其特征在于,主要步骤为:
1)在训练阶段,在图中确定b的位置区域,我们将他定义为y*,我们对训练图像进行了人脸检测,提供了标志的初始配置(y0)在这个框架中,使下列函数中的Δy最小化获得脸部定位
2)给定图像的其中一个像素点d∈Ra+1,d(y)∈Rb+1,其中指标b定位在图像中,令h作为特征提取函数,提取长度F的特征,则h(d(y))∈RFb+1
f ( y 0 + y ) = | | h ( d ( y 0 + Δ y ) ) - β * | | 2 2
其中β*=h(d(y*))代表图像标记的特征值
3)使特征提取函数(h)高度非线性,我们使用一系列线性回归矩阵(Mi),这样,在训练数据中产生一系列从y0到y*的更新
Δyi=Ri-1βi-1+bi-1
yi=yi-1+Δyi→y*
4)在这里,y由3D标志的二维投影的位置和相应的视觉信息组成,
y=[x1;y1;v1;…;xM;yM;yM]
其中,vi∈[0,1]表明3D标志是否可见,可见(vi=1),不可见(vi=0)。
6.基于权利要求书1所述的通过3D模型进行匹配(四),其特征在于,主要步骤为:
1)迭代算法细化对应关系
之前的级联回归提供了3D标志的二维投影的位置,从二维形状重建三维形状,需要使重构误差最小化
arg m i n p , r , s Σ i = 1 M | | Px i ( p , r , s ) - z i | | 2 2
这里的P代表了矩阵在二维的投影,z是目标的二维形状,迭代方法在2D标志上注册3D模型,细化了3D形状和3D动作的结合,建立了刚性(p={s,α,β,γ,t})和非刚性(r和s)的转换
2)通过矩阵进行矫正
假定在2D和3D标志之间有语义对应,采用矩阵的形式来选择正确的3D对应2D的标志,这里的语义对应在建模阶段已经建立,3D标志的二维投影标志通过级联回归获得
3)约束可见标志
此通过约束可见标志的过程,级联回归评估了标志的清晰度
arg m i n p , r , s Σ i ∈ ξ | | Px i ( p , r , s ) - z i | | 2 2
ξ={j|vj=1}表明标志指标的子集是可见的
4)二维测量
进入时间同步的二维测量(z(1),...,z(C)),所有的C测量代表相同的三维人脸,但是从不同的角度,通过对所有测量的重建的限制,将上式进行扩展:
arg m i n p ( 1 ) , ... , p ( C ) , Σ k = 1 C Σ i ∈ ξ ( k ) | | Px i ( p ( k ) , r , s ) - z i ( k ) | | 2 2
上标(k)代表kth次测量,能见度设置为ξ(k),因为我们观察的是相同的人脸但是是从不同角度,整体刚性(r)和部分非刚性(s)的测量方法都相同
5)确定刚性、非刚性参数
假定人脸的刚性结构变化很小(参数r),只有表情会有变化(参数s),为了解决这种情况,在时间域中进行解决,第一步,我们计算刚性变型参数:
arg m i n r T Σ t ∈ T Σ i ∈ ξ ( t ) | | Px i ( p ( t ) , r T , 0 ) - z i ( t ) | | 2 2
т={z(t)|t=1,…,T}代表时间测量的设置,rт代表从т计算出的刚性变型参数,这一步里的非刚性参数设置为0
第二步,在任意时间帧计算刚性变型参数t∈[1,…,T],
arg m i n p ( t ) , s ( t ) Σ i ∈ ξ ( t ) | | Px i ( p ( t ) , r T , S ( t ) ) - z i ( t ) | | 2 2 .
7.基于权利要求书1所述的对人脸进行3D重建(五),其特征在于,在一个参数向量中
q:p(q)∝N(q;0,∧)
参数的优先原则遵循一个平均值为0、方差为Λ的正态分布,使用主成份分析法确定3维基向量的d部分,则:
我们分别对刚性和非刚性这两部分进行建模,
x i = ( p , r , s ) = s R ( x ‾ i + θ i r + ψ i s ) + t ( i = 1 , ... , M )
其中3维基向量的d部分(θ=[θ1;...;θM]∈R3M×d)描述刚性变形,3维基向量的e部分(ψ=[ψ1;...;ψM]∈R3M×d)描述了非刚性变形
建立刚性部分,我们从每个视频中选择中间帧,应用主成份分析法确定基向量(θ)和平均值提供了一个整体的线性子空间,描述了人脸形状的变化
建立描述非刚性变形(ψ)的线性子空间目标是建立一个模型,由自主训练并共享软边界的PCA模型集合组成,建立基于部分的模型,使顶点高度相关,形成密集的区域,由于这些区域将更好通过PCA压缩,为了找到面部表情数据驱动分割,使用了数据集中选出的6000帧,数据集D∈R6000×3072由6000帧和1024三维顶点组成;把D分为三个子集Dx,Dy,Dz∈R6000×1024每个包含顶点对应的空间坐标,描述顶点之间的相关测量,通过Dx,Dy,Dz计算相关矩阵归一化,然后平均成一个相关矩阵C;相同区域的顶点也应该在人脸表面互相接近,因此,我们利用计算了模型顶点间距离形成距离矩阵G归一化到[0,1]范围,这两个矩阵整合成一个矩阵。
8.基于权利要求书4所述的图像训练,其特征在于,自动人脸定位需要大量的图像的训练实例,每个图片计算相应的旋转3D标志和2D投影标志,3D网格不含背景,在最后的2D图像中可以任意选择没有人脸的图像来提高多样性,这样产生被标注的图像用来训练密集级联回归,最后训练集中使用超过300000个网格。
9.基于权利要求书4所述的迭代算法和顶点数量,其特征在于,顶点数量的增加对重建错误率的降低效果微弱,而且顶点数量增加影响回归模型和匹配速度,顶点数量取较低值;迭代算法次数的增加对对重建错误率的降低效果显著,对模型尺寸的影响不大,所以迭代算法次数取较大值。
10.基于权利要求书6所述的2D到3D的对应关系,其特征在于,使用单目照相机图像时,对应公式有多个解,在这里同时使用多个图像帧。
CN201610589294.5A 2016-07-25 2016-07-25 一种基于视频图像的3d人脸网格重构方法 Active CN106157372B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610589294.5A CN106157372B (zh) 2016-07-25 2016-07-25 一种基于视频图像的3d人脸网格重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610589294.5A CN106157372B (zh) 2016-07-25 2016-07-25 一种基于视频图像的3d人脸网格重构方法

Publications (2)

Publication Number Publication Date
CN106157372A true CN106157372A (zh) 2016-11-23
CN106157372B CN106157372B (zh) 2019-01-25

Family

ID=58060755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610589294.5A Active CN106157372B (zh) 2016-07-25 2016-07-25 一种基于视频图像的3d人脸网格重构方法

Country Status (1)

Country Link
CN (1) CN106157372B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106683169A (zh) * 2016-12-09 2017-05-17 华南理工大学 一种关节运动感知的稀疏局部分解及重构算法
CN106846278A (zh) * 2017-02-17 2017-06-13 深圳市唯特视科技有限公司 一种基于深度卷积神经网络的图像像素标记方法
CN107103646A (zh) * 2017-04-24 2017-08-29 厦门幻世网络科技有限公司 一种表情合成方法及装置
CN108171792A (zh) * 2018-01-15 2018-06-15 深圳市云之梦科技有限公司 一种基于语义参数的人体三维模型恢复技术的方法及系统
CN108197593A (zh) * 2018-01-23 2018-06-22 深圳极视角科技有限公司 基于三点定位方法的多尺寸人脸表情识别方法及装置
CN108510583A (zh) * 2018-04-03 2018-09-07 北京华捷艾米科技有限公司 人脸图像的生成方法和人脸图像的生成装置
CN109285216A (zh) * 2018-08-24 2019-01-29 太平洋未来科技(深圳)有限公司 基于遮挡图像生成三维人脸图像方法、装置及电子设备
CN109541730A (zh) * 2018-11-23 2019-03-29 长三角环境气象预报预警中心(上海市环境气象中心) 一种大气污染物浓度预测的方法及设备
CN109631799A (zh) * 2019-01-09 2019-04-16 王红军 一种智能化的测量与标记方法
CN109712223A (zh) * 2017-10-26 2019-05-03 北京大学 一种基于纹理合成的三维模型自动上色方法
CN110008873A (zh) * 2019-04-25 2019-07-12 北京华捷艾米科技有限公司 面部表情捕捉方法、系统及设备
CN110135215A (zh) * 2018-02-02 2019-08-16 上海大学 一种基于Avatar表情移植的虚拟社交方法
CN110276124A (zh) * 2019-06-19 2019-09-24 国网上海市电力公司 一种数字化审查数字模型的信息提取方法
CN111382618A (zh) * 2018-12-28 2020-07-07 广州市百果园信息技术有限公司 一种人脸图像的光照检测方法、装置、设备和存储介质
CN111680577A (zh) * 2020-05-20 2020-09-18 北京的卢深视科技有限公司 人脸检测方法和装置
CN111783820A (zh) * 2020-05-08 2020-10-16 北京沃东天骏信息技术有限公司 图像标注方法和装置
CN112489216A (zh) * 2020-11-27 2021-03-12 北京百度网讯科技有限公司 面部重建模型的评测方法、装置、设备及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100214288A1 (en) * 2009-02-25 2010-08-26 Jing Xiao Combining Subcomponent Models for Object Image Modeling
CN103824050A (zh) * 2014-02-17 2014-05-28 北京旷视科技有限公司 一种基于级联回归的人脸关键点定位方法
CN105608710A (zh) * 2015-12-14 2016-05-25 四川长虹电器股份有限公司 一种非刚性人脸检测和追踪定位方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100214288A1 (en) * 2009-02-25 2010-08-26 Jing Xiao Combining Subcomponent Models for Object Image Modeling
CN103824050A (zh) * 2014-02-17 2014-05-28 北京旷视科技有限公司 一种基于级联回归的人脸关键点定位方法
CN105608710A (zh) * 2015-12-14 2016-05-25 四川长虹电器股份有限公司 一种非刚性人脸检测和追踪定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡永利等: "《基于形变模型的三维人脸重建方法及其改进》", 《计算机学报》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106683169A (zh) * 2016-12-09 2017-05-17 华南理工大学 一种关节运动感知的稀疏局部分解及重构算法
CN106683169B (zh) * 2016-12-09 2019-10-18 华南理工大学 一种关节运动感知的稀疏局部分解及重构算法
CN106846278A (zh) * 2017-02-17 2017-06-13 深圳市唯特视科技有限公司 一种基于深度卷积神经网络的图像像素标记方法
CN107103646A (zh) * 2017-04-24 2017-08-29 厦门幻世网络科技有限公司 一种表情合成方法及装置
CN107103646B (zh) * 2017-04-24 2020-10-23 厦门黑镜科技有限公司 一种表情合成方法及装置
CN109712223B (zh) * 2017-10-26 2020-11-03 北京大学 一种基于纹理合成的三维模型自动上色方法
CN109712223A (zh) * 2017-10-26 2019-05-03 北京大学 一种基于纹理合成的三维模型自动上色方法
CN108171792A (zh) * 2018-01-15 2018-06-15 深圳市云之梦科技有限公司 一种基于语义参数的人体三维模型恢复技术的方法及系统
CN108197593A (zh) * 2018-01-23 2018-06-22 深圳极视角科技有限公司 基于三点定位方法的多尺寸人脸表情识别方法及装置
CN110135215B (zh) * 2018-02-02 2021-11-05 上海大学 一种基于Avatar表情移植的虚拟社交方法
CN110135215A (zh) * 2018-02-02 2019-08-16 上海大学 一种基于Avatar表情移植的虚拟社交方法
CN108510583A (zh) * 2018-04-03 2018-09-07 北京华捷艾米科技有限公司 人脸图像的生成方法和人脸图像的生成装置
CN108510583B (zh) * 2018-04-03 2019-10-11 北京华捷艾米科技有限公司 人脸图像的生成方法和人脸图像的生成装置
CN109285216B (zh) * 2018-08-24 2023-06-09 太平洋未来科技(深圳)有限公司 基于遮挡图像生成三维人脸图像方法、装置及电子设备
CN109285216A (zh) * 2018-08-24 2019-01-29 太平洋未来科技(深圳)有限公司 基于遮挡图像生成三维人脸图像方法、装置及电子设备
CN109541730A (zh) * 2018-11-23 2019-03-29 长三角环境气象预报预警中心(上海市环境气象中心) 一种大气污染物浓度预测的方法及设备
CN111382618A (zh) * 2018-12-28 2020-07-07 广州市百果园信息技术有限公司 一种人脸图像的光照检测方法、装置、设备和存储介质
CN111382618B (zh) * 2018-12-28 2021-02-05 广州市百果园信息技术有限公司 一种人脸图像的光照检测方法、装置、设备和存储介质
US11908236B2 (en) 2018-12-28 2024-02-20 Bigo Technology Pte. Ltd. Illumination detection method and apparatus for face image, and device and storage medium
CN109631799A (zh) * 2019-01-09 2019-04-16 王红军 一种智能化的测量与标记方法
CN110008873B (zh) * 2019-04-25 2021-06-22 北京华捷艾米科技有限公司 面部表情捕捉方法、系统及设备
CN110008873A (zh) * 2019-04-25 2019-07-12 北京华捷艾米科技有限公司 面部表情捕捉方法、系统及设备
CN110276124A (zh) * 2019-06-19 2019-09-24 国网上海市电力公司 一种数字化审查数字模型的信息提取方法
CN111783820A (zh) * 2020-05-08 2020-10-16 北京沃东天骏信息技术有限公司 图像标注方法和装置
CN111783820B (zh) * 2020-05-08 2024-04-16 北京沃东天骏信息技术有限公司 图像标注方法和装置
CN111680577A (zh) * 2020-05-20 2020-09-18 北京的卢深视科技有限公司 人脸检测方法和装置
CN112489216A (zh) * 2020-11-27 2021-03-12 北京百度网讯科技有限公司 面部重建模型的评测方法、装置、设备及可读存储介质
CN112489216B (zh) * 2020-11-27 2023-07-28 北京百度网讯科技有限公司 面部重建模型的评测方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN106157372B (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
CN106157372A (zh) 一种基于视频图像的3d人脸网格重构方法
US10679046B1 (en) Machine learning systems and methods of estimating body shape from images
US11501508B2 (en) Parameterized model of 2D articulated human shape
CN104715493B (zh) 一种运动人体姿态估计的方法
JP6918198B2 (ja) 姿勢変動に頑健な顔位置調整のためのシステム及び方法
US10002460B2 (en) Method and apparatus for estimating body shape
O'Toole et al. 3D shape and 2D surface textures of human faces: The role of “averages” in attractiveness and age
Ye et al. Accurate 3d pose estimation from a single depth image
US9942535B2 (en) Method for 3D scene structure modeling and camera registration from single image
Liu et al. Markerless motion capture of multiple characters using multiview image segmentation
US8023726B2 (en) Method and system for markerless motion capture using multiple cameras
CN106469465A (zh) 一种基于灰度和深度信息的三维人脸重建方法
US20150262405A1 (en) Co-registration - simultaneous alignment and modeling of articulated 3d shapes
Jaimez et al. Motion cooperation: Smooth piece-wise rigid scene flow from rgb-d images
CN103733226A (zh) 快速的有关节运动的跟踪
Michel et al. Tracking the articulated motion of the human body with two RGBD cameras
Ugrinovic et al. Body size and depth disambiguation in multi-person reconstruction from single images
Krahnstöver et al. Automatic acquisition and initialization of articulated models
Pham et al. Robust real-time performance-driven 3D face tracking
Chen et al. Learning shape priors for single view reconstruction
Zhang et al. Articulated deformable structure approach to human motion segmentation and shape recovery from an image sequence
Fang et al. A modeling method for the human body model with facial morphology
Sengupta et al. Probabilistic estimation of 3D human shape and pose with a semantic local parametric model
Chang et al. Seeing through the appearance: Body shape estimation using multi-view clothing images
Rotger et al. 2D-to-3D facial expression transfer

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant