CN110020600B - 生成用于训练人脸对齐模型的数据集的方法 - Google Patents
生成用于训练人脸对齐模型的数据集的方法 Download PDFInfo
- Publication number
- CN110020600B CN110020600B CN201910165661.2A CN201910165661A CN110020600B CN 110020600 B CN110020600 B CN 110020600B CN 201910165661 A CN201910165661 A CN 201910165661A CN 110020600 B CN110020600 B CN 110020600B
- Authority
- CN
- China
- Prior art keywords
- face
- dimensional
- image
- model
- mapping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种生成用于训练人脸对齐模型的数据集的方法,适于在计算设备中执行。该方法包括:将人脸图像及其对应的第一特征点输入训练好的三维人脸重建模型中,以输出对应的三维人脸形状;将第一特征点映射到对应的三维人脸形状中并将三维人脸形状进行旋转,得到三维特征点坐标;以及将三维特征点坐标映射到二维人脸图像中,以得到包含第二特征点的人脸图像作为生成的数据集。该方案能够较好地解决极端姿态下人脸对齐的问题。
Description
技术领域
本发明涉及人脸对齐技术领域,尤其涉及一种生成用于训练人脸对齐模型的数据集的方法、人脸对齐方法、计算设备及存储介质。
背景技术
现有的人脸特征点检测方法主要是基于二维人脸形状建模的,然而存在以下几个问题:1)在人脸姿态不是很大的情况下,通过改变人脸轮廓特征点语义位置来解决自遮挡的问题会导致不同姿态下检测的特征点语义信息不一致;2)在大角度姿态下的人脸图像,由于人脸区域近一半自遮挡,遮挡区域的纹理特征信息完全丢失,则导致特征点检测失败。
为了解决上述问题,通常使用三维形变模型拟合到二维人脸图像中的方法实现。但是仍然存在以下问题:1)不同姿态下的特征点语义信息不一致,难以确定三维形变模型中对应的点;2)三维形变模型采用主成分分析方法构建统计模型,而主成分分析方法本质上是一种低通滤波,这种方法对人脸细节特征识别方面效果仍不理想,常常会出现五官凹陷和定位不准确等问题,导致无法构建合适的数据集对人脸对齐模型进行训练。
因此,需要一种生成用于训练人脸对齐模型的数据集的方法,能够较好地解决极端姿态下人脸对齐的问题。
发明内容
为此,本发明提供了一种生成用于训练人脸对齐模型的数据集的方法、人脸对齐方法、计算设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种生成用于训练人脸对齐模型的数据集的方法,该方法适于在计算设备中执行。首先,将人脸图像及其对应的第一特征点输入训练好的三维人脸重建模型中,以输出对应的三维人脸形状。然后,将第一特征点映射到对应的三维人脸形状中并将三维人脸形状进行旋转,得到三维特征点坐标。最后,将三维特征点坐标映射到二维人脸图像中,以得到包含第二特征点坐标的人脸图像作为生成的数据集。
可选地,在上述方法中,第一特征点为无遮挡人脸图像的特征点,第二特征点为有遮挡人脸图像的特征点。
可选地,在上述方法中,可以首先将包含第一特征点的人脸图像输入三维人脸重建模型中,以得到三维人脸形状。然后,基于三维形变模型将三维人脸形状映射到二维图像中,得到对应的映射图。最后,基于映射图与对应的输入图像之间的差异,调整三维人脸重建模型的参数,以得到训练后的三维人脸重建模型。
可选地,在上述方法中,三维人脸重建模型的参数包括人脸形状参数、投影参数和光照参数。
可选地,在上述方法中,首先基于坐标变换函数gluUnProject(),得到映射矩阵。然后基于旋转变换函数cvRodrigues2,得到旋转矩阵。最后结合映射矩阵和旋转矩阵,得到三维人脸坐标。
根据本发明另一个方面,提供了一种人脸对齐方法,该方法可以在计算设备中执行,首先基于上述生成用于训练人脸对齐模型的数据集的方法生成的数据集训练人脸对齐模型,得到训练后的人脸对齐模型。然后将有遮挡的人脸图像输入训练后的人脸对齐模型中,以输出对应的特征点坐标。
可选地,在上述方法中,基于第二特征点与预测特征点之间的偏移量,调整人脸对齐模型的权重参数,以得到训练后的人脸对齐模型。
可选地,在上述方法中,有遮挡的人脸图像包括自遮挡的人脸图像、光线遮挡的人脸图像和实物遮挡的人脸图像中任意一种。
根据本发明的又一方面,提供了一种计算设备,包括:一个或多个处理器;和存储器;一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行如上所述方法中的任一方法的指令。
根据本发明的再一方面,提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当计算设备执行时,使得计算设备执行如上所述的方法中的任一方法。
根据本发明的方案,首先通过三维人脸重建模型得到无遮挡的人脸图像的三维人脸特征点信息,然后将三维人脸特征点映射到二维人脸图像中,得到大角度有遮挡的人脸图像的特征点信息。本方案能够将无遮挡图像中的特征点映射到有遮挡图像中的不可见区域,能够较好地解决极端姿态下人脸对齐不准确的问题。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明的一个实施例的计算设备100的构造示意图;
图2示出了根据本发明的一个实施例的生成用于训练人脸对齐模型的数据集的方法200的示意性流程图;
图3示出了根据本发明的一个实施例的生成用于训练人脸对齐模型的数据集的方法200的流程图;
图4示出了根据本发明的一个实施例的人脸对齐方法400的示意性流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
现有的人脸特征点对齐模型大都是基于完全可见的特征点训练得到的,这并不适用于极端姿态下的不可见的人脸特征点检测。并且由于人脸不规则的表面,非刚性的变形、在不同姿态和光照下的复杂变化,以及人脸的多样性和差异性,人脸识别的准确性受到了很大的限制。为了提高极端姿态下人脸特征点检测效果,本方案提出一种基于三维人脸重建模型的人脸对齐方法。
图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。在一些实施例中,计算设备100被配置为执行生成用于训练人脸对齐模型的数据集的方法200和人脸对齐方法400,程序数据124中就包含了用于执行上述方法的指令。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、图像输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中以编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。在一些实施例中,计算机可读介质中存储一个或多个程序,这一个或多个程序中包括执行某些方法的指令。
计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、数码照相机、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。当然,计算设备100也可以实现为包括桌面计算机和笔记本计算机配置的个人计算机,或者是具有上述配置的服务器。本发明的实施方式对此均不作限制。
基于二维人脸特征点与三维人脸形状之间很强的相关性,可以将二维特征点检测与三维人脸重建耦合起来,在回归的框架下同时实现这两个任务。从三维人脸形状投影得到的二维特征点对人脸形状和姿态都有很强的约束,通过三维形变模型修正三维重建模型的参数能够有效地提高特征点检测的准确性。为了更好地处理任意姿态、表情的二维人脸图像,训练数据集中需要包括尽量多的不同姿态和表情的人脸图像。
图2示出了根据本发明的一个实施例的生成用于训练人脸对齐模型的数据集的方法200的示意性流程图。如图2所述,方法200始于步骤S210。将人脸图像及其对应的第一特征点输入训练好的三维人脸重建模型中,以输出对应的三维人脸形状。
其中,人脸图像及其对应的第一特征点是无遮挡的有完整纹理特征信息的小角度人脸图像及其对应的人脸特征点。例如标注的人脸轮廓、鼻子、眼睛、眉毛、嘴巴等关键特征的特征点。根据本发明的一个实现方式,可以使用上述包含第一特征点的人脸图像训练三维人脸重建模型。通过卷积神经网络使用一个稠密3D人脸模型来拟合人脸图像。可以将三维形变模型作为监督信息,将模型拟合到输入的二维人脸图像中,再利用拟合参数实现三维人脸形状的重建。其中,三维形变模型代表了一个平均人脸,但同时也包含与这一平均值的偏差模式信息,是通过对大量的三维人脸数据进行学习构建的描述人脸形状和纹理的模型。
根据本发明的一个实施例,可以基于三维形变模型,将输入图像对应的三维人脸形状映射到二维图像中,得到对应的映射图。然后基于映射图与对应输入图像之间的差异,调整三维人脸重建模型的参数,以得到训练后的三维人脸重建模型。例如,通过计算映射图与输入图像之间的欧式距离,对损失函数求三维重建模型参数的梯度。沿梯度下降的方向进行参数学习,迭代更新参数直到损失函数的损失值小于预定阈值。从而使映射图与输入图像尽可能地逼近,得到调整后的参数包括人脸形状参数、投影参数、光照参数。这样就可以根据调整后的参数生成二维输入图像对应的三维人脸形状。
随后在步骤S220中,将第一特征点映射到步骤S210中输出的三维人脸形状中并将三维人脸形状进行旋转,得到三维人脸坐标。
经过步骤S210可以得到无遮挡小角度人脸图像对应的三维人脸形状。可以将第一特征点映射到对应的三维人脸形状中,通过坐标变换得到映射矩阵。根据本发明的一个实现方式,可以利用OpenGL里gluUnProject()函数来实现。只要提供一个经过变换的顶点的三维坐标以及所有对他产生影响的变换,gluUnProject()就可以返回这个顶点的全局坐标。输入是二维平面中的二维坐标(x1,y1)(x1,y1),输出是三维空间中的三维坐标(x2,y2,z2)(x2,y2,z2),从函数的角度看就是F(x1,y1)=(x2,y2,z2)。为了得到大量的大角度姿态下的人脸图像,可以将得到的三维人脸形状按照需要的多个角度分别进行旋转,经旋转矩阵变换可以得到三维人脸坐标。根据本发明的一个实现方式,可以通过函数实现的旋转坐标变换,即一个向量乘以旋转矩阵等价于向量以某种方式进行旋转。旋转向量与旋转矩阵可以通过罗德里格斯(Rodrigues)变换进行转换。例如,OpenCV实现Rodrigues变换的函数为
int cvRodrigues2(const CvMat*src,CvMat*dst,CvMat*jacobian=0)
其中src为输入的旋转向量(其一般为一个3x1或者1x3的向量)或者旋转矩阵(一般是大小为3x3的矩阵),dst为输出的旋转矩阵(一般是大小为3x3的矩阵)或者旋转向量(同理,是一个3x1或者1x3的向量),jacobian为可选的输出雅可比矩阵(可以是3x9或者9x3),是输入与输出数组的偏导数。
最后在步骤S230中,将步骤S220中得到的三维人脸坐标映射到二维人脸图像中,以得到包含第二特征点的人脸图像作为生成的数据集。
坐标映射是通过原图像与目标图像之间建立一种映射关系,这种映射关系有两种:一种就是计算原图像任意像素在映射后图像的坐标位置,为正映射;二是计算变换后图像任意像素反映射的坐标位置,为反映射。由于正映射往往会映射不完全以及出现映射重复现象,可以采用反映射的方式来保证输出图像的每个像素点都可以通过映射关系在原图像中唯一的找到对应的像素。最后映射后的二维人脸图像中保留了自遮挡部分的特征点信息,即第二坐标点为有遮挡的人脸图像的特征点。
根据本发明的一个实施例,在得到了一批大角度下保留遮挡区域特征点的侧脸数据集之后,可以将数据集输入预训练的人脸对齐模型中进行训练,得到适于大角度人脸对齐的模型,用来预测大角度人脸图像的特征点位置。本发明提供了一种人脸对齐方法,将上述方法生成的数据集输入人脸对齐模型中进行训练,得到训练后的人脸对齐模型。将有遮挡的人脸图像输入训练后的人脸对齐模型中,以输出对应的特征点坐标。根据本发明的一个实施例,常见的人脸遮挡方式有光线遮挡(光线不均匀或强烈的外部光照等)、实物遮挡(覆盖人脸上的物品)和自遮挡(人体姿态导致)。人脸对齐模型的训练过程可以使用梯度下降法进行参数调整,基于第二特征点与预测特征点之间的偏移量计算损失函数的损失值,通过反复多次迭代调整模型的权重参数,直到损失函数的损失值小于预定阈值,得到训练后的人脸对齐模型。由于对人脸对齐模型的训练过程属于本领域技术人员已知内容,故此处不再赘述。
图3示出了根据本发明的一个实施例的生成用于训练人脸对齐模型的数据集的方法200的流程图。如图3所示,将包含第一特征点的无遮挡的人脸图像输入三维人脸重建模型中,以人脸形变模型作为监督信息进行训练。其中,通过对比三维人脸形状映射到二维图像中的映射图与三维人脸形状对应的原输入图像之间的差异,通过梯度下降法调整三维人脸重建模型的各项参数,包括人脸形状参数、投影参数、光照参数等,这样可以使训练后的三维人脸重建模型具有更好的重建效果。然后对三维人脸形状按照需要的角度进行旋转,可以得到大量的大角度的人脸图像。同时结合映射变换和旋转变换,得到第一特征点对应的三维特征点坐标。最后将三维特征点投影到大角度的二维人脸图像中,得到包含第二特征点的有遮挡的人脸图像。即得到用于训练人脸对齐模型的数据集。
图4示出了根据本发明的一个实施例的人脸对齐方法400的示意性流程图。如图4所示,首先在步骤S410中将包含第二特征点的人脸图像输入人脸对齐模型中进行训练,得到训练后的人脸对齐模型。然后在步骤S420中,将有遮挡的人脸图像输入训练后的人脸对齐模型中,得到有遮挡人脸图像的特征点坐标。可以通过梯度下降法最小化预测特征点与第二特征点之间的误差,反复迭代来训练人脸对齐模型。训练人脸对齐模型的方法对于本领域技术人员是清楚的,对此不再赘述。
根据本发明的方案,通过三维人脸重建模型得到无遮挡的人脸图像的三维人脸特征点信息,然后对三维人脸特征点进行各种角度的旋转,生成大量的带有旋转角度的三维人脸特征点。这样,将这些带有旋转角度的三维人脸特征点映射到二维人脸图像中,就得到了大量的包含各种角度、和有遮挡的人脸图像的特征点信息。
将本方案应用到人脸对齐中,能够将无遮挡图像中的特征点映射到有遮挡图像中的不可见区域,能够较好地解决极端姿态下人脸对齐不准确的问题。同时,该方案不仅解决了现有算法在构建三维模型时五官凹陷的问题,而且运算速度快,提高了大角度极端姿态下的人脸对齐的准确性。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明所述的方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (9)
1.一种生成用于训练人脸对齐模型的数据集的方法,适于在计算设备中执行,所述方法包括:
将人脸图像及其对应的第一特征点输入训练好的三维人脸重建模型中,以输出对应的三维人脸形状,其中,所述第一特征点为无遮挡人脸图像的特征点;
将第一特征点映射到对应的三维人脸形状中并将三维人脸形状进行旋转,得到三维特征点坐标;以及
将三维特征点坐标映射到二维人脸图像中,以得到包含第二特征点的人脸图像作为所述数据集,其中,所述第二特征点为有遮挡人脸图像的特征点。
2.如权利要求1所述的方法,其中,所述三维人脸重建模型基于下述方法训练得到:
将包含第一特征点的人脸图像输入三维人脸重建模型中,以得到三维人脸形状;
基于三维形变模型将三维人脸形状映射到二维图像中,得到对应的映射图;
基于所述映射图与对应的输入图像之间的差异,调整三维人脸重建模型的参数,以得到训练后的三维人脸重建模型。
3.如权利要求2所述的方法,其中,所述三维人脸重建模型的参数包括人脸形状参数、投影参数和光照参数。
4.如权利要求1所述的方法,其中,所述将第一特征点映射到对应的三维人脸形状中并将三维人脸形状进行旋转,得到三维特征点坐标的步骤包括:
基于坐标变换函数,得到映射矩阵;
基于旋转变换函数,得到旋转矩阵;以及
结合所述映射矩阵和旋转矩阵,得到三维特征点坐标。
5.一种人脸对齐方法,适于在计算设备中执行,所述方法包括:
基于权利要求1-4任一项中所述的方法生成的数据集训练人脸对齐模型,得到训练后的人脸对齐模型;
将有遮挡的人脸图像输入训练后的人脸对齐模型中,以输出对应的特征点坐标。
6.如权利要求5所述的方法,其中,所述训练人脸对齐模型的步骤包括:
基于第二特征点与预测特征点之间的偏移量,调整人脸对齐模型的权重参数,以得到训练后的人脸对齐模型。
7.如权利要求5所述的方法,其中,所述有遮挡的人脸图像包括自遮挡的人脸图像、光线遮挡的人脸图像和实物遮挡的人脸图像中任意一种。
8.一种计算设备,包括:
存储器;
一个或多个处理器;
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-7所述方法中的任一方法的指令。
9.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行根据权利要求1-7所述的方法中的任一方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910165661.2A CN110020600B (zh) | 2019-03-05 | 2019-03-05 | 生成用于训练人脸对齐模型的数据集的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910165661.2A CN110020600B (zh) | 2019-03-05 | 2019-03-05 | 生成用于训练人脸对齐模型的数据集的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110020600A CN110020600A (zh) | 2019-07-16 |
CN110020600B true CN110020600B (zh) | 2021-04-16 |
Family
ID=67189298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910165661.2A Active CN110020600B (zh) | 2019-03-05 | 2019-03-05 | 生成用于训练人脸对齐模型的数据集的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110020600B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113128292A (zh) * | 2019-12-31 | 2021-07-16 | Tcl集团股份有限公司 | 一种图像识别方法、存储介质及终端设备 |
CN113129425B (zh) * | 2019-12-31 | 2024-07-12 | Tcl科技集团股份有限公司 | 一种人脸图像三维重建方法、存储介质及终端设备 |
CN111489435B (zh) * | 2020-03-31 | 2022-12-27 | 天津大学 | 基于单图像的自适应三维人脸重建方法 |
CN113673278A (zh) * | 2020-05-13 | 2021-11-19 | 阿里巴巴集团控股有限公司 | 数据处理方法及装置 |
CN111695628B (zh) * | 2020-06-11 | 2023-05-05 | 北京百度网讯科技有限公司 | 关键点标注方法、装置、电子设备及存储介质 |
CN111667403B (zh) * | 2020-07-02 | 2023-04-18 | 北京爱笔科技有限公司 | 一种有遮挡的人脸图像的生成方法及装置 |
CN113345079B (zh) * | 2021-06-18 | 2024-02-27 | 厦门美图宜肤科技有限公司 | 面部三维模型可视化方法、装置、电子设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101159015A (zh) * | 2007-11-08 | 2008-04-09 | 清华大学 | 一种二维人脸图像的识别方法 |
CN101320484A (zh) * | 2008-07-17 | 2008-12-10 | 清华大学 | 一种基于人脸全自动定位的三维人脸识别方法 |
CN101561874A (zh) * | 2008-07-17 | 2009-10-21 | 清华大学 | 一种人脸图像识别的方法 |
CN102999942A (zh) * | 2012-12-13 | 2013-03-27 | 清华大学 | 三维人脸重建方法 |
CN104036546A (zh) * | 2014-06-30 | 2014-09-10 | 清华大学 | 一种基于自适应形变模型的任意视角人脸三维重构方法 |
CN106503684A (zh) * | 2016-10-28 | 2017-03-15 | 厦门中控生物识别信息技术有限公司 | 一种人脸图像处理方法和装置 |
CN107038429A (zh) * | 2017-05-03 | 2017-08-11 | 四川云图睿视科技有限公司 | 一种基于深度学习的多任务级联人脸对齐方法 |
CN107423678A (zh) * | 2017-05-27 | 2017-12-01 | 电子科技大学 | 一种提取特征的卷积神经网络的训练方法及人脸识别方法 |
CN108765273A (zh) * | 2018-05-31 | 2018-11-06 | Oppo广东移动通信有限公司 | 人脸拍照的虚拟整容方法和装置 |
KR20180126146A (ko) * | 2017-05-17 | 2018-11-27 | 디프트(주) | 2.5차원 이미지를 활용한 가상 전시 공간 시스템 및 제공 방법 |
CN109285215A (zh) * | 2018-08-28 | 2019-01-29 | 腾讯科技(深圳)有限公司 | 一种人体三维模型重建方法、装置和存储介质 |
-
2019
- 2019-03-05 CN CN201910165661.2A patent/CN110020600B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101159015A (zh) * | 2007-11-08 | 2008-04-09 | 清华大学 | 一种二维人脸图像的识别方法 |
CN101320484A (zh) * | 2008-07-17 | 2008-12-10 | 清华大学 | 一种基于人脸全自动定位的三维人脸识别方法 |
CN101561874A (zh) * | 2008-07-17 | 2009-10-21 | 清华大学 | 一种人脸图像识别的方法 |
CN102999942A (zh) * | 2012-12-13 | 2013-03-27 | 清华大学 | 三维人脸重建方法 |
CN104036546A (zh) * | 2014-06-30 | 2014-09-10 | 清华大学 | 一种基于自适应形变模型的任意视角人脸三维重构方法 |
CN106503684A (zh) * | 2016-10-28 | 2017-03-15 | 厦门中控生物识别信息技术有限公司 | 一种人脸图像处理方法和装置 |
CN107038429A (zh) * | 2017-05-03 | 2017-08-11 | 四川云图睿视科技有限公司 | 一种基于深度学习的多任务级联人脸对齐方法 |
KR20180126146A (ko) * | 2017-05-17 | 2018-11-27 | 디프트(주) | 2.5차원 이미지를 활용한 가상 전시 공간 시스템 및 제공 방법 |
CN107423678A (zh) * | 2017-05-27 | 2017-12-01 | 电子科技大学 | 一种提取特征的卷积神经网络的训练方法及人脸识别方法 |
CN108765273A (zh) * | 2018-05-31 | 2018-11-06 | Oppo广东移动通信有限公司 | 人脸拍照的虚拟整容方法和装置 |
CN109285215A (zh) * | 2018-08-28 | 2019-01-29 | 腾讯科技(深圳)有限公司 | 一种人体三维模型重建方法、装置和存储介质 |
Non-Patent Citations (3)
Title |
---|
Continuous Pose Normalization for Pose-Robust Fce Recognition;Ding L et al.;《IEEE Signal Processing Letters》;20121231;第19卷(第11期);第721-724页 * |
基于三维人耳形变模型的三维人耳重建;李琛 等;《北京科技大学学报》;20130531;第35卷(第5期);第694-702页 * |
基于三维型变模型的多姿态人脸识别;张壮;《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》;20061215;第2章 * |
Also Published As
Publication number | Publication date |
---|---|
CN110020600A (zh) | 2019-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020600B (zh) | 生成用于训练人脸对齐模型的数据集的方法 | |
CN107146199B (zh) | 一种人脸图像的融合方法、装置及计算设备 | |
US11514642B2 (en) | Method and apparatus for generating two-dimensional image data describing a three-dimensional image | |
CN107392984B (zh) | 一种基于人脸图像生成动画的方法及计算设备 | |
JP7155271B2 (ja) | 画像処理システム及び画像処理方法 | |
Stoll et al. | Fast articulated motion tracking using a sums of gaussians body model | |
CN107507216B (zh) | 图像中局部区域的替换方法、装置及存储介质 | |
CN104937635B (zh) | 基于模型的多假设目标追踪器 | |
WO2020119458A1 (zh) | 脸部关键点检测方法、装置、计算机设备和存储介质 | |
CN105759967B (zh) | 一种基于深度数据的手部全局姿态检测方法 | |
CN112001859B (zh) | 一种人脸图像的修复方法及系统 | |
US20150278589A1 (en) | Image Processor with Static Hand Pose Recognition Utilizing Contour Triangulation and Flattening | |
US11087517B2 (en) | Sketch-based abstraction for character posing and synthesis | |
CN104123749A (zh) | 一种图像处理方法及系统 | |
CN110276289B (zh) | 生成匹配模型的方法和人脸特征点追踪方法 | |
US20230169727A1 (en) | Generative Nonlinear Human Shape Models | |
KR20150107063A (ko) | 얼굴 성형 시뮬레이션을 이용한 3차원 스캔 시스템 | |
JP2015219868A (ja) | 情報処理装置、情報処理方法、プログラム | |
de La Gorce et al. | A variational approach to monocular hand-pose estimation | |
Soussen et al. | Polygonal and polyhedral contour reconstruction in computed tomography | |
CN117333635B (zh) | 一种基于单幅rgb图像的交互双手三维重建方法及系统 | |
AU2020436768B2 (en) | Joint rotation inferences based on inverse kinematics | |
CN110852934A (zh) | 图像处理方法及装置、图像设备及存储介质 | |
TWI817680B (zh) | 影像擴增方法以及裝置 | |
CN111027389B (zh) | 人群计数系统中基于可变形高斯核的训练数据生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |