CN108805056B - 一种基于3d人脸模型的摄像监控人脸样本扩充方法 - Google Patents
一种基于3d人脸模型的摄像监控人脸样本扩充方法 Download PDFInfo
- Publication number
- CN108805056B CN108805056B CN201810530124.9A CN201810530124A CN108805056B CN 108805056 B CN108805056 B CN 108805056B CN 201810530124 A CN201810530124 A CN 201810530124A CN 108805056 B CN108805056 B CN 108805056B
- Authority
- CN
- China
- Prior art keywords
- face
- model
- matrix
- camera
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及人脸样本扩充和人脸识别领域,具体的说是涉及一种摄像监控人脸样本扩充方法。本发明使用3D人脸用用模型,在只有一张正面人脸照片的基础上,合成其他视角的人脸照片,很好的解决了摄像监控人脸样本缺少、识别率低的问题。通过在合成人脸数据集上训练的深度神经网络可以获得很好的摄像监控人脸识别性能。
Description
技术领域
本发明涉及人脸样本扩充和人脸识别领域,具体的说是涉及一种摄像监控人脸样本扩充方法。
背景技术
在过去几年中,人脸识别性能得到了巨大的提升,这种性能的提升很大一部分来源于深度学习方法的成功,该方法从大量训练集中学习人脸的特征表示。这些方法提出了一个基本的假设,即通过收集足够多的训练集,深度网络将有足够多的类间和类内变化的样本,从这些变化中,网络可以学会分辨每个样本和其他样本外观变换的特征。
不幸的是,这种潜在的假设在实践中往往不存在。即便是庞大的数据集,如CASIAWebFace数据集,每类只包含少量的样本,而且样本之间表现出巨大的差异,主要体现在不同的光照和姿态下样本呈现出不一样的效果,这些数据集提供的类内和类间差异的变化是有限的。特别是在摄像监控样本中,每个类别往往只有特别少的样本,有的甚至只有一张正面照片。最近的许多方法使用计算机图形技术,通过对人脸照片合成许多新的视角的照片来扩充数据集,从而使得深度网络有很大的性能提升。但是在摄像监控样本中这些方法并没有取得很好的效果,主要原因在于样本的差异性。不同于现有数据集,摄像监控样本最大的差异体现在其大姿态上。一般来讲,摄像监控样本很大一部分是自从高出往下拍摄,且包含一定的大的角度,因此样本扩充方法需要考虑从正面照片生成包含大的俯仰角的人脸照片。
在由正面视图生成其他视图的人脸照片时,关键问题在于保持人脸局部特征不变,即生成的大角度人脸照片的局部特征和正面人脸照片相应的局部特征变化不大甚至不变。在计算机视觉领域,通常在合成新视图时,估计输入照片中人脸的3D几何形状以匹配输入照片,通过对3D人脸模型旋转一定的角度来生成需要的视图。借助于此方法,可以极大地扩充数据集,提高深度网络的识别率。
但是此过程严重依赖于重建的准确性,而且对于人脸特征点检测有极高的准确度要求。此外,由于摄像监控样本的复杂,光照的变化和照片分辨率低等原因,并不能直接使用此过程进行其他视角人脸样本的扩充。
发明内容
针对上述存在的问题或不足,为了实现摄像监控样本的多视图扩充,使得在只有一张正面照或其他小角度人脸照片的前提下可以扩充更多的其他视角的照片,本发明借助通用3D人脸模型,在不估计形状的前提下,通过2D人脸特征点和3D模型特征点匹配,可以有效的实现多视角样本扩充,而且相比之前的方法,该算法在保证精确度的同时,简化了合成和渲染过程,计算速度也得到了极大的提升。
本发明由以下步骤实现,其扩充算法流程见附图1,实现过程见附图2。
步骤1、人脸检测、裁剪、缩放到标准坐标系。
此过程对样本扩充算法的输入照片进行了预处理操作,主要是检测输入照片中的人脸区域,裁剪并缩放到固定的大小以匹配3D模型。
步骤2、人脸特征点检测、投影矩阵估计。
使用现有的特征点检测算法对预处理后的人脸照片进行68个2D特征点检测。借助于3D通用模型的3D特征点,可以估计得到投影矩阵。其过程如下:
假设2D特征点坐标为(xk,yk),3D特征点坐标为(Xk,Yk,Zk),3D特征点在相机中的坐标为(Uk,Vk,Wk),则对应关系为:
其中,R为旋转矩阵(3x3),t为平移向量(3x1),fx,fy表示相机x,y方向的焦距,cx,cy表示相机的光学中心,A即相机的内参矩阵,s为尺度因子。若忽略掉尺度因子,给定相机内参矩阵A,可以得到旋转矩阵R和平移向量t,进而可以得到投影矩阵C=A[R t]。
步骤3、分离3D模型投影到2D图片的人脸区域。
在由正面人脸照片合成其他视角的过程中需要分离出背景和人脸区域,只进行人脸区域的合成,而忽略背景区域,从可以减少背景区域对人脸识别的影响。该过程如下:
首先通过投影矩阵C将3D模型坐标点(Xk,Yk,Zk)投影到2D平面坐标点(xk,yk):
(xk,yk)T=C*(Xk,Yk,Zk)T
由3D模型的人脸区域的索引,可以分别得到2D平面人脸区域和背景区域的坐标值和对应的索引,进而可以分离出人脸和背景。
步骤4、合成固定视角照片IR
由给定的3D人脸模型,通过指定参考投影矩阵CM=AM[RM tM]来产生该模型固定角度的合成渲染视图。其中,AM是相机内参矩阵,[RM tM]是由旋转矩阵RM和平移向量tM组成的矩阵。通过选择旋转矩阵和平移向量来产生模型的固定视角的视图,作为参考视图IR,由步骤3,可以得到参考视图IR的人脸区域的背景区域。其过程如下:
在产生参考视图IR时,为参考视图的每个像素点p'存储该像素点位于3D模型表面上点的3D坐标P=(X,Y,Z)T,其中,p'=CMP,pi'是由位于3D模型表面的坐标点Pi=(Xi,Yi,Zi)T通过投影矩阵CM投影而来。令pi=(xi yi)T是输入照片IF的人脸特征点。
同样,可以通过投影矩阵CQ来产生输入人脸照片IF的每个像素点的坐标pi=(xiyi)T。IF和参考视图IR对应像素点是通过3D模型中相同位置的3D坐标点投影产生。
通过双线性插值,采样输入人脸照片IF中像素点p处的强度,然后将采样的强度分配给新的视图中的相应像素点p',重映射后合成固定视角的人脸照片IR。
附图说明
图1为人脸样本扩充算法流程图;
图2为人脸样本扩充算法实现过程示意图;
图3为使用扩充后的人脸样本进行训练网络的训练损失和测试准确率;
图4为使用训练好的模型进行准确预测的结果图;
图5为使用训练好的模型预测错误的结果图。
具体实施方式
下面以图2所示人脸照片为例,对本发明作进一步说明。
本发明是为了解决在只有一张正面人脸照片的情况下,扩充摄像监控人脸样本,使得在其他视角和环境下的人脸样本也可以正确识别。本发明使用26类样本,每类只使用一张正面照片进行样本扩充,分别在x轴、y轴和z轴进行不同角度旋转,生成多个角度的人脸照片,同时在处理过程中忽略了背景信息,即不对背景区域进行合成。为了进一步扩充数据集,在扩充后的数据集基础上,进行了简单的裁剪、旋转、亮度调节等变换,这样将每个样本扩充为3000张样本,每类包含多个视角的人脸样本。将扩充后的人脸数据集分为训练集和测试集,比例为8:2,即训练样本62400张,测试样本15600张。采用VGG16深度神经网络进行训练,然后使用训练的网络对图2样本的其他视角和环境的人脸照片进行预测。
实验的系统环境为Ubuntu16.04,使用Caffe框架训练VGG16网络。网络参数设置为:train_batch和test_batch为64,iter_test设置为300次,base_lr为0.001,每隔10000次减小一次。网络训练20000次可以收敛,且在测试集上的准确率为0.996,如图3所示。使用训练好的网络对其他视角和环境的人脸照片进行预测,当人脸视角为90度时,即侧面人脸或者接近侧面的情况下会识别出错,其他视角下的人脸照片有很好的准确率。使用训练好的深度网络模型进行预测的结果见图4和图5。
Claims (1)
1.一种基于3D人脸模型的摄像监控人脸样本扩充方法,其特征在于,包括以下具体步骤:
步骤1、人脸预处理:人脸检测、裁剪,并缩放到标准坐标系,使其能与3D模型匹配为准;
步骤2、人脸特征点检测、投影矩阵估计:
使用人脸特征点检测算法检测68个特征点(xk,yk),k=1,2,...,68,3D人脸模型上的3D特征点坐标为(Xk,Yk,Zk),假设3D特征点在相机中的坐标为(Uk,Vk,Wk),则对应关系为:
其中,R为旋转矩阵(3x3),t为平移向量(3x1),fx,fy表示相机x,y方向的焦距,cx,cy表示相机的光学中心,A即相机的内参矩阵,s为尺度因子;设定忽略尺度因子,给定相机内参矩阵A,可得到旋转矩阵R和平移向量t,进而得到投影矩阵C=A[R t];
步骤3、分离3D模型投影到2D图片的人脸区域:
首先通过投影矩阵C将3D模型坐标点(Xk,Yk,Zk)投影到2D平面坐标点(xk,yk):
(xk,yk)T=C*(Xk,Yk,Zk)T
由3D模型的人脸区域的索引,分别得到2D平面人脸区域和背景区域的坐标值和对应的索引,进而可以分离出人脸和背景;
步骤4、合成固定视角人脸照片IR:
由给定的3D人脸模型,通过指定参考投影矩阵CM=AM[RM tM]来产生该模型固定角度的合成渲染视图;其中,AM是相机内参矩阵,[RM tM]是由旋转矩阵RM和平移向量tM组成的矩阵;通过选择旋转矩阵和平移向量来产生模型的固定视角的视图,作为参考视图IR,由步骤3,可以得到参考视图IR的人脸区域的背景区域,具体为:
在产生参考视图IR时,为参考视图的每个像素点p'存储该像素点位于3D模型表面上点的3D坐标P=(X,Y,Z)T,其中,p'=CMP,即p'是由位于3D模型表面的坐标点P=(X,Y,Z)T通过投影矩阵CM投影而来;令pi=(xi,yi)T是输入照片IF的人脸特征点;
同样,可以通过投影矩阵CQ来产生输入人脸照片IF的每个像素点的坐标pi=(xi,yi)T;IF和参考视图IR对应像素点是通过3D模型中相同位置的3D坐标点投影产生;
通过双线性插值,采样输入人脸照片IF中像素点p处的强度,然后将采样的强度分配给新的视图中的相应像素点p',重映射后合成固定视角的人脸照片IR。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810530124.9A CN108805056B (zh) | 2018-05-29 | 2018-05-29 | 一种基于3d人脸模型的摄像监控人脸样本扩充方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810530124.9A CN108805056B (zh) | 2018-05-29 | 2018-05-29 | 一种基于3d人脸模型的摄像监控人脸样本扩充方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108805056A CN108805056A (zh) | 2018-11-13 |
CN108805056B true CN108805056B (zh) | 2021-10-08 |
Family
ID=64090937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810530124.9A Active CN108805056B (zh) | 2018-05-29 | 2018-05-29 | 一种基于3d人脸模型的摄像监控人脸样本扩充方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108805056B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097035A (zh) * | 2019-05-15 | 2019-08-06 | 成都电科智达科技有限公司 | 一种基于3d人脸重建的人脸特征点检测方法 |
CN110288512B (zh) * | 2019-05-16 | 2023-04-18 | 成都品果科技有限公司 | 用于图像合成的光照重映射方法、装置、存储介质和处理器 |
CN111310791A (zh) * | 2020-01-17 | 2020-06-19 | 电子科技大学 | 一种基于小样本数目集的动态渐进式自动目标识别方法 |
CN111753652B (zh) * | 2020-05-14 | 2022-11-29 | 天津大学 | 一种基于数据增强的三维人脸识别方法 |
CN112819758A (zh) * | 2021-01-19 | 2021-05-18 | 武汉精测电子集团股份有限公司 | 训练数据集的生成方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101763636A (zh) * | 2009-09-23 | 2010-06-30 | 中国科学院自动化研究所 | 视频序列中的三维人脸位置和姿态跟踪的方法 |
CN101866497A (zh) * | 2010-06-18 | 2010-10-20 | 北京交通大学 | 基于双目立体视觉的智能三维人脸重建方法及系统 |
CN104299250A (zh) * | 2014-10-15 | 2015-01-21 | 南京航空航天大学 | 基于先验模型的正面人脸图像合成方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100940862B1 (ko) * | 2007-12-17 | 2010-02-09 | 한국전자통신연구원 | 3차원 얼굴 애니메이션을 위한 헤드 모션 추적 방법 |
CN103093490B (zh) * | 2013-02-02 | 2015-08-26 | 浙江大学 | 基于单个视频摄像机的实时人脸动画方法 |
-
2018
- 2018-05-29 CN CN201810530124.9A patent/CN108805056B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101763636A (zh) * | 2009-09-23 | 2010-06-30 | 中国科学院自动化研究所 | 视频序列中的三维人脸位置和姿态跟踪的方法 |
CN101866497A (zh) * | 2010-06-18 | 2010-10-20 | 北京交通大学 | 基于双目立体视觉的智能三维人脸重建方法及系统 |
CN104299250A (zh) * | 2014-10-15 | 2015-01-21 | 南京航空航天大学 | 基于先验模型的正面人脸图像合成方法及系统 |
Non-Patent Citations (3)
Title |
---|
A 3D Face Model for Pose and Illumination Invariant Face Recognition;Pascal Paysan 等;《2009 Sixth IEEE International Conference on Advanced Video and Signal Based》;20091006;296-301 * |
Large Pose 3D Face Reconstruction from a Single Image via Direct Volumetric CNN Regression;Aaron S. Jackson 等;《2017 IEEE International Conference on Computer Vision》;20171225;1031-1039 * |
基于形变模型的三维人脸建模方法研究;盖赟;《中国优秀硕士学位论文全文数据库信息科技辑》;20130215(第(2013)02期);I138-1788 * |
Also Published As
Publication number | Publication date |
---|---|
CN108805056A (zh) | 2018-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108805056B (zh) | 一种基于3d人脸模型的摄像监控人脸样本扩充方法 | |
CN111325794B (zh) | 一种基于深度卷积自编码器的视觉同时定位与地图构建方法 | |
CN109325437B (zh) | 图像处理方法、装置和系统 | |
KR101007276B1 (ko) | 3차원 안면 인식 | |
Richardson et al. | Learning detailed face reconstruction from a single image | |
Weinmann et al. | Material classification based on training data synthesized using a BTF database | |
CN109583483B (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
CN109684925B (zh) | 一种基于深度图像的人脸活体检测方法及设备 | |
CN108171133B (zh) | 一种基于特征协方差矩阵的动态手势识别方法 | |
US20180357819A1 (en) | Method for generating a set of annotated images | |
CN106155299B (zh) | 一种对智能设备进行手势控制的方法及装置 | |
WO2021249401A1 (zh) | 模型生成方法、图像透视图确定方法、装置、设备及介质 | |
JPH08320933A (ja) | 三次元画像の評価方法 | |
Manikandan et al. | Hand gesture detection and conversion to speech and text | |
WO2018133119A1 (zh) | 基于深度相机进行室内完整场景三维重建的方法及系统 | |
CN110751097A (zh) | 一种半监督的三维点云手势关键点检测方法 | |
CN113012122A (zh) | 一种类别级6d位姿与尺寸估计方法及装置 | |
CN107808391B (zh) | 一种基于特征选择与光滑表示聚类的视频动态目标提取方法 | |
Wu et al. | 3D film animation image acquisition and feature processing based on the latest virtual reconstruction technology | |
CN115008454A (zh) | 一种基于多帧伪标签数据增强的机器人在线手眼标定方法 | |
CN108564043B (zh) | 一种基于时空分布图的人体行为识别方法 | |
Paterson et al. | 3D head tracking using non-linear optimization. | |
CN107341476A (zh) | 一种基于系统计算原理的无监督人体模型构建方法 | |
Kallasi et al. | Object detection and pose estimation algorithms for underwater manipulation | |
CN112132743A (zh) | 可自适应光照的视频换脸方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |