CN108932536A - 基于深度神经网络的人脸姿态重建方法 - Google Patents

基于深度神经网络的人脸姿态重建方法 Download PDF

Info

Publication number
CN108932536A
CN108932536A CN201810790966.8A CN201810790966A CN108932536A CN 108932536 A CN108932536 A CN 108932536A CN 201810790966 A CN201810790966 A CN 201810790966A CN 108932536 A CN108932536 A CN 108932536A
Authority
CN
China
Prior art keywords
facial image
image
neural network
human face
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810790966.8A
Other languages
English (en)
Other versions
CN108932536B (zh
Inventor
羊恺
顾岩
袁丹
袁一丹
任向阳
陈鑫
张惠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201810790966.8A priority Critical patent/CN108932536B/zh
Publication of CN108932536A publication Critical patent/CN108932536A/zh
Application granted granted Critical
Publication of CN108932536B publication Critical patent/CN108932536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Geometry (AREA)
  • Biophysics (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例公开了一种基于深度神经网络的人脸姿态重建方法,包括:人脸图像的预处理,将人脸训练样本分成多个局部小块,组成样本局部图像集;构建人脸姿态中的神经网络,根据改进后的人脸姿态重建关系式,将样本局部图像集代入神经网络,通过神经网络求出关系式的各因子对应参数,确定重建关系式,训练出改进后的姿态重建模型;把分割好的测试局部图像集代入训练好的姿态重建模型,得到预测后的人脸图像局部小块,将人脸图像局部小块组合后生成人脸图像。本发明有效提高了人脸图像重建的准确率。

Description

基于深度神经网络的人脸姿态重建方法
技术领域
本发明涉及图像数据处理技术领域,尤其是一种基于深度神经网络的人脸姿态重建方法。
背景技术
在人脸图像识别技术中,影响人脸识别率的因素包括遮挡、光照、表情变化、姿态变换等,在这些因素中,人脸的姿态变换使对人脸识别率产生影响的重要因素,也是人脸识别技术从理论走向实际的瓶颈,现有技术的人脸图像识别主要是对人脸正面图像的识别,对于变换姿态的识别需要进行人脸姿态重建,现有技术主要包括以下几种方式:
一是3D人脸姿态重建,通过图像的表面信息和深度信息等图像信息进行人脸姿态重建,或通过三维模型对图像进行人脸姿态重建,这种方法的缺点是要求每一张人脸图像的特征点数量必须相同,且各个特征点的位置也要相同,实现比较困难,数据量较大;
二是2D人脸姿态重建,主要包括图形学法,该方法需要通过几何变换对图像中的脸部纹理进行修正重建,需要把由于遮挡造成的脸部信息进行补充,会导致重建后的正面图像不自然,与源图像的差异较大;另一种统计学习方法,存在较大的局限性,容易产生相似度不高的情况。
因此,现有技术需要改进。
发明内容
本发明实施例所要解决的一个技术问题是:提供一种基于深度神经网络的人脸姿态重建方法,以解决现有技术存在的问题,所述基于深度神经网络的人脸姿态重建方法包括:
人脸图像的预处理,将人脸训练样本分成多个局部小块,组成样本局部图像集,所选取人脸图像满足凸显的大小一致、人脸部分位置一致、人脸的概略对齐,消除对人脸图像对姿态重建的影响;
构建人脸姿态中的神经网络,根据改进后的人脸姿态重建关系式,将样本局部图像集代入神经网络,通过神经网络求出关系式的各因子对应参数,确定重建关系式,训练出改进后的姿态重建模型;
把分割好的测试局部图像集代入训练好的姿态重建模型,得到预测后的人脸图像局部小块,将人脸图像局部小块组合后生成人脸图像。
在基于本发明上述基于深度神经网络的人脸姿态重建方法的另一个实施例中,所述人脸图像的预处理包括:
采集人脸图像,制作人脸图像库;
采用加权平均法对人脸图像进行灰度化处理;
对灰度化处理后的人脸图像进行几何归一化处理;
采用线性变换方法进行人脸图像的数据归一化处理;
对人脸图像中值滤波去噪。
在基于本发明上述基于深度神经网络的人脸姿态重建方法的另一个实施例中,所述采用加权平均法对人脸图像进行灰度化处理包括:
对人脸图像中的RGB分量进行加权平均,得到灰度图像的灰度值,其公式为:
F(x,y)=0.2989R(x,y)+0.5870G(x,y)+0.1140B(x,y) (1)
式中,0.2989,0.5870,0.1140分别为(x,y)位置的像素点R分量、G分量、B分量对应的权值,经过公式(1)得到灰度化后的图像(x,y)位置像素点的灰度值F的大小。
在基于本发明上述基于深度神经网络的人脸姿态重建方法的另一个实施例中,所述对灰度化处理后的人脸图像进行几何归一化处理包括:
采用LBP算法的人脸检测训练模型,对模型要训练的人脸图像进行检测,在人脸图像中找到人脸部分的位置,确定人脸区域的准确位置,准确获取人脸部分;
采用AdaBoost算法训练检测眼睛位置,对测试图像进行人眼检测,获得图像上的眼睛区域,作为眼睛精确位置的初步估算;
根据图像平面旋转方法,对人脸图像中选取的某一点位置作为基准点,将人脸图像以基准点为中心进行旋转,将人脸图像进行矫正对齐。
在基于本发明上述基于深度神经网络的人脸姿态重建方法的另一个实施例中,所述采用线性变换方法进行人脸图像的数据归一化处理包括:线性函数转换方法、对数函数转换方法、反余切函数转换方法、正态分布化方法、小数定标规范化方法、模糊量化模式方法。
在基于本发明上述基于深度神经网络的人脸姿态重建方法的另一个实施例中,所述对人脸图像中值滤波去噪包括:
设置滤波模板,并将滤波模板的中心与人脸图像的像素点位置进行重合;
将滤波模板与人脸图像重合区域内的各个对应像素点的灰度值进行排序;
获取人脸图像重合区域灰度值的中间值;
将中值赋值给模板中心位置的像素点。
在基于本发明上述基于深度神经网络的人脸姿态重建方法的另一个实施例中,所述构建人脸姿态中的神经网络从人脸图像的输入输出顺序包括:
输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、全连接层、输出层;
人脸图像首先通过输入层输入,经过第一卷积层进行函数激励,通过第一池化层缩小特征图大小,压缩精简特征,经过第二卷积层进一步进行函数激励,第二池化层进一步缩小特征图大小,压缩精简特征,通过第三卷积层后,将图像信息输出至全连接层,全连接层对提取到的特征图进行全连接,经过输出层输出生成图像。
在基于本发明上述基于深度神经网络的人脸姿态重建方法的另一个实施例中,所述第一卷积层、第二卷积层、第三卷积层对应的权值初始化值为:
arg min||Y-OWiXi-1||2 (2)
式中,Xi-1是第i层卷积层的输出特征图数据,Wi是第i层的权重,每层的O是一个二进制矩阵,用于将上一层的特征映射的相同位置上的像素相加在一起,使得OWiXi-1与Y大小相同,Y是该输入的人脸侧脸图像对应的人脸正面图像原图像。
在基于本发明上述基于深度神经网络的人脸姿态重建方法的另一个实施例中,所述把分割好的测试局部图像集代入训练好的姿态重建模型,得到预测后的人脸图像局部小块,将人脸图像局部小块组合后生成人脸图像包括:
将各部分小块图像合成人脸图像局部小块图像,其公式为:
式中,ai为初始化局部图像块之间的重构系数,作为一次项xi的参数的初始化值,其表示公式为:γi表示初始化的线性因子,其表示公式为:bi为偏置参数,其初始化值为0。
将人脸图像局部小块图像合成人脸图像,其公式为:
本发明具有的优点将结合实施例具体予以说明。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本发明的实施例,并且连同描述一起用于解释本发明的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
图1为本发明的基于深度神经网络的人脸姿态重建方法的一个实施例的流程图;
图2为本发明的基于深度神经网络的人脸姿态重建方法的另一个实施例的流程图;
图3为本发明的基于深度神经网络的人脸姿态重建方法的又一个实施例的流程图;
图4为本发明实施例的对人脸图像中值滤波去噪的流程图;
图5为本发明实施例的构建人脸姿态中的神经网络从人脸图像的输入输出顺序示意图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
如图1所示,所述基于深度神经网络的人脸姿态重建方法包括:
10,人脸图像的预处理,将人脸训练样本分成多个局部小块,组成样本局部图像集,所选取人脸图像满足凸显的大小一致、人脸部分位置一致、人脸的概略对齐,消除对人脸图像对姿态重建的影响;
20,构建人脸姿态中的神经网络,根据改进后的人脸姿态重建关系式,将样本局部图像集代入神经网络,通过神经网络求出关系式的各因子对应参数,确定重建关系式,训练出改进后的姿态重建模型;
30,把分割好的测试局部图像集代入训练好的姿态重建模型,得到预测后的人脸图像局部小块,将人脸图像局部小块组合后生成人脸图像。
如图2所示,所述人脸图像的预处理包括:
101,采集人脸图像,制作人脸图像库;
102,采用加权平均法对人脸图像进行灰度化处理;
103,对灰度化处理后的人脸图像进行几何归一化处理;
104,采用线性变换方法进行人脸图像的数据归一化处理;
105,对人脸图像中值滤波去噪。
在一个具体的实施例中,所述采集人脸图像,制作人脸图像库的方法为:现有技术的人脸数据库一般采用CMU-PIE人脸数据库,该人脸数据库包含了68位志愿者的图片,采集的面部图像包括多种姿态、光照和表情的图片,总共有41368张,所有照片都包括了每个人的13种姿态条件,43种光照条件和4中表情条件,PIE人脸数据库与其他的人脸数据库相比较,更适合永凯做人脸姿态重建技术的人脸数据库,因此,本发明的一个实施例采用模拟PIE人脸数据库的采集方式进行人脸采集,用作人脸姿态重建的实验数据,将人脸数据库中的图片进行裁剪和整理,将图片统一成64*64大小的人脸图像,制作成本发明的人脸图像库。
所述采用加权平均法对人脸图像进行灰度化处理包括:
对人脸图像中的RGB分量进行加权平均,得到灰度图像的灰度值,其公式为:
F(x,y)=0.2989R(x,y)+0.5870G(x,y)+0.1140B(x,y) (1)
式中,0.2989,0.5870,0.1140分别为(x,y)位置的像素点R分量、G分量、B分量对应的权值,经过公式(1)得到灰度化后的图像(x,y)位置像素点的灰度值F的大小。
人脸图像的灰度化,是将彩色的人脸图像,经过灰度化处理后,转化为灰度图像,图像灰度化的作用有以下几点:
一是方便进行图形操作,将三通道的图像矩阵变换成二维矩阵数据;
二是改善图像质量,使图像能够显示更多的细节,提高图像的对比度;
三是有选择的突出图像感兴趣的特征或者抑制图像中不需要的特征;
四是可以有效的改变图像的直方图分布,使像素的分布更加均匀。
如图3所示,所述对灰度化处理后的人脸图像进行几何归一化处理包括:
201,采用LBP算法的人脸检测训练模型,对模型要训练的人脸图像进行检测,在人脸图像中找到人脸部分的位置,确定人脸区域的准确位置,准确获取人脸部分;
202,采用AdaBoost算法训练检测眼睛位置,对测试图像进行人眼检测,获得图像上的眼睛区域,作为眼睛精确位置的初步估算;
203,根据图像平面旋转方法,对人脸图像中选取的某一点位置作为基准点,将人脸图像以基准点为中心进行旋转,将人脸图像进行矫正对齐。
人脸图像进行几何归一化处理的作用是消除人脸图像由于成像位置的不同以及人脸姿态不同引起的图像差异,解决人脸图像的尺度大小和人脸角度的不同。
所述采用线性变换方法进行人脸图像的数据归一化处理是对人脸图像数据进行灰度值归一化,方便模型训练时加快收敛,减小参数误差,所述采用线性变换方法进行人脸图像的数据归一化处理包括:线性函数转换方法、对数函数转换方法、反余切函数转换方法、正态分布化方法、小数定标规范化方法、模糊量化模式方法。
所述线性函数转换方法为:
所述对数函数转换方法为:
y=log10 (x) (3)
所述反余切函数转换方法为:
y=arctan(x)*2/π (4)
所述正态分布化方法包括:
零均值化:
归一化方差:
所述小数定标规范化方法包括:
通过除以10的次方数,将x的小数点进行移动,公式如下:
式中,j为使得Max|y|<1的最小整数。
所述模糊量化模式方法包括:
式中:x为人脸图像经过归一化前的原始数据。
人脸图像数据的线性变换归一化是将待处理的人脸图像数据的像素值按照一定的比例进行缩放,使得归一化后的图像像素值落入实验所需的特定的值区间,去除处理数据的单位限制,标准化后的数据值转换为无量纲的纯数字,便于不同量纲之间的数据值进行加权计算。
在人脸姿态重建的过程中,通常会出现椒盐噪声(salt-and-pepper noise),所述椒盐噪声是黑白相间的亮暗点噪声,通常是由采集图像的设备、传输图像的通道,或者在进行图像处理的过程中产生的,噪声是影响图片的效果,干扰图像处理过程的主要因素之一,因此,必须尽量减少噪声的干扰,去噪的目的是尽可能保持图像信息。
中值滤波对图像的椒盐噪声去除效果最好,中值滤波的眼里是,针对图像中的某一噪声的像素点,将该点的像素灰度值与周围的像素灰度值进行比较,除去像素灰度值序列的中间值,将其代替噪声点,消除掉图像中的噪声点。
如图4所示,所述对人脸图像中值滤波去噪包括:
301,设置滤波模板,并将滤波模板的中心与人脸图像的像素点位置进行重合;
302,将滤波模板与人脸图像重合区域内的各个对应像素点的灰度值进行排序;
303,获取人脸图像重合区域灰度值的中间值;
304,将中值赋值给模板中心位置的像素点。
中值滤波的去除效果的好坏由滤波模板的中间值确定,所以,该方法的对滤波模板中非中心的极大或极小像素灰度值的敏感度远不如区域内的平均值的敏感度高,所以,中值滤波能够更好的保存人脸图像中的图像纹理。
如图5所示,所述构建人脸姿态中的神经网络从人脸图像的输入输出顺序包括:
输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、全连接层、输出层;
所述输入层将图像预处理后的人脸图像进行输入,将经过预处理后的图片信息转换成矩阵信息输入到神经网络中,方便进行数据处理;
所述第一卷积层、第二卷积层、第三卷积层用于提取人脸图像特征。
所述第一池化层、第二池化层的作用是将卷积计算输出的特征图以及权重值进行压缩,减小数据量,以达到减小过拟合的目的,第一池化层、第二池化层对输入该层的特征图像进行压缩,将图像的大小进行压缩,得到尺寸减小的特征图,并对提取到的特征纹理进行压缩,精简特征值,提取最关键的特征信息,避免过拟合。池化操作有两种方式,一种是平均池化,一种是最大池化,平均池化是将池化滤波器与图像重合,将该区域内的像素灰度值做平均运算,求得该区域内的平均值作为池化结果;最大池化是区域内的像素灰度值中的最大值提取出来作为池化结果。
全连接层的作用是将提取到的特征图进行重构,第三卷积层与全连接层之间的所有神经元都有权重连接,全连接层的目的是为了将经过卷积与池化后得到的特征信息最大化的利用起来并重构成对应的接近源图像的人脸图像。
人脸图像首先通过输入层输入,经过第一卷积层进行函数激励,通过第一池化层缩小特征图大小,压缩精简特征,经过第二卷积层进一步进行函数激励,第二池化层进一步缩小特征图大小,压缩精简特征,通过第三卷积层后,将图像信息输出至全连接层,全连接层对提取到的特征图进行全连接,经过输出层输出生成图像。
所述第一卷积层、第二卷积层、第三卷积层对应的权值初始化值为:
arg min||Y-OWiXi-1||2 (9)
式中,Xi-1是第i层卷积层的输出特征图数据,Wi是第i层的权重,每层的O是一个二进制矩阵,用于将上一层的特征映射的相同位置上的像素相加在一起,使得OWiXi-1与Y大小相同,Y是该输入的人脸侧脸图像对应的人脸正面图像原图像。
所述把分割好的测试局部图像集代入训练好的姿态重建模型,得到预测后的人脸图像局部小块,将人脸图像局部小块组合后生成人脸图像包括:
将各部分小块图像合成人脸图像局部小块图像,其公式为:
式中,ai为初始化局部图像块之间的重构系数,作为一次项xi的参数的初始化值,其表示公式为:γi表示初始化的线性因子,其表示公式为:bi为偏置参数,其初始化值为0。
bi的值根据误差函数进行参数更新而进行参数优化,其误差函数公式为:
式中,是重构之后得到的人脸正面图像,X0是目标人脸正面图像,训练过程也就是是误差函数变小到误差函数最小的过程。
将人脸图像局部小块图像合成人脸图像,其公式为:
在本发明的一个优选的实施例中,在人脸图像数据库中提取5个人,每个人各9个不同的侧面姿态方向,包括左侧4个不同角度,右侧面5个不同角度的人脸图像,一共45幅人脸图像作为本发明的测试集,剩下的图片作为训练集进行训练,首先把训练集的人脸图像的图划分为大小为5*5的小块,每个人脸图像X都划分成32个重叠的小块,该侧脸训练图像可表示为:X=(x1,x2,…,x32),然后,分别利用改进的线性回归算法估计每一个小块对应的正脸部分,X对应的正脸图像为X0=(x1 0,x2 0,…,x32 0)。
根据LLR思想,采用单独局部模块一一对应进行人脸姿态重建,包括以下四个步骤:
(1)初始化局部图像块之间的重构系数αi作为一次项xi的参数的初始化值:
(2)初始化的线性因子γi
(3)将bi初始化为0,在根据误差函数进行参数更新而进行参数优化,最后经过优化之后得到损失函数最小值αi、γi、bi
(4)根据参数更新方法进行网络的参数更新后,得到对应估计正脸小块为:
最后把所有小块拼成一张预测人脸图像:
对应的参数矩阵为:α=(α12,…,α32),γ=(γ12,…,γ32),b=(b1,b2,…,b32)。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (9)

1.一种基于深度神经网络的人脸姿态重建方法,其特征在于,包括:
人脸图像的预处理,将人脸训练样本分成多个局部小块,组成样本局部图像集,所选取人脸图像满足凸显的大小一致、人脸部分位置一致、人脸的概略对齐,消除对人脸图像对姿态重建的影响;
构建人脸姿态中的神经网络,根据改进后的人脸姿态重建关系式,将样本局部图像集代入神经网络,通过神经网络求出关系式的各因子对应参数,确定重建关系式,训练出改进后的姿态重建模型;
把分割好的测试局部图像集代入训练好的姿态重建模型,得到预测后的人脸图像局部小块,将人脸图像局部小块组合后生成人脸图像。
2.根据权利要求1所述的基于深度神经网络的人脸姿态重建方法,其特征在于,所述人脸图像的预处理包括:
采集人脸图像,制作人脸图像库;
采用加权平均法对人脸图像进行灰度化处理;
对灰度化处理后的人脸图像进行几何归一化处理;
采用线性变换方法进行人脸图像的数据归一化处理;
对人脸图像中值滤波去噪。
3.根据权利要求2所述的基于深度神经网络的人脸姿态重建方法,其特征在于,所述采用加权平均法对人脸图像进行灰度化处理包括:
对人脸图像中的RGB分量进行加权平均,得到灰度图像的灰度值,其公式为:
F(x,y)=0.2989R(x,y)+0.5870G(x,y)+0.1140B(x,y) (1)
式中,0.2989,0.5870,0.1140分别为(x,y)位置的像素点R分量、G分量、B分量对应的权值,经过公式(1)得到灰度化后的图像(x,y)位置像素点的灰度值F的大小。
4.根据权利要求2所述的基于深度神经网络的人脸姿态重建方法,其特征在于,所述对灰度化处理后的人脸图像进行几何归一化处理包括:
采用LBP算法的人脸检测训练模型,对模型要训练的人脸图像进行检测,在人脸图像中找到人脸部分的位置,确定人脸区域的准确位置,准确获取人脸部分;
采用AdaBoost算法训练检测眼睛位置,对测试图像进行人眼检测,获得图像上的眼睛区域,作为眼睛精确位置的初步估算;
根据图像平面旋转方法,对人脸图像中选取的某一点位置作为基准点,将人脸图像以基准点为中心进行旋转,将人脸图像进行矫正对齐。
5.根据权利要求2所述的基于深度神经网络的人脸姿态重建方法,其特征在于,所述采用线性变换方法进行人脸图像的数据归一化处理包括:线性函数转换方法、对数函数转换方法、反余切函数转换方法、正态分布化方法、小数定标规范化方法、模糊量化模式方法。
6.根据权利要求2所述的基于深度神经网络的人脸姿态重建方法,其特征在于,所述对人脸图像中值滤波去噪包括:
设置滤波模板,并将滤波模板的中心与人脸图像的像素点位置进行重合;
将滤波模板与人脸图像重合区域内的各个对应像素点的灰度值进行排序;
获取人脸图像重合区域灰度值的中间值;
将中值赋值给模板中心位置的像素点。
7.根据权利要求1所述的基于深度神经网络的人脸姿态重建方法,其特征在于,所述构建人脸姿态中的神经网络从人脸图像的输入输出顺序包括:
输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、全连接层、输出层;
人脸图像首先通过输入层输入,经过第一卷积层进行函数激励,通过第一池化层缩小特征图大小,压缩精简特征,经过第二卷积层进一步进行函数激励,第二池化层进一步缩小特征图大小,压缩精简特征,通过第三卷积层后,将图像信息输出至全连接层,全连接层对提取到的特征图进行全连接,经过输出层输出生成图像。
8.根据权利要求7所述的基于深度神经网络的人脸姿态重建方法,其特征在于,所述第一卷积层、第二卷积层、第三卷积层对应的权值初始化值为:
arg min||Y-OWiXi-1||2 (2)
式中,Xi-1是第i层卷积层的输出特征图数据,Wi是第i层的权重,每层的O是一个二进制矩阵,用于将上一层的特征映射的相同位置上的像素相加在一起,使得OWiXi-1与Y大小相同,Y是该输入的人脸侧脸图像对应的人脸正面图像原图像。
9.根据权利要求1所述的基于深度神经网络的人脸姿态重建方法,其特征在于,所述把分割好的测试局部图像集代入训练好的姿态重建模型,得到预测后的人脸图像局部小块,将人脸图像局部小块组合后生成人脸图像包括:
将各部分小块图像合成人脸图像局部小块图像,其公式为:
式中,ai为初始化局部图像块之间的重构系数,作为一次项xi的参数的初始化值,其表示公式为:γi表示初始化的线性因子,其表示公式为:bi为偏置参数,其初始化值为0。
将人脸图像局部小块图像合成人脸图像,其公式为:
CN201810790966.8A 2018-07-18 2018-07-18 基于深度神经网络的人脸姿态重建方法 Active CN108932536B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810790966.8A CN108932536B (zh) 2018-07-18 2018-07-18 基于深度神经网络的人脸姿态重建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810790966.8A CN108932536B (zh) 2018-07-18 2018-07-18 基于深度神经网络的人脸姿态重建方法

Publications (2)

Publication Number Publication Date
CN108932536A true CN108932536A (zh) 2018-12-04
CN108932536B CN108932536B (zh) 2021-11-09

Family

ID=64447814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810790966.8A Active CN108932536B (zh) 2018-07-18 2018-07-18 基于深度神经网络的人脸姿态重建方法

Country Status (1)

Country Link
CN (1) CN108932536B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109459043A (zh) * 2018-12-12 2019-03-12 上海航天控制技术研究所 一种基于生成式重构图像的航天器相对导航方法
CN109977751A (zh) * 2019-01-16 2019-07-05 上海理工大学 一种基于卷积神经网络的人脸关键点检测方法
CN110110693A (zh) * 2019-05-17 2019-08-09 北京字节跳动网络技术有限公司 用于识别人脸属性的方法和装置
CN110766645A (zh) * 2019-10-24 2020-02-07 西安电子科技大学 基于人物识别与分割的目标人物复现图生成方法
CN111137761A (zh) * 2019-12-27 2020-05-12 恒大智慧科技有限公司 一种人脸识别电梯防误触发方法、装置及存储介质
CN111242078A (zh) * 2020-01-20 2020-06-05 重庆邮电大学 一种基于自注意力机制的人脸正脸化生成方法
CN111260577A (zh) * 2020-01-15 2020-06-09 哈尔滨工业大学 基于多引导图和自适应特征融合的人脸图像复原系统
CN111310730A (zh) * 2020-03-17 2020-06-19 扬州航盛科技有限公司 一种基于人脸表情的驾驶行为预警系统
CN111626087A (zh) * 2019-02-28 2020-09-04 北京市商汤科技开发有限公司 神经网络训练及眼睛睁闭状态检测方法、装置及设备
CN112581356A (zh) * 2020-12-14 2021-03-30 广州岸边网络科技有限公司 一种人像变换的处理方法、装置及存储介质
CN112597847A (zh) * 2020-12-15 2021-04-02 深圳云天励飞技术股份有限公司 人脸姿态估计方法、装置、电子设备和存储介质
CN113191480A (zh) * 2020-01-14 2021-07-30 北京地平线机器人技术研发有限公司 一种用于神经网络的池化方法及装置
TWI770432B (zh) * 2019-02-15 2022-07-11 大陸商北京市商湯科技開發有限公司 圖像復原方法、電子設備、儲存介質

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968775A (zh) * 2012-11-02 2013-03-13 清华大学 基于超分辨率重建技术的低分辨率人脸图像的重建方法
CN103065292A (zh) * 2012-12-26 2013-04-24 武汉大学 一种基于主成份稀疏表达的人脸超分辨率重建方法
CN104077808A (zh) * 2014-07-20 2014-10-01 詹曙 一种用于计算机图形图像处理的、基于深度信息的实时三维人脸建模方法
US9308445B1 (en) * 2013-03-07 2016-04-12 Posit Science Corporation Neuroplasticity games
CN105844605A (zh) * 2016-03-17 2016-08-10 西安电子科技大学 基于自适应表示的人脸画像合成方法
CN106096547A (zh) * 2016-06-11 2016-11-09 北京工业大学 一种面向识别的低分辨率人脸图像特征超分辨率重建方法
CN106548165A (zh) * 2016-11-28 2017-03-29 中通服公众信息产业股份有限公司 一种基于图像分块加权的卷积神经网络的人脸识别方法
CN107463920A (zh) * 2017-08-21 2017-12-12 吉林大学 一种消除局部遮挡物影响的人脸识别方法
US20180199066A1 (en) * 2017-01-11 2018-07-12 Groq, Inc. Multi-pass compression of uncompressed data

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968775A (zh) * 2012-11-02 2013-03-13 清华大学 基于超分辨率重建技术的低分辨率人脸图像的重建方法
CN103065292A (zh) * 2012-12-26 2013-04-24 武汉大学 一种基于主成份稀疏表达的人脸超分辨率重建方法
US9308445B1 (en) * 2013-03-07 2016-04-12 Posit Science Corporation Neuroplasticity games
CN104077808A (zh) * 2014-07-20 2014-10-01 詹曙 一种用于计算机图形图像处理的、基于深度信息的实时三维人脸建模方法
CN105844605A (zh) * 2016-03-17 2016-08-10 西安电子科技大学 基于自适应表示的人脸画像合成方法
CN106096547A (zh) * 2016-06-11 2016-11-09 北京工业大学 一种面向识别的低分辨率人脸图像特征超分辨率重建方法
CN106548165A (zh) * 2016-11-28 2017-03-29 中通服公众信息产业股份有限公司 一种基于图像分块加权的卷积神经网络的人脸识别方法
US20180199066A1 (en) * 2017-01-11 2018-07-12 Groq, Inc. Multi-pass compression of uncompressed data
CN107463920A (zh) * 2017-08-21 2017-12-12 吉林大学 一种消除局部遮挡物影响的人脸识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
C. CASTILLO等: "Wide-Baseline Stereo for Face Recognition with Large Pose Variation", 《COMPUTER SCIENCE CVPR 2011》 *
王科俊 等: "一种快速眼睛定位与人脸平面旋转校正方法", 《计算机辅助设计与图像学学报》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109459043A (zh) * 2018-12-12 2019-03-12 上海航天控制技术研究所 一种基于生成式重构图像的航天器相对导航方法
CN109977751A (zh) * 2019-01-16 2019-07-05 上海理工大学 一种基于卷积神经网络的人脸关键点检测方法
TWI770432B (zh) * 2019-02-15 2022-07-11 大陸商北京市商湯科技開發有限公司 圖像復原方法、電子設備、儲存介質
CN111626087A (zh) * 2019-02-28 2020-09-04 北京市商汤科技开发有限公司 神经网络训练及眼睛睁闭状态检测方法、装置及设备
CN110110693A (zh) * 2019-05-17 2019-08-09 北京字节跳动网络技术有限公司 用于识别人脸属性的方法和装置
CN110766645A (zh) * 2019-10-24 2020-02-07 西安电子科技大学 基于人物识别与分割的目标人物复现图生成方法
CN111137761A (zh) * 2019-12-27 2020-05-12 恒大智慧科技有限公司 一种人脸识别电梯防误触发方法、装置及存储介质
CN113191480A (zh) * 2020-01-14 2021-07-30 北京地平线机器人技术研发有限公司 一种用于神经网络的池化方法及装置
CN111260577A (zh) * 2020-01-15 2020-06-09 哈尔滨工业大学 基于多引导图和自适应特征融合的人脸图像复原系统
CN111260577B (zh) * 2020-01-15 2023-04-18 哈尔滨工业大学 基于多引导图和自适应特征融合的人脸图像复原系统
CN111242078A (zh) * 2020-01-20 2020-06-05 重庆邮电大学 一种基于自注意力机制的人脸正脸化生成方法
CN111310730A (zh) * 2020-03-17 2020-06-19 扬州航盛科技有限公司 一种基于人脸表情的驾驶行为预警系统
CN112581356A (zh) * 2020-12-14 2021-03-30 广州岸边网络科技有限公司 一种人像变换的处理方法、装置及存储介质
CN112581356B (zh) * 2020-12-14 2024-05-07 广州岸边网络科技有限公司 一种人像变换的处理方法、装置及存储介质
CN112597847A (zh) * 2020-12-15 2021-04-02 深圳云天励飞技术股份有限公司 人脸姿态估计方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN108932536B (zh) 2021-11-09

Similar Documents

Publication Publication Date Title
CN108932536A (zh) 基于深度神经网络的人脸姿态重建方法
CN109815893B (zh) 基于循环生成对抗网络的彩色人脸图像光照域归一化的方法
CN110348330B (zh) 基于vae-acgan的人脸姿态虚拟视图生成方法
CN110503680B (zh) 一种基于非监督的卷积神经网络单目场景深度估计方法
US11308587B2 (en) Learning method of generative adversarial network with multiple generators for image denoising
CN109255831B (zh) 基于多任务学习的单视图人脸三维重建及纹理生成的方法
CN108875935B (zh) 基于生成对抗网络的自然图像目标材质视觉特征映射方法
CN110427799B (zh) 基于生成对抗网络的人手深度图像数据增强方法
CN107153816A (zh) 一种用于鲁棒人脸识别的数据增强方法
CN104318569B (zh) 基于深度变分模型的空间显著性区域提取方法
CN107958444A (zh) 一种基于深度学习的人脸超分辨率重建方法
CN111784821B (zh) 三维模型生成方法、装置、计算机设备及存储介质
CN112766160A (zh) 基于多级属性编码器和注意力机制的人脸替换方法
CN108334816A (zh) 基于轮廓对称约束生成式对抗网络的多姿态人脸识别方法
CN110390638A (zh) 一种高分辨率三维体素模型重建方法
CN103208133A (zh) 一种图像中人脸胖瘦的调整方法
CN106886986B (zh) 基于自适应组结构稀疏字典学习的图像融合方法
CN110223370A (zh) 一种从单视点图片生成完整人体纹理贴图的方法
CN109035172A (zh) 一种基于深度学习的非局部均值超声图像去噪方法
JP2023524252A (ja) 生成的非線形人間形状モデル
CN107845065A (zh) 超分辨率图像重建方法和装置
CN112614070B (zh) 一种基于DefogNet的单幅图像去雾方法
CN112288645A (zh) 一种颅骨面貌复原模型构建方法及复原方法与系统
CN115689869A (zh) 一种视频美妆迁移方法及系统
CN113724354A (zh) 基于参考图颜色风格的灰度图像着色方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant