CN109886160B - 一种非限定条件下的人脸识别方法 - Google Patents
一种非限定条件下的人脸识别方法 Download PDFInfo
- Publication number
- CN109886160B CN109886160B CN201910091792.0A CN201910091792A CN109886160B CN 109886160 B CN109886160 B CN 109886160B CN 201910091792 A CN201910091792 A CN 201910091792A CN 109886160 B CN109886160 B CN 109886160B
- Authority
- CN
- China
- Prior art keywords
- face
- layer
- network
- feature
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明提供一种非限定条件下的人脸识别方法,包括如下步骤:S1)图像预处理;S2)人脸特征提取;S3)SVD权值分解操作;S4)人脸识别网络前向传播;S5)人脸识别。本发明的优点为:算法中适当地增加inception结构,可增加网络的宽度和深度,使模型可以提取到不同尺度的、更丰富、更鲁棒的人脸特征。本发明的算法可以使用小规模的数据训练达到大规模数据下训练得到的模型的相差无几的识别效果。
Description
技术领域
本发明涉及计算机视觉中的智能视频监控技术领域,具体涉及一种非限定条件下的人脸识别方法。
背景技术
在大型的视频监控场所,如地铁站、广场、机场等,对于监控系统中的人脸进行识别,非限定条件下的人脸的特征匹配是一个关键步骤。对于这种非限定条件下的人脸识别的数据非常的有限,目前应用较广的人脸识别算法都是在公开的大规模数据集上训练得到的。对于这种非限定条件下的人脸识别采用上述算法进行识别,识别效果较差。
发明内容
本发明的目的是提供一种基于深度卷积神经网络、可大大提高人脸匹配速度及效率的非限定条件下的人脸识别方法。
为了达到上述目的,本发明通过以下技术方案来实现:
一种非限定条件下的人脸识别方法,包括如下步骤:
S1)图像预处理
提取多个摄像头下拍摄的人脸图像,将人脸图像按每个人分类并赋标签,标签的取值为[0,…,m],m为所有人数减1;
将所有人脸图像重新采样到大小为224×224像素并减去ImageNet均值(104,117,123),随机打乱图像,将图像转换成适用于Caffe框架的lmdb数据存储结构;
S2)人脸特征提取
以VGG-Face作为卷积层提取特征,删除最后的全连接层,增加inception结构,inception结构包括inception v2结构和inception v3结构;inception v2将两个3*3的卷积代替5*5的大卷积,inception v3将一个大的卷积拆分成多个小的卷积;添加两个全连接层,在最后一层输出增加分类损失函数softmaxloss();
从预处理好的图像中选取n个训练样本,作为卷积神经网络第一层的感知节点,将人工标注的训练样本通过网络数据层输入到网络中进行训练;
随机初始化卷积核的参数,将卷积核与每张图像进行卷积,得出的特征映射图再输入到之后的其他层,采用随机梯度下降算法优化网络权重,训练网络模型直到收敛;
S3)SVD权值分解操作
网络模型最后的全连接层分别为fc7层和fc8层,fc7层提取的特征用来计算人脸之间的距离,特征维度为4096,fc8层提取的特征为人脸分类的类别数,类别数为2262;
S3-1)将fc7层的权重进行分解,公式为W=USVT;其中,用US代替W,然后用WWT的特征向量代替权重;
S3-2)固定fc7的参数不变,用同样的训练集继续fine-tune直至收敛;
S3-3)不固定fc7的参数不变,用同样的训练集继续fine-tune直至收敛;
S3-4)重复S3-1)至S3-3);
S4)人脸识别网络前向传播
读取视频图像序列中的视频帧,将视频帧图像送入训练好的人脸检测网络模型中进行前向传播操作,将检测到的人脸图像做预处理后输入到人脸识别网络中,取倒数第二个全连接层,即fc7层的输出向量f=[f1,f2,…,fn]作为每个图像的特征值,n为特征向量的维数;
S5)人脸识别
采用余弦相似度作为特征相似度,采用两个特征向量夹角的余弦值作为衡量两个人脸差异大小的度量;
本发明与现有技术相比,具有以下优点:
本发明一种非限定条件下的人脸识别方法,是一种基于深度卷积神经网络的、适用于人脸卡口相机及各类视频监控的人脸识别算法。算法中适当地增加inception结构,可增加网络的宽度和深度,使模型可以提取到不同尺度的、更丰富、更鲁棒的人脸特征。本发明的算法可以使用小规模的数据训练达到大规模数据下训练得到的模型的相差无几的识别效果。
与传统的神经网络相比,深度卷积神经网络克服了网络层数较少的问题,通过对特征进行逐层变换,获得更加抽象的特征表达,并且将目标分类作为网络的最后输出层实现,大大提高了人脸匹配的速度和效率。本发明的效果和速度均可达到state-of-art级别。
如果还想提升模型的泛化能力,可以通过增量学习方法,再使用上述方法进行训练,以获得更好的特征提取的模型。
附图说明
图1是本发明一种非限定条件下的人脸识别方法的流程示意图。
图2是本发明一种非限定条件下的人脸识别方法的人脸识别网络结构示意图。
具体实施方式
下面结合附图,对本发明的实施例作进一步详细的描述。
一种非限定条件下的人脸识别方法,包括如下步骤:
S1)图像预处理
提取多个摄像头下拍摄的人脸图像,将人脸图像按每个人分类并赋标签,同一个人给相同的标签,标签的取值范围为[0,…,m],m为所有人数减1;
将所有人脸图像重新采样到大小为224×224像素,每个像素的取值都是在0-255之间,每个通道上的像素值都减去ImageNet上图片均值,R、G、B三个通道上对应的均值分别为104、117、123,随机打乱图像,将图像转换成适用于Caffe框架的lmdb数据存储结构。
S2)人脸特征提取
以VGG-Face作为卷积层提取特征,VGG的前四层中,每一层都是经过卷积、激活和池化,每经过一层,feature map的大小都减少一半,通道数增加,第五层只进行了卷积操作,输出的feature map大小为14x14,然后删除VGG最后的全连接层,增加inception结构,inception结构包括inception v2结构和inception v3结构;inception v2将两个3*3的卷积代替5*5的大卷积,在减少参数的同时建立更多的非线性变换,使得卷积神经网络对特征的学习能力更强;inception v3将一个大的卷积拆分成多个小的卷积,使得网络深度进一步增加,增加网络的非线性。例如经典的v3结构将7*7的卷积被分成1*7卷积和7*1卷积,或者将3*3卷积拆成1*3卷积和3*1卷积;一方面,节约了大量参数,参数的减少加速了运算,并一定程度上减轻了过拟合现象,同时,增加了非线性扩展,提高了网络模型的表达能力,提升泛化能力;这种将对称的卷积核拆分成非对称的结构增加了提取的特征的多样性,这样的卷积结构可以处理更丰富的空间特征;我们在网络中大量地使用了1*1的卷积,因为1*1的卷积可以实现特征图之间的跨通道交互和信息整合,还可以进行卷积核通道数的降维和升维,同时也相应减少了网络参数;
添加两个全连接层,在最后一层输出增加分类损失函数softmaxloss();
从预处理好的图像中选取n个训练样本,作为卷积神经网络第一层的感知节点,将人工标注的训练样本通过网络数据层输入到网络中进行训练,训练数据包含图像以及图像中所有人脸的id信息;
随机初始化卷积核的参数,将卷积核与每张图像进行卷积,得出的特征映射图再输入到之后的其他层,采用随机梯度下降算法优化网络权重,训练网络模型直到收敛。
S3)SVD权值分解操作
网络中的全连接层是以向量内积形式进行特征的相似性度量或者说分类,全连接层的权重之间存在相关性的,训练出来的特征也是有相关性的,而在特征匹配的普遍测试中是以欧式距离进行相似性度量的,因此存在一定的误差。为了去除特征之间的相关性,我们使用全连接权重分解方法继续fine-tune。具体分解和训练方法如下:
网络模型最后的全连接层分别为fc7层和fc8层,fc7层提取的特征用来计算人脸之间的距离,特征维度为4096;fc8层提取的特征为人脸分类的类别数,类别数为2262;
S3-1)在训练至收敛的网络模型中,为了去除特征之间的相关性,提高分类效果,将fc7层的权重进行分解,公式为W=USVT;其中,用US代替W,然后用WWT的特征向量代替权重,W是fc7层的权重矩阵,任意一个nxm的实矩阵W都可以分解成USVT,U是nxn的标准正交矩阵,V是mxm的标准正交矩阵,S是nxm的对角矩阵,T是转置符号;
S3-2)固定权值分解后的fc7的参数不变,用同样的训练集继续微调网络参数直至收敛;
S3-3)不固定fc7的参数不变,用同样的训练集继续微调网络参数直至收敛;
S3-4)重复S3-1)至S3-3)6次;
S4)人脸识别网络(NCCFR)前向传播
读取视频图像序列中的视频帧,将视频帧图像送入训练好的人脸检测网络模型中进行前向传播操作,将检测到的人脸图像做预处理后输入到人脸识别网络中,取倒数第二个全连接层,即fc7层的输出向量f=[f1,f2,…,fn]作为每个图像的特征值,n为特征向量的维数,n=4096;
S5)人脸识别
采用余弦相似度作为特征相似度,采用两个特征向量夹角的余弦值作为衡量两个人脸差异大小的度量;
以上所述仅是本发明优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明构思的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明保护范围内。
Claims (1)
1.一种非限定条件下的人脸识别方法,其特征在于包括如下步骤:
S1)图像预处理
提取多个摄像头下拍摄的人脸图像,将人脸图像按每个人分类并赋标签,标签的取值为[0,…,m],m为所有人数减1;
将所有人脸图像重新采样到大小为224×224像素,每个像素的取值都是在0-255之间,每个通道上的像素值都减去ImageNet上图片均值,R、G、B三个通道上对应的均值分别为104、117、123,随机打乱图像,将图像转换成适用于Caffe框架的lmdb数据存储结构;
S2)人脸特征提取
以VGG-Face作为卷积层提取特征,VGG的前四层中,每一层都是经过卷积、激活和池化,每经过一层,feature map的大小都减少一半,通道数增加,第五层只进行了卷积操作,输出的feature map大小为14x14,然后删除VGG最后的全连接层,增加inception结构,inception结构包括inception v2结构和inception v3结构;inception v2将两个3*3的卷积代替5*5的大卷积,inception v3将一个大的卷积拆分成多个小的卷积;
添加两个全连接层,在最后一层输出增加分类损失函数softmaxloss();
从预处理好的图像中选取n个训练样本作为卷积神经网络第一层的感知节点,将人工标注的训练样本输入到网络中进行迭代训练;
随机初始化卷积核的参数,将卷积核与每张图像进行卷积,得出的特征映射图再输入到之后的其他层,采用随机梯度下降算法优化网络权重,训练网络模型直到收敛;
S3)SVD权值分解操作
网络模型最后的全连接层分别为fc7层和fc8层,fc7层提取的特征用来计算人脸之间的距离,特征维度为4096,fc8层提取的特征为人脸分类的类别数,类别数为2262;
S3-1)将fc7层的权重进行分解,公式为W=USVT;其中,用US代替W,然后用WWT的特征向量代替权重,W是fc7层的权重矩阵,任意一个nxm的实矩阵W都可以分解成USVT,U是nxn的标准正交矩阵,V是mxm的标准正交矩阵,S是nxm的对角矩阵,T是转置符号;
S3-2)固定fc7的参数不变,用同样的训练集继续微调网络参数直至收敛;
S3-3)不固定fc7的参数不变,用同样的训练集继续微调网络参数直至收敛;
S3-4)重复S3-1)至S3-3);
S4)人脸识别网络前向传播
读取视频图像序列中的视频帧,将视频帧图像送入训练好的人脸检测网络模型中进行前向传播操作,将检测到的人脸图像做预处理后输入到人脸识别网络中,取倒数第二个全连接层,即fc7层的输出向量f=[f1,f2,…,fn]作为每个图像的特征值,n为特征向量的维数;
S5)人脸识别
采用余弦相似度作为特征相似度,采用两个特征向量夹角的余弦值作为衡量两个人脸差异大小的度量;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910091792.0A CN109886160B (zh) | 2019-01-30 | 2019-01-30 | 一种非限定条件下的人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910091792.0A CN109886160B (zh) | 2019-01-30 | 2019-01-30 | 一种非限定条件下的人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109886160A CN109886160A (zh) | 2019-06-14 |
CN109886160B true CN109886160B (zh) | 2021-03-09 |
Family
ID=66927426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910091792.0A Active CN109886160B (zh) | 2019-01-30 | 2019-01-30 | 一种非限定条件下的人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109886160B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110490892A (zh) * | 2019-07-03 | 2019-11-22 | 中山大学 | 一种基于USFaster R-CNN的甲状腺超声图像结节自动定位识别方法 |
CN110866470A (zh) * | 2019-10-31 | 2020-03-06 | 湖北工程学院 | 一种基于随机图像特征的人脸防伪检测方法 |
CN113947802B (zh) * | 2021-12-21 | 2022-04-01 | 武汉天喻信息产业股份有限公司 | 有遮挡人脸识别方法、装置、设备及可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105913025A (zh) * | 2016-04-12 | 2016-08-31 | 湖北工业大学 | 一种基于多特征融合的深度学习人脸识别方法 |
CN107977707A (zh) * | 2017-11-23 | 2018-05-01 | 厦门美图之家科技有限公司 | 一种对抗蒸馏神经网络模型的方法及计算设备 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103400114A (zh) * | 2013-07-18 | 2013-11-20 | 上海交通大学 | 针对人脸识别的光照归一化处理系统 |
US10068171B2 (en) * | 2015-11-12 | 2018-09-04 | Conduent Business Services, Llc | Multi-layer fusion in a convolutional neural network for image classification |
CN106127297B (zh) * | 2016-06-02 | 2019-07-12 | 中国科学院自动化研究所 | 基于张量分解的深度卷积神经网络的加速与压缩方法 |
US11157814B2 (en) * | 2016-11-15 | 2021-10-26 | Google Llc | Efficient convolutional neural networks and techniques to reduce associated computational costs |
CN107368886B (zh) * | 2017-02-23 | 2020-10-02 | 奥瞳系统科技有限公司 | 基于重复使用小规模卷积神经网络模块的神经网络系统 |
US10713540B2 (en) * | 2017-03-07 | 2020-07-14 | Board Of Trustees Of Michigan State University | Deep learning system for recognizing pills in images |
CN107506717B (zh) * | 2017-08-17 | 2020-11-27 | 南京东方网信网络科技有限公司 | 无约束场景中基于深度变换学习的人脸识别方法 |
CN108509978B (zh) * | 2018-02-28 | 2022-06-07 | 中南大学 | 基于cnn的多级特征融合的多类目标检测方法及模型 |
CN108921037B (zh) * | 2018-06-07 | 2022-06-03 | 四川大学 | 一种基于BN-inception双流网络的情绪识别方法 |
-
2019
- 2019-01-30 CN CN201910091792.0A patent/CN109886160B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105913025A (zh) * | 2016-04-12 | 2016-08-31 | 湖北工业大学 | 一种基于多特征融合的深度学习人脸识别方法 |
CN107977707A (zh) * | 2017-11-23 | 2018-05-01 | 厦门美图之家科技有限公司 | 一种对抗蒸馏神经网络模型的方法及计算设备 |
Non-Patent Citations (2)
Title |
---|
"Deep Learning Models for Facial Expression Recognition";A. Sajjanhar 等;《2018 Digital Image Computing: Techniques and Applications (DICTA)》;20181213;1-6 * |
"面向人脸识别的深度学习技术研究及应用";曲直;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190115(第1期);I138-2308 * |
Also Published As
Publication number | Publication date |
---|---|
CN109886160A (zh) | 2019-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110443143B (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
CN107341452B (zh) | 基于四元数时空卷积神经网络的人体行为识别方法 | |
Chen et al. | Data-free learning of student networks | |
CN113221641B (zh) | 基于生成对抗网络和注意力机制的视频行人重识别方法 | |
CN109886160B (zh) | 一种非限定条件下的人脸识别方法 | |
Chen et al. | Dictionary learning from ambiguously labeled data | |
CN112001278A (zh) | 一种基于结构化知识蒸馏的人群计数模型及其方法 | |
CN104077742B (zh) | 基于Gabor特征的人脸素描合成方法及系统 | |
CN115100709B (zh) | 一种特征分离的图像人脸识别与年龄估计方法 | |
CN105631469A (zh) | 一种多层稀疏编码特征的鸟类图像识别方法 | |
CN110188827A (zh) | 一种基于卷积神经网络和递归自动编码器模型的场景识别方法 | |
CN105868711B (zh) | 一种基于稀疏低秩的人体行为识别方法 | |
Ye et al. | Ground-based cloud image categorization using deep convolutional visual features | |
Liu et al. | Ground-based remote sensing cloud classification via context graph attention network | |
CN112257741A (zh) | 一种基于复数神经网络的生成性对抗虚假图片的检测方法 | |
Kliangsuwan et al. | Feature extraction techniques for ground-based cloud type classification | |
CN113505719B (zh) | 基于局部-整体联合知识蒸馏算法的步态识别模型压缩系统及方法 | |
CN105718858B (zh) | 一种基于正负广义最大池化的行人识别方法 | |
CN116543192A (zh) | 一种基于多视角特征融合的遥感图像小样本分类方法 | |
CN116091946A (zh) | 一种基于YOLOv5的无人机航拍图像目标检测方法 | |
CN113963421B (zh) | 基于混合特征增强网络的动态序列非约束表情识别方法 | |
CN115578599A (zh) | 一种基于超像素-超图特征增强网络的极化sar图像分类方法 | |
CN113449751B (zh) | 基于对称性和群论的物体-属性组合图像识别方法 | |
CN114780767A (zh) | 一种基于深度卷积神经网络的大规模图像检索方法及系统 | |
Sánchez et al. | Robust multiband image segmentation method based on user clues |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |