CN110059625B - 一种基于mixup的人脸训练与识别方法 - Google Patents
一种基于mixup的人脸训练与识别方法 Download PDFInfo
- Publication number
- CN110059625B CN110059625B CN201910314170.XA CN201910314170A CN110059625B CN 110059625 B CN110059625 B CN 110059625B CN 201910314170 A CN201910314170 A CN 201910314170A CN 110059625 B CN110059625 B CN 110059625B
- Authority
- CN
- China
- Prior art keywords
- face
- training
- picture
- network
- mixup
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明涉及一种基于mixup的人脸训练与识别方法,属于人工智能领域。该方法包括:S1:网络搭建;S2:人脸特征分类器的训练:构建虚拟训练样本来训练卷积神经网络;S3:人脸识别:包括摄像头的图像采集,人脸检测,人脸图像预处理,特征提取,人脸验证判断。本发明能够减少错误标签的开销,增强对抗样本的鲁棒性,稳定生成对抗网络的训练,最终提高网络训练的准确性,从而提高识别精度。
Description
技术领域
本发明属于人工智能领域,涉及深度学习和人脸识别技术,尤其涉及一种基于mixup的人脸训练与识别方法。
背景技术
现如今人脸识别技术在移动支付、视频监控等多个领域有了广泛的应用,其中应用的深度学习技术也发展迅猛。为了提高人脸识别的准确率以及速率,当前主要有两个改进方向:(1)从改进神经网络结构入手,如增加网络深度和宽度,修改卷积和池化操作和修改激活函数等;(2)增加训练数据样本。大规模深度神经网络虽然具有强大的性能,但是会损耗巨大的内存,以及对对抗样本的敏感性不好。
并且训练神经网络时,一方面损失函数的ERM(经验风险最小化)允许大规模神经网络去记忆(而不是泛化)训练数据。另一方面,神经网络使用ERM方法训练后,在训练分布之外的测试样本上验证时会极大地改变预测结果。因此,ERM方法已不具有良好的解释和泛化性能。
本发明利用了基于mixup的训练方法能减缓这类问题。mixup规范神经网络,增强了训练样本之间的线性表达。
发明内容
有鉴于此,本发明的目的在于提供一种基于mixup的人脸训练与识别方法,减少错误标签的开销,增强对抗样本的鲁棒性,稳定生成对抗网络的训练,最终提高网络训练的准确性,从而提高识别精度。
为达到上述目的,本发明提供如下技术方案:
一种基于mixup的人脸训练与识别方法,包括以下步骤:
S1:网络搭建;
S2:人脸特征分类器的训练:构建虚拟训练样本来训练卷积神经网络;
S3:人脸识别:包括摄像头的图像采集,人脸检测,人脸图像预处理,特征提取,人脸验证判断。
进一步,步骤S2中,构建虚拟训练样本具体为:
其中,xi表示第i个样本图片,yi表示第i个样本图片的标签,代表训练网络的实际输入,代表网络的期望输出;且λ~Beta(α,α),mixup超参数α∈(0,∞);λ的值满足于Beta分布,是一种概率分布,使得在(0,1)上分布的概率密度积分等于1。
进一步,步骤S2中,所述人脸特征分类器的训练具体包括以下步骤:
S21:将卷积神经网络进行参数权值的初始化;
S23:输入数据经过卷积层、池化层、全连接层等前向传播得到实际网络输出值y;
S25:当误差超出允许范围时,将误差传回网络中,利用随机梯度下降法,依次求得全连接层、池化层、卷积层的参数误差,对网络参数进行权值更新,然后在转至步骤S22继续训练;当误差在允许范围内时,结束训练,保存参数。
进一步,步骤S3中,所述人脸识别具体包括以下步骤:
S31:摄像头视频读取:使用摄像头采集图片,将采集到的图片解析,并将其传输到系统中;
S32:人脸检测:对采集的图片进行人脸检测,如果判断有人脸,则转至步骤S33,若没有则继续采集图片;
S33:人脸图片预处理:对步骤S32的采集的人脸图片进行预处理,将人脸图片剪裁为统一大小,为卷积神经网络的特征提取做准备,将其转化为灰度图,是为了减少计算量,人脸对齐;
S34:特征提取:将步骤S33预处理好的人脸图片使用训练好的人脸特征分类器进行特征提取;整个提取过程,使用BP算法的前向计算过程,对比网络的训练,它少了后向梯度更新过程,所以计算量大大减少;
S35:特征验证:将步骤S34中提取的人脸特征向量与存储在人脸特征数据库中的特征向量进行相似度计算,判断人物身份。
进一步,所述步骤S32中,采用机器学习库Dlib自带的frontal_face_detector来实现快速人脸检测。
进一步,所述步骤S33中,采用的opencv中自带的对齐算法进行人脸对齐映射。
本发明的有益效果在于:本发明训练的分类器在图片数据集上的卷积神经网络上实现,提高了其表现性能;在光照、背景、表情等干扰下达到的识别精度比现有方法的识别精度更高。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为人脸特征分类器的训练流程图;
图2为人脸识别流程图;
图3为神经网络训练时的实际输入效果图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
训练数据集和预处理:本实施例采用CASIA-Webface人脸数据集,包含有黄种人、白种人和黑种人。CASIA-Webface:该数据集是中科院自动化研究所建立的大型人脸图片库,图库包含了10575个人,共有494414张人脸图片,人均图片数量达到了46张。CASIA-Webface人脸库的总量和人数都十分的丰富,在多分类问题上,使用更多的类别数的数据训练可以让网络的泛化能力增强,更好的区分出不同人脸的特征差异,网络的识别精度就会更高。
网络训练中,不直接使用CASIA-WebFace人脸库中的图片整张作为输入,而是将处理后的图片进行了局部裁剪,裁剪尺度为64*64,然后对图片中不同部分进行取样,获得更多的实验样本,从而增加样中背景和人脸位置的差异,使得模型对背景的改变和人脸位子的更换变得不敏感,进而提升模型的泛化能力。
本发明所述的一种基于mixup的人脸训练与识别方法,包括以下步骤:
步骤一:搭建Resnet-18网络,本发明选用经典的Resnet-18结构作为深度学习的神经网络,其包括多个卷积层、池化层、全连接层等和softmax输出层。
步骤二:训练该网络:利用CASIA-Webface人脸数据库并结合mixup数据整合方法训练搭建好的Resnet-18神经网络。基于mixup卷积神经网络的人脸特征分类器的训练过程:
mixup从真实样本中构建了虚拟的训练样本:
其中,(xi,yi)和(xj,yj)是从训练样本数据中通过随机抽取而得,且λ~Beta(α,α),α∈(0,∞)。因此,mixup是通过结合先验知识,即样本特征向量的线性插值同时应导致相关标签的线性插值,来扩展训练分布。mixup仅需要几行代码即可实现,且花费计算开销较小。mixup超参数α控制了在特征与目标向量之间插值的强度,当α→0时恢复为原始样本输入的规则。
本实施中使用的网络是Resnet-18。对于mixup(混合),将α设置为默认值1,表示λ会在0和1之间进行均匀采样;训练200个迭代;学习率为0.1(ITER 1-100)、0.01(ITER 101-150)和0.001(ITER 151-200);批量大小为128。
卷积神经网络的训练过程分为两个阶段。第一个阶段是数据由低层次向高层次传播的阶段,即前向传播阶段。另外一个阶段是,将当前向传播得出的结果与预期结果进行误差计算(损失函数的计算--LOSS),将误差从高层次向底层次进行传播训练的阶段,即反向传播阶段。训练过程如图1所示。训练过程为:
1)将卷积神经网络进行参数权值的初始化;
3)输入数据经过卷积层、池化层、全连接层等前向传播得到实际网络输出值y;
5)当误差超出允许范围时,将误差传回网络中,利用随机梯度下降法,依次求得全连接层、池化层、卷积层的参数误差,对网络参数进行权值更新,然后在转至步骤2)继续训练;当误差在允许范围内时,结束训练,保存参数。
步骤三:在线人脸识别流程:系统的人脸识别流程如图2所示,主要包括以下几个模块:摄像头的图像采集,人脸检测,人脸图像预处理,特征提取,人脸验证判断。这些模块按照顺序构成了一个完整的人脸识别流程:
1)摄像头视频读取:使用摄像头采集图片,将采集到的图片解析,并将其传输到系统中;
2)人脸检测:采用的人脸检测器是机器学习库Dlib自带的frontal_face_detector来实现快速人脸检测,对采集的图片进行人脸检测,如果判断有人脸,则转至步骤1),若没有则继续采集图片;
3)人脸图片预处理:对步骤2)的采集的人脸图片进行预处理,将人脸图片剪裁为统一大小,为卷积神经网络的特征提取做准备,将其转化为灰度图,是为了减少计算量,人脸对齐采用的是opencv中自带的对齐算法进行人脸对齐映射;
4)特征提取:将步骤3)预处理好的人脸图片使用训练好的人脸特征分类器进行特征提取;整个提取过程,使用BP算法的前向计算过程,对比网络的训练,它少了后向梯度更新过程,所以计算量大大减少;
5)特征验证:将步骤4)中提取的人脸特征向量与存储在人脸特征数据库中的特征向量进行相似度计算(Cosino计算相似度),判断人物身份。
如图3所示,假设λ=0.5,按各50%的比例将人脸1和人脸2两张图通过mixup混合到一起,用混合好的样图去训练,最终希望判断结果为50%可能是人脸1以及50%可能是人脸2。
本发明训练的分类器在LFW人脸数据集上验证,在一定程度上提高了识别性能。在光照、背景、表情等干扰下达到的识别精度比当前的方法有了一定的提升。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (4)
1.一种基于mixup的人脸训练与识别方法,其特征在于,该方法包括以下步骤:
S1:网络搭建;
S2:人脸特征分类器的训练:构建虚拟训练样本来训练卷积神经网络;
步骤S2中,构建虚拟训练样本具体为:
其中,xi表示第i个样本图片,yi表示第i个样本图片的标签,代表训练网络的实际输入,代表网络的期望输出;且λ~Beta(α,α),mixup超参数α∈(0,∞);λ的值满足于Beta分布,是一种概率分布,使得在(0,1)上分布的概率密度积分等于1;
步骤S2中,所述人脸特征分类器的训练具体包括以下步骤:
S21:将卷积神经网络进行参数权值的初始化;
S23:输入数据经过卷积层、池化层和全连接层的前向传播最终得到实际网络输出值y;
S25:当误差超出允许范围时,将误差传回网络中,利用随机梯度下降法,依次求得全连接层、池化层、卷积层的参数误差,对网络参数进行权值更新,然后在转至步骤S22继续训练;当误差在允许范围内时,结束训练,保存参数;
S3:人脸识别:包括摄像头的图像采集,人脸检测,人脸图像预处理,特征提取,人脸验证判断。
2.根据权利要求1所述的一种基于mixup的人脸训练与识别方法,其特征在于,步骤S3中,所述人脸识别具体包括以下步骤:
S31:摄像头视频读取:使用摄像头采集图片,将采集到的图片解析,并将其传输到系统中;
S32:人脸检测:对采集的图片进行人脸检测,如果判断有人脸,则转至步骤S33,若没有则继续采集图片;
S33:人脸图片预处理:对步骤S32的采集的人脸图片进行预处理,将人脸图片剪裁为统一大小,将其转化为灰度图,人脸对齐;
S34:特征提取:将步骤S33预处理好的人脸图片使用训练好的人脸特征分类器进行特征提取;
S35:特征验证:将步骤S34中提取的人脸特征向量与存储在人脸特征数据库中的特征向量进行相似度计算,判断人物身份。
3.根据权利要求2所述的一种基于mixup的人脸训练与识别方法,其特征在于,所述步骤S32中,采用机器学习库Dlib自带的frontal_face_detector来实现人脸快速检测。
4.根据权利要求2所述的一种基于mixup的人脸训练与识别方法,其特征在于,所述步骤S33中,采用opencv中自带的对齐算法进行人脸对齐映射。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910314170.XA CN110059625B (zh) | 2019-04-18 | 2019-04-18 | 一种基于mixup的人脸训练与识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910314170.XA CN110059625B (zh) | 2019-04-18 | 2019-04-18 | 一种基于mixup的人脸训练与识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110059625A CN110059625A (zh) | 2019-07-26 |
CN110059625B true CN110059625B (zh) | 2023-04-07 |
Family
ID=67319510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910314170.XA Active CN110059625B (zh) | 2019-04-18 | 2019-04-18 | 一种基于mixup的人脸训练与识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110059625B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275020A (zh) * | 2020-03-12 | 2020-06-12 | 青梧桐有限责任公司 | 一种房间状态识别方法 |
CN111553191A (zh) * | 2020-03-30 | 2020-08-18 | 深圳壹账通智能科技有限公司 | 基于人脸识别的视频分类方法、装置及存储介质 |
CN111340008B (zh) * | 2020-05-15 | 2021-02-19 | 支付宝(杭州)信息技术有限公司 | 对抗补丁生成、检测模型训练、对抗补丁防御方法及系统 |
CN112101467A (zh) * | 2020-09-17 | 2020-12-18 | 哈尔滨理工大学 | 一种基于深度学习的高光谱图像分类方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6982723B1 (en) * | 1998-08-30 | 2006-01-03 | Gmd-Forschungszentrum Informationstechnik Gmbh | Method and apparatus for eliminating unwanted steps at edges in graphic representations in the line raster |
CN105512624A (zh) * | 2015-12-01 | 2016-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种人脸图像的笑脸识别方法及其装置 |
CN107977932A (zh) * | 2017-12-28 | 2018-05-01 | 北京工业大学 | 一种基于可鉴别属性约束生成对抗网络的人脸图像超分辨率重建方法 |
CN108304826A (zh) * | 2018-03-01 | 2018-07-20 | 河海大学 | 基于卷积神经网络的人脸表情识别方法 |
CN109165566A (zh) * | 2018-08-01 | 2019-01-08 | 中国计量大学 | 一种基于新型损失函数的人脸识别卷积神经网络训练方法 |
CN109272045A (zh) * | 2018-09-25 | 2019-01-25 | 华南农业大学 | 一种基于神经网络和迁移学习的水果图像分类方法及装置 |
CN109359608A (zh) * | 2018-10-25 | 2019-02-19 | 电子科技大学 | 一种基于深度学习模型的人脸识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230145545A (ko) * | 2013-04-07 | 2023-10-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 개인맞춤화 신생물 백신을 위한 조성물 및 방법 |
-
2019
- 2019-04-18 CN CN201910314170.XA patent/CN110059625B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6982723B1 (en) * | 1998-08-30 | 2006-01-03 | Gmd-Forschungszentrum Informationstechnik Gmbh | Method and apparatus for eliminating unwanted steps at edges in graphic representations in the line raster |
CN105512624A (zh) * | 2015-12-01 | 2016-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种人脸图像的笑脸识别方法及其装置 |
CN107977932A (zh) * | 2017-12-28 | 2018-05-01 | 北京工业大学 | 一种基于可鉴别属性约束生成对抗网络的人脸图像超分辨率重建方法 |
CN108304826A (zh) * | 2018-03-01 | 2018-07-20 | 河海大学 | 基于卷积神经网络的人脸表情识别方法 |
CN109165566A (zh) * | 2018-08-01 | 2019-01-08 | 中国计量大学 | 一种基于新型损失函数的人脸识别卷积神经网络训练方法 |
CN109272045A (zh) * | 2018-09-25 | 2019-01-25 | 华南农业大学 | 一种基于神经网络和迁移学习的水果图像分类方法及装置 |
CN109359608A (zh) * | 2018-10-25 | 2019-02-19 | 电子科技大学 | 一种基于深度学习模型的人脸识别方法 |
Non-Patent Citations (6)
Title |
---|
Weakly Supervised Learning of Single-Cell Feature Embeddings;Juan C. Caicedo等;《2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition》;20181216;9309-9318 * |
基于注意力机制的三维超声影像的多尺度目标识别的研究;王晓东;《中国优秀硕士学位论文全文数据库信息科技辑》;20190215(第2期);I138-1869 * |
基于深度学习的细粒度图像分类研究;唐文博;《中国优秀硕士学位论文全文数据库信息科技辑》;20190115(第1期);I138-3127 * |
面向云-端融合的移动互联网应用运行平台;黄罡等;《中国科学:信息科学》;20130120(第01期);28-48 * |
面向自动驾驶的语义分割和目标检测技术;郭继舜;《中国优秀硕士学位论文全文数据库信息科技辑》;20180915(第9期);I140-22 * |
面向迎宾机器人的人脸跟踪系统研究与实现;张云福;《中国优秀硕士学位论文全文数据库信息科技辑》;20210115(第1期);I138-915 * |
Also Published As
Publication number | Publication date |
---|---|
CN110059625A (zh) | 2019-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059625B (zh) | 一种基于mixup的人脸训练与识别方法 | |
CN109165664B (zh) | 一种基于生成对抗网络的属性缺失数据集补全与预测方法 | |
CN111950453B (zh) | 一种基于选择性注意力机制的任意形状文本识别方法 | |
CN110223324B (zh) | 一种基于鲁棒特征表示的孪生匹配网络的目标跟踪方法 | |
CN110443143B (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
CN109800648B (zh) | 基于人脸关键点校正的人脸检测识别方法及装置 | |
CN110287800B (zh) | 一种基于sgse-gan的遥感图像场景分类方法 | |
CN112507793A (zh) | 一种超短期光伏功率预测方法 | |
CN112329760B (zh) | 基于空间变换网络端到端印刷体蒙古文识别翻译的方法 | |
CN112580590A (zh) | 一种基于多语义特征融合网络的指静脉识别方法 | |
CN110246181A (zh) | 基于锚点的姿态估计模型训练方法、姿态估计方法和系统 | |
CN112651262A (zh) | 一种基于自适应行人对齐的跨模态行人重识别方法 | |
CN112084895B (zh) | 一种基于深度学习的行人重识别方法 | |
CN114399757A (zh) | 多路并行位置关联网络的自然场景文本识别方法及系统 | |
CN116206185A (zh) | 一种基于改进YOLOv7的轻量级小目标检测方法 | |
CN111709443B (zh) | 一种基于旋转不变卷积神经网络的书法字风格分类方法 | |
CN113312989B (zh) | 一种基于聚合描述子与注意力的指静脉特征提取网络 | |
CN114267060A (zh) | 基于不确定抑制网络模型的人脸年龄识别方法及系统 | |
CN117274627A (zh) | 一种基于图像转换的多时相积雪遥感图像匹配方法及系统 | |
CN111695450A (zh) | 一种基于IMobileNet的人脸快速识别方法 | |
CN115984924A (zh) | 一种基于类脑技术的自然场景下的表情识别方法 | |
CN113283423B (zh) | 基于生成网络的自然场景扭曲文本图像矫正方法及系统 | |
CN114495170A (zh) | 一种基于局部抑制自注意力的行人重识别方法及系统 | |
CN111046861B (zh) | 识别红外影像的方法、构建识别模型的方法及应用 | |
CN113705731A (zh) | 一种基于孪生网络的端到端图像模板匹配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |