CN106599864A - 一种基于极值理论的深度人脸识别方法 - Google Patents
一种基于极值理论的深度人脸识别方法 Download PDFInfo
- Publication number
- CN106599864A CN106599864A CN201611189169.1A CN201611189169A CN106599864A CN 106599864 A CN106599864 A CN 106599864A CN 201611189169 A CN201611189169 A CN 201611189169A CN 106599864 A CN106599864 A CN 106599864A
- Authority
- CN
- China
- Prior art keywords
- training
- value
- extreme value
- face
- method based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Abstract
本发明是一种基于极值理论的深度人脸识别方法,包括通过深度卷积神经网络对训练人脸图像进行特征提取,对提取的特征进行SVM分类训练,得到决策面,通过深度卷积神经网络对测试人脸图像进行特征提取,结合分类训练得到的决策面进行预测,得到决策值,基于极值理论对决策值进行统计分析得出预测结果。该方法只需每个人脸类具有极少量的训练样本,能够适应实际应用中人脸在很大范围内的光照、姿态、表情、遮挡等变化,能够有效区分陌生人脸,识别率高。同时该方法训练效率高,能够适应实际应用中对增量学习的需求。
Description
技术领域
本发明属于人工智能与图像处理领域,涉及一种人脸图像的识别方法,特别是基于极值理论进行统计分析,设置预测阈值,然后输出识别结果。
背景技术
对任意一个识别系统,主要目标是最优化识别性能。对于普通的人脸识别,不希望陌生人脸被误认为人脸库中的已知人脸,同样不希望本该被识别的库中的已知人脸被误认为陌生人脸。极值理论作为视觉应用预测器在以前已经出现,但不是作为识别问题的主要部分。
极值理论主要是指处理与概率分布的中值相离极大的情况的理论。可以直观地假设任何一个考虑尾部分布的问题都是极值问题。最近关于目标检测得分空间的工作依赖于这一假设,但是并没有正式解释为什么极值理论适用于那些分数分布的尾部。仅仅是位于尾部并不足以说明这是一个极值问题。比如可以认为任意特定分布D的前N个值根据定义只满足分布D而不满足其它分布。
识别是一个真正意义上的极值问题。当中心极限定理接近极限时,极值问题与中心极限定理相似。极值分布是发生于一个任意分布的一系列随机观测值的最大值(或最小值,根据数据表示方式而定)。Gumbel表示对于任意连续可逆的初始分布,只需要三个模型,依赖于最大值或最小值是否感兴趣,以及观测值是否有上界或下界。Gumbel同样证明如果一个系统或部分有多种失效模式,通过Weibull分布可以很好地模拟这种故障。
发明内容
本发明要解决的技术问题为:本发明提供一种基于极值理论的深度人脸识别方法,该方法利用预测得到的决策值数组,求得统计值,基于极值理论设置阈值,得到识别结果,提高识别准确率。
本发明采用的技术方案为:本发明提供一种基于极值理论的深度人脸识别方法,如图1所示,该方法包括步骤:
步骤S1:利用预训练的深度卷积神经网络CNN对训练人脸图像进行特征提取,得到特征矩阵,用于训练分类器;
步骤S2:对特征矩阵进行SVM分类训练,得到决策面,用于人脸身份预测;
步骤S3:利用预训练的深度卷积神经网络CNN对测试人脸图像进行特征提取,得到特征矩阵,用于人脸身份预测;
步骤S4:利用训练得到的SVM分类器,对步骤S3中得到的人脸图像特征进行身份预测,基于极值理论,得到预测结果。
其中,步骤S1和步骤S3中,输入到深度卷积神经网络CNN的图像大小为224×224。
其中,步骤S1和步骤S3中,CNN一共有40层,一个输入层(第0层),一个softmax输出层(第39层),3个全连接层(第32,35,38层),其余的是conv/relu/mpool/drop层。
其中,步骤S2中的SVM分类使用了LIBSVM工具包,选择L2-正规化L2-损失径向基核函数SVM并将惩罚因子设为10。
其中,步骤S4中人脸身份预测的步骤包括:
步骤S41:针对每一帧图像的人脸特征进行预测,得到决策值数组,选取决策值数组最大20%部分的值进行统计分析;
步骤S42:基于极值理论,设置识别阈值;
步骤S43:将步骤S41得到的统计值与步骤S42得到的阈值作比较,当阈值大于统计值均方差时,认为识别对象为陌生人,当阈值小于统计值均方差时,得到预测结果。
本发明与现有技术相比的有益效果在于:本发明通过极值理论设置阈值,适应能力强,识别准确率高。
(1)基于极值理论设置阈值,能够更准确区分陌生人脸,提高识别准确率;
(2)只需每个人脸类具有极少量的训练样本;
(3)能够适应实际应用中人脸在很大范围内的光照、姿态、表情、遮挡等变化,识别率高;
(4)训练效率高,能够适应实际应用中对增量学习的需求,不用每次进行重复训练。
附图说明
图1为本发明一种基于极值理论的深度人脸识别方法实现流程图;
图2为本发明具体实施例实现流程图。
具体实施方式
下面结合附图对本发明的实施例作详细说明。本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于以下的实施例。
本发明提供一种人脸识别方法,输入为单帧彩色224×224大小图像。
如图2所示,本发明提供了一种基于极值理论的深度人脸识别方法,包含以下步骤:
步骤S1:使用"triplet-based"损失,利用预训练的深度卷积神经网络CNN对原始训练图像进行特征提取,得到特征矩阵,用于训练分类;
步骤S2:选择L2-规范化L2-损耗径向基核函数SVM对特征矩阵进行分类训练,得到决策面,用于人脸预测,给定一组实例-标签对(xi,yi),i=1,...,l,xi∈Rn,yi∈{-1,+1}l,L2-规范化L2-损耗SVM的目标函数为:
subject to yi(wTφ(xi)+b)≥1-ξi,
ξi≥0.
其中,(w,b)是决策面,ξi是松弛变量,C>0是惩罚因子,一般由应用问题决定,C值大时对误分类的惩罚增大,C值小时对误分类的惩罚减小。训练向量xi通过函数φ被映射到更高维空间,K(xi,xj)≡φ(xi)Tφ(xj)是核函数。
步骤S3:利用预训练的深度卷积神经网络CNN对原始识别图像进行特征提取,得到特征矩阵,用于人脸身份预测;
步骤S4:利用训练得到的SVM分类器,对步骤S3中得到的人脸图像特征进行身份预测,基于极值理论,得到预测结果;
步骤S41:针对每一帧图像的人脸特征进行预测,得到决策值数组,选取决策值数组最大20%部分的值进行统计分析;
步骤S42:基于极值理论,设置识别阈值;
步骤S43:将步骤S41得到的统计值与步骤S42得到的阈值作比较,当阈值大于统计值均方差时,认为识别对象为陌生人,当阈值小于统计值均方差时,得到预测结果。
经测试,针对不同环境,在摄像头成像质量良好的情况下,人脸识别准确率不低于90%,可支持多张人脸同时识别,人脸识别响应时间不超过3秒。
Claims (5)
1.一种基于极值理论的深度人脸识别方法,其特征在于包括如下步骤:
步骤S1:利用预训练的深度卷积神经网络CNN对训练人脸图像进行特征提取,得到特征矩阵,用于训练分类器;
步骤S2:对特征矩阵进行SVM分类训练,得到决策面,用于人脸身份预测;
步骤S3:利用预训练的深度卷积神经网络CNN对测试人脸图像进行特征提取,得到特征矩阵,用于人脸身份预测;
步骤S4:利用训练得到的SVM分类器,对步骤S3中得到的人脸图像特征进行身份预测,基于极值理论,得到预测结果。
2.根据权利要求1所述的基于极值理论的深度人脸识别方法,其特征在于,步骤S1和步骤S3中,输入到深度卷积神经网络CNN的图像大小为224×224。
3.根据权利要求1所述的基于极值理论的深度人脸识别方法,其特征在于,步骤S1和步骤S3中,CNN一共有40层,一个输入层,一个softmax输出层,3个全连接层,其余的是conv/relu/mpool/drop层。
4.根据权利要求1所述的基于极值理论的深度人脸识别方法,其特征在于,步骤S2中的SVM分类使用了LIBSVM工具包,选择L2-正规化L2-损失径向基核函数SVM并将惩罚因子设为10。
5.根据权利要求1所述的基于极值理论的深度人脸识别方法,其特征在于,步骤S4中人脸身份预测的步骤包括:
步骤S41:针对每一帧图像的人脸特征进行预测,得到决策值数组,选取决策值数组最大20%部分的值进行统计分析;
步骤S42:基于极值理论,设置识别阈值;
步骤S43:将步骤S41得到的统计值与步骤S42得到的阈值作比较,当阈值大于统计值均方差时,认为识别对象为陌生人,当阈值小于统计值均方差时,得到预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611189169.1A CN106599864B (zh) | 2016-12-21 | 2016-12-21 | 一种基于极值理论的深度人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611189169.1A CN106599864B (zh) | 2016-12-21 | 2016-12-21 | 一种基于极值理论的深度人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106599864A true CN106599864A (zh) | 2017-04-26 |
CN106599864B CN106599864B (zh) | 2020-01-07 |
Family
ID=58600581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611189169.1A Active CN106599864B (zh) | 2016-12-21 | 2016-12-21 | 一种基于极值理论的深度人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106599864B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832667A (zh) * | 2017-10-11 | 2018-03-23 | 哈尔滨理工大学 | 一种基于深度学习的人脸识别方法 |
CN108304800A (zh) * | 2018-01-30 | 2018-07-20 | 厦门启尚科技有限公司 | 一种人脸检测和人脸比对的方法 |
CN109325399A (zh) * | 2018-07-13 | 2019-02-12 | 哈尔滨工程大学 | 一种基于信道状态信息的陌生人手势识别方法及系统 |
CN107742141B (zh) * | 2017-11-08 | 2020-07-28 | 重庆西南集成电路设计有限责任公司 | 基于rfid技术的智能身份信息采集方法及系统 |
CN107742140B (zh) * | 2017-11-08 | 2020-07-28 | 重庆西南集成电路设计有限责任公司 | 基于rfid技术的智能身份信息识别方法 |
CN112102314A (zh) * | 2020-11-02 | 2020-12-18 | 成都考拉悠然科技有限公司 | 基于不确定性来判断人脸图片质量的计算方法 |
CN113780138A (zh) * | 2021-08-31 | 2021-12-10 | 中国科学技术大学先进技术研究院 | 自适应鲁棒性VOCs气体泄漏检测方法、系统及存储介质 |
US11443559B2 (en) | 2019-08-29 | 2022-09-13 | PXL Vision AG | Facial liveness detection with a mobile device |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276407A (zh) * | 2008-05-09 | 2008-10-01 | 武汉大学 | 数字指纹生成和跟踪方法 |
CN103544492A (zh) * | 2013-08-06 | 2014-01-29 | Tcl集团股份有限公司 | 基于深度图像三维曲面几何特征的目标识别方法和装置 |
US20150235073A1 (en) * | 2014-01-28 | 2015-08-20 | The Trustees Of The Stevens Institute Of Technology | Flexible part-based representation for real-world face recognition apparatus and methods |
CN105426963A (zh) * | 2015-12-01 | 2016-03-23 | 北京天诚盛业科技有限公司 | 用于人脸识别的卷积神经网络的训练方法、装置及应用 |
-
2016
- 2016-12-21 CN CN201611189169.1A patent/CN106599864B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101276407A (zh) * | 2008-05-09 | 2008-10-01 | 武汉大学 | 数字指纹生成和跟踪方法 |
CN103544492A (zh) * | 2013-08-06 | 2014-01-29 | Tcl集团股份有限公司 | 基于深度图像三维曲面几何特征的目标识别方法和装置 |
US20150235073A1 (en) * | 2014-01-28 | 2015-08-20 | The Trustees Of The Stevens Institute Of Technology | Flexible part-based representation for real-world face recognition apparatus and methods |
CN105426963A (zh) * | 2015-12-01 | 2016-03-23 | 北京天诚盛业科技有限公司 | 用于人脸识别的卷积神经网络的训练方法、装置及应用 |
Non-Patent Citations (1)
Title |
---|
ABHIJIT BENDALE,TERRANCE BOULT: "Reliable Posterior Probability Estimation for Streaming Face Recognition", 《THE IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832667A (zh) * | 2017-10-11 | 2018-03-23 | 哈尔滨理工大学 | 一种基于深度学习的人脸识别方法 |
CN107742141B (zh) * | 2017-11-08 | 2020-07-28 | 重庆西南集成电路设计有限责任公司 | 基于rfid技术的智能身份信息采集方法及系统 |
CN107742140B (zh) * | 2017-11-08 | 2020-07-28 | 重庆西南集成电路设计有限责任公司 | 基于rfid技术的智能身份信息识别方法 |
CN108304800A (zh) * | 2018-01-30 | 2018-07-20 | 厦门启尚科技有限公司 | 一种人脸检测和人脸比对的方法 |
CN109325399A (zh) * | 2018-07-13 | 2019-02-12 | 哈尔滨工程大学 | 一种基于信道状态信息的陌生人手势识别方法及系统 |
CN109325399B (zh) * | 2018-07-13 | 2021-11-19 | 哈尔滨工程大学 | 一种基于信道状态信息的陌生人手势识别方法及系统 |
US11443559B2 (en) | 2019-08-29 | 2022-09-13 | PXL Vision AG | Facial liveness detection with a mobile device |
US11669607B2 (en) | 2019-08-29 | 2023-06-06 | PXL Vision AG | ID verification with a mobile device |
CN112102314A (zh) * | 2020-11-02 | 2020-12-18 | 成都考拉悠然科技有限公司 | 基于不确定性来判断人脸图片质量的计算方法 |
CN113780138A (zh) * | 2021-08-31 | 2021-12-10 | 中国科学技术大学先进技术研究院 | 自适应鲁棒性VOCs气体泄漏检测方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106599864B (zh) | 2020-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110443143B (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
CN106599864A (zh) | 一种基于极值理论的深度人脸识别方法 | |
Alani et al. | Hand gesture recognition using an adapted convolutional neural network with data augmentation | |
CN108960080B (zh) | 基于主动防御图像对抗攻击的人脸识别方法 | |
CN111191737B (zh) | 基于多尺度反复注意力机制的细粒度图像分类方法 | |
CN109215034B (zh) | 一种基于空间金字塔掩盖池化的弱监督图像语义分割方法 | |
CN112949572B (zh) | 基于Slim-YOLOv3的口罩佩戴情况检测方法 | |
US8379994B2 (en) | Digital image analysis utilizing multiple human labels | |
WO2018052586A1 (en) | Method and system for multi-scale cell image segmentation using multiple parallel convolutional neural networks | |
CN109002755B (zh) | 基于人脸图像的年龄估计模型构建方法及估计方法 | |
CN108710893B (zh) | 一种基于特征融合的数字图像相机源模型分类方法 | |
CN109472209A (zh) | 一种图像识别方法、装置和存储介质 | |
CN109903339B (zh) | 一种基于多维融合特征的视频群体人物定位检测方法 | |
CN105023006B (zh) | 基于增强型非参数最大边缘准则的人脸识别方法 | |
CN110008899B (zh) | 一种可见光遥感图像候选目标提取与分类方法 | |
CN109815814A (zh) | 一种基于卷积神经网络的人脸检测方法 | |
CN110569780A (zh) | 一种基于深度迁移学习的高精度人脸识别方法 | |
CN113705596A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN110135435A (zh) | 一种基于广度学习系统的显著性检测方法及装置 | |
CN109101984B (zh) | 一种基于卷积神经网络的图像识别方法及装置 | |
Putro et al. | Fast face-CPU: a real-time fast face detector on CPU using deep learning | |
CN108460772B (zh) | 基于卷积神经网络的广告骚扰传真图像检测系统及方法 | |
CN114821200B (zh) | 一种应用于工业视觉检测领域的图像检测模型及方法 | |
Ji et al. | A fast face detection method combining skin color feature and adaboost | |
Wan et al. | Face detection method based on skin color and adaboost algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |