CN105160336A - 基于Sigmoid函数的人脸识别方法 - Google Patents

基于Sigmoid函数的人脸识别方法 Download PDF

Info

Publication number
CN105160336A
CN105160336A CN201510688631.1A CN201510688631A CN105160336A CN 105160336 A CN105160336 A CN 105160336A CN 201510688631 A CN201510688631 A CN 201510688631A CN 105160336 A CN105160336 A CN 105160336A
Authority
CN
China
Prior art keywords
identity
function
face
sigmoid function
forecast model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510688631.1A
Other languages
English (en)
Other versions
CN105160336B (zh
Inventor
陶大鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan University YNU
Original Assignee
Yunnan University YNU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan University YNU filed Critical Yunnan University YNU
Priority to CN201510688631.1A priority Critical patent/CN105160336B/zh
Publication of CN105160336A publication Critical patent/CN105160336A/zh
Application granted granted Critical
Publication of CN105160336B publication Critical patent/CN105160336B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开了一种基于Sigmoid函数的人脸识别方法,该方法包括以下步骤:预处理训练集中的人脸图像,并提取高效的人脸图像特征,如局部二值模式(LBP);将训练数据输入到以改进的Sigmoid函数为损失函数的目标函数进行训练,得到所有身份的预测模型;提取待确认身份的人脸图像特征,并计算其对应所有身份的预测得分,取最大得分所对应的身份信息作为最终的确认身份。与以往使用均方、hinge和log损失函数替代0-1损失函数度量分类误差不同,本发明在人脸识别预测模型的建立中,使用改进的Sigmoid函数来近似0-1损失函数。通过调整参数,可以控制近似的精确程度。改进的Sigmoid函数在趋近于0-1损失函数的同时,将获得对野点的鲁棒性。

Description

基于Sigmoid函数的人脸识别方法
技术领域
本发明涉及人脸识别方法,具体涉及一种基于Sigmoid函数的人脸识别方法。
背景技术
随着社会的发展和科技的进步,人们对于人脸识别的研究越来越重视。在众多基于生物信息的身份鉴别技术中,由于基于人脸特征的识别具有无侵犯性、低成本和较好的隐蔽性等优点,它在身份验证、安全监测和人机交互等应用中发挥着不可替代的作用。
人脸识别系统是一个复杂而庞大的系统,它处理的对象是来自动态视频序列的图像或者静态的人脸与场景图像。人脸识别的目的是将不明身份的一张或多张人脸图像与数据库中明确身份的人脸图像进行对比,进而确定二者是否来自同一个人。人脸识别可以被看成一个典型的分类任务。在实际中,通常并不直接利用图像像素作为人脸图像特征,而是使用更为有效的特征来表示人脸图像数据,如局部二值模式(LBP)或者卷积神经网络(CNN)输出的特征。在训练的过程中,通过最小化分类误差,为每个身份得到一个预测的模型;在预测的过程中,将待确认身份的人脸图像特征输入到这些已知身份的预测模型进行身份的预测。
由于在获取人脸图像数据的过程中会受到背景、姿态和光照等因素的影响,图像数据中的噪声和野点将对人脸识别的性能带来很大的困难。如何提高身份预测模型的准确性和鲁棒性是一个亟待解决的重要问题。0-1损失目标通过最小化错误分类的数目进行预测模型的建立,并被证实是一种对野点鲁棒的方法。然而由于它是NPhard的问题,很难直接进行优化求解。近年来,涌现出很多研究工作,致力于寻求具有较好计算性质的替代损失函数。例如,专利申请CN103208007A和CN103530657A均在支持向量机的框架下使用hinge损失函数作为0-1损失函数凸的替代函数。尽管,hinge损失函数可以通过高效的计算达到全局的优化,它并不对野点具有鲁棒性,而且它并不是一个光滑的函数。
发明内容
本发明主要针对人脸识别问题。本发明所要解决的技术问题是探索Sigmoid函数,这一光滑可微的0-1损失函数的近似函数,进而提出了一种基于Sigmoid函数的人脸识别方法。
为了实现上述目的,本发明采用以下技术方案:基于Sigmoid函数的人脸识别方法,其特征在于,包括以下步骤:
步骤1对人脸训练图像进行预处理,并提取人脸图像的特征(LBP局部二值模式);
步骤2对人脸预测模型进行建立;步骤2包括以下步骤:
步骤2.1,设定k=1
步骤2.2,从训练集中采样N+个属于第k个身份的样本以及N-个不属于第k个身份的样本它们的标签分别是y=1和y=-1。确定优化的目标函数为
w k * = arg min w k J ( w k ) = Σ i = 1 N + + N - 1 1 + e λ y i ( w k T x i ) + C | | w k | | 2 2 ,
并随机初始化w,设定梯度下降的速率η,最大迭代优化次数T,以及容许的目标函数值的最小变化∈;
步骤2.3,计算目标函数关于当前wk的梯度值
步骤2.4,更新
w k * ← w k * - η ▿ w k J ( w k ) ;
步骤2.5,判断迭代次数是否小于T,判断更新后的使目标函数值的变化是否大于∈;如果没有达到收敛条件,则回到步骤2.3;
步骤2.6,存储第k个身份的预测模型fk(x,wk);
步骤2.7,设定k=k+1,重复执行步骤2.2-步骤2.6,直到获得所有K个身份的预测模型{f1(x,w1),…,fK(x,wK)}。
步骤3,将待确认身份的人脸图像进行如步骤1所述的处理,得到高效的人脸图像识别特征;
步骤4,将待确认身份的图像特征依次输入K个身份的预测模型{f1(x,w1),…,fK(x,wK)},得到K个身份的预测得分;取最大得分所对应的身份信息作为最终的确认身份,完成人脸识别任务。
本发明的有益效果在于:提出了一种基于Sigmoid函数的人脸识别算法,具体为:
(1)与以往使用均方、hinge和log损失函数替代0-1损失函数度量分类误差不同,本发明在人脸识别预测模型的建立中,直接使用近似的0-1损失函数进行分类误差的度量。
(2)本发明使用改进的Sigmoid函数来近似0-1损失函数。通过调整参数λ,可以控制近似的精确程度。当λ→+∞时,改进的Sigmoid函数将等价于0-1损失函数。
(3)由于0-1损失函数对野点具有鲁棒性,改进的Sigmoid函数在趋近于0-1损失函数的同时,也将获得对野点的鲁棒性。
下面结合附图和具体实施方式对本发明做进一步的描述。
附图说明
图1为不同损失函数的曲线图。
图2为不同参数下的Sigmoid函数对0-1损失函数的近似曲线图。
图3为本发明的人脸识别方法流程图。
具体实施方式
基于Sigmoid函数的人脸识别方法,包括以下步骤:预处理训练集中的人脸图像,并提取高效的人脸图像特征;将训练数据输入到以改进的Sigmoid函数为损失函数的目标函数进行训练,得到所有身份的预测模型;提取待确认身份的人脸图像特征,并计算其对应所有身份的预测得分,取最大得分所对应的身份信息作为最终的确认身份。具体为,
(1)对人脸训练图像进行预处理,并提取人脸图像的特征(LBP局部二值模式);
(2)对人脸预测模型进行建立;
假设每幅人脸图像可由向量表示,训练图像集中的图像来自K个身份。接下来,以第k个身份的预测模型建立为例进行介绍。考虑线性的预测函数,第k个身份的预测模型定义如下:
fk(x,wk)=wk Tx,
其中是判别向量。如果fk(x,wk)≥0,则图像x是第k个身份;反之,则不是第k个身份。假设训练集包含N+个属于第k个身份的样本以及N-个不属于第k个身份的样本它们的标签分别是y=1和y=-1,那么yifk(xi,wk)<0表示样本xi被错误分类,而yifk(xi,wk)≥0表示样本被正确分类。理想的判别向量可以通过求解下述问题获得,
w k * = arg min w k Σ i = 1 N + + N - l ( y i f k ( x i , w k ) ) + C R ( w k ) ,
其中,损失函数定义为关于yifk(xi,wk)的方程,R(wk)是正则子,通常取或者||wk||1,C>0是控制正则强度的参数。常见的损失函数选取为,
其中,是指示函数,如果参数是真的,则值为1;反之,值为0。由于0-1损失函数不受错误分类点的yifk(xi,wk)值的影响,它对野点具有鲁棒性,但是也使得它成为非凸的函数;由于凸的均方、hinge和log损失函数对错误分类点的惩罚受到yifk(xi,wk)值的影响,它们对野点不具备鲁棒性,见图1。
不光滑、不可微的0-1损失函数可以使用一个光滑可微的函数近似。通过对Sigmoid函数进行变形,0-1损失函数可以近似为,
其中参数λ控制着光滑程度和近似程度。如图2,注意到,当λ→+∞时,
至此,以线性的预测函数和正则函数为例,可以得到基于Sigmoid函数的人脸识别训练模型,
w k * = arg min w k J ( w k ) = Σ i = 1 N + + N - 1 1 + e λ y i ( w k T x i ) + C | | w k | | 2 2 .
由于目标方程关于wk是光滑可微的,我们可以利用梯度下降的方法进行求解。在每一次的迭代过程中,使用下式对进行更新,直到收敛 w k * ← w k * - η ▿ w k J ( w k ) ,
其中是目标方程关于wk的梯度,η控制梯度下降的速率。
使用相同的方法依次完成对所有身份的预测模型的建立,可以得到K个身份的预测模型{f1(x,w1),…,fK(x,wk)}。
(3)人脸识别
人脸识别的过程与人脸预测模型建立的过程类似。将待确认身份的人脸图像进行如步骤1所述的处理,得到高效的人脸图像识别特征。然后将图像特征依次输入到K个身份的预测模型{f1(x,w1),…,fK(x,wK)},进而得到K个身份的预测得分。取最大得分所对应的身份信息作为最终的确认身份。

Claims (2)

1.基于Sigmoid函数的人脸识别方法,其特征在于,包括以下步骤:
步骤1对人脸训练图像进行预处理,并提取人脸图像的特征;
步骤2建立人脸预测模型;
步骤3,将待确认身份的人脸图像进行如步骤1所述的处理,得到高效的人脸图像识别特征;
步骤4,将待确认身份的图像特征依次输入K个身份的预测模型,得到K个身份的预测得分;取最大得分所对应的身份信息作为最终的确认身份,完成人脸识别任务。
2.根据权利要求1所述的基于Sigmoid函数的人脸识别方法,其特征在于,步骤2包括以下步骤:
步骤2.1,设定k=1
步骤2.2,从训练集中采样N+个属于第k个身份的样本以及N-个不属于第k个身份的样本它们的标签分别是y=1和y=-1;确定优化的目标函数为
w k * = arg min w k J ( w k ) = Σ i = 1 N + + N - 1 1 + e λy i ( w k T x i ) + C | | w k | | 2 2 ,
并随机初始化w,设定梯度下降的速率η,最大迭代优化次数T,以及容许的目标函数值的最小变化∈;
步骤2.3,计算目标函数关于当前wk的梯度值
步骤2.4,更新
w k * ← w k * - η ▿ w k J ( w k ) ;
步骤2.5,判断迭代次数是否小于T,判断更新后的使目标函数值的变化是否大于∈;如果没有达到收敛条件,则回到步骤2.3;
步骤2.6,存储第k个身份的预测模型fk(x,wk);
步骤2.7,设定k=k+1,重复执行步骤2.2-步骤2.6,直到获得所有K个身份的预测模型{f1(x,w1),…,fK(x,wK)}。
CN201510688631.1A 2015-10-21 2015-10-21 基于Sigmoid函数的人脸识别方法 Active CN105160336B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510688631.1A CN105160336B (zh) 2015-10-21 2015-10-21 基于Sigmoid函数的人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510688631.1A CN105160336B (zh) 2015-10-21 2015-10-21 基于Sigmoid函数的人脸识别方法

Publications (2)

Publication Number Publication Date
CN105160336A true CN105160336A (zh) 2015-12-16
CN105160336B CN105160336B (zh) 2018-06-15

Family

ID=54801188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510688631.1A Active CN105160336B (zh) 2015-10-21 2015-10-21 基于Sigmoid函数的人脸识别方法

Country Status (1)

Country Link
CN (1) CN105160336B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718914A (zh) * 2016-01-27 2016-06-29 中国石油大学(华东) 一种人脸编码及识别方法
CN107818314A (zh) * 2017-11-22 2018-03-20 北京达佳互联信息技术有限公司 脸部图像处理方法、装置及服务器
WO2022126917A1 (zh) * 2020-12-18 2022-06-23 平安科技(深圳)有限公司 基于深度学习的人脸图像评估方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060178881A1 (en) * 2005-02-04 2006-08-10 Samsung Electronics Co., Ltd. Method and apparatus for detecting voice region
CN103778414A (zh) * 2014-01-17 2014-05-07 杭州电子科技大学 基于深度神经网络的实时人脸识别方法
CN103927531A (zh) * 2014-05-13 2014-07-16 江苏科技大学 一种基于局部二值和粒子群优化bp神经网络的人脸识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060178881A1 (en) * 2005-02-04 2006-08-10 Samsung Electronics Co., Ltd. Method and apparatus for detecting voice region
CN103778414A (zh) * 2014-01-17 2014-05-07 杭州电子科技大学 基于深度神经网络的实时人脸识别方法
CN103927531A (zh) * 2014-05-13 2014-07-16 江苏科技大学 一种基于局部二值和粒子群优化bp神经网络的人脸识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
N.WANG 等: "Learning a Deep Compact Image Representation for", 《ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS》 *
孙喜波 等: "改进混沌PSO算法的BP网络优化", 《微计算机信息》 *
林琳: "智能机器人视觉中的人脸识别研究", 《长沙航空职业技术学院学报》 *
柴瑞敏 等: "基于改进的稀疏深度信念网络的人脸识别方法", 《计算机应用研究》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718914A (zh) * 2016-01-27 2016-06-29 中国石油大学(华东) 一种人脸编码及识别方法
CN107818314A (zh) * 2017-11-22 2018-03-20 北京达佳互联信息技术有限公司 脸部图像处理方法、装置及服务器
WO2022126917A1 (zh) * 2020-12-18 2022-06-23 平安科技(深圳)有限公司 基于深度学习的人脸图像评估方法、装置、设备及介质

Also Published As

Publication number Publication date
CN105160336B (zh) 2018-06-15

Similar Documents

Publication Publication Date Title
CN106203395B (zh) 基于多任务深度学习的人脸属性识别方法
CN104463209B (zh) 一种基于bp神经网络的pcb板上数字代码识别方法
Yang et al. Deep label distribution learning for apparent age estimation
US9489561B2 (en) Method and system for estimating fingerprint pose
Zhao et al. Fingerprint image synthesis based on statistical feature models
CN103605972A (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN105138993A (zh) 建立人脸识别模型的方法及装置
CN104239858A (zh) 一种人脸特征验证的方法和装置
CN111368926B (zh) 图像筛选方法、装置和计算机可读存储介质
CN104331716A (zh) 面向大规模训练数据的svm主动学习分类算法
CN111539320B (zh) 基于互相学习网络策略的多视角步态识别方法及系统
Liu et al. Fingerprint pore matching using deep features
CN109934114A (zh) 一种手指静脉模板生成与更新算法及系统
Qin et al. Finger-vein quality assessment by representation learning from binary images
CN108960412A (zh) 图像识别方法、装置及计算机可读存储介质
CN109344713A (zh) 一种姿态鲁棒的人脸识别方法
CN107945210A (zh) 基于深度学习和环境自适应的目标跟踪算法
CN104050680B (zh) 基于迭代自组织和多智能体遗传聚类算法的图像分割方法
CN106127112A (zh) 基于dlle模型的数据降维与特征理解方法
CN109656808A (zh) 一种基于混合式主动学习策略的软件缺陷预测方法
CN105160336A (zh) 基于Sigmoid函数的人脸识别方法
CN108010015A (zh) 一种指静脉影像质量评价方法及其系统
CN104361339A (zh) 掌形图形提取及识别方法
Qin et al. Multi-scaling detection of singular points based on fully convolutional networks in fingerprint images
Latha et al. A novel method for person authentication using retinal images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210224

Address after: 650091 Yunnan province Kunming City Lake Road No. 2

Patentee after: YUNNAN University

Patentee after: Tao Dapeng

Address before: 650091 Yunnan province Kunming City Lake Road No. 2

Patentee before: YUNNAN University