CN105160336B

CN105160336B - 基于Sigmoid函数的人脸识别方法

Info

Publication number: CN105160336B
Application number: CN201510688631.1A
Authority: CN
Inventors: 陶大鹏
Original assignee: Yunnan University YNU
Current assignee: Tao Dapeng; Yunnan University YNU
Priority date: 2015-10-21
Filing date: 2015-10-21
Publication date: 2018-06-15
Anticipated expiration: 2035-10-21
Also published as: CN105160336A

Abstract

本发明公开了一种基于Sigmoid函数的人脸识别方法，该方法包括以下步骤：预处理训练集中的人脸图像，并提取高效的人脸图像特征，如局部二值模式(LBP)；将训练数据输入到以改进的Sigmoid函数为损失函数的目标函数进行训练，得到所有身份的预测模型；提取待确认身份的人脸图像特征，并计算其对应所有身份的预测得分，取最大得分所对应的身份信息作为最终的确认身份。与以往使用均方、hinge和log损失函数替代0‑1损失函数度量分类误差不同，本发明在人脸识别预测模型的建立中，使用改进的Sigmoid函数来近似0‑1损失函数。通过调整参数，可以控制近似的精确程度。改进的Sigmoid函数在趋近于0‑1损失函数的同时，将获得对野点的鲁棒性。

Description

基于Sigmoid函数的人脸识别方法

技术领域

本发明涉及人脸识别方法，具体涉及一种基于Sigmoid函数的人脸识别方法。

背景技术

随着社会的发展和科技的进步，人们对于人脸识别的研究越来越重视。在众多基于生物信息的身份鉴别技术中，由于基于人脸特征的识别具有无侵犯性、低成本和较好的隐蔽性等优点，它在身份验证、安全监测和人机交互等应用中发挥着不可替代的作用。

人脸识别系统是一个复杂而庞大的系统，它处理的对象是来自动态视频序列的图像或者静态的人脸与场景图像。人脸识别的目的是将不明身份的一张或多张人脸图像与数据库中明确身份的人脸图像进行对比，进而确定二者是否来自同一个人。人脸识别可以被看成一个典型的分类任务。在实际中，通常并不直接利用图像像素作为人脸图像特征，而是使用更为有效的特征来表示人脸图像数据，如局部二值模式(LBP)或者卷积神经网络(CNN)输出的特征。在训练的过程中，通过最小化分类误差，为每个身份得到一个预测的模型；在预测的过程中，将待确认身份的人脸图像特征输入到这些已知身份的预测模型进行身份的预测。

由于在获取人脸图像数据的过程中会受到背景、姿态和光照等因素的影响，图像数据中的噪声和野点将对人脸识别的性能带来很大的困难。如何提高身份预测模型的准确性和鲁棒性是一个亟待解决的重要问题。0-1损失目标通过最小化错误分类的数目进行预测模型的建立，并被证实是一种对野点鲁棒的方法。然而由于它是NP hard的问题，很难直接进行优化求解。近年来，涌现出很多研究工作，致力于寻求具有较好计算性质的替代损失函数。例如，专利申请CN 103208007A和CN 103530657A均在支持向量机的框架下使用hinge损失函数作为0-1损失函数凸的替代函数。尽管，hinge损失函数可以通过高效的计算达到全局的优化，它并不对野点具有鲁棒性，而且它并不是一个光滑的函数。

发明内容

本发明主要针对人脸识别问题。本发明所要解决的技术问题是探索Sigmoid函数，这一光滑可微的0-1损失函数的近似函数，进而提出了一种基于Sigmoid函数的人脸识别方法。

为了实现上述目的，本发明采用以下技术方案：基于Sigmoid函数的人脸识别方法，其特征在于，包括以下步骤：

步骤1对人脸训练图像进行预处理，并提取人脸图像的特征(LBP局部二值模式)；

步骤2对人脸预测模型进行建立；步骤2包括以下步骤：

步骤2.1，设定k＝1

步骤2.2，从训练集中采样N₊个属于第k个身份的样本以及N_-个不属于第k个身份的样本它们的标签分别是y＝1和y＝-1。确定优化的目标函数为

并随机初始化w，设定梯度下降的速率η，最大迭代优化次数T，以及容许的目标函数值的最小变化∈；

步骤2.3，计算目标函数关于当前w_k的梯度值

步骤2.4，更新

步骤2.5，判断迭代次数是否小于T，判断更新后的使目标函数值的变化是否大于∈；如果没有达到收敛条件，则回到步骤2.3；

步骤2.6，存储第k个身份的预测模型f_k(x，w_k)；

步骤2.7，设定k＝k+1，重复执行步骤2.2-步骤2.6，直到获得所有K个身份的预测模型{f₁(x，w₁)，…，f_K(x，w_K)}。

步骤3，将待确认身份的人脸图像进行如步骤1所述的处理，得到高效的人脸图像识别特征；

步骤4，将待确认身份的图像特征依次输入K个身份的预测模型{f₁(x，w₁)，…，f_K(x，w_K)}，得到K个身份的预测得分；取最大得分所对应的身份信息作为最终的确认身份，完成人脸识别任务。

本发明的有益效果在于：提出了一种基于Sigmoid函数的人脸识别算法，具体为：

(1)与以往使用均方、hinge和log损失函数替代0-1损失函数度量分类误差不同，本发明在人脸识别预测模型的建立中，直接使用近似的0-1损失函数进行分类误差的度量。

(2)本发明使用改进的Sigmoid函数来近似0-1损失函数。通过调整参数λ，可以控制近似的精确程度。当λ→+∞时，改进的Sigmoid函数将等价于0-1损失函数。

(3)由于0-1损失函数对野点具有鲁棒性，改进的Sigmoid函数在趋近于0-1损失函数的同时，也将获得对野点的鲁棒性。

下面结合附图和具体实施方式对本发明做进一步的描述。

附图说明

图1为不同损失函数的曲线图。

图2为不同参数下的Sigmoid函数对0-1损失函数的近似曲线图。

图3为本发明的人脸识别方法流程图。

具体实施方式

基于Sigmoid函数的人脸识别方法，包括以下步骤：预处理训练集中的人脸图像，并提取高效的人脸图像特征；将训练数据输入到以改进的Sigmoid函数为损失函数的目标函数进行训练，得到所有身份的预测模型；提取待确认身份的人脸图像特征，并计算其对应所有身份的预测得分，取最大得分所对应的身份信息作为最终的确认身份。具体为，

(1)对人脸训练图像进行预处理，并提取人脸图像的特征(LBP局部二值模式)；

(2)对人脸预测模型进行建立；

假设每幅人脸图像可由向量表示，训练图像集中的图像来自K个身份。接下来，以第k个身份的预测模型建立为例进行介绍。考虑线性的预测函数，第k个身份的预测模型定义如下：

f_k(x，w_k)＝w_k ^Tx，

其中是判别向量。如果f_k(x，w_k)≥0，则图像x是第k个身份；反之，则不是第k个身份。假设训练集包含N₊个属于第k个身份的样本以及N_-个不属于第k个身份的样本它们的标签分别是y＝1和y＝-1，那么y_if_k(x_i，w_k)＜0表示样本x_i被错误分类，而y_if_k(x_i，w_k)≥0表示样本被正确分类。理想的判别向量可以通过求解下述问题获得，

其中，损失函数定义为关于y_if_k(x_i，w_k)的方程，R(w_k)是正则子，通常取或者||w_k||₁，C＞0是控制正则强度的参数。常见的损失函数选取为，

其中，是指示函数，如果参数是真的，则值为1；反之，值为0。由于0-1损失函数不受错误分类点的y_if_k(x_i，w_k)值的影响，它对野点具有鲁棒性，但是也使得它成为非凸的函数；由于凸的均方、hinge和log损失函数对错误分类点的惩罚受到y_if_k(x_i，w_k)值的影响，它们对野点不具备鲁棒性，见图1。

不光滑、不可微的0-1损失函数可以使用一个光滑可微的函数近似。通过对Sigmoid函数进行变形，0-1损失函数可以近似为，

其中参数λ控制着光滑程度和近似程度。如图2，注意到，当λ→+∞时，

至此，以线性的预测函数和正则函数为例，可以得到基于Sigmoid函数的人脸识别训练模型，

其中是目标方程关于w_k的梯度，η控制梯度下降的速率。

使用相同的方法依次完成对所有身份的预测模型的建立，可以得到K个身份的预测模型{f₁(x，w₁)，…，f_K(x，w_k)}。

(3)人脸识别

人脸识别的过程与人脸预测模型建立的过程类似。将待确认身份的人脸图像进行如步骤1所述的处理，得到高效的人脸图像识别特征。然后将图像特征依次输入到K个身份的预测模型{f₁(x，w₁)，…，f_K(x，w_K)}，进而得到K个身份的预测得分。取最大得分所对应的身份信息作为最终的确认身份。

Claims

1.基于Sigmoid函数的人脸识别方法，其特征在于，包括以下步骤：

步骤1对人脸训练图像进行预处理，并提取人脸图像的特征；

步骤2建立人脸预测模型；步骤2包括以下步骤：

步骤2.1，设定k＝1

步骤2.2，从训练集中采样N₊个属于第k个身份的样本以及N_-个不属于第k个身份的样本它们的标签分别是y＝1和y＝-1；确定优化的目标函数为

并随机初始化w，设定梯度下降的速率η，最大迭代优化次数T，以及容许的目标函数值的最小变化∈；w_k∈R^D是判别向量；C>0是控制正则强度的参数；λ控制着光滑程度和近似程度；

步骤2.3，计算目标函数关于当前w_k的梯度值

步骤2.4，更新

步骤2.6，存储第k个身份的预测模型f_k(x,w_k)；

步骤2.7，设定k＝k+1，重复执行步骤2.2-步骤2.6，直到获得所有K个身份的预测模型{f₁(x,w₁),…,f_K(x,w_K)}；

步骤4，将待确认身份的图像特征依次输入k个身份的预测模型，得到K个身份的预测得分；取最大得分所对应的身份信息作为最终的确认身份，完成人脸识别任务。