CN109977803A

CN109977803A - 一种基于Kmeans监督学习的人脸识别方法

Info

Publication number: CN109977803A
Application number: CN201910177986.2A
Authority: CN
Inventors: 彭明莎; 张颢; 向志宏; 杨延辉
Original assignee: Beijing Super Dimension Computing Technology Co Ltd
Current assignee: Beijing Super Dimension Computing Technology Co Ltd
Priority date: 2019-03-07
Filing date: 2019-03-07
Publication date: 2019-07-05

Abstract

本发明涉及一种基于Kmeans监督学习的人脸识别方法，包括以下步骤：获取待识别的人脸图像，提取人脸图像的特征数据；利用预先训练完成的Kmeans监督学习分类器对所述特征数据进行分类，然后计算测试样本与样本库中质心的距离；当距离大于阈值时，识别成功；当距离小于阈值时，进行SVM分类，并输出识别结果。本发明的人脸识别速度快，效率高。

Description

一种基于Kmeans监督学习的人脸识别方法

技术领域

本发明涉及深度图像人脸检测领域，特别涉及一种基于Kmeans监督学习的人脸识别方法。

背景技术

3D人脸识别是通过深度摄像头立体成像，能够识别视野内空间每个点位的三维坐标信息，从而通过计算空间3D数据能够复原完整的三维世界，提高安全系统，防止双胞胎作假及化妆或其他手段攻击，适合于对安全要求更高的应用场景，如金融，门禁，考勤等。

目前人脸识别方法，主流的有Kmeans，SVM，KNN等，其中SVM超平面分类器，主要的原理是针对二分类，而人脸识别是多类别进行分类，已有技术是通过多个二类向量机组合，即(H-SVMs)，多个超平面将空间划分为多个区域。

Kmeans是无监督学习算法，是一种分组观察的方法，可调参数少，聚类速度快，方法简单。其改进算法有Kmeans++,ISODATA。其中Kmeans++是在Kmeans上对初始聚类中心的选择做了改进，首先从样本中随机选取一个初始化觉聚类中心，然后根据距离最短得到新的聚类中心，最终得到K个样本聚类中心。ISODATA算法是根据类别的实际情况调整聚类中心的个数及类内的样本个数，该方法相对较复杂，参数不好设置。

KNN是一种监督学习，主要是通过计算不同特征向量间的距离，并选取K个最相似的样本，比较样本相同类别最多的类别作为该样本的类别，依次类推。

现有技术存在以下缺点：

1)目前SVM对于非库内类别和无多个负样本的情况下，分类精度不高，拒识率偏低，所以对于解决多分类问题存在很大的困难。

2)KMeans算法，K参数选值难以把控，尤其对于多姿态的人脸数据比较敏感，很容易出现不同类别数据分到一组。

发明内容

本发明的目的在于，针对现有技术人脸检测中存在的上述问题。

为实现上述目的，本发明提供了一种基于Kmeans监督学习的人脸识别方法，该方法包括以下步骤：

获取待识别的人脸图像，提取人脸图像的特征数据；利用预先训练完成的Kmeans监督学习分类器对所述特征数据进行分类，然后计算测试样本与样本库中质心的距离；当距离大于阈值时，识别成功；当距离小于阈值时，进行SVM分类，并输出识别结果。

优选地，Kmeans监督学习分类器的训练步骤包括：

假设输入类别个数为K，每类中样本为X，则输出类别个数为N及每类样本为Y；计算K_i类别的初始聚类中心，以及计算K_i类别的类内任意一个样本的类内距离，比较得到欧式距离最小的样本作为K_i类别的Y_i1样本；测量该类内其他样本到Y_i1的欧式距离，距离最小的为Y_i2样本,并计算K_i类别的质心C_i；针对K_i类中剩下的样本，测量其到C_i的距离，得到Y_i3样本；分别对K个类别分别选取多个样本，并计算出该类别的聚类中心C_i；针对第K_i个类别中第j个样本的X_ij，监督学习该样本加入在K_i类别前后的类内和类间距离，根据距离变化判定X_ij样本是否产生K_{i_0}新类或加入K_i类；更新类别及聚类中心Ci；迭代计算X_i,(j+1),与K_i类别及K_{i_0},K_{i_1},...K_{i_n},类别的类内、类间距离；依次类推,最终得到不同姿态的类别K_i-0,K_i-1,……，K_i-n，总共得到N个类别每个类别的样本为Y。

优选地，根据距离变化判定X_ij样本是否产生K_{i_0}新类或加入K_i类步骤包括：当加入在K_i类别前后的类内和类间距离差值大于0.2×加入样本前的距离时，则产生K_{i_0}新的类别；小于0.2×加入样本前的距离时，则加入该K_i类别内。

本发明提供的基于Kmeans监督学习的人脸识别方法在进行人脸识别时速度快，效率高。

附图说明

图1为本发明实施例提供的一种基于Kmeans监督学习的人脸识别方法流程示意图；

图2为Kmeans的监督学习分类器对同一类别中不同姿态的样本进行迭代学习示意图；

图3为Kmeans监督学习分类器的训练方法流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实例例主要是针对3D人脸不同姿态的特征数据，将KNN算法和Kmeans算法结合，得到一个基于Kmeans的监督学习分类器，并且对同一类别中不同姿态的样本进行迭代学习，学习生成多个同人不同姿态的类别。例如，将A类识别为A0，A1，A2，A3(如图2所示)，其中一个即为A类，提高通过率，降低误识率。

图1为本发明实施例提供的一种基于Kmeans监督学习的人脸识别方法流程示意图。如图1所示，该方法包括以下步骤：

步骤一，获取待识别的3D人脸图像，提取3D人脸图像的特征数据。人脸图像的特征数据包括眼睛、鼻子和嘴巴区域的数据。

步骤二，利用预先训练完成的Kmeans监督学习分类器对所述特征数据进行分类，然后计算测试样本与样本库中质心的距离；当距离大于阈值时，识别成功；当距离小于阈值时，进行SVM分类，输出识别结果。

具体地，利用预先训练完成的Kmeans监督学习分类器对特征数据进行分类，得到测试样本信息；然后计算测试样本与样本库中质心的距离；当距离大于阈值时，识别成功；当距离小于阈值时，进行SVM分类，输出人脸识别。结果。

本发明实施例基于KMeans的监督学习分类器训练完成后，直接丢弃训练数据，最终输出的是类别的质心，识别速度快。

本发明实施例的创新点是基于Kmeans的监督学习分类器，监督学习不同姿态的类别。Kmeans监督学习过程流程图如图3所示：

图3为Kmeans监督学习分类器的训练方法流程示意图。

Kmeans监督学习过程流程包括：

假设输入类别个数为K，每类中样本为X，则输出类别个数为N及每类样本为Y，主要步骤：

步骤一，计算K_i类别的初始聚类中心，以3个样本为初始样本。

·根据最小距离原则，首先计算该类内任意样本的类内距离，比较得到距离最小的样本作为K_i类别的Y_i1样本；

·测量该类内其他样本到Y_i1的欧式距离，距离最小的为Y_i2并计算K_i类别的质心C_i；

·针对K_i类中剩下的样本，测量其到Ci的距离，得到Y_i3。

步骤二，按照步骤一分别对K个类别分别选取3个样本，并计算出该类别的聚类中心C_i；

步骤三，针对第K_i个类别中第j个样本的X_i,j，监督学习该样本加入在Ki类别前后的类内和类间距离，根据距离变化判定X_ij样本是否产生K_{i_0}新类或加入K_i类。

优选地，当加入在K_i类别前后的类内和类间距离差值大于0.2×加入样本前的距离时，则产生K_{i_0}新的类别；小于0.2×加入样本前的距离时，则加入该K_i类别内。

步骤四，更新类别及聚类中心Ci；

步骤五，迭代计算X_i,(j+1),与K_i类别及K_{i_0},K_{i_1},...K_{i_n}类别的类内类间距离；

步骤六，依次类推，最终的得到同一人的多个不同姿态的类别K_{i_0},K_{i_1},...K_{i_n}，总共得到N个类别每个类别的样本为Y。

步骤七，更新并保存labels和样本质心向量。

本发明实施例的3D人脸识别主要包含Kmeans监督学习分类器的训练及识别两个过程。Kmeans监督学习分类器主要是Kmeans监督学习过程，最终输出labels和质心。识别过程是计算测试样本与样本库中质心的距离。

本发明实施例目前主要应用于生物识别门锁，刷脸考勤，安防监控等领域。以刷脸考勤系统为例，主要分为两个部分，人员注册和人员识别。人员注册主要是利用facenet深度神经网络提取3D的人像特征，利用人像特征训练3D的SVM分类器和监督学习分类器。人员识别：人员出现在深度摄像头拍照范围内，自动捕捉人像，提取特征利用训练好的分类器进行分类，计算距离，距离大于阈值，直接返回该人员不在人员库里；距离小于阈值，并进行SVM分类，最终将3D的识别结果融合，输出最终结果。

本发明实施例利用3D人脸识别可以有效解决遮挡和光线对2D的影响。对于任意的测试数据，可以归纳为两类：已注册人员和未注册人员。由于不同姿态的人员的特征向量方差相对较大，KNN等已有的监督学习分类器无法满足，本发明实施例利用Kmeans的聚类思想，监督学习每个类别中不同姿态的子类别，最终一个类别A自动分成多个子类别，即A0A1A02...等子类，最终输出N个类别。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于Kmeans监督学习的人脸识别方法，其特征在于，包括以下步骤：

获取待识别的人脸图像，提取人脸图像的特征数据；

利用预先训练完成的Kmeans监督学习分类器对所述特征数据进行分类，然后计算测试样本与样本库中质心的距离；当距离大于阈值时，识别成功；当距离小于阈值时，进行SVM分类，输出识别结果。

2.根据权利要求1所述的方法，其特征在于，所述Kmeans监督学习分类器的训练步骤包括：

假设输入类别个数为K，每类中样本为X，则输出类别个数为N及每类样本为Y；

计算K_i类别的初始聚类中心，以及计算K_i类别的类内任意一个样本的类内距离，比较得到欧式距离最小的样本作为K_i类别的Y_i1样本；

测量该类内其他样本到Y_i1的欧式距离，距离最小的为Y_i2样本,并计算K_i类别的质心C_i；

针对K_i类中剩下的样本，测量其到C_i的距离，得到Y_i3样本；

分别对K个类别分别选取多个样本，并计算出该类别的聚类中心C_i；

针对第K_i个类别中第j个样本的X_ij，监督学习该样本加入在K_i类别前后的类内和类间距离，根据距离变化判定X_ij样本是否产生K_{i_0}新类或加入K_i类；

更新类别及聚类中心Ci；

迭代计算X_i,(j+1),与K_i类别及K_{i_0},K_{i_1},...K_{i_n},类别的类内、类间距离；

依次类推,最终得到不同姿态的类别K_i-0,K_i-1,……，K_i-n，总共得到N个类别每个类别的样本为Y。

3.根据权利要求2所述的方法，其特征在于，所述根据距离变化判定X_ij样本是否产生K_{i_0}新类或加入K_i类步骤包括：

当加入在K_i类别前后的类内和类间距离差值大于0.2×加入样本前的距离时，则产生K_{i_0}新的类别；小于0.2×加入样本前的距离时，则加入该K_i类别内。