CN109977803A - 一种基于Kmeans监督学习的人脸识别方法 - Google Patents
一种基于Kmeans监督学习的人脸识别方法 Download PDFInfo
- Publication number
- CN109977803A CN109977803A CN201910177986.2A CN201910177986A CN109977803A CN 109977803 A CN109977803 A CN 109977803A CN 201910177986 A CN201910177986 A CN 201910177986A CN 109977803 A CN109977803 A CN 109977803A
- Authority
- CN
- China
- Prior art keywords
- sample
- classification
- class
- distance
- kmeans
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/166—Detection; Localisation; Normalisation using acquisition arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C1/00—Registering, indicating or recording the time of events or elapsed time, e.g. time-recorders for work people
- G07C1/10—Registering, indicating or recording the time of events or elapsed time, e.g. time-recorders for work people together with the recording, indicating or registering of other data, e.g. of signs of identity
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于Kmeans监督学习的人脸识别方法,包括以下步骤:获取待识别的人脸图像,提取人脸图像的特征数据;利用预先训练完成的Kmeans监督学习分类器对所述特征数据进行分类,然后计算测试样本与样本库中质心的距离;当距离大于阈值时,识别成功;当距离小于阈值时,进行SVM分类,并输出识别结果。本发明的人脸识别速度快,效率高。
Description
技术领域
本发明涉及深度图像人脸检测领域,特别涉及一种基于Kmeans监督学习的人脸识别方法。
背景技术
3D人脸识别是通过深度摄像头立体成像,能够识别视野内空间每个点位的三维坐标信息,从而通过计算空间3D数据能够复原完整的三维世界,提高安全系统,防止双胞胎作假及化妆或其他手段攻击,适合于对安全要求更高的应用场景,如金融,门禁,考勤等。
目前人脸识别方法,主流的有Kmeans,SVM,KNN等,其中SVM超平面分类器,主要的原理是针对二分类,而人脸识别是多类别进行分类,已有技术是通过多个二类向量机组合,即(H-SVMs),多个超平面将空间划分为多个区域。
Kmeans是无监督学习算法,是一种分组观察的方法,可调参数少,聚类速度快,方法简单。其改进算法有Kmeans++,ISODATA。其中Kmeans++是在Kmeans上对初始聚类中心的选择做了改进,首先从样本中随机选取一个初始化觉聚类中心,然后根据距离最短得到新的聚类中心,最终得到K个样本聚类中心。ISODATA算法是根据类别的实际情况调整聚类中心的个数及类内的样本个数,该方法相对较复杂,参数不好设置。
KNN是一种监督学习,主要是通过计算不同特征向量间的距离,并选取K个最相似的样本,比较样本相同类别最多的类别作为该样本的类别,依次类推。
现有技术存在以下缺点:
1)目前SVM对于非库内类别和无多个负样本的情况下,分类精度不高,拒识率偏低,所以对于解决多分类问题存在很大的困难。
2)KMeans算法,K参数选值难以把控,尤其对于多姿态的人脸数据比较敏感,很容易出现不同类别数据分到一组。
发明内容
本发明的目的在于,针对现有技术人脸检测中存在的上述问题。
为实现上述目的,本发明提供了一种基于Kmeans监督学习的人脸识别方法,该方法包括以下步骤:
获取待识别的人脸图像,提取人脸图像的特征数据;利用预先训练完成的Kmeans监督学习分类器对所述特征数据进行分类,然后计算测试样本与样本库中质心的距离;当距离大于阈值时,识别成功;当距离小于阈值时,进行SVM分类,并输出识别结果。
优选地,Kmeans监督学习分类器的训练步骤包括:
假设输入类别个数为K,每类中样本为X,则输出类别个数为N及每类样本为Y;计算Ki类别的初始聚类中心,以及计算Ki类别的类内任意一个样本的类内距离,比较得到欧式距离最小的样本作为Ki类别的Yi1样本;测量该类内其他样本到Yi1的欧式距离,距离最小的为Yi2样本,并计算Ki类别的质心Ci;针对Ki类中剩下的样本,测量其到Ci的距离,得到Yi3样本;分别对K个类别分别选取多个样本,并计算出该类别的聚类中心Ci;针对第Ki个类别中第j个样本的Xij,监督学习该样本加入在Ki类别前后的类内和类间距离,根据距离变化判定Xij样本是否产生Ki_0新类或加入Ki类;更新类别及聚类中心Ci;迭代计算Xi,(j+1),与Ki类别及Ki_0,Ki_1,...Ki_n,类别的类内、类间距离;依次类推,最终得到不同姿态的类别Ki-0,Ki-1,……,Ki-n,总共得到N个类别每个类别的样本为Y。
优选地,根据距离变化判定Xij样本是否产生Ki_0新类或加入Ki类步骤包括:当加入在Ki类别前后的类内和类间距离差值大于0.2×加入样本前的距离时,则产生Ki_0新的类别;小于0.2×加入样本前的距离时,则加入该Ki类别内。
本发明提供的基于Kmeans监督学习的人脸识别方法在进行人脸识别时速度快,效率高。
附图说明
图1为本发明实施例提供的一种基于Kmeans监督学习的人脸识别方法流程示意图;
图2为Kmeans的监督学习分类器对同一类别中不同姿态的样本进行迭代学习示意图;
图3为Kmeans监督学习分类器的训练方法流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实例例主要是针对3D人脸不同姿态的特征数据,将KNN算法和Kmeans算法结合,得到一个基于Kmeans的监督学习分类器,并且对同一类别中不同姿态的样本进行迭代学习,学习生成多个同人不同姿态的类别。例如,将A类识别为A0,A1,A2,A3(如图2所示),其中一个即为A类,提高通过率,降低误识率。
图1为本发明实施例提供的一种基于Kmeans监督学习的人脸识别方法流程示意图。如图1所示,该方法包括以下步骤:
步骤一,获取待识别的3D人脸图像,提取3D人脸图像的特征数据。人脸图像的特征数据包括眼睛、鼻子和嘴巴区域的数据。
步骤二,利用预先训练完成的Kmeans监督学习分类器对所述特征数据进行分类,然后计算测试样本与样本库中质心的距离;当距离大于阈值时,识别成功;当距离小于阈值时,进行SVM分类,输出识别结果。
具体地,利用预先训练完成的Kmeans监督学习分类器对特征数据进行分类,得到测试样本信息;然后计算测试样本与样本库中质心的距离;当距离大于阈值时,识别成功;当距离小于阈值时,进行SVM分类,输出人脸识别。结果。
本发明实施例基于KMeans的监督学习分类器训练完成后,直接丢弃训练数据,最终输出的是类别的质心,识别速度快。
本发明实施例的创新点是基于Kmeans的监督学习分类器,监督学习不同姿态的类别。Kmeans监督学习过程流程图如图3所示:
图3为Kmeans监督学习分类器的训练方法流程示意图。
Kmeans监督学习过程流程包括:
假设输入类别个数为K,每类中样本为X,则输出类别个数为N及每类样本为Y,主要步骤:
步骤一,计算Ki类别的初始聚类中心,以3个样本为初始样本。
·根据最小距离原则,首先计算该类内任意样本的类内距离,比较得到距离最小的样本作为Ki类别的Yi1样本;
·测量该类内其他样本到Yi1的欧式距离,距离最小的为Yi2并计算Ki类别的质心Ci;
·针对Ki类中剩下的样本,测量其到Ci的距离,得到Yi3。
步骤二,按照步骤一分别对K个类别分别选取3个样本,并计算出该类别的聚类中心Ci;
步骤三,针对第Ki个类别中第j个样本的Xi,j,监督学习该样本加入在Ki类别前后的类内和类间距离,根据距离变化判定Xij样本是否产生Ki_0新类或加入Ki类。
优选地,当加入在Ki类别前后的类内和类间距离差值大于0.2×加入样本前的距离时,则产生Ki_0新的类别;小于0.2×加入样本前的距离时,则加入该Ki类别内。
步骤四,更新类别及聚类中心Ci;
步骤五,迭代计算Xi,(j+1),与Ki类别及Ki_0,Ki_1,...Ki_n类别的类内类间距离;
步骤六,依次类推,最终的得到同一人的多个不同姿态的类别Ki_0,Ki_1,...Ki_n,总共得到N个类别每个类别的样本为Y。
步骤七,更新并保存labels和样本质心向量。
本发明实施例的3D人脸识别主要包含Kmeans监督学习分类器的训练及识别两个过程。Kmeans监督学习分类器主要是Kmeans监督学习过程,最终输出labels和质心。识别过程是计算测试样本与样本库中质心的距离。
本发明实施例目前主要应用于生物识别门锁,刷脸考勤,安防监控等领域。以刷脸考勤系统为例,主要分为两个部分,人员注册和人员识别。人员注册主要是利用facenet深度神经网络提取3D的人像特征,利用人像特征训练3D的SVM分类器和监督学习分类器。人员识别:人员出现在深度摄像头拍照范围内,自动捕捉人像,提取特征利用训练好的分类器进行分类,计算距离,距离大于阈值,直接返回该人员不在人员库里;距离小于阈值,并进行SVM分类,最终将3D的识别结果融合,输出最终结果。
本发明实施例利用3D人脸识别可以有效解决遮挡和光线对2D的影响。对于任意的测试数据,可以归纳为两类:已注册人员和未注册人员。由于不同姿态的人员的特征向量方差相对较大,KNN等已有的监督学习分类器无法满足,本发明实施例利用Kmeans的聚类思想,监督学习每个类别中不同姿态的子类别,最终一个类别A自动分成多个子类别,即A0A1A02...等子类,最终输出N个类别。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于Kmeans监督学习的人脸识别方法,其特征在于,包括以下步骤:
获取待识别的人脸图像,提取人脸图像的特征数据;
利用预先训练完成的Kmeans监督学习分类器对所述特征数据进行分类,然后计算测试样本与样本库中质心的距离;当距离大于阈值时,识别成功;当距离小于阈值时,进行SVM分类,输出识别结果。
2.根据权利要求1所述的方法,其特征在于,所述Kmeans监督学习分类器的训练步骤包括:
假设输入类别个数为K,每类中样本为X,则输出类别个数为N及每类样本为Y;
计算Ki类别的初始聚类中心,以及计算Ki类别的类内任意一个样本的类内距离,比较得到欧式距离最小的样本作为Ki类别的Yi1样本;
测量该类内其他样本到Yi1的欧式距离,距离最小的为Yi2样本,并计算Ki类别的质心Ci;
针对Ki类中剩下的样本,测量其到Ci的距离,得到Yi3样本;
分别对K个类别分别选取多个样本,并计算出该类别的聚类中心Ci;
针对第Ki个类别中第j个样本的Xij,监督学习该样本加入在Ki类别前后的类内和类间距离,根据距离变化判定Xij样本是否产生Ki_0新类或加入Ki类;
更新类别及聚类中心Ci;
迭代计算Xi,(j+1),与Ki类别及Ki_0,Ki_1,...Ki_n,类别的类内、类间距离;
依次类推,最终得到不同姿态的类别Ki-0,Ki-1,……,Ki-n,总共得到N个类别每个类别的样本为Y。
3.根据权利要求2所述的方法,其特征在于,所述根据距离变化判定Xij样本是否产生Ki_0新类或加入Ki类步骤包括:
当加入在Ki类别前后的类内和类间距离差值大于0.2×加入样本前的距离时,则产生Ki_0新的类别;小于0.2×加入样本前的距离时,则加入该Ki类别内。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910177986.2A CN109977803A (zh) | 2019-03-07 | 2019-03-07 | 一种基于Kmeans监督学习的人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910177986.2A CN109977803A (zh) | 2019-03-07 | 2019-03-07 | 一种基于Kmeans监督学习的人脸识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109977803A true CN109977803A (zh) | 2019-07-05 |
Family
ID=67078334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910177986.2A Pending CN109977803A (zh) | 2019-03-07 | 2019-03-07 | 一种基于Kmeans监督学习的人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977803A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008147039A1 (en) * | 2007-05-25 | 2008-12-04 | Inha-Industry Partnership Institute | System and method for recognizing images using t-test |
CN103440275A (zh) * | 2013-08-08 | 2013-12-11 | 南京邮电大学 | 一种基于普利姆的k均值聚类方法 |
CN103605962A (zh) * | 2013-11-19 | 2014-02-26 | 四川长虹电器股份有限公司 | 基于类内类间距离的人脸验证方法 |
CN103903474A (zh) * | 2014-04-09 | 2014-07-02 | 浙江工业大学 | 一种基于K-means聚类的车队出行诱导方法 |
CN104376057A (zh) * | 2014-11-06 | 2015-02-25 | 南京邮电大学 | 一种基于最大最小距离和K-means的自适应聚类方法 |
CN105894047A (zh) * | 2016-06-28 | 2016-08-24 | 深圳市唯特视科技有限公司 | 一种基于三维数据的人脸分类系统 |
CN106250821A (zh) * | 2016-07-20 | 2016-12-21 | 南京邮电大学 | 一种聚类再分类的人脸识别方法 |
CN106407915A (zh) * | 2016-08-31 | 2017-02-15 | 广州精点计算机科技有限公司 | 一种基于svm的人脸特征识别方法及装置 |
CN109344740A (zh) * | 2018-09-12 | 2019-02-15 | 上海了物网络科技有限公司 | 人脸识别系统、方法及计算机可读存储介质 |
-
2019
- 2019-03-07 CN CN201910177986.2A patent/CN109977803A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008147039A1 (en) * | 2007-05-25 | 2008-12-04 | Inha-Industry Partnership Institute | System and method for recognizing images using t-test |
CN103440275A (zh) * | 2013-08-08 | 2013-12-11 | 南京邮电大学 | 一种基于普利姆的k均值聚类方法 |
CN103605962A (zh) * | 2013-11-19 | 2014-02-26 | 四川长虹电器股份有限公司 | 基于类内类间距离的人脸验证方法 |
CN103903474A (zh) * | 2014-04-09 | 2014-07-02 | 浙江工业大学 | 一种基于K-means聚类的车队出行诱导方法 |
CN104376057A (zh) * | 2014-11-06 | 2015-02-25 | 南京邮电大学 | 一种基于最大最小距离和K-means的自适应聚类方法 |
CN105894047A (zh) * | 2016-06-28 | 2016-08-24 | 深圳市唯特视科技有限公司 | 一种基于三维数据的人脸分类系统 |
CN106250821A (zh) * | 2016-07-20 | 2016-12-21 | 南京邮电大学 | 一种聚类再分类的人脸识别方法 |
CN106407915A (zh) * | 2016-08-31 | 2017-02-15 | 广州精点计算机科技有限公司 | 一种基于svm的人脸特征识别方法及装置 |
CN109344740A (zh) * | 2018-09-12 | 2019-02-15 | 上海了物网络科技有限公司 | 人脸识别系统、方法及计算机可读存储介质 |
Non-Patent Citations (6)
Title |
---|
MRS. S. SUJATHA 等: "New Fast K-Means Clustering Algorithm using Modified Centroid Selection Method", 《INTERNATIONAL JOURNAL OF ENGINEERING RESEARCH & TECHNOLOGY 》 * |
SERI PANSANG 等: "Invariant Range Image Multi-pose Face Recognition Using K-means,Membership Matching Score and Center of Gravity search", 《PROCEEDINGS OF THE 10TH WSEAS INTERNATIONAL CONFERENCE ON SYSTEMS》 * |
THOMAS FINLEY 等: "Supervised k-Means Clustering", 《WWW.CS.CORNELL.EDU》 * |
张雅雯 等: "一种基于k-means的人脸识别算法", 《科技传播》 * |
杨新春 等: "改进的 K-均值聚类排挤小生境遗传算法", 《软件导刊》 * |
黎银环 等: "改进的K-means算法在入侵检测中的应用", 《计算机技术与发展》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108053615B (zh) | 基于微表情的驾驶员疲劳驾驶状态检测方法 | |
Zhang et al. | Improving multiview face detection with multi-task deep convolutional neural networks | |
CN103902961B (zh) | 一种人脸识别方法及装置 | |
CN100592322C (zh) | 照片人脸与活体人脸的计算机自动鉴别方法 | |
Chaudhari et al. | Face detection using viola jones algorithm and neural networks | |
EP2091021A1 (en) | Face authentication device | |
CN104992148A (zh) | 基于随机森林的atm终端部分遮挡人脸关键点检测方法 | |
CN106355138A (zh) | 基于深度学习和关键点特征提取的人脸识别方法 | |
Sunhem et al. | An approach to face shape classification for hairstyle recommendation | |
CN106485191A (zh) | 一种驾驶员疲劳状态检测方法及系统 | |
CN105138954A (zh) | 一种图像自动筛选查询识别系统 | |
Reese et al. | A comparison of face detection algorithms in visible and thermal spectrums | |
Suma et al. | Real time face recognition of human faces by using LBPH and Viola Jones algorithm | |
TW201917636A (zh) | 一種基於線上學習的人臉辨識方法與系統 | |
Hebbale et al. | Real time COVID-19 facemask detection using deep learning | |
WO2023279557A1 (zh) | 基于眨眼同步及双目移动检测的伪造视频检验方法及系统 | |
CN107832730A (zh) | 提高人脸识别准确率的方法和人脸识别系统 | |
CN103839056B (zh) | 一种人眼状态识别方法和装置 | |
Sanghvi et al. | Mixnet for generalized face presentation attack detection | |
Chouchane et al. | 3D and 2D face recognition using integral projection curves based depth and intensity images | |
Broussard et al. | Using artificial neural networks and feature saliency techniques for improved iris segmentation | |
Lu et al. | Eye detection based on rectangle features and pixel-pattern-based texture features | |
WO2015037973A1 (en) | A face identification method | |
Das et al. | Human face detection in color images using HSV color histogram and WLD | |
CN109977803A (zh) | 一种基于Kmeans监督学习的人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20211221 |
|
AD01 | Patent right deemed abandoned |