CN106407878B - 基于多分类器的人脸检测方法及装置 - Google Patents

基于多分类器的人脸检测方法及装置 Download PDF

Info

Publication number
CN106407878B
CN106407878B CN201610487857.XA CN201610487857A CN106407878B CN 106407878 B CN106407878 B CN 106407878B CN 201610487857 A CN201610487857 A CN 201610487857A CN 106407878 B CN106407878 B CN 106407878B
Authority
CN
China
Prior art keywords
classifier
sub
image
positive sample
window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610487857.XA
Other languages
English (en)
Other versions
CN106407878A (zh
Inventor
曾建平
王正
谢静
班华忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhi Xinyuandong Science And Technology Ltd
Original Assignee
Beijing Zhi Xinyuandong Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhi Xinyuandong Science And Technology Ltd filed Critical Beijing Zhi Xinyuandong Science And Technology Ltd
Priority to CN201610487857.XA priority Critical patent/CN106407878B/zh
Publication of CN106407878A publication Critical patent/CN106407878A/zh
Application granted granted Critical
Publication of CN106407878B publication Critical patent/CN106407878B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了基于多分类器的人脸检测方法,该方法包括:选取正样本图像和负样本图像,通过K‑means聚类算法对正样本图像进行聚类,获取聚类正样本集;采用Cascade算法分别利用主分类器和子分类器对聚类正样本集和负样本图像进行训练,获取训练好的主分类器和子分类器;输入图像,根据训练好的主分类器和子分类器对输入的图像进行检测,输出检测结果。与现有技术相比,本发明能够从复杂的图像中检测出人脸,检测准确率较高。

Description

基于多分类器的人脸检测方法及装置
技术领域
本发明涉及图像处理、视频监控以及安防,特别涉及人脸检测方法及装置。
背景技术
人脸检测是在指定图像中检测而所有人脸(如果存在)的位置和大小的过程,最初作为自动人脸识别系统的定位被提出来,近年来由于其在安全访问控制、视觉监测、基于内容的检索和新一代人机界面等领域的应用价值,已经成为人脸信息处理中的一项关键技术,得到了广泛的关注。
目前人脸检测的方法主要分为两种:基于知识的人脸检测和基于统计的人脸检测。其中,基于知识的人脸检测又包括:模板匹配、人脸特征、形状与边缘、纹理特征、颜色特征等;基于统计的人脸检测又包括:神经网络、支持向量机 (SVM)、隐马尔科夫模型、Boost分类器、AdaBoost分类器、朴素贝叶斯方法等。
公开号为CN102254183A的中国发明专利申请公开了一种基于AdaBoost算法的人脸检测方法,包括步骤:将待测图像利用缩放算法生成金字塔图像集合;在图像集合中利用AdaBoost人脸检测器搜索人脸,人脸检测器包含Harr特征计算及瀑布式级联分类器;标定人脸位置。公开号为CN105335684A的中国发明专利申请公开了一种人脸检测方法及装置,将强分类器中的部分弱分类器构建成嵌套级联分类器,每一级嵌套级联分类器都能滤除一部分非人脸图像,从而通过较少的弱分类器过滤掉待检测图像中的部分非人脸图像。然而,上述人脸检测方法鲁棒性较差。
综上所述,目前迫切需要提出一种鲁棒性较好的人脸检测的方法及装置。
发明内容
有鉴于此,本发明的主要目的在于实现一种鲁棒性较好的人脸检测的方法及装置。
为达到上述目的,按照本发明的第一个方面,提供了基于多分类器的人脸检测方法,该方法包括:
第一步骤,选取正样本图像和负样本图像,通过K-means聚类算法对正样本图像进行聚类,获取聚类正样本集;
第二步骤,采用Cascade算法分别利用主分类器和子分类器对聚类正样本集和负样本图像进行训练,获取训练好的主分类器和子分类器;
第三步骤,输入图像,根据训练好的主分类器和子分类器对输入的图像进行检测,输出检测结果。
其中,所述第一步骤进一步包括:
样本选取步骤,选取人脸图像为正样本图像,非人脸图像为负样本图像;
聚类样本集获取步骤,将正样本图像缩小成宽度为Wnew、高度为Hnew的新正样本图像,每个新正样本图像用Wnew*Hnew个特征向量表示,将全体的新正样本图像集作为全体聚类正样本集DS_ALL,使用K-means聚类算法将全体聚类正样本集DS_ALL聚类为N1个聚类正样本集 {DS_SUB1,DS_SUB2,…,DS_SUBN1}。
所述第二步骤进一步包括:
主分类器训练步骤,采用Cascade算法利用主分类器提取全体聚类正样本集 DS_ALL和负样本图像的特征,对全体聚类正样本集DS_ALL和负样本图像提取的特征进行训练,当训练过程中的误检率≤Th_NF1或者时训练层数≥ Th_TL,停止训练,得到训练好的实现人脸与背景分类的主分类器,主分类器是由Th_TL个级联的Boost分类器构成;
子分类器选择步骤,采用N1个子分类器,分别提取N1个聚类正样本集 {DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征,并根据聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征进行训练,每个子分类器是由N2个级联的Boost分类器组成;
子分类器训练步骤,对子分类器SCi训练ΔTL层,i=1,2,…,N3, j=1,2,…,N3,k=1,2,…,Numj,N3为需要训练的子分类器的数量,统计该样本 Sjk的置信度最大值对应的i,若i≠j,则将该样本Sjk重新分配到DS_SUBi中,重复计算,直至聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}中每个样本都计算完毕;
子分类器重复训练步骤,计算第j个子分类器的误检率,若误检率≤Th_NF2,则停止对第j个子分类器的训练,继续对剩余的子分类器重复子分类器训练步骤,直至所有的子分类器都停止训练,得到N1个训练好的实现人脸与背景分类的子分类器SC′i,i=1,2,…,N1
所述第三步骤进一步包括:
输入图像特征提取步骤,若输入图像是彩色图像,对输入图像进行灰度化处理,提取灰度图像的特征;
主分类器分类步骤,对整幅灰度图像进行逐窗扫描,得到一系列的窗口图像,利用训练好的主分类器分别对每一个窗口图像的特征进行分类,若分类结果为背景,则将该窗口图像标示为背景;
子分类器分类步骤,依次采用训练好的N1个子分类器对未标示的窗口图像的特征进行分类,若N1个子分类器中有一个或者以上的分类结果为人脸,则将该窗口图像标示为人脸,否则将该窗口图像标示为背景;
标示结果输出步骤,将标示人脸的窗口图像标签为人脸检测区域,并输出。
所述主分类器分类步骤和子分类器分类步骤中主分类器和子分类器对窗口图像的特征进行分类的步骤进一步包括:
步骤a),对未标示的窗口图像,利用第i个Boost分类器根据该窗口图像的特征进行分类,i=1,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则步骤b);
步骤b),i=i+1,继续利用第i个Boost分类器根据该窗口图像的特征进行分类,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则继续步骤b),直至所有Boost分类器都分类完毕,将该窗口图像标为人脸。
按照本发明的另一个方面,提供了基于多分类器的人脸检测装置,该装置包括:
负样本和聚类正样本集获取模块,用于选取正样本图像和负样本图像,通过 K-means聚类算法对正样本图像进行聚类,获取聚类正样本集;
主分类器和子分类器训练模块,用于采用Cascade算法分别利用主分类器和子分类器对聚类正样本集和负样本图像进行训练,获取训练好的主分类器和子分类器;
主分类器和子分类器检测模块,用于输入图像,根据训练好的主分类器和子分类器对输入的图像进行检测,输出检测结果。
其中,所述负样本和聚类正样本集获取模块进一步包括:
样本选取模块,用于选取人脸图像为正样本图像,非人脸图像为负样本图像;
聚类样本集获取模块,用于将正样本图像缩小成宽度为Wnew、高度为Hnew的新正样本图像,每个新正样本图像用Wnew*Hnew个特征向量表示,将全体的新正样本图像集作为全体聚类正样本集DS_ALL,使用K-means聚类算法将全体聚类正样本集DS_ALL聚类为N1个聚类正样本集 {DS_SUB1,DS_SUB2,…,DS_SUBN1}。
所述主分类器和子分类器训练模块进一步包括:
主分类器训练模块,用于采用Cascade算法利用主分类器提取全体聚类正样本集DS_ALL和负样本图像的特征,对全体聚类正样本集DS_ALL和负样本图像提取的特征进行训练,当训练过程中的误检率≤Th_NF1或者时训练层数≥ Th_TL,停止训练,得到训练好的实现人脸与背景分类的主分类器,主分类器是由Th_TL个级联的Boost分类器构成;
子分类器选择模块,用于采用N1个子分类器,分别提取N1个聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征,并根据聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征进行训练,每个子分类器是由N2个级联的Boost分类器组成;
子分类器训练模块,用于对子分类器SCi训练ΔTL层,i=1,2,…,N3, j=1,2,…,N3,k=1,2,…,Numj,N3为需要训练的子分类器的数量,统计该样本 Sjk的置信度最大值对应的i,若i≠j,则将该样本Sjk重新分配到DS_SUBi中,重复计算,直至聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}中每个样本都计算完毕;
子分类器重复训练模块,用于计算第j个子分类器的误检率,若误检率≤Th_NF2,则停止对第j个子分类器的训练,继续对剩余的子分类器重复子分类器训练模块,直至所有的子分类器都停止训练,得到N1个训练好的实现人脸与背景分类的子分类器SC′i,i=1,2,…,N1
所述主分类器和子分类器检测模块进一步包括:
输入图像特征提取模块,用于若输入图像是彩色图像,对输入图像进行灰度化处理,提取灰度图像的特征;
主分类器分类模块,用于对整幅灰度图像进行逐窗扫描,得到一系列的窗口图像,利用训练好的主分类器分别对每一个窗口图像的特征进行分类,若分类结果为背景,则将该窗口图像标示为背景;
子分类器分类模块,用于依次采用训练好的N1个子分类器对未标示的窗口图像的特征进行分类,若N1个子分类器中有一个或者以上的分类结果为人脸,则将该窗口图像标示为人脸,否则将该窗口图像标示为背景;
标示结果输出模块,用于将标示人脸的窗口图像标签为人脸检测区域,并输出。
所述主分类器分类模块和子分类器分类模块中主分类器和子分类器对窗口图像的特征进行分类的子模块进一步包括:
子模块a),用于对未标示的窗口图像,利用第i个Boost分类器根据该窗口图像的特征进行分类,i=1,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则子模块b);
子模块b),用于i=i+1,继续利用第i个Boost分类器根据该窗口图像的特征进行分类,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则继续子模块b),直至所有Boost分类器都分类完毕,将该窗口图像标为人脸。
与现有的人脸检测技术相比,本发明的基于多分类器的人脸检测方法及装置利用K-means聚类算法将样本聚类成多类样本,对多类样本分别进行主分类器和子分类器的训练,最后通过主分类器和子分类器进行二次分类,因此检测准确率较高。本发明的基于多分类器的人脸检测方法及装置可以检测出复杂图像中的人脸,且鲁棒性较高。
附图说明
图1示出了按照本发明的基于多分类器的人脸检测方法的流程图。
图2示出了按照本发明的基于多分类器的人脸检测装置的框架图。
具体实施方式
为进一步了解本发明的结构、特征及其他目的,现结合所附较佳实施例详细说明如下,所说明的较佳实施例仅用于说明本发明的技术方案,并非限定本发明。
图1给出了按照本发明的基于多分类器的人脸检测方法的流程图。如图1所示,按照本发明的基于多分类器的人脸检测方法包括:
第一步骤S1,选取正样本图像和负样本图像,通过K-means聚类算法对正样本图像进行聚类,获取聚类正样本集;
第二步骤S2,采用Cascade算法分别利用主分类器和子分类器对聚类正样本集和负样本图像进行训练,获取训练好的主分类器和子分类器;
第三步骤S3,输入图像,根据训练好的主分类器和子分类器对输入的图像进行检测,输出检测结果。
其中,所述第一步骤S1进一步包括:
样本选取步骤S11,选取人脸图像为正样本图像,非人脸图像为负样本图像;
聚类样本集获取步骤S12,将正样本图像缩小成宽度为Wnew、高度为Hnew的新正样本图像,每个新正样本图像用Wnew*Hnew个特征向量表示,将全体的新正样本图像集作为全体聚类正样本集DS_ALL,使用K-means聚类算法将全体聚类正样本集DS_ALL聚类为N1个聚类正样本集 {DS_SUB1,DS_SUB2,…,DS_SUBN1}。
所述样本选取步骤S11中选取的人脸图像的数量可以大于1000,选取的非人脸图像的数量可以大于500,选取的样本图像宽度Ws∈[12,512]、高度 Hs∈[12,512]。优选地,选取的人脸图像的数量可以大于5000,选取的非人脸图像的数量可以大于1000,选取的样本图像宽度Ws选为24、高度Hs选为24。
所述聚类样本获取步骤S12中Wnew∈[6,24],Hnew∈[6,24],N1∈[3,7]。优选地,Wnew选为12,Hnew选为12,N1选为5。
所述K-means聚类算法可以通过现有的技术实现。例如,“袁方,孟增辉,于戈.对K-means聚类算法的改进.《计算机工程与应用》,2004,40(36):177-178”。
所述第二步骤S2进一步包括:
主分类器训练步骤S21,采用Cascade算法利用主分类器提取全体聚类正样本集DS_ALL和负样本图像的特征,对全体聚类正样本集DS_ALL和负样本图像提取的特征进行训练,当训练过程中的误检率≤Th_NF1或者时训练层数≥ Th_TL,停止训练,得到训练好的实现人脸与背景分类的主分类器,主分类器是由Th_TL个级联的Boost分类器构成;
子分类器选择步骤S22,采用N1个子分类器,分别提取N1个聚类正样本集 {DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征,并根据聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征进行训练,每个子分类器是由N2个级联的Boost分类器组成;
子分类器训练步骤S23,对子分类器SCi训练ΔTL层,i=1,2,…,N3, j=1,2,…,N3,k=1,2,…,Numj,N3为需要训练的子分类器的数量,统计该样本 Sjk的置信度最大值对应的i,若i≠j,则将该样本Sjk重新分配到DS_SUBi中,重复计算,直至聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}中每个样本都计算完毕;
子分类器重复训练步骤S24,计算第j个子分类器的误检率,若误检率≤Th_NF2,则停止对第j个子分类器的训练,继续对剩余的子分类器重复子分类器训练步骤S23,直至所有的子分类器都停止训练,得到N1个训练好的实现人脸与背景分类的子分类器SC′i,i=1,2,…,N1
其中,主分类器训练步骤S21中Th_NF1∈[0.05,0.2],Th_TL∈[40,80], N2∈[100,1000]。优选地,Th_NF1选为0.1,Th_TL选为80,N2选为300。
所述Cascade算法可以通过现有的技术实现。例如,“L.Bourdev,J.Brandt.Robust Object Detection Via Soft Cascade.IEEE Computer Society Conference onComputer Vision&Pattern Recognition,2010,2:236-243vol.2”。
所述Boost分类器可以通过现有的技术实现。例如,“方承志,苏腾云.基于改进型LBP的Floatboost人脸检测.《南京邮电大学学报:自然科学版》,2014, 34(6):75-79”。
所述特征可以选取常用的一些特征,例如LBP特征(全称Local Binary Patterns,局部二值模式)、Haar特征、NPD特征(归一化像素差值)、ICF(积分通道特征)等。
所述子分类器训练步骤S23中ΔTL∈[10,20]。优选地,ΔTL选为15。
所述子分类器重复训练步骤S24中Th_NF2∈[5×10-7,5×10-5]。优选地, Th_NF2选为5×10-6
所述第三步骤S3进一步包括:
输入图像特征提取步骤S31,若输入图像是彩色图像,对输入图像进行灰度化处理,提取灰度图像的特征;
主分类器分类步骤S32,对整幅灰度图像进行逐窗扫描,得到一系列的窗口图像,利用训练好的主分类器分别对每一个窗口图像的特征进行分类,若分类结果为背景,则将该窗口图像标示为背景;
子分类器分类步骤S33,依次采用训练好的N1个子分类器对未标示的窗口图像的特征进行分类,若N1个子分类器中有一个或者以上的分类结果为人脸,则将该窗口图像标示为人脸,否则将该窗口图像标示为背景;
标示结果输出步骤S34,将标示人脸的窗口图像标签为人脸检测区域,并输出。
所述输入图像特征提取步骤S31中提取灰度图像的特征可以选取常用的一些特征,例如LBP特征、Haar特征、NPD特征、ICF特征等。
所述主分类器检测步骤S32中逐窗扫描是以宽度为Wnew、高度为Hnew的矩形窗口依次扫描整幅图像。
所述主分类器分类步骤S32和子分类器分类步骤S33中主分类器和子分类器对窗口图像的特征进行分类的步骤进一步包括:
步骤a),对未标示的窗口图像,利用第i个Boost分类器根据该窗口图像的特征进行分类,i=1,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则步骤b);
步骤b),i=i+1,继续利用第i个Boost分类器根据该窗口图像的特征进行分类,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则继续步骤b),直至所有Boost分类器都分类完毕,将该窗口图像标为人脸。
其中,所述步骤b)中直至所有Boost分类器都分类完毕,对于主分类器为 Th_TL个级联的Boost分类器都分类完毕,对于子分类器为N2个级联的Boost 分类器都分类完毕。
图2给出了按照本发明的基于多分类器的人脸检测装置的框架图。如图2所示,按照本发明的基于多分类器的人脸检测装置包括:
负样本和聚类正样本集获取模块1,用于选取正样本图像和负样本图像,通过K-means聚类算法对正样本图像进行聚类,获取聚类正样本集;
主分类器和子分类器训练模块2,用于采用Cascade算法分别利用主分类器和子分类器对聚类正样本集和负样本图像进行训练,获取训练好的主分类器和子分类器;
主分类器和子分类器检测模块3,用于输入图像,根据训练好的主分类器和子分类器对输入的图像进行检测,输出检测结果。
其中,所述负样本和聚类正样本集获取模块1进一步包括:
样本选取模块11,用于选取人脸图像为正样本图像,非人脸图像为负样本图像;
聚类样本集获取模块12,用于将正样本图像缩小成宽度为Wnew、高度为Hnew的新正样本图像,每个新正样本图像用Wnew*Hnew个特征向量表示,将全体的新正样本图像集作为全体聚类正样本集DS_ALL,使用K-means聚类算法将全体聚类正样本集DS_ALL聚类为N1个聚类正样本集 {DS_SUB1,DS_SUB2,…,DS_SUBN1}。
所述样本选取模块11中选取的人脸图像的数量可以大于1000,选取的非人脸图像的数量可以大于500,选取的样本图像宽度Ws∈[12,512]、高度优选地,选取的人脸图像的数量可以大于5000,选取的非人脸图像的数量可以大于1000,选取的样本图像宽度Ws选为24、高度Hs选为24。
所述聚类样本获取模块12中Wnew∈[6,24],Hnew∈[6,24],N1∈[3,7]。优选地,Wnew选为12,Hnew选为12,N1选为5。
所述K-means聚类算法可以通过现有的技术实现。例如,“袁方,孟增辉,于戈.对K-means聚类算法的改进.《计算机工程与应用》,2004,40(36):177-178”。
所述主分类器和子分类器训练模块2进一步包括:
主分类器训练模块21,用于采用Cascade算法利用主分类器提取全体聚类正样本集DS_ALL和负样本图像的特征,对全体聚类正样本集DS_ALL和负样本图像提取的特征进行训练,当训练过程中的误检率≤Th_NF1或者时训练层数≥ Th_TL,停止训练,得到训练好的实现人脸与背景分类的主分类器,主分类器是由Th_TL个级联的Boost分类器构成;
子分类器选择模块22,用于采用N1个子分类器,分别提取N1个聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征,并根据聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征进行训练,每个子分类器是由N2个级联的Boost分类器组成;
子分类器训练模块23,用于对子分类器SCi训练ΔTL层,i=1,2,…,N3, j=1,2,…,N3,k=1,2,…,Numj,N3为需要训练的子分类器的数量,统计该样本 Sjk的置信度最大值对应的i,若i≠j,则将该样本Sjk重新分配到DS_SUBi中,重复计算,直至聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}中每个样本都计算完毕;
子分类器重复训练模块24,用于计算第j个子分类器的误检率,若误检率≤Th_NF2,则停止对第j个子分类器的训练,继续对剩余的子分类器重复子分类器训练模块23,直至所有的子分类器都停止训练,得到N1个训练好的实现人脸与背景分类的子分类器SC′i,i=1,2,…,N1
其中,主分类器训练模块21中Th_NF1∈[0.05,0.2],Th_TL∈[40,80], N2∈[100,1000]。优选地,Th_NF1选为0.1,Th_TL选为80,N2选为300。
所述Cascade算法可以通过现有的技术实现。例如,“L.Bourdev,J.Brandt.Robust Object Detection Via Soft Cascade.IEEE Computer Society Conference onComputer Vision&Pattern Recognition,2010,2:236-243vol.2”。
所述Boost分类器可以通过现有的技术实现。例如,“方承志,苏腾云.基于改进型LBP的Floatboost人脸检测.《南京邮电大学学报:自然科学版》,2014, 34(6):75-79”。
所述特征可以选取常用的一些特征,例如LBP特征(全称Local Binary Patterns,局部二值模式)、Haar特征、NPD特征(归一化像素差值)、ICF(积分通道特征)等。
所述子分类器训练模块23中ΔTL∈[10,20],Th_NF2∈[5×10-7,5×10-5]。优选地,ΔTL选为15,Th_NF2选为5×10-6
所述主分类器和子分类器检测模块3进一步包括:
输入图像特征提取模块31,用于若输入图像是彩色图像,对输入图像进行灰度化处理,提取灰度图像的特征;
主分类器分类模块32,用于对整幅灰度图像进行逐窗扫描,得到一系列的窗口图像,利用训练好的主分类器分别对每一个窗口图像的特征进行分类,若分类结果为背景,则将该窗口图像标示为背景;
子分类器分类模块33,用于依次采用训练好的N1个子分类器对未标示的窗口图像的特征进行分类,若N1个子分类器中有一个或者以上的分类结果为人脸,则将该窗口图像标示为人脸,否则将该窗口图像标示为背景;
标示结果输出模块34,用于将标示人脸的窗口图像标签为人脸检测区域,并输出。
所述输入图像特征提取模块31中提取灰度图像的特征可以选取常用的一些特征,例如LBP特征、Haar特征、NPD特征、ICF特征等。
所述主分类器检测模块32中逐窗扫描是以宽度为Wnew、高度为Hnew的矩形窗口依次扫描整幅图像。
所述主分类器分类模块32和子分类器分类模块33中主分类器和子分类器对窗口图像的特征进行分类的子模块进一步包括:
子模块a),用于对未标示的窗口图像,利用第i个Boost分类器根据该窗口图像的特征进行分类,i=1,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则子模块b);
子模块b),用于i=i+1,继续利用第i个Boost分类器根据该窗口图像的特征进行分类,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则继续子模块b),直至所有Boost分类器都分类完毕,将该窗口图像标为人脸。
与现有的人脸检测技术相比,本发明的基于多分类器的人脸检测方法及装置利用K-means聚类算法将样本聚类成多类样本,对多类样本分别进行主分类器和子分类器的训练,最后通过主分类器和子分类器进行二次分类,因此检测准确率较高。本发明的基于多分类器的人脸检测方法及装置可以检测出复杂图像中的人脸,且鲁棒性较高。
其中,所述步骤b)中直至所有Boost分类器都分类完毕,对于主分类器为 Th_TL个级联的Boost分类器都分类完毕,对于子分类器为N2个级联的Boost 分类器都分类完毕。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,应当理解,本发明并不限于这里所描述的实现方案,这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的情况下进行进一步的改进和完善,因此本发明只受到本发明权利要求的内容和范围的限制,其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等同方案。

Claims (8)

1.基于多分类器的人脸检测方法,其特征在于,该方法包括:
第一步骤,选取正样本图像和负样本图像,通过K-means聚类算法对正样本图像进行聚类,获取聚类正样本集;
第二步骤,采用Cascade算法分别利用主分类器和子分类器对聚类正样本集和负样本图像进行训练,获取训练好的主分类器和子分类器;
第三步骤,输入图像,根据训练好的主分类器和子分类器对输入的图像进行检测,输出检测结果;
其中,所述第二步骤包括:
主分类器训练步骤,采用Cascade算法利用主分类器提取全体聚类正样本集DS_ALL和负样本图像的特征,对全体聚类正样本集DS_ALL和负样本图像提取的特征进行训练,当训练过程中的误检率≤Th_NF1或者时训练层数≥Th_TL,停止训练,得到训练好的实现人脸与背景分类的主分类器,主分类器是由Th_TL个级联的Boost分类器构成;
子分类器选择步骤,采用N1个子分类器,分别提取N1个聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征,并根据聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征进行训练,每个子分类器是由N2个级联的Boost分类器组成;
子分类器训练步骤,对子分类器SCi训练ΔTL层,分别计算聚类正样本集DS_SUBj中每个样本Sjk在第i个子分类器SCi中的置信度S_ijk,i=1,2,…,N3,j=1,2,…,N3,k=1,2,…,Numj,N3为需要训练的子分类器的数量,统计该样本Sjk的置信度最大值对应的i,若i≠j,则将该样本Sjk重新分配到DS_SUBi中,重复计算,直至聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}中每个样本都计算完毕;
子分类器重复训练步骤,计算第j个子分类器的误检率,若误检率≤Th_NF2,则停止对第j个子分类器的训练,继续对剩余的子分类器重复子分类器训练步骤,直至所有的子分类器都停止训练,得到N1个训练好的实现人脸与背景分类的子分类器SC′i,i=1,2,…,N1
其中所述Th_NF1∈[0.05,0.2],Th_TL∈[40,80],N2∈[100,1000],ΔTL∈[10,20],Th_NF2∈[5×10-7,5×10-5]。
2.如权利要求1所述的方法,其特征在于,所述第一步骤包括:
样本选取步骤,选取人脸图像为正样本图像,非人脸图像为负样本图像;
聚类样本集获取步骤,将正样本图像缩小成宽度为Wnew、高度为Hnew的新正样本图像,每个新正样本图像用Wnew*Hnew个特征向量表示,将全体的新正样本图像集作为全体聚类正样本集DS_ALL,使用K-means聚类算法将全体聚类正样本集DS_ALL聚类为N1个聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1};其中,所述Wnew∈[6,24],Hnew∈[6,24],N1∈[3,7]。
3.如权利要求1所述的方法,其特征在于,所述第三步骤包括:
输入图像特征提取步骤,若输入图像是彩色图像,对输入图像进行灰度化处理,提取灰度图像的特征;
主分类器分类步骤,对整幅灰度图像进行逐窗扫描,得到一系列的窗口图像,利用训练好的主分类器分别对每一个窗口图像的特征进行分类,若分类结果为背景,则将该窗口图像标示为背景;
子分类器分类步骤,依次采用训练好的N1个子分类器对未标示的窗口图像的特征进行分类,若N1个子分类器中有一个或者以上的分类结果为人脸,则将该窗口图像标示为人脸,否则将该窗口图像标示为背景;
标示结果输出步骤,将标示人脸的窗口图像标签为人脸检测区域,并输出。
4.如权利要求3所述的方法,其特征在于,所述主分类器和子分类器对窗口图像的特征进行分类的步骤包括:
步骤a),对未标示的窗口图像,利用第i个Boost分类器根据该窗口图像的特征进行分类,i=1,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则步骤b);
步骤b),i=i+1,继续利用第i个Boost分类器根据该窗口图像的特征进行分类,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则继续步骤b),直至所有Boost分类器都分类完毕,将该窗口图像标为人脸。
5.基于多分类器的人脸检测装置,其特征在于,该装置包括:
负样本和聚类正样本集获取模块,用于选取正样本图像和负样本图像,通过K-means聚类算法对正样本图像进行聚类,获取聚类正样本集;
主分类器和子分类器训练模块,用于采用Cascade算法分别利用主分类器和子分类器对聚类正样本集和负样本图像进行训练,获取训练好的主分类器和子分类器;
主分类器和子分类器检测模块,用于输入图像,根据训练好的主分类器和子分类器对输入的图像进行检测,输出检测结果;
其中,所述主分类器和子分类器训练模块包括:
主分类器训练模块,用于采用Cascade算法利用主分类器提取全体聚类正样本集DS_ALL和负样本图像的特征,对全体聚类正样本集DS_ALL和负样本图像提取的特征进行训练,当训练过程中的误检率≤Th_NF1或者时训练层数≥Th_TL,停止训练,得到训练好的实现人脸与背景分类的主分类器,主分类器是由Th_TL个级联的Boost分类器构成;
子分类器选择模块,用于采用N1个子分类器,分别提取N1个聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征,并根据聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}和负样本图像的样本特征进行训练,每个子分类器是由N2个级联的Boost分类器组成;
子分类器训练模块,用于对子分类器SCi训练ΔTL层,i=1,2,…,N3,j=1,2,…,N3,k=1,2,…,Numj,N3为需要训练的子分类器的数量,统计该样本Sjk的置信度最大值对应的i,若i≠j,则将该样本Sjk重新分配到DS_SUBi中,重复计算,直至聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1}中每个样本都计算完毕;
子分类器重复训练模块,用于计算第j个子分类器的误检率,若误检率≤Th_NF2,则停止对第j个子分类器的训练,继续对剩余的子分类器重复子分类器训练模块,直至所有的子分类器都停止训练,得到N1个训练好的实现人脸与背景分类的子分类器SC′i,i=1,2,…,N1
其中,所述Th_NF1∈[0.05,0.2],Th_TL∈[40,80],N2∈[100,1000],ΔTL∈[10,20],Th_NF2∈[5×10-7,5×10-5]。
6.如权利要求5所述的装置,其特征在于,所述负样本和聚类正样本集获取模块进一步包括:
样本选取模块,用于选取人脸图像为正样本图像,非人脸图像为负样本图像;聚类样本集获取模块,用于将正样本图像缩小成宽度为Wnew、高度为Hnew的新正样本图像,每个新正样本图像用Wnew*Hnew个特征向量表示,将全体的新正样本图像集作为全体聚类正样本集DS_ALL,使用K-means聚类算法将全体聚类正样本集聚类为N1个聚类正样本集{DS_SUB1,DS_SUB2,…,DS_SUBN1};
其中,所述Wnew∈[6,24],Hnew∈[6,24],N1∈[3,7]。
7.如权利要求5所述的装置,其特征在于,所述主分类器和子分类器检测模块包括:
输入图像特征提取模块,用于若输入图像是彩色图像,对输入图像进行灰度化处理,提取灰度图像的特征;
主分类器分类模块,用于对整幅灰度图像进行逐窗扫描,得到一系列的窗口图像,利用训练好的主分类器分别对每一个窗口图像的特征进行分类,若分类结果为背景,则将该窗口图像标示为背景;
子分类器分类模块,用于依次采用训练好的N1个子分类器对未标示的窗口图像的特征进行分类,若N1个子分类器中有一个或者以上的分类结果为人脸,则将该窗口图像标示为人脸,否则将该窗口图像标示为背景;
标示结果输出模块,用于将标示人脸的窗口图像标签为人脸检测区域,并输出。
8.如权利要求7所述的装置,其特征在于,所述主分类器和子分类器对窗口图像的特征进行分类的子模块进一步包括:
子模块a),用于对未标示的窗口图像,利用第i个Boost分类器根据该窗口图像的特征进行分类,i=1,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则子模块b);
子模块b),用于i=i+1,继续利用第i个Boost分类器根据该窗口图像的特征进行分类,若第i个Boost分类器分类为背景,则将该窗口图像标为背景,直接输出该结果,否则继续子模块b),直至所有Boost分类器都分类完毕,将该窗口图像标为人脸。
CN201610487857.XA 2016-06-28 2016-06-28 基于多分类器的人脸检测方法及装置 Active CN106407878B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610487857.XA CN106407878B (zh) 2016-06-28 2016-06-28 基于多分类器的人脸检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610487857.XA CN106407878B (zh) 2016-06-28 2016-06-28 基于多分类器的人脸检测方法及装置

Publications (2)

Publication Number Publication Date
CN106407878A CN106407878A (zh) 2017-02-15
CN106407878B true CN106407878B (zh) 2019-08-13

Family

ID=58006803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610487857.XA Active CN106407878B (zh) 2016-06-28 2016-06-28 基于多分类器的人脸检测方法及装置

Country Status (1)

Country Link
CN (1) CN106407878B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108198160B (zh) * 2017-12-28 2019-12-17 深圳云天励飞技术有限公司 图像处理方法、装置、图像过滤方法、电子设备及介质
CN109034052B (zh) * 2018-07-24 2021-04-02 深圳市科脉技术股份有限公司 人脸检测方法及装置
CN111368926B (zh) * 2020-03-06 2021-07-06 腾讯科技(深圳)有限公司 图像筛选方法、装置和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236608A (zh) * 2008-01-25 2008-08-06 清华大学 基于图片几何结构的人脸检测方法
CN101667245A (zh) * 2009-09-25 2010-03-10 西安电子科技大学 基于支持向量新颖检测分类器级联的人脸检测方法
CN102208009A (zh) * 2010-03-31 2011-10-05 索尼公司 分类器及分类方法
CN104778474A (zh) * 2015-03-23 2015-07-15 四川九洲电器集团有限责任公司 一种用于目标检测的分类器构建方法及目标检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7099510B2 (en) * 2000-11-29 2006-08-29 Hewlett-Packard Development Company, L.P. Method and system for object detection in digital images

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236608A (zh) * 2008-01-25 2008-08-06 清华大学 基于图片几何结构的人脸检测方法
CN101667245A (zh) * 2009-09-25 2010-03-10 西安电子科技大学 基于支持向量新颖检测分类器级联的人脸检测方法
CN102208009A (zh) * 2010-03-31 2011-10-05 索尼公司 分类器及分类方法
CN104778474A (zh) * 2015-03-23 2015-07-15 四川九洲电器集团有限责任公司 一种用于目标检测的分类器构建方法及目标检测方法

Also Published As

Publication number Publication date
CN106407878A (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN109522853B (zh) 面向监控视频的人脸检测与搜索方法
CN105574505B (zh) 一种多摄像机间人体目标再识别的方法及系统
CN108520226B (zh) 一种基于躯体分解和显著性检测的行人重识别方法
CN109558810B (zh) 基于部位分割与融合目标人物识别方法
Mady et al. Face recognition and detection using Random forest and combination of LBP and HOG features
CN105574509B (zh) 一种基于光照的人脸识别系统回放攻击检测方法及应用
Cerna et al. Face detection: Histogram of oriented gradients and bag of feature method
WO2021000829A1 (zh) 多维度身份信息识别方法、装置、计算机设备及存储介质
CN102799870A (zh) 基于分块一致lbp和稀疏编码的单训练样本人脸识别方法
Rouhi et al. A review on feature extraction techniques in face recognition
CN101383008A (zh) 基于视觉注意模型的图像分类方法
CN106407878B (zh) 基于多分类器的人脸检测方法及装置
CN106682578A (zh) 基于眨眼检测的人脸识别方法
CN106778786A (zh) 基于对数频域分层梯度方向直方图的苹果病害识别方法
CN104598881B (zh) 基于特征压缩与特征选择的歪斜场景文字识别方法
CN109190456A (zh) 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法
Sagana et al. Object Recognition System for Visually Impaired People
Zhang et al. Iris image classification based on color information
Sikander et al. Facial feature detection: A facial symmetry approach
CN109389017A (zh) 行人再识别方法
Hewitt et al. Active learning in face recognition: Using tracking to build a face model
CN103366163A (zh) 基于增量学习的人脸检测系统和方法
CN113591519A (zh) 一种手势识别处理方法
Wang et al. Eye detection based on head contour geometry and wavelet subband projection
CN104809435B (zh) 一种基于视觉一致性约束的图像目标分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20170215

Assignee: Zhongguancun Technology Leasing Co.,Ltd.

Assignor: Beijing ICETech Science & Technology Co.,Ltd.

Contract record no.: X2023980041869

Denomination of invention: Face detection method and device based on multiple classifiers

Granted publication date: 20190813

License type: Exclusive License

Record date: 20230915

EE01 Entry into force of recordation of patent licensing contract
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Face detection method and device based on multiple classifiers

Effective date of registration: 20230918

Granted publication date: 20190813

Pledgee: Zhongguancun Technology Leasing Co.,Ltd.

Pledgor: Beijing ICETech Science & Technology Co.,Ltd.

Registration number: Y2023980057373

PE01 Entry into force of the registration of the contract for pledge of patent right