CN105488456B - 基于自适应阈值调整拒识子空间学习的人脸检测方法 - Google Patents
基于自适应阈值调整拒识子空间学习的人脸检测方法 Download PDFInfo
- Publication number
- CN105488456B CN105488456B CN201510811406.2A CN201510811406A CN105488456B CN 105488456 B CN105488456 B CN 105488456B CN 201510811406 A CN201510811406 A CN 201510811406A CN 105488456 B CN105488456 B CN 105488456B
- Authority
- CN
- China
- Prior art keywords
- sample
- face
- rejection
- classifier
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000001514 detection method Methods 0.000 claims abstract description 21
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 238000005070 sampling Methods 0.000 claims description 8
- 230000001815 facial effect Effects 0.000 claims description 6
- 238000005286 illumination Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 3
- 239000010931 gold Substances 0.000 claims description 3
- 229910052737 gold Inorganic materials 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 210000003813 thumb Anatomy 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 2
- 230000036544 posture Effects 0.000 claims 1
- 238000011160 research Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24317—Piecewise classification, i.e. whereby each classification requires several discriminant rules
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于自适应阈值调整拒识子空间学习的人脸检测方法,步骤为:S1,采集人脸和非人脸图像,进行灰度和尺寸归一化处理后形成训练样本集合;S2,利用训练样本集合,采用Boosting算法和互信息最大化准则训练人脸检测模型中第k层的强分类器;S3,采用修正的互信息最大化学习准则自适应的调整人脸检测模型中第k层强分类器的最优拒识阈值,得到带拒识的强分类器;S4,利用带拒识的强分类器在训练集上筛选出拒识的样本作为第k+1层分类器的训练样本;S5,重复S2至S4直至满足收敛性条件;S6,利用带拒识的强分类器对待检测的图像进行人脸检测。该方法缩减人脸检测模型的复杂度,提高人脸检测模型的灵活性。
Description
技术领域
本发明涉及计算机视觉、模式识别和机器学习等技术领域,特别是涉及了一种基于自适应阈值调整拒识子空间学习的人脸检测方法。
背景
人脸检测的目的是在图像或视频中自动判定人脸是否出现以及人脸出现的位置、大小以及姿态等。人脸检测是计算机视觉和人脸研究中一个非常重要的研究内容,其在智能图像处理、模式识别、机器学习、智能视频监控等众多研究和应用领域都有着重要的研究意义和广泛的应用价值,人脸检测技术也受到了众多研究人员和公司部分的广泛关注和发展。虽然人脸检测得到了很多的关注和研究,鲁邦性的人脸检测一直是一个非常艰巨和富于挑战性的课题,这主要体现在以下几个方面:现实中的人脸往往存在许多差异,如姿态的变化(正面脸和侧面脸等)、表情的变化(如严肃和大笑等)以及容貌上的差异(如亚洲人种和欧洲人种的差异)等等;由于拍照条件和环境的变化引入的影响,如不同的光照条件(强光照和弱光照)和人脸的遮挡(眼睛、口罩)等;实时性人脸检测,由于无法准确的确定人脸的位置和大小,人脸检测算法通常采取滑动窗口的方法进行判断,该方法需要扫描海量的候选窗口,对实时性的人脸检测带来了很大的负担。
目前关于人脸检测问题人们提出过很多解决方案,这其中基于学习的方法在人脸检测领域取得了很好的效果,特别是基于统计特征的方法。该类方法旨在从大量训练数据中挖掘出类别本身的统计特性,并利用学习得到的统计特性对新样本进行分类,其中最具代表性的人脸检测模型是Viola Jones于2001年提出的级联Boosting分类器人脸检测模型,该人脸检测模型主要有以下三个特点:利用积分图像和Haar特征进行快速的特征计算;利用Boosting算法进行特征选择和弱分类器学习;利用级联检测器框架有效的拒绝大量非人脸窗口。该框架在提高检测精度的同时达到了实时性的检测要求,也得到研究人员和公司的广泛发展和应用。虽然级联Boosting分类器具有优异的性能和快速的检测速度,该类方法中每一层强分类器仅是一个二值分类器(人脸窗输出为1、非人脸窗输出为0),并将所有的人脸窗口和错分的非人脸窗口都放到下一层去继续训练,这种策略限制了人脸检测模型的灵活性,人脸检测模型训练起来也非常复杂和耗时,最终得到的人脸检测模型往往层数很多。如何缩减人脸检测模型的复杂度,提高人脸检测模型的灵活性仍是一个亟待解决的问题。
发明内容
为了解决复杂度和灵活性的问题,本发明提出一种基于自适应阈值调整拒识子空间学习的人脸检测方法,有效地缩减了人脸检测模型的复杂度,提高了人脸检测模型的灵活性。
本发明提出的基于自适应阈值调整拒识子空间学习的人脸检测方法,包括如下步骤:
步骤S1,采集人脸和非人脸图像,并将所有图像进行灰度处理,将图像尺寸缩放至统一像素大小A,构成训练样本集合;其中人脸图像为正样本、非人脸图像为负样本;
步骤S2,利用步骤S1中的训练样本集合,采用Boosting算法和互信息最大化准则训练人脸检测模型中第k层的强分类器;
步骤S3,计算修正的互信息,利用修正的互信息最大化学习准则自适应的调整人脸检测模型中第k层强分类器的最优拒识阈值,得到带拒识的强分类器;
步骤S4,利用步骤S3中已训练完成的前k层强分类器,在训练集上筛选出拒识的样本作为第k+1层分类器的训练样本;
步骤S5,重复步骤S2至S4直至满足收敛性条件;
步骤S6,给定待检测的图像,构建图像金字塔将待检测图像大小缩放至A,并在图像金字塔的每一层滑动窗口采样,利用训练得到的每一层带拒识的强分类器对每一个采样窗口进行判定,并将判定为人脸的采样窗口还原到待检测的图像上,通过对待检测的图像上所有人脸窗口进行聚类得到最终的人脸检测结果。
优选的,步骤S1中正样本为不同光照、不同姿态情况下的人脸图像;负样本采集方式为先采集一个负样本子集进行训练,对采用通过步骤S2至S5训练好的人脸检测模型进行测试,将人脸检测模型误检的负样本对象进行增量采集加入负样本集中,通过N次反复训练和测试得到最终的负样本集合。
优选的,步骤S2中,人脸检测模型中每层的强分类器均由弱分类器w构成,利用Boosting算法和互信息最大化准则训练人脸检测模型中第k层的强分类器步骤如下:
步骤S21,选取Haar特征,利用总体互信息最大化准则进行弱分类器w的学习,选取互信息最大的阈值为当前弱分类器的阈值;
步骤S22,利用S21所述方法计算得到每一个Haar特征对应的弱分类器及其对应的互信息值,选取互信息值最大的弱分类器为当前迭代轮的弱分类器wt;
步骤S23,根据样本在弱分类器wt下的输出值设定样本权重,样本权重计算公式为
其中,表示t-1轮迭代后样本i的权重,Li表示样本i的真实类别,ht(xi)为样本i的预测类别,Zt为归一化因子;
步骤S24,重复步骤S21-S23直至满足收敛性条件。
优选的,步骤S3中,计算修正的互信息,利用修正的互信息最大化学习准则自适应的调整人脸检测模型中第k层强分类器的最优拒识阈值的步骤如下:
步骤S31,计算每个样本在第k层强分类器下的输出值Fi,并设定强分类器的正、负样本的初始拒识阈值Tk1、Tk2;
其中T为当前强分类器包含的弱分类器总数;
步骤S32,利用非参数估算方法估计正、负样本输出值的条件概率密度;
步骤S33,计算修正的互信息,求解修正的互信息关于参数Tk1,Tk2的一阶导数,利用拟牛顿法迭代求解互信息最大化问题,得到最优的拒识阈值。
优选的,步骤S32中采用的非参数估计方法为Parzen窗法,利用该方法估算正、负样本的条件概率密度和其估算公式如下
其中为正样本的条件概率密度,为负样本的条件概率密度,G(·,σ2)表示高斯核函数,σ表示窗宽。
优选的,所述的窗宽σ采用大拇指准则进行估算。
优选的,步骤S4中,筛选第k+1层的训练样本时,将初始正、负样本集分别输入已训练好的前k层人脸检测模型,将前k层人脸检测模型均不能进行确定的分类的样本作为第k+1层分类器的训练样本。
优选的,步骤S3中,计算修正的互信息的公式为
其中,(t1,t2)为给定的一组拒识阈值,N为正、负样本总数,TP(t2)表示真实类别和预测类别均为正样本的样本数,FN(t1)表示真实类别为正样本,预测类别为负样本的样本数;FP(t2)表示真实类别为负样本,预测类别为正样本的样本数;TN(t1)表示真实类别和预测类别均为负样本的样本数;P(+1)与P(-1)分别是正样本和负样本的先验概率。
优选的,所述的弱分类器w为区域分割分类器。
优选的,步骤5中的收敛条件为总体分类器层数或已收集不到足够的正、负样本用于训练。
优选的,步骤S5的具体步骤为:给定待检测的图像,首先利用下采样构建图像金字塔,直至将图像缩放至A大小,并计算每一层金字塔的积分图;其次在每一层金字塔上滑动A大小的窗口,并利用训练得到的每一层带拒识的强分类器对每一个滑动窗口进行判定,将判定为人脸的窗口还原到待检测的图像上,最终对待检测的图像上所有候选人脸窗口进行聚类得到最后的人脸检测结果。
本发明通过分层处理处理的方式,显著的降低了人脸检测模型训练的复杂度,利用带拒识的强分类器提高了人脸检测模型的灵活度并加快了检测速度,并且各层中强分类器的最优拒识阈值是基于数据分布的统计特性而自动确定,从而实现了自适应阈值调整的功能。
附图说明
图1示出本发明人脸检测方法的结构示意图;
图2示出本发明人脸检测方法的人脸检测模型训练过程的算法流程图;
图3示出本发明人脸检测方法中每一层强分类器训练过程中的算法流程图;
图4示出本发明人脸检测方法中检测过程的算法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
本发明通过基于拒识子空间构建的人脸检测模型可以更加灵活的在分类器的每一层进行判断,并利用互信息最大化准则训练分类器,从而得到的检测具有更好的鲁棒性和灵活性。
本发明的基于自适应阈值调整拒识子空间学习的人脸检测方法如图1、图2所示,包括以下步骤:
步骤S1,采集一定的人脸和非人脸图像,并将所有图像进行灰度处理,将图像尺寸缩放至统一像素大小A,构成训练样本集合。图像尺寸缩放至统一像素大小A为24*24。
其中人脸图像为正样本、非人脸图像为负样本,正样本为不同光照、不同姿态情况下的人脸图像;负样本采集方式为先采集一个负样本子集进行训练,采用如下步骤S2至S5训练好的人脸检测模型进行测试,将人脸检测模型误检的负样本对象进行增量采集加入负样本集中,通过N次反复训练和测试得到最终的负样本集合。
步骤S2,利用步骤S1中的训练样本集合,采用Boosting算法和互信息最大化准则训练人脸检测模型中第k层的强分类器;如图3所示。
本实施例中人脸检测模型中每层的强分类器均由弱分类器w构成;
步骤S21,选取Haar特征,利用总体互信息最大化准则进行弱分类器w的学习,选取互信息最大的阈值为当前弱分类器的阈值;
为了简化训练人脸检测模型和加快检测速度,本实施例中我们选取Haar类型的特征,弱分类器类型为区域分割分类器(Domain-Partition Classifier),本实施例中将特征值划分为两个区域,对应的弱分类器w有一个待确定阈值τ和两个输出值(r1,r2),且r1=ln((W1,+1+ε)/(W1,-1+ε))/2,r2=ln((W2,+1+ε)/(W2,-1+ε))/2。Wij为第i个区域内类别为j的样本总权重。弱分类器的每一个阈值都对应一个分类的混淆矩阵C,如公式(1)所示,其中Cij表示真实类别为i但预测类别为j的样本数,
利用混淆矩阵(1)计算得到其对应的互信息,计算公式如公式(2)所示,
其中,l表示样本的真实类别;y表示样本的判定类别;MI表示当前特征和弱分类器阈值下真实分布和预测分布之间的经验互信息;p(l,y)表示样本的真实类别和判定类别的联合概率密度;p(l)表示样本的真实类别的概率密度;p(y)表示样本的判定类别的概率密度;Ni=ci,+1+ci,-1表示真实类别为i的样本数量;表示预测类别为j的样本数量;N是全体样本数量。通过遍历所有的阈值以及计算其对应的互信息,选取互信息最大的阈值为当前弱分类器的阈值。
步骤S22,利用S21所述方法计算得到每一个Haar特征对应的弱分类器及其对应的互信息值,选取互信息值最大的弱分类器为当前迭代轮的弱分类器wt;
步骤S23,根据样本在弱分类器wt下的输出值设定样本权重,样本权重的计算如公式(3)所示
其中,表示t-1轮迭代后样本i的权重,Zt为归一化因子,Li表示样本i的真实类别,,ht(xi)为样本i的预测类别;Zt的计算如公式(4)所示,Li的取之如公式(5)所示。
步骤S24,重复步骤S21-S23直至满足收敛性条件。
步骤S3,计算修正的互信息,利用修正的互信息最大化学习准则自适应的调整人脸检测模型中第k层强分类器的最优拒识阈值,得到带拒识的强分类器;
步骤S31,计算每个样本在第k层强分类器下的输出值Fi,并设定强分类器的正、负样本的初始拒识阈值Tk1、Tk2;Fi的计算如公式(6)所示。
其中T为当前强分类器包含的弱分类器总数;
步骤S32,利用非参数估算方法估计正、负样本输出值的条件概率密度;
本实施例采用的非参数估计方法为Parzen窗法,利用该方法估算正、负样本的条件概率密度和其估算如公式(7)、公式(8)所示
其中为正样本的条件概率密度,为负样本的条件概率密度,G(·,σ2)表示高斯核函数,σ表示窗宽。窗宽σ采用大拇指准则(Rule of Thumb)进行估算。
步骤S33,计算修正的互信息,求解修正的互信息关于参数Tk1,Tk2的一阶导数,利用拟牛顿法迭代求解互信息最大化问题,得到最优的拒识阈值。
其中给定一组拒识阈值(t1,t2),其对应的分类混淆矩阵可以表示如表1所示。
表1分类器对应阈值(t1,t2)的分类混淆矩阵
表1中,+1表示正样本,-1表示负样本,0表示拒识的样本;TP(t2)表示真实类别和预测类别均为+1的样本数,TN(t1)表示真实类别和预测类别均为-1的样本数;FN(t1)表示真实类别为+1,预测类别为-1的样本数;FP(t2)表示真实类别为-1,预测类别为+1的样本数;RP(t1,t2)表示真实类别为+1但被拒识的样本数;RN(t1,t2)表示真实类别为-1但被拒识的样本数;N表示正、负样本总数;N+表示真实类别为+1的样本数;N-表示真实类别为-1的样本数;表示预测类别为+1的样本数;表示预测类别为-1的样本数;NR表示被拒识的样本数。
考虑到引入拒识项带来的退化现象,此处我们利用公式(9)计算修正的互信息值,P(+1)与P(-1)分别是正样本和负样本的先验概率,
计算可得MMI(t1,t2)关于(t1,t2)的导数分别如公式(10)、公式(11),
利用拟牛顿法求解修正互信息最大化问题,得到最优决策阈值即第k层强分类器的决策阈值Tk1,Tk2。
步骤S4,利用步骤S3中已训练完成的前k层强分类器,在训练集上筛选出拒识的样本作为第k+1层分类器的训练样本;
利用已训练完成的前k层强分类器,收集第k+1层人脸检测模型的训练样本,将初始正、负样本集分别输入已训练好的前k层人脸检测模型,如果前k层人脸检测模型均不能对样本进行确定的分类,则将其放入第k+1层的训练集中,由此收集完k+1层的训练样本。
步骤S5,重复步骤S2至S4多次直至满足收敛性条件。
本发明的收敛条件为总体分类器层数或已收集不到足够的正、负样本用于训练;当总体分类器层数小于设定阈值或已收集不到足够的正、负样本用于训练时执行步骤S6。
步骤S6,给定待检测的图像,首先利用下采样构建图像金字塔,直至将图像缩放至24*24大小,并计算每一层金字塔的积分图;其次在每一层金字塔上滑动24*24大小的窗口,并利用训练得到的每一层带拒识的强分类器对每一个滑动窗口进行判定,将判定为人脸的窗口还原到待检测的图像上,最终对待检测的图像上所有候选人脸窗口进行聚类得到最后的人脸检测结果。如图4所示。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应理解的是,以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,该方法包括如下步骤:
步骤S1,采集人脸和非人脸图像,并将所有图像进行灰度处理,将图像尺寸缩放至统一像素大小A,构成训练样本集合;其中人脸图像为正样本、非人脸图像为负样本;
步骤S2,利用步骤S1中的训练样本集合,采用Boosting算法和互信息最大化准则训练人脸检测模型中第k层的强分类器;
步骤S3,计算修正的互信息,利用修正的互信息最大化学习准则自适应的调整人脸检测模型中第k层强分类器的最优拒识阈值,得到带拒识的强分类器;
步骤S4,利用步骤S3中已训练完成的前k层强分类器,在训练集上筛选出拒识的样本作为第k+1层分类器的训练样本;
步骤S5,重复步骤S2至S4直至满足收敛性条件;
步骤S6,给定待检测的图像,构建图像金字塔将待检测图像大小缩放至A,并在图像金字塔的每一层滑动窗口采样,利用训练得到的每一层带拒识的强分类器对每一个采样窗口进行判定,并将判定为人脸的采样窗口还原到待检测的图像上,通过对待检测的图像上所有人脸窗口进行聚类得到最终的人脸检测结果;
其中,
所述人脸检测模型中每层的强分类器均由弱分类器w构成;
相应地,步骤S2中“采用Boosting算法和互信息最大化准则训练人脸检测模型中第k层的强分类器”的步骤包括:
步骤S21,选取Haar特征,利用总体互信息最大化准则进行弱分类器w的学习,选取互信息最大的阈值为当前弱分类器的阈值;
步骤S22,利用步骤S21计算得到每一个Haar特征对应的弱分类器及其对应的互信息值,选取互信息值最大的弱分类器为当前迭代轮的弱分类器wt;
步骤S23,根据样本在弱分类器wt下的输出值设定样本权重,样本权重计算公式为
其中,表示t-1轮迭代后样本i的权重,Li表示样本i的真实类别,ht(xi)为样本i的预测类别,Zt为归一化因子;
步骤S24,重复步骤S21-S23直至满足收敛性条件。
2.如权利要求1所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,步骤S1中正样本为不同光照、不同姿态情况下的人脸图像;负样本采集方式为先采集一个负样本子集进行训练,对采用通过步骤S2至S5训练好的人脸检测模型进行测试,将人脸检测模型误检的负样本对象进行增量采集加入负样本集中,通过N次反复训练和测试得到最终的负样本集合。
3.如权利要求1所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,步骤S3中,计算修正的互信息,利用修正的互信息最大化学习准则自适应的调整人脸检测模型中第k层强分类器的最优拒识阈值的步骤如下:
步骤S31,计算每个样本在第k层强分类器下的输出值Fi,并设定强分类器的正、负样本的初始拒识阈值Tk1、Tk2;
其中T为当前强分类器包含的弱分类器总数;
步骤S32,利用非参数估算方法估计正、负样本输出值的条件概率密度;
步骤S33,计算修正的互信息,求解修正的互信息关于参数Tk1,Tk2的一阶导数,利用拟牛顿法迭代求解互信息最大化问题,得到最优的拒识阈值。
4.如权利要求3所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,步骤S32中采用的非参数估计方法为Parzen窗法,利用该方法估算正、负样本的条件概率密度和其估算公式如下
其中为正样本的条件概率密度,为负样本的条件概率密度,G(·,σ2)表示高斯核函数,σ表示窗宽。
5.如权利要求4所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,所述的窗宽σ采用大拇指准则进行估算。
6.如权利要求1-5中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,步骤S4中,筛选第k+1层的训练样本时,将初始正、负样本集分别输入已训练好的前k层人脸检测模型,将前k层人脸检测模型均不能进行确定的分类的样本作为第k+1层分类器的训练样本。
7.如权利要求1-5中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,步骤S3中,计算修正的互信息的公式为
其中,(t1,t2)为给定的一组拒识阈值,N为正、负样本总数,TP(t2)表示真实类别和预测类别均为正样本的样本数,FN(t1)表示真实类别为正样本,预测类别为负样本的样本数;FP(t2)表示真实类别为负样本,预测类别为正样本的样本数;TN(t1)表示真实类别和预测类别均为负样本的样本数;P(+1)与P(-1)分别是正样本和负样本的先验概率。
8.如权利要求1-5中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,所述的弱分类器w为区域分割分类器。
9.如权利要求1-5中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,步骤5中的收敛条件为总体分类器层数或已收集不到足够的正、负样本用于训练。
10.如权利要求1-5中任一项所述的基于自适应阈值调整拒识子空间学习的人脸检测方法,其特征在于,步骤S5的具体步骤为:给定待检测的图像,首先利用下采样构建图像金字塔,直至将图像缩放至A大小,并计算每一层金字塔的积分图;其次在每一层金字塔上滑动A大小的窗口,并利用训练得到的每一层带拒识的强分类器对每一个滑动窗口进行判定,将判定为人脸的窗口还原到待检测的图像上,最终对待检测的图像上所有候选人脸窗口进行聚类得到最后的人脸检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510811406.2A CN105488456B (zh) | 2015-11-23 | 2015-11-23 | 基于自适应阈值调整拒识子空间学习的人脸检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510811406.2A CN105488456B (zh) | 2015-11-23 | 2015-11-23 | 基于自适应阈值调整拒识子空间学习的人脸检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105488456A CN105488456A (zh) | 2016-04-13 |
CN105488456B true CN105488456B (zh) | 2019-04-23 |
Family
ID=55675428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510811406.2A Active CN105488456B (zh) | 2015-11-23 | 2015-11-23 | 基于自适应阈值调整拒识子空间学习的人脸检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105488456B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127131A (zh) * | 2016-06-17 | 2016-11-16 | 安徽理工大学 | 一种基于互信息无参数局部保持投影算法的人脸识别方法 |
CN106231434B (zh) * | 2016-07-25 | 2019-09-10 | 武汉斗鱼网络科技有限公司 | 一种基于人脸检测的直播互动特效实现方法及系统 |
CN108022331B (zh) * | 2016-11-01 | 2022-02-18 | 腾讯科技(深圳)有限公司 | 门禁系统中实现人脸识别的方法和装置 |
CN106803909A (zh) * | 2017-02-21 | 2017-06-06 | 腾讯科技(深圳)有限公司 | 一种视频文件的生成方法及终端 |
CN107103296A (zh) * | 2017-04-20 | 2017-08-29 | 四川大学 | 基于完全矫正Boosting和子空间学习算法的步态识别方法 |
CN107856628A (zh) * | 2017-07-07 | 2018-03-30 | 安徽摩尼电子科技有限公司 | 一种车载儿童探测报警装置 |
WO2019010640A1 (zh) * | 2017-07-12 | 2019-01-17 | 中国科学院自动化研究所 | 图像美感评估方法及装置 |
CN108537272A (zh) * | 2018-04-08 | 2018-09-14 | 上海天壤智能科技有限公司 | 用于检测和分析仓位的方法和装置 |
CN108564019A (zh) * | 2018-04-08 | 2018-09-21 | 深浅度视觉科技(大连)有限公司 | 一种人脸识别方法及系统 |
CN108960201A (zh) * | 2018-08-01 | 2018-12-07 | 西南石油大学 | 一种基于人脸关键点提取和稀疏表达分类的表情识别方法 |
CN110046601B (zh) * | 2019-04-24 | 2023-04-07 | 南京邮电大学 | 针对十字路口场景的行人检测方法 |
CN110956981B (zh) * | 2019-12-06 | 2022-04-26 | 湖北文理学院 | 语音情感识别方法、装置、设备及存储介质 |
CN113221820B (zh) * | 2021-05-28 | 2022-07-19 | 杭州网易智企科技有限公司 | 一种对象识别方法、装置、设备及介质 |
CN114387620A (zh) * | 2022-01-05 | 2022-04-22 | 北京容积视觉科技有限公司 | 一种基于Adaboost的头部定位方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5781650A (en) * | 1994-02-18 | 1998-07-14 | University Of Central Florida | Automatic feature detection and age classification of human faces in digital images |
CN1731417A (zh) * | 2005-08-19 | 2006-02-08 | 清华大学 | 复杂背景图像中的鲁棒人脸检测方法 |
CN1971630A (zh) * | 2006-12-01 | 2007-05-30 | 浙江工业大学 | 基于人脸鉴别技术的门禁和考勤装置 |
CN103473556A (zh) * | 2013-08-30 | 2013-12-25 | 中国科学院自动化研究所 | 基于拒识子空间的分层支持向量机分类方法 |
CN105069430A (zh) * | 2015-08-05 | 2015-11-18 | 杭州南江机器人股份有限公司 | 一种基于msnrd特征的多姿态人脸检测器的设计方法 |
-
2015
- 2015-11-23 CN CN201510811406.2A patent/CN105488456B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5781650A (en) * | 1994-02-18 | 1998-07-14 | University Of Central Florida | Automatic feature detection and age classification of human faces in digital images |
CN1731417A (zh) * | 2005-08-19 | 2006-02-08 | 清华大学 | 复杂背景图像中的鲁棒人脸检测方法 |
CN1971630A (zh) * | 2006-12-01 | 2007-05-30 | 浙江工业大学 | 基于人脸鉴别技术的门禁和考勤装置 |
CN103473556A (zh) * | 2013-08-30 | 2013-12-25 | 中国科学院自动化研究所 | 基于拒识子空间的分层支持向量机分类方法 |
CN105069430A (zh) * | 2015-08-05 | 2015-11-18 | 杭州南江机器人股份有限公司 | 一种基于msnrd特征的多姿态人脸检测器的设计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105488456A (zh) | 2016-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105488456B (zh) | 基于自适应阈值调整拒识子空间学习的人脸检测方法 | |
CN107134144B (zh) | 一种用于交通监控的车辆检测方法 | |
CN110070074B (zh) | 一种构建行人检测模型的方法 | |
CN108921051B (zh) | 基于循环神经网络注意力模型的行人属性识别网络及技术 | |
Alani et al. | Hand gesture recognition using an adapted convolutional neural network with data augmentation | |
CN109002845A (zh) | 基于深度卷积神经网络的细粒度图像分类方法 | |
CN100440246C (zh) | 一种人脸特征点定位方法 | |
CN109101865A (zh) | 一种基于深度学习的行人重识别方法 | |
CN108052896A (zh) | 基于卷积神经网络与支持向量机的人体行为识别方法 | |
CN107330357A (zh) | 基于深度神经网络的视觉slam闭环检测方法 | |
CN110575663B (zh) | 一种基于人工智能的体育辅助训练方法 | |
CN107767416B (zh) | 一种低分辨率图像中行人朝向的识别方法 | |
Li et al. | Sign language recognition based on computer vision | |
CN106408030A (zh) | 基于中层语义属性和卷积神经网络的sar图像分类方法 | |
CN109598220A (zh) | 一种基于多元输入多尺度卷积的人数统计方法 | |
CN106548194B (zh) | 二维图像人体关节点定位模型的构建方法及定位方法 | |
CN109948501A (zh) | 一种监控视频中人员和安全帽的检测方法 | |
CN110879982A (zh) | 一种人群计数系统及方法 | |
CN105976397B (zh) | 一种目标跟踪方法 | |
CN108762503A (zh) | 一种基于多模态数据采集的人机交互系统 | |
CN107590427A (zh) | 基于时空兴趣点降噪的监控视频异常事件检测方法 | |
CN107609580A (zh) | 一种直推式的低秩张量判别性分析方法 | |
CN112597921B (zh) | 一种基于注意力机制gru深度学习的人体行为识别方法 | |
CN104680193B (zh) | 基于快速相似性网络融合算法的在线目标分类方法与系统 | |
CN110533100A (zh) | 一种基于机器学习进行cme检测和跟踪的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |