CN102521607B - 高斯框架下近似最优肤色检测方法 - Google Patents
高斯框架下近似最优肤色检测方法 Download PDFInfo
- Publication number
- CN102521607B CN102521607B CN201110389354.6A CN201110389354A CN102521607B CN 102521607 B CN102521607 B CN 102521607B CN 201110389354 A CN201110389354 A CN 201110389354A CN 102521607 B CN102521607 B CN 102521607B
- Authority
- CN
- China
- Prior art keywords
- model
- optimum
- skin
- gauss
- mean vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Abstract
为了解决目前高斯框架下的方法只能在某个特定的误检率(FalsePositive Rates,简称FPRs)区间内性能较好的问题,本发明专利提出一种高斯框架下近似最优的肤色检测方法,称为多高斯模型(Multiple GaussianModels,简称MGMs),并推导出其离散和连续的形式。该方法对于整个FPR区间内都具有很好的性能。首先将RGB颜色空间归一化得到rgb空间,然后建立多个最优单高斯模型,最后将多个最优模型融合。MGMs模型包含多个最优单高斯模型,每个高斯模型对应于一个事先定义的FPR值。在每个FPR情况下,对应的最优模型会得到最高的肤色检测率(True Positive Rates,简称TPRs),该模型采用基于搜索算法的优化问题求解来获得。因此,对于所有的FPR值,MGMs模型能够在高斯框架下获得近似最优的肤色检测性能。此外,MGMs模型与单高斯模型(Single Gaussian Models,简称SGMs)在测试环节具有相同的计算复杂度。
Description
技术领域:
本发明涉及一种基于多高斯模型的肤色检测的方法,属于图像处理领域。
背景技术:
在图像处理与计算机视觉领域中,肤色检测在人脸检测、人脸识别以及不良图像的过滤等应用领域中具有重要的意义。
在过去的几年中,一些基于像素的肤色检测方法已涌现。这些方法可分为两类:第一类是非参数模型,例如肤色空间的直接阈值法和直方图方法;第二类是参数化模型,例如单高斯模型、椭圆边界模型等。与非参数模型相比,参数化模型需要较少的训练数据和较低的存储要求,更易于推广。Menser和Wien利用多维的单高斯模型(Single Gaussian Models,简称SGMs)来表征RGB空间中的肤色分布。由于肤色分布并不严格正态分布,而是有一定程度的倾斜,故单高斯模型并不能准确地描述该分布。Lee和Yoo提出了椭圆边界模型,该模型本质上等价于单高斯模型,但是在均值向量的估计稍有区别。为了更加准确地表示肤色分布,很多研究者采用了混合高斯模型(GaussianMixture Models,简称GMMs)。此外,其它方法如多层感知器分类法(MLP)也已被提出。
由于SGMs、椭圆边界模型、GMMs等基于高斯模型方法具有简单性和良好的推广性等优点,这些方法已被广泛应用。但是,它们局限性在于仅当FPRs在某个较小的特定范围内时方法表现良好。一般地,SGMs在FPR较小的时候表现好于椭圆边界模型法,在FRP大于0.09时椭圆边界法表现优于SGMs。此外,在实验中我们发现GMMs在FPR大过0.40时表现优于上述两种方法。通常地,单个模型仅在特定FPRs范围内表现得较好。因此,提出一种在大范围甚至整个FPRs区间内表现良好的肤色检测方法是非常必要的。
发明内容:
本发明的主要内容,提出一种新的基于像素的肤色检测方法,名为MGMs模型,并导出其离散和连续的形式,用以解决目前高斯框架下绝大多数方法只能在某个特定FPRs小区间上得到较好性能的问题。
MGMs模型是基于多个最优高斯模型而建立的,每个高斯模型对应一个事先给定的FPR。每个最优模型在对应的FPR值条件下能够取得最高的肤色检测TPR值,可以通过搜索的优化算法来解决。因此,对于所有给定的FPRs值,MGMs模型能够在高斯框架下实现近似最优性能。并且,MGMs模型与SGMs有相同的计算代价。
本发明采用了如下技术手段来实现的:首先将RGB空间归一化;
1)建立最优单高斯模型:
从单高斯概率密度函数出发,通过判断概率密度函数值与事先定义的阈值之间的关系来对肤色空间中的样本点进行分类;最优单高斯模型通过求解优化问题来获得:假定肤色检测的FPR值为rF=C,最大化肤色检测的检测率TPR,通过该优化问题可以获得最优单高斯模型的均值向量和协方差矩阵参数;该最优化问题的求解通过搜索算法来,按如下步骤进行:
①.最优高斯模型的协方差矩阵通过对训练集中的肤色样本点采用最大似然估计方法获得,假设该矩阵在搜索算法执行过程中不变;
②.采用Fisher线性判别和主成分分析方法得到两个方向,对此进行线性组合来初始化搜索算法中的高斯模型均值向量μini,即为0时刻的均值向量μ0;
③.在搜索算法中的t时刻,沿着方向θ∈Θ对均值向量μt进行移动,其中Θ为预定义的8个方向,步长为δ个像素,从中选择一个方向使得:在该方向上向量在ROC曲线rF=C处法线方向上投影向量处在该ROC曲线的上方,并且范数最大,则即为t时刻均值
向量的更新方向,转至④;否则,中止搜索算法,输出最终的均值向量;
④.在t+1时刻,通过调整阈值的大小使得FPR的值重新为rF,t+1=C。t←t+1,转至③。
最终可以通过以上搜索算法获得对应于rF=C的最优单高斯模型。若有k个给定的FPR值C1,C2,…,CK,则通过以上算法可以得到K个对应的最优单高斯模型{<N(μk,∑),Ck>|k=1,2,...,K},其中μk为第k个最优高斯模型均值向量,Ck为第k个最优高斯模型的FPR值。
2)融合多个最优高斯模型:
使N(μk,∑)作用于区间F∈[ak,bk)而不仅仅是Ck,其中ak<Ck<bk。每个模型的ROC曲线可以用函数rT=fk(rF),rF∈[0,1]表示。ak和bk的值由下式决定:ak=min{rF|fk(rF)≥fl(rF),l≠k}和bk=max{rF|fk(rF)≥fl(rF),l≠k},其中fk(rF)和fl(rF)分别为对应模型N(μk,∑)和N(μl,∑)的ROC曲线。在[0,1]区间内对误检率FPR进行采样,在此基础上通过实验方法得到fk(·),最后通过比较fk(rF)和其它ROC曲线来计算ak,bk,其中k=1,2,...,K;最终得到融合后的多高斯模离散形式可以表示为如下二元组的集合{<N(μk,∑),[ak,bk)>|k=1,2,...,K}。
对多个最优高斯模型中的参数采用线性拟合的方法,得到一个μk和Ck的线性关系,可以得到的多高斯模型MGMs的连续形式。
本发明的有益效果是:提出了一种在大范围FPRs区间上都能取得近似最优性能的肤色检测方法,并且计算复杂度低,对海量的网络可视媒体的处理具有重要的意义。
具体实施方式:
下面对本发明的具体实施例加以说明:
步骤1,在标准化的RGB颜色空间上对肤色进行建模。
本专利中的图像像素是在归一化的RGB颜色空间(也成为rgb颜色空间)上进行表示的。在忽略背景光的条件下,归一化RGB空间具有相对于光源不随表面方向变化的不变性。此外,RGB到归一化RGB的变换由如下公式可得:
其中SRGB=R+G+B,r+g+b=1。第三个分量b不独立于r和g,故仅使用分量r和g来表示图像,在实验中可以线性变换至范围[0,255]。
步骤2,基于一个特定的FPR值rF=C∈[0,1],求解最优单个高斯模型。
其中x=(r,g)T表示肤色像素,μ=(μr,μg)T和∑分别表示均值向量和方差矩阵,其中,μr是分量r的均值,μg是分量g的均值,n是x的维数,n=2。当像素x满足不等式Pr(x)≥γ时则被判断为肤色像素。该不等式等价于如下公式:
(x-μ)T∑-1(x-μ)≤τ2 (3)
其中式子左侧表示马氏距离的平方,γ和τ为两个事先定义的阈值。
为了达到最优的分类性能,估计参数μ和∑可根据如下优化问题进行求解:
其中d(xi,μ,∑)=[(xi-μ)T∑-1(xi-μ)]1/2,u(t)为单位阶跃函数,xi和yi分别表示图像中肤色像素和非肤色像素,Ns,Nns分别是肤色像素和非肤色像素的数目,C是事先给定的FPR值。公式(4)和(5)表示在肤色检测的FPR值等于C时,最优单高斯模型可通过最大化TPR值来获得。
公式(4)-(6)所描述的优化问题很难求得解析解。因此我们提出一种搜索算法来找到该问题的解。基于实验,我们发现相对于协方差矩阵∑,均值向量μ在决定肤色检测的性能上起着决定性的作用。因此,为了简化求解过程,我们假定∑为常数:
我们通过结合Fisher线性判别法(FLD)和主成分分析法(PCA)来对均值向量进行初始化。在该初始化中既采用了肤色和非肤色类别间的分类信息,及肤色类别本身的分布信息。首先,我们使用FLD方法计算区分肤色和非肤色类别时的最优投影方向:
其中Sw=Ss+Sns, 其次,我们使用PCA计算方向w2:,在该方向上肤色像素数据具有最大的方差,其中w2是协方差矩阵∑的最大特征值相对应的特征向量。基于实验,我们发现初始均值向量μini与rF之间近似遵循如下线性关系,这为初始化提供了重要的信息:
μini=a+brFw (8)
参数a=c1μ+(1-c1)μns,w=[c2w1+(1-c2)w2]/||c2w1+(1-c2)w2||2是w1和w2的线性组合,参数b、c1、c2可由实验求得。在此专利中,b=379.1,c1=0.776,c2=-0.258。
在求得模型均值向量的初值后,搜索算法按如下步骤进行:
①.在t=0时刻,μ0=μini,rF,0=C;
②.在t时刻,求解模型的ROC曲线rF,t=C处法线rt′;沿着方向θ∈Θ对均值向量μt进行移动得步长为δ个像素,其中Θ为预定义的8个方向,则在该方向上检测性能的变化为选择方向使得在法线方向rt′的投影向量处在该ROC曲线的上方,并且范数最大,即则即为t时刻均值向量的更新方向,转至③,其中rF,t和rT,t分别是模型在t时刻的误检率和检测率,和分别是该模型沿着方向θ∈Θ对均值向量μt进行移动后新模型的误检率和检测率;否则,中止搜索算法,输出最终的均值向量;
③.在t+1时刻,通过调整阈值τ的大小使得FPR的值重新为rF,t+1=C;t←t+1,转至②;
最终可以通过以上搜索算法获得对应于rF=C的最优单高斯模型;
步骤3:多个最优高斯模型融合。
设{Ck|k=1,2,...,K}是事先定义的FPRs集合,我们可获对应的最优高斯模型集合:
{<N(μk,∑),Ck>|k=1,2,...,K} (9)
其中N(μk,∑)表示对应于FPR值rF=Ck下的最优高斯模型,K为最优模型的个数。由于在包含于[0,1]区间中有无数个FPRs值,我们无法求取每一个对应的最优高斯模型,故必须定义有限个FPRs的集合{Ck|k=1,2,...,K}。其次,我们使N(μk,∑)作用于区间rF∈[ak,bk)中,而不是仅仅在离散点rF=Ck。假设第k个模型的ROC曲线由函数rT=fk(rF),rF∈[0,1]表示,则ak,bk由以下公式求得:
ak=min{rF|fk(rF)≥fl(rF),l≠k} (10)
bk=max{rF|fk(rF)≥fl(rF),l≠k} (11)
其中,fk(rF)和fl(rF)分别表示第k个和第l个模型的ROC曲线。在通过实验得到fk(·)后,通过公式(10)和(11)即可计算出ak和bk,其中k,l=1,2,...,K。最后,离散的MGM模型表示如下:
{<N(μk,∑),[ak,bk)>|k=1,2,...,K} (12)
在此离散型MGM模型中,N(μk,∑)在rF=Ck时具有最优的肤色检测性能,在rF∈[ak,bk)上具有近似最优性能。因此,MGMs方法在高斯框架下具有近似最优的性能。通常,在K值较小的情况下MGMs就可以达到比SGMs,GMMs和椭圆边界模型更好的性能。
表达式(11)给出了一种MGM离散形式。此外,我们还可以基于式(9)获得MGMs的连续形式。假设(μr,μg,C)可以用如下线性方程表示:
其中μr,μg是均值向量μ的两个分量,μ0,r,μ0,g,mr和mg是参数,C是预先定义的FPR值。给定K个数据点{(μk,r,μk,g,Ck)},k=1,...K,上式可写成如下矩阵形式:
MC=U (14)
其中
公式(14)的解如下:
则连续MGM模型表示如下:
Claims (2)
1.一种高斯框架下近似最优的肤色检测方法,其特征在于,包括如下步骤:
1)首先将RGB空间归一化至rgb空间;
2)建立最优单高斯模型:
从单高斯概率密度函数出发,通过判断概率密度函数值与事先定义的阈值之间的关系来对肤色空间中的样本点进行分类;
所述的单高斯概率密度函数为:
其中,x=(r,g)T表示肤色像素,μ=(μr,μg)T和∑分别表示均值向量和协方差矩阵,μr是分量r的均值,μg是分量g的均值,n是x的维数,n=2;当肤色像素x满足不等式Pr(x)≥γ时则被判断为肤色像素,该不等式等价于如下公式:
(x-μ)T∑-1(x-μ)≤τ2;
γ和τ为两个事先定义的阈值;
最优单高斯模型通过求解优化问题来获得:假定肤色检测的误检率FPR值为rF=C∈[0,1],最大化肤色检测的检测率TPR,通过该优化问题可以获得最优单高斯模型的均值向量和协方差矩阵参数;该最优化问题的求解通过搜索算法来,按如下步骤进行:
①.最优高斯模型的协方差矩阵通过对训练集中的肤色样本点采用最大似然估计方法获得,假设该矩阵在搜索算法执行过程中不变;
②.采用Fisher线性判别和主成分分析方法得到反映肤色分布趋势的两个方向,对此进行线性组合来初始化搜索算法中的高斯模型均值向量μini,即为0时刻的均值向量μ0;
③.在搜索算法中的t时刻,沿着方向θ∈Θ对均值向量μt进行移动,其中Θ为预定义的8个方向,步长为δ个像素,从中选择一个方向使得:在该方向上t时刻向量在ROC曲线rF=C处法线方向上的投影向量处在该ROC曲线的上方,并且范数最大,则即为t时刻均值向量的更新方向,转至④,其中rF,t和rT,t分别是模型在t时刻的误检率FPR和检测率TPR,和分别是该模型沿着方向对均值向量μt进行移动后新模型的误检率FPR和检测率TPR;否则,中止搜索算法,输出最终的均值向量;
④.在t+1时刻,通过调整阈值τ的大小使得误检率FPR的值重新为rF,t+1=C;t←t+1,转至③;
最终可以通过以上搜索算法获得对应于rF=C的最优单高斯模型;若有k个给定的误检率FPR值C1,C2,…,CK,则通过以上算法可以得到K个对应的最优单高斯模型{<N(μk,∑),Ck>|k=1,2,...,K},其中μk为第k个最优高斯模型均值向量,Ck为第k个最优高斯模型的误检率FPR值,∑为单高斯概率密度函数中描述的协方差矩阵;
3)融合多个最优高斯模型:
使作用于区间F∈[ak,bk)而不仅仅是Ck,其中ak<Ck<bk;第k个模型的ROC曲线可以用函数rT=fk(rF),rF∈[0,1]表示;ak和bk的值由下式决定:ak=min{rF|fk(rF)≥fl(rF),l≠k}和bk=max{rF|fk(rF)≥fl(rF),l≠k},其中fk(rF)和fl(rF)分别为对应模型N(μk,∑)和N(μl,∑)的ROC曲线;
在[0,1]区间内对误检率FPR进行采样,在此基础上通过实验方法得到fk(·),最后通过比较fk(rF)和其它ROC曲线来计算ak,bk,其中k=1,2,...,K;最终得到融合后的多高斯模离散形式,表示为如下二元组的集合{<N(μk,∑),[ak,bk)>|k=1,2,...,K}。
2.根据权利要求1所述的检测方法,其特征在于,对多个最优高斯模型中的参数采用线性拟合的方法,得到一个μk和Ck的线性关系,最终得到的多高斯模型连续形式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110389354.6A CN102521607B (zh) | 2011-11-30 | 2011-11-30 | 高斯框架下近似最优肤色检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110389354.6A CN102521607B (zh) | 2011-11-30 | 2011-11-30 | 高斯框架下近似最优肤色检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102521607A CN102521607A (zh) | 2012-06-27 |
CN102521607B true CN102521607B (zh) | 2014-03-12 |
Family
ID=46292518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110389354.6A Expired - Fee Related CN102521607B (zh) | 2011-11-30 | 2011-11-30 | 高斯框架下近似最优肤色检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102521607B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678813A (zh) * | 2015-11-26 | 2016-06-15 | 乐视致新电子科技(天津)有限公司 | 一种肤色检测方法及装置 |
CN107633252B (zh) | 2017-09-19 | 2020-04-21 | 广州市百果园信息技术有限公司 | 肤色检测方法、装置及存储介质 |
CN108108770A (zh) * | 2017-12-31 | 2018-06-01 | 厦门大学 | 基于CRBM和Fisher网络的移动视觉搜索框架 |
CN110310268A (zh) * | 2019-06-26 | 2019-10-08 | 深圳市同为数码科技股份有限公司 | 基于白平衡统计分区信息的肤色检测方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7031523B2 (en) * | 2001-05-16 | 2006-04-18 | Siemens Corporate Research, Inc. | Systems and methods for automatic scale selection in real-time imaging |
CN101551853A (zh) * | 2008-11-14 | 2009-10-07 | 重庆大学 | 复杂静态彩色背景下的人耳检测方法 |
-
2011
- 2011-11-30 CN CN201110389354.6A patent/CN102521607B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102521607A (zh) | 2012-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220254191A1 (en) | System and method for recognition and annotation of facial expressions | |
US10354159B2 (en) | Methods and software for detecting objects in an image using a contextual multiscale fast region-based convolutional neural network | |
US10929649B2 (en) | Multi-pose face feature point detection method based on cascade regression | |
Tenenbaum et al. | Separating style and content | |
Oh et al. | Occlusion invariant face recognition using selective local non-negative matrix factorization basis images | |
Bar-Hillel et al. | Learning a Mahalanobis metric from equivalence constraints. | |
CN106295694B (zh) | 一种迭代重约束组稀疏表示分类的人脸识别方法 | |
CN102521607B (zh) | 高斯框架下近似最优肤色检测方法 | |
US7697752B2 (en) | Method and apparatus for performing object detection | |
Sahbi et al. | A Hierarchy of Support Vector Machines for Pattern Detection. | |
CN102867191A (zh) | 一种基于流形子空间学习的降维方法 | |
Palazzi et al. | Learning where to attend like a human driver | |
CN101021897A (zh) | 一种基于块内相关性的二维线性鉴别分析人脸识别方法 | |
Kursun et al. | Canonical correlation analysis using within-class coupling | |
Agarwal et al. | Facial expression recognition through adaptive learning of local motion descriptor | |
US20230177801A1 (en) | Method of salient object detection in images | |
Soula et al. | A novel incremental Kernel Nonparametric SVM model (iKN-SVM) for data classification: An application to face detection | |
Jin et al. | Face detection using one-class-based support vectors | |
Pima et al. | Regularized discriminant analysis for face recognition | |
Zhang et al. | Deep compact discriminative representation for unconstrained face recognition | |
CN109919056B (zh) | 一种基于判别式主成分分析的人脸识别方法 | |
CN106407922A (zh) | 一种基于在线字典学习形变模型的疲劳状态识别方法 | |
Santarcangelo et al. | Dynamic time-alignment k-means kernel clustering for time sequence clustering | |
Zhang et al. | Block independent component analysis for face recognition | |
CN111507243A (zh) | 一种基于格拉斯曼流形分析的人体行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140312 Termination date: 20161130 |