CN102609733A - 海量人脸库应用环境下的人脸快速识别方法 - Google Patents

海量人脸库应用环境下的人脸快速识别方法 Download PDF

Info

Publication number
CN102609733A
CN102609733A CN2012100289421A CN201210028942A CN102609733A CN 102609733 A CN102609733 A CN 102609733A CN 2012100289421 A CN2012100289421 A CN 2012100289421A CN 201210028942 A CN201210028942 A CN 201210028942A CN 102609733 A CN102609733 A CN 102609733A
Authority
CN
China
Prior art keywords
sample
bunch
face database
face
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100289421A
Other languages
English (en)
Other versions
CN102609733B (zh
Inventor
康一梅
赵元
柴锂君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201210028942.1A priority Critical patent/CN102609733B/zh
Publication of CN102609733A publication Critical patent/CN102609733A/zh
Application granted granted Critical
Publication of CN102609733B publication Critical patent/CN102609733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明是一种海量人脸库应用环境下的人脸快速识别方法。引入二分K-均值聚类算法BKM结合PCA+LDA算法对大规模人脸库进行特征提取。首先对人脸库计算每个样本的均值向量,本着类内聚合度最大、类间耦合度最小的原则映射到某个维度空间;然后在这个维度空间对其进行聚类;得到聚类结果后,将各个样本按照其簇属性重新组合分组;最后在每个簇上使用线性子空间人脸特征提取算法进行特征提取。

Description

海量人脸库应用环境下的人脸快速识别方法
技术领域
本发明应用于模式识别领域,具体为海量人脸库应用环境下的人脸快速识别方法。
背景技术
传统的线性子空间算法在海量人脸库中有一定局限性,如:基于主成分分析(PrincipalComponent Analysis,PCA)和线性判别准则(Linear Discriminant Analysis,LDA)的PCA+LDA:PCA+LDA方法的目的在于追求一个最佳投影平面,使得原始随机向量在这个投影平面上的投影具有类内离散度最小、类间离散度最大的特点。
传统的PCA+LDA技术的缺点:当原始数据的类别数C比较少时,找到C-1维的最佳投影空间是比较容易的。随着类别数C的增加,其投影空间的维数也在不断增加,最佳投影空间需要满足的条件也就越多,这样的空间也就越来越难以寻找。同时,由于类别数的不断增加,空间中各个类别的类间距离不断缩小,类内距离相对于类间距离则相对不断增加,因此给分类器的设计带来了困难,使得识别率不断降低,而识别时间却不断增加。
本发明的目的在于提出一种应用于大规模人脸库的识别算法,使其相对于传统的线性子空间算法识别率提高,识别时间减少,实时性增强。
发明内容
本发明涉及图像识别领域,提供一种海量人脸库应用环境下的快速识别方法。目的在于寻找一种应用于海量人脸库高识别率的特征提取方法。
本发明所述方法包括:引入二分K-均值聚类算法BKM结合PCA+LDA算法对大规模人脸库进行特征提取。将大规模人脸库通过聚类的手段分为若干个簇,每个簇具有聚合度最大,耦合度最小的特点。并且每个簇中的样本数量均能被线性子空间算法一次性处理,然后在每个簇上通过人脸识别算法进行分类识别。要注意以下两点:
1)对大规模人脸库进行分解的时候,应尽量使得每个组具有相同的特征,而组与组之间的特征尽量不相近。
2)在对某个分组进行人脸识别之前,应先对待测试样本进行粗识别,确定其属于哪个分组,然后在确定的分组上进行细识别确定其属于哪个分类。
本发明采用的技术方案为:首先对人脸库计算每个样本的均值向量,将这些均值向量本着类内聚合度最大、类间耦合度最小的原则映射到某个维度空间;然后在这个维度空间对其进行聚类;得到聚类结果后,将各个样本按照其簇属性重新组合分组;最后在每个簇上使用线性子空间人脸特征提取算法进行特征提取。图1为本发明的技术方案流程。
本发明方法的更详细步骤为:
输入:海量人脸数据库、K值、N值(人脸库中样本的数量)、C值(人脸库中样本类别数);
输出:K组人脸特征;
步骤1:
对人脸库的所有测试样本计算样本均值;
设x是一个n维随机向量,人脸库X包含一组数据{xi|i=1,2,…,N},将其表达为矩阵的形式X=[x1,x2,…,xN],计算样本均值向量:
μ = 1 N Σ i = 1 N x i ;
步骤2:
中心化样本矩阵:将人脸库X中的每个样本减去均值向量μ:
X=[x1-μ,x2-μ,…,xN-μ];
步骤3:
计算中心化矩阵的内积矩阵;
S t = 1 N Σ i = 1 N ( x i - μ ) ( x i - μ ) T = 1 N XX T ;
步骤4:
计算内积矩阵的特征值与特征向量,将特征值由大到小排列,取前N-C个较大的特征值所对应的特征向量,组成子空间矩阵WPCA
步骤5:
定义每个类的类内离散度和类间离散度;
mi是第i个样本的均值;ni是第i个样本的样本数量;Xi为样本类别;样本类内离散度矩阵Sb和总类内离散度矩阵Sw计算如下:
S w = Σ i = 1 C Σ x ∈ X i ( x - m i ) ( x - m i ) T
样本类间离散度矩阵Sb
S b = Σ i = 1 C n i ( m i - μ ) ( m i - μ ) T ;
步骤6:
计算能够使得样本可分性得到最大化的某一维度空间WLDA
S w - 1 S b W LDA = λ W LDA
WLDA为Sw -1Sb的前C-1个较大特征值所对应的特征向量;
步骤7:
最终以类内聚合度最大、类间耦合度最小的原则映射的空间为:
W=WPCA*WLDA
将W转置,即求:WT
将所有的训练样本均值向量向这个空间投影;
ηi=WT(xi-μ);
步骤8:
随机选择两个坐标作为簇中心,将所有样本按照距离最近的原则划分其所属簇;
步骤9:
计算簇均值,若簇均值与当前簇中心不重合,则以簇均值为中心重新划分簇,否则转向步骤10;
步骤10:
以生成的两个簇为输入数据,在每个簇中分别随机选择两个坐标点作为簇中心,按照步骤8至步骤9迭代划分,直至当前生成的簇的个数等于K;
步骤11:
按照生成的K个簇结果对原始数据进行分组;
步骤12:
在每个簇上使用PCA+LDA算法进行特征提取,得到K组人脸特征,方法结束。
本发明与已有的相应技术相比,在大规模人脸库中,识别时间减少,实时性提高,识别率提高。
附图说明
图1为海量人脸数据库的人脸特征提取算法流程图;
图2为BKM+PCA+LDA算法过程图。
具体实施方式
下面结合具体实例,进一步阐述本发明,本实例采用CAS-PEAL-R1人脸库,照片类别数为400,每个人取2张照片作为训练样本,照片像素为100*100。
输入:海量人脸数据库、K=40、N=800(人脸库中样本的数量)、C=400(人脸库中样本类别数);
输出:40组人脸特征;
步骤1:
对人脸库的所有测试样本计算样本均值;
x是一个100*100维随机向量,人脸库X包含一组数据{xi|i=1,2,…,800},将其表达为矩阵的形式x=[x1,x2,…,x800],计算样本均值向量:
μ = 1 800 Σ i = 1 800 x i ;
步骤2:
中心化样本矩阵:将人脸库X中的每个样本减去均值向量μ:
X=[x1-μ,x2-μ,…,x800-μ];
步骤3:
计算中心化矩阵的内积矩阵;
S t = 1 800 Σ i = 1 800 ( x i - μ ) ( x i - μ ) T = 1 800 XX T ;
步骤4:
计算内积矩阵的特征值与特征向量,将特征值由大到小排列,取前400个较大的特征值所对应的特征向量,组成子空间矩阵WPCA
步骤5:
定义每个类的类内离散度和类间离散度;其中:mi是第i个样本的均值;每个样本类别有两个训练样本。
样本类内离散度矩阵Sb和总类内离散度矩阵Sw如下,
S w = Σ i = 1 400 Σ x ∈ X i ( x - m i ) ( x - m i ) T
样本类间离散度矩阵Sb
S b = 2 Σ i = 1 100 ( m i - μ ) ( m i - μ ) T ;
步骤6:
计算能够使得样本可分性得到最大化的某一维度空间WLDA
S w - 1 S b W LDA = λ W LDA ;
其中:λ是Sw -1Sb的特征值,对特征值λ从大到小排列,取其前c-1个特征值对应的特征向量组成维度空间WLDA
步骤7:
最终以类内聚合度最大、类间耦合度最小的原则映射的空间为:
W=WPCA*WLDA
将其转置为WT
将所有的训练样本均值向量向这个空间投影;
ηi=WT(xi-μ);
步骤8:
随机选择两个样本点作为簇中心。将所有样本按照距离最近的原则划分其所属簇;
步骤9:
计算簇均值,若簇均值与当前簇中心不重合,则以簇均值为中心重复步骤8,否则转向步骤10;
步骤10:
以生成的两个簇为输入数据,按照步骤8至步骤9迭代划分,直至当前生成的簇的个数等于K;
步骤11:
按照生成的K个簇结果对原始数据进行分组;
步骤12:
在每个簇上使用Peter N.Belhumeur.,Eigenfaces vs.Fisherfaces:Recognition using class specificlinear projection[J].IEEE Trans.Pattern Anal.Machine Intell.19(7)(1997)711-720 PCA+LDA算法进行特征提取,得到K组人脸特征,方法结束。
以上所述实施例仅用于说明本发明的技术思想及特点,其目的在于使本领域内的技术人员能够理解本发明的内容并据以实施,不能仅以本实施例来限定本发明的专利范围,即凡依本发明所揭示的精神所做的同等变化或修饰,仍落在本发明的专利范围内。

Claims (1)

1.一种海量人脸库应用环境下的人脸快速识别方法,其特征在于如下步骤:
步骤一:输入海量人脸数据库、人脸库中样本的数量N值、人脸库中样本类别数C值;
步骤二:
1)对人脸库的所有测试样本计算样本均值;
2)计算中心化样本矩阵:将人脸库所有测试样本减去步骤1中所得样本均值;
3)计算中心化样本矩阵的内积矩阵;
4)计算内积矩阵的特征值与特征向量,将特征值由大到小排列,取前N-C个较大的特征值所对应的特征向量,组成子空间矩阵WPCA
5)定义每个类的类内离散度和类间离散度;
6)计算能够使得样本可分性得到最大化的某一维度空间WLDA
7)最终以类内聚合度最大、类间耦合度最小的原则映射的空间为:
W=WPCA*WLDA
将所有的训练样本均值向量向这个空间投影;
8)随机选择两个样本点作为簇中心,将所有样本按照距离最近的原则划分其所属簇;
9)计算簇均值,若簇均值与当前簇中心不重合,则以簇均值为中心重新划分簇,否则转向步骤10;
10)以生成的两个簇为输入数据,在每个簇中分别随机选择两个坐标点作为簇中心,按照步骤8)至步骤9)迭代划分,直至当前生成的簇的个数等于K;
11)在每个簇上使用PCA+LDA算法进行特征提取,得到K组人脸特征;
步骤三:输出K组人脸特征。
CN201210028942.1A 2012-02-09 2012-02-09 海量人脸库应用环境下的人脸快速识别方法 Active CN102609733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210028942.1A CN102609733B (zh) 2012-02-09 2012-02-09 海量人脸库应用环境下的人脸快速识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210028942.1A CN102609733B (zh) 2012-02-09 2012-02-09 海量人脸库应用环境下的人脸快速识别方法

Publications (2)

Publication Number Publication Date
CN102609733A true CN102609733A (zh) 2012-07-25
CN102609733B CN102609733B (zh) 2014-04-02

Family

ID=46527092

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210028942.1A Active CN102609733B (zh) 2012-02-09 2012-02-09 海量人脸库应用环境下的人脸快速识别方法

Country Status (1)

Country Link
CN (1) CN102609733B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239859A (zh) * 2014-09-05 2014-12-24 西安电子科技大学 基于结构化因子分析的人脸识别方法
CN106250821A (zh) * 2016-07-20 2016-12-21 南京邮电大学 一种聚类再分类的人脸识别方法
CN108664917A (zh) * 2018-05-08 2018-10-16 佛山市顺德区中山大学研究院 基于辅变字典及最大边际线性映射的人脸识别方法和系统
CN109426781A (zh) * 2017-08-29 2019-03-05 阿里巴巴集团控股有限公司 人脸识别数据库的构建方法、人脸识别方法、装置及设备
US10395146B2 (en) 2016-08-04 2019-08-27 International Business Machines Corporation Face recognition in big data ecosystem using multiple recognition models

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030210808A1 (en) * 2002-05-10 2003-11-13 Eastman Kodak Company Method and apparatus for organizing and retrieving images containing human faces
CN101329724A (zh) * 2008-07-29 2008-12-24 上海天冠卫视技术研究所 一种优化的人脸识别方法和装置
CN102129574A (zh) * 2011-03-18 2011-07-20 北京中星微电子有限公司 一种人脸认证方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030210808A1 (en) * 2002-05-10 2003-11-13 Eastman Kodak Company Method and apparatus for organizing and retrieving images containing human faces
CN101329724A (zh) * 2008-07-29 2008-12-24 上海天冠卫视技术研究所 一种优化的人脸识别方法和装置
CN102129574A (zh) * 2011-03-18 2011-07-20 北京中星微电子有限公司 一种人脸认证方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239859A (zh) * 2014-09-05 2014-12-24 西安电子科技大学 基于结构化因子分析的人脸识别方法
CN106250821A (zh) * 2016-07-20 2016-12-21 南京邮电大学 一种聚类再分类的人脸识别方法
US10395146B2 (en) 2016-08-04 2019-08-27 International Business Machines Corporation Face recognition in big data ecosystem using multiple recognition models
US10402702B2 (en) 2016-08-04 2019-09-03 International Business Machines Corporation Face recognition in big data ecosystem using multiple recognition models
CN109426781A (zh) * 2017-08-29 2019-03-05 阿里巴巴集团控股有限公司 人脸识别数据库的构建方法、人脸识别方法、装置及设备
CN108664917A (zh) * 2018-05-08 2018-10-16 佛山市顺德区中山大学研究院 基于辅变字典及最大边际线性映射的人脸识别方法和系统

Also Published As

Publication number Publication date
CN102609733B (zh) 2014-04-02

Similar Documents

Publication Publication Date Title
Li et al. Shapenet: A shapelet-neural network approach for multivariate time series classification
Agarwal et al. Face recognition using eigen faces and artificial neural network
CN101226590B (zh) 一种人脸识别方法
Li et al. Activity recognition using dynamic subspace angles
CN103745200B (zh) 一种基于词袋模型的人脸图像识别方法
CN105426842A (zh) 基于支持向量机的表面肌电信号多类手部动作识别方法
CN102609733B (zh) 海量人脸库应用环境下的人脸快速识别方法
CN102073880A (zh) 利用稀疏表示进行人脸识别的集成方法
Adamos et al. NASS: an empirical approach to spike sorting with overlap resolution based on a hybrid noise-assisted methodology
Bronstein Spectral descriptors for deformable shapes
CN103226713A (zh) 一种多视角行为识别方法
CN105893947A (zh) 基于多局部相关特征学习的两视角人脸识别方法
Liu et al. Combining 2D gabor and local binary pattern for facial expression recognition using extreme learning machine
CN106295708A (zh) 一种基于Fisher分类器组的连续型数据预处理方法
CN101877065B (zh) 小样本条件下的人脸图像非线性鉴别特征抽取和识别方法
CN103632145A (zh) 一种基于模糊二维非相关判别转换的人脸识别方法
CN104318224A (zh) 一种人脸识别方法及监控设备
CN102609718B (zh) 一种结合不同聚类算法生成视觉字典集体的方法
CN104408468A (zh) 基于粗糙集和集成学习的人脸识别方法
CN102332087A (zh) 一种基于稀疏表示的人脸识别方法
Dong et al. Finger vein verification with vein textons
Pan et al. Pseudo-set frequency refinement architecture for fine-grained few-shot class-incremental learning
CN104504305B (zh) 监督基因表达数据分类方法
CN109800854A (zh) 一种基于概率神经网络的复合绝缘子憎水性等级判定方法
Demontis et al. Super-sparse regression for fast age estimation from faces at test time

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant