CN103679151B - 一种融合LBP、Gabor特征的人脸聚类方法 - Google Patents
一种融合LBP、Gabor特征的人脸聚类方法 Download PDFInfo
- Publication number
- CN103679151B CN103679151B CN201310703205.1A CN201310703205A CN103679151B CN 103679151 B CN103679151 B CN 103679151B CN 201310703205 A CN201310703205 A CN 201310703205A CN 103679151 B CN103679151 B CN 103679151B
- Authority
- CN
- China
- Prior art keywords
- lbp
- face
- image
- gabor characteristic
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种融合LBP、Gabor特征的人脸聚类方法,步骤包括:将图像的R,G,B三个通道转换为灰度图,得到图像L;Gabor特征提取;LBP特征提取;分层人脸聚类等。本发明的积极效果是:本发明通过对图像进行人脸检测,定位出人脸区域,然后通过对定位的人脸区域进行LBP,Gabor特征提取,最后对提取的特征进行分层聚类,将属于同一个人的照片聚类在一起。本发明的特征抽取方法可以有效地克制光照影响,在度量人脸相似度时,使用弹性部分匹配算法,有效地抑制了姿势,发型,头部饰物等条件的影响。实现了在复杂背景,变化光照,不同面部表情,不同人体姿态,不同发型,有头部饰物的干扰下都能对人脸进行稳健聚类。
Description
技术领域
本发明涉及一种融合LBP、Gabor特征的人脸聚类方法。
背景技术
近年来,随着移动互联网的迅速发展,拍照应用获得了很大的发展空间,照片的获取与存储变得十分容易。随着照片数据爆炸式的增长,用户迫切需要对照片的检索和整理的自动化技术。人脸聚类技术在互联网中的应用也越来越普及,利用人脸聚类技术,可以用于图像好友分组,建立社交关系网等等。人脸聚类技术作为一种特别的生物特征识别技术,有着广泛的应用领域。然而,由于光照,人物表情,姿态,以及发型和背景等因素的影响,很大程度地影响了人脸聚类技术的性能。除此之外,还有一些其他的外在因素也会对人脸识别技术造成一定影响,比如:眼镜,帽子,围巾等人体头部饰物。因此,如何在这么多因素的影响下发展出一种可靠的人脸聚类技术显得特别重要。
发明内容
为了克服现有技术的上述缺点,本发明提供了一种融合LBP、Gabor特征的人脸聚类方法。
本发明解决其技术问题所采用的技术方案是:一种融合LBP、Gabor特征的人脸聚类方法,包括如下步骤:
步骤一、将图像的R,G,B三个通道转换为灰度图,得到图像L;
步骤二、Gabor特征提取:
1)将图像L与Gabor核进行卷积,获取不同的空间、尺度局部特征;
2)采样比例因子对卷积进行下采样,然后对其进行零均值单位方差归一化,最终得到Gabor特征;
步骤三、LBP特征提取:
1)以尺寸为3×3的模板,遍历整个图像L,对每个3×3模板,计算出9个点的像素的LBP(p)特征;
2)对LBP(p)的二进制码按顺序进行移位操作,获得旋转不变的LBP特征;
3)统计纹理特征:
步骤四、分层人脸聚类:
1)计算人脸两两特征的相似度:
2)按照完全链聚类方法对相似度进行聚类,得到一棵深度为T的分类树,此时整个树图仅含一个连通分量;
3)设置一个小于等于T的深度d,其中根节点的深度为0,按照这个深度对树进行切割,得到k棵子树,其中每棵树都代表一个聚类结果;
4)对于给定的人脸照片,判断其属于哪棵子树,返回子树作为查询结果。
与现有技术相比,本发明的积极效果是:本发明通过对图像进行人脸检测,定位出人脸区域,然后通过对定位的人脸区域进行LBP,Gabor特征提取,最后对提取的特征进行分层聚类,将属于同一个人的照片聚类在一起。本发明的特征抽取方法可以有效地克制光照影响,在度量人脸相似度时,使用弹性部分匹配算法,有效地抑制了姿势,发型,头部饰物等条件的影响。实现了在复杂背景,变化光照,不同面部表情,不同人体姿态,不同发型,有头部饰物的干扰下都能对人脸进行稳健聚类。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明方法的流程图。
具体实施方式
Gabor特征作为最成功的人脸特征之一,已经广泛的应用在人脸识别技术上,LBP特征对人脸也具有很好的判决能力,其主要优势集中在能保持旋转不变形和光照不变性,本文采用Gabor特征与LBP二者结合的方式,对人脸进行聚类分析。
具体步骤如图1所示,一种融合LBP、Gabor 特征的人脸聚类方法,包括如下步骤:
步骤一、将图像的R,G,B三个通道转换为灰度图,得到图像L,使用下式进行转换:
L=0.299*R+0.587*G+0.114*B:
步骤二、Gabor特征提取:
1.将图像L与Gabor核进行卷积,获取不同的空间、尺度局部特征:
Oμ,ν(z)=L(z)*ψμ,ν(z)
其中μ,ν表示Gabor核的方向和尺度,z表示图像坐标(x,y)。
kμ,ν表示波向量,kmax表示最大频率,f表示频域中的核间距因子。本发明方法中统一取5个不同尺度ν∈{0,1,2,3,4},8个不同方向μ∈{0,1...7},除此之外取σ=2π,
2.为了降低空间维度,我们使用了一个采样比例因子ρ对Oμ,ν(z)进行下采样,然后对其进行零均值单位方差归一化,最终得到Gabor特征为:
步骤三、LBP特征提取:
1.以尺寸为3×3的模板,遍历整个图像L,对每个3×3模板,按照如下方法计算出一串二进制数,即LBP特征:
记模板中的9个点为pi(0≤i≤8),其中模板正中的点记为p0。将模板中其它的点减去中心点的灰度值:
gi=pi-p0,(1≤i≤8)
对每个计算得到的gi,如果gi≥0则令gi=1,否则gi=0。则位于位置p的像素的LBP(p)特征为:
2.上述计算的LBP特征不能应对旋转不变的要求,为了获得旋转不变的LBP特征,需要进一步计算:
对LBP(p)的二进制码按顺序进行移位操作,总共可以得到8个二进制数据,取其中最小的一个作为最终的计算结果:
LBPri(p)=min(ROR(LBP(p),i)),0≤i≤7
式中ROR表示移位操作,i表示移位次数。
3.初始化纹理分布直方图数组hist以及计数次数Count为0,将该像素点对应的纹理分布直方图加1,同时累加计数次数,即:
hist[G]=hist[G]+1
Count=Count+1
归一化纹理分布直方图:
hist[G]=hist[G]/Count
最后再进行一次零均值单位方差归一化即可。
步骤四、分层人脸聚类:
1.计算人脸两两特征的相似度:
首先通过人脸检测算法到人脸区域,将两图像的人脸区域以横向和纵向均为2的步长稠密地分为K×K个相互重叠的子块,每个子块的大小为18×18,按照上述步骤提到的特征提取方法,统计每个子块的特征向量fi,j(1≤i,j≤K),逐子块进行匹配。进一步说明,对于每一个1≤i,j≤K,计算
其中:s=2;r表示允许的弹性度范围,可以任意指定,本例中取r=5,smilarity(fi,j-fk,l)=||fi,j-fk,l||1,使用L1范数计算距离。对计算出来的K×K个fi,j按升序排列:
其中N=K×K,设置一个分位数α,取dis(f1 αN)为选定的距离,同理交换计算顺序可得dis(f2 αN)。
最终的距离设置为:
D(f1,f2)=max(dis(f1 αN),dis(f2 αN))
2.按照完全链聚类方法对相似度进行聚类,得到一棵深度为T的分类树,此时整个树图仅含一个连通分量。
3.设置一个深度d,(d≤T),其中根节点的深度为0,按照这个深度对树进行切割,得到k棵子树,其中每棵树都代表一个聚类结果。
4.对于给定的人脸照片,判断其属于哪棵子树,返回子树作为查询结果。
Claims (3)
1.一种融合LBP、Gabor特征的人脸聚类方法,其特征在于:包括如下步骤:
步骤一、将图像的R,G,B三个通道转换为灰度图,得到图像L;
步骤二、Gabor特征提取:
1)将图像L与Gabor核进行卷积,获取不同的空间、尺度局部特征;
2)采样比例因子对卷积进行下采样,然后对其进行零均值单位方差归一化,最终得到Gabor特征;
步骤三、LBP特征提取:
1)以尺寸为3×3的模板,遍历整个图像L,对每个3×3模板,计算出9个点的像素的LBP(p)特征;
2)对LBP(p)的二进制码按顺序进行移位操作,获得旋转不变的LBP特征;
3)统计纹理特征;
步骤四、分层人脸聚类:
1)计算人脸两两特征的相似度;
2)按照完全链聚类方法对相似度进行聚类,得到一棵深度为T的分类树,此时整个树图仅含一个连通分量;
3)设置一个小于等于T的深度d,其中根节点的深度为0,按照这个深度对树进行切割,得到k棵子树,其中每棵树都代表一个聚类结果;
4)对于给定的人脸照片,判断其属于哪棵子树,返回子树作为查询结果。
2.根据权利要求1所述的一种融合LBP、Gabor特征的人脸聚类方法,其特征在于:所述图像L的转换公式为:
L=0.299*R+0.587*G+0.114*B。
3.根据权利要求1所述的一种融合LBP、Gabor特征的人脸聚类方法,其特征在于:所述统计纹理特征的方法为:初始化纹理分布直方图数组hist以及计数次数Count为0,将像素点对应的纹理分布直方图加1,同时累加计数次数;归一化纹理分布直方图;进行一次零均值单位方差归一化。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310703205.1A CN103679151B (zh) | 2013-12-19 | 2013-12-19 | 一种融合LBP、Gabor特征的人脸聚类方法 |
PCT/CN2014/073990 WO2015089949A1 (zh) | 2013-12-19 | 2014-03-25 | 一种融合LBP、Gabor特征的人脸聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310703205.1A CN103679151B (zh) | 2013-12-19 | 2013-12-19 | 一种融合LBP、Gabor特征的人脸聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103679151A CN103679151A (zh) | 2014-03-26 |
CN103679151B true CN103679151B (zh) | 2016-08-17 |
Family
ID=50316641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310703205.1A Active CN103679151B (zh) | 2013-12-19 | 2013-12-19 | 一种融合LBP、Gabor特征的人脸聚类方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN103679151B (zh) |
WO (1) | WO2015089949A1 (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091163A (zh) * | 2014-07-19 | 2014-10-08 | 福州大学 | 一种消除遮挡影响的lbp人脸识别方法 |
CN104504368A (zh) * | 2014-12-10 | 2015-04-08 | 成都品果科技有限公司 | 一种图像场景识别方法及系统 |
CN104598878A (zh) * | 2015-01-07 | 2015-05-06 | 深圳市唯特视科技有限公司 | 基于灰度和深度信息的多层融合的多模态人脸识别装置及方法 |
CN104504381B (zh) * | 2015-01-09 | 2017-12-26 | 新智认知数据服务有限公司 | 非刚体目标检测方法及其系统 |
CN105138972B (zh) * | 2015-08-11 | 2020-05-19 | 北京眼神智能科技有限公司 | 人脸认证方法和装置 |
CN105608387B (zh) * | 2015-08-11 | 2019-04-12 | 宇龙计算机通信科技(深圳)有限公司 | 多媒体资源的存储方法、存储装置及终端 |
WO2017113083A1 (zh) * | 2015-12-29 | 2017-07-06 | 厦门中控生物识别信息技术有限公司 | 一种虹膜识别方法及装置 |
CN105701472B (zh) * | 2016-01-15 | 2019-07-09 | 杭州鸿雁电器有限公司 | 一种动态目标的面部识别方法与装置 |
CN106980844A (zh) * | 2017-04-06 | 2017-07-25 | 武汉神目信息技术有限公司 | 一种基于人脸识别系统的人物关系挖掘系统及方法 |
CN107609466A (zh) * | 2017-07-26 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 人脸聚类方法、装置、设备及存储介质 |
CN107578005A (zh) * | 2017-09-01 | 2018-01-12 | 宜宾学院 | 一种复数小波变换域lbp人脸识别方法 |
CN108921201B (zh) * | 2018-06-12 | 2019-06-28 | 河海大学 | 基于特征组合与cnn的大坝缺陷识别与分类方法 |
CN109166133B (zh) * | 2018-07-14 | 2021-11-23 | 西北大学 | 基于关键点检测和深度学习的软组织器官图像分割方法 |
CN109117803B (zh) * | 2018-08-21 | 2021-08-24 | 腾讯科技(深圳)有限公司 | 人脸图像的聚类方法、装置、服务器及存储介质 |
CN110084259B (zh) * | 2019-01-10 | 2022-09-20 | 谢飞 | 一种结合面部纹理和光流特征的面瘫分级综合评估系统 |
CN109948534B (zh) * | 2019-03-19 | 2023-03-07 | 华侨大学 | 采用快速密度峰值聚类进行人脸识别的方法 |
CN112365485B (zh) * | 2020-11-19 | 2022-08-16 | 同济大学 | 一种基于Circular LBP和颜色空间转换算法的黑色素瘤识别方法 |
CN112700462A (zh) * | 2020-12-31 | 2021-04-23 | 北京迈格威科技有限公司 | 一种图像分割方法、装置、电子设备及存储介质 |
CN112948612B (zh) * | 2021-03-16 | 2024-02-06 | 杭州海康威视数字技术股份有限公司 | 人体封面生成方法、装置、电子设备及存储介质 |
CN113360688B (zh) * | 2021-06-28 | 2024-02-20 | 北京百度网讯科技有限公司 | 信息库的构建方法、装置及系统 |
CN113344124B (zh) * | 2021-06-29 | 2023-11-28 | 北京市商汤科技开发有限公司 | 轨迹分析方法及装置、存储介质和系统 |
CN117171384B (zh) * | 2023-11-02 | 2024-02-23 | 广州翼拍联盟网络技术有限公司 | 高精度纹理路径检索方法、装置、计算机设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101425136A (zh) * | 2008-10-24 | 2009-05-06 | 北京工业大学 | 视频图像局部二进制模式特征的获取方法和装置 |
CN101447021A (zh) * | 2008-12-30 | 2009-06-03 | 爱德威软件开发(上海)有限公司 | 人脸快速识别系统及其识别方法 |
CN102024141A (zh) * | 2010-06-29 | 2011-04-20 | 上海大学 | 基于Gabor小波变换和局部二值模式优化的人脸识别方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100866792B1 (ko) * | 2007-01-10 | 2008-11-04 | 삼성전자주식회사 | 확장 국부 이진 패턴을 이용한 얼굴 기술자 생성 방법 및장치와 이를 이용한 얼굴 인식 방법 및 장치 |
CN101996308A (zh) * | 2009-08-19 | 2011-03-30 | 北京中星微电子有限公司 | 人脸认证方法及系统、人脸模型训练方法及系统 |
CN102799871A (zh) * | 2012-07-13 | 2012-11-28 | Tcl集团股份有限公司 | 一种人脸跟踪识别的方法 |
CN102831447B (zh) * | 2012-08-30 | 2015-01-21 | 北京理工大学 | 多类别面部表情高精度识别方法 |
-
2013
- 2013-12-19 CN CN201310703205.1A patent/CN103679151B/zh active Active
-
2014
- 2014-03-25 WO PCT/CN2014/073990 patent/WO2015089949A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101425136A (zh) * | 2008-10-24 | 2009-05-06 | 北京工业大学 | 视频图像局部二进制模式特征的获取方法和装置 |
CN101447021A (zh) * | 2008-12-30 | 2009-06-03 | 爱德威软件开发(上海)有限公司 | 人脸快速识别系统及其识别方法 |
CN102024141A (zh) * | 2010-06-29 | 2011-04-20 | 上海大学 | 基于Gabor小波变换和局部二值模式优化的人脸识别方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2015089949A1 (zh) | 2015-06-25 |
CN103679151A (zh) | 2014-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103679151B (zh) | 一种融合LBP、Gabor特征的人脸聚类方法 | |
CN103605972B (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
CN108520216B (zh) | 一种基于步态图像的身份识别方法 | |
US9117105B2 (en) | 3D face recognition method based on intermediate frequency information in geometric image | |
CN102542281B (zh) | 非接触式生物特征识别方法和系统 | |
CN110852182B (zh) | 一种基于三维空间时序建模的深度视频人体行为识别方法 | |
CN110659589B (zh) | 基于姿态和注意力机制的行人再识别方法、系统、装置 | |
CN105956560A (zh) | 一种基于池化多尺度深度卷积特征的车型识别方法 | |
CN106203356B (zh) | 一种基于卷积网络特征提取的人脸识别方法 | |
CN109815826A (zh) | 人脸属性模型的生成方法及装置 | |
CN109497990B (zh) | 一种基于典型相关分析的心电信号身份识别方法及系统 | |
CN111126240B (zh) | 一种三通道特征融合人脸识别方法 | |
CN109670548A (zh) | 基于改进lstm-cnn的多尺寸输入har算法 | |
CN105469063B (zh) | 鲁棒的人脸图像主成分特征提取方法及识别装置 | |
CN102542243A (zh) | 一种基于lbp图像和分块编码的虹膜特征提取方法 | |
CN103218609A (zh) | 一种基于隐最小二乘回归的多姿态人脸识别方法及其装置 | |
CN105956570B (zh) | 基于唇部特征和深度学习的笑脸识别方法 | |
CN104834905A (zh) | 一种人脸图像识别仿真系统及方法 | |
CN105869166A (zh) | 一种基于双目视觉的人体动作识别方法及系统 | |
CN111666813B (zh) | 基于非局部信息的三维卷积神经网络的皮下汗腺提取方法 | |
CN105844204B (zh) | 人体行为识别方法和装置 | |
CN115205933A (zh) | 面部表情识别方法、装置、设备及可读存储介质 | |
CN104376312A (zh) | 基于词袋压缩感知特征提取的人脸识别方法 | |
CN108090460B (zh) | 基于韦伯多方向描述子的人脸表情识别特征提取方法 | |
CN110008847A (zh) | 一种基于卷积神经网络的泳姿识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder | ||
CP02 | Change in the address of a patent holder |
Address after: 610041 China (Sichuan) free trade test zone, Chengdu high tech Zone, middle section of Tianfu Avenue, 13 floor, 1 Patentee after: Chengdu PinGuo Digital Entertainment Ltd. Address before: 610041 Chengdu high tech Zone, Sichuan Century City Road, No. 216 Patentee before: Chengdu PinGuo Digital Entertainment Ltd. |