CN112001231A - 加权多任务稀疏表示的三维人脸识别方法、系统及介质 - Google Patents
加权多任务稀疏表示的三维人脸识别方法、系统及介质 Download PDFInfo
- Publication number
- CN112001231A CN112001231A CN202010658517.5A CN202010658517A CN112001231A CN 112001231 A CN112001231 A CN 112001231A CN 202010658517 A CN202010658517 A CN 202010658517A CN 112001231 A CN112001231 A CN 112001231A
- Authority
- CN
- China
- Prior art keywords
- dimensional face
- point
- sparse representation
- weighted
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种加权多任务稀疏表示的三维人脸识别方法、系统及介质,所述方法包括以下步骤:将三维人脸化分成若干不同区域,所述若干不同区域包括半刚性区域和非刚性区域,所述若干不同区域具有不同的权重;提取所述三维人脸的不同区域的曲线特征;基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配。相较于现有技术,本发明减少了三维人脸不同的区域由于受到表情的变化对三维人脸识别的影响,提高了三维人脸识别的鲁棒性。
Description
技术领域
本发明涉及人脸识别技术领域,尤其涉及一种基于加权多任务稀疏表示的三维人脸识别方法、系统及介质。
背景技术
三维人脸识别从提出到现在技术上有了很大的发展变化,但是从技术上来讲主要可以分为两大阶段,早期的时候,三维人脸识别主要关注点是在整个三维人脸上,把整个三维人脸的几何信息作为特征使用,并不会细分,对于任意两张三维人脸通常是计算整张人脸的特征相似度,这一阶段的算法统称为基于整体特征的三维人脸识别算法,常见的方法有基于主成分分析、形变模型、有符号的形状微分图、球谐函数等。另一个阶段也就是现在主要研究的算法,这类算法从三维人脸的局部区域,例如鼻子、眼睛等,来提取特征向量,这类算法统称为基于局部特征的三维人脸识别算法。
三维局部特征描述符是从三维人脸局部区域提取出来的,相比于整体特征,局部特征有一个十分重要的性质是局部特征具有刚性不变的性质,把一整个三维人脸用局部特征的形式描述出来可以认为是另一种形式的压缩处理。根据现有的三维局部描述符文献研究,可以把基于局部特征的三维人脸识别算法分为三类:基于关键点的三维人脸识别算法,基于曲线特征的三维人脸识别算法和基于局部表面特征的三维人脸识别算法。
三维关键点主要是从那些比较突出的位置选择,根据三维曲面上的一些几何信息来检测三维关键点,这类方法主要涉及两个步骤:关键点检测和特征描述。基于关键点的算法虽然对于遮挡和缺失的数据集有一定的鲁棒性,但是所需的计算量很高,这是因为大量的关键点计算,所以选择最有效的关键点来创建特征向量是非常重要的。
尺度不变特征变换(SIFT)是一个非常有效的关键点检测算法,它的优点是对于噪声有很强的健壮性。
但是,三维人脸上几何信息在表情发生变化的时候也会有很大的形变,导致相同区域计算的结果差异很大,同一张三维人脸上,不同的区域由于受到表情变化的形变影响也有很大的差别,所以三维人脸上的有表情和无表情的区域对算法识别有很大的影响。
发明内容
本发明提供一种基于加权多任务稀疏表示的三维人脸识别方法、系统及介质,旨在减少三维人脸不同的区域由于受到表情的变化对三维人脸识别的影响。
为实现上述目的,本发明提出一种加权多任务稀疏表示的三维人脸识别方法,所述方法包括以下步骤:
将三维人脸化分成若干不同区域,所述若干不同区域包括半刚性区域和非刚性区域,所述若干不同区域具有不同的权重;
提取所述三维人脸的不同区域的曲线特征;
基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配。
本发明进一步的技术方案是,所述将三维人脸化分成若干不同区域的步骤包括:
获取三维人脸点云V,在点云V中检测出鼻尖点坐标,点云V中所有点坐标减去鼻尖点坐标,把鼻尖点置于原点处;
用四个平行于XOZ平面的平面将人脸分割成五个区域,自上而下分别记作L1,L2,L3,L4,L5,这四个平面分别为Y=50,Y=20,Y=-20,Y=-50;
使用平面X=-15,X=15将L2分割为三个区域;
使用X=-25和X=25将L3和L4分别分割成三个区域。
本发明进一步的技术方案是,所述基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配的步骤包括:
基于所述曲线特征,获取三维人脸的所述五个区域的关键点;
以预设方式计算以所述关键点为中心的预设半径的范围内的所有点的协方差矩阵;
根据所述协方差矩阵,采用加权的稀疏表示算法对所述三维人脸进行识别匹配。
本发明进一步的技术方案是,所述基于所述曲线特征,获取三维人脸的所述五个区域的关键点的步骤包括:
首先,空间中的三维人脸曲面用S表示,p表示三维人脸中的一个点,Nbhd(p)表示以点p为球心、半径为r的球体内的点,也称为点p的邻域,用Hotelling 变换或者主成分分析把Nbhd(p)中的每一个点都转换成局部对齐邻域Anbhd(p),定义X和Y表示Anbhd(p)的x和y分量:
X={x1,x2,...,xl},
Y={y1,y2,...,yl},
其中l表示Anbhd(p)的长度;
定义人脸表面变化指数θ为以关键点p为中心的局部对齐邻域的前两个主轴即X轴和Y轴之间的比率:
θ反映了点p的局部邻域的几何变化,当某点p的表面变化指数大于εθ时可以被看做关键点;
对于每一个点的局部邻域Nbhd(p),可以计算它的协方差矩阵:
其中pi属于Nbhd(p)是Nbhd(p)的均值,Cp是Nbhd(p)的协方差矩阵;
然后对于协方差矩阵Cp进行特征值分解,求得特征值λ1(p),λ2(p),λ3(p),并且满足λ1(p)>λ2(p)>λ3(p),另外一个指标是特征值变化率ρ:
只有每个点的特征值变化率大于ερ时才可被视为关键点,只有当某一个点同时满足θ>εθ∨ρ>ερ时,才被选为关键点。
本发明进一步的技术方案是,所述以预设方式计算以所述关键点为中心的预设半径的范围内的所有点的协方差矩阵的步骤包括:
首先把人脸分成许多以关键点为中心,距离为r的区域,P={pi,i=1,2,...,m},表示三维人脸上的区域,pi={xi,yi,zi}T表示关键点,对于pi中的每一个点pj可以计算特征向量fj:
fj=[xj,yj,zj,k1,k2,Dj],
xj,yj和zj表示关键点pj的三维坐标信息,k1,k2表示关键点pj的最大、最小曲率,Dj则是点pj到关键点pi的距离;
根据所述特征向量计算协方差矩阵:
μ表示区域pi中所有点的特征向量的均值,Xi为所求区域pi的协方差矩阵;协方差矩阵的对角线表示每个特征的变化,非对角线元素表示特征之间的共变。
本发明进一步的技术方案是,所述基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配的步骤包括:
将根据特征向量计算出的协方差矩阵进行信号处理,得到稀疏表示系数。
本发明进一步的技术方案是,所述将三维人脸化分成若干不同区域的步骤之前包括:
构建多任务稀疏表示分类器。
本发明进一步的技术方案是,所述构建多任务稀疏表示分类器的步骤包括:
构建训练集学习字典:
根据所述学习字典进行多任务稀疏表示。
为实现上述目的,本发明还提出一种加权多任务稀疏表示的三维人脸识别系统,所述系统包括存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时实现如上所述的方法的步骤。
为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时实现如上所述的方法的步骤。
本发明加权多任务稀疏表示的三维人脸识别方法、系统及介质的有益效果是:本发明通过上述技术方案:将三维人脸化分成若干不同区域,所述若干不同区域包括半刚性区域和非刚性区域,所述若干不同区域具有不同的权重;提取所述三维人脸的不同区域的曲线特征;基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配,减少了三维人脸不同的区域由于受到表情的变化对三维人脸识别的影响,提高了三维人脸识别的鲁棒性。
附图说明
图1是本发明加权多任务稀疏表示的三维人脸识别方法较佳实施例的流程示意图;
图2(a)是将人脸分割成五个区域的结果示意图;
图2(b)是将人脸分割成十一个区域的结果示意图;
图3人脸不同分区上选取的关键点示意图;
图4是加权的多任务稀疏表示分类器流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
考虑到三维人脸上几何信息在表情发生变化的时候也会有很大的形变,导致相同区域计算的结果差异很大,同一张三维人脸上,不同的区域由于受到表情变化的形变影响也有很大的差别,所以三维人脸上的有表情和无表情的区域对算法识别有很大的影响,由此,本发明提出一种解决方案。
具体地,本发明提出一种基于加权多任务稀疏表示的三维人脸识别方法,三维人脸包括半刚性区域以及非刚性区域,本发明所采用的技术方案主要是首先对三维人脸分区,主要有两大类:半刚性区域和非刚性区域,不同的部位有不同的权重,在不同的区域提取曲线特征,使用加权的稀疏表达算法进行匹配。
请参照图1,图1是本发明加权多任务稀疏表示的三维人脸识别方法较佳实施例的流程示意图。
如图1所示,本实施例中,所述加权多任务稀疏表示的三维人脸识别方法包括以下步骤:
步骤S10,将三维人脸化分成若干不同区域,所述若干不同区域包括半刚性区域和非刚性区域,所述若干不同区域具有不同的权重。
可以理解的是,本实施例的执行主体例如可以为手机、电脑、IPAD等具有人脸识别功能的智能终端。
具体地,所述将三维人脸化分成若干不同区域的步骤可以包括:
获取三维人脸点云V,在点云V中检测出鼻尖点坐标,点云V中所有点坐标减去鼻尖点坐标,把鼻尖点置于原点处;
用四个平行于XOZ平面的平面将人脸分割成五个区域,自上而下分别记作L1,L2,L3,L4,L5,这四个平面分别为Y=50,Y=20,Y=-20,Y=-50;
使用平面X=-15,X=15将L2分割为三个区域;
使用X=-25和X=25将L3和L4分别分割成三个区域。
步骤S20,提取所述三维人脸的不同区域的曲线特征。
步骤S30,基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配。
具体地,可以先基于所述曲线特征,获取三维人脸的所述五个区域的关键点,再以预设方式计算以所述关键点为中心的预设半径的范围内的所有点的协方差矩阵,然后根据所述协方差矩阵,采用加权的稀疏表示算法对所述三维人脸进行识别匹配。
其中,所述基于所述曲线特征,获取三维人脸的所述五个区域的关键点的步骤包括:
首先空间中的三维人脸曲面用S表示,p表示三维人脸中的一个点,Nbhd(p)表示以点p为球心、半径为r的球体内的点,也称为点p的邻域,用Hotelling变换或者主成分分析把Nbhd(p)中的每一个点都转换成局部对齐邻域Anbhd(p),定义X 和Y表示Anbhd(p)的x和y分量:
X={x1,x2,...,xl},
Y={y1,y2,...,yl},
其中l表示Anbhd(p)的长度;
定义人脸表面变化指数θ为以关键点p为中心的局部对齐邻域的前两个主轴即X轴和Y轴之间的比率:
θ反映了点p的局部邻域的几何变化,当某点p的表面变化指数大于εθ时可以被看做关键点;
对于每一个点的局部邻域Nbhd(p),可以计算它的协方差矩阵:
其中pi属于Nbhd(p)是Nbhd(p)的均值,Cp是Nbhd(p)的协方差矩阵;
然后对于协方差矩阵Cp进行特征值分解,求得特征值λ1(p),λ2(p),λ3(p),并且满足λ1(p)>λ2(p)>λ3(p),另外一个指标是特征值变化率ρ:
只有每个点的特征值变化率大于ερ时才可被视为关键点,只有当某一个点同时满足这两个变化指数时,才被选为关键点:
θ>εθ∨ρ>ερ。
其中,所述以预设方式计算以所述关键点为中心的预设半径的范围内的所有点的协方差矩阵的步骤包括:
首先把人脸分成许多以关键点为中心,距离为r的区域,P={pi,i=1,2,...,m},表示三维人脸上的区域,pi={xi,yi,zi}T表示关键点,对于pi中的每一个点pj可以计算特征向量fj:
fj=[xj,yj,zj,k1,k2,Dj],
xj,yj和zj表示关键点pj的三维坐标信息,k1,k2表示关键点pj的最大、最小曲率,Dj则是点pj到关键点pi的距离;
根据所述特征向量计算协方差矩阵:
μ表示区域pi中所有点的特征向量的均值,Xi为所求区域pi的协方差矩阵;协方差矩阵的对角线表示每个特征的变化,非对角线元素表示特征之间的共变。
其中,所述基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配的步骤包括:
将根据特征向量计算出的协方差矩阵进行信号处理,得到稀疏表示系数。
其中,所述将三维人脸化分成若干不同区域的步骤之前包括:
构建多任务稀疏表示分类器。
具体地,所述构建多任务稀疏表示分类器的步骤包括:
构建训练集学习字典:
根据所述学习字典进行多任务稀疏表示。
由此,本实施例通过上述技术方案:将三维人脸化分成若干不同区域,所述若干不同区域包括半刚性区域和非刚性区域,所述若干不同区域具有不同的权重;提取所述三维人脸的不同区域的曲线特征;基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配,减少了三维人脸不同的区域由于受到表情的变化对三维人脸识别的影响,提高了三维人脸识别的鲁棒性。
以下对本发明基于局部特征的三维人脸识别方法做进一步的详细阐述。
三维人脸按照受表情影响大的程度可以分为:半刚性区域和非刚性区域。人脸上严格来说是不可能有刚性区域的,因为刚性区域是不会发生形变的区域,而三维人脸上的任何区域都有可能发生形变。形变较小的区域称之为半刚性区域,形变较大的区域称之为非刚性区域。通过观察三维人脸数据库得知,三维人脸上额头、鼻子、脸颊和下巴等区域受表情的影响较小,可归为半刚性区域,但是当三维人脸上发生表情变化很大时,鼻子区域也有可能会发生很大的形变;比较容易受表情变化影响的区域包括眼部区域和嘴部区域会发生很大的形变,可以被分为非刚性区域。
本发明所使用的三维人脸分区的主要步骤如表1所示。
表1三维人脸分区主要步骤
划分完成的人脸如图2(b)所示,本发明把三维人脸根据半刚性区域和非刚性区域的划分把人脸分割成了11个区域,这十一个区域所对应的名称和性质如表2所示。
表2人脸分区结果对应
首先空间中的三维人脸曲面用S表示,p表示三维人脸中的一个点,Nbhd(p)表示以点p为球心、半径为r的球体内的点,也称为点p的邻域。局部邻域Nbhd(p)用来提取局部参考系(LRF),因为LRF对杂波和遮挡有很好的鲁棒性。与此同时,用Hotelling变换或者主成分分析(PCA)把Nbhd(p)中的每一个点都转换成局部对齐邻域Anbhd(p)。让X和Y表示Anbhd(p)的x和y分量:
X={x1,x2,...,xl}
Y={y1,y2,...,yl}
其中l表示Anbhd(p)的长度。
人脸表面变化指数θ被定义为以关键点p为中心的局部对齐邻域的前两个主轴即X轴和Y轴之间的比率:
θ反映了点p的局部邻域的几何变化。对于任何对称的局部点集,例如一个平面或者球体,θ等于1,任何非对称的局部点集,θ大于1。当某点p的表面变化指数大于εθ时可以被看做关键点。
对于每一个点的局部邻域Nbhd(p),可以计算它的协方差矩阵:
其中pi属于Nbhd(p)是Nbhd(p)的均值,Cp是Nbhd(p)的协方差矩阵。然后对于协方差矩阵Cp进行特征值分解,求得特征值λ1(p),λ2(p),λ3(p),并且满足λ1(p)>λ2(p)>λ3(p)。另外一个指标是特征值变化率ρ:
并且只有每个点的特征值变化率大于ερ时才可被视为关键点。只有当某一个点同时满足这两个变化指数时,才被选为关键点:
θ>εθ∨ρ>ερ (1-5)
人脸不同分区上选取的关键点如图3所示。
根据选取的关键点,就可以计算以关键点为中心半径为r的范围内的邻域的所有点的协方差矩阵了。
首先把人脸分成许多以关键点为中心,距离为r的区域, P={pi,i=1,2,...,m},表示三维人脸上的区域,pi={xi,yi,zi}T表示关键点,对于pi中的每一个点pj可以计算特征向量fj:
fj=[xj,yj,zj,k1,k2,Dj] (1-6)
xj、yj和zj表示关键点pj的三维坐标信息,k1,k2表示关键点pj的最大、最小曲率,Dj则是点pj到关键点pi的距离。
有了特征向量之后就可以计算协方差矩阵了:
μ表示区域pi中所有点的特征向量的均值,Xi为所求区域pi的协方差矩阵。协方差矩阵的对角线表示每个特征的变化,非对角线元素表示特征之间的共变。
稀疏表示一直以来被用于信号处理,主要的研究内容就是如何使用比香农定理更低的采样率来表示和压缩信号。稀疏的含义是选择少量重要的系数来表示原始信号的一种技术。稀疏表示方法第一次用在人脸识别中是由 Wright等提出来的,特征使用的就是图片的像素转置的列向量。Wright的方法把一张人脸看作是一个原始信号,根据稀疏表示的含义,可以用所有训练集中的人脸的集合来线性表示任意一张待测试人脸,分类依据是通过计算待测试样本和学习字典间的一个稀疏表示系数。
本发明需要把稀疏表示的思想引入到三维人脸识别中,不想Wright中的算法特征向量是每一个二维人脸图像的列向量转置,本发明把前面特征提取阶段提取到的协方差矩阵作为稀疏表示方法中的信号进行处理。首先假设有k 类训练样本,第i类训练样本有ni个三维人脸数据,每个训练样本即从这个三维人脸上提取的协方差矩阵描述符转置为一个m维列向量,那么第i类训练样本可以表示为:
Ai被称为第i类训练集样本的字典。
对于第i类中的一个测试样本y∈IRm可以线性地表示为:
其中αi,j属于常量,αi,j∈IR,j=1,2,...,ni。
但是在实验中使用的测试集的标签是未知的,所以定义一个新的矩阵表示整个训练集也就是k类训练样本的串联集合:
那么未知标签的测试样本y能够被所有的训练集线性表示:
y=Ax0∈IRm (1-11)
其中表示的是待测试样本y的稀疏表示系数,但是除了所对应的第i类别其它的位置都为0。x0可以用来表示待测试样本y的类别,所以这个问题就转化为求解y=Ax。其中m>n,所以说训练集的整个字典A是一个过完备字典,也就是说可以找到x0的一个唯一解。所以现在的问题难点转移到了如何求解这个最小化的l2-范式:
式中,是指x2重建后的量,区别于原数据x2,下同。虽然这个l2- 范式问题很好解决,但是,它求出来的稀疏表示系数并不足够的稀疏,也就是说无法精确的定位y的类别,所以把它转化为一个l0-范式的问题求解:
l0-范式表示x这个稀疏表示系数向量中非零值的个数。但是l0-范式的求解是一个NP难的问题。l1-范式可以看作是l0-范式的近似最优解,并且l1- 范式可以在多项式时间内解决,所以这个求解l0-范式的问题又被转化为求解 l1-范式的问题:
类似于最近邻分类器的思想,选择残差最小的训练集类别作为待测试样本的标签,如公式(1-16)所示:
本发明提出了一个多任务稀疏表示分类器用来改进稀疏表示分类器。设计的多任务稀疏表示分类器的主体模块仍然和稀疏表示分类器保持一致,只不过在构建训练集的学习字典的时候发生了变化。具体的算法步骤如下所示:
(1)构建训练集学习字典。假设训练集有k个类别,第i个类别共有ni个关键点,所以类别i的学习字典表示为:
A=[A1,A2,...,Ak]∈IRm·K (1-18)
公式(1-18)中的K代表整个训练集中所有的关键点的数目,即 K是一个十分大的数,这就表明了训练集的学习字典A是符合过完备这个条件的,也就是说任何一个待测试样本都可以由学习字典A线性表示,可以从中求得一个稀疏解。
(2)多任务稀疏表示。根据前文关键点提取算法可知,每个三维人脸都会采集很多个关键点也就是会有很多个协方差矩阵,对于任一张待测试三维人脸样本,记为Y=[y1,y2,...,yn]∈IRm·n,其中m表示的是协方差矩阵转为列向量后的维数,n维待测试样本提取的关键点的个数。原本求一个l1-范式最小化的问题转换为求n个l1-范式最小化的问题:
公式(1-19)中,X=(x1,x2,...,xn)∈IRK·n是待测试样本Y的稀疏系数矩阵;公式(1-19)等价于同时解决了n个l1-范式最小化的问题,对于每一个关键点来讲计算公式如(1-20):
改写公式(1-15)适应多任务的稀疏表示分类器:
接下来的分类思想和最初的稀疏表示分类器一致选择根据公式(1-21)计算出的平均残差作为分类依据,如公式(1-22)所示:
人脸主要分为半刚性区域和非刚性区域,本发明把人脸分成R1至R11 这些个区域,其中R1、R3、R5、R6、R7、R8、R10、R11为半刚性区域, R2、R4、R9为非刚性区域。大体上可以把这些区域分为两类:C1和C2。这两类在对三维人脸识别时所作的贡献程度并不一样,因此对其赋予不同的权重,分别为w1和w2。本发明提出了加权多任务稀疏表示分类器(WMSP),对任意一张三维人脸,提取的关键点总数为n,C1和C2中所含关键点数分别为 n1和n2。在表示提取出的特征F时,将从C1中提取的特征向量按列置于F 前半部分,而从C2中提取的特征向量按列置于F的后半部分,即:
F=[F1,F2]∈IRm·n (1-23)
Fw=[w1F1,w2F2]∈IRm·n (1-24)
那么第i类训练集样本的特征进行加权后得到第i类训练集合的学习字典:
所以有k个类别的训练集样本的学习字典就是把每个类别训练集样本的学习字典串联起来得到整个训练集样本的学习字典:
Aw=[A1w,A2w,...,Akw]∈IRm·K (1-26)
进行分类的方式没有发生改变,公式(1-27)和(1-28)作为加权多任务稀疏表示分类器的依据。
稀疏表示分类器中有一个重要的指标叫做稀疏标准,公式(1-27)中得到的稀疏表示系数是用来判断稀疏程度的,中大部分数据都应该接近于0 除了稀疏表示系数中对应的那个类别的元素不为0,公式(1-28)中是指X重建后的量,区别于原数据X,公式(1-29)用来计算的稀疏程度。
当时表明待测试样本仅仅来自于只有一个训练样本的类别,当时表明稀疏表示系数均匀地分在每一个训练集类别中,所以本文选择一个阈值τ∈(0,1),当(这是个经验值,本发明实验取τ=0.8)时表明这个稀疏表示稀疏向量足够稀疏可以进行下一步的分类。
综上,利用带权重的多任务稀疏表示分类器进行分类的流程图如图4所示。
本发明加权多任务稀疏表示的三维人脸识别方法的有益效果是:本发明通过上述技术方案:将三维人脸化分成若干不同区域,所述若干不同区域包括半刚性区域和非刚性区域,所述若干不同区域具有不同的权重;提取所述三维人脸的不同区域的曲线特征;基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配,减少了三维人脸不同的区域由于受到表情的变化对三维人脸识别的影响,提高了三维人脸识别的鲁棒性。
为实现上述目的,本发明还提出一种加权多任务稀疏表示的三维人脸识别系统,所述系统包括存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时实现如上实施例所述的方法的步骤,这里不再赘述。
为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时实现如上实施例所述的方法的步骤,这里不再赘述。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种加权多任务稀疏表示的三维人脸识别方法,其特征在于,所述方法包括以下步骤:
将三维人脸化分成若干不同区域,所述若干不同区域包括半刚性区域和非刚性区域,所述若干不同区域具有不同的权重;
提取所述三维人脸的不同区域的曲线特征;
基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配。
2.根据权利要求1所述的加权多任务稀疏表示的三维人脸识别方法,其特征在于,所述将三维人脸化分成若干不同区域的步骤包括:
获取三维人脸点云V,在点云V中检测出鼻尖点坐标,点云V中所有点坐标减去鼻尖点坐标,把鼻尖点置于原点处;
用四个平行于XOZ平面的平面将人脸分割成五个区域,自上而下分别记作L1,L2,L3,L4,L5,这四个平面分别为Y=50,Y=20,Y=-20,Y=-50;
使用平面X=-15,X=15将L2分割为三个区域;
使用X=-25和X=25将L3和L4分别分割成三个区域。
3.根据权利要求2所述的加权多任务稀疏表示的三维人脸识别方法,其特征在于,所述基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配的步骤包括:
基于所述曲线特征,获取三维人脸的所述五个区域的关键点;
以预设方式计算以所述关键点为中心的预设半径的范围内的所有点的协方差矩阵;
根据所述协方差矩阵,采用加权的稀疏表示算法对所述三维人脸进行识别匹配。
4.根据权利要求3所述的加权多任务稀疏表示的三维人脸识别方法,其特征在于,所述基于所述曲线特征,获取三维人脸的所述五个区域的关键点的步骤包括:
首先,空间中的三维人脸曲面用S表示,p表示三维人脸中的一个点,Nbhd(p)表示以点p为球心、半径为r的球体内的点,也称为点p的邻域,用Hotelling变换或者主成分分析把Nbhd(p)中的每一个点都转换成局部对齐邻域Anbhd(p),定义X和Y表示Anbhd(p)的x和y分量:
X={x1,x2,...,xl},
Y={y1,y2,...,yl},
其中l表示Anbhd(p)的长度;
定义人脸表面变化指数θ为以关键点p为中心的局部对齐邻域的前两个主轴即X轴和Y轴之间的比率:
θ反映了点p的局部邻域的几何变化,当某点p的表面变化指数大于εθ时可以被看做关键点;
对于每一个点的局部邻域Nbhd(p),可以计算它的协方差矩阵:
其中pi属于Nbhd(p)是Nbhd(p)的均值,Cp是Nbhd(p)的协方差矩阵;
然后对于协方差矩阵Cp进行特征值分解,求得特征值λ1(p),λ2(p),λ3(p),并且满足λ1(p)>λ2(p)>λ3(p),另外一个指标是特征值变化率ρ:
只有每个点的特征值变化率大于ερ时才可被视为关键点,只有当某一个点同时满足θ>εθ∨ρ>ερ时,才被选为关键点。
5.根据权利要求3所述的加权多任务稀疏表示的三维人脸识别方法,其特征在于,所述以预设方式计算以所述关键点为中心的预设半径的范围内的所有点的协方差矩阵的步骤包括:
首先把人脸分成许多以关键点为中心,距离为r的区域,P={pi,i=1,2,...,m},表示三维人脸上的区域,pi={xi,yi,zi}T表示关键点,对于pi中的每一个点pj可以计算特征向量fj:
fj=[xj,yj,zj,k1,k2,Dj],
xj,yj和zj表示关键点pj的三维坐标信息,k1,k2表示关键点pj的最大、最小曲率,Dj则是点pj到关键点pi的距离;
根据所述特征向量计算协方差矩阵:
μ表示区域pi中所有点的特征向量的均值,Xi为所求区域pi的协方差矩阵;协方差矩阵的对角线表示每个特征的变化,非对角线元素表示特征之间的共变。
6.根据权利要求4所述的加权多任务稀疏表示的三维人脸识别方法,其特征在于,所述基于所述曲线特征,采用加权的稀疏表示算法对所述三维人脸进行识别匹配的步骤包括:
将根据特征向量计算出的协方差矩阵进行信号处理,得到稀疏表示系数。
7.根据权利要求1-6任意一项所述的加权多任务稀疏表示的三维人脸识别方法,其特征在于,所述将三维人脸化分成若干不同区域的步骤之前包括:
构建多任务稀疏表示分类器。
8.根据权利要求7所述的加权多任务稀疏表示的三维人脸识别方法,其特征在于,所述构建多任务稀疏表示分类器的步骤包括:
构建训练集学习字典;
根据所述学习字典进行多任务稀疏表示。
9.一种加权多任务稀疏表示的三维人脸识别系统,其特征在于,所述系统包括存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时实现如权利要求1-8中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时实现如权利要求1-8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010658517.5A CN112001231B (zh) | 2020-07-09 | 2020-07-09 | 加权多任务稀疏表示的三维人脸识别方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010658517.5A CN112001231B (zh) | 2020-07-09 | 2020-07-09 | 加权多任务稀疏表示的三维人脸识别方法、系统及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112001231A true CN112001231A (zh) | 2020-11-27 |
CN112001231B CN112001231B (zh) | 2023-07-21 |
Family
ID=73467432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010658517.5A Active CN112001231B (zh) | 2020-07-09 | 2020-07-09 | 加权多任务稀疏表示的三维人脸识别方法、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112001231B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733758A (zh) * | 2021-01-15 | 2021-04-30 | 哈尔滨工业大学(深圳) | 黎曼几何不变性下基于曲线的三维人脸识别方法及系统 |
CN113378660A (zh) * | 2021-05-25 | 2021-09-10 | 广州紫为云科技有限公司 | 一种低数据成本的人脸识别的方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663413A (zh) * | 2012-03-09 | 2012-09-12 | 中盾信安科技(江苏)有限公司 | 一种面向多姿态和跨年龄的人脸图像认证方法 |
CN106022228A (zh) * | 2016-05-11 | 2016-10-12 | 东南大学 | 一种基于网格纵横局部二值模式的三维人脸识别方法 |
CN107748871A (zh) * | 2017-10-27 | 2018-03-02 | 东南大学 | 一种基于多尺度协方差描述子与局部敏感黎曼核稀疏分类的三维人脸识别方法 |
CN109508678A (zh) * | 2018-11-16 | 2019-03-22 | 广州市百果园信息技术有限公司 | 人脸检测模型的训练方法、人脸关键点的检测方法和装置 |
CN109711297A (zh) * | 2018-12-14 | 2019-05-03 | 深圳壹账通智能科技有限公司 | 基于面部图片的风险识别方法、装置、计算机设备及存储介质 |
CN109871818A (zh) * | 2019-02-27 | 2019-06-11 | 东南大学 | 基于法向量分布直方图和协方差描述子的人脸识别方法 |
CN111027569A (zh) * | 2019-11-04 | 2020-04-17 | 华北电力大学(保定) | 一种基于红外图像的劣化绝缘子识别诊断方法及其装置 |
-
2020
- 2020-07-09 CN CN202010658517.5A patent/CN112001231B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663413A (zh) * | 2012-03-09 | 2012-09-12 | 中盾信安科技(江苏)有限公司 | 一种面向多姿态和跨年龄的人脸图像认证方法 |
CN106022228A (zh) * | 2016-05-11 | 2016-10-12 | 东南大学 | 一种基于网格纵横局部二值模式的三维人脸识别方法 |
CN107748871A (zh) * | 2017-10-27 | 2018-03-02 | 东南大学 | 一种基于多尺度协方差描述子与局部敏感黎曼核稀疏分类的三维人脸识别方法 |
CN109508678A (zh) * | 2018-11-16 | 2019-03-22 | 广州市百果园信息技术有限公司 | 人脸检测模型的训练方法、人脸关键点的检测方法和装置 |
CN109711297A (zh) * | 2018-12-14 | 2019-05-03 | 深圳壹账通智能科技有限公司 | 基于面部图片的风险识别方法、装置、计算机设备及存储介质 |
CN109871818A (zh) * | 2019-02-27 | 2019-06-11 | 东南大学 | 基于法向量分布直方图和协方差描述子的人脸识别方法 |
CN111027569A (zh) * | 2019-11-04 | 2020-04-17 | 华北电力大学(保定) | 一种基于红外图像的劣化绝缘子识别诊断方法及其装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733758A (zh) * | 2021-01-15 | 2021-04-30 | 哈尔滨工业大学(深圳) | 黎曼几何不变性下基于曲线的三维人脸识别方法及系统 |
CN112733758B (zh) * | 2021-01-15 | 2023-09-01 | 哈尔滨工业大学(深圳) | 黎曼几何不变性下基于曲线的三维人脸识别方法及系统 |
CN113378660A (zh) * | 2021-05-25 | 2021-09-10 | 广州紫为云科技有限公司 | 一种低数据成本的人脸识别的方法及装置 |
CN113378660B (zh) * | 2021-05-25 | 2023-11-07 | 广州紫为云科技有限公司 | 一种低数据成本的人脸识别的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112001231B (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tabia et al. | Covariance descriptors for 3D shape matching and retrieval | |
CN105138972B (zh) | 人脸认证方法和装置 | |
Li et al. | Overview of principal component analysis algorithm | |
Sarfraz et al. | Head Pose Estimation in Face Recognition Across Pose Scenarios. | |
Chen et al. | Fisher vector encoded deep convolutional features for unconstrained face verification | |
KR100950776B1 (ko) | 얼굴 인식 방법 | |
CN111709313B (zh) | 基于局部和通道组合特征的行人重识别方法 | |
Lee et al. | Face image retrieval using sparse representation classifier with gabor-lbp histogram | |
CN105844261A (zh) | 基于优化特征投影矩阵的3d掌纹稀疏表示识别方法 | |
Dikmen et al. | A data driven method for feature transformation | |
CN112001231B (zh) | 加权多任务稀疏表示的三维人脸识别方法、系统及介质 | |
Kpalma et al. | An overview of advances of pattern recognition systems in computer vision | |
Mali et al. | Indian sign language recognition using SVM classifier | |
CN113592030B (zh) | 基于复值奇异谱分析的图像检索方法和系统 | |
Alavi et al. | Random projections on manifolds of symmetric positive definite matrices for image classification | |
CN110287973B (zh) | 一种基于低秩鲁棒线性鉴别分析的图像特征提取方法 | |
CN112818779B (zh) | 一种基于特征优选与多种特征融合的人体行为识别方法 | |
Devi et al. | Retrieval and recognition of faces using content-based image retrieval (CBIR) and feature combination method | |
L Fernandes et al. | Study on MACE Gabor filters, Gabor wavelets, DCT-neural network, hybrid spatial feature interdependence matrix, fusion techniques for face recognition | |
Pietkiewicz et al. | Recognition of maritime objects based on FLIR images using the method of eigenimages | |
Chang et al. | Feature patch illumination spaces and Karcher compression for face recognition via Grassmannians | |
Deng et al. | Adaptive feature selection based on reconstruction residual and accurately located landmarks for expression-robust 3D face recognition | |
Feng et al. | The framework of learnable kernel function and its application to dictionary learning of SPD data | |
Liu et al. | Hilbert–Schmidt Independence Criterion Subspace Learning on Hybrid Region Covariance Descriptor for Image Classification | |
Bhati | Face Recognition Stationed on DT-CWT and Improved 2DPCA employing SVM Classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |