CN105069403B - 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别 - Google Patents

一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别 Download PDF

Info

Publication number
CN105069403B
CN105069403B CN201510427489.5A CN201510427489A CN105069403B CN 105069403 B CN105069403 B CN 105069403B CN 201510427489 A CN201510427489 A CN 201510427489A CN 105069403 B CN105069403 B CN 105069403B
Authority
CN
China
Prior art keywords
human ear
type
dimensional
dimensional human
dictionary learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510427489.5A
Other languages
English (en)
Other versions
CN105069403A (zh
Inventor
张�林
李力达
沈莹
李宏宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN201510427489.5A priority Critical patent/CN105069403B/zh
Publication of CN105069403A publication Critical patent/CN105069403A/zh
Application granted granted Critical
Publication of CN105069403B publication Critical patent/CN105069403B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • G06V20/653Three-dimensional objects by matching three-dimensional models, e.g. conformal mapping of Riemann surfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其将三维人耳的采样图像等分为若干个子区域,针对每个子区域,首先计算人耳的表面类型,然后使用直方图统计每个子区域内人耳表面类型,最后将每个子区域的表面类型直方图拼接在一起,作为人耳深度图像的特征描述算子,并使用字典学习稀疏表示框架进行分类,从而提高识别效率与精确度。本发明可用于对身份识别有严格要求的场合,有效地解决了多个三维人耳采样之间的对齐偏差问题。

Description

一种基于分块统计特征与字典学习稀疏表示分类的三维人耳 识别
技术领域
本发明属于模式识别领域,涉及一种身份信息验证的方法,尤其是一种人耳识别方法。
背景技术
随着信息技术的不断发展,海内外学者以及多家科技公司热衷于提高身份信息的验证效果,以满足实际生活中,诸如门禁控制、海关通关、体育场馆安检等多个不同场合中,对于识别人的身份的严苛需求。基于生物特征识别的方法正受到人们越来越多的关注。其中,人耳作为生物特征识别领域中一种新兴的生物特征,在近年中受到了广泛的研究,并通过实验证明人耳是一种性质优异的生物特征。人耳包括丰富的结构以及特殊的形状,具有普遍性、独特性、持久性等诸多特征。经前期研究发现,人耳的形状在8至70岁之间都不会发生改变。
二维人耳识别系统受限于成像因素,受光照条件影响大。此外,二维人耳图像容易被他人复制顶替,不适合对身份识别有严格要求的应用场合。对此,使用包含深度信息的人耳的三维数据进行识别,可以从数据获取途径层面上有效地克服上述问题。然而,在使用人耳的三维数据进行的识别过程中,通常需要进行三维数据之间的一对一的注册匹配,耗时漫长。另外,经过注册后,人耳的三维数据之间仍存在微小的注册误差,对提高人耳的三维数据的识别效果造成了瓶颈。
近年来,研究者将稀疏编码的算法成功应用于解决计算机视觉以及图像处理中的诸多问题中,包括图像去噪、图像恢复、物体识别、图像质量评价等。在稀疏编码中,通过选取一个过完备字典中的若干个元素,用所选取的元素线性表出输入信号。根据稀疏编码的各元素的大小以及所对应的字典项的类标,可用于解决物体识别问题。目前,有学者通过实验发现,使用字典学习的方法更新字典项,所得到的新字典在用于稀疏编码后,通常可以取得更加出色的识别效果。
发明内容
本发明的目的在于提供一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法。在以往的三维人耳匹配过程中,需要把待测人耳与已知集合中的每一个人耳的三维数 据样本逐一匹配。该方法效率随样本数据集合的容量增大而大幅降低。针对这一问题,本发明采用字典学习与稀疏表示分类的算法,解决一对多的识别问题。此外,本发明针对人耳的三维数据在注册匹配后,仍然存在的微小对齐误差的问题,采用基于分块统计特征的描述算子。通过实施上述策略,进而建立了一种精确、快速的三维人耳识别方法。
为达到上述目的,本发明的解决方案是:
一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,
(一)确定人耳的三维数据特征:
(1)定义为第i个人耳的第j次三维人耳的采样图像,其长、宽分别为U、V,共包含U×V个点,用(x,y,f(x,y))描述任意点P在三维空间中的位置;
(2)将在长、宽方向上分别作u等分和v等分,得到u×v个三维人耳采样图像的子区域,则每个子区域的长、宽分别为在长方向上的第p个、宽方向上的第q个子区域,其中,1≤p≤u,1≤q≤v;
所述步骤(2)中,若三维人耳图像的长U无法被u整除和/或三维人耳图像的宽V无法被v整除,分块时,保留三维人耳图像的位于中心区域的点进行分块以作为子区域,删除三维人耳图像四周无法被整除区域的点,不作为进行识别的子区域,优选方案为
(3)创建子区域的描述算子,用于描述子区域内三位人耳表面的信息:
(3-1)确定子区域内每个点的平均曲率H;
所述步骤(3-1)中,根据公式确定子区域内每个点的平均曲率H,其中fx,fy分别表示该点的深度在x、y方向上的一阶偏导,fxx,fyy,fxy分别表示该点的深度的二阶偏导。
(3-2)确定子区域内每个点的高斯曲率K;
所述步骤(3-2)中,根据公式计算子区域内每个点的高斯曲率K,其中fx,fy分别表示该点的深度在x、y方向上的一阶偏导,fxx,fyy,fxy分别表示该点的深度的二阶偏导。
所述步骤(3-1)与(3-2)中,为了准确地计算偏导数,可以采用P.J.Besl与R.C.Jain在Segmentation through variable-order surface fitting一文中所使用的方法。具体方法为,对于给定的深度图像,可先使用二项式滤波器S对深度图像f进行卷积平滑操作,其中S=ssT,s=[1 6 15 20 15 6 1]T/64,而后,使用预定义的窗口掩膜 计算偏导数,其中,d0=[1 1 1 1 1 1 1]T/7,d1=[-3 -2 -1 0 12 3]T/28,d2=[5 0 -3 -4 -4 0 5]T/84。从而,偏导数的计算公式为fx=Dx*S* f,fy=Dy*S*f,fxx=Dxx*S*f,fyy=Dyy*S*f,fxy=Dxy*S*f,其中,*代表卷积运算,可使用快速傅里叶变换的方法大幅度提升偏导数的计算效率。
(3-3)根据每个点的平均曲率H与高斯曲率K的符号,确定每个点的类型:若H<0且K>0,该点为类型1;若H<0且K=0,该点为类型2;若H<0且K<0,该点为类型3;若H=0且K>0,该点为类型4;若H=0且K=0,该点为类型5;若H=0且K<0,该点为类型6;若H>0且K>0,该点为类型7;若H>0且K=0,该点为类型8;若H>0且K<0,该点为类型9;
所述步骤(3-3)中,类型1呈峰状,类型2呈山脊状,类型3呈鞍岭状,类型5呈平面状,类型6为最小曲面,类型7呈凹陷状,类型8呈山谷状,类型9呈鞍谷状,类型4为特殊类型,包括除上述8种类型外的其他形状。在实际判断平均曲率H与高斯曲率K的符号时,由于在实际计算得出的平均曲率H与高斯曲率K的值均为实数值,而实数值精确取为0的概率极低,因此将实数值直接与0比较以确定符号的做法不适用于实际场景。在实际实现中,可参照D.Zhang,G.Lu,W.Li和N.Luo在Palmprint recognition using 3-D information中首次提出的改进方法,该方法为:分别定义包含数值0的两个非常短的区间[-εHH]与[-εKK],将经运算得到的H与K分别与对应的区间进行比较,以最终确定对应的表面类型。此外,为了使得εH或者εK适应于不同的人耳,可将H或者K的值,根据其标准差将其归一化。优选的εH与εK分别为0.030和0.015。
(3-4)使用直方图统计各类型出现的次数,得到向量h=[h1,h2,…hi…,h8,h9]以用于描述该子区域,其中hi表示该子区域内为类型i的点的个数,1≤i≤9;
(4)将各子区域的描述算子拼接在一起,构成的描述算子
其中hp,q表示在长方向上的第p个、宽方向上的第q个子区域的描述算子,n=9×u×v;
(二)根据步骤(一)中确定的人耳的三维数据特征构建三维人耳数据库 s表示数据库中的人耳总数,N表示数据库中的人耳采样的总数,Cj表示第j个人耳的采样总数;
所述步骤(二)中,构建得到的三维人耳数据库Y与人耳的三维数据采样总数N与描述算子的维度n的大小关系应满足N>>n;
在人耳的三维数据采样总数N与描述算子的维度n的大小关系为N≤n时,可以采用随机投影的算法对描述算子降维,即在步骤(三)中使用降维后的字典代替Y,其中 为高斯白噪音随机投影矩阵,满足
(三)根据步骤(二)中确定的三维人耳数据库Y,采用字典学习框架,得到学习过的字典以及分类器:
(I)从Y中随机选取κ个人耳的三维数据特征,组成字典
所述步骤(I)中,所选取的人耳的三维数据特征数目κ应满足κ>n。
(II)计算Y的有辨别性的稀疏编码矩阵其中 是yi对应的有辨别性的稀疏编码,qi中的非零元素所在的位置表示输入信号yi与字典项dj(j=1,…,κ)属于同一人耳;
(III)计算Y的类标矩阵其中是输入信号yi的类标向量,其中非零元素的位置表示该信号所属的人耳身份;
(IV)确定能量方程满足 其中为Y的稀疏编码,τ为稀疏限制阈值,‖·‖0计算向量中的非零元 素的个数,为线性变换矩阵,它使得初始的稀疏编码在κ维空间中 最具辨别能力,为线性分类器的参数矩阵;
所述步骤(IV)中,α、β为非负数,τ为正整数,优选方案为α=β=1,τ=7。
(V)为了最小化能量方程ε,可将其改写为满足 并令从而应用 K-SVD算法求解改写后的能量方程,即满足
(VI)由于在中,满足 因此经过字典学习后,所得到的字典与线性分类器的参数矩阵分别为
(四)根据步骤(三)中确定的使用稀疏表示分类方法,确定待测人耳的三维数据的身份:
(i)对于一个给定的待测三维人耳数据Eprobe,根据步骤(一),计算其描述算子yprobe,对所得到的描述算子在上进行稀疏编码,即求解满足‖x‖0≤τ;
所述步骤(i)中,求解稀疏编码可以采用正交匹配追踪算法,求解稀疏编码所使用的稀疏限制阈值τ采用步骤(IV)中所使用的τ的取值。
(ii)对于计算得到的稀疏编码使用经字典学习得到的线性分类器的参数矩阵计算类标向量
(iii)类标向量c中最大元素所处的位置所对应的身份,即为Eprobe的身份。
由于采用上述方案,本发明的有益效果是:
步骤(一)描述了对三维人耳数据进行分块,并使用直方图统计各分块中的人耳表面类型,最终获得三维人耳数据特征描述算子的过程。在本发明中,由于采用分块统计各分块中的人耳表面类型,对于同一个人耳的多次三维数据采样,经注册对齐后的采样之间仍存在的微小的对齐误差,对于三维人耳身份识别造成的影响可有效地降低。通过本步骤,对于输入的三维人耳数据,可以对各分块分别用直方图统计表面类型,从而构成该三维人耳的特征描述算子。
步骤(二)根据步骤(一)中确定的待测人耳的三维数据特征构建三维人耳数据库。为了保证该数据库具有支持多人多次注册的性质,步骤(二)对于每一次注册的三维人耳数据标记上所属的用户编号与注册次数,进而可以满足三维人耳数据的注册、识别、验证等基本需求。
步骤(三)根据步骤(二)中确定的三维人耳数据库,运用字典学习框架,得到学习后的字典以及分类器,
第一,从三维人耳数据库中随机选出多个三维人耳数据特征,组成初始字典D,虽然可直接用于稀疏编码算法。然而,在通常情况下,使用字典项的类标对初始字典进行有监督字典学习,所得到的字典更具有辨别能力,因此能提高三维人耳数据的识别率。
第二,在字典学习过程中,除了优化能量方程的重构误差项之外,同时将辨别性稀疏编码误差加入能量方程,并将分类器的参数对于分类结果的影响纳入能量方程中,不仅可以使得所学习得到的字典具备重构能力与出色的辨别能力,学习得到的字典还能使同一类别的信号的稀疏编码更一致而不同类别的信号的稀疏编码差异更大,因此在三维人耳数据识别的任务中更加出色。
第三,在优化能量方程所得到的分类器,可直接用于识别任务中,即使是采用一个简单的线性分类器,也能产生非常高的识别率,且运算用时极其短暂。
步骤(四)的效果在于识别率高,消耗时间少,识别时间不受三维人耳数据库内数据的增加而大幅攀升。
通过执行以上四个步骤并根据实际需求稍作调整,即可实现三维人耳数据的注册、识别和验证等基本功能,满足识别时间不受三维人耳数据库内数据的增加而大幅提升,同时,也解决了三维人耳数据在对齐过程中产生的误差对于三维人耳识别造成的影响。
附图说明
图1为本发明一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法的工作流程图。
具体实施方式
以下结合附图所示实施例对本发明作进一步的说明。
针对以往的三维人耳匹配过程中需要对待验证的人耳与数据库中的样本数据集进行逐一注册匹配,效率随样本数据集的容量增大而大幅降低的问题,本发明采用字典学习与稀疏表示分类算法对待测三维人耳进行一对多的识别;针对人耳的三维数据在注册匹配后仍存在的微小对齐误差,本发明采用基于分块统计特征的描述算子以建立一种精确、快速的三维人耳识别方法,其具体工作流程如图1所示:
(一)确定待测人耳的三维数据特征:
(1)定义为第i个人耳的第j次三维采样图像,其长、宽分别为U、V,共包含U×V个点,用(x,y,z)描述其中的任意点P在三维空间中的位置,其中z=f(x,y),f表示z轴方向上的取值关于x轴、y轴方向上取值的函数;
(2)将在长、宽方向上分别作u等分和v等分,得到u×v个三维人耳采样图像的子区域。记在长方向上的第p个、宽方向上的第q个子区域,满足1≤p≤u,1≤q≤v,其长、宽分别为
步骤(2)中,若三维人耳图像的长U无法被u整除和/或三维人耳图像的宽V无法被v整除,分块时,保留三维人耳图像的位于中心区域的点进行分块以作为子区域,删除三维人耳图像四周无法被整除区域的点,不作为进行识别的子区域。
例如,当三维人耳的图像为96×65大小,按行9等分,按列6等分,则可以得到54个相同大小的区域。对于每个区域,其长宽应该分别为96÷9=10.67,65÷6=10.83,即96无法整除9,65无法整除6。由于三维人耳的图像中点是离散的,无法取到诸如第10.67的点或者第10.83的点,在这种情况下,每个区域的长宽均向下取整,得到长宽均为10。如此一来,长宽各取了90个点和60个点,由于原图像长宽为96×65,因此长方向上上都多出了6个点,宽方向上多出了5个点。
本实施例中,选取人耳的三维图像中心区域的点进行分块以作为子区域,删除三维人耳图像四周无法被整除区域的点,也就是左边保留3个点不选,右边保留3个点不选;上面保留2个点不选,下面保留3个点不选,因此长方向上选取第4~第93的点,宽方向上选取第 3~第62的点,即位于中心区域的点,然后每100个点作为一个区域,分别进行统计表面类型。
(3)创建子区域的描述算子,用于描述子区域内三位人耳表面的信息:
(3-1)本实施例中,是根据公式确定子区域内每个点的平均曲率H,其中fx,fy分别表示该点的深度在x、y方向上的一阶偏导,fxx,fyy,fxy分别表示该点的深度的二阶偏导;
(3-2)根据公式确定子区域内每个点的高斯曲率K;
(3-3)根据每个点的平均曲率H与高斯曲率K的符号,确定每个点的类型:若H<0且K>0,该点为类型1;若H<0且K=0,该点为类型2;若H<0且K<0,该点为类型3;若H=0且K>0,该点为类型4;若H=0且K=0,该点为类型5;若H=0且K<0,该点为类型6;若H>0且K>0,该点为类型7;若H>0且K=0,该点为类型8;若H>0且K<0,该点为类型9。
步骤(3-3)中,类型1呈峰状,类型2呈山脊状,类型3呈鞍岭状,类型5呈平面状,类型6为最小曲面,类型7呈凹陷状,类型8呈山谷状,类型9呈鞍谷状,类型4为特殊类型。
(3-4)使用直方图统计各类型出现的次数,得到向量h=[h1,h2,…hi…,h8,h9]以用于描述该子区域,其中hi表示该子区域内为类型i的点的个数,1≤i≤9;
(4)将各子区域的描述算子拼接在一起,构成的描述算子
其中hp,q表示在长方向上的第p个、宽方向上的第q个子区域的描述算子。
(二)根据步骤(一)中确定的人耳的三维数据特征构建三维人耳数据库 s表示数据库中的人耳总数,N表示数据库中的人耳采样的总数,Cj表示第j个人耳的采样总数。
(三)根据步骤(二)中确定的三维人耳数据库Y,采用字典学习框架,得到学习过的字典以及分类器:
(I)从Y中随机选取κ个人耳的三维数据特征,组成字典
步骤(I)中,字典D优选的为一个行数小于列数的二维矩阵,且行数尽量小于列数的设置,能取得更好的识别效果。在对三维人耳图像划分块时,由于划分后的块数不同,比如可以按行按列划分成共25块,也可以划分成共100块,因此每个三维人耳的特征描述符的维度 不同,以上述数据为例,划分25块的描述符的维度为25×9=225维,划分为100块的描述符的维度为100×9=900维。由于字典D为一个行数远小于列数的二维矩阵时,能取得较好的识别效果,故本实施例中,若三维人耳数据库Y中的样本总数N不超过n个,即无法取出多于n个样本构成字典时,可以使用公式对Y降维,其中为高斯白噪音随机投影矩阵,满足并在步骤(三)及之后的步骤中,使用Y代替Y,进行三维人耳识别。
(II)计算Y的有辨别性的稀疏编码矩阵其中 是yi对应的有辨别性的稀疏编码,qi中的非零元素所在的位置表示输入信号yi与字典项dj(j=1,…,κ)属于同一人耳;
(III)计算Y的类标矩阵其中是输入信号yi的类标向量,其中非零元素的位置表示该信号所属的人耳身份,例如hi=[0,0,1,0]T表示输入信号yi属于第三号人耳。
(IV)确定能量方程满足 其中为Y的稀疏编码,τ为稀疏限制阈值,‖·‖0计算向量中的非零元 素的个数,为线性变换矩阵,它使得初始的稀疏编码在κ维空间中最 具辨别能力,为线性分类器的参数矩阵;
步骤(IV)中,α、β为非负数,τ为正整数,优选方案为α=β=1,τ=7。
(V)为了最小化能量方程ε,可将其改写为满足 并令从而应用 K-SVD算法求解改写后的能量方程,即满足
(VI)由于在中,满足 因此经过字典学习后,所得到的字典与线性分类器的参数矩阵分别为
(四)根据步骤(三)中确定的使用稀疏表示分类方法,确定待测人耳的三维数据的身份:
(i)对于一个给定的待测三维人耳数据Eprobe,根据步骤(一),计算其描述算子yprobe, 对所得到的描述算子在上进行稀疏编码,即求解满足‖x‖0≤τ;
步骤(i)中,求解稀疏编码可以采用正交匹配追踪算法,求解稀疏编码所使用的稀疏限制阈值τ采用步骤(IV)中所使用的τ的取值。
(ii)对于计算得到的稀疏编码使用经字典学习得到的线性分类器的参数矩阵计算类标向量
(iii)类标向量c中最大元素所处的位置所对应的身份,即为Eprobe的身份。
以下结合具体实验对本发明的有益效果进行说明:
实验设置:使用公开的UND-J2三维人耳数据集,包含2346张三维人耳采样,来自于415位志愿者。数据使用柯尼卡美能达Vivid 910深度扫描仪获取。志愿者坐在距离扫描仪1.5米距离的位置。扫描仪对准志愿者的左侧脸。每次拍摄得到的三维数据的分辨率为640×480。
由于在UND-J2数据集中,多数志愿者的采样次数仅有2次,而基于稀疏编码算法要求每一类中需要有足够多的采样次数。因此,为了充分展示本发明的有益效果,在实验过程中,从原数据集上虚拟地建立了四个数据子集,每个子集分别要求其中的每一位志愿者的采样次数超过6,8,10和12次。以第一个虚拟数据集为例,首先选取所有采样次数超过6次的志愿者,对于这其中的每一名志愿者的所有采样,随机选取6次采样用于构建训练集合,其余的所有采样均用于分类。四个子集合的主要信息总结在表1中。
表1
所有实验在惠普Z620工作站上运行,其配有3.2GHZ英特尔至强E5-1650中央处理器及8G内存,使用Matlab R2013b运行。
实验一:为了验证本发明提出的基于分块统计特征的描述符的鲁棒性,在本实验中,将本发明所使用的描述符,即步骤(一)(记为LHST),分别与局部二进制纹理(LBP)、竞争编码(记为CompCode),以及L.Zhang等在3D ear identification based on sparserepresentation 一文中所使用的基于主成分分析的方法(记为PCA),在四个子集合中进行横向比较。其中,LBP也是一种基于局部统计特征的描述符,被广泛应用于图像分类等任务中。为了提取基于LBP特征,对于人耳的三维图像,本发明也将其等分为若干个大小相同的子区域,并统计每一个子区域的LBP直方图,将每一个子区域的直方图拼接为最终的特征向量用于比较。针对LBP的不同参数设置,在实验中,记作其中“riu2”表示使用具有旋转不变性统一的纹理描述方式,该方式包含的变换上限为2,R代表采样半径,单位为像素,P代表采样点的个数。本实验比较了与这三者的简单拼接而成的特征描述符LBPm。对于不同的三维人耳数据的特征描述符,在对比实验中采取相同的分类方法,即沿用步骤(二)至步骤(四)的字典学习与稀疏表示分类方法。表2列出了不同特征描述符在四个数据子集合上的一阶识别率。
表2使用不同特征描述符所取得的一阶识别率(单位:%)
从表2中可以清楚地看到,在采用相同的字典学习与稀疏表示分类算法的前提下,采用本发明中所使用的基于分块的表面类型直方图统计特征的方法作为三维人耳的特征描述符,能取得比其余所有方法都要高的识别率。此外,这也说明了这种特征提取方法对于刻画三维深度数据的局部形状结构有着更突出的能力。
实验二:为了评估本发明对于三维人耳识别的性能,在本实验中,分别在四个子集合上,就不同三维人耳识别算法的一阶识别率与完成一次识别消耗的时间进行了比较。所比较的方法包括:本发明所使用的方法、迭代最近点算法(记作ICP)、L.Zhang等在3D earidentification based on sparse representation一文中所使用的基于主成分分析的方法、基于分块形状表面特征 直方图统计特征与稀疏表示分类(记作SRC_LHST)。在这里,完成一次识别消耗的时间指对于一份给定的人耳的三维数据样本所执行的特征提取所消耗的时间与特征匹配所消耗的时间之和。表3列出了不同方法在各子集合上取得的一阶识别率。表4列出了不同方法完成一次识别消耗的时间,其中,为了充分反映出不同方法所能达到的识别效果,各方法所消耗的时间均依照所取得最佳识别效果的参数配置进行记录。
表3使用不同方法所取得的一阶识别率(单位:%)
从表3中可以得出以下三点结论:第一,本发明提出的方法从一阶识别率而言,比其他方法的效果要更好,尤其是在子集合4上取得了100%的分类正确率;第二,SRC_LHST的识别效果比L.Zhang等的方法要更佳,而造成这一现象的原因在于二者尽管使用了相同的特征匹配方式,然而却使用了不同的特征提取方式,这一原因再次说明了本发明所采用的基于分块表面类型直方图统计特征的鲁棒性;第三,本发明所取得的一阶识别率在四个子集合中都优于SRC_LHST方法,而其原因在于前者使用了基于字典学习算法,利用训练集中特征的类别信息,同时训练得到更有辨别性的字典和线性分两类器,而后者未采用字典学习的方式,将训练集合中的特征直接组成字典进行分类,从此处,可以反映出步骤(三)对于三维人耳识别任务的重要性。
表4使用不同方法完成一次识别所消耗的时间(单位:秒)
在表4中,可以看出本发明在完成一次识别所消耗的时间比其余三种方法都要少。使用ICP方法的计算负担十分巨大,不适合用于大规模的识别场合。尽管采用相同的分类方式, SRC_LHST的运算效率高于L.Zhang等使用的方法,其原因在于,前者在计算基于分块表面类型直方图统计特征时,可使用快速傅里叶变换在很大程度上提升计算效率,而后者需要逐点进行PCA运算,速度缓慢。相比SRC_LHST与本发明的识别效率,尽管采用了相同的特征提取方式,而在特征匹配阶段,前者在稀疏编码阶段之后,需要根据稀疏编码逐类别地计算重构误差,以确定待测信号的所属类别,而后者在字典学习阶段同时训练得到了一个简单的线性分类器,在计算稀疏编码后,可使用线性分类器迅速地得到待测信号的类别,大大缩短了识别所消耗的时间。
上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和使用本发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。

Claims (11)

1.一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:
将三维人耳的采样图像等分为若干个子区域,针对每个子区域,首先计算人耳的表面类型,然后使用直方图统计每个子区域内人耳表面类型,最后将每个子区域的表面类型直方图拼接在一起,作为人耳深度图像的特征描述算子,并使用字典学习稀疏表示框架进行分类以提高识别效率与精确度;
包括以下步骤,
(一)确定人耳的三维数据特征:
(1)定义为第i个人耳的第j次三维人耳的采样图像,其长、宽分别为U、V,共包含U×V个点,用(x,y,f(x,y))描述任意点P在三维空间中的位置;
(2)将在长、宽方向上分别作u等分和v等分,得到u×v个三维人耳采样图像的子区域,则每个子区域的长、宽分别为在长方向上的第p个、宽方向上的第q个子区域,其中,1≤p≤u,1≤q≤v;
(3)创建子区域的描述算子,用于描述子区域内三维人耳表面的信息:
(3-1)确定子区域内每个点的平均曲率H;
(3-2)确定子区域内每个点的高斯曲率K;
(3-3)根据每个点的平均曲率H与高斯曲率K的符号,确定每个点的类型:若H<0且K>0,该点为类型1;若H<0且K=0,该点为类型2;若H<0且K<0,该点为类型3;若H=0且K>0,该点为类型4;若H=0且K=0,该点为类型5;若H=0且K<0,该点为类型6;若H>0且K>0,该点为类型7;若H>0且K=0,该点为类型8;若H>0且K<0,该点为类型9;
(3-4)使用直方图统计各类型出现的次数,得到向量以用于描述该子区域,其中表示该子区域内为类型的点的个数,
(4)将各子区域的描述算子拼接在一起,构成的描述算子其中hp,q表示在长方向上的第p个、宽方向上的第q个子区域的描述算子,n=9×u×v;
(二)根据步骤(一)中确定的人耳的三维数据特征构建三维人耳数据库
s表示数据库中的人耳总数,N表示数据库中的人耳采样的总数,Cψ表示第ψ个人耳的采样总数;
(三)根据步骤(二)中确定的三维人耳数据库Y,采用字典学习框架,得到学习过的字典以及分类器:
(I)从Y中随机选取κ个人耳的三维数据特征,组成字典
(II)计算Y的有辨别性的稀疏编码矩阵其中 是yθ对应的有辨别性的稀疏编码,qθ中的非零元素所在的位置表示输入信号yθ与字典项dη属于同一人耳,其中η=1,…,κ,θ=1,…,N;
(III)计算Y的类标矩阵其中是输入信号yθ的类标向量,其中非零元素的位置表示该信号所属的人耳身份;
(IV)确定能量方程满足其中为Y的稀疏编码,τ为稀疏限制阈值,||·||0计算向量中的非零元素的个数,为线性变换矩阵,它使得初始的稀疏编码在κ维空间中最具辨别能力,为线性分类器的参数矩阵;
(V)为了最小化能量方程ε,将其改写为满足并令从而应用K-SVD算法求解改写后的能量方程,即满足
(VI)由于在中,满足 因此经过字典学习后,所得到的字典与线性分类器的参数矩阵分别为
(四)根据步骤(三)中确定的使用稀疏表示分类方法,确定待测人耳的三维数据的身份:
(i)对于一个给定的待测三维人耳数据Eprobe,根据步骤(一),计算其描述算子yprobe,对所得到的描述算子在上进行稀疏编码,即求解满足||x||0≤τ;
(ii)对于计算得到的稀疏编码使用经字典学习得到的线性分类器的参数矩阵计算类标向量
(iii)类标向量c中最大元素所处的位置所对应的身份,即为Eprobe的身份。
2.根据权利要求1所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(2)中,若三维人耳图像的长U无法被u整除和/或三维人耳图像的宽V无法被v整除,分块时,保留三维人耳图像的位于中心区域的点进行分块以作为子区域,删除三维人耳图像四周无法被整除区域的点,不作为进行识别的子区域。
3.根据权利要求2所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(2)中,
4.根据权利要求1所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(3-1)中,根据公式确定子区域内每个点的平均曲率H,其中fx,fy分别表示该点的深度在x、y方向上的一阶偏导,fxx,fyy,fxy分别表示该点的深度的二阶偏导。
5.根据权利要求1所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(3-2)中,根据公式计算子区域内每个点的高斯曲率K,其中fx,fy分别表示该点的深度在x、y方向上的一阶偏导,fxx,fyy,fxy分别表示该点的深度的二阶偏导。
6.根据权利要求1所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(3-3)中,类型1呈峰状,类型2呈山脊状,类型3呈鞍岭状,类型5呈平面状,类型6为最小曲面,类型7呈凹陷状,类型8呈山谷状,类型9呈鞍谷状,类型4为特殊类型。
7.根据权利要求1所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(二)中,构建得到的三维人耳数据库Y与描述算子的维度n的大小关系应满足N>>n;
在人耳的三维数据采样总数N与描述算子的维度n的大小关系为N≤n时,采用随机投影的算法对描述算子降维,即在步骤(三)中使用降维后的字典代替Y,其中为高斯白噪音投影矩阵,满足
8.根据权利要求1所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(I)中,所选取的人耳的三维数据特征数目κ应满足κ>n。
9.根据权利要求1所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(IV)中,α、β为非负数,τ为正整数。
10.根据权利要求1所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(IV)中,α=β=1,τ=7。
11.根据权利要求1所述的基于分块统计特征与字典学习稀疏表示分类的三维人耳识别方法,其特征在于:所述步骤(i)中,求解稀疏编码采用正交匹配追踪算法;或者,所述步骤(i)中,求解稀疏编码所使用的稀疏限制阈值τ采用步骤(IV)中所使用的τ的取值。
CN201510427489.5A 2015-07-20 2015-07-20 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别 Active CN105069403B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510427489.5A CN105069403B (zh) 2015-07-20 2015-07-20 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510427489.5A CN105069403B (zh) 2015-07-20 2015-07-20 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别

Publications (2)

Publication Number Publication Date
CN105069403A CN105069403A (zh) 2015-11-18
CN105069403B true CN105069403B (zh) 2018-10-26

Family

ID=54498765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510427489.5A Active CN105069403B (zh) 2015-07-20 2015-07-20 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别

Country Status (1)

Country Link
CN (1) CN105069403B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654029B (zh) * 2015-11-30 2019-04-05 辽宁师范大学 可提高识别精度及效率的三维点云耳廓识别方法
CN106778807A (zh) * 2016-11-22 2017-05-31 天津大学 基于公共字典对和类依赖字典对的细粒度图像分类方法
CN111062343B (zh) * 2019-12-20 2023-04-18 东南大学 基于平均曲率和正态分布变换的三维人耳识别方法
CN111414827B (zh) * 2020-03-13 2022-02-08 四川长虹电器股份有限公司 基于稀疏编码特征的深度图像人体检测方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166842A (zh) * 2014-07-25 2014-11-26 同济大学 一种基于分块统计特征与联合表示的三维掌纹识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0807411D0 (en) * 2008-04-23 2008-05-28 Mitsubishi Electric Inf Tech Scale robust feature-based indentfiers for image identification

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166842A (zh) * 2014-07-25 2014-11-26 同济大学 一种基于分块统计特征与联合表示的三维掌纹识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Sparse Representation for Face Recognition based on Discriminative Low-Rank Dictionary Learning;Long Ma 等;《IEEE》;20121231;第2586页-2593页 *
基于学习字典的稀疏表示人耳识别方法;江晨 等;《第25届中国控制与决策会议论文集》;20131231;第1487页-1491页 *

Also Published As

Publication number Publication date
CN105069403A (zh) 2015-11-18

Similar Documents

Publication Publication Date Title
CN106682598B (zh) 一种基于级联回归的多姿态的人脸特征点检测方法
CN103632132B (zh) 一种基于肤色分割和模板匹配的人脸检测与识别方法
Cheng et al. Outdoor scene image segmentation based on background recognition and perceptual organization
CN108875600A (zh) 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质
CN103996057B (zh) 基于多特征融合的实时手写体数字识别方法
CN102332086B (zh) 一种基于双阈值局部二进制模式的人脸识别方法
CN103035013B (zh) 一种基于多特征融合的精确运动阴影检测方法
CN104240256B (zh) 一种基于层次化稀疏建模的图像显著性检测方法
CN104408449B (zh) 智能移动终端场景文字处理方法
CN103413145B (zh) 基于深度图像的关节点定位方法
CN103984920B (zh) 一种基于稀疏表示与多特征点的三维人脸识别方法
CN109902590A (zh) 深度多视图特征距离学习的行人重识别方法
CN103679158A (zh) 人脸认证方法和装置
CN108681737B (zh) 一种复杂光照下图像特征提取方法
CN106778687A (zh) 基于局部评估和全局优化的注视点检测方法
CN105069774B (zh) 基于多示例学习与图割优化的目标分割方法
CN105069403B (zh) 一种基于分块统计特征与字典学习稀疏表示分类的三维人耳识别
CN110119726A (zh) 一种基于YOLOv3模型的车辆品牌多角度识别方法
CN103198303A (zh) 一种基于人脸图像的性别识别方法
CN109711416A (zh) 目标识别方法、装置、计算机设备和存储介质
CN105095867A (zh) 基于深度学习的快速动态人脸提取、识别方法
Jia et al. SAR image change detection based on iterative label-information composite kernel supervised by anisotropic texture
CN108108760A (zh) 一种快速人脸识别方法
CN108268865A (zh) 一种基于级联卷积网络的自然场景下车牌识别方法及系统
CN112949738A (zh) 基于eecnn算法的多类不平衡高光谱图像分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant