发明内容
本发明的任务是提供一种基于核聚类的虹膜分类方法,该方法首先针对现有虹膜数据库(尤其是海量数据库)建立一种便于分类索引的聚类,然后针对特定的待识别虹膜样本进行分类。本发明有利于提高虹膜识别准确率和识别效率。
本发明详细技术方案如下:
一种基于核聚类的虹膜分类方法,如图1所示,包括以下两个过程:
一、针对现存虹膜数据库建立聚类的过程,具体包括以下步骤:
步骤1:设现存虹膜数据库中虹膜样本原始图像的数量为N,对现存虹膜数据库的所有虹膜样本原始图像进行编号;
步骤2:提取虹膜数据库中一张经编号的虹膜样本原始图像I;
步骤3:将步骤2中的虹膜样本原始图像I进行去噪、定位和归一化处理,得到其大小为64×256像素的虹膜归一化图像A;
步骤4:将步骤3所得的虹膜归一化图像A进行光照补偿和直方图拉伸后,等分成大小为32×256像素的上下两层图像:上层图像A_up和下层图像A_down;
步骤5:对上层图像A_up采用Daubechies-4小波进行三层分解,删除三层小波分解过程中得到的三个高频通道下的系数,保留其余7个通道并计算每个通道的平均能量Eup和标准差STDup;
然后将各个通道上的平均能量Eup和标准差STDup按照LL3,LH3,HL3,LH2,HL2,LH1,HL1的顺序排列,得到上层图像A_up的分类特征向量Feature_A_up:
步骤6:对下层图像A_down采用与步骤5相同的处理方法,得到下层图像A_down的分类特征向量Feature_A_down:
步骤7:将上层图像A_up的分类特征向量Feature_A_up与下层图像A_down的分类特征向量Feature_B_down一一对应相除,得到标准虹膜原始图像I内外半圆在小波系数统计量上的比值,作为虹膜归一化图像的特征向量:
步骤8:反复执行步骤2至步骤7,对虹膜数据库中的所有编号的虹膜样本原始图像,计算其虹膜归一化图像A的特征向量,得到N个虹膜归一化图像的特征向量,并组成一个N×14的虹膜归一化图像特征向量矩阵X。
步骤9:定义一个N×2的聚类矩阵B,聚类矩阵B的行号与虹膜数据库中虹膜样本原始图像的编号一一对应,其中每一行中的两个元素中一个为0,另一个为1,“1”表示对应行号的虹膜样本原始图像属于“1”所在列所对应的聚类。
步骤10:定义对角矩阵 其对角元素依次是聚类矩阵B的第一、二列所有元素之和的倒数;计算质心矩阵C=X′BD,其中X′为虹膜归一化图像特征向量矩阵X的转置矩阵,质心矩阵C的第k列Ck,k=1,2,表示第k类聚类的质心。
步骤11:计算虹膜数据库中所有虹膜样本原始图像的归一化图像的特征向量Feature_A与两聚类质心Ck的距离:κ(φ(x),Ck);其中φ(x)表示归一化图像的特征向量Feature_A;x表示虹膜样本原始图像的编号,即聚类矩阵B的行号;然后比较κ(φ(x),C1)与κ(φ(x),C2)的大小,把编号为x的虹膜样本原始图像分到距离聚类的质心最小的那个聚类,即对应修改聚类矩阵B的x行中“1”的位置;得到更新后的聚类矩阵B′。
步骤12:比较聚类矩阵B′与聚类矩阵B,若二者对应元素完全相同,则执行步骤13;若二者对应元素不完全相同,则令B=B′并返回步骤10。
步骤13:聚类矩阵B′的行号与虹膜数据库中虹膜样本原始图像的编号一一对应,其中每一行中的元素“1”所在列的列号代表对应行号的虹膜样本原始图像所属的聚类,这样就把所述虹膜数据库的虹膜样本原始图像分成了两个聚类。
通过步骤1至步骤12,就能够得到所述虹膜数据库的第一级分类的两个聚类;若将第一级分类的两个聚类分别视为两个新的虹膜数据库,再分别采取步骤1至步骤13的操作,就能够得到所述虹膜数据库的第二级分类的四个聚类;以此类推,则能够得到所述虹膜数据库的第n级分类的2n个聚类。
二、待检测虹膜样本原始图像的归类过程,具体包括以下步骤:
步骤14:对于待检测虹膜样本原始图像,进行去噪、定位和归一化处理,得到其大小为64×256像素的虹膜归一化图像A;
步骤15:将步骤14所得的虹膜归一化图像A进行光照补偿和直方图拉伸后,等分成大小为32×256像素的上下两层图像:上层图像A_up和下层图像A_down;
步骤16:对上层图像A_up采用Daubechies-4小波进行三层分解,删除三层小波分解过程中得到的三个高频通道下的系数,保留其余7个通道并计算每个通道的平均能量Eup和标准差STDup;
然后将各个通道上的平均能量Eup和标准差STDup按照LL3,LH3,HL3,LH2,HL2,LH1,HL1的顺序排列,得到上层图像A_up的分类特征向量Feature_A_up:
步骤17:对下层图像A_down采用与步骤16相同的处理方法,得到下层图像A_down的分类特征向量Feature_A_down:
步骤18:将上层图像A_up的分类特征向量Feature_A_up与下层图像A_down的分类特征向量Feature_B_down一一对应相除,得到标准虹膜原始图像I内外半圆在小波系数统计量上的比值,作为虹膜归一化图像的特征向量:
步骤19:构建聚类标签向量Y=[y1,y2,…,yj,…yN]T,其中yj=-1或1,当yj=-1时表示现存虹膜数据库中编号为j的虹膜样本原始图像属于聚类一,当yj=1时表示现存虹膜数据库中编号为j的虹膜样本原始图像属于聚类二;然后将步骤8中所述的虹膜归一化图像特征向量矩阵X和聚类标签向量Y输入到支持向量机中训练,得到支持向量集合SV和判别函数f(x),其中 判别函数f(x)中:x表示待检测虹膜样本原始图像的归一化图像特征向量Feature_A;xj表示虹膜归一化图像特征向量矩阵X中第j行向量;κ(xj,x)表示x到xj的距离;αj表示xj的权重系数,且当xj∈SV时αj>0,当 时αj=0;b表示支持向量机的冗余度。
步骤20:将待检测虹膜样本原始图像的归一化图像特征向量x输入到步骤19所述的判别函数f(x),计算判别函数f(x)的值,当f(x)=-1时表示待检测虹膜样本原始图像属于聚类一;当f(x)=1时表示待检测虹膜样本原始图像属于聚类二。
通过步骤14至步骤20,就能够得到待检测虹膜样本原始图像在所述虹膜数据库中所属的一级聚类;若将待检测虹膜样本原始图像在所述虹膜数据库中所属的一级聚类视为新的虹膜数据库,再采取步骤19至步骤20的操作,就能够得到待检测虹膜样本原始图像在所述虹膜数据库中所属的二级聚类;以此类推,则能够得到待检测虹膜样本原始图像在所述虹膜数据库中所属的n级聚类。
需要说明的是:
步骤11和步骤19中计算所述距离时,具体计算方法可以采用范数距离或核空间距离的计算方法。若采用核空间距离的计算方法,具体方法可以采用高斯核空间距离计算方法。但不管采用什么计算方法,步骤11和步骤19应当采用同样的距离计算方法。
本发明的有益效果是:
本发明创新性地提出了一种基于核聚类的虹膜分类的方法,将海量的虹膜数据库中的虹膜样本进行无监督地聚类并对待检测的虹膜样本原始图像进行分类,找到其所属的聚类。本发明利用虹膜纹理能量和标准差在方向、频率、位置上的不同,使用Daubechies-4小波对虹膜纹理提取并构建特征向量;在无监督聚类算法中运用了核方法,得到比经典聚类方法(如C均值聚类)更接近数据特性、性能更为良好的分类结果;利用聚类中核算法的多样性,机动地、灵活地选取适合表达虹膜纹理的核算法,而不是经典聚类算法中确定一种算法,就只能得到一种聚类结果;最后采用支持向量机对待测试虹膜样本进行分类,使分类成为凸最优化问题,更容易得到全局最优解。
本发明能够快速而准确的找到待检测的虹膜样本原始图像所属的聚类,从而减少虹膜识别时待检测的虹膜样本原始图像在海量虹膜库中匹配的时间,有利于提高虹膜识别准确率和识别效率。