CN101556646B

CN101556646B - 一种基于核聚类的虹膜分类方法

Info

Publication number: CN101556646B
Application number: CN200910059358.0A
Authority: CN
Inventors: 解梅; 郑韬
Original assignee: University of Electronic Science and Technology of China
Current assignee: Houpu Clean Energy Group Co ltd
Priority date: 2009-05-20
Filing date: 2009-05-20
Publication date: 2013-03-13
Anticipated expiration: 2029-05-20
Also published as: CN101556646A

Abstract

一种基于核聚类的虹膜分类方法，属于图像处理技术领域，涉及虹膜身份识别技术。针对虹膜数据库建立聚类时，首先将虹膜归一化图像等分成上下两层，分别对上下层做三层小波分解，选取其中7个通道下的小波系数计算能量和标准差；然后将上下两层的小波能量和标准差相除得到虹膜库样本的特征向量；将特征向量进行基于核方法的聚类，得到聚类结果。对待检测虹膜进行分类时，先将虹膜库所有特征向量输入到支持向量机中进行训练，得到支持向量和判别函数；最后将待检测虹膜样品的相应的特征向量输入判别函数中检测，得到分类结果。本发明能快速而准确的找到待检测虹膜样本所属的聚类，有利于提高虹膜识别准确率和识别效率。

Description

一种基于核聚类的虹膜分类方法

技术领域

本发明属于图像处理技术领域，主要涉及生物特征鉴别中的虹膜身份识别技术。

背景技术

目前，基于虹膜特征的身份识别技术己经渗透到日常生活的每一个方面，虹膜数据库的样本量也越来越大。例如：英国政府发起的IRIS计划要求至少一百万个经常在英国出入境的旅行者通过视频头采集虹膜进行身份识别，而不需要随身附带其他的身份鉴别证明；同时，英国政府正试图将生物信息加入到公民身份证中，如果成功采集到英国大约六千万公民的虹膜图像，那虹膜数据库的样本将达到海量。而我国人口是英国的约20倍，出入境人数更是达到了3亿多。

所以，在海量虹膜数据库的情况下对于特定虹膜样本的识别过程中，需要在虹膜数据库中快速而准确的找到其分类检索，这对于特定虹膜样本的识别具有十分必要意义的。在海量虹膜数据库中建立适当标准的分类检索不仅有利于提高虹膜识别准确率，更加有利于提高虹膜识别的效率。

目前虹膜识别技术领域的研究主要集中在虹膜的定位与匹配识别方面，尚没有针对海量虹膜数据库进行分类索引的研究。

发明内容

本发明的任务是提供一种基于核聚类的虹膜分类方法，该方法首先针对现有虹膜数据库(尤其是海量数据库)建立一种便于分类索引的聚类，然后针对特定的待识别虹膜样本进行分类。本发明有利于提高虹膜识别准确率和识别效率。

本发明详细技术方案如下：

一种基于核聚类的虹膜分类方法，如图1所示，包括以下两个过程：

一、针对现存虹膜数据库建立聚类的过程，具体包括以下步骤：

步骤1：设现存虹膜数据库中虹膜样本原始图像的数量为N，对现存虹膜数据库的所有虹膜样本原始图像进行编号；

步骤2：提取虹膜数据库中一张经编号的虹膜样本原始图像I；

步骤3：将步骤2中的虹膜样本原始图像I进行去噪、定位和归一化处理，得到其大小为64×256像素的虹膜归一化图像A；

步骤4：将步骤3所得的虹膜归一化图像A进行光照补偿和直方图拉伸后，等分成大小为32×256像素的上下两层图像：上层图像A_up和下层图像A_down；

步骤5：对上层图像A_up采用Daubechies-4小波进行三层分解，删除三层小波分解过程中得到的三个高频通道下的系数，保留其余7个通道并计算每个通道的平均能量E^up和标准差STD^up；

然后将各个通道上的平均能量E^up和标准差STD^up按照LL³，LH³，HL³，LH²，HL²，LH¹，HL¹的顺序排列，得到上层图像A_up的分类特征向量Feature_A_up：

Feature_A_up = [E_{1}^{up}, {STD}_{1}^{up}, E_{2}^{up}, {STD}_{2}^{up}, E_{3}^{up}, {STD}_{3}^{up}, E_{4}^{up}, {STD}_{4}^{up}, E_{5}^{up}, {STD}_{5}^{up}, E_{6}^{up}, {STD}_{6}^{up}, E_{7}^{up}, {STD}_{7}^{up}];

步骤6：对下层图像A_down采用与步骤5相同的处理方法，得到下层图像A_down的分类特征向量Feature_A_down：

Feature_A_down =

[E_{1}^{down}, {STD}_{1}^{down}, E_{2}^{down}, {STD}_{2}^{down}, E_{3}^{down}, {STD}_{3}^{down}, E_{4}^{down}, {STD}_{4}^{down}, E_{5}^{down}, {STD}_{5}^{down}, E_{6}^{down}, {STD}_{6}^{down}, E_{7}^{down}, {STD}_{7}^{down}];

步骤7：将上层图像A_up的分类特征向量Feature_A_up与下层图像A_down的分类特征向量Feature_B_down一一对应相除，得到标准虹膜原始图像I内外半圆在小波系数统计量上的比值，作为虹膜归一化图像的特征向量：

Feature_A =

[\frac{E_{1}^{up}}{E_{1}^{down}}, \frac{{STD}_{1}^{up}}{{STD}_{1}^{down}}, \frac{E_{2}^{up}}{E_{2}^{down}}, \frac{{STD}_{2}^{up}}{{STD}_{2}^{down}}, \frac{E_{3}^{up}}{E_{3}^{down}}, \frac{{STD}_{3}^{up}}{{STD}_{3}^{down}}, \frac{E_{4}^{up}}{E_{4}^{down}}, \frac{{STD}_{4}^{up}}{{STD}_{4}^{down}}, \frac{E_{5}^{up}}{E_{5}^{down}}, \frac{{STD}_{5}^{up}}{{STD}_{5}^{down}}, \frac{E_{6}^{up}}{E_{6}^{down}}, \frac{{STD}_{6}^{up}}{{STD}_{6}^{down}}, \frac{E_{7}^{up}}{E_{7}^{down}}, \frac{{STD}_{7}^{up}}{{STD}_{7}^{down}}]

步骤8：反复执行步骤2至步骤7，对虹膜数据库中的所有编号的虹膜样本原始图像，计算其虹膜归一化图像A的特征向量，得到N个虹膜归一化图像的特征向量，并组成一个N×14的虹膜归一化图像特征向量矩阵X。

步骤9：定义一个N×2的聚类矩阵B，聚类矩阵B的行号与虹膜数据库中虹膜样本原始图像的编号一一对应，其中每一行中的两个元素中一个为0，另一个为1，“1”表示对应行号的虹膜样本原始图像属于“1”所在列所对应的聚类。

步骤10：定义对角矩阵

D = [\begin{matrix} 1 / Σ_{i = 1}^{N} B_{i, 1} & 0 \\ 0 & 1 / Σ_{i = 1}^{N} B_{i, 2} \end{matrix}],

其对角元素依次是聚类矩阵B的第一、二列所有元素之和的倒数；计算质心矩阵C＝X′BD，其中X′为虹膜归一化图像特征向量矩阵X的转置矩阵，质心矩阵C的第k列C_k，k＝1，2，表示第k类聚类的质心。

步骤11：计算虹膜数据库中所有虹膜样本原始图像的归一化图像的特征向量Feature_A与两聚类质心C_k的距离：κ(φ(x)，C_k)；其中φ(x)表示归一化图像的特征向量Feature_A；x表示虹膜样本原始图像的编号，即聚类矩阵B的行号；然后比较κ(φ(x)，C₁)与κ(φ(x)，C₂)的大小，把编号为x的虹膜样本原始图像分到距离聚类的质心最小的那个聚类，即对应修改聚类矩阵B的x行中“1”的位置；得到更新后的聚类矩阵B′。

步骤12：比较聚类矩阵B′与聚类矩阵B，若二者对应元素完全相同，则执行步骤13；若二者对应元素不完全相同，则令B＝B′并返回步骤10。

步骤13：聚类矩阵B′的行号与虹膜数据库中虹膜样本原始图像的编号一一对应，其中每一行中的元素“1”所在列的列号代表对应行号的虹膜样本原始图像所属的聚类，这样就把所述虹膜数据库的虹膜样本原始图像分成了两个聚类。

通过步骤1至步骤12，就能够得到所述虹膜数据库的第一级分类的两个聚类；若将第一级分类的两个聚类分别视为两个新的虹膜数据库，再分别采取步骤1至步骤13的操作，就能够得到所述虹膜数据库的第二级分类的四个聚类；以此类推，则能够得到所述虹膜数据库的第n级分类的2ⁿ个聚类。

二、待检测虹膜样本原始图像的归类过程，具体包括以下步骤：

步骤14：对于待检测虹膜样本原始图像，进行去噪、定位和归一化处理，得到其大小为64×256像素的虹膜归一化图像A；

步骤15：将步骤14所得的虹膜归一化图像A进行光照补偿和直方图拉伸后，等分成大小为32×256像素的上下两层图像：上层图像A_up和下层图像A_down；

步骤16：对上层图像A_up采用Daubechies-4小波进行三层分解，删除三层小波分解过程中得到的三个高频通道下的系数，保留其余7个通道并计算每个通道的平均能量E^up和标准差STD^up；

Feature_A_up = [E_{1}^{up}, {STD}_{1}^{up}, E_{2}^{up}, {STD}_{2}^{up}, E_{3}^{up}, {STD}_{3}^{up}, E_{4}^{up}, {STD}_{4}^{up}, E_{5}^{up}, {STD}_{5}^{up}, E_{6}^{up}, {STD}_{6}^{up}, E_{7}^{up}, {STD}_{7}^{up}];

步骤17：对下层图像A_down采用与步骤16相同的处理方法，得到下层图像A_down的分类特征向量Feature_A_down：

Feature_A_down =

[E_{1}^{down}, {STD}_{1}^{down}, E_{2}^{down}, {STD}_{2}^{down}, E_{3}^{down}, {STD}_{3}^{down}, E_{4}^{down}, {STD}_{4}^{down}, E_{5}^{down}, {STD}_{5}^{down}, E_{6}^{down}, {STD}_{6}^{down}, E_{7}^{down}, {STD}_{7}^{down}];

步骤18：将上层图像A_up的分类特征向量Feature_A_up与下层图像A_down的分类特征向量Feature_B_down一一对应相除，得到标准虹膜原始图像I内外半圆在小波系数统计量上的比值，作为虹膜归一化图像的特征向量：

Feature_A =

[\frac{E_{1}^{up}}{E_{1}^{down}}, \frac{{STD}_{1}^{up}}{{STD}_{1}^{down}}, \frac{E_{2}^{up}}{E_{2}^{down}}, \frac{{STD}_{2}^{up}}{{STD}_{2}^{down}}, \frac{E_{3}^{up}}{E_{3}^{down}}, \frac{{STD}_{3}^{up}}{{STD}_{3}^{down}}, \frac{E_{4}^{up}}{E_{4}^{down}}, \frac{{STD}_{4}^{up}}{{STD}_{4}^{down}}, \frac{E_{5}^{up}}{E_{5}^{down}}, \frac{{STD}_{5}^{up}}{{STD}_{5}^{down}}, \frac{E_{6}^{up}}{E_{6}^{down}}, \frac{{STD}_{6}^{up}}{{STD}_{6}^{down}}, \frac{E_{7}^{up}}{E_{7}^{down}}, \frac{{STD}_{7}^{up}}{{STD}_{7}^{down}}]

步骤19：构建聚类标签向量Y＝[y₁，y₂，…，y_j，…y_N]^T，其中y_j＝-1或1，当y_j＝-1时表示现存虹膜数据库中编号为j的虹膜样本原始图像属于聚类一，当y_j＝1时表示现存虹膜数据库中编号为j的虹膜样本原始图像属于聚类二；然后将步骤8中所述的虹膜归一化图像特征向量矩阵X和聚类标签向量Y输入到支持向量机中训练，得到支持向量集合SV和判别函数f(x)，其中

f (x) = sgn {\underset{x_{j} &Element; SV}{Σ} α_{j} y_{j} κ (x_{j}, x) + b},

判别函数f(x)中：x表示待检测虹膜样本原始图像的归一化图像特征向量Feature_A；x_j表示虹膜归一化图像特征向量矩阵X中第j行向量；κ(x_j，x)表示x到x_j的距离；α_j表示x_j的权重系数，且当x_j∈SV时α_j＞0，当

x_{j} &NotElement; SV

时α_j＝0；b表示支持向量机的冗余度。

步骤20：将待检测虹膜样本原始图像的归一化图像特征向量x输入到步骤19所述的判别函数f(x)，计算判别函数f(x)的值，当f(x)＝-1时表示待检测虹膜样本原始图像属于聚类一；当f(x)＝1时表示待检测虹膜样本原始图像属于聚类二。

通过步骤14至步骤20，就能够得到待检测虹膜样本原始图像在所述虹膜数据库中所属的一级聚类；若将待检测虹膜样本原始图像在所述虹膜数据库中所属的一级聚类视为新的虹膜数据库，再采取步骤19至步骤20的操作，就能够得到待检测虹膜样本原始图像在所述虹膜数据库中所属的二级聚类；以此类推，则能够得到待检测虹膜样本原始图像在所述虹膜数据库中所属的n级聚类。

需要说明的是：

步骤11和步骤19中计算所述距离时，具体计算方法可以采用范数距离或核空间距离的计算方法。若采用核空间距离的计算方法，具体方法可以采用高斯核空间距离计算方法。但不管采用什么计算方法，步骤11和步骤19应当采用同样的距离计算方法。

本发明的有益效果是：

本发明创新性地提出了一种基于核聚类的虹膜分类的方法，将海量的虹膜数据库中的虹膜样本进行无监督地聚类并对待检测的虹膜样本原始图像进行分类，找到其所属的聚类。本发明利用虹膜纹理能量和标准差在方向、频率、位置上的不同，使用Daubechies-4小波对虹膜纹理提取并构建特征向量；在无监督聚类算法中运用了核方法，得到比经典聚类方法(如C均值聚类)更接近数据特性、性能更为良好的分类结果；利用聚类中核算法的多样性，机动地、灵活地选取适合表达虹膜纹理的核算法，而不是经典聚类算法中确定一种算法，就只能得到一种聚类结果；最后采用支持向量机对待测试虹膜样本进行分类，使分类成为凸最优化问题，更容易得到全局最优解。

本发明能够快速而准确的找到待检测的虹膜样本原始图像所属的聚类，从而减少虹膜识别时待检测的虹膜样本原始图像在海量虹膜库中匹配的时间，有利于提高虹膜识别准确率和识别效率。

附图说明

图1：本发明提供的一种基于核聚类的虹膜分类方法的流程示意图。

图2：归一化示意图。

图3：小波分解示意图。

步骤4中所提及的7个通道分别为：LL³，LH³，HL³，LH²，HL²，LH¹，HL¹。

具体实施方式

采用本发明的方法，使用Matlab语言编写虹膜识别软件，然后用中科院自动化所采集的CASIA2.0虹膜数据库为源数据。从中提取出40个人的虹膜图片，分别对其进行高斯噪声(选取25组不同的参数)的攻击，乘积性噪声(选取25组不同的参数)的攻击和不同角度(角度范围0度到10度)的旋转，一共2400张图片进行分类。正确分类结果为98.3％，各个噪声的正确分类率为96.6％，97.8％和96.3％。

同时从CASIA2.0库中选取40个人，每人9张拍摄于不同时期的虹膜图片进行分类训练，成功将40个人的虹膜分成大小合适的3类，并得到支持向量机的各个参数。另外选取同样40个人，每人3张的虹膜图片作为测试库。经过提取特征向量后，输入支持向量机进行分类测试，得到平均92％的分类正确率。

Claims

1.一种基于核聚类的虹膜分类方法，包括以下两个过程：

Feature_A_up = [E_{1}^{up}, {STD}_{1}^{up}, E_{2}^{up}, {STD}_{2}^{up}, E_{3}^{up}, {STD}_{3}^{up}, E_{4}^{up}, {STD}_{4}^{up}, E_{5}^{up}, {STD}_{5}^{up}, E_{6}^{up}, {STD}_{6}^{up}, E_{7}^{up}, {STD}_{7}^{up}];

Feature_A_down =

[E_{1}^{down}, {STD}_{1}^{down}, E_{2}^{down}, {STD}_{2}^{down}, E_{3}^{down}, {STD}_{3}^{down}, E_{4}^{down}, {STD}_{4}^{down}, E_{5}^{down}, {STD}_{5}^{down}, E_{6}^{down}, {STD}_{6}^{down}, E_{7}^{down}, {STD}_{7}^{down}];

步骤7：将上层图像A_up的分类特征向量Feature_A_up与下层图像A_down的分类特征向量Feature_A_down一一对应相除，得到虹膜样本原始图像I内外半圆在小波系数统计量上的比值，作为虹膜归一化图像的特征向量：

Feature_A =

[\frac{E_{1}^{up}}{E_{1}^{down}}, \frac{{STD}_{1}^{up}}{{STD}_{1}^{down}}, \frac{E_{2}^{up}}{E_{2}^{down}}, \frac{{STD}_{2}^{up}}{{STD}_{2}^{down}}, \frac{E_{3}^{up}}{E_{3}^{down}}, \frac{{STD}_{3}^{up}}{{STD}_{3}^{down}}, \frac{E_{4}^{up}}{E_{4}^{down}}, \frac{{STD}_{4}^{up}}{{STD}_{4}^{down}}, \frac{E_{5}^{up}}{E_{5}^{down}}, \frac{{STD}_{5}^{up}}{{STD}_{5}^{down}}, \frac{E_{6}^{up}}{E_{6}^{down}}, \frac{{STD}_{6}^{up}}{{STD}_{6}^{down}}, \frac{E_{7}^{up}}{E_{7}^{down}}, \frac{{STD}_{7}^{up}}{{STD}_{7}^{down}}]

步骤8：反复执行步骤2至步骤7，对虹膜数据库中的所有编号的虹膜样本原始图像，计算其虹膜归一化图像A的特征向量，得到N个虹膜归一化图像的特征向量，并组成一个N×14的虹膜归一化图像特征向量矩阵X；

步骤9：定义一个N×2的聚类矩阵B，聚类矩阵B的行号与虹膜数据库中虹膜样本原始图像的编号一一对应，其中每一行中的两个元素中一个为0，另一个为1，“1”表示对应行号的虹膜样本原始图像属于“1”所在列所对应的聚类；

步骤10：定义对角矩阵

D = [\begin{matrix} 1 / Σ_{i = 1}^{N} B_{i, 1} & 0 \\ 0 & 1 / Σ_{i = 1}^{N} B_{i, 2} \end{matrix}],

其对角元素依次是聚类矩阵B的第一、二列所有元素之和的倒数；计算质心矩阵C＝X′BD，其中X′为虹膜归一化图像特征向量矩阵X的转置矩阵，质心矩阵C的第k列C_k，k＝1，2，表示第k类聚类的质心；

步骤11：计算虹膜数据库中所有虹膜样本原始图像的归一化图像的特征向量Feature_A与两聚类质心C_k的距离K(φ(x)，C_k)；其中φ(x)表示归一化图像的特征向量Feature_A；x表示虹膜样本原始图像的编号，即聚类矩阵B的行号；然后比较κ(φ(x)，C₁)与κ(φ(x)，C₂)的大小，把编号为x的虹膜样本原始图像分到距离聚类的质心最小的那个聚类，即对应修改聚类矩阵B的x行中“1”的位置；得到更新后的聚类矩阵B′；

步骤12：比较聚类矩阵B′与聚类矩阵B，若二者对应元素完全相同，则执行步骤13；若二者对应元素不完全相同，则令B＝B′并返回步骤10；

步骤13：聚类矩阵B′的行号与虹膜数据库中虹膜样本原始图像的编号一一对应，其中每一行中的元素“1”所在列的列号代表对应行号的虹膜样本原始图像所属的聚类，这样就把所述虹膜数据库的虹膜样本原始图像分成了两个聚类；

通过步骤1至步骤12，就能够得到所述虹膜数据库的第一级分类的两个聚类；若将第一级分类的两个聚类分别视为两个新的虹膜数据库，再分别采取步骤1至步骤13的操作，就能够得到所述虹膜数据库的第二级分类的四个聚类；以此类推，则能够得到所述虹膜数据库的第n级分类的2ⁿ个聚类；

Feature_A_up = [E_{1}^{up}, {STD}_{1}^{up}, E_{2}^{up}, {STD}_{2}^{up}, E_{3}^{up}, {STD}_{3}^{up}, E_{4}^{up}, {STD}_{4}^{up}, E_{5}^{up}, {STD}_{5}^{up}, E_{6}^{up}, {STD}_{6}^{up}, E_{7}^{up}, {STD}_{7}^{up}];

Feature_A_down =

[E_{1}^{down}, {STD}_{1}^{down}, E_{2}^{down}, {STD}_{2}^{down}, E_{3}^{down}, {STD}_{3}^{down}, E_{4}^{down}, {STD}_{4}^{down}, E_{5}^{down}, {STD}_{5}^{down}, E_{6}^{down}, {STD}_{6}^{down}, E_{7}^{down}, {STD}_{7}^{down}];

步骤18：将上层图像A_up的分类特征向量Feature_A_up与下层图像A_down的分类特征向量Feature_A_down一一对应相除，得到待检测虹膜样本原始图像内外半圆在小波系数统计量上的比值，作为虹膜归一化图像的特征向量：

Feature_A =

[\frac{E_{1}^{up}}{E_{1}^{down}}, \frac{{STD}_{1}^{up}}{{STD}_{1}^{down}}, \frac{E_{2}^{up}}{E_{2}^{down}}, \frac{{STD}_{2}^{up}}{{STD}_{2}^{down}}, \frac{E_{3}^{up}}{E_{3}^{down}}, \frac{{STD}_{3}^{up}}{{STD}_{3}^{down}}, \frac{E_{4}^{up}}{E_{4}^{down}}, \frac{{STD}_{4}^{up}}{{STD}_{4}^{down}}, \frac{E_{5}^{up}}{E_{5}^{down}}, \frac{{STD}_{5}^{up}}{{STD}_{5}^{down}}, \frac{E_{6}^{up}}{E_{6}^{down}}, \frac{{STD}_{6}^{up}}{{STD}_{6}^{down}}, \frac{E_{7}^{up}}{E_{7}^{down}}, \frac{{STD}_{7}^{up}}{{STD}_{7}^{down}}]

时α_j＝0；b表示支持向量机的冗余度；

步骤20：将待检测虹膜样本原始图像的归一化图像特征向量Feature_A输入到步骤19所述的判别函数f(x)，计算判别函数f(x)的值，当f(x)＝-1时表示待检测虹膜样本原始图像属于聚类一；当f(x)＝1时表示待检测虹膜样本原始图像属于聚类二；