CN110490107A

CN110490107A - 一种基于胶囊神经网络的指纹识别技术

Info

Publication number: CN110490107A
Application number: CN201910723251.5A
Authority: CN
Inventors: 李裕梅; 杨顺欣; 王鑫; 曹显兵; 傅莺莺
Original assignee: Beijing Technology and Business University
Current assignee: Beijing Technology and Business University
Priority date: 2019-08-06
Filing date: 2019-08-06
Publication date: 2019-11-22

Abstract

本发明公开了一种基于胶囊神经网络的指纹识别技术，属于指纹识别技术领域，(1)指纹图像区域的自动寻找和提取；(2)对指纹图片进行预处理(包括指纹图像增强、二值化、细化)；(3)设置胶囊神经网络的结构；(4)设置胶囊神经网络中每一层的参数；(5)设置网络训练的学习率、批尺寸和训练轮次；(6)用所选择的指纹图像训练集对胶囊网络进行训练；(7)使用胶囊神经网络对指纹图像测试集进行分类测试和识别，得到分类精度。本发明的方法首次将胶囊神经网络应用于指纹识别技术领域，解决了关键技术难题，并得到了很高的精度。

Description

一种基于胶囊神经网络的指纹识别技术

技术领域

本发明涉及一种基于胶囊神经网络的指纹识别技术，其属于指纹识别技术领域。

背景技术

在当今这个高速发展的社会中，信息化水平不断提高，科学技术不断发展，数据与信息与人民生产生活紧密联系，同时更涉及到军事等众多敏感领域。信息与数据是一把双刃剑，为社会和人民带来方便的同时，也能带来很多安全问题。对于身份鉴定，人们采用了各式各样的方法来保证自己的数据安全，其中指纹识别是最主要、最常见身份鉴定方式之一，指纹识别具有非常多的优点： (1)指纹是人体独有的特征之一，不会随年龄变化而变化，具有良好的稳定性； (2)指纹图案十分复杂，不同人指纹图形、纹线数量、掌纹线的分布都是完全不同的；(3)指纹图像易采集，采集过程不会对人体造成伤害，采集成本低，且指纹图像易保存和处理；(4)指纹识别，只要设计好计算机算法，结合硬件，比较容易操作。当然，其中的算法设计是关键，虽然设计好以后，操作应用的人会感觉比较简单，各种不同的算法，可以得到不同的识别精度，指纹识别算法设计方面，现有的经典的指纹匹配算法有三大类：(1)基于相关性的匹配；(2) 基于细节点的匹配；(3)基于非细节点的匹配。这三大类算法都是通过提取指纹图像底层内容特征，通过各种匹配方法进行特征比较，从而识别指纹。而深度学习出现以后，图像的底层特征提取基本不再有优势，通过深度学习自动从图像中学习和提取特征，再用于识别，已经大大的提升后续识别效果。现在将深度学习用于做指纹识别的，主要还是用卷积神经网络进行指纹特征学习和分类识别；比如：基于卷积神经网络的指纹中心块识别算法，基于卷积神经网络的指纹特征点模糊化图识别算法等，而卷积神经网络本身比胶囊网络的不足有：(1) 卷积神经网络无法真正地模仿生物神经网络；(2)卷积神经网络的结构过于复杂并且效率低下；(3)没有保留特征之间的空间层次关系。而胶囊网络正是在克服了卷积神经网络的上述缺点发展起来的。我们首次将胶囊神经网络用于指纹识别，而胶囊网络，Google开源的tensorflow代码主要用于识别手写数字，手写数字图像本身比较简单，要将开源的代码用于复杂的指纹图像识别，以及指纹图像的前期处理，综合起来，我们解决了如下几个关键的技术问题。第一， tensorflow开源的代码里设计的图像是28×28大小的，把胶囊网络用于做其他工作的研究者们基本上都把自己的图片缩放或者分块到28×28大小、以便直接调用tensorflow里开源的代码，从而实现自己的工作。对于指纹图像(我们实际采集的是288×375大小)，如果缩放到28×28，那指纹图像本身的很多特征信息就会丢失，从而会导致后续实验结果非常不准确；再者，如果分块成28×28 大小，那么指纹纹路的连续性受到分割和阻断，从而导致深度神经网络学习出来的特征不连续，不利于识别；但因为胶囊网络中的张量计算导致计算量太大、实验在我们操作的很多设备上难以进行，在保持图像基本信息、基本不影响后续分类精度的情况下，我们把指纹图像由288×375适当缩放到200×200(如果设备计算能力允许的话，我们的代码也很容易改成用原图大小)，但200×200 的图像完全不能直接调用原来tensorflow实用于28×28图像的代码。所以，我们改编原来代码，这一步的技术很关键，难度比较大，这也正是很多使用者只愿意改变自己图片的大小到28×28来适应tensorflow原始的程序代码的原因，而我们经过详细的研究，根据原始代码进行重新整改，从而适应我们自己的图像大小，有利于保证图像信息的完整性。第二，指纹图像采集的过程中，会有很多噪声，尤其是指纹周边，我们创新性地将指纹图像自动寻找和提取算法运用到预处理过程中，能够去除指纹无关区域，提高学习效率和最终识别精度。第三，原始tensorflow里关于手写数字识别的代码，学习率为一个固定常数，这对于图像结构简单的手写数字识别、能得到很好的效果，但对于信息复杂的指纹图像、效果非常差。所以，我们改变设计方式，选择了指数衰减的方式对学习率进行调整，避免出现学习率过小导致收敛时间变长或是学习率过大而跨过最优值使得学习不稳定。

发明内容

本发明是针对现有技术存在的不足，提供一种基于胶囊神经网络的指纹识别技术，解决了上述背景技术存在的问题，满足实际使用要求。

为解决上述问题，本发明所采取的技术方案如下：

一种基于胶囊神经网络的指纹识别技术，包括以下步骤：

(1)指纹图像区域的自动寻找和提取；

(2)指纹图像的增强；

(3)指纹图像的二值化；

(4)指纹图像的细化；

(5)确定胶囊网络模型的结构；

(6)确定胶囊神经网络中每一层结构的参数；

(7)确定胶囊神经网络中的学习率、批尺寸和训练轮次；

(8)用所选择的指纹图像训练集对胶囊网络进行训练；

(9)使用胶囊神经网络对指纹图像测试集进行分类测试和识别，得到分类精度。

作为上述技术方案的改进，所述步骤(1)的具体步骤如下：

步骤(1-1)：将指纹图片灰度化处理；

步骤(1-2)：利用高斯滤波算子进行高斯平滑处理来消除原来指纹图像的高斯噪声；

步骤(1-3)：通过Sobel算子提取具有高水平梯度和低垂直梯度的指纹图像区域；

步骤(1-4)：将Sobel算子提取好的指纹图像进行二值化操作；

步骤(1-5)：使用形态学中的闭操作处理，将二值指纹图像中的细小间隔消除，分割出独立的指纹图像区域；

步骤(1-6)：使用OpenCv库中的findContours()函数将指纹图片的轮廓计算出来，接着标记出指纹图像区域；

步骤(1-7)：按照提取好的指纹图像区域将其从原图像切割。

作为上述技术方案的改进，所述步骤(2)的具体步骤如下：

步骤(2-1):将指纹图像分为不重叠的若干个指纹块；

步骤(2-2):估计每一个指纹块的方向信息和纹线的频率；

步骤(2-3):用Gabor滤波器对这些指纹块进行增强；

步骤(2-4):将增强后的指纹块还原整张指纹图片。

作为上述技术方案的改进，所述步骤(3)的具体操作是设置一个阈值，超过阈值的像素点变为1，未超过的像素点变为0；指纹图像中的纹线之间的间隙基本相同，本文利用指纹图像的这个特性，根据指纹图像每一部分的特点来调整阈值，可以取得更好的二值效果。

作为上述技术方案的改进，所述步骤(4)的具体操作是采用查表法来对指纹图像进行细化处理。

作为上述技术方案的改进，所述步骤(5)中，设置了两个卷积层，一个初级胶囊层，一个数字胶囊层和一个三级的全连接层。

作为上述技术方案的改进，所述步骤(6)，又分为以下几个小的步骤来完成：

步骤(6-1)：在卷积层1中，图片输入的大小为200×200，本文采用的卷积核大小为9×9，卷积的步长为1，选用的激活函数为ReLu函数，填充大小为[0，0，0，0]，卷积核的个数为256个；

步骤(6-2)：卷积层2中，图片输入大小为192×192(这是卷积层1输出的图片大小。每个卷积层的输入输出大小由下面的公式(1)和(2)可以推出)，采用的卷积核大小仍然是9×9，步长变为2，选用的激活函数为ReLu 函数，填充大小为[0，0，0，0]，卷积核的个数为256个；

步骤(6-3)：在初级胶囊层中，输入大小为92×92，输出大小可以由上面公式(1)和公式(2)推出，将步长设为2。填充大小为[0，0，0，0]，采用非线性挤压函数作为激活函数，其数学表达式如公式(3)所示：

其中，v_j为非线性挤压函数的输出向量，s_j为输入向量，为缩放的尺度，为单位化向量，该非线性挤压函数有非常好的性质，的分母比分子大1，当s_j模长很长的时候，输出结果v_j的模长就越接近1，当s_j模长很小的时候，输出结果v_j≈||s_j||s_j，v_j模长就越接近0，同时非线性挤压函数过后方向并未改变，不同于前面两层，最后将这一层的通道数设置为32，每个通道中包含8个卷积核，这样就可以保证卷积核的总数不会发生变化，提取的特征总数不会发生变化；

步骤(6-4)：在数字胶囊层中，该层的输入大小为42×42，由于要对 10类指纹进行识别，该层的胶囊个数设为10个，而初级胶囊层会输出56448 个初级胶囊，每个胶囊的维度为8，由于我们期望输出的v_j的维度为16，在数字胶囊层中，需要的仿射变换矩阵的大小为8×16，需要的仿射变换矩阵的个数为564480个，需要耦合系数c_ij564480个；

步骤(6-5)：第一个全连接层的单元数设置为512，第二个全连接层的单元数设置为1024，将第三个全连接层的单元数设置为40000，这三个全连接层分别使用激活函数ReLu，ReLu和Sigmoid，整个胶囊神经网络的结构，如图1所示。

作为上述技术方案的改进，所述步骤(7)，又分为以下几个小的步骤来完成：

步骤(7-1)：本文选择的是Adam优化器进行优化，将整体损失最小作为优化的目标。本文采用指数衰减的方式使得学习率能够动态调整。其中学习率的表达式为：

new_lr＝lr×rate^gs/ds (2)

公式(2)中，new_lr表示更新后的学习率，lr表示原来的学习率，rate 为衰减率，gs为当前训练的轮次，ds为衰减周期，本文将初始学习率lr设置为0.01，衰减率rate设置为0.96，衰减周期设置为282，这样每次训练282 轮次后，学习率变为原来学习率的96％；

步骤(7-2)：将训练轮次设置为900轮；

步骤(7-3)：选取的批尺寸为32。

本发明的实施效果如下：本发明的基于胶囊神经网络的指纹识别技术，可以对指纹图像进行分类和识别。

附图说明

图1是本发明设置的胶囊神经网络的结构图；

图2是本发明对指纹图像区域进行寻找和提取的效果示意图；

图3是本发明对指纹图像增强的效果示意图；

图4是本发明对指纹图像二值化的效果示意图；

图5是本发明对指纹图像细化的效果示意图；

图6是本发明训练集和验证集的损失值与训练轮次的关系图；

图7是本发明训练集和验证集的准确率与训练轮次的关系图。

具体实施方式

下面将结合具体的实施例来说明本发明的内容。

所述基于胶囊神经网络的指纹识别技术，包括：(1)指纹图像区域的自动寻找和提取；(2)指纹图像的增强；(3)指纹图像的二值化；(4)指纹图像的细化；(5)确定胶囊网络模型的结构；(6)确定胶囊神经网络中每一层结构参数；(7)确定胶囊神经网络中的学习率、批尺寸和训练轮次； (8)用所选择的指纹图像训练集对胶囊网络进行训练；(9)使用胶囊神经网络对指纹图像测试集进行分类测试和识别，得到分类精度。

其中，所述步骤(1)的具体步骤如下：

步骤(1-1)：将指纹图片灰度化处理；

步骤(1-4)：将Sobel算子提取好的指纹图片进行二值化操作；

步骤(1-7)：按照提取好的指纹图像区域将其从原图像切割。

所述步骤(2)的具体步骤如下：

步骤(2-1):将指纹图像分为不重叠的若干个指纹块；

步骤(2-2):估计每一个指纹块的方向信息和纹线的频率；

步骤(2-3):用Gabor滤波器对这些指纹块进行增强；

步骤(2-4):将增强后的指纹块还原整张指纹图片。

具体地，所述步骤(3)的具体操作是设置一个阈值，超过阈值的像素点变为1，未超过的像素点变为0；指纹图像中的纹线之间的间隙基本相同，本文利用指纹图像的这个特性，根据指纹图像每一部分的特点来调整阈值，可以取得更好的二值效果。

具体地，所述步骤(4)的具体操作是采用查表法来对指纹图像进行细化处理；所述步骤(5)中，本文设置了两个卷积层，一个初级胶囊层，一个数字胶囊层和一个三级的全连接层。

具体地，所述步骤(6)，又分为以下几个小的步骤来完成：

步骤(6-3)：在初级胶囊层中，输入大小为92×92，输入大小可以由上面公式(1)和公式(2)推出，将步长设为2。填充大小为[0，0，0，0]，采用非线性挤压函数作为激活函数，其数学表达式如公式(3)所示：

步骤(6-4)：在数字胶囊层中，该层的输入大小为42×42，由于要对十类指纹进行识别，该层的胶囊个数设为10个，而初级胶囊层会输出56448 个初级胶囊，每个胶囊的维度为8，由于我们期望输出的v_j的维度为16，在数字胶囊层中，需要的仿射变换矩阵的大小为8×16，需要的仿射变换矩阵的个数为564480个，需要耦合系数c_ij564480个；

具体地，所述步骤(7)，又分为以下几个小的步骤来完成：

new_lr＝lr×rate^gs/ds (2)

步骤(7-2)：文将训练轮次设置为900轮；

步骤(7-3)：本文选取的批尺寸为32。

为了实现基于胶囊神经网络的指纹识别技术，实例的步骤如下：

(1)建立指纹图片数据库

指纹图片是由中控LIVE20R指纹采集仪器对实验者进行指纹采集得到的，我们找到了10名志愿者参与采样，每名志愿者采集右手的食指指纹，采样50次，共采样500张指纹图片，每张指纹图片的大小为288×375，格式为png格式；为了减少指纹图片识别中过拟合的现象，我们要对指纹图片的数量进行扩充；本文将预处理处理好的指纹图片进行随机旋转来扩充数据库。原来500张指纹图片经过随机旋转扩充到了9000张指纹图片。

(2)对指纹图片库中的所有指纹图片进行批量预处理

下面分别给出了指纹图像预处理中指纹图像区域的寻找和提取、指纹图像的增强、指纹图像的二值化、指纹图像的细化的处理结果图。

如图2所示，是本发明指纹图像区域进行寻找和提取的效果示意图；如图3所示，是本发明指纹图像增强的效果示意图；如图4所示，是本发明指纹图像二值化的效果示意图；如图5所示，是本发明指纹图像细化的效果示意图；

(3)基于胶囊神经网络的指纹识别技术的训练和预测实验结果分析，下面给出神经网络的训练结果图。

如图6所示，是本发明训练集和验证集的损失值与训练轮次的关系图；如图7所示，是本发明训练集和验证集的准确率与训练轮次的关系图；

从图6可以看出，训练集和验证集的损失值变化趋势相同，说明本文所用的指纹图片库可以用胶囊神经网络进行学习，胶囊神经网络在前200 轮的训练中，损失值下降的非常快，说明网络在前200轮的训练中，训练效果非常好，200轮以后，损失值缓慢下降，800轮以后，损失值一直在 0.1～0.2附近，说明在800轮以后模型训练遇到了瓶颈。可以从图7中观察到前300轮的训练中，训练集和验证集的准确率上升十分明显，但是在300 轮以后验证集的准确率基本在70％到80％这个区间来回波动，然而训练集准确率继续上升，直到训练到800轮次后，准确率在100％附近。结合损失值得变化情况，说明800轮次以后可能已经过拟合，需要扩充数据库中指纹图片的数目，以达到更好的效果。那么在现有图片库的基础上，我们的最终精度是96％，效果已经非常好了，如果扩大训练样本集，还可以得到更好的精度，也就是得到更好的识别效果。

以上内容是结合具体的实施例对本发明所作的详细说明，不能认定本发明具体实施仅限于这些说明。对于本发明所属技术领域的技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明保护的范围。

Claims

1.一种基于胶囊神经网络的指纹识别技术，其特征在于：步骤如下：

(1)指纹图像区域的自动寻找和提取；

(2)指纹图像的增强；

(3)指纹图像的二值化；

(4)指纹图像的细化；

(5)确定胶囊网络模型的结构；

(6)确定胶囊神经网络中每一层结构的参数；

(7)确定胶囊神经网络中的学习率、批尺寸和训练轮次；

(8)胶囊网络训练指纹图像；

(9)使用胶囊神经网络对指纹图像进行识别和分类，得到分类精度。

2.根据权利要求1所述的基于胶囊神经网络的指纹识别技术，其特征在于：步骤(1)的具体步骤如下：指纹图像区域的自动寻找和提取，指纹图片的增强，指纹图片的二值化，指纹图片的细化。

3.根据权利要求2所述的基于胶囊神经网络的指纹识别技术，其特征在于：步骤(2)的具体步骤如下：设置两个卷积层，一个初级胶囊层，一个数字胶囊层和一个三级的全连接层。

4.根据权利要求3所述的基于胶囊神经网络的指纹识别技术，其特征在于：步骤(3)的具体步骤如下：在卷积层1中，图片输入的大小为200×200，采用的卷积核大小为9×9，卷积的步长为1，选用的激活函数为ReLu函数，填充大小为[0，0，0，0]，卷积核的个数为256个；卷积层2中，图片输入大小为192×192，采用的卷积核大小仍是9×9，步长变为2，选用的激活函数为ReLu函数，填充大小为[0，0，0，0]，卷积核的个数为256个；在初级胶囊层中，输入大小为92×92，将步长设为2，填充大小为[0，0，0，0]，采用非线性挤压函数作为激活函数，不同于前面两层，最后将这一层的通道数设置为32，每个通道中包含8个卷积核，这样可保证卷积核的总数不会发生变化，提取特征总数不会发生变化，在数字胶囊层中，该层的输入大小为42×42；由于要对十类指纹进行识别，该层的胶囊个数设为10个，而初级胶囊层会输出56448个初级胶囊，每个胶囊的维度为8，由于我们期望输出的_vj的维度为16，在数字胶囊层中，需要的仿射变化矩阵的大小为8×16，需要的仿射变化矩阵的个数为564480个，需要耦合系数_cij564480个；第一个全连接层的单元数设置为512，第二个全连接层的单元数设置为1024，将第三个全连接层的单元数设置为40000，这三个全连接层分别使用激活函数ReLu，ReLu和Sigmoid。

5.根据权利要求4所述的基于胶囊神经网络的指纹识别技术，其特征在于：步骤(4)的具体步骤如下：选择Adam优化器进行优化，将整体损失最小作为优化的目标，采用指数衰减的方式使得学习率能够动态调整，将训练轮次设置为900轮，选取的批尺寸为32。