CN110490107A - 一种基于胶囊神经网络的指纹识别技术 - Google Patents
一种基于胶囊神经网络的指纹识别技术 Download PDFInfo
- Publication number
- CN110490107A CN110490107A CN201910723251.5A CN201910723251A CN110490107A CN 110490107 A CN110490107 A CN 110490107A CN 201910723251 A CN201910723251 A CN 201910723251A CN 110490107 A CN110490107 A CN 110490107A
- Authority
- CN
- China
- Prior art keywords
- capsule
- fingerprint
- neural network
- layer
- fingerprint image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002775 capsule Substances 0.000 title claims abstract description 73
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 36
- 238000005516 engineering process Methods 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 10
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000013016 damping Methods 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 238000003475 lamination Methods 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 9
- 238000012360 testing method Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration by the use of local operators
-
- G06T5/70—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/12—Fingerprints or palmprints
- G06V40/1347—Preprocessing; Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/12—Fingerprints or palmprints
- G06V40/1365—Matching; Classification
Abstract
本发明公开了一种基于胶囊神经网络的指纹识别技术,属于指纹识别技术领域,(1)指纹图像区域的自动寻找和提取;(2)对指纹图片进行预处理(包括指纹图像增强、二值化、细化);(3)设置胶囊神经网络的结构;(4)设置胶囊神经网络中每一层的参数;(5)设置网络训练的学习率、批尺寸和训练轮次;(6)用所选择的指纹图像训练集对胶囊网络进行训练;(7)使用胶囊神经网络对指纹图像测试集进行分类测试和识别,得到分类精度。本发明的方法首次将胶囊神经网络应用于指纹识别技术领域,解决了关键技术难题,并得到了很高的精度。
Description
技术领域
本发明涉及一种基于胶囊神经网络的指纹识别技术,其属于指纹识别 技术领域。
背景技术
在当今这个高速发展的社会中,信息化水平不断提高,科学技术不断发展, 数据与信息与人民生产生活紧密联系,同时更涉及到军事等众多敏感领域。信 息与数据是一把双刃剑,为社会和人民带来方便的同时,也能带来很多安全问 题。对于身份鉴定,人们采用了各式各样的方法来保证自己的数据安全,其中 指纹识别是最主要、最常见身份鉴定方式之一,指纹识别具有非常多的优点: (1)指纹是人体独有的特征之一,不会随年龄变化而变化,具有良好的稳定性; (2)指纹图案十分复杂,不同人指纹图形、纹线数量、掌纹线的分布都是完全 不同的;(3)指纹图像易采集,采集过程不会对人体造成伤害,采集成本低, 且指纹图像易保存和处理;(4)指纹识别,只要设计好计算机算法,结合硬件, 比较容易操作。当然,其中的算法设计是关键,虽然设计好以后,操作应用的 人会感觉比较简单,各种不同的算法,可以得到不同的识别精度,指纹识别算 法设计方面,现有的经典的指纹匹配算法有三大类:(1)基于相关性的匹配;(2) 基于细节点的匹配;(3)基于非细节点的匹配。这三大类算法都是通过提取指纹 图像底层内容特征,通过各种匹配方法进行特征比较,从而识别指纹。而深度 学习出现以后,图像的底层特征提取基本不再有优势,通过深度学习自动从图 像中学习和提取特征,再用于识别,已经大大的提升后续识别效果。现在将深 度学习用于做指纹识别的,主要还是用卷积神经网络进行指纹特征学习和分类 识别;比如:基于卷积神经网络的指纹中心块识别算法,基于卷积神经网络的 指纹特征点模糊化图识别算法等,而卷积神经网络本身比胶囊网络的不足有:(1) 卷积神经网络无法真正地模仿生物神经网络;(2)卷积神经网络的结构过于复杂 并且效率低下;(3)没有保留特征之间的空间层次关系。而胶囊网络正是在克服 了卷积神经网络的上述缺点发展起来的。我们首次将胶囊神经网络用于指纹识 别,而胶囊网络,Google开源的tensorflow代码主要用于识别手写数字,手写 数字图像本身比较简单,要将开源的代码用于复杂的指纹图像识别,以及指纹 图像的前期处理,综合起来,我们解决了如下几个关键的技术问题。第一, tensorflow开源的代码里设计的图像是28×28大小的,把胶囊网络用于做其他 工作的研究者们基本上都把自己的图片缩放或者分块到28×28大小、以便直接 调用tensorflow里开源的代码,从而实现自己的工作。对于指纹图像(我们实际 采集的是288×375大小),如果缩放到28×28,那指纹图像本身的很多特征信 息就会丢失,从而会导致后续实验结果非常不准确;再者,如果分块成28×28 大小,那么指纹纹路的连续性受到分割和阻断,从而导致深度神经网络学习出 来的特征不连续,不利于识别;但因为胶囊网络中的张量计算导致计算量太大、 实验在我们操作的很多设备上难以进行,在保持图像基本信息、基本不影响后 续分类精度的情况下,我们把指纹图像由288×375适当缩放到200×200(如果 设备计算能力允许的话,我们的代码也很容易改成用原图大小),但200×200 的图像完全不能直接调用原来tensorflow实用于28×28图像的代码。所以,我 们改编原来代码,这一步的技术很关键,难度比较大,这也正是很多使用者只 愿意改变自己图片的大小到28×28来适应tensorflow原始的程序代码的原因, 而我们经过详细的研究,根据原始代码进行重新整改,从而适应我们自己的图 像大小,有利于保证图像信息的完整性。第二,指纹图像采集的过程中,会有很多噪声,尤其是指纹周边,我们创新性地将指纹图像自动寻找和提取算法运 用到预处理过程中,能够去除指纹无关区域,提高学习效率和最终识别精度。 第三,原始tensorflow里关于手写数字识别的代码,学习率为一个固定常数,这 对于图像结构简单的手写数字识别、能得到很好的效果,但对于信息复杂的指 纹图像、效果非常差。所以,我们改变设计方式,选择了指数衰减的方式对学 习率进行调整,避免出现学习率过小导致收敛时间变长或是学习率过大而跨过 最优值使得学习不稳定。
发明内容
本发明是针对现有技术存在的不足,提供一种基于胶囊神经网络的指 纹识别技术,解决了上述背景技术存在的问题,满足实际使用要求。
为解决上述问题,本发明所采取的技术方案如下:
一种基于胶囊神经网络的指纹识别技术,包括以下步骤:
(1)指纹图像区域的自动寻找和提取;
(2)指纹图像的增强;
(3)指纹图像的二值化;
(4)指纹图像的细化;
(5)确定胶囊网络模型的结构;
(6)确定胶囊神经网络中每一层结构的参数;
(7)确定胶囊神经网络中的学习率、批尺寸和训练轮次;
(8)用所选择的指纹图像训练集对胶囊网络进行训练;
(9)使用胶囊神经网络对指纹图像测试集进行分类测试和识别,得到 分类精度。
作为上述技术方案的改进,所述步骤(1)的具体步骤如下:
步骤(1-1):将指纹图片灰度化处理;
步骤(1-2):利用高斯滤波算子进行高斯平滑处理来消除原来指纹图像 的高斯噪声;
步骤(1-3):通过Sobel算子提取具有高水平梯度和低垂直梯度的指纹 图像区域;
步骤(1-4):将Sobel算子提取好的指纹图像进行二值化操作;
步骤(1-5):使用形态学中的闭操作处理,将二值指纹图像中的细小间 隔消除,分割出独立的指纹图像区域;
步骤(1-6):使用OpenCv库中的findContours()函数将指纹图片的轮 廓计算出来,接着标记出指纹图像区域;
步骤(1-7):按照提取好的指纹图像区域将其从原图像切割。
作为上述技术方案的改进,所述步骤(2)的具体步骤如下:
步骤(2-1):将指纹图像分为不重叠的若干个指纹块;
步骤(2-2):估计每一个指纹块的方向信息和纹线的频率;
步骤(2-3):用Gabor滤波器对这些指纹块进行增强;
步骤(2-4):将增强后的指纹块还原整张指纹图片。
作为上述技术方案的改进,所述步骤(3)的具体操作是设置一个阈值, 超过阈值的像素点变为1,未超过的像素点变为0;指纹图像中的纹线之间 的间隙基本相同,本文利用指纹图像的这个特性,根据指纹图像每一部分 的特点来调整阈值,可以取得更好的二值效果。
作为上述技术方案的改进,所述步骤(4)的具体操作是采用查表法来 对指纹图像进行细化处理。
作为上述技术方案的改进,所述步骤(5)中,设置了两个卷积层,一 个初级胶囊层,一个数字胶囊层和一个三级的全连接层。
作为上述技术方案的改进,所述步骤(6),又分为以下几个小的步骤 来完成:
步骤(6-1):在卷积层1中,图片输入的大小为200×200,本文采用 的卷积核大小为9×9,卷积的步长为1,选用的激活函数为ReLu函数,填 充大小为[0,0,0,0],卷积核的个数为256个;
步骤(6-2):卷积层2中,图片输入大小为192×192(这是卷积层1输 出的图片大小。每个卷积层的输入输出大小由下面的公式(1)和(2)可以推 出),采用的卷积核大小仍然是9×9,步长变为2,选用的激活函数为ReLu 函数,填充大小为[0,0,0,0],卷积核的个数为256个;
步骤(6-3):在初级胶囊层中,输入大小为92×92,输出大小可以由 上面公式(1)和公式(2)推出,将步长设为2。填充大小为[0,0,0,0],采用 非线性挤压函数作为激活函数,其数学表达式如公式(3)所示:
其中,vj为非线性挤压函数的输出向量,sj为输入向量,为缩放的 尺度,为单位化向量,该非线性挤压函数有非常好的性质,的分 母比分子大1,当sj模长很长的时候,输出结果vj的模长就越接 近1,当sj模长很小的时候,输出结果vj≈||sj||sj,vj模长就越接近0,同时 非线性挤压函数过后方向并未改变,不同于前面两层,最后将这一层的通 道数设置为32,每个通道中包含8个卷积核,这样就可以保证卷积核的总 数不会发生变化,提取的特征总数不会发生变化;
步骤(6-4):在数字胶囊层中,该层的输入大小为42×42,由于要对 10类指纹进行识别,该层的胶囊个数设为10个,而初级胶囊层会输出56448 个初级胶囊,每个胶囊的维度为8,由于我们期望输出的vj的维度为16, 在数字胶囊层中,需要的仿射变换矩阵的大小为8×16,需要的仿射变换矩 阵的个数为564480个,需要耦合系数cij564480个;
步骤(6-5):第一个全连接层的单元数设置为512,第二个全连接层的 单元数设置为1024,将第三个全连接层的单元数设置为40000,这三个全 连接层分别使用激活函数ReLu,ReLu和Sigmoid,整个胶囊神经网络的结 构,如图1所示。
作为上述技术方案的改进,所述步骤(7),又分为以下几个小的步骤 来完成:
步骤(7-1):本文选择的是Adam优化器进行优化,将整体损失最小作 为优化的目标。本文采用指数衰减的方式使得学习率能够动态调整。其中 学习率的表达式为:
new_lr=lr×rategs/ds (2)
公式(2)中,new_lr表示更新后的学习率,lr表示原来的学习率,rate 为衰减率,gs为当前训练的轮次,ds为衰减周期,本文将初始学习率lr设 置为0.01,衰减率rate设置为0.96,衰减周期设置为282,这样每次训练282 轮次后,学习率变为原来学习率的96%;
步骤(7-2):将训练轮次设置为900轮;
步骤(7-3):选取的批尺寸为32。
本发明的实施效果如下:本发明的基于胶囊神经网络的指纹识别技术, 可以对指纹图像进行分类和识别。
附图说明
图1是本发明设置的胶囊神经网络的结构图;
图2是本发明对指纹图像区域进行寻找和提取的效果示意图;
图3是本发明对指纹图像增强的效果示意图;
图4是本发明对指纹图像二值化的效果示意图;
图5是本发明对指纹图像细化的效果示意图;
图6是本发明训练集和验证集的损失值与训练轮次的关系图;
图7是本发明训练集和验证集的准确率与训练轮次的关系图。
具体实施方式
下面将结合具体的实施例来说明本发明的内容。
所述基于胶囊神经网络的指纹识别技术,包括:(1)指纹图像区域的 自动寻找和提取;(2)指纹图像的增强;(3)指纹图像的二值化;(4)指 纹图像的细化;(5)确定胶囊网络模型的结构;(6)确定胶囊神经网络中 每一层结构参数;(7)确定胶囊神经网络中的学习率、批尺寸和训练轮次; (8)用所选择的指纹图像训练集对胶囊网络进行训练;(9)使用胶囊神经 网络对指纹图像测试集进行分类测试和识别,得到分类精度。
其中,所述步骤(1)的具体步骤如下:
步骤(1-1):将指纹图片灰度化处理;
步骤(1-2):利用高斯滤波算子进行高斯平滑处理来消除原来指纹图像 的高斯噪声;
步骤(1-3):通过Sobel算子提取具有高水平梯度和低垂直梯度的指纹 图像区域;
步骤(1-4):将Sobel算子提取好的指纹图片进行二值化操作;
步骤(1-5):使用形态学中的闭操作处理,将二值指纹图像中的细小间 隔消除,分割出独立的指纹图像区域;
步骤(1-6):使用OpenCv库中的findContours()函数将指纹图片的轮 廓计算出来,接着标记出指纹图像区域;
步骤(1-7):按照提取好的指纹图像区域将其从原图像切割。
所述步骤(2)的具体步骤如下:
步骤(2-1):将指纹图像分为不重叠的若干个指纹块;
步骤(2-2):估计每一个指纹块的方向信息和纹线的频率;
步骤(2-3):用Gabor滤波器对这些指纹块进行增强;
步骤(2-4):将增强后的指纹块还原整张指纹图片。
具体地,所述步骤(3)的具体操作是设置一个阈值,超过阈值的像素 点变为1,未超过的像素点变为0;指纹图像中的纹线之间的间隙基本相同, 本文利用指纹图像的这个特性,根据指纹图像每一部分的特点来调整阈值, 可以取得更好的二值效果。
具体地,所述步骤(4)的具体操作是采用查表法来对指纹图像进行细 化处理;所述步骤(5)中,本文设置了两个卷积层,一个初级胶囊层,一 个数字胶囊层和一个三级的全连接层。
具体地,所述步骤(6),又分为以下几个小的步骤来完成:
步骤(6-1):在卷积层1中,图片输入的大小为200×200,本文采用 的卷积核大小为9×9,卷积的步长为1,选用的激活函数为ReLu函数,填 充大小为[0,0,0,0],卷积核的个数为256个;
步骤(6-2):卷积层2中,图片输入大小为192×192(这是卷积层1输 出的图片大小。每个卷积层的输入输出大小由下面的公式(1)和(2)可以推 出),采用的卷积核大小仍然是9×9,步长变为2,选用的激活函数为ReLu 函数,填充大小为[0,0,0,0],卷积核的个数为256个;
步骤(6-3):在初级胶囊层中,输入大小为92×92,输入大小可以由 上面公式(1)和公式(2)推出,将步长设为2。填充大小为[0,0,0,0],采用 非线性挤压函数作为激活函数,其数学表达式如公式(3)所示:
其中,vj为非线性挤压函数的输出向量,sj为输入向量,为缩放的 尺度,为单位化向量,该非线性挤压函数有非常好的性质,的分 母比分子大1,当sj模长很长的时候,输出结果vj的模长就越接 近1,当sj模长很小的时候,输出结果vj≈||sj||sj,vj模长就越接近0,同时 非线性挤压函数过后方向并未改变,不同于前面两层,最后将这一层的通 道数设置为32,每个通道中包含8个卷积核,这样就可以保证卷积核的总 数不会发生变化,提取的特征总数不会发生变化;
步骤(6-4):在数字胶囊层中,该层的输入大小为42×42,由于要对 十类指纹进行识别,该层的胶囊个数设为10个,而初级胶囊层会输出56448 个初级胶囊,每个胶囊的维度为8,由于我们期望输出的vj的维度为16, 在数字胶囊层中,需要的仿射变换矩阵的大小为8×16,需要的仿射变换矩 阵的个数为564480个,需要耦合系数cij564480个;
步骤(6-5):第一个全连接层的单元数设置为512,第二个全连接层的 单元数设置为1024,将第三个全连接层的单元数设置为40000,这三个全 连接层分别使用激活函数ReLu,ReLu和Sigmoid,整个胶囊神经网络的结 构,如图1所示。
具体地,所述步骤(7),又分为以下几个小的步骤来完成:
步骤(7-1):本文选择的是Adam优化器进行优化,将整体损失最小作 为优化的目标。本文采用指数衰减的方式使得学习率能够动态调整。其中 学习率的表达式为:
new_lr=lr×rategs/ds (2)
公式(2)中,new_lr表示更新后的学习率,lr表示原来的学习率,rate 为衰减率,gs为当前训练的轮次,ds为衰减周期,本文将初始学习率lr设 置为0.01,衰减率rate设置为0.96,衰减周期设置为282,这样每次训练282 轮次后,学习率变为原来学习率的96%;
步骤(7-2):文将训练轮次设置为900轮;
步骤(7-3):本文选取的批尺寸为32。
为了实现基于胶囊神经网络的指纹识别技术,实例的步骤如下:
(1)建立指纹图片数据库
指纹图片是由中控LIVE20R指纹采集仪器对实验者进行指纹采集得到 的,我们找到了10名志愿者参与采样,每名志愿者采集右手的食指指纹, 采样50次,共采样500张指纹图片,每张指纹图片的大小为288×375,格 式为png格式;为了减少指纹图片识别中过拟合的现象,我们要对指纹图 片的数量进行扩充;本文将预处理处理好的指纹图片进行随机旋转来扩充 数据库。原来500张指纹图片经过随机旋转扩充到了9000张指纹图片。
(2)对指纹图片库中的所有指纹图片进行批量预处理
下面分别给出了指纹图像预处理中指纹图像区域的寻找和提取、指纹 图像的增强、指纹图像的二值化、指纹图像的细化的处理结果图。
如图2所示,是本发明指纹图像区域进行寻找和提取的效果示意图; 如图3所示,是本发明指纹图像增强的效果示意图;如图4所示,是本发 明指纹图像二值化的效果示意图;如图5所示,是本发明指纹图像细化的 效果示意图;
(3)基于胶囊神经网络的指纹识别技术的训练和预测实验结果分析, 下面给出神经网络的训练结果图。
如图6所示,是本发明训练集和验证集的损失值与训练轮次的关系图; 如图7所示,是本发明训练集和验证集的准确率与训练轮次的关系图;
从图6可以看出,训练集和验证集的损失值变化趋势相同,说明本文 所用的指纹图片库可以用胶囊神经网络进行学习,胶囊神经网络在前200 轮的训练中,损失值下降的非常快,说明网络在前200轮的训练中,训练 效果非常好,200轮以后,损失值缓慢下降,800轮以后,损失值一直在 0.1~0.2附近,说明在800轮以后模型训练遇到了瓶颈。可以从图7中观察 到前300轮的训练中,训练集和验证集的准确率上升十分明显,但是在300 轮以后验证集的准确率基本在70%到80%这个区间来回波动,然而训练集 准确率继续上升,直到训练到800轮次后,准确率在100%附近。结合损失 值得变化情况,说明800轮次以后可能已经过拟合,需要扩充数据库中指 纹图片的数目,以达到更好的效果。那么在现有图片库的基础上,我们的 最终精度是96%,效果已经非常好了,如果扩大训练样本集,还可以得到更好的精度,也就是得到更好的识别效果。
以上内容是结合具体的实施例对本发明所作的详细说明,不能认定本 发明具体实施仅限于这些说明。对于本发明所属技术领域的技术人员来说, 在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当 视为属于本发明保护的范围。
Claims (5)
1.一种基于胶囊神经网络的指纹识别技术,其特征在于:步骤如下:
(1)指纹图像区域的自动寻找和提取;
(2)指纹图像的增强;
(3)指纹图像的二值化;
(4)指纹图像的细化;
(5)确定胶囊网络模型的结构;
(6)确定胶囊神经网络中每一层结构的参数;
(7)确定胶囊神经网络中的学习率、批尺寸和训练轮次;
(8)胶囊网络训练指纹图像;
(9)使用胶囊神经网络对指纹图像进行识别和分类,得到分类精度。
2.根据权利要求1所述的基于胶囊神经网络的指纹识别技术,其特征在于:步骤(1)的具体步骤如下:指纹图像区域的自动寻找和提取,指纹图片的增强,指纹图片的二值化,指纹图片的细化。
3.根据权利要求2所述的基于胶囊神经网络的指纹识别技术,其特征在于:步骤(2)的具体步骤如下:设置两个卷积层,一个初级胶囊层,一个数字胶囊层和一个三级的全连接层。
4.根据权利要求3所述的基于胶囊神经网络的指纹识别技术,其特征在于:步骤(3)的具体步骤如下:在卷积层1中,图片输入的大小为200×200,采用的卷积核大小为9×9,卷积的步长为1,选用的激活函数为ReLu函数,填充大小为[0,0,0,0],卷积核的个数为256个;卷积层2中,图片输入大小为192×192,采用的卷积核大小仍是9×9,步长变为2,选用的激活函数为ReLu函数,填充大小为[0,0,0,0],卷积核的个数为256个;在初级胶囊层中,输入大小为92×92,将步长设为2,填充大小为[0,0,0,0],采用非线性挤压函数作为激活函数,不同于前面两层,最后将这一层的通道数设置为32,每个通道中包含8个卷积核,这样可保证卷积核的总数不会发生变化,提取特征总数不会发生变化,在数字胶囊层中,该层的输入大小为42×42;由于要对十类指纹进行识别,该层的胶囊个数设为10个,而初级胶囊层会输出56448个初级胶囊,每个胶囊的维度为8,由于我们期望输出的vj的维度为16,在数字胶囊层中,需要的仿射变化矩阵的大小为8×16,需要的仿射变化矩阵的个数为564480个,需要耦合系数cij564480个;第一个全连接层的单元数设置为512,第二个全连接层的单元数设置为1024,将第三个全连接层的单元数设置为40000,这三个全连接层分别使用激活函数ReLu,ReLu和Sigmoid。
5.根据权利要求4所述的基于胶囊神经网络的指纹识别技术,其特征在于:步骤(4)的具体步骤如下:选择Adam优化器进行优化,将整体损失最小作为优化的目标,采用指数衰减的方式使得学习率能够动态调整,将训练轮次设置为900轮,选取的批尺寸为32。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910723251.5A CN110490107A (zh) | 2019-08-06 | 2019-08-06 | 一种基于胶囊神经网络的指纹识别技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910723251.5A CN110490107A (zh) | 2019-08-06 | 2019-08-06 | 一种基于胶囊神经网络的指纹识别技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110490107A true CN110490107A (zh) | 2019-11-22 |
Family
ID=68550112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910723251.5A Pending CN110490107A (zh) | 2019-08-06 | 2019-08-06 | 一种基于胶囊神经网络的指纹识别技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110490107A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428556A (zh) * | 2020-02-17 | 2020-07-17 | 浙江树人学院(浙江树人大学) | 一种基于胶囊神经网络的交通标志识别方法 |
CN112446357A (zh) * | 2020-12-15 | 2021-03-05 | 电子科技大学 | 一种基于胶囊网络的sar自动目标识别方法 |
CN112906813A (zh) * | 2021-03-09 | 2021-06-04 | 中南大学 | 一种基于密度聚类和胶囊神经网络的浮选工况识别方法 |
CN113870241A (zh) * | 2021-10-12 | 2021-12-31 | 北京信息科技大学 | 一种基于胶囊神经网络的药片缺陷识别方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1741043A (zh) * | 2005-08-15 | 2006-03-01 | 西安交通大学 | 基于二维条码的指纹信息隐藏及认证方法 |
CN102254163A (zh) * | 2011-08-03 | 2011-11-23 | 山东志华信息科技股份有限公司 | 自适应模板大小的Gabor指纹图像增强方法 |
CN108520225A (zh) * | 2018-03-30 | 2018-09-11 | 南京信息工程大学 | 一种基于空间变换卷积神经网络的指纹检测分类方法 |
-
2019
- 2019-08-06 CN CN201910723251.5A patent/CN110490107A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1741043A (zh) * | 2005-08-15 | 2006-03-01 | 西安交通大学 | 基于二维条码的指纹信息隐藏及认证方法 |
CN102254163A (zh) * | 2011-08-03 | 2011-11-23 | 山东志华信息科技股份有限公司 | 自适应模板大小的Gabor指纹图像增强方法 |
CN108520225A (zh) * | 2018-03-30 | 2018-09-11 | 南京信息工程大学 | 一种基于空间变换卷积神经网络的指纹检测分类方法 |
Non-Patent Citations (2)
Title |
---|
SARA SABOUR等: ""Dynamic Routing Between Capsules"", 《ARXIV》 * |
郝子煜等: ""基于 CapsNet 的中国手指语识别"", 《计算机应用研究》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111428556A (zh) * | 2020-02-17 | 2020-07-17 | 浙江树人学院(浙江树人大学) | 一种基于胶囊神经网络的交通标志识别方法 |
CN111428556B (zh) * | 2020-02-17 | 2024-01-19 | 浙江树人学院(浙江树人大学) | 一种基于胶囊神经网络的交通标志识别方法 |
CN112446357A (zh) * | 2020-12-15 | 2021-03-05 | 电子科技大学 | 一种基于胶囊网络的sar自动目标识别方法 |
CN112446357B (zh) * | 2020-12-15 | 2022-05-03 | 电子科技大学 | 一种基于胶囊网络的sar自动目标识别方法 |
CN112906813A (zh) * | 2021-03-09 | 2021-06-04 | 中南大学 | 一种基于密度聚类和胶囊神经网络的浮选工况识别方法 |
CN113870241A (zh) * | 2021-10-12 | 2021-12-31 | 北京信息科技大学 | 一种基于胶囊神经网络的药片缺陷识别方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490107A (zh) | 一种基于胶囊神经网络的指纹识别技术 | |
CN108664996A (zh) | 一种基于深度学习的古文字识别方法及系统 | |
CN104361313B (zh) | 一种基于多核学习异构特征融合的手势识别方法 | |
CN108805833B (zh) | 基于条件对抗网络的字帖二值化背景噪声杂点去除方法 | |
CN107862322B (zh) | 结合图片和文本进行图片属性分类的方法、装置及系统 | |
CN105138968A (zh) | 人脸认证方法和装置 | |
CN107491729B (zh) | 基于余弦相似度激活的卷积神经网络的手写数字识别方法 | |
CN104156690B (zh) | 一种基于图像空间金字塔特征包的手势识别方法 | |
CN105117707A (zh) | 一种基于区域图像的人脸表情识别方法 | |
CN109034012A (zh) | 基于动态图像和视频子序列的第一人称视角手势识别方法 | |
CN112069900A (zh) | 基于卷积神经网络的票据文字识别方法及系统 | |
CN110110724A (zh) | 基于指数型挤压函数驱动胶囊神经网络的文本验证码识别方法 | |
CN105354532A (zh) | 一种基于手部运动帧数据的手势识别方法 | |
CN112836651A (zh) | 基于动态融合机制的手势图像特征提取方法 | |
CN104978569A (zh) | 一种基于稀疏表示的增量人脸识别方法 | |
Gawade et al. | Early-stage apple leaf disease prediction using deep learning | |
CN114428860A (zh) | 院前急救病例文本的识别方法、装置、终端及存储介质 | |
CN103942572A (zh) | 一种基于双向压缩数据空间维度缩减的面部表情特征提取方法和装置 | |
CN108764083A (zh) | 基于自然语言表达的目标检测方法、电子设备、存储介质 | |
CN109145723A (zh) | 一种印章识别方法、系统、终端装置及存储介质 | |
CN108710836A (zh) | 一种基于级联特征提取的唇部检测及读取方法 | |
Joshi et al. | Combination of multiple image features along with KNN classifier for classification of Marathi Barakhadi | |
CN115083011A (zh) | 基于深度学习的手语理解视觉手势识别方法、系统、计算机装置及存储介质 | |
Wang et al. | Design and implementation of handwritten digit recognition based on K-nearest neighbor algorithm | |
CN111046934B (zh) | 一种swift报文软条款识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |