CN109753575B

CN109753575B - 一种基于统计编码的掌静脉图像快速检索方法

Info

Publication number: CN109753575B
Application number: CN201811034397.0A
Authority: CN
Inventors: 余孟春; 谢清禄; 姚克猛
Original assignee: Guangzhou Melux Information Technology Co ltd
Current assignee: Guangzhou Melux Information Technology Co ltd
Priority date: 2018-08-27
Filing date: 2018-08-27
Publication date: 2023-04-18
Anticipated expiration: 2038-08-27
Also published as: CN109753575A

Abstract

本发明公开了一种基于统计编码的掌静脉图像快速检索方法，通过对掌静脉图像进行静脉交叉点区域进行截取，获得小部件图像，再利用卷积神经网络对小部件图像进行特征向量提取；对获得的特征向量进行编码，并对掌静脉图像数据库中的所有编码建立倒排索引；根据待检索掌静脉图像转换成的一串编码从倒排索引中获得候选掌静脉图像集合。

Description

一种基于统计编码的掌静脉图像快速检索方法

技术领域

本发明涉及静脉特征识别技术领域，尤其涉及一种基于统计编码的掌静脉图像快速检索方法。

背景技术

掌静脉识别作为一种新兴的生物特征识别技术，它具有安全卫生、较强的隐蔽性、无法伪造等特点。近年来，掌静脉识别的产品快速增长，使得掌静脉数据增长至海量的规模，在这样一个海量的掌静脉数据库中，如何快速检索到特定的部分掌静脉图像已成为掌静脉识别技术的亟待解决的问题。

传统的图像检索方法包括基于树结构的方法、基于哈希的方法和基于视觉单词的倒排索引方法等。基于树结构的方法，通常的实现是对待处理数据集在树这种数据结构进行空间的划分，因为检索的时候需要在树上进行子结点的递归回溯，当数据规模较大、空间维度较高时，会出现维度灾难的问题导致检索十分低效。基于哈希的方法，通常的实现是对待处理数据集进行散列化，把数据划分到多个散列表中，通过对待查询数据检索到哈希桶中若干个散列表，从而避免暴力检索全数据集以达到加速的效果，在小规模的数据上有卓越的表现。然而，当面对大规模、高维度的数据时，由哈希带来的精度损失及散列表占用存储空间过大等问题，导致其无法满足大部分工业应用的需求。

上述方法一般适用于普通的图像检索，会有较好的效果，但掌静脉图像由于其特殊的网状结构，在使用传统的图像检索方法进行快速检索，效果并不理想。

发明内容

针对上述的技术背景，为解决上述问题，本发明提出了一种基于统计编码的掌静脉图像快速检索方法，通过对掌静脉图像进行静脉交叉点区域进行截取，获得小部件图像，再利用卷积神经网络对小部件图像进行特征向量提取；对获得的特征向量进行编码，并对掌静脉图像数据库中的所有编码建立倒排索引；根据待检索掌静脉图像转换成的一串编码从倒排索引中获得候选掌静脉图像集合。

在掌静脉图像检索中，特征向量匹配是掌静脉图像检索的一个关键环节。检索过程具有特征依赖的特点，对于不同的特征应采用不同的度量方法。在检索的过程中，根据系统相似性度量的算法计算查询特征与特征库中对应的每组特征的相似程度，把所得结果通过得分排序后得到一个匹配图像序列返回给用户。然后，通过对检索的结果逐步求精，不断缩小匹配集合的范围，从而定位到目标。匹配过程常利用特征向量之间的距离函数来进行度量相似性。

压缩编码算法则可以大大提图像检索的效率。基于压缩编码算法的图像检索方法将图片的高维信息特征映射到其他空间中，生成一个低维的编码序列来表示一幅图片，降低了图像检索系统对计算机内存空间的要求，提高了检索速度，能更好的适应海量图片检索的要求。

本发明的技术方案对掌静脉图像进行静脉交叉点区域进行截取，获得小部件图像，由于小部件图像的相似性和特征向量之间的欧氏距离成正比关系。因此，对特征向量的编码压缩只需要考虑向量间的欧式距离。向量值的2-范数不仅保留原有向量的特征，同时还可以确定特征向量和编码的对应关系。

为实现本发明的技术目的，所采用的技术方案如下：

一种基于统计编码的掌静脉图像快速检索方法，包括如下的实施步骤：

步骤S1、对掌静脉图像按一定的像素大小进行掌静脉交叉点区域截取，所截取的掌静脉交叉点区域图像统称为小部件图像。

步骤S2、利用卷积神经网络对小部件图像进行特征向量提取。

优选的，所述的卷积神经网络由3个卷积层、1个MaxPooling层、1个Dropout层、1个Flatten层和1个全连接层构成，其中第1个卷积层有32个卷积核，卷积参数为kernel_size＝(3，3)，strides＝(1，1)，padding＝“SAME”；第2个卷积层有64个卷积核，卷积参数为kernel_size＝(5，5)，strides＝(2，2)；第3个卷积层有80个卷积核，卷积参数为kernel_size＝(3，3)，strides＝(1，1)；MaxPooling层的pooling参数为pool_size＝(3，3)，strides＝(1，1)，padding＝“SAME”；Dropout层的参数为0.25；Flatten层用于扁平参数，用在Dropout层与最后的全链接层之间；最后的全连接层，包含有64个神经元；激活函数均为ReLU函数。

步骤S3、对获得的特征向量进行编码，具体包括：

(1)对每一个具有一定维度的特征向量，利用特征向量的前16维特征计算2-范数

(2)以步长为4维的方式，再取5至20维的特征计算2-范数

以此类推；

(3)再根据所有相同位置的2-范数

进行排序，用其4分位值进行最为基准的划分、编码；

(4)最后，每一个特征向量则对应一个12位的由“1”、“2”、“3”、“4”四个数字组成的特征向量编码。

步骤S4、对掌静脉图像数据库中的所有编码建立倒排索引，根据掌静脉图像与多个编码之间的对应关系，利用全文检索引擎对掌静脉图像标示以及相应多个编码训练出倒排索引，以供后续的快速检索。

步骤S5、根据待检索掌静脉图像转换成的一串编码从倒排索引中获得候选掌静脉图像集合。

附图说明

图1是本发明技术方案实施步骤流程图；

图2是本发明掌静脉图像示意图；

图3是本发明对掌静脉图像截取的小部件图像示意图；

图4是本发明掌静脉图像及其相应编码示意图；

图5是本发明卷积神经网络结构图；

图6是本发明计算2-范数示意图；

图7是本发明利用四分位值编码示意图；

图8是本发明编码倒排索引示意图。

具体实施方式

为了使本发明的目的、技术方案更加清楚明白，以下结合附图及实施例对本发明的技术方案进行详细阐述。

本发明公开了一种基于统计编码的掌静脉图像快速检索方法，参照图1所示，以掌静脉图像的快速检索为例，具体实施步骤如下：

步骤S1、对掌静脉图像按一定的像素大小进行掌静脉交叉点区域截取，所截取的掌静脉交叉点区域图像统称为小部件图像。参考图2所示，为本发明掌静脉图像示意图，图3所示为对掌静脉图像进行交叉点区域截取所得的小部件图像。

为了更加清晰的说明本发明技术方案的实施流程，在本实施例中，我们设已经有M张320*320像素的掌静脉灰度图像。设置命名规则如下：palm_0001.jpg，palm_0002.jpg，…，palm_M.jpg。对掌静脉交叉点区域图像预处理具体如下：

首先，扫描每一张掌静脉图像，定位掌静脉图像中的每一个静脉交叉点；

然后，以掌静脉交叉点为中心，从64*64像素大小的区域在掌静脉图像中截取掌静脉交叉点，并将掌静脉交叉点另存为64*64像素图像；再根据掌静脉图像名称、截图坐标和扫描顺序命名掌静脉交叉点图像，以下统称为小部件图像。

如命名为：palm_0001_010025_074089_1.jpg。

因此，可以从M张320*320像素的掌静脉图像中，截取出N张64*64像素的静脉交叉点图像。

优选的，参照图5所示，所述的卷积神经网络由3个卷积层、1个MaxPooling层、1个Dropout层、1个Flatten层和1个全连接层构成，其中第1个卷积层有32个卷积核，卷积参数为kernel_size＝(3，3)，strides＝(1，1)，padding＝“SAME”；第2个卷积层有64个卷积核，卷积参数为kernel_size＝(5，5)，strides＝(2，2)；第3个卷积层有80个卷积核，卷积参数为kernel_size＝(3，3)，strides＝(1，1)；MaxPooling层的pooling参数为pool_size＝(3，3)，strides＝(1，1)，padding＝“SAME”；Dropout层的参数为0.25；Flatten层用于扁平参数，用在Dropout层与最后的全链接层之间；最后的全连接层，包含有64个神经元；激活函数均为ReLU函数。

将一个64*64像素单通道的小部件图像作为输入，通过上述卷积神经网络，最终输出一个64维的特征向量。若从N个64*64像素的小部件图像中分别提取出一个64维特征向量，则相应得到N个64维特征向量。

步骤S3、对获得的特征向量进行编码，具体包括：

(2)以步长为4维的方式，再取5至20维的特征计算2-范数

以此类推；

(3)再根据所有相同位置的2-范数

进行排序，用其4分位值进行最为基准的划分、编码；

设共有N个掌静脉的特征向量为：

…

具体的，对于第一个64维的特征向量

利用特征向量中的连续16维特征计算2-范数

它表示为第1个小部件特征向量的第i个16维向量的2-范数。

在第一个特征向量中，前16维向量的2-范数为：

再以固定16维的长度，步长为4维的方式移动计算，再取第5维至第20维的特征计算2-范数

以此类推，可以从一个64维特征向量中计算出12个2-范数

因此，第一个64维特征向量可以计算出如下12个2-范数：

…

因此，从N个64维特征向量，可以计算出N*12个2-范数

其中，j＝1，2，…，N；X＝1，2，…，12。

进一步的，根据所有相同位置的2-范数

进行排序并记录排序位置，再根据4分位值进行划分、编码，参照图7所示。设对第一组16维特征的N个2-范数

进行排序，然后用这N个2-范数的4分位值进行最为基准的划分、编码。若

的位置小于等于第一四分位数，则赋予码字1；若

的位置大于第一四分位数，且小于等于第二四分位数，则赋予码字2；若

的位置大于第二四分位数，同时小于等于第三四分位数，则赋予码字3；若

位置大于第三四分位数，则赋予码字4。最终，每一个小部件特征向量对应于一个12位的由“1”、“2”、“3”、“4”四个数字组成的数字。如，142213313124为某一个特征向量的编码。

通过上述的步骤，可以把一张掌静脉图像转化为由多个编码组成的字符编码，因此可以将字符编码类比作文本检索中的关键字进行快速检索。

步骤S4、对掌静脉图像数据库中的所有编码建立倒排索引，根据掌静脉图像与多个编码之间的对应关系，利用全文检索引擎对掌静脉图像标示以及相应多个编码训练出倒排索引，以供后续的快速检索，参照附图8所示。

具体的，所述的根据掌静脉图像与多个编码之间的对应关系，是将图像名称和N个编码进行以一对多的关系绑定，即一个掌静脉图像与从该掌静脉图像抽取出来的小部件图像编码进行绑定，再将所有编码以及对应的掌静脉图像序号存入全文检索引擎系统中。

为了更具体的说明步骤S5，设从1张待检索的掌静脉图像按顺序截取出10个小部件图像，然后通过提取特征、转换编码后，这10个小部件图像各自编码分别为：111111111111、111111111112、111111111113、111111111114、111111111121、111111111122、111111111123、111111111124、111111111131、111111111132。最后，利用这些检索编码在搜索引擎中进行全文检索，得到候选掌静脉图像集合。

优选的，为了使检索出来的掌静脉图像与输入的待检索图像保持有最好的相似度，设定检索出来掌静脉图像中的小部件图像排序与待检索的掌静脉图像的小部件图像排序一致。因此，需要根据从掌静脉图像中截取小部件图像的顺序，设定查询逻辑。在利用转换出来的编码时，在全文检索引擎中的查询逻辑应为：

111111111111|111111111112|111111111113|111111111114|111111111121|111111111122|111111111123|111111111124|111111111131|111111111132。

最终得到掌静脉图像参考集为有序的检索结果。对于待检索图像，检索结果的相似度从高到低排序。

以上所述是对本发明的较佳实施进行具体说明，并不限于所述的实施例，熟悉本领域的技术人员在不违背本发明精神的前提下所作的等同变形或替换等，均应包含在本发明的保护范围之内。

Claims

1.一种基于统计编码的掌静脉图像快速检索方法，其特征在于：所述的方法包括以下步骤：

步骤S1、对掌静脉图像按一定的像素大小进行掌静脉交叉点区域截取，所截取的掌静脉交叉点区域图像统称为小部件图像；

步骤S2、利用卷积神经网络对小部件图像进行特征向量提取；

步骤S3、对获得的特征向量进行编码，具体包括：

(2)以步长为4维的方式，再取5至20维的特征计算2-范数

以此类推；

(3)再根据所有相同位置的2-范数

进行排序，用其4分位值进行最为基准的划分、编码；

(4)最后，每一个特征向量则对应一个12位的由“1”、“2”、“3”、“4”四个数字组成的特征向量编码；

步骤S4、对掌静脉图像数据库中的所有编码建立倒排索引，根据掌静脉图像与多个编码之间的对应关系，利用全文检索引擎对掌静脉图像标示以及相应多个编码训练出倒排索引，以供后续的快速检索；

2.根据权利要求1所述的一种基于统计编码的掌静脉图像快速检索方法，其特征在于：步骤S2中所述的卷积神经网络由3个卷积层、1个MaxPooling层、1个Dropout层、1个Flatten层和1个全连接层构成，其中第1个卷积层有32个卷积核，卷积参数为kernel_size＝(3，3)，strides＝(1，1)，padding＝“SAME”；第2个卷积层有64个卷积核，卷积参数为kernel_size＝(5，5)，strides＝(2，2)；第3个卷积层有80个卷积核，卷积参数为kernel_size＝(3，3)，strides＝(1，1)；MaxPooling层的pooling参数为pool_size＝(3，3)，strides＝(1，1)，padding＝“SAME”；Dropout层的参数为0.25；Flatten层用于扁平参数，用在Dropout层与最后的全链接层之间；最后的全连接层，包含有64个神经元；激活函数均为ReLU函数。