CN101477523A - 超大型指纹库的索引结构和检索方法 - Google Patents

超大型指纹库的索引结构和检索方法 Download PDF

Info

Publication number
CN101477523A
CN101477523A CNA200810180094XA CN200810180094A CN101477523A CN 101477523 A CN101477523 A CN 101477523A CN A200810180094X A CNA200810180094X A CN A200810180094XA CN 200810180094 A CN200810180094 A CN 200810180094A CN 101477523 A CN101477523 A CN 101477523A
Authority
CN
China
Prior art keywords
index
fingerprint
retrieval
triangle
depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200810180094XA
Other languages
English (en)
Other versions
CN101477523B (zh
Inventor
袁宝玺
苏菲
蔡安妮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN200810180094XA priority Critical patent/CN101477523B/zh
Publication of CN101477523A publication Critical patent/CN101477523A/zh
Application granted granted Critical
Publication of CN101477523B publication Critical patent/CN101477523B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明用于超大型指纹数据库的指纹检索,提出了超大型指纹库的索引结构和检索方法。本发明属于计算机识别领域,具体涉及到指纹识别、数据库、数据检索和图像处理等领域。本发明提出了一种超大型指纹库检索系统结构的构造方法、基于索引匹配错误概率的索引评价方法、基于分层深度索引的指纹检索方法以及基于一边多次匹配结构特征的检索评价方法来加速超大型指纹库的检索,具有实用价值和普遍的适用性。在离线建库阶段依据基于索引匹配错误概率的索引评价方法对库指纹构建哈希索引、分层深度索引、特征值索引三个功能互补的索引器;在在线检索阶段依据基于索引匹配错误概率的索引评价方法和基于一边多次匹配结构特征的检索评价方法构建检索器。

Description

超大型指纹库的索引结构和检索方法
技术领域
本发明属于计算机识别领域,具体涉及到指纹识别、数据库、数据检索和图像处理等领域。本发明用于超大型指纹数据库的指纹检索。
背景技术
指纹识别技术用于鉴别身份已有几百年的历史,近几十年来,随着科技的不断发展,自动指纹识别系统(Automated Fingerprint Identification System,简称AFIS)已在多个领域中得到了广泛的应用。但是,目前AFIS仍面临着不少难题,其中一个亟待解决的问题就是超大型指纹库的检索问题。
AFIS的工作模式一般分为两类:验证(verification)和辨识(identification)。验证就是通过把一个现场采集到的指纹与指纹库中某枚特定的指纹进行一对一的比对(one-to-onematching),来确认身份的过程。验证通常采用指纹细节点比对的方式实现。此时对整个处理过程的速度要求并不太高,目前市场上的AFIS在进行验证时,从图像采集到最后给出验证结果,基本都能在1秒以内完成,不会给用户造成长时间等待的感觉。
辨识要远比验证复杂,该方法是把现场采集到的指纹同指纹数据库中的所有指纹逐一对比,从中找出与现场指纹相匹配的指纹。即该方法是“一对多匹配(one-to-many matching)”。对用户来说,他(她)不会考虑库中指纹数量有多大,真正关心的仍然是进行指纹按压后,多长时间能出结果。举一个简单例子:如果库中有指纹500000枚,算法的处理速度按每秒100枚算,则需5000秒钟(1小时38分钟),则对一般用户来说,显然是难以接受的。据此速度,对公安、司法领域等动辄百万人乃至千万人以上库[注:库中每人一般会采集十枚手指的图像,因此指纹图像数量是人数的十倍],辨识时间将是天文数字。
指纹检索技术就是一种提高辨识速度的方法,该技术首先通过检索对指纹数据库进行粗筛选,减少需要比对的指纹数目,然后将剩下的指纹进行细节点比对(简称细比对),从而提高指纹辨识的速度。
图1所示为指纹检索技术示意图。
发明内容
本发明提出了用于超大型指纹数据库检索系统结构的构造方法、基于索引匹配错误概率的索引评价方法、基于分层深度索引的指纹检索方法以及基于一边多次匹配结构特征的检索评价方法。
本发明提出了一种用于超大型指纹库检索系统结构的构造方法。在离线建库阶段,该系统采用基于索引匹配错误概率的索引评价方法,构造了三个互补的索引器和索引数据库;在在线检索阶段,该系统采用基于索引匹配错误概率的索引评价方法根据现场指纹图像的质量自适应地选择检索方式,采用基于一边多次匹配结构特征的检索评价方法对检索结果进行打分评价,判决指纹是否应该被筛除。
本发明提出了基于索引匹配错误概率的索引评价方法。根据此方法可以针对不同的现场指纹图像质量选择合适的索引方法和检索方法,以使系统达到最佳的性能和效率。
本发明提出了基于一边多次匹配结构特征的检索评价方法,该方法不以匹配三角形数目作为唯一的评分基础,而是通过三元组匹配信息获取多元组结构的匹配数目,使得评分结果更能体现指纹的相似性;同时,指纹特征参数组的存储量并没有增加,有效提高了指纹检索的性能和效率。
本发明提出了基于分层深度索引的指纹检索方法。在大型指纹库的应用中,由于大部分现场指纹属于指纹质量中等的情况,所述基于分层深度索引的指纹检索方法能够在保证检索速度没有大幅降低的同时,保证了相对于哈希检索法更好的检索精度。具有实用价值和普遍的适用性。
附图说明
图1指纹检索技术示意图
图2超大型指纹库检索系统的结构
图3索引器工作流程
图4检索器工作流程
图5细节点三角形参数图示
图6端点和分叉点可能出现的退化情况:(a)为端点,(a1)到(a3)为各种可能的退化情况;(b)为分叉点,(b1)到(b3)为各种可能的退化情况
图7指纹图像无法判断细节点类型图示:加方框处为无法准确判定其属于分叉点还是端点的情况
图8前期累计误差对量化结果的影响
图9前期累计误差引起的匹配错误
图10量化区间边界附近的值的匹配错误
图11分层深度索引的存储方式
图12三角形一边二次匹配图示,左图为现场指纹,右图为库指纹
具体实施方式
下面结合附图对本发明所述方法进行详细阐述。
1.超大型指纹库检索系统结构
图2所示为本发明提出的超大型指纹库检索系统的结构,包括指纹图像预处理、计算细节点三角形、索引器、索引数据库、检索器等模块。
1.1 索引器工作流程
索引器完成离线建库功能,图3所示为索引器的工作流程。
在离线阶段,对于每一枚库指纹,首先预处理得到细节点三角形,然后依据基于索引匹配错误概率的索引评价方法,构造三个互补的索引器及对应的索引数据库:三角形全部参数量化构造哈希(hash)索引;三角形部分特征量化构造分层深度索引;三角形全部参数都不量化构造特征值索引。
指纹库的每枚指纹都要构造对应的三个索引器,然后将索引值写入对应的索引数据库。这三个索引器构造方法参见图2和图3。索引器的构造需要遍历所有库指纹,由于库指纹的数量是非常庞大的,所以需要很长的时间,但整个过程是在离线阶段完成的,所以有效减少了在线阶段的计算量,这正是指纹索引方法能够非常高效的原因之一。
1.2 检索器工作流程
检索器完成在线检索功能,检索流程如图2和图4所示。
检索分为三个步骤:
1、用户输入一枚现场指纹,系统进行预处理得到细节点三角形,然后依据基于索引匹配错误概率的索引评价方法,根据指纹图像质量判断采用三种检索方法中的哪种方法;
2、在选定了检索方法之后,检索该方法对应的索引数据库,获取检索信息;
3、在得到检索信息之后,采用基于一边多次匹配结构特征的检索评价方法对库指纹打分,分数大于阈值的库指纹进入细比对环节,小于阈值的从比对队列筛除。
构造指纹检索系统的评价方法是整个系统性能和效率能否提高的核心环节之一。一个好的检索评价方法能够充分利用已得到的检索信息对指纹的相似程度进行准确的评价,从而能够有效提高整个系统的检索精度,增大索引系统的筛选率,进而减少进入细比对环节的指纹数量,提高整个超大型指纹库的比对速度(包括检索和细比对两个阶段)。
本发明提出的基于一边多次匹配结构特征的检索评价方法能够使评分结果更能体现指纹结构的相似性;同时,指纹特征参数组的存储量并没有增加,从而有效提高了系统的效率。
2 细节点三角形特征参数的提取和筛选
2.1 细节点三角形的特征组
如图5所示,p1、p2、p3为指纹图像的三个细节点,它们组成了一个细节点三角形。
Figure A200810180094D00061
表示顶点p1指向p2的矢量,
Figure A200810180094D00062
表示p2指向p3的矢量,α1、α2、α3表示组成的三角形的三个内角,φ1、φ2、φ3分别表示对应的细节点的方向。
我们从指纹图像中能够得到的细节点信息有:细节点坐标pi(xi,yi),细节点方向角φi,细节点类型γi,细节点详细信息Mi等,其中i=1,2,3。能够进行指纹检索的参数必须具有平移、旋转和缩放不变性,所以pi(xi,yi)和φi不能用于指纹检索。当采集指纹的仪器相同或者相近时,可以认为指纹不存在伸缩,故一般算法不考虑伸缩变形。所以,我们必须从pi(xi,yi)和φi这几个参数出发构造出具有平移、旋转不变的参数。
细节点三角形包含的信息有:三角形三条边的长度(l1,l2,l3),三顶点的方向角差(用△φ表示,△φk=φij,i,j,k=1,2,3,i<j),三角形内角(α1,α2,α3),三角形的左右手系(用H表示, H = sign ( z 21 &RightArrow; &times; z 32 &RightArrow; ) , sign(·)为符号函数),两细节点间纹线数目(用RC表示,指两个细节点连线穿过的指纹纹线数目)等。这些参数具有平移和旋转不变性。
具有平移和旋转不变性的细节点和三角形特征总共有:
{l1,l2,l3,Δφ1,Δφ2,Δφ3,α1,α2,α3,H,RC,γ1,γ2,γ3,M1,M2,M3}  (1)
(1)式称为细节点三角形特征参数组,简称特征参数组或特征组,特征组中的每个参数称为特征参数。基于细节点三角形的指纹检索方法就是利用特征组中的部分或全部参数构成数据库索引实现对整个系统的检索。
2.2 特征参数的筛选
公式(1)的特征组中有很多特征参数是不可靠的。
由于受到按压力度、手指表面情况和图像质量的影响,分叉点很容易退化成端点,而端点也很容易与周围脊线粘连而退化成一个分叉点,所以细节点类型γ和细节点详细信息M在很多情况下不能准确求得。特征RC很容易受到图像质量的影响。
图6为端点和分叉点可能出现的退化情况:(α)为端点,(α1)到(α3)为各种可能的退化情况;(b)为分叉点,(b1)到(b3)为各种可能的退化情况。
图7为真实指纹图像,加方框处为无法准确判定其属于分叉点还是端点的情况。
在剔除了可靠性差的特征之后,特征组变为:
{l1,l2,l3,Δφ1,Δφ2,Δφ3,α1,α2,α3,H}  (2)
3 指纹检索系统的索引评价方法
3.1 索引匹配错误概率分析
3.1.1 特征组量化产生的匹配错误概率
(2)式中除参数H是离散值外,其余都是连续值,为了使用这些参数构成索引(称为index或key),需要将这些参数量化成离散值。
将特征组的每个参数量化都会引起一定的匹配错误(错误的来源见3.1.4节),并且这些错误会产生累积影响。
假设我们选取公式(2)的特征组建立索引,对除了H以外的每个参数进行量化得到:
{k1,k2,k3,k4,k5,k6,k7,k8,k9,H}  (3)
于是索引值为:
key=k1k2k3k4k5k6k7k8k9H         (4)
(3)式中,如果其中任何一个参数量化引起匹配错误,都会导致(4)式的索引值匹配错误,也就是说,只有(4)式中的9个参数都不引起匹配错误时,索引值才能得到正确的结果。将上述特征组转化为索引值时产生的匹配错误称为特征组量化产生的匹配错误。
假设每个参数量化不引起匹配错误的概率为pi,i=1,2,…,9,且相互独立,则索引值不发生匹配错误的概率为:
p key = &Pi; i = 1 9 p i - - - ( 5 )
这种累积的错误是非常严重的,例如:如果pi=0.9,i=1,2,…,9,则pkey=0.387,发生错误的概率为1-pkey=0.613。就是说如果每个参数量化不发生错误的概率为0.9的话,索引值不发生错误的概率仅为0.387。
量化引起的索引值匹配错误的表现是:特征组并不匹配的两个三角形,它们的索引值相等;或者反之,特征组匹配的两个三角形,它们的索引值却不相等。
3.1.2 减少特征参数冗余以减少量化产生的匹配错误概率
为了减少量化引起的索引值匹配错误,我们对特征组公式(2)中的冗余信息进行进一步去除。事实上,如果两个三角形的三边长在一定误差范围内匹配,其三内角匹配的可能性是很大的。故我们将公式(2)中的三内角去掉,以减少特征之间的冗余。特征组变为:
{l1,l2,l3,Δφ1,Δφ2,Δφ3,H}        (6)
这样,索引值不发生匹配错误的概率变为:
p key = &Pi; i = 1 6 p i - - - ( 7 )
此时,如果pi=0.9,i=1,2,…,6,则pkey=0.53,发生匹配错误的概率为1-pkey=0.47。
3.1.3 量化间隔的选择
由于受到指纹图像质量的影响,指纹的细节点信息都是存在误差的,所以三角形特征匹配也必须允许一定的容差范围。
假设下面两式分别表示现场指纹和库指纹的三角形特征组:
{ l 1 L , l 2 L , l 3 L , &Delta;&phi; 1 L , &Delta;&phi; 2 L , &Delta;&phi; 3 L , H L }
{ l 1 D , l 2 D , l 3 D , &Delta;&phi; 1 D , &Delta;&phi; 2 D , &Delta;&phi; 3 D , H D }
如果
| l i L - l i D | &le; T l , | &Delta;&phi; i L - &Delta;&phi; i D | &le; T &phi; , i=1,2,3,HL=HD
则认为这两个三角形匹配。其中|·|为绝对值符号,Tl和Tφ为边长和角度的容差范围,上标L表示该特征属于现场指纹,上标D表示该特征属于库指纹。针对三角形特征的特性,本文选择Tl和Tφ作为边长和角度的量化间隔。
在真实的指纹采集过程中,指纹图像除了会有平移、旋转形变外,还可能由于按压力度的不同而存在切变形变。切变形变会对三角形的边长产生影响,边长越长,切变形变对边长的影响会越大,因此我们选取三角形时必须剔除掉边长过长的三角形;对于太小的边长,可能会受到图像误差的影响。因此我们选取边长大小在一定范围内的三角形构成特征。即:
lmin≤li≤lmax,i=1,2,3
由于切变形变对三角形边长的影响随着边长的变大而变大,故Tl应该是一个随着边长增大而增大的变量。所以我们构造了如下的边长量化区间:
定义1:取一列数{zj|j=0,1,…,m},描述如下:
1、zj-1=r×zj,其中0<r<1,常数
2、z0=lmin,zm=lmax
3、{zj|j=0,1,…,m}组成如下边长l的映射区间
[z0,z1),[z1,z2),…,[zm-2,zm-1),[zm-1,zm]
定义1中量化间隔(即量化区间的大小)为:
Tl=zj-zj-1=(1-r)zj
即量化区间的大小是和zj成正比的。
对边长进行量化时,如果(6)式中的边长l落入哪个区间,就以该区间的编号作为其量化后的值。
对于三角形的角度特征来说,由于切变形变对角度造成的影响不随角度的变大而变大,所以我们将角度的映射区间大小设定为固定值。
定义2:取一列数{θi|i=0,1,2,…,t},描述如下:
1、θi=θi-1+Δθ
2、{θi|i=0,1,2,…,t}组成角度的映射区间:
0,θ1),[θ1,θ2),…,[θt-1,θt]
其中θ0=θmin=0,θt=θmax=2π,Δθ=Tφ
和对边长进行量化一样,如果(6)式中的角度Δφ落入哪个区间,就以该区间的编号作为其量化后的值。
3.1.4 量化引起匹配错误的原因
量化引起的匹配错误来源于两种情况:(1)图像获取阶段、预处理阶段等前期累计误差对量化结果影响产生的匹配错误。(2)位于量化区间边界附近的值的匹配错误。
以角度参数量化为例说明量化引起匹配错误的两种情况:
第一种情况,如图8所示,Δφ本来位于[θ0,θ1]区间,但是由于前期累计误差的影响,计算得到的Δφ变成了Δφ′,从而被划分到了[θ1,θ2]区间。
前期累计误差会影响到匹配结果,如图9所示,ΔφL本来应该属于[θ0,θ1]区间,应该和
Figure A200810180094D00091
量化值相等,但是由于前期累计误差的影响使计算得到的ΔφL
Figure A200810180094D0009105752QIETU
,从而被划分到[θ1,θ2]区间,这样就和本来不在同一区间的
Figure A200810180094D00092
量化值相等,从而造成虚假匹配。
对于第二种情况,如图10所示,ΔφL和ΔφD分别为现场指纹和库指纹的特征参数,|ΔφL-ΔφD|≤Tφ,但是由于ΔφL和ΔφD位于量化区间边界θ2的两侧,它们将被量化到两个区间,因此量化后的数值会不相等,导致拒真错误。
3.2 基于索引匹配错误概率的索引评价方法
3.2.1 基于索引匹配错误概率的索引评价准则
本发明构造的基于索引匹配错误概率的索引评价准则描述如下:
1、索引匹配错误概率的定义:特征组转化为索引值时产生匹配错误的概率。
2、不漏真前提:量化引起的索引匹配错误必须在一定范围之内,必须不能使索引结果遗漏与现场指纹真正匹配的库指纹。如果检索系统遗漏了与现场指纹真正匹配的库指纹,那么整个系统最终将无法找到这枚与现场指纹真正匹配的库指纹。
3、容错原则:系统容许一定范围内的量化引起的索引匹配错误。指纹检索系统是对指纹库进行粗筛选的,可以容忍一定的匹配错误。在图像质量较好时,即使存在一定的匹配错误,与现场指纹真正匹配的库指纹的检索分数也会大于阈值,不会被筛除。
4、索引速度优先原则:在满足不漏真的前提下,指纹检索系统可以利用容错原则,在可以容错的范围内达到最快的检索速度。因为设计指纹检索系统的目的是加快指纹辨识的速度,所以如何有效利用容错原则,提高指纹检索系统的速度,是整个系统设计的关键。
3.2.2 特征值索引及特征值检索法的索引匹配错误概率分析
对于(6)式的特征组{l1,l2,l3,Δφ1,Δφ2,Δφ3,H},我们对所有参数都不进行量化而使用下式
| l i L - l i D | &le; T l , | &Delta;&phi; i L - &Delta;&phi; i D | &le; T &phi; , i=1,2,3,HL=HD
直接进行比对的方法称为特征值检索法。此时的计算误差仅为前期累计误差,并无量化匹配错误,但是特征值检索法的计算量很大。
3.2.3 哈希索引及哈希检索法的索引匹配错误概率分析
对于(6)式的特征组,我们对6个参数都进行量化得到索引值key:
key=k1k2k3k4k5k6H
索引值不发生错误的概率如(7)式所示,将(7)式重写如下:
p key = &Pi; i = 1 6 p i - - - ( 7 )
当在线检索时只需计算一下现场和库三角形的索引值是否相等,即只需判断
keyL=keyD
是否成立就可以判断两个三角形是否匹配。因为该方法的计算量仅为1次等于比较,这种方法在线检索所需时间最短,得到索引结果速度最快。但是,我们从(7)式可以看到,该方法发生匹配错误的概率也最大。
3.2.4 分层深度索引及分层深度检索法的索引匹配错误概率分析
基于分层深度索引的检索方法描述如下:
我们将(6)式的特征组分为两部分:
{l1,l2,l3,H}          (8)
{Δφ1,Δφ2,Δφ3}      (9)
将(8)式进行量化,作为第一层。得到:
keyfirst=k1k2k3H
量化不引起索引值匹配错误的概率变为:
p key = &Pi; i = 1 3 p i
此时,如果pi=0.9,i=1,2,3,则pkey=0.729,量化引起匹配错误的概率为1-pkey=0.271。
将(9)式作为第二层,不进行量化。
假设指纹有n个三角形,nk表示keyfirst的数目,nz表示keyfirst相同的每个组内三角形的数目。如图11所示,这n个三角形将被划分为nk个组,每个组中包含所有keyfrst值相同的nz个三角形。nz是个变化的量,每个组的nz大小可能不同。
这样,指纹检索过程将变为两步:
第一步:比较现场指纹三角形和库指纹三角形的keyfirst值是否相等:
key first L = key first D - - - ( 10 )
如果第一层索引值keyfirst相等则进入第二步,否则判定所比较的两个三角形不匹配。
第二步:在每个组内使用下式比较角度是否相等:
| &Delta;&phi; i L - &Delta;&phi; i D | &le; T &phi; , i = 1,2,3 - - - ( 11 )
即如果现场指纹三角形和库指纹三角形同时满足(10)和(11)式,则认为这两个三角形匹配,否则判定所比较的两个三角形不匹配。
3.2.5 依据索引匹配错误概率的索引评价方法选择检索方式
根据本发明提出的基于索引匹配错误概率的索引评价准则和前文对三种索引方式索引匹配错误概率的分析,本发明提出了基于索引匹配错误概率的索引评价方法:
第一步:依据图像预处理过程得到的信息将指纹图像质量划分为三个等级:好、中等、差;
第二步:图像质量好的指纹,对索引匹配错误的容错范围大,不易漏真,可以最大限度地利用容错范围得到尽量快的检索速度,选择用哈希检索法检索哈希索引数据库;
第三步:图像质量差的指纹,对索引匹配错误的容错范围小,易漏真,为了满足不漏真前提,只能使用速度最慢但精度最高的检索方式,选择用特征值检索法检索特征值索引数据库;
第四步:图像质量中等的指纹,对索引匹配错误的容错范围中等,为了有效利用这些容差范围,提高系统的检索速度,选择用分层深度检索法检索分层深度索引数据库。
在大型指纹库的应用中,大部分现场指纹属于图像质量中等的情况,分层深度检索法兼具了哈希检索法和特征值检索法的优点,同时在一定程度上克服了二者的缺点,具有最佳的实用价值。
4 指纹检索系统的检索评价方法
4.1 指纹检索系统的检索效率
由图2、图4可以看到,在对索引数据库检索得到检索结果之后需要利用检索评价方法对检索结果进行打分,然后将分数和设定的阈值进行比较判断,将分数大于阈值的那些库指纹送入细比对环节,其它库指纹则从比对序列中筛除。
设指纹库中有ND枚库指纹,th表示阈值,nre表示打分大于th的库指纹数目,Rfilter表示指纹检索系统的筛选率。
则筛选率定义为
R filter = 1 - n re N D - - - ( 12 )
从(12)式可以看到,在不遗漏真正匹配的库指纹的前提下,指纹检索系统的筛选率Rfilter越高,则需要进行细比对的指纹数目nre越少,从而完成整个辨识过程(检索和细比对)的速度越快。
提高筛选率的途径为增大阈值th,但是,前提是不能遗漏与现场指纹真正匹配的库指纹。设与现场指纹真正匹配的库指纹的检索分数为Scor,则检索系统必须满足
Scor≥th             (13)
如果系统的筛选率非常高,但是却不满足(13)式,即遗漏了与现场指纹真正匹配的库指纹,那么整个系统最终将无法找到这枚与现场指纹真正匹配的库指纹。
所以,指纹检索系统的评价方法必须足够精确,如果一个检索评分方法能够充分利用已得到的检索信息对指纹的相似程度进行准确的评价,那么Scor就会很大,(13)式得到满足的可能性就会很大,从而得到高筛选率的可能性也会越大,进而可能有效的提高检索系统的效率。因此,构造指纹检索系统的评价方法是整个系统性能和效率能否提高的核心环节之一。
4.2 特征组的精选
假设指纹有n个细节点,将细节点组合获取平移旋转不变的参数的方法有:二元组(线段)、三元组(三角形)、四元组(四边形)、……、i元组(i边形)、……。i越大,代表的指纹结构信息越丰富,但同时匹配上的困难性就越大。在i<<n的情况下,i越大,i元组的数量会越多。比如:二元组有
Figure A200810180094D00121
个,三元组有
Figure A200810180094D00122
个,四元组有
Figure A200810180094D00123
个等。
二元组虽然数量少,但是其区分能力差。三元组已经具有了较好的区别能力。但是三元组代表的指纹结构信息仍然不够丰富,仍然有很多的误判,同时三元组的数目
Figure A200810180094D0012110248QIETU
已经是非常庞大到必须进行精选的程度。比如 C 80 3 = 82160 , C 150 3 = 551300 .
如果将这么多三角形全部存储起来作为索引,将会使存储量大大增加,检索系统从硬盘读取数据花费的时间就会越多,检索时间会大大增加,这样就没有起到加速AFIS的作用。所以特征组的精选方法是影响指纹检索系统效率的另一个重要因素。
4.3 基于一边多次匹配结构特征的检索评价方法
对索引数据库检索得到的检索结果除了含有匹配的三角形数目之外,还包含很多有用的信息。例如使用细节点三角形进行检索时存在如图12所示的现象。图12中左图是现场指纹,右图是库指纹。现场指纹的两个三角形分别和库指纹的两个三角形匹配,同一枚指纹中的两个三角形共用一条边。对于这样的情形,我们定义为一边二次匹配。如果这样的两对三角形匹配,说明这两枚指纹在结构上更为相似,所以其匹配的可能性就更高。同理可推广到一边三次匹配、一边四次匹配等等。因此我们用以下公式作为评分方法:
S = r 1 N tri + &Sigma; i = 2 4 r i N i - - - ( 14 )
其中,S为两枚指纹的匹配总分数,Ntri为匹配三角形数目,N2,N3,N4表示具有一边2,3,4次匹配的三角形数目,r1,r2,r3,r4表示加权系数。我们将采用(14)式评分方法的指纹检索评价方法称为基于一边多次匹配结构特征的检索评价方法,并将(14)式称为基于一边多次匹配结构特征的检索评价公式。
我们对公式(14)进行如下分析:
从4.2的分析可知,由于特征组的数量非常庞大,所以必须对指纹的特征组进行精选。精选必须遵循两个原则:(1)减少特征组的数量;(2)不能明显降低指纹的识别精度,即必须从大量特征组中选取可靠性和代表性好的特征组。
表1和表2所示为细节点数目n=80和n=150时,
Figure A200810180094D00127
的数值。从表中可以看到,n=80时, C 80 4 > > C 80 3 , 而很多指纹库中,n多达150甚至更多。这样我们就面临着一个矛盾:为了提高检索速度,必须对指纹特征组进行精选,而对三元特征组进行精选已经非常困难,如果为了提高检索精度而选取四元组或者更高结构将会使这一矛盾更加突出。
我们采用了将易于形变的三角形剔除和将三角形限制在一定局部范围的方法对三角形进行精选,该方法对三元组的精选是有效的。但是,由于 C n 3 < < C n 4 , 这些方法对四元组的精选是无效的,因为使用这些方法筛选后剩下的四元组数量仍然是庞大的。
表1 
Figure A200810180094D00132
的数值
Figure A200810180094D00133
表2 
Figure A200810180094D00134
的数值
Figure A200810180094D00135
本发明提出的基于一边多次匹配结构特征的相似性评价方法可以有效解决高维特征组的精选问题。图12所示一边二次匹配的同一枚指纹的两个三角形的四个顶点能够组成一个四元组,即两对三角形具有一边二次匹配特性时,事实上就相当于匹配上了一对四元组。只要我们统计一边二次匹配的三角形数目就可以得到两枚指纹匹配的四元组数目,即(14)式中的N2相当于是两枚指纹匹配的四元组的数目。
这样我们用三元组的存储量完成了比对四元组任务,即利用三元组巧妙地实现了四元组的比对。因为我们使用一边二次匹配方法得到的四元组是用已经匹配上的三元组的顶点得到的,事实上这些四元组正好就是我们需要从四元组总数据量
Figure A200810180094D00136
中精选出来的那些可以匹配的四元组,这样我们通过这种方法实现了对四元组进行精选的目的,符合精选必须遵循的两个原则。所以,一边二次匹配方法用远小于
Figure A200810180094D00137
的数据量同时达到了对四元组精选和匹配的双重目的。具体带来了以下好处:
(a)特征组的存储量 N C < C n 3 < < C n 4 , 节省了存储空间,从而减少了从硬盘读取数据和比对的时间,提高了检索速度。NC表示精选后的三角形数量。
(b)通过可匹配的三元组组合得到四元组,实现了对四元组数量的精选,而且得到的四元组正好是两枚指纹匹配的四元组,保证了比对效果。
(c)公式(14)的打分更注重指纹结构上的相似性,所以更精确,从而提高了检索精度。
从公式(14)可以看到,通过三角形一边多次匹配参数不仅可以得到四元组匹配的数目N2,而且可以得到五元组、六元组及其更高组合的匹配数目N3,N4,…Ni…,原因是三对三角形一边三次匹配就相当于匹配上了一个五元组,同理可推广到一边四次匹配以上。公式(14)选择的一边多次匹配是一边二次匹配、一边三次匹配、一边四次匹配,选择的多元组是四元组、五元组、六元组。
从上述分析我们可以得到基于一边多次匹配结构特征的检索评价方法的评价步骤:
第一步:获取检索信息;
第二步:从检索信息中提取匹配三角形数目信息;
第三步:从检索信息中提取三角形一边多次匹配信息得到相应的多元组匹配信息;
第四步:使用基于一边多次匹配结构特征的检索评价公式对现场指纹和库指纹进行相似性打分。
基于一边多次匹配结构特征的指纹检索评价方法不以匹配三角形数目作为唯一的评分方法,而是通过三元组匹配信息有效地获取了多元组结构的匹配数目,使得评分结果更真实更能体现指纹的相似性,从而能够使与现场指纹真正匹配的库指纹得到更高的打分,减少了漏真的可能性;而且,该评分方法在提高了检索精度的同时,指纹特征参数组的存储量却依然为精选后的三元组的数量,有效提高了指纹检索的效率。

Claims (10)

1.一种超大型指纹库检索系统的构造方法,该方法包括:
第一步:提取指纹细节点三角形具有平移和旋转畸变不变性的参数构成特征参数组,剔除特征参数组中可靠性差和冗余的特征参数;
第二步:依据基于索引匹配错误概率的索引评价方法对库指纹构建哈希索引、分层深度索引、特征值索引三个功能互补的索引器;
第三步:将三个索引器分别写入数据库,构建三个功能互补的索引数据库;
第四步:依据基于索引匹配错误概率的索引评价方法和基于一边多次匹配结构特征的检索评价方法构建检索器。
2.如权利要求1所述的构造方法,其中所述索引器的构建包括:
哈希索引器的构造:三角形特征参数组的全部特征量化构造哈希索引器;
分层深度索引器的构造:按照基于分层深度索引的指纹检索方法构造分层深度索引器;
特征值索引器的构造:三角形特征参数组的全部特征不量化构造特征值索引器。
3.如权利要求1所述的构造方法,其中所述检索器的构建包括:
自适应选择检索方式模块的构造:依据基于索引匹配错误概率的索引评价方法构建该自适应选择检索方式模块,用于根据用户输入的现场指纹图像质量选择相适应的检索方式;
检索模块的构造:对应于哈希索引、分层深度索引、特征值索引三种索引方式构建哈希检索、分层深度检索、特征值检索三个检索模块,用于检索索引数据库;
检索结果打分模块的构造:依据基于一边多次匹配结构特征的检索评价方法构造检索结果打分模块;
判决模块的构造:依据打分结果判决所检索的库指纹是否应被筛除。
4.一种基于索引匹配错误概率的索引评价方法,该方法包括:
第一步:依据图像预处理过程得到的信息将指纹图像质量划分为三个等级:好、中等、差;
第二步:图像质量好的指纹,对索引匹配错误的容错范围大,不易漏真,可以最大限度地利用容错范围得到尽量快的检索速度,选择用哈希检索法检索哈希索引数据库;
第三步:图像质量差的指纹,对索引匹配错误的容错范围小,易漏真,为了满足不漏真前提,只能使用速度最慢但精度最高的检索方式,选择用特征值检索法检索特征值索引数据库;
第四步:图像质量中等的指纹,对索引匹配错误的容错范围中等,为了有效利用这些容差范围,提高系统的检索速度,选择用分层深度检索法检索分层深度索引数据库。
5.如权利要求4所述的基于索引匹配错误概率的索引评价方法,其中所述哈希检索法是指比较现场指纹三角形的哈希值是否与库指纹三角形的哈希值相等,如果相等则判定所比较的两个三角形匹配,否则判定为不匹配。
6.如权利要求4所述的基于索引匹配错误概率的索引评价方法,其中所述特征值检索法是指计算现场指纹三角形特征参数组中的特征参数与库指纹三角形特征参数组中的特征参数的差值是否在设定的阈值范围之内,如果差值都在阈值范围之内,则判定所比较的两个三角形匹配,否则判定为不匹配。
7.如权利要求4所述的基于索引匹配错误概率的索引评价方法,其中所述分层深度检索法分为两步:
第一步:比较现场指纹三角形分层深度索引第一层的索引值与库指纹三角形分层深度索引第一层的索引值是否相等,如果第一层索引值相等则进入第二步,否则判定所比较的两个三角形不匹配;
第二步:计算现场指纹三角形深度索引第二层的特征参数与库指纹三角形深度索引第二层的特征参数的差值是否在设定的阈值范围之内,如果现场指纹三角形和库指纹三角形的第一层索引值相等,并且第二层特征参数的差值都在设定的阈值范围之内,则判定所比较的两个三角形匹配,否则判定为不匹配。
8.一种基于分层深度索引的指纹检索方法,该方法包括:
第一步:依据指纹三角形特征参数组中的每个特征参数的特性将指纹三角形特征参数组分为两部分;
第二步:将三角形特征参数组的第一部分量化构造分层深度索引的第一层;
第三步:将三角形特征参数组的第二部分不量化构造分层深度索引的第二层;
第四步:比较现场指纹三角形和库指纹三角形的第一层索引值是否相等,如果第一层索引值相等则进入第二步,否则判定所比较的两个三角形不匹配;
第五步:计算现场指纹三角形第二层的特征参数与库指纹三角形第二层的特征参数的差值是否都在设定的阈值范围之内;
第六步:如果现场指纹三角形和库指纹三角形的第一层索引值相等,第二层特征参数的差值都在设定的阈值范围之内,则判定所比较的两个三角形匹配,否则判定为不匹配。
9.一种基于一边多次匹配结构特征的检索评价方法,该方法包括:
第一步:获取检索信息;
第二步:从检索信息中提取匹配三角形数目信息;
第三步:从检索信息中提取三角形一边多次匹配信息获取相应的多元组匹配信息;
第四步:使用基于一边多次匹配结构特征的检索评价公式
S = r 1 N tri + &Sigma; i = 2 4 r i N i
对现场指纹和库指纹进行相似性打分,其中S为两枚指纹的匹配总分数,Ntri为匹配三角形数目,N2、N3、N4表示具有一边2、3、4次匹配的三角形数目,r1、r2、r3、r4表示加权系数。
10.如权利要求9所述的基于一边多次匹配结构特征的检索评价方法,其中,所述一边多次匹配是一边二次匹配、一边三次匹配、一边四次匹配;所述多元组是四元组、五元组、六元组。
CN200810180094XA 2008-11-24 2008-11-24 超大型指纹库的索引结构和检索方法 Expired - Fee Related CN101477523B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810180094XA CN101477523B (zh) 2008-11-24 2008-11-24 超大型指纹库的索引结构和检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810180094XA CN101477523B (zh) 2008-11-24 2008-11-24 超大型指纹库的索引结构和检索方法

Publications (2)

Publication Number Publication Date
CN101477523A true CN101477523A (zh) 2009-07-08
CN101477523B CN101477523B (zh) 2011-07-20

Family

ID=40838240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810180094XA Expired - Fee Related CN101477523B (zh) 2008-11-24 2008-11-24 超大型指纹库的索引结构和检索方法

Country Status (1)

Country Link
CN (1) CN101477523B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096780A (zh) * 2010-12-17 2011-06-15 华中科技大学 大规模用户环境下数字指纹的快速检测方法
CN102117380A (zh) * 2009-12-30 2011-07-06 鸿富锦精密工业(深圳)有限公司 简化基于矩阵的Boosting算法的系统及方法
CN105898866A (zh) * 2016-06-16 2016-08-24 合肥工业大学 一种WiFi室内定位中指纹库的构建方法
WO2017020735A1 (zh) * 2015-07-31 2017-02-09 华为技术有限公司 一种数据处理方法、备份服务器及存储系统
WO2017067292A1 (zh) * 2015-10-19 2017-04-27 广东欧珀移动通信有限公司 一种保证指纹数据稳定的方法、装置及终端
CN108960039A (zh) * 2018-05-07 2018-12-07 西安电子科技大学 一种基于对称hash的不可逆指纹模板加密方法
CN109213738A (zh) * 2018-11-20 2019-01-15 武汉理工光科股份有限公司 一种云存储文件级重复数据删除检索系统及方法
CN110083601A (zh) * 2019-04-04 2019-08-02 中国科学院计算技术研究所 面向键值存储系统的索引树构建方法及系统
CN110096555A (zh) * 2019-04-17 2019-08-06 北京奇安信科技有限公司 一种分布式系统的表匹配处理方法及装置
CN111831660A (zh) * 2020-07-16 2020-10-27 深圳大学 度量空间划分方式评价方法、装置、计算机设备及存储介质
CN112434658A (zh) * 2020-12-10 2021-03-02 上海金智晟东电力科技有限公司 一种智慧城市指纹图像多特征快速匹配算法
CN113989867A (zh) * 2021-12-08 2022-01-28 东北大学 一种基于Faiss库的高效指纹识别系统及方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103235791B (zh) * 2013-03-29 2019-03-26 厦门雅迅网络股份有限公司 一种基于秩次的指纹匹配优化定位方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117380A (zh) * 2009-12-30 2011-07-06 鸿富锦精密工业(深圳)有限公司 简化基于矩阵的Boosting算法的系统及方法
CN102117380B (zh) * 2009-12-30 2014-04-23 鸿富锦精密工业(深圳)有限公司 简化基于矩阵的Boosting算法的系统及方法
CN102096780B (zh) * 2010-12-17 2013-01-02 华中科技大学 大规模用户环境下数字指纹的快速检测方法
CN102096780A (zh) * 2010-12-17 2011-06-15 华中科技大学 大规模用户环境下数字指纹的快速检测方法
WO2017020735A1 (zh) * 2015-07-31 2017-02-09 华为技术有限公司 一种数据处理方法、备份服务器及存储系统
WO2017067292A1 (zh) * 2015-10-19 2017-04-27 广东欧珀移动通信有限公司 一种保证指纹数据稳定的方法、装置及终端
CN105898866A (zh) * 2016-06-16 2016-08-24 合肥工业大学 一种WiFi室内定位中指纹库的构建方法
CN105898866B (zh) * 2016-06-16 2019-04-05 合肥工业大学 一种WiFi室内定位中指纹库的构建方法
CN108960039B (zh) * 2018-05-07 2021-08-06 西安电子科技大学 一种基于对称hash的不可逆指纹模板加密方法
CN108960039A (zh) * 2018-05-07 2018-12-07 西安电子科技大学 一种基于对称hash的不可逆指纹模板加密方法
CN109213738A (zh) * 2018-11-20 2019-01-15 武汉理工光科股份有限公司 一种云存储文件级重复数据删除检索系统及方法
CN109213738B (zh) * 2018-11-20 2022-01-25 武汉理工光科股份有限公司 一种云存储文件级重复数据删除检索系统及方法
CN110083601A (zh) * 2019-04-04 2019-08-02 中国科学院计算技术研究所 面向键值存储系统的索引树构建方法及系统
CN110096555A (zh) * 2019-04-17 2019-08-06 北京奇安信科技有限公司 一种分布式系统的表匹配处理方法及装置
CN111831660A (zh) * 2020-07-16 2020-10-27 深圳大学 度量空间划分方式评价方法、装置、计算机设备及存储介质
CN112434658A (zh) * 2020-12-10 2021-03-02 上海金智晟东电力科技有限公司 一种智慧城市指纹图像多特征快速匹配算法
CN113989867A (zh) * 2021-12-08 2022-01-28 东北大学 一种基于Faiss库的高效指纹识别系统及方法

Also Published As

Publication number Publication date
CN101477523B (zh) 2011-07-20

Similar Documents

Publication Publication Date Title
CN101477523B (zh) 超大型指纹库的索引结构和检索方法
EP1467308A1 (en) Image identification system
Liu et al. A coarse to fine minutiae-based latent palmprint matching
JP5230525B2 (ja) 画像検索装置およびその方法
CN102016918B (zh) 物体识别用图像数据库的制作方法以及处理装置
CN102460511B (zh) 用于物体识别的图像数据库的制作方法以及制作装置
Han et al. Handwritten signature retrieval and identification
US20050058325A1 (en) Fingerprint verification
CN101536035A (zh) 图像识别方法、图像识别装置以及图像识别程序
Jégou et al. Exploiting descriptor distances for precise image search
US20040255128A1 (en) Fingerprint authentication system and method
WO2008135521A2 (en) Fast fingerprint identification and verification by minutiae pair indexing
Uz et al. Minutiae-based template synthesis and matching for fingerprint authentication
Divya et al. Methods to detect different types of outliers
Mitra et al. Probabilistic fingerprints for shapes
US7574609B2 (en) Method, device and computer program for detecting point correspondences in sets of points
Valdes-Ramirez et al. An ensemble of fingerprint matching algorithms based on cylinder codes and mtriplets for latent fingerprint identification
CN110119693A (zh) 一种基于改进vgg-16模型的英文笔迹鉴别方法
Yildirim et al. A case study: unsupervised approach for tourist profile analysis by k-means clustering in turkey
CN103927351B (zh) 基于姿态校正的指纹检索方法及系统
Ren et al. A novel method of score level fusion using multiple impressions for fingerprint verification
Li et al. A novel fingerprint indexing approach focusing on minutia location and direction
Le et al. Sequential pattern mining of large combinable items with values for a set-of-items recommendation
JP2004334644A (ja) データマージプログラム、データマージの方法、データマージプログラムを用いたスコアリングシステム
Sethi et al. Local structural association for retrieval and recognition of signature images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110720

Termination date: 20161124