CN110874419A - 一种人脸数据库快速检索技术 - Google Patents

一种人脸数据库快速检索技术 Download PDF

Info

Publication number
CN110874419A
CN110874419A CN201911135162.5A CN201911135162A CN110874419A CN 110874419 A CN110874419 A CN 110874419A CN 201911135162 A CN201911135162 A CN 201911135162A CN 110874419 A CN110874419 A CN 110874419A
Authority
CN
China
Prior art keywords
face
partition
distance
database
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911135162.5A
Other languages
English (en)
Other versions
CN110874419B (zh
Inventor
高岩
金长新
郝虹
姜凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Scientific Research Institute Co Ltd
Original Assignee
Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Artificial Intelligence Research Institute Co Ltd filed Critical Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Priority to CN201911135162.5A priority Critical patent/CN110874419B/zh
Publication of CN110874419A publication Critical patent/CN110874419A/zh
Application granted granted Critical
Publication of CN110874419B publication Critical patent/CN110874419B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人工智能领域,具体提供了一种人脸数据库快速检索技术。与现有技术相比,本发明的在人脸识别模型输出的人脸特征向量为多维向量,其中,每一维均为浮点数值标量,人脸特征向量组成的空间认为是Rn空间。其特征在于,包括如下步骤:步骤1、对人脸数据库建立有序分割,保证划分的每个子区间有序;步骤2、基于划分的子区间,在人脸识别时对人脸特征向量进行对比,根据特征向量与中心向量的距离判断分区。根据距离远近对数据库中的人脸记录事先进行分区存储的方法,适当建立索引,在识别人脸时能够大大减小需要查找的候选记录,增加对比速度。

Description

一种人脸数据库快速检索技术
技术领域
本发明涉及人工智能领域,具体提供一种人脸数据库快速检索技术。
背景技术
随着人工智能和深度学习技术的发展,深度神经网路模型在人脸识别任务中得到广泛应用,并大幅度提高了人脸识别的准确率。被训练好的人脸识别模型计算得到所有人员的人脸特征向量,并存储在数据库中,当进行识别某个员工时,在模型计算中计算待识别人脸的特征向量,然后,计算该向量与数据库中所有特征向量的距离,如果其中距离最小值小于预先设定的阈值δ,则判断为同一个人;反之,判定该人员不在数据库中。
在这种方法下,许多人脸识别场景需要实时的识别性能,但是当人脸数据库中的人员过多时,查找最小距离的过程会消耗过长的时间,从而导致应用的实时性下降,甚至不可接受。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的人脸数据库快速检索技术。
本发明解决其技术问题所采用的技术方案是:
一种人脸数据库快速检索技术,在人脸识别模型输出的人脸特征向量为多维向量,其中,每一维均为浮点数值标量,人脸特征向量组成的空间认为是Rn空间。其特征在于,包括如下步骤:
步骤1、对人脸数据库建立有序分割,保证划分的每个子区间有序;
步骤2、基于划分的子区间,在人脸识别时对人脸特征向量进行对比,根据特征向量与中心向量的距离判断分区。
进一步的,步骤1-1、得到中心向量;
步骤1-2、划分到不同的子集合;
步骤1-3、构建一级分区;
步骤1-4、构建二级分区。
进一步的,在步骤1-1中由人脸识别模型和人脸图像得到所有人员的人脸特征向量,计算每一个维度的平均值,得到中心向量,中心向量用O表示,将中心向量O作为中心点。
进一步的,在步骤1-2中以两倍的阈值为增量建立有序数列,阈值用δ来表示,任意相邻的两个有序数对组成一个子区间的划分,将特征向量按照所述划分分配到不同的子集合中。
进一步的,在步骤1-3中,若一个特征向量与中心点的距离在某个有序数对的区间内,则这个特征向量被分配到对应的有序数对分割的子集合中,这样的子集合构成一级分区。
进一步的,在步骤1-4中,对每个子集合继续划分为两个子集合,同样按照特征向量与中心点的距离远近划分,分割点为一级分区两个边界的中点,对每个一级分区划分为两个二级分区。
进一步的,在步骤2中,对于一张待识别的人脸图像,输入到人脸识别模型中,得到所述人脸图像的特征向量。然后,进行如下步骤:
步骤2-1、计算人脸图像的特征向量与中心点的距离,进行分区;
步骤2-2、判断待识别人脸图像是否在数据库中。
进一步的,在步骤2-1中,计算所述人脸图像的特征向量与所述中心点的距离,根据距离远近得到对应的一级分区,如果该距离与一级分区的上边界差值超过阈值δ,则返回该一级分区和下一个一级分区的前二级分区;
否则,返回该一级分区和上一个一级分区的后二级分区。
进一步的,步骤2-2中,如果返回分区中不含有任何特征向量,则判定待识别人脸图像对应的人员不在数据库中;否则,计算人脸图像的特征向量与返回的分区中所有特征向量的距离,距离最小者即为对应的人员,判定为同一个人。
本发明的人脸数据库快速检索技术和现有技术相比,具有以下突出的有益效果:
(1)本发明提出的一种根据距离远近对数据库中的人脸记录事先进行分区存储的方法,适当建立索引,在识别人脸时能够大大减小需要查找的候选记录,增加对比速度。
(2)当在人脸数据库中的人员过多时,查找的时间也会相对的减少时间,实用性和实时性提高,提高工作的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是本发明数据库索引分表示意图;
附图2是本发明待识别样本位置示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1、2所示,本实施例中首先提出一种对人脸数据库建立有序分割的方法,该方法保证划分的每个子区间有序;然后,基于该划分的子区间,提出了一种在人脸识别时对人脸特征向量进行快速对比的方法。
(1)对人脸数据库建立有序分割,保证划分的每个子区间有序:
首先,进行预处理。确定训练后的人脸识别模型,假设为M,识别阈值设置为δ。为所有需要识别的人员分配唯一的id,将所有人员的脸部图像输入到模型M中,输出人脸特征向量V,每一个人员的(id,v)组成数据库的一条记录,假设M用128维向量表示人脸特征,则向量V为128维。
然后,划分数据库。根据人脸特征向量V组成的特征空间,计算每一维的平均值,得到中心向量O,计算与O相距最大的向量距离为t。从零开始,以两倍的阈值2*δ为增量生成有序数列r0,r1,r2,...,rm,其中,rm-1≤t<rm。[r0,r1)构成第一个一级分区的区间,与中心向量O的距离在该区间的所有向量被分配到该一级分区中,同时,与中心向量O的距离小于r0+δ的所有向量继续被分配到该一级分区的前二级分区中,剩余向量被分配到该一级分区的后二级分区中。
最后,按照该方法,依次分配剩余m-1个一级分区,和每个一级分区中的前、后二级分区。一级分区的示意图参阅图1。对所有一级分区和二级分区建立树形索引,根据索引可以在常数时间内查找到每个分区。每个二级分区内存储所有被分配到该分区的(id,v)记录。
(2)基于划分的子区间,在人脸识别时对人脸特征向量进行对比,根据特征向量与中心向量的距离判断分区:
在进行人脸识别时,将人脸图像输入到人脸识别模型M中,得到输出特征向量u,计算u与中心向量O的距离d,计算距离d与增量δ的整除商k。
当k为偶数时,返回第k/2个一级分区和第
Figure BDA0002279394890000042
个一级分区的后二级分区,否则,返回第k/2个一级分区和第
Figure BDA0002279394890000041
个一级分区的前二级分区的记录。请参阅图2,当u位于A或B类似位置时,返回所在一级分区和该分区左侧一级分区和后二级分区,当u位于C类似位置时,返回所在一级分区和该分区右侧一级分区的前二级分区。如果返回记录条数为0,则判定数据库中无该人员,否则,计算u与返回的所有记录的特征向量的距离,距离最小者对应的id判定为该人员id,返回id信息。
原理为:
在Rn空间中,以任意一点O为中心,设其子空间Dλ,β表示与中心点O的距离不小于λ,且小于β的向量集合,λ>0,β>0。那么,对任意一组正有序数列r0<t1<…<ri<…,集合
Figure BDA0002279394890000051
中的子空间集合
Figure BDA0002279394890000052
满足如下性质:
1)对任意的两个子空间集合,
Figure BDA0002279394890000053
当i≠j时,其中
Figure BDA0002279394890000054
为空集。
2)
Figure BDA0002279394890000055
上述性质表明,空间Rn可以被任意一组正有序数列划分为多个互不相交,但可以完全覆盖该空间的子空间集合。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的人脸数据库快速检索技术权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (9)

1.一种人脸数据库快速检索技术,在人脸识别模型输出的人脸特征向量为多维向量,其中,每一维均为浮点数值标量,人脸特征向量组成的空间认为是Rn空间。其特征在于,包括如下步骤:
步骤1、对人脸数据库建立有序分割,保证划分的每个子区间有序;
步骤2、基于划分的子区间,在人脸识别时对人脸特征向量进行对比,根据特征向量与中心向量的距离判断分区。
2.根据权利要求1所述的一种人脸数据库快速检索技术,其特征在于,
步骤1-1、得到中心向量;
步骤1-2、划分到不同的子集合;
步骤1-3、构建一级分区;
步骤1-4、构建二级分区。
3.根据权利要求2所述的一种人脸数据库快速检索技术,其特征在于,在步骤1-1中由人脸识别模型和人脸图像得到所有人员的人脸特征向量,计算每一个维度的平均值,得到中心向量,中心向量用O表示,将中心向量O作为中心点。
4.根据权利要求2所述的一种人脸数据库快速检索技术,其特征在于,在步骤1-2中以两倍的阈值为增量建立有序数列,阈值用δ来表示,任意相邻的两个有序数对组成一个子区间的划分,将特征向量按照所述划分分配到不同的子集合中。
5.根据权利要求2所述的一种人脸数据库快速检索技术,其特征在于,在步骤1-3中,若一个特征向量与中心点的距离在某个有序数对的区间内,则这个特征向量被分配到对应的有序数对分割的子集合中,这样的子集合构成一级分区。
6.根据权利要求5所述的一种人脸数据库快速检索技术,其特征在于,在步骤1-4中,对每个子集合继续划分为两个子集合,同样按照特征向量与中心点的距离远近划分,分割点为一级分区两个边界的中点,对每个一级分区划分为两个二级分区。
7.根据权利要求1所述的一种人脸数据库快速检索技术,其特征在于,在步骤2中,对于一张待识别的人脸图像,输入到人脸识别模型中,得到所述人脸图像的特征向量。然后,进行如下步骤:
步骤2-1、计算人脸图像的特征向量与中心点的距离,进行分区;
步骤2-2、判断待识别人脸图像是否在数据库中。
8.根据权利要求7所述的一种人脸数据库快速检索技术,其特征在于,在步骤2-1中,计算所述人脸图像的特征向量与所述中心点的距离,根据距离远近得到对应的一级分区,如果该距离与一级分区的上边界差值超过阈值δ,则返回该一级分区和下一个一级分区的前二级分区;
否则,返回该一级分区和上一个一级分区的后二级分区。
9.根据权利要求7所述的一种人脸数据库快速检索技术,其特征在于,步骤2-2中,如果返回分区中不含有任何特征向量,则判定待识别人脸图像对应的人员不在数据库中;否则,计算人脸图像的特征向量与返回的分区中所有特征向量的距离,距离最小者即为对应的人员,判定为同一个人。
CN201911135162.5A 2019-11-19 2019-11-19 一种人脸数据库快速检索技术 Active CN110874419B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911135162.5A CN110874419B (zh) 2019-11-19 2019-11-19 一种人脸数据库快速检索技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911135162.5A CN110874419B (zh) 2019-11-19 2019-11-19 一种人脸数据库快速检索技术

Publications (2)

Publication Number Publication Date
CN110874419A true CN110874419A (zh) 2020-03-10
CN110874419B CN110874419B (zh) 2022-03-29

Family

ID=69717266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911135162.5A Active CN110874419B (zh) 2019-11-19 2019-11-19 一种人脸数据库快速检索技术

Country Status (1)

Country Link
CN (1) CN110874419B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201894A (zh) * 2007-11-06 2008-06-18 重庆大学 基于网格计算技术的大规模人脸数据库人脸识别方法
CN102194106A (zh) * 2011-05-11 2011-09-21 西安理工大学 一种用于门禁系统中的人脸识别方法
US20120254175A1 (en) * 2011-04-01 2012-10-04 Eliot Horowitz System and method for optimizing data migration in a partitioned database
CN103207898A (zh) * 2013-03-19 2013-07-17 天格科技(杭州)有限公司 一种基于局部敏感哈希的相似人脸快速检索方法
CN103970883A (zh) * 2014-05-20 2014-08-06 西安工业大学 基于对齐聚类分析的运动序列检索方法
CN104036261A (zh) * 2014-06-30 2014-09-10 北京奇虎科技有限公司 人脸识别方法和系统
CN104765768A (zh) * 2015-03-09 2015-07-08 深圳云天励飞技术有限公司 海量人脸库的快速准确检索方法
CN104899255A (zh) * 2015-05-15 2015-09-09 浙江大学 适用于训练深度卷积神经网络的图像数据库的构建方法
US20170060978A1 (en) * 2015-08-28 2017-03-02 International Business Machines Corporation Processing window partitioning and ordering for on-line analytical processing (olap) functions
CN108932321A (zh) * 2018-06-29 2018-12-04 金蝶软件(中国)有限公司 人脸图像检索方法、装置、计算机设备及存储介质
CN108932468A (zh) * 2018-04-27 2018-12-04 衡阳师范学院 一种适用于心理学的面部识别方法
CN109408653A (zh) * 2018-09-30 2019-03-01 叠境数字科技(上海)有限公司 基于多特征检索和形变的人体发型生成方法
CN109685044A (zh) * 2019-02-18 2019-04-26 上海德拓信息技术股份有限公司 基于k均值聚类算法的人脸识别检索方法
CN110147455A (zh) * 2017-08-30 2019-08-20 中兴通讯股份有限公司 一种人脸匹配检索装置及方法
CN110458002A (zh) * 2019-06-28 2019-11-15 天津大学 一种轻量级快速人脸识别方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201894A (zh) * 2007-11-06 2008-06-18 重庆大学 基于网格计算技术的大规模人脸数据库人脸识别方法
US20120254175A1 (en) * 2011-04-01 2012-10-04 Eliot Horowitz System and method for optimizing data migration in a partitioned database
CN102194106A (zh) * 2011-05-11 2011-09-21 西安理工大学 一种用于门禁系统中的人脸识别方法
CN103207898A (zh) * 2013-03-19 2013-07-17 天格科技(杭州)有限公司 一种基于局部敏感哈希的相似人脸快速检索方法
CN103970883A (zh) * 2014-05-20 2014-08-06 西安工业大学 基于对齐聚类分析的运动序列检索方法
CN104036261A (zh) * 2014-06-30 2014-09-10 北京奇虎科技有限公司 人脸识别方法和系统
CN104765768A (zh) * 2015-03-09 2015-07-08 深圳云天励飞技术有限公司 海量人脸库的快速准确检索方法
CN104899255A (zh) * 2015-05-15 2015-09-09 浙江大学 适用于训练深度卷积神经网络的图像数据库的构建方法
US20170060978A1 (en) * 2015-08-28 2017-03-02 International Business Machines Corporation Processing window partitioning and ordering for on-line analytical processing (olap) functions
CN110147455A (zh) * 2017-08-30 2019-08-20 中兴通讯股份有限公司 一种人脸匹配检索装置及方法
CN108932468A (zh) * 2018-04-27 2018-12-04 衡阳师范学院 一种适用于心理学的面部识别方法
CN108932321A (zh) * 2018-06-29 2018-12-04 金蝶软件(中国)有限公司 人脸图像检索方法、装置、计算机设备及存储介质
CN109408653A (zh) * 2018-09-30 2019-03-01 叠境数字科技(上海)有限公司 基于多特征检索和形变的人体发型生成方法
CN109685044A (zh) * 2019-02-18 2019-04-26 上海德拓信息技术股份有限公司 基于k均值聚类算法的人脸识别检索方法
CN110458002A (zh) * 2019-06-28 2019-11-15 天津大学 一种轻量级快速人脸识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JIAOJIAO ZHAO: "Unconstrained Face Recognition Using a Set-to-Set Distance Measure on Deep Learned Features", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY 》 *
张晓伟: "基于动态时间规整的局部分块匹配在面部遮挡人脸识别中的应用", 《科学技术与工程》 *
陈雯柏: "一种基于P稳定局部敏感哈希算法的相似人脸检索系统设计", 《智能系统学报》 *
雷婷等: "云环境下大规模图像索引技术", 《计算机工程与设计》 *

Also Published As

Publication number Publication date
CN110874419B (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
CN108920720B (zh) 基于深度哈希和gpu加速的大规模图像检索方法
CN105912611B (zh) 一种基于cnn的快速图像检索方法
Popat et al. Hierarchical document clustering based on cosine similarity measure
CN105574212B (zh) 一种多索引磁盘哈希结构的图像检索方法
CN108733976B (zh) 基于融合生物与拓扑特征的关键蛋白质识别方法
WO2018166273A1 (zh) 高维图像特征匹配方法和装置
CN102799614B (zh) 基于视觉词语空间共生性的图像检索方法
CN109919084B (zh) 一种基于深度多索引哈希的行人重识别方法
CN104199827A (zh) 基于局部敏感哈希的大规模多媒体数据的高维索引方法
Song et al. Solutions for processing k nearest neighbor joins for massive data on mapreduce
JPWO2013129580A1 (ja) 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム
CN103020321B (zh) 近邻搜索方法与系统
CN110598061A (zh) 一种多元图融合的异构信息网嵌入方法
CN107180079B (zh) 基于卷积神经网络以及树与哈希结合索引的图像检索方法
CN113792594A (zh) 一种基于对比学习的视频中语言片段定位方法及装置
CN110874419B (zh) 一种人脸数据库快速检索技术
Johns et al. Pairwise probabilistic voting: Fast place recognition without RANSAC
CN110083732B (zh) 图片检索方法、装置及计算机存储介质
CN116861022A (zh) 一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法
CN116304213A (zh) 基于图神经网络的rdf图数据库子图匹配查询优化方法
Mercioni et al. A study on Hierarchical Clustering and the Distance metrics for Identifying Architectural Styles
CN104978729A (zh) 一种基于数据感知的图像哈希方法
Rachkovskij Fast similarity search for graphs by edit distance
CN112149566A (zh) 一种图像处理方法、装置、电子设备及存储介质
Lee et al. An improvement video search method for VP-tree by using a trigonometric inequality

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220303

Address after: Building S02, 1036 Gaoxin Langchao Road, Jinan, Shandong 250100

Applicant after: Shandong Inspur Scientific Research Institute Co.,Ltd.

Address before: North 6th floor, S05 building, Langchao Science Park, 1036 Langchao Road, hi tech Zone, Jinan City, Shandong Province, 250100

Applicant before: SHANDONG INSPUR ARTIFICIAL INTELLIGENCE RESEARCH INSTITUTE Co.,Ltd.

GR01 Patent grant
GR01 Patent grant