CN110874419A - 一种人脸数据库快速检索技术 - Google Patents
一种人脸数据库快速检索技术 Download PDFInfo
- Publication number
- CN110874419A CN110874419A CN201911135162.5A CN201911135162A CN110874419A CN 110874419 A CN110874419 A CN 110874419A CN 201911135162 A CN201911135162 A CN 201911135162A CN 110874419 A CN110874419 A CN 110874419A
- Authority
- CN
- China
- Prior art keywords
- face
- partition
- distance
- database
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及人工智能领域,具体提供了一种人脸数据库快速检索技术。与现有技术相比,本发明的在人脸识别模型输出的人脸特征向量为多维向量,其中,每一维均为浮点数值标量,人脸特征向量组成的空间认为是Rn空间。其特征在于,包括如下步骤:步骤1、对人脸数据库建立有序分割,保证划分的每个子区间有序;步骤2、基于划分的子区间,在人脸识别时对人脸特征向量进行对比,根据特征向量与中心向量的距离判断分区。根据距离远近对数据库中的人脸记录事先进行分区存储的方法,适当建立索引,在识别人脸时能够大大减小需要查找的候选记录,增加对比速度。
Description
技术领域
本发明涉及人工智能领域,具体提供一种人脸数据库快速检索技术。
背景技术
随着人工智能和深度学习技术的发展,深度神经网路模型在人脸识别任务中得到广泛应用,并大幅度提高了人脸识别的准确率。被训练好的人脸识别模型计算得到所有人员的人脸特征向量,并存储在数据库中,当进行识别某个员工时,在模型计算中计算待识别人脸的特征向量,然后,计算该向量与数据库中所有特征向量的距离,如果其中距离最小值小于预先设定的阈值δ,则判断为同一个人;反之,判定该人员不在数据库中。
在这种方法下,许多人脸识别场景需要实时的识别性能,但是当人脸数据库中的人员过多时,查找最小距离的过程会消耗过长的时间,从而导致应用的实时性下降,甚至不可接受。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的人脸数据库快速检索技术。
本发明解决其技术问题所采用的技术方案是:
一种人脸数据库快速检索技术,在人脸识别模型输出的人脸特征向量为多维向量,其中,每一维均为浮点数值标量,人脸特征向量组成的空间认为是Rn空间。其特征在于,包括如下步骤:
步骤1、对人脸数据库建立有序分割,保证划分的每个子区间有序;
步骤2、基于划分的子区间,在人脸识别时对人脸特征向量进行对比,根据特征向量与中心向量的距离判断分区。
进一步的,步骤1-1、得到中心向量;
步骤1-2、划分到不同的子集合;
步骤1-3、构建一级分区;
步骤1-4、构建二级分区。
进一步的,在步骤1-1中由人脸识别模型和人脸图像得到所有人员的人脸特征向量,计算每一个维度的平均值,得到中心向量,中心向量用O表示,将中心向量O作为中心点。
进一步的,在步骤1-2中以两倍的阈值为增量建立有序数列,阈值用δ来表示,任意相邻的两个有序数对组成一个子区间的划分,将特征向量按照所述划分分配到不同的子集合中。
进一步的,在步骤1-3中,若一个特征向量与中心点的距离在某个有序数对的区间内,则这个特征向量被分配到对应的有序数对分割的子集合中,这样的子集合构成一级分区。
进一步的,在步骤1-4中,对每个子集合继续划分为两个子集合,同样按照特征向量与中心点的距离远近划分,分割点为一级分区两个边界的中点,对每个一级分区划分为两个二级分区。
进一步的,在步骤2中,对于一张待识别的人脸图像,输入到人脸识别模型中,得到所述人脸图像的特征向量。然后,进行如下步骤:
步骤2-1、计算人脸图像的特征向量与中心点的距离,进行分区;
步骤2-2、判断待识别人脸图像是否在数据库中。
进一步的,在步骤2-1中,计算所述人脸图像的特征向量与所述中心点的距离,根据距离远近得到对应的一级分区,如果该距离与一级分区的上边界差值超过阈值δ,则返回该一级分区和下一个一级分区的前二级分区;
否则,返回该一级分区和上一个一级分区的后二级分区。
进一步的,步骤2-2中,如果返回分区中不含有任何特征向量,则判定待识别人脸图像对应的人员不在数据库中;否则,计算人脸图像的特征向量与返回的分区中所有特征向量的距离,距离最小者即为对应的人员,判定为同一个人。
本发明的人脸数据库快速检索技术和现有技术相比,具有以下突出的有益效果:
(1)本发明提出的一种根据距离远近对数据库中的人脸记录事先进行分区存储的方法,适当建立索引,在识别人脸时能够大大减小需要查找的候选记录,增加对比速度。
(2)当在人脸数据库中的人员过多时,查找的时间也会相对的减少时间,实用性和实时性提高,提高工作的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是本发明数据库索引分表示意图;
附图2是本发明待识别样本位置示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1、2所示,本实施例中首先提出一种对人脸数据库建立有序分割的方法,该方法保证划分的每个子区间有序;然后,基于该划分的子区间,提出了一种在人脸识别时对人脸特征向量进行快速对比的方法。
(1)对人脸数据库建立有序分割,保证划分的每个子区间有序:
首先,进行预处理。确定训练后的人脸识别模型,假设为M,识别阈值设置为δ。为所有需要识别的人员分配唯一的id,将所有人员的脸部图像输入到模型M中,输出人脸特征向量V,每一个人员的(id,v)组成数据库的一条记录,假设M用128维向量表示人脸特征,则向量V为128维。
然后,划分数据库。根据人脸特征向量V组成的特征空间,计算每一维的平均值,得到中心向量O,计算与O相距最大的向量距离为t。从零开始,以两倍的阈值2*δ为增量生成有序数列r0,r1,r2,...,rm,其中,rm-1≤t<rm。[r0,r1)构成第一个一级分区的区间,与中心向量O的距离在该区间的所有向量被分配到该一级分区中,同时,与中心向量O的距离小于r0+δ的所有向量继续被分配到该一级分区的前二级分区中,剩余向量被分配到该一级分区的后二级分区中。
最后,按照该方法,依次分配剩余m-1个一级分区,和每个一级分区中的前、后二级分区。一级分区的示意图参阅图1。对所有一级分区和二级分区建立树形索引,根据索引可以在常数时间内查找到每个分区。每个二级分区内存储所有被分配到该分区的(id,v)记录。
(2)基于划分的子区间,在人脸识别时对人脸特征向量进行对比,根据特征向量与中心向量的距离判断分区:
在进行人脸识别时,将人脸图像输入到人脸识别模型M中,得到输出特征向量u,计算u与中心向量O的距离d,计算距离d与增量δ的整除商k。
当k为偶数时,返回第k/2个一级分区和第个一级分区的后二级分区,否则,返回第k/2个一级分区和第个一级分区的前二级分区的记录。请参阅图2,当u位于A或B类似位置时,返回所在一级分区和该分区左侧一级分区和后二级分区,当u位于C类似位置时,返回所在一级分区和该分区右侧一级分区的前二级分区。如果返回记录条数为0,则判定数据库中无该人员,否则,计算u与返回的所有记录的特征向量的距离,距离最小者对应的id判定为该人员id,返回id信息。
原理为:
在Rn空间中,以任意一点O为中心,设其子空间Dλ,β表示与中心点O的距离不小于λ,且小于β的向量集合,λ>0,β>0。那么,对任意一组正有序数列r0<t1<…<ri<…,集合中的子空间集合满足如下性质:
上述性质表明,空间Rn可以被任意一组正有序数列划分为多个互不相交,但可以完全覆盖该空间的子空间集合。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的人脸数据库快速检索技术权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (9)
1.一种人脸数据库快速检索技术,在人脸识别模型输出的人脸特征向量为多维向量,其中,每一维均为浮点数值标量,人脸特征向量组成的空间认为是Rn空间。其特征在于,包括如下步骤:
步骤1、对人脸数据库建立有序分割,保证划分的每个子区间有序;
步骤2、基于划分的子区间,在人脸识别时对人脸特征向量进行对比,根据特征向量与中心向量的距离判断分区。
2.根据权利要求1所述的一种人脸数据库快速检索技术,其特征在于,
步骤1-1、得到中心向量;
步骤1-2、划分到不同的子集合;
步骤1-3、构建一级分区;
步骤1-4、构建二级分区。
3.根据权利要求2所述的一种人脸数据库快速检索技术,其特征在于,在步骤1-1中由人脸识别模型和人脸图像得到所有人员的人脸特征向量,计算每一个维度的平均值,得到中心向量,中心向量用O表示,将中心向量O作为中心点。
4.根据权利要求2所述的一种人脸数据库快速检索技术,其特征在于,在步骤1-2中以两倍的阈值为增量建立有序数列,阈值用δ来表示,任意相邻的两个有序数对组成一个子区间的划分,将特征向量按照所述划分分配到不同的子集合中。
5.根据权利要求2所述的一种人脸数据库快速检索技术,其特征在于,在步骤1-3中,若一个特征向量与中心点的距离在某个有序数对的区间内,则这个特征向量被分配到对应的有序数对分割的子集合中,这样的子集合构成一级分区。
6.根据权利要求5所述的一种人脸数据库快速检索技术,其特征在于,在步骤1-4中,对每个子集合继续划分为两个子集合,同样按照特征向量与中心点的距离远近划分,分割点为一级分区两个边界的中点,对每个一级分区划分为两个二级分区。
7.根据权利要求1所述的一种人脸数据库快速检索技术,其特征在于,在步骤2中,对于一张待识别的人脸图像,输入到人脸识别模型中,得到所述人脸图像的特征向量。然后,进行如下步骤:
步骤2-1、计算人脸图像的特征向量与中心点的距离,进行分区;
步骤2-2、判断待识别人脸图像是否在数据库中。
8.根据权利要求7所述的一种人脸数据库快速检索技术,其特征在于,在步骤2-1中,计算所述人脸图像的特征向量与所述中心点的距离,根据距离远近得到对应的一级分区,如果该距离与一级分区的上边界差值超过阈值δ,则返回该一级分区和下一个一级分区的前二级分区;
否则,返回该一级分区和上一个一级分区的后二级分区。
9.根据权利要求7所述的一种人脸数据库快速检索技术,其特征在于,步骤2-2中,如果返回分区中不含有任何特征向量,则判定待识别人脸图像对应的人员不在数据库中;否则,计算人脸图像的特征向量与返回的分区中所有特征向量的距离,距离最小者即为对应的人员,判定为同一个人。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911135162.5A CN110874419B (zh) | 2019-11-19 | 2019-11-19 | 一种人脸数据库快速检索技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911135162.5A CN110874419B (zh) | 2019-11-19 | 2019-11-19 | 一种人脸数据库快速检索技术 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110874419A true CN110874419A (zh) | 2020-03-10 |
CN110874419B CN110874419B (zh) | 2022-03-29 |
Family
ID=69717266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911135162.5A Active CN110874419B (zh) | 2019-11-19 | 2019-11-19 | 一种人脸数据库快速检索技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110874419B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101201894A (zh) * | 2007-11-06 | 2008-06-18 | 重庆大学 | 基于网格计算技术的大规模人脸数据库人脸识别方法 |
CN102194106A (zh) * | 2011-05-11 | 2011-09-21 | 西安理工大学 | 一种用于门禁系统中的人脸识别方法 |
US20120254175A1 (en) * | 2011-04-01 | 2012-10-04 | Eliot Horowitz | System and method for optimizing data migration in a partitioned database |
CN103207898A (zh) * | 2013-03-19 | 2013-07-17 | 天格科技(杭州)有限公司 | 一种基于局部敏感哈希的相似人脸快速检索方法 |
CN103970883A (zh) * | 2014-05-20 | 2014-08-06 | 西安工业大学 | 基于对齐聚类分析的运动序列检索方法 |
CN104036261A (zh) * | 2014-06-30 | 2014-09-10 | 北京奇虎科技有限公司 | 人脸识别方法和系统 |
CN104765768A (zh) * | 2015-03-09 | 2015-07-08 | 深圳云天励飞技术有限公司 | 海量人脸库的快速准确检索方法 |
CN104899255A (zh) * | 2015-05-15 | 2015-09-09 | 浙江大学 | 适用于训练深度卷积神经网络的图像数据库的构建方法 |
US20170060978A1 (en) * | 2015-08-28 | 2017-03-02 | International Business Machines Corporation | Processing window partitioning and ordering for on-line analytical processing (olap) functions |
CN108932321A (zh) * | 2018-06-29 | 2018-12-04 | 金蝶软件(中国)有限公司 | 人脸图像检索方法、装置、计算机设备及存储介质 |
CN108932468A (zh) * | 2018-04-27 | 2018-12-04 | 衡阳师范学院 | 一种适用于心理学的面部识别方法 |
CN109408653A (zh) * | 2018-09-30 | 2019-03-01 | 叠境数字科技(上海)有限公司 | 基于多特征检索和形变的人体发型生成方法 |
CN109685044A (zh) * | 2019-02-18 | 2019-04-26 | 上海德拓信息技术股份有限公司 | 基于k均值聚类算法的人脸识别检索方法 |
CN110147455A (zh) * | 2017-08-30 | 2019-08-20 | 中兴通讯股份有限公司 | 一种人脸匹配检索装置及方法 |
CN110458002A (zh) * | 2019-06-28 | 2019-11-15 | 天津大学 | 一种轻量级快速人脸识别方法 |
-
2019
- 2019-11-19 CN CN201911135162.5A patent/CN110874419B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101201894A (zh) * | 2007-11-06 | 2008-06-18 | 重庆大学 | 基于网格计算技术的大规模人脸数据库人脸识别方法 |
US20120254175A1 (en) * | 2011-04-01 | 2012-10-04 | Eliot Horowitz | System and method for optimizing data migration in a partitioned database |
CN102194106A (zh) * | 2011-05-11 | 2011-09-21 | 西安理工大学 | 一种用于门禁系统中的人脸识别方法 |
CN103207898A (zh) * | 2013-03-19 | 2013-07-17 | 天格科技(杭州)有限公司 | 一种基于局部敏感哈希的相似人脸快速检索方法 |
CN103970883A (zh) * | 2014-05-20 | 2014-08-06 | 西安工业大学 | 基于对齐聚类分析的运动序列检索方法 |
CN104036261A (zh) * | 2014-06-30 | 2014-09-10 | 北京奇虎科技有限公司 | 人脸识别方法和系统 |
CN104765768A (zh) * | 2015-03-09 | 2015-07-08 | 深圳云天励飞技术有限公司 | 海量人脸库的快速准确检索方法 |
CN104899255A (zh) * | 2015-05-15 | 2015-09-09 | 浙江大学 | 适用于训练深度卷积神经网络的图像数据库的构建方法 |
US20170060978A1 (en) * | 2015-08-28 | 2017-03-02 | International Business Machines Corporation | Processing window partitioning and ordering for on-line analytical processing (olap) functions |
CN110147455A (zh) * | 2017-08-30 | 2019-08-20 | 中兴通讯股份有限公司 | 一种人脸匹配检索装置及方法 |
CN108932468A (zh) * | 2018-04-27 | 2018-12-04 | 衡阳师范学院 | 一种适用于心理学的面部识别方法 |
CN108932321A (zh) * | 2018-06-29 | 2018-12-04 | 金蝶软件(中国)有限公司 | 人脸图像检索方法、装置、计算机设备及存储介质 |
CN109408653A (zh) * | 2018-09-30 | 2019-03-01 | 叠境数字科技(上海)有限公司 | 基于多特征检索和形变的人体发型生成方法 |
CN109685044A (zh) * | 2019-02-18 | 2019-04-26 | 上海德拓信息技术股份有限公司 | 基于k均值聚类算法的人脸识别检索方法 |
CN110458002A (zh) * | 2019-06-28 | 2019-11-15 | 天津大学 | 一种轻量级快速人脸识别方法 |
Non-Patent Citations (4)
Title |
---|
JIAOJIAO ZHAO: "Unconstrained Face Recognition Using a Set-to-Set Distance Measure on Deep Learned Features", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY 》 * |
张晓伟: "基于动态时间规整的局部分块匹配在面部遮挡人脸识别中的应用", 《科学技术与工程》 * |
陈雯柏: "一种基于P稳定局部敏感哈希算法的相似人脸检索系统设计", 《智能系统学报》 * |
雷婷等: "云环境下大规模图像索引技术", 《计算机工程与设计》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110874419B (zh) | 2022-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108920720B (zh) | 基于深度哈希和gpu加速的大规模图像检索方法 | |
CN105912611B (zh) | 一种基于cnn的快速图像检索方法 | |
Popat et al. | Hierarchical document clustering based on cosine similarity measure | |
CN105574212B (zh) | 一种多索引磁盘哈希结构的图像检索方法 | |
CN108733976B (zh) | 基于融合生物与拓扑特征的关键蛋白质识别方法 | |
WO2018166273A1 (zh) | 高维图像特征匹配方法和装置 | |
CN102799614B (zh) | 基于视觉词语空间共生性的图像检索方法 | |
CN109919084B (zh) | 一种基于深度多索引哈希的行人重识别方法 | |
CN104199827A (zh) | 基于局部敏感哈希的大规模多媒体数据的高维索引方法 | |
Song et al. | Solutions for processing k nearest neighbor joins for massive data on mapreduce | |
JPWO2013129580A1 (ja) | 近似最近傍探索装置、近似最近傍探索方法およびそのプログラム | |
CN103020321B (zh) | 近邻搜索方法与系统 | |
CN110598061A (zh) | 一种多元图融合的异构信息网嵌入方法 | |
CN107180079B (zh) | 基于卷积神经网络以及树与哈希结合索引的图像检索方法 | |
CN113792594A (zh) | 一种基于对比学习的视频中语言片段定位方法及装置 | |
CN110874419B (zh) | 一种人脸数据库快速检索技术 | |
Johns et al. | Pairwise probabilistic voting: Fast place recognition without RANSAC | |
CN110083732B (zh) | 图片检索方法、装置及计算机存储介质 | |
CN116861022A (zh) | 一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法 | |
CN116304213A (zh) | 基于图神经网络的rdf图数据库子图匹配查询优化方法 | |
Mercioni et al. | A study on Hierarchical Clustering and the Distance metrics for Identifying Architectural Styles | |
CN104978729A (zh) | 一种基于数据感知的图像哈希方法 | |
Rachkovskij | Fast similarity search for graphs by edit distance | |
CN112149566A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
Lee et al. | An improvement video search method for VP-tree by using a trigonometric inequality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220303 Address after: Building S02, 1036 Gaoxin Langchao Road, Jinan, Shandong 250100 Applicant after: Shandong Inspur Scientific Research Institute Co.,Ltd. Address before: North 6th floor, S05 building, Langchao Science Park, 1036 Langchao Road, hi tech Zone, Jinan City, Shandong Province, 250100 Applicant before: SHANDONG INSPUR ARTIFICIAL INTELLIGENCE RESEARCH INSTITUTE Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |