CN103235825B - 一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法 - Google Patents

一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法 Download PDF

Info

Publication number
CN103235825B
CN103235825B CN201310166729.1A CN201310166729A CN103235825B CN 103235825 B CN103235825 B CN 103235825B CN 201310166729 A CN201310166729 A CN 201310166729A CN 103235825 B CN103235825 B CN 103235825B
Authority
CN
China
Prior art keywords
face
characteristic vector
face characteristic
cluster
identity information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310166729.1A
Other languages
English (en)
Other versions
CN103235825A (zh
Inventor
杨利平
李力
龚卫国
李伟红
李正浩
王立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201310166729.1A priority Critical patent/CN103235825B/zh
Publication of CN103235825A publication Critical patent/CN103235825A/zh
Application granted granted Critical
Publication of CN103235825B publication Critical patent/CN103235825B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种基于Hadoop的海量人脸识别搜索引擎设计方法,属于云计算和模式识别领域。以Hadoop云计算框架为基础,由内层、中间层和外层三层构成。内层用于存放海量的人脸图像及身份信息与提供分布式计算资源,中间层用于搜索引擎的索引表的建立与维护,外层用于接收任务与分配任务。为了在保证精度的同时提高人脸图像在数据库中的搜索速度,本方法采用在中间层使用K均值聚类算法建立人脸特征向量聚类索引表与聚类名单表相结合的方法。本方法可以使用廉价的普通服务器组构建海量人脸识别搜索引擎,并且采用经过大量实践证明的Hadoop云计算框架为基础实现,具有良好的稳定性,方法简单,易于实施。

Description

一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法
技术领域
本发明属于云计算和模式识别领域,具体涉及一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法。
背景技术
现代社会中,视频监控是实现社会公共安全防控的主要监控系统。遍布城市各处的视频信息采集点将海量的视频信息汇集到监控中心,为城市的公共安全防控提供了海量的信息。但是,由于缺乏智能的海量视频分析技术,这些信息的利用率极低。为了充分利用这些信息,保障社会安全,人们尝试将人脸识别技术应用于智能视频分析中,实现犯罪嫌疑人身份的快速确认。然而,面对海量的人脸图像信息,人脸识别的搜索速度则完全无法满足安全部门的应用需求,迫切需要一种快速的海量人脸图像搜索比对方法。
目前,提升人脸图像搜索速度的主要途径是使用高性能的工作站代替一般计算机,这种方案不仅价格昂贵,而且可扩展性差。云计算技术的迅速发展为解决人脸图像的快速搜索提供了条件,已经有一些基于云计算的解决方案被提了出来。例如:中国专利文献公开号:CN202433901U,名称为:分布式智能人脸视频检索系统,其是一种包括工作终端、WEB服务器、任务调度服务器和监控终端的分布式智能人脸视频检索系统,实现实时检索并降低系统搭建成本;中国专利文献公开号:CN102360355A,名称为:基于云计算环境的人脸识别搜索比对引擎,其针对云计算环境人脸识别搜索比对引擎的接口兼容、授权处理、资源调度及分配等问题给出了解决方案。然而,这些方法或系统很少提及云计算技术的具体实现,同时,这些方法使用自建的分布式体系,稳定性差。
云计算技术的实现是一项较为复杂且综合度高的工作,对面向海量人脸图像信息的搜索引擎而言,使用未经实践检验的未成熟云计算框架所构建的系统,实际引擎的架设与维护成本难以控制,且稳定性差,无法满足公共安全部门的实际使用需求。近年来,由Apache基金会支持的Hadoop云计算框架(是一个分布式系统基础架构)已被Facebook、Google等国际顶尖互联网公司所采用,且已经在海量信息检索方面获得了成功,这为构建高效、易于维护与扩展的云计算人脸识别搜索引擎提供了条件。
发明内容
为了解决基于云计算的海量人脸识别搜索引擎开发难度高、稳定性差、难于维护的缺点,本发明提出一种基于Hadoop框架的人脸识别搜索引擎设计方法,以成熟的Hadoop云计算框架为基础,实现稳定高效的海量人脸识别。
本发明首先提出一种建立高效人脸特征向量数据索引表的方法,保证该人脸识别搜索引擎的空间索引实时性与可靠性。
该方法以包含内层、中间层和外层的三层结构的云计算框架为基础,其中,内层由分布式的人脸身份信息数据表构成,用于存放海量的人脸图像、人脸特征向量以及对应的身份信息;中间层由人脸特征向量聚类索引表与聚类名单表构成,用于信息索引表的建立与维护;外层用于接收任务、人脸特征向量计算与任务分配。所述方法将利用人脸特征提取方法计算得到的海量人脸图像的人脸特征向量储存在非结构化的HBase数据库中,得到人脸身份信息数据表,利用K均值聚类算法对该表中人脸特征向量的每一维特征分别进行聚类分析后建立信息索引表,包括人脸特征向量聚类索引表和若干张聚类名单表。
基于以上方法,本发明进一步提出一种基于Hadoop的海量人脸识别搜索引擎设计方法,所述方法是将海量人脸识别过程分解为海量数据组织和人脸特征搜索比对两个阶段。海量数据组织阶段即是建立高效人脸特征向量数据索引表的阶段,在此阶段将利用特征提取方法计算得到的海量人脸图像的特征向量储存在非结构化的HBase数据库中,得到人脸身份信息数据表,利用K均值聚类算法对该表中人脸特征向量的每一维特征分别进行聚类分析后建立信息索引表(包括一张人脸特征向量聚类索引表和若干张聚类名单表);在人脸特征搜索比对阶段,利用待比对人脸图像的特征向量的每一维特征在信息索引表中进行检索,合并检索得到的结果信息,以大大缩小需要比对的人脸数据范围,然后利用Hadoop框架中的MapReduce并行计算进行人脸特征向量对比计算,提高计算效率与均衡载荷。
本发明构建了一种包含内层、中间层和外层的三层结构云计算框架来实现海量数据组织和人脸特征搜索比对。内层由分布式的人脸身份信息数据表构成,用于存放海量的人脸图像、人脸特征向量以及对应的身份信息;中间层由人脸特征向量聚类索引表与聚类名单表构成,用于搜索引擎的信息索引表的建立与维护;外层用于接收任务、人脸特征向量计算与任务分配。
基于以上所述的三层结构云计算框架,本发明的海量人脸识别搜索引擎的实现包括以下步骤:
1、海量数据组织。首先,利用Hadoop框架中的数据库HBase对内层数据进行组织,以键值对的形式存储人脸的图像、人脸特征向量以及对应的身份信息,实现人脸身份信息数据表的分布式存储。然后,在中间层使用K均值聚类算法对人脸身份信息数据表中的人脸特征向量进行聚类分析,建立由单个人脸特征向量聚类索引表和多个聚类名单数据表构成的信息索引表,将人脸身份信息数据表中人脸特征向量的每一维特征值聚为N类,并建立一个含有人脸特征向量维度编号、聚类分类编号、聚类分类中心值及聚类名单表编号属性的人脸特征向量聚类索引表,同时建立多个含有人脸身份信息唯一ID的聚类名单表。这两类表也采用HBase的键值对形式进行组织。
2、人脸特征搜索比对。当外层接收到人脸识别任务时,首先通过Hadoop框架中的MapReduce方式(是一种编程模型,用于大规模数据集(大于1TB)的并行运算)计算待识别人脸图像的人脸特征向量;然后将人脸特征向量传入中间层,由中间层利用信息索引表进行索引后得到若干聚类名单表,并通过MapReduce方式将聚类名单表合并形成待比对的索引名单表;最后,内层根据索引名单表查询待比对的人脸特征向量,并通过MapReduce方式计算待识别人脸图像特征向量与待比对的人脸特征向量的距离得到一张人脸特征向量距离表,对该表按距离从小到大排序后输出搜索结果。
本发明采用上述技术方案,具有以下有益效果:本发明应对构建海量人脸识别搜索引擎不需要采用昂贵的高性能工作站,并且采用经过大量实践证明的Hadoop云计算框架为基础实现,具有良好的稳定性,方法简单,易于实施。本发明还提供了一种高效的人脸特征向量组数据索引表方法,保证了该人脸图像识别搜索引擎的空间索引实时性与可靠性。
附图说明
图1:基于Hadoop的海量人脸识别搜索引擎的架构图;
图2:海量数据组织即建立高效人脸特征向量数据索引表的流程图;
图3:人脸识别搜索查询流程图。
具体实施方式
下面结合流程图和实例进一步说明本发明实施方式。应当理解,此处描述的具体实施例仅用以解释本发明,并不用于限制本发明。
如图1所示,为本发明所提出的人脸识别搜索引擎的架构图。该搜索引擎包含内层、中间层和外层三层。其中,内层由人脸身份信息数据表与人脸特征向量分布式对比计算节点1、计算节点2、计算节点3……计算节点M组成;中间层由人脸特征向量聚类索引表及若干聚类名单表数据集1、2、3……n组成,每个数据集对应1维特征;外层由人机交互查询接口与人脸特征向量计算节点1、2、3……M组成。
如图2所示,为本发明的数据组织流程图。主要步骤分为人脸身份信息数据表的初始化、人脸特征向量聚类分析、聚类名单表的建立、人脸特征向量聚类索引表的建立及信息索引表构建。具体实施过程如下:
1.人脸身份信息数据表的建立
(1)以身份信息的唯一ID为主键,以人脸图像、人脸特征向量、身份信息(包括:姓名、性别、出生日期、住址、常用联系电话等)为“键”在内层的HBase中建立一张人脸身份信息数据表;
(2)从输入的人脸身份信息数据中提取人脸图像,使用外层分布式计算节点通过MapReduce方式计算其人脸特征向量,并将人脸特征向量及对应的人脸图像、身份信息插入到人脸身份信息数据表中,这个过程循环至所有输入的人脸身份信息数据都添加到人脸身份信息数据表中为止;
2.人脸特征向量聚类分析
使用K均值聚类算法以人脸特征向量的每一维特征为分析对象对步骤1所生成的人脸身份信息数据表进行聚类分析,将人脸特征向量每一维特征聚为N个分类(N为自然数,其取值可根据人脸数据规模确定);
3.聚类名单表的建立
由步骤2可获得人脸特征向量每一维特征聚类分析结果,将该结果中的每一个分类在中间层中单独创建一张以人脸身份信息唯一ID为“键”,人名为“值”的聚类名单表,以HBase方式储存。
4.人脸特征向量聚类索引表的建立
在中间层中建立一个以自增自然数为主键,以人脸特征向量维度编号、聚类分类编号、聚类分类中心值及聚类名单表编号为属性的人脸特征向量聚类索引表;
5.信息索引表构建
将步骤2所得聚类分析结果与步骤3所建立的每一个聚类名单表编号信息一起插入到步骤4所建立的人脸特征向量聚类索引表中,该人脸特征向量聚类索引表与所有聚类名单表一起构成信息索引表;
经过以上步骤,本发明的数据组织阶段完成。
如图3所示,为本发明执行人脸识别搜索查询流程图。以下将结合图3说明本发明如何在数据组织完成的基础上进行快速人脸识别检索。在过程的执行中,使用MapReduce计算出待识别人脸图像的人脸特征向量后,将该人脸特征向量每一维特征分别与人脸特征向量聚类索引表中的对应人脸特征向量维度的每一个分类中心值进行对比计算,记录人脸特征向量每一维特征与分类中心值差值绝对值最小的聚类分类,将这些聚类分类对应聚类名单表进行对比,去掉重合信息,合并为一张索引名单表,再根据该索引名单表中的人脸身份信息唯一ID在人脸身份信息数据表中进行查询,构建待比对人脸特征向量,最后待识别的人脸特征向量与待比对人脸特征向量进行对比计算,根据人脸特征向量距离排序后得到最终的结果,返回给用户。具体实施步骤如下:
1.人脸特征向量计算
将待识别的人脸图像使用外层分布式计算节点以MapReduce方式进行计算,得到对应的d维人脸特征向量(d的值由具体的人脸特征提取方法确定),将其传入中间层。
2.索引名单表的构建
中间层中的信息索引表是整个人脸识别搜索引擎的核心,其原理是计算出待识别人脸特征向量各维度特征与聚类分类中心值差值绝对值最小的聚类分类,将这些聚类分类所对应的聚类名单表加以合并以提供索引,与输入人脸图像的人脸特征向量距离较近的人脸所属ID都会出现在该名单中,这样将极大缩小需要对比计算人脸特征向量的范围以达到快速检索的目的,具体实施过程如下:
(1)将步骤1所得d维人脸特征向量的每一维特征分别与人脸特征向量聚类索引表中对应人脸特征向量维度的每一个分类中心值使用内层分布式计算节点进行对比计算,得到一个以聚类分类编号为“键”,差值绝对值为“值”的键值对Ai;
(2)对Ai进行“值”升序排序,得到“值”最小的聚类分类编号Ni
(3)通过聚类分类编号Ni在HBase数据库中定位一张聚类名单表Si
(4)对于人脸特征向量中的每一维特征都执行(1)~(3)的步骤,得到一系列聚类名单表:S1,S2,…,Sd
(5)将步骤(4)中得到的S1,S2,…,Sd中的所有“键”使用内层分布式计算节点通过MapReduce方式进行交叉信息对比,去掉重合信息,合并为一张索引名单表;
(6)将索引名单表传入内层进行进一步操作。
3.获取相似度较高的人脸图像
利用步骤2中所得到的索引名单表中的人脸身份信息在人脸身份信息数据表中执行查询操作,获取对应的待比对人脸特征向量,并依次与待识别人脸图像的人脸特征向量进行距离计算,获取人脸特征向量距离表;最后使用内层中的分布式计算节点以MapReduce方式对人脸特征向量距离表进行降序排序后,输出前m个人脸身份信息(m的取值根据人脸身份信息数据表规模与实际应用环境确定),即为相似度较高的人脸图像。
本发明中所涉及的距离计算方法可采用欧氏距离、曼哈顿距离及幂距离计算方法等方法得到。具体的计算公式为:
●欧氏距离: D = Σ k = 1 n ( I F k - L F jk ) 2 , ( j = 1 , . . . , J )
●曼哈顿距离: D = 1 n Σ k = 1 n | I F k - L F jk | , ( j = 1 , . . . , J )
●幂距离:其中r与p为自定义的参数,(j=1,...,J)
上述公式中n为人脸特征向量维度,J为待比对人脸身份信息个数,IFk为输入待识别人脸图像的人脸特征向量的第k维特征,LFjk为待比对人脸身份信息表中第j张人脸图像的人脸特征向量的第k维特征。
以上对本发明的具体实施例进行了描述和说明,这些实例应被认为其只是示例性的,并不用于对本发明进行限制,本发明应根据所附的权利要求进行解释。

Claims (4)

1.一种基于Hadoop的海量人脸识别搜索引擎的人脸特征向量数据索引表的建立方法,其特征在于:所述方法以包含内层、中间层和外层的三层结构的云计算框架为基础,其中,内层由分布式的人脸身份信息数据表构成,用于存放海量的人脸图像、人脸特征向量以及对应的身份信息;中间层由人脸特征向量聚类索引表与聚类名单表构成,用于信息索引表的建立与维护;外层用于接收任务、人脸特征向量计算与任务分配;
所述方法将利用人脸特征提取方法计算得到的海量人脸图像的人脸特征向量储存在非结构化的HBase数据库中,得到人脸身份信息数据表,利用K均值聚类算法对该表中人脸特征向量的每一维特征分别进行聚类分析后建立信息索引表,包括人脸特征向量聚类索引表和若干张聚类名单表;
所述方法的具体步骤包括:
(1)以身份信息的唯一ID为主键,以人脸图像、人脸特征向量、身份信息为“键”在内层的HBase中建立一张人脸身份信息数据表;从输入的人脸身份信息数据中提取人脸图像,使用外层分布式计算节点通过MapReduce方式计算其人脸特征向量,并将人脸特征向量及对应的人脸图像、身份信息插入到人脸身份信息数据表中,这个过程循环至所有输入的人脸身份信息数据都添加到人脸身份信息数据表中为止;
(2)使用K均值聚类算法以人脸特征向量的每一维特征为分析对象对步骤(1)所生成的人脸身份信息数据表进行聚类分析,将人脸特征向量每一维特征聚为N个分类,N为自然数;
(3)由步骤(2)可获得人脸特征向量每一维特征聚类分析结果,将该结果中的每一个分类在中间层中单独创建一张以人脸身份信息唯一ID为“键”,人名为“值”的聚类名单表,以HBase方式储存;
(4)在中间层中建立一个以自增自然数为主键,以人脸特征向量维度编号、聚类分类编号、聚类分类中心值及聚类名单表编号为属性的人脸特征向量聚类索引表;
(5)将步骤(2)所得聚类分析结果与步骤(3)所建立的每一张聚类名单表编号信息一起插入到步骤(4)所建立的人脸特征向量聚类索引表中,该人脸特征向量聚类索引表与所有聚类名单表一起构成信息索引表。
2.根据权利要求1所述的人脸特征向量数据索引表的建立方法,其特征在于所述身份信息包括:姓名、性别、出生日期、住址、常用联系电话。
3.一种基于Hadoop的海量人脸识别搜索引擎设计方法,其特征在于:所述方法将海量人脸识别过程分解为人脸特征向量数据索引表建立即海量数据组织和人脸特征搜索比对两个阶段;在海量数据组织阶段,将利用特征提取方法计算得到的海量人脸图像的人脸特征向量储存在非结构化的HBase数据库中,得到人脸身份信息数据表,利用K均值聚类算法对该表中人脸特征向量的每一维特征分别进行聚类分析后建立信息索引表,包括人脸特征向量聚类索引表和若干张聚类名单表;在人脸特征搜索比对阶段,利用待比对人脸图像的人脸特征向量的每一维特征在信息索引表中进行检索,合并检索得到的结果信息,然后利用Hadoop框架中的MapReduce并行计算进行人脸特征向量对比计算,提高计算效率与均衡载荷;
所述方法以包含内层、中间层和外层的三层结构的云计算框架为基础,其中,内层由分布式的人脸身份信息数据表构成,用于存放海量的人脸图像、人脸特征向量以及对应的身份信息;中间层由人脸特征向量聚类索引表与聚类名单表构成,用于搜索引擎的信息索引表的建立与维护;外层用于接收任务、人脸特征向量计算与任务分配;
所述海量数据组织的具体步骤包括:
(1)以身份信息的唯一ID为主键,以人脸图像、人脸特征向量、身份信息为“键”在内层的HBase中建立一张人脸身份信息数据表;从输入的人脸身份信息数据中提取人脸图像,使用外层分布式计算节点通过MapReduce方式计算其人脸特征向量,并将人脸特征向量及对应的人脸图像、人脸身份信息插入到人脸身份信息数据表中,这个过程循环至所有输入的人脸身份信息数据都添加到人脸身份信息数据表中为止;
(2)使用K均值聚类算法以人脸特征向量的每一维特征为分析对象对步骤(1)所生成的人脸身份信息数据表进行聚类分析,将人脸特征向量每一维特征聚为N个分类,N为自然数;
(3)由步骤(2)可获得人脸特征向量每一维特征聚类分析结果,将该结果中的每一个分类在中间层中单独创建一张以人脸身份信息唯一ID为“键”,人名为“值”的聚类名单表,以HBase方式储存;
(4)在中间层中建立一个以自增自然数为主键,以人脸特征向量维度编号、聚类分类编号、聚类分类中心值及聚类名单表编号为属性的人脸特征向量聚类索引表;
(5)将步骤(2)所得聚类分析结果与步骤(3)所建立的每一张聚类名单表编号信息一起插入到步骤(4)所建立的人脸特征向量聚类索引表中,该人脸特征向量聚类索引表与所有聚类名单表一起构成信息索引表;
所述人脸特征搜索比对按照以下步骤进行:
(1)将待识别的人脸图像使用外层分布式计算节点以MapReduce方式进行计算,得到对应的d维人脸特征向量,d的值由具体的人脸特征提取方法确定,将其传入中间层;
(2)将步骤(1)所得d维人脸特征向量的每一维特征分别与人脸特征向量聚类索引表中对应人脸特征向量维度的每一个分类中心值使用内层分布式计算节点进行对比计算,得到一个以聚类分类编号为“键”,差值绝对值为“值”的键值对A i
(3)对A i 进行“值”升序排序,得到“值”最小的聚类分类编号N i
(4)通过聚类分类编号N i 在HBase数据库中定位一张聚类名单表S i
(5)对于人脸特征向量中的每一维特征都执行(2)~(4)的步骤,得到一系列聚类名单表:S 1 ,S 2 ,…,S d
(6)将步骤(5)中得到的S 1 ,S 2 ,…,S d 中的所有“键”使用内层分布式计算节点通过MapReduce方式进行交叉信息对比,去掉重合信息,合并为一张索引名单表;
(7)将步骤(6)中所得到的索引名单表中的人脸身份信息在人脸身份信息数据表中执行查询操作,获取对应的待比对人脸特征向量,并依次与待识别人脸图像的人脸特征向量进行对比计算,获取人脸特征向量距离表;最后使用内层中的分布式计算节点以MapReduce方式对人脸特征向量距离表进行降序排序后,输出前m个人脸身份信息。
4.根据权利要求3所述的基于Hadoop的海量人脸识别搜索引擎设计方法,其特征在于所述身份信息包括:姓名、性别、出生日期、住址、常用联系电话。
CN201310166729.1A 2013-05-08 2013-05-08 一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法 Active CN103235825B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310166729.1A CN103235825B (zh) 2013-05-08 2013-05-08 一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310166729.1A CN103235825B (zh) 2013-05-08 2013-05-08 一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法

Publications (2)

Publication Number Publication Date
CN103235825A CN103235825A (zh) 2013-08-07
CN103235825B true CN103235825B (zh) 2016-05-25

Family

ID=48883866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310166729.1A Active CN103235825B (zh) 2013-05-08 2013-05-08 一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法

Country Status (1)

Country Link
CN (1) CN103235825B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9904844B1 (en) 2016-08-04 2018-02-27 International Business Machines Corporation Clustering large database of images using multilevel clustering approach for optimized face recognition process
EP3594877A1 (en) * 2018-07-10 2020-01-15 Masterwork Automodules Tech Corp. Ltd Cash handling system and cash transaction method

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104392438A (zh) * 2014-11-13 2015-03-04 百度在线网络技术(北京)有限公司 一种图像对比方法及装置
CN104679887B (zh) * 2015-03-17 2018-04-13 广西大学 基于emd距离的大规模图像数据相似性搜索方法
CN104834751A (zh) * 2015-05-28 2015-08-12 成都艺辰德迅科技有限公司 基于物联网的数据分析方法
CN105069400B (zh) * 2015-07-16 2018-05-25 北京工业大学 基于栈式稀疏自编码的人脸图像性别识别系统
CN106557521B (zh) * 2015-09-29 2020-07-14 佳能株式会社 对象索引方法、对象搜索方法及对象索引系统
CN106454248A (zh) * 2016-10-25 2017-02-22 上海银晨智能识别科技有限公司 大范围内人脸监控数据处理系统及处理方法
CN106649538A (zh) * 2016-10-26 2017-05-10 北京旷视科技有限公司 人脸搜索的方法及装置
CN108229260B (zh) * 2016-12-21 2020-12-29 杭州海康威视系统技术有限公司 一种身份信息核验方法及系统
CN106778653A (zh) * 2016-12-27 2017-05-31 北京光年无限科技有限公司 面向智能机器人的基于人脸识别样本库的交互方法和装置
CN107145546A (zh) * 2017-04-26 2017-09-08 北京环境特性研究所 基于深度学习的监控视频人员模糊检索方法
CN107273796A (zh) * 2017-05-05 2017-10-20 珠海数字动力科技股份有限公司 一种基于人脸特征的快速人脸识别搜索方法
CN107566785B (zh) * 2017-08-02 2021-05-25 重庆菲莫科技有限公司 一种面向大数据的视频监控系统及方法
CN109426781A (zh) * 2017-08-29 2019-03-05 阿里巴巴集团控股有限公司 人脸识别数据库的构建方法、人脸识别方法、装置及设备
CN109993042A (zh) * 2017-12-29 2019-07-09 国民技术股份有限公司 一种人脸识别方法及其装置
CN108228799B (zh) * 2017-12-29 2021-09-28 北京奇虎科技有限公司 对象索引信息的存储方法及装置
CN109388727A (zh) * 2018-09-12 2019-02-26 中国人民解放军国防科技大学 一种基于聚类的bgp人脸快速检索方法
CN109165307B (zh) * 2018-09-19 2021-02-02 腾讯科技(深圳)有限公司 一种特征检索方法、装置和存储介质
CN109858328B (zh) * 2018-12-14 2023-06-02 上海集成电路研发中心有限公司 一种基于视频的人脸识别的方法及装置
CN109829093A (zh) * 2018-12-29 2019-05-31 深圳云天励飞技术有限公司 一种搜索的方法及装置
CN109753577B (zh) * 2018-12-29 2021-07-06 深圳云天励飞技术有限公司 一种搜索人脸的方法及相关装置
CN109815887B (zh) * 2019-01-21 2020-10-16 浙江工业大学 一种基于多智能体协作的复杂光照下人脸图像的分类方法
CN110070037B (zh) * 2019-04-22 2022-11-01 深圳力维智联技术有限公司 人脸识别模型的平滑升级方法、装置和可读存储介质
CN110175546B (zh) * 2019-05-15 2022-02-25 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110569390B (zh) * 2019-08-20 2024-01-30 武汉大千信息技术有限公司 基于区分存储介质的海量案件数据高效检索方法
CN112835876B (zh) * 2019-11-25 2023-07-28 深圳云天励飞技术有限公司 一种人脸档案去重方法及相关设备
CN111539285B (zh) * 2020-04-16 2023-06-06 艾特城信息科技有限公司 一种基于特征编码的高效人脸聚类方法
CN111814760B (zh) * 2020-08-24 2021-06-01 湖南视觉伟业智能科技有限公司 人脸识别方法及系统
CN112084366B (zh) * 2020-09-11 2024-04-09 北京百度网讯科技有限公司 用于检索图像的方法、装置、设备以及存储介质
CN112003956B (zh) * 2020-10-27 2021-01-15 武汉中科通达高新技术股份有限公司 一种交管系统
CN112396016B (zh) * 2020-11-26 2021-07-23 武汉宏数信息技术有限责任公司 一种基于大数据技术的人脸识别系统
CN112506959B (zh) * 2020-11-30 2022-11-08 智慧航海(青岛)科技有限公司 智能船舶数据库检索的数据调度方法、装置和检索系统
CN112801144B (zh) * 2021-01-12 2021-09-28 平安科技(深圳)有限公司 资源分配方法、装置、计算机设备及存储介质
CN115129921B (zh) * 2022-06-30 2023-05-26 重庆紫光华山智安科技有限公司 图片检索方法、装置、电子设备和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201894A (zh) * 2007-11-06 2008-06-18 重庆大学 基于网格计算技术的大规模人脸数据库人脸识别方法
CN101446980A (zh) * 2008-12-26 2009-06-03 北京大学 一种基于彩色旋转图像的三维部分形状匹配和检索方法
CN102222092A (zh) * 2011-06-03 2011-10-19 复旦大学 一种MapReduce平台上的海量高维数据聚类方法
CN102831225A (zh) * 2012-08-27 2012-12-19 南京邮电大学 云环境下的多维索引结构、其构建方法及相似性查询方法
US8363961B1 (en) * 2008-10-14 2013-01-29 Adobe Systems Incorporated Clustering techniques for large, high-dimensionality data sets

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8867793B2 (en) * 2010-12-01 2014-10-21 The Trustees Of The University Of Pennsylvania Scene analysis using image and range data
US9087267B2 (en) * 2011-06-10 2015-07-21 Image Vision Labs, Inc. Image scene recognition

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201894A (zh) * 2007-11-06 2008-06-18 重庆大学 基于网格计算技术的大规模人脸数据库人脸识别方法
US8363961B1 (en) * 2008-10-14 2013-01-29 Adobe Systems Incorporated Clustering techniques for large, high-dimensionality data sets
CN101446980A (zh) * 2008-12-26 2009-06-03 北京大学 一种基于彩色旋转图像的三维部分形状匹配和检索方法
CN102222092A (zh) * 2011-06-03 2011-10-19 复旦大学 一种MapReduce平台上的海量高维数据聚类方法
CN102831225A (zh) * 2012-08-27 2012-12-19 南京邮电大学 云环境下的多维索引结构、其构建方法及相似性查询方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于Hadoop平台的失踪乞讨儿童检索系统的设计与实现;陈飞;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130415(第04期);第1、7-8、10、15、19、26-43、53-54页 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9904844B1 (en) 2016-08-04 2018-02-27 International Business Machines Corporation Clustering large database of images using multilevel clustering approach for optimized face recognition process
US9922240B2 (en) 2016-08-04 2018-03-20 International Business Machines Corporation Clustering large database of images using multilevel clustering approach for optimized face recognition process
EP3594877A1 (en) * 2018-07-10 2020-01-15 Masterwork Automodules Tech Corp. Ltd Cash handling system and cash transaction method

Also Published As

Publication number Publication date
CN103235825A (zh) 2013-08-07

Similar Documents

Publication Publication Date Title
CN103235825B (zh) 一种基于Hadoop云计算框架的海量人脸识别搜索引擎设计方法
CN102129451B (zh) 图像检索系统中数据聚类方法
Kim et al. Attribute relationship evaluation methodology for big data security
CN103631909B (zh) 对大规模结构化和非结构化数据联合处理的系统及方法
Choi et al. SPIDER: a system for scalable, parallel/distributed evaluation of large-scale RDF data
CN102915365A (zh) 基于Hadoop的分布式搜索引擎构建方法
CN104112005B (zh) 分布式海量指纹识别方法
Kumar et al. Canopy clustering: a review on pre-clustering approach to k-means clustering
CN104391908B (zh) 一种图上基于局部敏感哈希的多关键字索引方法
Parashar et al. An efficient classification approach for data mining
CN109885650B (zh) 一种外包云环境隐私保护密文排序检索方法
CN110019070A (zh) 一种基于Hadoop的安全日志聚类方法与追责系统
Alsubaiee et al. Asterix: scalable warehouse-style web data integration
CN103761298B (zh) 一种基于分布式架构的实体匹配方法
CN107967331A (zh) 匹配于高性能计算机结构的数据整理方法
Yang et al. Research on distributed Hilbert R tree spatial index based on BIRCH clustering
Kesavan et al. Graph based indexing techniques for big data analytics: a systematic survey
Zhou et al. Multiple features driven author name disambiguation
CN111737490A (zh) 基于银行渠道的知识图谱本体模型生成方法及装置
Sun Knowledge element-based competitive intelligence analytics serving for SWOT situation assessment
CN110990430A (zh) 一种大规模数据并行处理系统
Amin et al. Extracting top-K interesting subgraphs with weighted query semantics
Yang et al. Patent abstract analysis on Chinese big data
JP2020506492A (ja) データ構造を用いた数値情報管理装置
Ganga et al. Performance of Students Evaluation in Education Sector Using Clustering K-Means Algorithms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant