CN112101267B - 一种基于深度学习和哈希编码的快速人脸检索方法 - Google Patents
一种基于深度学习和哈希编码的快速人脸检索方法 Download PDFInfo
- Publication number
- CN112101267B CN112101267B CN202011008141.XA CN202011008141A CN112101267B CN 112101267 B CN112101267 B CN 112101267B CN 202011008141 A CN202011008141 A CN 202011008141A CN 112101267 B CN112101267 B CN 112101267B
- Authority
- CN
- China
- Prior art keywords
- face
- layer
- binary
- cluster
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000013135 deep learning Methods 0.000 title claims abstract description 16
- 230000006870 function Effects 0.000 claims abstract description 36
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 230000004927 fusion Effects 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 74
- 238000013527 convolutional neural network Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 14
- 238000011176 pooling Methods 0.000 claims description 9
- 230000006837 decompression Effects 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000007667 floating Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000013526 transfer learning Methods 0.000 claims description 3
- 238000013139 quantization Methods 0.000 abstract description 7
- 238000003064 k means clustering Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习和哈希编码的快速人脸检索方法,包括人脸特征提取和人脸检索两个阶段。人脸特征提取阶段,通过特征融合和量化损失函数,使得特征提取网络提取到的人脸哈希特征更加具有判别力;人脸检索阶段,利用提取到的人脸哈希特征和聚类算法,实现对人脸的快速检索。
Description
技术领域
本发明涉及图像检索技术领域,具体为一种基于深度学习和哈希编码的快速人脸检索方法。
背景技术
随着大规模图像检索需求的日益增加,为了降低图像检索的空间复杂度与时间复杂度,研究者们在过去十几年提出了很多高效的检索技术,最成功的方法包括基于树结构的图像检索方法、基于哈希的图像检索方法,其中,经典的哈希方法是局部敏感哈希方法和基于向量量化的图像检索方法。相比基于树结构的图像检索方法和基于向量量化的图像检索方法,哈希技术将图像的高维特征保持相似性的映射为紧致的二进制哈希码。由于二进制哈希码在汉明距离计算上的高效性和存储空间上的优势,哈希码在大规模相似图像检索中非常高效。
大规模人脸库的快速检索在人员管理、视频监控等系统中有重要的实用价值,如人员身份验证、嫌疑人轨迹搜索等。人脸库中的人脸图像可能来源于静态的人脸采集,也可能来源于视频监控系统中的动态人脸检测与提取,尤其是后者将导致采集的人脸数量指数增长,形成海量人脸库。对于一张待查询的人脸,如何在海量人脸数据库中迅速的进行检索,并准确的提供与带查询人脸相似度最高的若干人脸结果,是人员管理、视频监控等系统中一个亟待解决的问题。
目前,针对快速人脸检索问题广大学者提出了很多不同的方法,例如:发明专利(申请号:201710703271.7,名称:一种基于深度学习细粒度人脸图像快速检索方法。)提供了一种基于深度学习细粒度人脸图像快速检索方法,通过卷积神经网络提取输入人脸图像的哈希码,通过计算不同哈希码的汉明距离实现快速人脸检索。发明专利(申请号:201810987143.4,名称:一种基于深度学习的快速人脸检索方法。)公开了一种基于深度学习的快速人脸检索方法,利用深度神经网络提取人脸二值特征并结合局部敏感哈希最近邻检索算法,实现了快速高效的人脸检索算法。发明专利(申请号:201811057447.7,名称:一种基于深度特征的大规模人脸检索方法。)公开了一种基于深度特征的大规模人脸检索方法,通过深度特征提取,缓冲消息队列构建,二进制特征压缩,建立多维度信息索引,并进行磁盘数据备份以及高速缓存,通过多维度特征索引以及基于内存的高速缓存进行精准过滤,使得大规模人脸图像数据集检索耗时大幅度降低。发明专利(申请号:201910119779.1,名称:基于k均值聚类算法的人脸识别检索方法。)公开了基于一种k均值聚类算法的人脸识别检索方法使用卷积神经网络从图像库中提取人脸图像的特征向量,建立人物库,每个人物都通过k均值聚类方法计算出该人物对应的中心向量,使用卷积神经网络从待查询图像中提取特征向量,并与人物库中的各中心向量作浮点数精确比对,通过比较结果,确定返回的检索结果。发明专利(申请号:201910270855.9,名称:一种基于深度学习和哈希编码的人脸图像检索方法和装置。)提供一种基于深度学习和哈希编码的人脸图像检索方法和装置,考虑人脸图像的特殊性,减少图像的背景信息对人脸特征的干扰,增强对有区分力的人脸特征的表达,为每一张人脸图像生成具有强区分力的二值哈希码,提高检索速度,降低存储开销,提高检索准确度。
上述提到的基于深度学习和哈希编码的人脸检索方法存在两个问题:1)特征提取阶段的到的特征尺度比较单一,不能很好的表示人脸;2)哈希编码阶段基本上都用了放松策略,不要求在训练阶段就严格生成二值码{-1,+1},放松为可以取-1到+1之间的连续值(相应生成函数处处可导),从而使得网络可以完成训练,然后在最后测试阶段再量化上述连续值特征,得到真正的二值码,这样会引入量化误差,从而导致所生成的图像二值编码及编码网络是次优的。
发明内容
针对上述方法存在的问题,本发明提出了一种基于深度学习和哈希编码的快速人脸检索方法。
一种基于深度学习和哈希编码的快速人脸检索方法,其特征在于,包括如下步骤:
步骤1:人脸特征提取,利用卷积神经网络对人脸样本图像进行训练,得到训练好的人脸特征提取模型W,利用人脸特征提取模型W提取人脸特征,具体为:
步骤1.1:卷积神经网络的构建,在InceptionResnetV2模型的基础上进行修改,包括不同尺度特征融合、哈希层的添加以及损失函数的设计,具体为:
步骤1.1.1:特征融合及降维,对InceptionResnetV2模型的repeat、repeat1以及block8三个层的特征进行融合,通过增加卷积层Conv_a1、Conv_a2、Conv_a3以及池化层MaxPool_a1来对三种特征进行尺寸上的对齐,卷积层Conv_a1与池化层MaxPool_a1将repeat层的特征由35×35×320缩小到8×8×320,卷积Conv_a1的卷积核大小为3,stride为2,padding为1,池化层MaxPool_a1的卷积核大小为3,stride为2,padding为0,卷积层Conv_a2将repeat1层的特征由17×17×1088缩小到8×8×1088,其中,卷积层Conv_a2的卷积核大小为3,stride为2,padding为0,将MaxPool_a1、Conv_a2以及block8三部分的特征进行级联,得到尺寸为8×8×3488的融合特征,利用卷积层Conv_a3对其降维,使用2080个大小为1的卷积核对8×8×3488的融合特征进行卷积操作,stride为1,padding为0,得到尺寸8×8×2080的融合特征;
步骤1.1.2:哈希层的添加,在InceptionResnetV2模型的Logits层后添加哈希层,包括FC层以及Tanh层,其中,FC层的结点数为k,即提取到的人脸哈希特征的维数,Tanh层将输入量化到(-1,1)之间,之后通过sign函数将大于0的值转化为1,小于等于0的值转化为-1,从而实现哈希编码;
步骤1.1.3:损失函数的设计,使用量化损失函数Lq来进行优化,量化损失函数Lq如式(1)所示,此外,Logits层输出的n个值输入分类损失函数Ll中,Ll为交叉熵损失函数,如式(2)所示,在计算交叉熵损失函数之前,首先利用softmax函数将分类网络的输出标准化为概率分布,如式(3)所示,对标签进行one-hot编码,只有真实类别对应的标签值为1,其它类别对应的标签值均为0,损失函数表示为式(4)的形式;
Lq=||H-B||2 (1)
Ll=-log(Pj) (4)
其中,H表示Tanh层输出的k个浮点数组成的向量,B表示经sign函数处理后得到的二进制向量,Pj表示第j个类别的概率,Yj表示第j个类别对应的标签值,Zj表示分类网络输出的对应第j个类别的值,Zm表示分类网络输出的对应第m个类别的值,n为类别数,||H-B||2表示求向量H与向量B的欧几里德距离,e为自然数;
步骤1.2:卷积神经网络的训练,在预训练模型的基础上,使用CASIA-WebFace人脸数据集来进行迁移学习,得到人脸特征提取模型W,其中,训练工具为tensorflow,优化器为SGD;
步骤1.3:人脸特征提取,对于输入卷积神经网络的任意图像I,获取Tanh层输出的k维向量作为人脸特征向量H,经sign函数处理后得到的二进制向量为B={bi|i=1,2,...,k},其中,bi表示二进制人脸特征向量B中的第i个特征值,bi∈{-1,1};
步骤2:人脸检索,利用上述步骤提取到的人脸二进制特征进行人脸快速检索,具体为:
步骤2.1:令海量人脸数据对应的二进制人脸特征向量集合Gb={(pi,Fi)|i=1,2,...,N},其中,pi表示第i个人员的编号,Fi表示编号为i的人员的二进制人脸特征向量,N表示人员数量,利用二进制人脸特征向量对海量人脸数据进行聚类,其步骤如下:
步骤2.2:利用聚类算法将海量人脸数据划分为K个聚类,使得每一个聚类中的二进制人脸特征向量与其所属聚类的聚类中心距离最近,令聚类中心集合Ccluster={Cj|j=1,2,...,K},其中,为第j个聚类的聚类中心,则海量人脸数据对应的二进制人脸特征向量集合其中,表示二进制人脸特征向量集合的第j个聚类,(pi,Fi)(j)表示聚类j中编号为i的人员及其二进制人脸特征向量;
步骤2.3:人脸检索阶段,令任意待检索人脸为Ia,其对应的二进制人脸特征向量Fa={ci|i=1,2,...,k},其中,ci∈{-1,1},遍历聚类中心集合Ccluster,计算二进制人脸特征向量Fa与每一个聚类中心Cj的距离D(Fa,Cj),其中,距离计算如公式(5)所示,令j′=argmin(D(Fa,Cj)),即二进制人脸特征向量Fa与聚类中心集合Ccluster中第j′个聚类中心距离最近;
步骤2.4:遍历第j′个聚类,利用公式(5)计算二进制人脸特征向量Fa与第j′个聚类中的每一个二进制人脸特征向量的距离,得到的二进制人脸特征向量集合Gbf={(pi,Fi)(j′)|i∈[1,N];D(Fa,Fi)<t},其中t表示距离阈值;
步骤2.5:通过步骤2.4即可得到与待检索人脸Ia最为相似的人脸特征向量集合Gbf,并可通过步骤2.4中计算出的距离由小到大的顺序,得到人脸相似度由高到低的顺序。
本发明的有益效果是:
1)利用特征融合的方法,使提取到的人脸特征更加具有判别力;
2)通过增加量化损失函数,可以减少哈希映射时产生的量化误差;
3)通过提取人脸的二进制特征并结合聚类的方法,可以大大加快人脸检索时的速度。
附图说明
图1为本发明一种基于深度学习和哈希编码的网络结构图。
具体实施方式
下面结合附图和实施例,对本发明进行进一步的说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
一种基于深度学习和哈希编码的快速人脸检索方法,其特征在于,包括如下步骤:
步骤1:人脸特征提取,利用卷积神经网络对人脸样本图像进行训练,得到训练好的人脸特征提取模型W,利用人脸特征提取模型W提取人脸特征,具体为:
步骤1.1:卷积神经网络的构建,在InceptionResnetV2模型的基础上进行修改,包括不同尺度特征融合、哈希层的添加以及损失函数的设计,具体为:
步骤1.1.1:特征融合及降维,对InceptionResnetV2模型的repeat、repeat1以及block8三个层的特征进行融合,通过增加卷积层Conv_a1、Conv_a2、Conv_a3以及池化层MaxPool_a1来对三种特征进行尺寸上的对齐,卷积层Conv_a1与池化层MaxPool_a1将repeat层的特征由35×35×320缩小到8×8×320,卷积Conv_a1的卷积核大小为3,stride为2,padding为1,池化层MaxPool_a1的卷积核大小为3,stride为2,padding为0,卷积层Conv_a2将repeat1层的特征由17×17×1088缩小到8×8×1088,其中,卷积层Conv_a2的卷积核大小为3,stride为2,padding为0,将MaxPool_a1、Conv_a2以及block8三部分的特征进行级联,得到尺寸为8×8×3488的融合特征,利用卷积层Conv_a3对其降维,使用2080个大小为1的卷积核对8×8×3488的融合特征进行卷积操作,stride为1,padding为0,得到尺寸8×8×2080的融合特征;
步骤1.1.2:哈希层的添加,在InceptionResnetV2模型的Logits层后添加哈希层,包括FC层以及Tanh层,其中,FC层的结点数为k,本实施例中k取值512,即提取到的人脸哈希特征的维数,Tanh层将输入量化到(-1,1)之间,之后通过sign函数将大于0的值转化为1,小于等于0的值转化为-1,从而实现哈希编码;
步骤1.1.3:损失函数的设计,使用量化损失函数Lq来进行优化,量化损失函数Lq如式(1)所示,此外,Logits层输出的n个值输入分类损失函数Ll中,Ll为交叉熵损失函数,如式(2)所示,在计算交叉熵损失函数之前,首先利用softmax函数将分类网络的输出标准化为概率分布,如式(3)所示,对标签进行one-hot编码,只有真实类别对应的标签值为1,其它类别对应的标签值均为0,损失函数表示为式(4)的形式;
Lq=||H-B||2 (1)
Ll=-log(Pj) (4)
其中,H表示Tanh层输出的k个浮点数组成的向量,B表示经sign函数处理后得到的二进制向量,Pj表示第j个类别的概率,Yj表示第j个类别对应的标签值,Zj表示分类网络输出的对应第j个类别的值,Zm表示分类网络输出的对应第m个类别的值,n为类别数,本实施例中n取值10575,||H-B||2表示求向量H与向量B的欧几里德距离,e为自然数;
步骤1.2:卷积神经网络的训练,在预训练模型的基础上,使用CASIA-WebFace人脸数据集来进行迁移学习,得到人脸特征提取模型W,其中,训练工具为tensorflow,优化器为SGD,本实施例中,初始学习率为0.001,momentum和weight decay分别为0.9和0.0001,迭代次数为100000;
步骤1.3:人脸特征提取,对于输入卷积神经网络的任意图像I,获取Tanh层输出的k维向量作为人脸特征向量H,经sign函数处理后得到的二进制向量为B={bi|i=1,2,...,k},其中,bi∈{-1,1}表示二进制人脸特征向量B中的第i个特征值;
步骤2:人脸检索,利用上述步骤提取到的人脸二进制特征进行人脸快速检索,具体为:
步骤2.1:令海量人脸数据对应的二进制人脸特征向量集合Gb={(pi,Fi)|i=1,2,...,N},其中,pi表示第i个人员的编号,Fi表示编号为i的人员的二进制人脸特征向量,N表示人员数量,利用二进制人脸特征向量对海量人脸数据进行聚类,其步骤如下:
步骤2.2:利用聚类算法将海量人脸数据划分为K个聚类,使得每一个聚类中的二进制人脸特征向量与其所属聚类的聚类中心距离最近,令聚类中心集合Ccluster={Cj|j=1,2,...,K},其中,为第j个聚类的聚类中心,则海量人脸数据对应的二进制人脸特征向量集合其中,表示二进制人脸特征向量集合的第j个聚类,(pi,Fi)(j)表示聚类j中编号为i的人员及其二进制人脸特征向量;
步骤2.3:人脸检索阶段,令任意待检索人脸为Ia,其对应的二进制人脸特征向量Fa={ci|i=1,2,...,k},其中,ci∈{-1,1},遍历聚类中心集合Ccluster,计算二进制人脸特征向量Fa与每一个聚类中心Cj的距离D(Fa,Cj),其中,距离计算如公式(5)所示,令j′=argmin(D(Fa,Cj)),即二进制人脸特征向量Fa与聚类中心集合Ccluster中第j′个聚类中心距离最近;
步骤2.4:遍历第j′个聚类,利用公式(5)计算二进制人脸特征向量Fa与第j′个聚类中的每一个二进制人脸特征向量的距离,得到的二进制人脸特征向量集合Gbf={(pi,Fi)(j′)|i∈[1,N];D(Fa,Fi)<t},其中t表示距离阈值;
步骤2.5:通过步骤2.4即可得到与待检索人脸Ia最为相似的人脸特征向量集合Gbf,并可通过步骤2.4中计算出的距离由小到大的顺序,得到人脸相似度由高到低的顺序。
Claims (1)
1.一种基于深度学习和哈希编码的快速人脸检索方法,其特征在于,包括如下步骤:
步骤1:人脸特征提取,利用卷积神经网络对人脸样本图像进行训练,得到训练好的人脸特征提取模型W,利用人脸特征提取模型W提取人脸特征,具体为:
步骤1.1:卷积神经网络的构建,在InceptionResnetV2模型的基础上进行修改,包括不同尺度特征融合、哈希层的添加以及损失函数的设计,具体为:
步骤1.1.1:特征融合及降维,对InceptionResnetV2模型的repeat、repeat1以及block8三个层的特征进行融合,通过增加卷积层Conv_a1、Conv_a2、Conv_a3以及池化层MaxPool_a1来对三种特征进行尺寸上的对齐,卷积层Conv_a1与池化层MaxPool_a1将repeat层的特征由35×35×320缩小到8×8×320,卷积Conv_a1的卷积核大小为3,stride为2,padding为1,池化层MaxPool_a1的卷积核大小为3,stride为2,padding为0,卷积层Conv_a2将repeat1层的特征由17×17×1088缩小到8×8×1088,其中,卷积层Conv_a2的卷积核大小为3,stride为2,padding为0,将MaxPool_a1、Conv_a2以及block8三部分的特征进行级联,得到尺寸为8×8×3488的融合特征,利用卷积层Conv_a3对其降维,使用2080个大小为1的卷积核对8×8×3488的融合特征进行卷积操作,stride为1,padding为0,得到尺寸8×8×2080的融合特征;
步骤1.1.2:哈希层的添加,在InceptionResnetV2模型的Logits层后添加哈希层,包括FC层以及Tanh层,其中,FC层的结点数为k,即提取到的人脸哈希特征的维数,Tanh层将输入量化到(-1,1)之间,之后通过sign函数将大于0的值转化为1,小于等于0的值转化为-1,从而实现哈希编码;
步骤1.1.3:损失函数的设计,使用量化损失函数Lq来进行优化,量化损失函数Lq如式(1)所示,此外,Logits层输出的n个值输入分类损失函数Ll中,Ll为交叉熵损失函数,如式(2)所示,在计算交叉熵损失函数之前,首先利用softmax函数将分类网络的输出标准化为概率分布,如式(3)所示,对标签进行one-hot编码,只有真实类别对应的标签值为1,其它类别对应的标签值均为0,损失函数表示为式(4)的形式;
Lq=||H-B||2 (1)
Ll=-log(Pj) (4)
其中,H表示Tanh层输出的k个浮点数组成的向量,B表示经sign函数处理后得到的二进制向量,Pj表示第j个类别的概率,Yj表示第j个类别对应的标签值,Zj表示分类网络输出的对应第j个类别的值,Zm表示分类网络输出的对应第m个类别的值,n为类别数,||H-B||2表示求向量H与向量B的欧几里德距离,e为自然数;
步骤1.2:卷积神经网络的训练,在预训练模型的基础上,使用CASIA-WebFace人脸数据集来进行迁移学习,得到人脸特征提取模型W,其中,训练工具为tensorflow,优化器为SGD;
步骤1.3:人脸特征提取,对于输入卷积神经网络的任意图像I,获取Tanh层输出的k维向量作为人脸特征向量H,经sign函数处理后得到的二进制向量为B={bi|i=1,2,...,k},其中,bi表示二进制人脸特征向量B中的第i个特征值,bi∈{-1,1};
步骤2:人脸检索,利用上述步骤提取到的人脸二进制特征进行人脸快速检索,具体为:
步骤2.1:令海量人脸数据对应的二进制人脸特征向量集合Gb={(pi,Fi)|i=1,2,...,N},其中,pi表示第i个人员的编号,Fi表示编号为i的人员的二进制人脸特征向量,N表示人员数量,利用二进制人脸特征向量对海量人脸数据进行聚类,其步骤如下:
步骤2.2:利用聚类算法将海量人脸数据划分为K个聚类,使得每一个聚类中的二进制人脸特征向量与其所属聚类的聚类中心距离最近,令聚类中心集合Ccluster={Cj|j=1,2,...,K},其中,为第j个聚类的聚类中心,则海量人脸数据对应的二进制人脸特征向量集合其中,表示二进制人脸特征向量集合的第j个聚类,(pi,Fi)(j)表示聚类j中编号为i的人员及其二进制人脸特征向量;
步骤2.3:人脸检索阶段,令任意待检索人脸为Ia,其对应的二进制人脸特征向量Fa={ci|i=1,2,...,k},其中,ci∈{-1,1},遍历聚类中心集合Ccluster,计算二进制人脸特征向量Fa与每一个聚类中心Cj的距离D(Fa,Cj),其中,距离计算如公式(5)所示,令j′=argmin(D(Fa,Cj)),即二进制人脸特征向量Fa与聚类中心集合Ccluster中第j′个聚类中心距离最近;
步骤2.4:遍历第j′个聚类,利用公式(5)计算二进制人脸特征向量Fa与第j′个聚类中的每一个二进制人脸特征向量的距离,得到的二进制人脸特征向量集合Gbf={(pi,Fi)(j′)|i∈[1,N];D(Fa,Fi)<t},其中t表示距离阈值;
步骤2.5:通过步骤2.4即可得到与待检索人脸Ia最为相似的人脸特征向量集合Gbf,并可通过步骤2.4中计算出的距离由小到大的顺序,得到人脸相似度由高到低的顺序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011008141.XA CN112101267B (zh) | 2020-09-23 | 2020-09-23 | 一种基于深度学习和哈希编码的快速人脸检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011008141.XA CN112101267B (zh) | 2020-09-23 | 2020-09-23 | 一种基于深度学习和哈希编码的快速人脸检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101267A CN112101267A (zh) | 2020-12-18 |
CN112101267B true CN112101267B (zh) | 2022-04-29 |
Family
ID=73755133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011008141.XA Active CN112101267B (zh) | 2020-09-23 | 2020-09-23 | 一种基于深度学习和哈希编码的快速人脸检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101267B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114022934B (zh) * | 2021-11-04 | 2023-06-27 | 清华大学 | 一种基于多数原则的实时人像聚档方法、系统和介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341178A (zh) * | 2017-05-24 | 2017-11-10 | 北京航空航天大学 | 一种自适应的二进制量化哈希编码方法及装置 |
CN108920720A (zh) * | 2018-07-30 | 2018-11-30 | 电子科技大学 | 基于深度哈希和gpu加速的大规模图像检索方法 |
CN109783667A (zh) * | 2019-01-14 | 2019-05-21 | 西安电子科技大学 | 一种图像存储和检索的方法、客户端及系统 |
CN109947963A (zh) * | 2019-03-27 | 2019-06-28 | 山东大学 | 一种基于深度学习的多尺度哈希检索方法 |
CN110175248A (zh) * | 2019-04-04 | 2019-08-27 | 中国科学院信息工程研究所 | 一种基于深度学习和哈希编码的人脸图像检索方法和装置 |
CN111221993A (zh) * | 2020-01-09 | 2020-06-02 | 山东建筑大学 | 基于深度二值细节感知哈希的可视媒体检索方法 |
CN111241323A (zh) * | 2020-01-09 | 2020-06-05 | 浙江工业大学 | 一种基于深度学习的由粗到精的快速人脸检索方法 |
CN111428073A (zh) * | 2020-03-31 | 2020-07-17 | 新疆大学 | 一种深度监督量化哈希的图像检索方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11556581B2 (en) * | 2018-09-04 | 2023-01-17 | Inception Institute of Artificial Intelligence, Ltd. | Sketch-based image retrieval techniques using generative domain migration hashing |
US20200104721A1 (en) * | 2018-09-27 | 2020-04-02 | Scopemedia Inc. | Neural network image search |
-
2020
- 2020-09-23 CN CN202011008141.XA patent/CN112101267B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107341178A (zh) * | 2017-05-24 | 2017-11-10 | 北京航空航天大学 | 一种自适应的二进制量化哈希编码方法及装置 |
CN108920720A (zh) * | 2018-07-30 | 2018-11-30 | 电子科技大学 | 基于深度哈希和gpu加速的大规模图像检索方法 |
CN109783667A (zh) * | 2019-01-14 | 2019-05-21 | 西安电子科技大学 | 一种图像存储和检索的方法、客户端及系统 |
CN109947963A (zh) * | 2019-03-27 | 2019-06-28 | 山东大学 | 一种基于深度学习的多尺度哈希检索方法 |
CN110175248A (zh) * | 2019-04-04 | 2019-08-27 | 中国科学院信息工程研究所 | 一种基于深度学习和哈希编码的人脸图像检索方法和装置 |
CN111221993A (zh) * | 2020-01-09 | 2020-06-02 | 山东建筑大学 | 基于深度二值细节感知哈希的可视媒体检索方法 |
CN111241323A (zh) * | 2020-01-09 | 2020-06-05 | 浙江工业大学 | 一种基于深度学习的由粗到精的快速人脸检索方法 |
CN111428073A (zh) * | 2020-03-31 | 2020-07-17 | 新疆大学 | 一种深度监督量化哈希的图像检索方法 |
Non-Patent Citations (2)
Title |
---|
基于二进制哈希与空间金字塔的视觉词袋模型生成方法;彭天强等;《计算机工程》;20161215(第12期);全文 * |
基于深度学习哈希算法的快速图像检索研究;李泗兰等;《计算机与数字工程》;20191220(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112101267A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110298037B (zh) | 基于增强注意力机制的卷积神经网络匹配的文本识别方法 | |
CN110969020B (zh) | 基于cnn和注意力机制的中文命名实体识别方法、系统及介质 | |
CN110275936B (zh) | 一种基于自编码神经网络的相似法律案例检索方法 | |
CN105469096B (zh) | 一种基于哈希二值编码的特征袋图像检索方法 | |
CN110222218B (zh) | 基于多尺度NetVLAD和深度哈希的图像检索方法 | |
CN113918753B (zh) | 基于人工智能的图像检索方法及相关设备 | |
CN112036511B (zh) | 基于注意力机制图卷积神经网络的图像检索方法 | |
CN112231477A (zh) | 一种基于改进胶囊网络的文本分类方法 | |
CN112633051A (zh) | 一种基于图像搜索的在线人脸聚类方法 | |
CN111984791A (zh) | 一种基于注意力机制的长文分类方法 | |
CN110852152A (zh) | 一种基于数据增强的深度哈希行人重识别方法 | |
CN112163114B (zh) | 一种基于特征融合的图像检索方法 | |
CN115186673A (zh) | 科技信息管理系统及其管理方法 | |
CN115048464A (zh) | 用户操作行为数据的检测方法、装置及电子设备 | |
CN113836896A (zh) | 一种基于深度学习的专利文本摘要生成方法和装置 | |
CN112256727A (zh) | 基于人工智能技术的数据库查询处理及优化方法 | |
Huang et al. | Supervised contrastive learning based on fusion of global and local features for remote sensing image retrieval | |
CN112101267B (zh) | 一种基于深度学习和哈希编码的快速人脸检索方法 | |
Shen et al. | Equiangular basis vectors | |
CN116385946B (zh) | 面向视频的目标片段定位方法、系统、存储介质及设备 | |
CN112084353A (zh) | 一种快速陆标-卷积特征匹配的词袋模型方法 | |
CN111241323A (zh) | 一种基于深度学习的由粗到精的快速人脸检索方法 | |
Ghansah et al. | A Discriminative locality-sensitive dictionary learning with kernel weighted KNN classification for video semantic concepts analysis | |
CN113657443A (zh) | 一种基于soinn网络的在线物联网设备识别方法 | |
Pipanmekaporn et al. | Spatial Pyramid Attention Enhanced Visual Descriptors for Landmark Retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Fast Face Retrieval Method Based on Deep Learning and Hash Encoding Effective date of registration: 20231127 Granted publication date: 20220429 Pledgee: Zhejiang Lishui Liandu Rural Commercial Bank Co.,Ltd. Pledgor: ZHEJIANG HAOTENG ELECTRON TECHNOLOGY CO.,LTD. Registration number: Y2023980067610 |