CN112818859B - 一种基于深度哈希的多级检索行人重识别方法 - Google Patents

一种基于深度哈希的多级检索行人重识别方法 Download PDF

Info

Publication number
CN112818859B
CN112818859B CN202110141536.5A CN202110141536A CN112818859B CN 112818859 B CN112818859 B CN 112818859B CN 202110141536 A CN202110141536 A CN 202110141536A CN 112818859 B CN112818859 B CN 112818859B
Authority
CN
China
Prior art keywords
hash
network
retrieval
training
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110141536.5A
Other languages
English (en)
Other versions
CN112818859A (zh
Inventor
李建清
彭冠兰
王宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110141536.5A priority Critical patent/CN112818859B/zh
Publication of CN112818859A publication Critical patent/CN112818859A/zh
Application granted granted Critical
Publication of CN112818859B publication Critical patent/CN112818859B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • G06F16/784Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Abstract

本发明公开了一种基于深度哈希的行人重识别方法,加载输入行人图像;训练特征提取网络;构造多级哈希训练网络,分别输出实值特征和多个哈希编码;为特征提取网络的训练设计基于余弦相似度的三元组losst和用于分类的交叉熵lossc,为哈希网络的训练设计三元组loss;输入测试集图像,获取哈希网络的多级输出,二值化后存储为哈希库;输入一张图像,根据哈希码的长度,由短到长依次检索哈希库,逐步缩小检索范围,最后使用实值特征对检索到的图像按照余弦相似度排序,并返回最相似样本。本发明采用多级哈希检索,能够训练检索精度更高的哈希码,通过逐步缩小检索范围的方法,将检索过程的计算量进一步减小,可以实现更快速的检索速度。

Description

一种基于深度哈希的多级检索行人重识别方法
技术领域
本发明涉及一种基于深度哈希多级检索的行人重识别方法,用于实现更快速的检索速度。
背景技术
行人重识别,又称行人再识别、Person Re-identification,简称为ReID,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,被广泛认为是图像检索的一个子问题。其主要工作就是给定一个监控行人图像,检索不同位置不同监控设备下的该行人图像。目前的行人重识别方法使用深度神经网络对行人图像进行特征提取,再进行特征相似度计算和排序。近些年来,随着行人重识别的研究逐渐深入,不少方法在公开数据集上都取得了不错的效果,但由于实值特征数据的计算复杂度高的问题,在面对海量数据时,检索效率很难满足实时处理需求。
深度哈希检索是使用深度卷积神经网络(DCNN)对图像进行哈希编码的技术,其目的在于对图像库中的图像进行哈希编码,使得拥有相同标签的图像在汉明空间中距离较近、拥有不同标签的图像在汉明空间中距离较远,这种方法的优势是计算复杂度小,可以快速完成特征的检索匹配,但相对实值特征检索精度较差;若是首先通过哈希码进行一次检索,缩小检索范围,再用实值特征进行二次精确检索,这样能在加快检索速度的同时又不损害检索精度。但这种方式在哈希码检索精度不高、范围较大的情况下,检索效率依然不够。
发明内容
本发明针对现有技术的不足,提供一种基于深度哈希多级检索的行人重识别方法,能够训练检索精度更高的哈希码,提供更快速的检索速度。
为了解决上述技术问题,本发明通过以下方式来实现:
一种基于深度哈希的多级检索行人重识别方法,具体包括以下步骤:
S1、加载训练图像,并对图像进行数据增强后,以一定形式送入网络;
S2、使用在ImageNet数据集上预训练好的ResNet50网络作为基网络,构造多级哈希训练网络,分别输出实值特征和多个哈希编码;
S3、为特征提取网络的训练设计基于余弦相似度的三元组losst和用于分类的交叉熵lossc,为哈希网络的训练设计三元组loss;
S4、将图像送入网络进行训练,在测试集上对训练好的网络进行测试,比较哈希检索及实值特征检索的计算速度。
进一步地,所述步骤S1具体方法是:加载训练图像,训练图像的数据集包含N个不同人(即N个类别)图像的训练集,M个不同人(即M个类别)图像的测试集,每个人包含最多K个不同摄像头拍摄的图像,并对图像进行水平翻转、裁切、擦除、色彩抖动操作以对数据增强;每次从数据集中任意挑选n1个人,每人任意挑选n2张图像送入网络。
进一步地,所述步骤S2包括以下子步骤:
S21、使用在Imagenet数据集上预训练好的Resnet50网络作为基网络,去掉最后的全连接层后接上一层2048维的全连接层fc1,并将fc1层的输出进行L2范数归一化处理输出实值特征;将输入的图像水平翻转再输入特征提取网络,得到的特征与翻转前的特征相加进行L2范数归一化处理,输出融合实值特征;在fc1层后接上N维的全连接层作为分类层fc2,分类层fc2以softmax为激活函数,其中L2范数归一化处理公式如下:
Figure BDA0002928807500000021
X=(x1,x2,x3,...,xi) (2)
其中X为i维向量,XL2为X经过L2范数归一化处理的结果;
S22、在fc1层之后,加上三层并联的一维卷积层h1、h2、h3,卷积核个数为hash码长度,采用分组卷积方式,分组数为hash码长度,以tanh作为激活函数。
进一步地,所述步骤S3包括以下子步骤:
S31、为特征提取网络的训练设计基于余弦相似度的三元组losst,对于fc1层输出的实值特征,首先一个batch中的每一张照片(称为anchor),挑选一张特征的余弦相似度最小的同类图(positive),再挑选一张特征的余弦相似度最大的异类图(negative),按照如下公式计算:
losst=max(Sap-San+m,0) (3)
其中Sap为同一人的两张图像间的余弦相似度,即anchor与positive的余弦相似度,San为不同两个人的两张图像间的余弦相似度,即anchor与negative的余弦相似度,m为期望的Sap和San间差距的阈值margin;
S32、为特征提取网络的训练设计用于分类的交叉熵lossc,对每一张输入的图像,根据特征提取网络对该图像分类的正确性,按照如下公式计算:
Figure BDA0002928807500000031
其中yi为0或1,当i为该图像类别标签时,yi为1;pi为网络预测该输入图像的类别为i的概率,将losst和lossc加起来,作为特征提取网络的最终loss;
S33、为哈希网络h1、h2、h3的训练设计三元组loss,按照如下公式对h1、h2、h3层分别计算loss:
Figure BDA0002928807500000032
Figure BDA0002928807500000033
losshash=losshasp-ap+losshash-an (7)
其中yai为选定anchor输出的哈希码的第i位,ypi为选定positive输出的哈希码的第i位,yaj为选定anchor输出的哈希码的第j位,ypj为选定negative输出的哈希码的第j位,bits为该哈希网络输出的哈希码位数。
进一步地,所述步骤S4包括以下子步骤:
S41、对包含M个不同人图像的测试集,为每个人在不同摄像头的图像中各抽取一张作为query用于检索,剩下的作为gallery用于被检索;
S42、使用query中的一张图像,送入网络测试得到实值特征和哈希码,在gallery中进行检索并排除与检索图像为同一人且同一摄像头的图像,使用哈希码作为初步筛选,并根据需要使用从短到长的多级哈希码分步检索,逐级减少检索范围,然后使用最终实值特征将检索结果按相似度由高到低排列;将多级哈希检索与单级哈希检索及实值特征检索的速度进行比较,并对不同位的哈希码使用rank1、rank5、rank20、mAP作为检索效果的验证指标。
与现有技术相比,本发明具有的有益效果:
本发明使用多级哈希检索,能够训练检索精度更高的哈希码,通过逐步缩小检索范围的方法,将检索过程的计算量进一步减小,可以实现更快速的检索速度;对哈希网络的训练关注正负号,同号的数量而非强制哈希网络输出贴近1和-1,让哈希网络的输出具有更好的表达性。
附图说明
图1为本发明所用的深度神经网络结构图。
具体实施方式
下面结合附图和具体实施例对本发明的具体实施方式作进一步详细的说明。
如图1所示,一种基于深度哈希的多级检索行人重识别方法,具体包括以下步骤:
S1、加载训练图像,训练图像的数据集包含N个不同人(即N个类别)图像的训练集,M个不同人(即M个类别)图像的测试集,每个人包含最多K个不同摄像头拍摄的图像,并对图像进行水平翻转、裁切、擦除、色彩抖动操作以对数据增强;每次从数据集中任意挑选n1个人,每人任意挑选n2张图像送入网络。
S2、使用在ImageNet数据集上预训练好的ResNet50网络作为基网络,构造多级哈希训练网络,分别输出实值特征和多个哈希编码,具体包括以下子步骤:
S21、使用在Imagenet数据集上预训练好的Resnet50网络作为基网络,去掉最后的全连接层后接上一层2048维的全连接层fc1,并将fc1层的输出进行L2范数归一化处理输出实值特征;将输入的图像水平翻转再输入特征提取网络,得到的特征与翻转前的特征相加进行L2范数归一化处理,输出融合实值特征;在fc1层后接上N维的全连接层作为分类层fc2,分类层fc2以softmax为激活函数,Resnet50到fc2为特征提取网络,其中L2范数归一化处理公式如下:
Figure BDA0002928807500000041
X=(x1,x2,x3,...,xi) (2)
其中X为i维向量,XL2为X经过L2范数归一化处理的结果;
Imagenet是一个包含2万多个类别,共有1400多万张图像的数据集,是目前深度学习图像领域最大的数据集,也是检验算法性能的标准数据集,Resnet50网络是深度卷积神经网络,本发明使用在Imagenet上预训练好的Resnet50网络作为基网络,实值特征用于计算特征提取网络的losst,融合实值特征用于检索和作为哈希网络的输入。
S22、在fc1层之后,加上三层并联的一维卷积层h1、h2、h3,卷积核个数为hash码长度,采用分组卷积方式,分组数为hash码长度,以tanh作为激活函数。
h1、h2、h3作为哈希网络的作用是,将特征映射到(-1,1)的区间,小于0的输出取0,大于0的输出取1,最终得到只含有0和1的二进制哈希特征。将一张图像和其水平翻转的图像输入特征提取网络,将得到的两个实值特征相加,并进行L2范数归一化,得到该图片最终的融合实值特征,将融合实值特征作为哈希网络的输入。
S3、为特征提取网络的训练设计基于余弦相似度的三元组losst和用于分类的交叉熵lossc,为哈希网络的训练设计三元组loss,具体包括以下子步骤:
S31、为特征提取网络的训练设计基于余弦相似度的三元组losst,对于fc1层输出的实值特征,首先一个batch中的每一张照片(称为anchor),挑选一张特征的余弦相似度最小的同类图(positive),再挑选一张特征的余弦相似度最大的异类图(negative),按照如下公式计算:
losst=max(Sap-San+m,0) (3)
其中Sap为同一人的两张图像间的余弦相似度,即anchor与positive的余弦相似度。San为不同两个人的两张图像间的余弦相似度,即anchor与negative的余弦相似度。m为期望的Sap和San间差距的阈值margin;
S32、为特征提取网络的训练设计用于分类的交叉熵lossc,对每一张输入的图像,根据特征提取网络对该图像分类的正确性,按照如下公式计算:
Figure BDA0002928807500000051
其中yi为0或1,当i为该图像类别标签时,yi为1,pi为网络预测该输入图像的类别为i的概率,将losst和lossc加起来,作为特征提取网络的最终loss;
S33、为哈希网络h1、h2、h3的训练设计三元组loss,考虑到二值化结果只和哈希网络输出的正负有关,按照如下公式对h1、h2、h3层分别计算loss:
Figure BDA0002928807500000052
Figure BDA0002928807500000053
losshash=losshash-ap+losshash-an (7)
其中yai为选定anchor输出的哈希码的第i位,ypi为选定positive输出的哈希码的第i位,yaj为选定anchor输出的哈希码的第j位,ypj为选定negative输出的哈希码的第j位,bits为该哈希网络输出的哈希码位数。α的作用是让输出偏离0附近,哈希网络的loss由两部分组成,losshash-ap的作用是让同一个人两张照片的哈希码中正负不同号的位数尽可能少,losshash-an的作用是让不同人两张照片的哈希码同号的位数尽可能少。
S4、将图像送入网络进行训练,在测试集上对训练好的网络进行测试,比较哈希检索及实值特征检索的计算速度,具体包括以下子步骤:
S41、对包含M个不同人图像的测试集,为每个人在不同摄像头的图像中各抽取一张作为query用于检索,剩下的作为gallery用于被检索;
S42、使用query中的一张图像,送入网络测试得到实值特征和哈希码,在gallery中进行检索并排除与检索图像为同一人且同一摄像头的图像,使用哈希码作为初步筛选,并根据需要使用从短到长的多级哈希码分步检索,逐级减少检索范围,然后使用最终实值特征将检索结果按相似度由高到低排列;将多级哈希检索与单级哈希检索及实值特征检索的速度进行比较,并对不同位的哈希码使用rank1、rank5、rank20、mAP作为检索效果的验证指标。
其中rankn的意思是使用query检索出的图像按照哈希码的汉明距离从小到大排序,前n张中如果有一张与query为同一个人,则视为命中,统计query中所有图像检索结果的rankn命中率取平均。mAP就是图像检索通用评价指标,用于计算所有query中图像的平均检索精度。
本发明的具体模型应用实例:
本实例基于深度学习框架Pytorch,机器GPU为1060,CPU为AMD Ryzen 5 2600六核,数据集包含1501个不同的人,即类别为1501类,其中训练集751类,包含12936张图像,验证集750类,包含19732张图像,输入神经网络的图像尺寸为256*128。
实验所用数据集为Market-1501。Market-1501数据集是在清华大学校园中采集,在2015年构建并公开,它包括由6个摄像头(其中5个高清摄像头和1个低清摄像头)拍摄到的1501个行人、32668个检测到的行人矩形框。每个行人至少由2个摄像头捕获到,并且在一个摄像头中可能具有多张图像。训练集有751人,包含12,936张图像,平均每个人有17.2张训练数据;测试集有750人,包含19,732张图像,平均每个人有26.3张测试数据。训练集和测试集行人是不重复的。
测试方法:为每个人在不同摄像头中的图像中各抽取一张作为query图像用于检索,共有3,368张图像,剩下的作为gallery用于被检索,检索时在gallery中排除与检索图像为同一人且同一摄像头的图像,统计所有query中图像的检索效果,计算总体检索效果。
具体的方法步骤如下:
加载训练集时,对图像进行水平翻转、裁切、擦除、色彩抖动等操作进行数据增强。将训练集以每个batch任意选择20个人,每个人任意选择4张图像的方式输入网络。首先冻结哈希网络的参数,使用特征提取网络输出的实值特征计算三元组损失(losst),使用特征提取网络分类层的分类结果计算交叉熵损失(lossc),将两个loss相加作为特征提取网络的最终loss,利用梯度下降法进行反向传播训练特征提取网络200个epoch。然后将特征提取网络的参数冻结,使用3个哈希层的输出分别计算losshash,训练哈希网络200个epoch。使用训练好的模型在测试集上进行测试,通过rank1、rank5、rank20、mAP验证哈希码的效果,通过不同级检索消耗的时间验证多级检索的效果。
为了比较本文方法训练的哈希码检索效果,与目前一些表现效果较好的哈希模型及其他专利的效果比较。比较结果如下:
表1:与其他哈希模型和专利在2048bits长度的哈希码上的检索效果比较
Figure BDA0002928807500000071
表2:和其他哈希模型及专利在不同长度的哈希码上的检索效果比较
Figure BDA0002928807500000072
为了验证多级检索的效果,使用本方法训练的特征提取网络和三级哈希网络,在检索结果mAP相近(即检索效果不受到太大影响)的情况下,在cpu上比较了只使用图像融合实值特征直接检索的速度、使用单哈希码+融合融合实值特征的检索速度、使用多级哈希码+融合实值特征的检索速度比较。
表3:多级哈希检索与单级检索在Market1501数据集上的检索速度比较
检索方式 消耗时间 mAP(%)
仅实值特征 929.3s 73.9%
512bits哈希码+实值特征 118.8s 72.9%
64bits哈希码+实值特征 66.6s 71.8%
16bits哈希码+实值特征 248.6s 72.7%
16+64+512bits哈希+实值特征 33.4s 72.4%
从表1表2的结果可以看到,本发明训练的不同长度的哈希码的检索效果相较于之前的方法均有不小提升,本发明在特征提取阶段结合了三元组loss和交叉熵loss,提取了较好的实值特征,又使用只关注输出正负的三元组loss训练哈希网络,让训练出的哈希值具有更好的表达性,取得了更高的检索精度。从表3的结果可以看出,使用多级哈希检索在对检索精度无较大影响的情况下,拥有更快的检索速度。
本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (4)

1.一种基于深度哈希的多级检索行人重识别方法,其特征在于:具体包括以下步骤:
S1、加载训练图像,并对图像进行数据增强后,以一定形式送入网络;
S2、使用在ImageNet数据集上预训练好的ResNet50网络作为基网络,构造多级哈希训练网络,分别输出实值特征和多个哈希编码;
S3、为特征提取网络的训练设计基于余弦相似度的三元组losst和用于分类的交叉熵lossc,为哈希网络的训练设计三元组loss;
S4、将图像送入网络进行训练,在测试集上对训练好的网络进行测试,比较哈希检索及实值特征检索的计算速度;
所述步骤S2包括以下子步骤:
S21、使用在Imagenet数据集上预训练好的Resnet50网络作为基网络,去掉最后的全连接层后接上一层2048维的全连接层fc1,并将fc1层的输出进行L2范数归一化处理输出实值特征;将输入的图像水平翻转再输入特征提取网络,得到的特征与翻转前的特征相加进行L2范数归一化处理,输出融合实值特征;在fc1层后接上N维的全连接层作为分类层fc2,分类层fc2以softmax为激活函数,其中L2范数归一化处理公式如下:
Figure FDA0003633978480000011
X=(x1,x2,x3,...,xi) (2)
其中X为i维向量,XL2为X经过L2范数归一化处理的结果;
S22、在fc1层之后,加上三层并联的一维卷积层h1、h2、h3,卷积核个数为hash码长度,采用分组卷积方式,分组数为hash码长度,以tanh作为激活函数。
2.如权利要求1所述的一种基于深度哈希的多级检索行人重识别方法,其特征在于:
所述步骤S1具体方法是:加载训练图像,训练图像的数据集包含N个不同人图像的训练集,M个不同人图像的测试集,每个人包含最多K个不同摄像头拍摄的图像,并对图像进行水平翻转、裁切、擦除、色彩抖动操作以对数据增强;每次从数据集中任意挑选n1个人,每人任意挑选n2张图像送入网络。
3.如权利要求1所述的一种基于深度哈希的多级检索行人重识别方法,其特征在于:
所述步骤S3包括以下子步骤:
S31、为特征提取网络的训练设计基于余弦相似度的三元组losst,对于fc1层输出的实值特征,首先一个batch中的每一张照片,挑选一张特征的余弦相似度最小的同类图,再挑选一张特征的余弦相似度最大的异类图按照如下公式计算:
losst=max(Sap-San+m,0) (3)
其中Sap为同一人的两张图像间的余弦相似度,anchor与positive的余弦相似度,San为不同两个人的两张图像间的余弦相似度,anchor与negative的余弦相似度,m为期望的Sap和San间差距的阈值margin;
S32、为特征提取网络的训练设计用于分类的交叉熵lossc,对每一张输入的图像,根据特征提取网络对该图像分类的正确性,按照如下公式计算:
Figure FDA0003633978480000021
其中yi为0或1,当i为该图像类别标签时,yi为1,pi为网络预测该输入图像的类别为i的概率,将losst和lossc加起来,作为特征提取网络的最终loss;
S33、为哈希网络h1、h2、h3的训练设计三元组loss,按照如下公式对h1、h2、h3层分别计算loss:
Figure FDA0003633978480000022
Figure FDA0003633978480000023
losshash=losshash-ap+losshash-an (7)
其中yai为选定anchor输出的哈希码的第i位,ypi为选定positive输出的哈希码的第i位,yaj为选定anchor输出的哈希码的第j位,ypj为选定negative输出的哈希码的第j位,bits为该哈希网络输出的哈希码位数,α的作用是让输出偏离0附近。
4.如权利要求1所述的一种基于深度哈希的多级检索行人重识别方法,其特征在于:
所述步骤S4包括以下子步骤:
S41、对包含M个不同人图像的测试集,为每个人在不同摄像头的图像中各抽取一张作为query用于检索,剩下的作为gallery用于被检索;
S42、使用query中的一张图像,送入网络测试得到实值特征和哈希码,在gallery中进行检索并排除与检索图像为同一人且同一摄像头的图像,使用哈希码作为初步筛选,并根据需要使用从短到长的多级哈希码分步检索,逐级减少检索范围,然后使用最终实值特征将检索结果按相似度由高到低排列;将多级哈希检索与单级哈希检索及实值特征检索的速度进行比较,并对不同位的哈希码使用rank1、rank5、rank20、mAP作为检索效果的验证指标。
CN202110141536.5A 2021-02-02 2021-02-02 一种基于深度哈希的多级检索行人重识别方法 Active CN112818859B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110141536.5A CN112818859B (zh) 2021-02-02 2021-02-02 一种基于深度哈希的多级检索行人重识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110141536.5A CN112818859B (zh) 2021-02-02 2021-02-02 一种基于深度哈希的多级检索行人重识别方法

Publications (2)

Publication Number Publication Date
CN112818859A CN112818859A (zh) 2021-05-18
CN112818859B true CN112818859B (zh) 2022-06-24

Family

ID=75861580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110141536.5A Active CN112818859B (zh) 2021-02-02 2021-02-02 一种基于深度哈希的多级检索行人重识别方法

Country Status (1)

Country Link
CN (1) CN112818859B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116108217B (zh) * 2022-10-27 2023-12-19 浙江大学 一种基于深度哈希编码和多任务预测的逃费车辆相似图片检索方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682233A (zh) * 2017-01-16 2017-05-17 华侨大学 一种基于深度学习与局部特征融合的哈希图像检索方法
CN107092661A (zh) * 2017-03-28 2017-08-25 桂林明辉信息科技有限公司 一种基于深度卷积神经网络的图像检索方法
CN109241313A (zh) * 2018-08-14 2019-01-18 大连大学 一种基于高阶深度哈希学习的图像检索方法
CN110046579A (zh) * 2019-04-18 2019-07-23 重庆大学 一种深度哈希的行人再识别方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015152876A1 (en) * 2014-03-31 2015-10-08 Empire Technology Development Llc Hash table construction for utilization in recognition of target object in image
US9978344B2 (en) * 2015-12-17 2018-05-22 Vmware, Inc. Application/window aware image caching system
US20190034497A1 (en) * 2017-07-27 2019-01-31 Nec Laboratories America, Inc. Data2Data: Deep Learning for Time Series Representation and Retrieval
CN108108699A (zh) * 2017-12-25 2018-06-01 重庆邮电大学 融合深度神经网络模型和二进制哈希的人体动作识别方法
CN108427729A (zh) * 2018-02-23 2018-08-21 浙江工业大学 一种基于深度残差网络与哈希编码的大规模图片检索方法
CN109165306B (zh) * 2018-08-09 2021-11-23 长沙理工大学 基于多任务哈希学习的图像检索方法
CN111414451A (zh) * 2020-02-27 2020-07-14 中国平安财产保险股份有限公司 信息识别方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682233A (zh) * 2017-01-16 2017-05-17 华侨大学 一种基于深度学习与局部特征融合的哈希图像检索方法
CN107092661A (zh) * 2017-03-28 2017-08-25 桂林明辉信息科技有限公司 一种基于深度卷积神经网络的图像检索方法
CN109241313A (zh) * 2018-08-14 2019-01-18 大连大学 一种基于高阶深度哈希学习的图像检索方法
CN110046579A (zh) * 2019-04-18 2019-07-23 重庆大学 一种深度哈希的行人再识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种改进的二进制哈希编码方法;江泽涛;《万方数据》;20190625;第462-469页 *
基于深层特征融合的行人重识别方法;熊炜;《万方数据》;20200325;第358-364页 *

Also Published As

Publication number Publication date
CN112818859A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN110084151B (zh) 基于非局部网络深度学习的视频异常行为判别方法
WO2017012277A1 (zh) 一种图像中目标的检索方法和装置
CN105808709B (zh) 人脸识别快速检索方法及装置
CN107392241B (zh) 一种基于加权列抽样XGBoost的图像目标分类方法
WO2019179403A1 (zh) 基于序列宽深学习的欺诈交易检测方法
CN109871749B (zh) 一种基于深度哈希的行人重识别方法和装置、计算机系统
CN110929848B (zh) 基于多挑战感知学习模型的训练、跟踪方法
CN111798312A (zh) 一种基于孤立森林算法的金融交易系统异常识别方法
CN111898689A (zh) 一种基于神经网络架构搜索的图像分类方法
CN110852152B (zh) 一种基于数据增强的深度哈希行人重识别方法
CN103020321B (zh) 近邻搜索方法与系统
CN111008224B (zh) 一种基于深度多任务表示学习的时间序列分类和检索方法
CN113806580B (zh) 基于层次语义结构的跨模态哈希检索方法
CN110008699B (zh) 一种基于神经网络的软件漏洞检测方法及装置
CN104731882A (zh) 一种基于哈希编码加权排序的自适应查询方法
CN111832650A (zh) 基于生成对抗网络局部聚合编码半监督的图像分类方法
CN112818790A (zh) 一种基于注意力机制与空间几何约束的行人重识别方法
CN112308235A (zh) 一种时间序列数据流异常检测方法
CN112818859B (zh) 一种基于深度哈希的多级检索行人重识别方法
CN108805280B (zh) 一种图像检索的方法和装置
CN111797177A (zh) 一种用于异常金融账号检测的金融时间序列分类方法及应用
CN116192537B (zh) 一种apt攻击报告事件抽取方法、系统和存储介质
CN109376964B (zh) 一种基于记忆神经网络的刑事案件罪名预测方法
CN113590867B (zh) 基于分层度量学习的跨模态信息检索方法
CN113032612B (zh) 一种多目标图像检索模型的构建方法及检索方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant