CN113449671A - 一种多尺度多特征融合的行人重识别方法及装置 - Google Patents

一种多尺度多特征融合的行人重识别方法及装置 Download PDF

Info

Publication number
CN113449671A
CN113449671A CN202110776004.9A CN202110776004A CN113449671A CN 113449671 A CN113449671 A CN 113449671A CN 202110776004 A CN202110776004 A CN 202110776004A CN 113449671 A CN113449671 A CN 113449671A
Authority
CN
China
Prior art keywords
pedestrian
layer
training
loss function
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110776004.9A
Other languages
English (en)
Inventor
刘丽
李曦
雷雪梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Beijing USTB
Original Assignee
University of Science and Technology Beijing USTB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Beijing USTB filed Critical University of Science and Technology Beijing USTB
Priority to CN202110776004.9A priority Critical patent/CN113449671A/zh
Publication of CN113449671A publication Critical patent/CN113449671A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及行人识别技术领域,特别是指一种多尺度多特征融合的行人重识别方法及装置,所述方法包括:将待识别图像输入预先训练好的行人重识别模型中,行人重识别模型包括特征提取层、嵌入层;其中,特征提取层设置三个分支;通过特征提取层的三个分支,得到三个不同尺度的特征图;根据嵌入层预先设置的分割数目,分别对三个特征图进行分割,得到三组分割后的局部特征图,对每组局部特征图分别进行拼接,得到多个特征张量;通过GMP、GAP、卷积层、批处理归一化层及ReLU激活函数,将多个特征张量转化为一维向量;通过一维向量分别与多个待检测图像的一维向量的相似度,确定待识别图像对应的识别结果。采用本发明,可以提高行人重识别的准确率和效率。

Description

一种多尺度多特征融合的行人重识别方法及装置
技术领域
本发明涉及行人识别技术领域,特别是指一种多尺度多特征融合的行人重识别方法及装置。
背景技术
行人重识别,是指在给定一张行人图像或一个视频序列后,利用图像或视频中的一系列特征,如体型、穿着、姿态等信息,从其他包含大量行人数据的数据库中准确匹配到属于待检索行人的视频图像。
行人重识别方法主要分为传统的方法以及基于深度学习的方法。在传统的处理方法中,需要人为设计不同的特征提取方法以及选取合适的距离度量方式进行行人重识别。然而,传统方法更多的是捕获更底层的视觉信息,在行人视频图像存在严重的环境、光照变化的情况下,容易出现失误。
基于深度学习的方法则是将对视频图像的一系列操作整合到了一个完整的框架中。作为一种端到端的方法,基于深度学习的行人重识别算法采用多层非线性结构来挖掘更高层的视觉信息,能够在复杂的光照条件下仍然保持良好的重识别结果,因此成为了目前行人重识别研究中的主流方法。在行人重识别过程中,全局特征以及局部特征对实现更准确的行人匹配有着不同的意义。全局特征能够获得更加宏观的特征信息,与之相对的,局部特征则更加关注细节上的特征信息。然而,目前常见的利用局部特征进行行人重识别的方法容易人为的割裂不同区域的潜在联系,从而导致识别准确率低。常见的基于局部特征的行人重识别方法,如基于局部特征提取(Part-based Convolutional Baseline,PCB)。多粒度网络(Multiple Granularity Network,MGN)虽然充分地利用了PCB优势,但是并没有考虑到不同的局部区域间的内在关系。如图1所示,一个行人图像中特别是位于上半部分的局部区域之间很明显存在相似的特征信息,有很强的相关性,应将其作为一个整体用于行人重识别,但是PCB重识别方法将其视为两个毫不相关部分,对其分别进行处理,从而影响了行人重识别性能。同时,PCB方法专注于利用单一尺度的特征图获得局部特征信息,没有考虑到不同尺度的特征图拼接能够获取更加丰富的特征信息。
发明内容
本发明实施例提供了一种多尺度多特征融合的行人重识别方法及装置。所述技术方案如下:
一方面,提供了一种多尺度多特征融合的行人重识别方法,该方法应用于电子设备,该方法包括:
将待识别图像输入预先训练好的行人重识别模型中,所述行人重识别模型包括特征提取层、嵌入层、全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及激活函数;其中,所述特征提取层设置三个分支,所述嵌入层中预先存储有对每个分支设置的分割数目;
通过所述特征提取层的三个分支,得到三个不同尺度的特征图;
根据所述嵌入层预先设置的分割数目,分别对三个特征图进行分割,得到三组分割后的局部特征图,对每组局部特征图分别进行拼接,得到多个特征张量;
通过所述全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及线性整流ReLU激活函数,将所述多个特征张量转化为一维向量;
将得到的一维向量进行拼接,获取多个待检测图像对应的一维向量,计算所述待识别图像的一维向量分别与所述多个待检测图像的一维向量的相似度,根据得到的多个相似度,确定所述待识别图像对应的待检测图像。
可选地,所述特征提取层的结构包括:
所述特征提取层的前三层完全继承Resnet-50网络的前三层结构,所述三个分支中,第一个分支的结构与Resnet-50网络的第四层以及第五层结构相同,第二个分支的结构与Resnet-50网络的第四层以及改进后的第五层结构相同,第三个分支的结构与Resnet-50网络改进后的第四层以及改进后的第五层结构相同;其中,所述改进后的第五层结构为删除了下采样环节的第五层结构,所述改进后的第四层结构为删除了下采样环节的第四层结构。
可选地,所述嵌入层中预先存储的对每个分支设置的分割数目包括:
第一个分支的分割数目为1,第二个分支的分割数目为2,所述第三个分支的分割数目为3。
可选地,所述对每组局部特征图分别进行拼接,得到多个特征张量,包括:
对于任一组局部特征图,确定所述组局部特征图的数量X,则所述组的局部特征图经过X轮拼接,其中,第i轮拼接包括i次拼接,所述i次拼接包括的局部特征图的数量分别为X、X-1、X-2、……、X-i+1,每次拼接得到一个特征张量,则对所述组局部特征图进行拼接后得到
Figure BDA0003154827780000031
个特征张量。
可选地,所述行人重识别模型的训练方法如下述过程:
获取训练样本数据集;
采用交叉熵损失Softmax Loss函数对初始行人重识别模型进行初步训练,得到预训练行人重识别模型;
将所述训练样本数据集输入所述预训练行人重识别模型中,将难样本三元组损失TriHard Loss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据所述综合损失函数对所述预训练行人重识别模型进行训练,直到综合损失函数收敛,完成对所述行人重识别模型的训练,得到训练好的行人重识别模型。
可选地,所述综合损失函数定义为:
L=Lsoftmax+γLHardtrip+βLc
其中,Lsoftmax表示交叉熵损失函数Softmax Loss,Lsoftmax定义为:
Figure BDA0003154827780000032
式中,p(yi|xi)代表标签为yi的输入xi被正确识别的概率;
其中,γ表示第一预设参数,LHardtrip表示难样本三元组损失函数TriHard Loss,LHardtrip定义为:
Figure BDA0003154827780000033
式中,α是设定的阈值,d表示两张图像之间的欧几里得距离,(z)+表示max(z,0),P,K分别指构成三元组的P个行人以及每个行人对应的K张图像,a,p表示正样本对,a,n表示负样本对;
其中,β表示第二预设参数,Lc表示中心损失函数Center Loss,Lc定义为:
Figure BDA0003154827780000041
可选地,初始行人重识别模型包括全连接层以及Softmax Loss函数;
所述将所述训练样本数据集输入初始行人重识别模型中,将难样本三元组损失TriHard Loss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据所述综合损失函数对所述预训练行人重识别模型进行训练,包括:
将所述训练样本数据集输入所述预训练行人重识别模型中,根据所述预训练行人重识别模型中ReLU激活函数的输出数据、TriHard Loss函数、以及Center Loss函数,对所述预训练行人重识别模型进行训练;
将所述ReLU激活函数的输出数据输入全连接层,根据所述全连接层的输出数据以及Softmax Loss函数,对所述预训练行人重识别模型进行训练。
可选地,所述行人重识别模型训练过程中使用随机梯度下降SGD优化器进行参数更新。
一方面,提供了一种多尺度多特征融合的行人重识别装置,该装置应用于电子设备,该装置包括:
输入单元,用于将待识别图像输入预先训练好的行人重识别模型中,所述行人重识别模型包括特征提取层、嵌入层、全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及激活函数;其中,所述特征提取层设置三个分支,所述嵌入层中预先存储有对每个分支设置的分割数目;
特征提取单元,用于通过所述特征提取层的三个分支,得到三个不同尺度的特征图;
拼接单元,用于根据所述嵌入层预先设置的分割数目,分别对三个特征图进行分割,得到三组分割后的局部特征图,对每组局部特征图分别进行拼接,得到多个特征张量;
转化单元,用于通过所述全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及线性整流ReLU激活函数,将所述多个特征张量转化为一维向量;
获取结果单元,用于将得到的一维向量进行拼接,获取多个待检测图像对应的一维向量,计算所述待识别图像的一维向量分别与所述多个待检测图像的一维向量的相似度,根据得到的多个相似度,确定所述待识别图像对应的待检测图像。
可选地,所述特征提取层的结构包括:
所述特征提取层的前三层完全继承Resnet-50网络的前三层结构,所述三个分支中,第一个分支的结构与Resnet-50网络的第四层以及第五层结构相同,第二个分支的结构与Resnet-50网络的第四层以及改进后的第五层结构相同,第三个分支的结构与Resnet-50网络改进后的第四层以及改进后的第五层结构相同;其中,所述改进后的第五层结构为删除了下采样环节的第五层结构,所述改进后的第四层结构为删除了下采样环节的第四层结构。
可选地,所述嵌入层中预先存储的对每个分支设置的分割数目包括:
第一个分支的分割数目为1,第二个分支的分割数目为2,所述第三个分支的分割数目为3。
可选地,所述拼接单元,用于:
对于任一组局部特征图,确定所述组局部特征图的数量X,则所述组的局部特征图经过X轮拼接,其中,第i轮拼接包括i次拼接,所述i次拼接包括的局部特征图的数量分别为X、X-1、X-2、……、X-i+1,每次拼接得到一个特征张量,则对所述组局部特征图进行拼接后得到
Figure BDA0003154827780000051
个特征张量。
可选地,所述装置还包括训练单元,所述训练单元用于:
获取训练样本数据集;
采用交叉熵损失Softmax Loss函数对初始行人重识别模型进行初步训练,得到预训练行人重识别模型;
将所述训练样本数据集输入所述预训练行人重识别模型中,将难样本三元组损失TriHard Loss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据所述综合损失函数对所述预训练行人重识别模型进行训练,直到综合损失函数收敛,完成对所述行人重识别模型的训练,得到训练好的行人重识别模型。
可选地,所述综合损失函数定义为:
L=Lsoftmax+γLHardtrip+βLc
其中,Lsoftmax表示交叉熵损失函数Softmax Loss,Lsoftmax定义为:
Figure BDA0003154827780000061
式中,p(yi|xi)代表标签为yi的输入xi被正确识别的概率;
其中,γ表示第一预设参数,LHardtrip表示难样本三元组损失函数TriHard Loss,LHardtrip定义为:
Figure BDA0003154827780000062
式中,α是设定的阈值,d表示两张图像之间的欧几里得距离,(z)+表示max(z,0),P,K分别指构成三元组的P个行人以及每个行人对应的K张图像,a,p表示正样本对,a,n表示负样本对;
其中,β表示第二预设参数,Lc表示中心损失函数Center Loss,Lc定义为:
Figure BDA0003154827780000063
可选地,所述训练单元,用于:
将所述训练样本数据集输入所述预训练行人重识别模型中,根据所述预训练行人重识别模型中ReLU激活函数的输出数据、TriHard Loss函数、以及Center Loss函数,对所述预训练行人重识别模型进行训练;其中,所述初始行人重识别模型包括全连接层以及Softmax Loss函数;
将所述ReLU激活函数的输出数据输入全连接层,根据所述全连接层的输出数据以及Softmax Loss函数,对所述预训练行人重识别模型进行训练。
可选地,所述行人重识别模型训练过程中使用随机梯度下降SGD优化器进行参数更新。
一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述多尺度多特征融合的行人重识别方法。
一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述多尺度多特征融合的行人重识别方法。
本发明实施例提供的技术方案带来的有益效果至少包括:
上述方案中,本发明实施例中,采用多分支结构获取行人特征图,与其他仅仅采用单一分支的算法相比,多分支结构能够获取到更加丰富的行人特征信息,结合不同分支中的特征信息,行人特征能够被更充分地表达。而且,本发明将多分支结构与局部特征学习相结合,获得了行人在不同层次上的特征表示,同时充分利用了相邻局部特征之间的联系,解决了其他行人重识别算法忽视局部特征之间内在联系的问题。另外,本发明采用了一种新的训练策略,与直接组合不同损失函数的训练策略相比,本发明提出的训练策略在充分利用三元组损失的基础上,也一定程度的避免了不同损失函数之间存在冲突的情况,提高了训练效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种现有技术的识别过程示意图;
图2是本发明实施例提供的一种实施环境图;
图3是本发明实施例提供的一种多尺度多特征融合的行人重识别方法流程图;
图4是本发明实施例提供的一种多尺度多特征融合的行人重识别方法流程图;
图5是本发明实施例提供的一种特征提取层的结构示意图;
图6是本发明实施例提供的一种训练过程的结构示意图;
图7是本发明实施例提供的一种局部特征图的拼接方法的示意图;
图8是本发明实施例提供的一种多尺度多特征融合的行人重识别装置框图;
图9是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明实施例提供了一种多尺度多特征融合的行人重识别方法,如图2所示,该实施环境可以包括至少一个终端201、以及用于为该多个终端201提供服务的服务器202。至少一个终端201通过无线或者有线网络和服务器202连接,该多个终端201可以为能够访问服务器202的计算机设备或智能终端等。对于行人重识别的过程,终端201中可以获取待识别图像,服务器202中存储有预先训练好的行人重识别模型,终端201得到待识别图像后,终端201向服务器202发送待识别图像,然后服务器202将待识别图像输入行人重识别模型中,使得行人重识别模型对待识别图像进行识别。或者,识别过程也可以由终端201完成,服务器202获取训练样本数据集,通过训练样本数据集对终端201的行人重识别模型进行训练,本发明对此不做限定。
本发明实施例提供了一种多尺度多特征融合的行人重识别方法,该方法可以由电子设备实现,该电子设备可以是终端或服务器。如图3所示的多尺度多特征融合的行人重识别方法流程图,该方法的处理流程可以包括如下的步骤:
步骤301、将待识别图像输入预先训练好的行人重识别模型中。
行人重识别模型包括特征提取层、嵌入层、全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及激活函数;其中,特征提取层设置三个分支,嵌入层中预先存储有对每个分支设置的分割数目;
步骤302、通过特征提取层的三个分支,得到三个不同尺度的特征图;
步骤303、根据嵌入层预先设置的分割数目,分别对三个特征图进行分割,得到三组分割后的局部特征图,对每组局部特征图分别进行拼接,得到多个特征张量;
步骤304、通过全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及线性整流ReLU激活函数,将多个特征张量转化为一维向量;
步骤305、将得到的一维向量进行拼接,获取多个待检测图像对应的一维向量,计算待识别图像的一维向量分别与多个待检测图像的一维向量的相似度,根据得到的多个相似度,确定待识别图像对应的待检测图像。
可选地,特征提取层的结构包括:
特征提取层的前三层完全继承Resnet-50网络的前三层结构,三个分支中,第一个分支的结构与Resnet-50网络的第四层以及第五层结构相同,第二个分支的结构与Resnet-50网络的第四层以及改进后的第五层结构相同,第三个分支的结构与Resnet-50网络改进后的第四层以及改进后的第五层结构相同;其中,改进后的第五层结构为删除了下采样环节的第五层结构,改进后的第四层结构为删除了下采样环节的第四层结构。
可选地,嵌入层中预先存储的对每个分支设置的分割数目包括:
第一个分支的分割数目为1,第二个分支的分割数目为2,第三个分支的分割数目为3。
可选地,对每组局部特征图分别进行拼接,得到多个特征张量,包括:
对于任一组局部特征图,确定组局部特征图的数量X,则组的局部特征图经过X轮拼接,其中,第i轮拼接包括i次拼接,i次拼接包括的局部特征图的数量分别为X、X-1、X-2、……、X-i+1,每次拼接得到一个特征张量,则对组局部特征图进行拼接后得到
Figure BDA0003154827780000091
个特征张量。
可选地,行人重识别模型的训练方法如下述过程:
获取训练样本数据集;
采用交叉熵损失Softmax Loss函数对初始行人重识别模型进行初步训练,得到预训练行人重识别模型;
将训练样本数据集输入预训练行人重识别模型中,将难样本三元组损失TriHardLoss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据综合损失函数对预训练行人重识别模型进行训练,直到综合损失函数收敛,完成对行人重识别模型的训练,得到训练好的行人重识别模型。
可选地,综合损失函数定义为:
L=Lsoftmax+γLHardtrip+βLc
其中,Lsoftmax表示交叉熵损失函数Softmax Loss,Lsoftmax定义为:
Figure BDA0003154827780000101
式中,p(yi|xi)代表标签为yi的输入xi被正确识别的概率;
其中,γ表示第一预设参数,LHardtrip表示难样本三元组损失函数TriHard Loss,LHardtrip定义为:
Figure BDA0003154827780000102
式中,α是设定的阈值,d表示两张图像之间的欧几里得距离,(z)+表示max(z,0),P,K分别指构成三元组的P个行人以及每个行人对应的K张图像,a,p表示正样本对,a,n表示负样本对;
其中,β表示第二预设参数,Lc表示中心损失函数Center Loss,Lc定义为:
Figure BDA0003154827780000103
可选地,将训练样本数据集输入初始行人重识别模型中,将难样本三元组损失TriHard Loss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据综合损失函数对预训练行人重识别模型进行训练,包括:
将训练样本数据集输入预训练行人重识别模型中,根据预训练行人重识别模型中ReLU激活函数的输出数据、TriHard Loss函数、以及Center Loss函数,对预训练行人重识别模型进行训练;其中,预训练行人重识别模型包括全连接层以及Softmax Loss函数;
将ReLU激活函数的输出数据输入全连接层,根据全连接层的输出数据以及Softmax Loss函数,对预训练行人重识别模型进行训练。
可选地,行人重识别模型训练过程中使用随机梯度下降SGD优化器进行参数更新。
本发明实施例提供了一种多尺度多特征融合的行人重识别方法,该方法可以由电子设备实现,该电子设备可以是终端或服务器。如图4所示的多尺度多特征融合的行人重识别方法流程图,该方法的处理流程可以包括如下的步骤:
步骤401、获取初始行人重识别模型。
其中,初始行人重识别模型包括特征提取层、嵌入层、全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层、激活函数以及线性全连接层。其中,特征提取层设置三个分支,嵌入层中预先存储有对每个分支设置的分割数目。
可选地,特征提取层的结构可以包括:
特征提取层的前三层完全继承Resnet-50网络的前三层结构,三个分支中,第一个分支的结构与Resnet-50网络的第四层以及第五层结构相同,第二个分支的结构与Resnet-50网络的第四层以及改进后的第五层结构相同,第三个分支的结构与Resnet-50网络改进后的第四层以及改进后的第五层结构相同;其中,改进后的第五层结构为删除了下采样环节的第五层结构,改进后的第四层结构为删除了下采样环节的第四层结构。如图5所示,图中Res_convx’和Res_convx分别表示删去下采样环节以及未删除下采样环节的第x个卷积层。下采样环节的作用是降低特征图像的分辨率,通过调整三个分支的下采样环节,使得三个分支对特征图像的特征提取的尺度不同,这样可以得到三个尺度不同的特征图像。
步骤402、获取训练样本数据集。
其中,当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一次epoch,即一个数据集的所有训练样本在神经网络中都进行了一次正向传播和一次反向传播。其中,一个人在摄像头下存在多种多样的姿态、遮挡等情况,为了尽可能的实现行人在不同摄像头下出现的情况,在获取样本图像时,对样本图像进行预处理操作,包括随机水平翻转以及随机裁剪。
步骤403、采用交叉熵损失Softmax Loss函数对初始行人重识别模型进行初步训练,得到预训练行人重识别模型。
一种可行的实施方式中,在前10个epoch中,仅仅采用交叉熵损失Softmax Loss对初始行人重识别模型进行初步训练。交叉熵损失被定义为:
Figure BDA0003154827780000121
式中,p(yi|xi)代表标签为yi的输入xi被正确识别的概率。
步骤404、将训练样本数据集输入预训练行人重识别模型中,将难样本三元组损失TriHard Loss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据综合损失函数对预训练行人重识别模型进行训练。
一种可行的实施方式中,在之后的训练过程中,结合难样本三元组损失TriHardLoss、中心损失Center Loss以及交叉熵损失进行训练。难样本三元组损失定义为:
Figure BDA0003154827780000122
式中,α是设定的阈值,d表示两张图像之间的欧几里得距离,(z)+表示max(z,0),P,K分别指构成三元组的P个行人以及每个行人对应的K张图像,a,p表示正样本对,a,n表示负样本对。
中心损失Center Loss定义为:
Figure BDA0003154827780000123
鉴于难样本三元组损失对交叉熵损失直接组合起来、会出现一定的冲突现象,因此难样本三元组损失作为辅助损失参与到模型训练中。同时为难样本三元组损失设置一个辅助系数。具体的损失函数设计为:
L=Lsoftmax+γLHardtrip+βLc
其中,Lsoftmax表示交叉熵损失函数Softmax Loss,γ表示第一预设参数,LHardtrip表示难样本三元组损失函数TriHard Loss,β表示第二预设参数,Lc表示中心损失函数CenterLoss,其中,第一预设参数以及第二预设参数是用户根据具体需求自行设定的。
根据综合损失函数进行训练时,由于Softmax Loss不能对激活函数的输出数据直接进行训练,因此需要全连接层结合样本的ID Loss作为分类器,Softmax Loss对全连接层的输出数据进行训练。具体地,如图6所示,将训练样本数据集输入预训练行人重识别模型中,根据预训练行人重识别模型中ReLU激活函数的输出数据、TriHard Loss函数、以及Center Loss函数,对预训练行人重识别模型进行训练;同时,将ReLU激活函数的输出数据输入全连接层,根据全连接层的输出数据以及Softmax Loss函数,对预训练行人重识别模型进行训练。
可选地,上述步骤中,行人重识别模型训练过程中可以使用随机梯度下降SGD优化器进行参数更新。
步骤405、使用训练样本数据集进行多次训练,直到综合损失函数收敛,完成对行人重识别模型的训练,得到训练好的行人重识别模型。
步骤406、对待识别图像进行归一化处理。
一种可行的实施方式中,为了使输入模型的待识别图像规格统一,对待识别图像进行归一化处理。
步骤407、将经过归一化操作的待识别图像输入预先训练好的行人重识别模型中。
步骤408、通过特征提取层的三个分支,得到三个不同尺度的特征图。
一种可行的实施方式中,由于三个分支的下采样环节不相同,因此,得到的三个特征图包括不同的特征信息。
步骤409、根据嵌入层预先设置的分割数目,分别对三个特征图进行分割,得到三组分割后的局部特征图,对每组局部特征图分别进行拼接,得到多个特征张量。
一种可行的实施方式中,申请人发现,现有技术通常将特征图像分割成6块,在后续进行拼接时,可以得到21个特征张量。这其中存在的问题是,将行人的特征图像分割成6块,分割的比较细,在行人不对齐的情况,很有可能其中某一块中并没有行人特征而只是背景图像,这种局部特征图属于噪声,也就是说,现有技术将特征图像分割成6块时会引入噪声,会影响后续识别结果的准确性。而且,拼接得到21个特征张量数量较多,在不能提高准确率的同时,还会加大运算量,降低识别的效率。
因此,为了解决上述问题,本发明实施例中,将嵌入层中预先存储的对每个分支设置的分割数目为:第一个分支的分割数目为1,第二个分支的分割数目为2,第三个分支的分割数目为3。这样,可以得到三组局部特征图,第一组的局部特征图数量为1,第二组的局部特征图数量为2,第三组的局部特征图数量为3。这样,即使待识别图像中包含背景图像的部分,也能保证分割后的局部特征图中均包含行人特征,不会引入噪声。
之后,对每组局部特征图分别进行拼接,得到多个特征张量,具体地,对于任一组局部特征图,确定组局部特征图的数量X,则组的局部特征图经过X轮拼接,其中,第i轮拼接包括i次拼接,i次拼接包括的局部特征图的数量分别为X、X-1、X-2、……、X-i+1,每次拼接得到一个特征张量,则对组局部特征图进行拼接后得到
Figure BDA0003154827780000141
个特征张量,如图7所示为一组局部特征图的拼接方式。
对于本发明实施例包括的三组局部特征图,具体的拼接步骤如下:
1、对于第一组局部特征图,由于该组只包括1个局部特征图,只经过1轮拼接,即无需拼接,得到1个特征张量。
2、对于第二组局部特征图,该组包括2个局部特征图,因此经过2轮拼接:
(1)第1轮拼接时包括1次拼接,这1次拼接包括的局部特征图的数量为2,即将2个局部特征图拼接起来,这1轮拼接得到1个特征张量;
(2)第2轮拼接时包括2次拼接:
①第1次拼接包括的局部特征图的数量为2,即将2个局部特征图拼接起来;
②第2次拼接包括的局部特征图的数量为1,无需拼接,这1轮拼接得到2个特征张量。
也就是说,第二组局部特征图得到1+2=3个特征张量。
3、对于第三组局部特征图,该组包括3个局部特征图,因此经过3轮拼接:
(1)第1轮拼接时包括1次拼接,这1次拼接包括的局部特征图的数量为3,即把3个局部特征图拼接起来,这1轮拼接得到1个特征张量;
(2)第2轮拼接时包括2次拼接:
①第1次拼接包括的局部特征图的数量为3,即将3个局部特征图拼接起来;
②第2次拼接包括的局部特征图的数量为2,将2个局部特征图拼接起来;这1轮拼接得到2个特征张量。
(3)第3轮拼接时包括3次拼接:
①第1次拼接包括的局部特征图的数量为3,即将3个局部特征图拼接起来;
②第2次拼接包括的局部特征图的数量为2,将2个局部特征图拼接起来;
③第3次拼接包括的局部特征图的数量为1,无需拼接,这1轮拼接得到3个特征张量。
也就是说,第三组局部特征图得到1+2+3=6个特征张量。
综合来看,本发明实施例的三组局部特征图可以得到1+3+6=10个特征张量,相较于现有技术的21个特征张量,在运算量上大大减少,因此,本发明可以在不影响识别准确率的前提下提高识别的效率。
步骤410、通过全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及线性整流ReLU激活函数,将多个特征张量转化为一维向量。
步骤411、将得到的一维向量进行拼接,获取多个待检测图像对应的一维向量,计算待识别图像的一维向量分别与多个待检测图像的一维向量的相似度,根据得到的多个相似度,确定待识别图像对应的待检测图像。
一种可行的实施方式中,多个待检测图像的一维向量可以采取上述步骤406-410的处理方式得到,具体操作过程此处不作赘述。
分别计算待识别图像的一维向量与多个待检测图像的一维向量的相似度,然后将相似度按照从大到小的顺序降序排列,获取前预设数量个相似度对应的待检测图像,这预设数量个待检测图像即为识别结果。
本发明实施例中,采用多分支结构获取行人特征图,与其他仅仅采用单一分支的算法相比,多分支结构能够获取到更加丰富的行人特征信息,结合不同分支中的特征信息,行人特征能够被更充分地表达。而且,本发明将多分支结构与局部特征学习相结合,获得了行人在不同层次上的特征表示,同时充分利用了相邻局部特征之间的联系,解决了其他行人重识别算法忽视局部特征之间内在联系的问题。另外,本发明采用了一种新的训练策略,与直接组合不同损失函数的训练策略相比,本发明提出的训练策略在充分利用三元组损失的基础上,也一定程度的避免了不同损失函数之间存在冲突的情况,提高了训练效率。
图8是根据一示例性实施例示出的一种多尺度多特征融合的行人重识别装置框图。参照图8,该装置包括输入单元810、特征提取单元820、拼接单元830、转化单元840、获取结果单元850以及训练单元860。
输入单元810,用于将待识别图像输入预先训练好的行人重识别模型中,所述行人重识别模型包括特征提取层、嵌入层、全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及激活函数;其中,所述特征提取层设置三个分支,所述嵌入层中预先存储有对每个分支设置的分割数目;
特征提取单元820,用于通过所述特征提取层的三个分支,得到三个不同尺度的特征图;
拼接单元830,用于根据所述嵌入层预先设置的分割数目,分别对三个特征图进行分割,得到三组分割后的局部特征图,对每组局部特征图分别进行拼接,得到多个特征张量;
转化单元840,用于通过所述全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及线性整流ReLU激活函数,将所述多个特征张量转化为一维向量;
获取结果单元850,用于将得到的一维向量进行拼接,获取多个待检测图像对应的一维向量,计算所述待识别图像的一维向量分别与所述多个待检测图像的一维向量的相似度,根据得到的多个相似度,确定所述待识别图像对应的待检测图像。
可选地,所述特征提取层的结构包括:
所述特征提取层的前三层完全继承Resnet-50网络的前三层结构,所述三个分支中,第一个分支的结构与Resnet-50网络的第四层以及第五层结构相同,第二个分支的结构与Resnet-50网络的第四层以及改进后的第五层结构相同,第三个分支的结构与Resnet-50网络改进后的第四层以及改进后的第五层结构相同;其中,所述改进后的第五层结构为删除了下采样环节的第五层结构,所述改进后的第四层结构为删除了下采样环节的第四层结构。
可选地,所述嵌入层中预先存储的对每个分支设置的分割数目包括:
第一个分支的分割数目为1,第二个分支的分割数目为2,所述第三个分支的分割数目为3。
可选地,所述拼接单元830,用于:
对于任一组局部特征图,确定所述组局部特征图的数量X,则所述组的局部特征图经过X轮拼接,其中,第i轮拼接包括i次拼接,所述i次拼接包括的局部特征图的数量分别为X、X-1、X-2、……、X-i+1,每次拼接得到一个特征张量,则对所述组局部特征图进行拼接后得到
Figure BDA0003154827780000171
个特征张量。
可选地,所述装置还包括训练单元860,所述训练单元860,用于:
获取训练样本数据集;
采用交叉熵损失Softmax Loss函数对初始行人重识别模型进行初步训练,得到预训练行人重识别模型;
将所述训练样本数据集输入所述预训练行人重识别模型中,将难样本三元组损失TriHard Loss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据所述综合损失函数对所述预训练行人重识别模型进行训练,直到综合损失函数收敛,完成对所述行人重识别模型的训练,得到训练好的行人重识别模型。
可选地,所述综合损失函数定义为:
L=Lsoftmax+γLHardtrip+βLc
其中,Lsoftmax表示交叉熵损失函数Softmax Loss,Lsoftmax定义为:
Figure BDA0003154827780000172
式中,p(yi|xi)代表标签为yi的输入xi被正确识别的概率;
其中,γ表示第一预设参数,LHardtrip表示难样本三元组损失函数TriHard Loss,LHardtrip定义为:
Figure BDA0003154827780000181
式中,α是设定的阈值,d表示两张图像之间的欧几里得距离,(z)+表示max(z,0),P,K分别指构成三元组的P个行人以及每个行人对应的K张图像,a,p表示正样本对,a,n表示负样本对;
其中,β表示第二预设参数,Lc表示中心损失函数Center Loss,Lc定义为:
Figure BDA0003154827780000182
可选地,所述训练单元860,用于:
将所述训练样本数据集输入所述预训练行人重识别模型中,根据所述预训练行人重识别模型中ReLU激活函数的输出数据、TriHard Loss函数、以及Center Loss函数,对所述预训练行人重识别模型进行训练;其中,所述预训练行人重识别模型包括全连接层以及Softmax Loss函数;
将所述ReLU激活函数的输出数据输入全连接层,根据所述全连接层的输出数据以及Softmax Loss函数,对所述预训练行人重识别模型进行训练。
可选地,所述行人重识别模型训练过程中使用随机梯度下降SGD优化器进行参数更新。
本发明实施例中,采用多分支结构获取行人特征图,与其他仅仅采用单一分支的算法相比,多分支结构能够获取到更加丰富的行人特征信息,结合不同分支中的特征信息,行人特征能够被更充分地表达。而且,本发明将多分支结构与局部特征学习相结合,获得了行人在不同层次上的特征表示,同时充分利用了相邻局部特征之间的联系,解决了其他行人重识别算法忽视局部特征之间内在联系的问题。另外,本发明采用了一种新的训练策略,与直接组合不同损失函数的训练策略相比,本发明提出的训练策略在充分利用三元组损失的基础上,也一定程度的避免了不同损失函数之间存在冲突的情况,提高了训练效率。
图9是本发明实施例提供的一种电子设备900的结构示意图,该电子设备900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)901和一个或一个以上的存储器902,其中,所述存储器902中存储有至少一条指令,所述至少一条指令由所述处理器901加载并执行以实现下述多尺度多特征融合的行人重识别方法的步骤:
将待识别图像输入预先训练好的行人重识别模型中,所述行人重识别模型包括特征提取层、嵌入层、全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及激活函数;其中,所述特征提取层设置三个分支,所述嵌入层中预先存储有对每个分支设置的分割数目;
通过所述特征提取层的三个分支,得到三个不同尺度的特征图;
根据所述嵌入层预先设置的分割数目,分别对三个特征图进行分割,得到三组分割后的局部特征图,对每组局部特征图分别进行拼接,得到多个特征张量;
通过所述全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及线性整流ReLU激活函数,将所述多个特征张量转化为一维向量;
将得到的一维向量进行拼接,获取多个待检测图像对应的一维向量,计算所述待识别图像的一维向量分别与所述多个待检测图像的一维向量的相似度,根据得到的多个相似度,确定所述待识别图像对应的待检测图像。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述多尺度多特征融合的行人重识别方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种多尺度多特征融合的行人重识别方法,其特征在于,所述方法包括:
将待识别图像输入预先训练好的行人重识别模型中,所述行人重识别模型包括特征提取层、嵌入层、全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及激活函数;其中,所述特征提取层设置三个分支,所述嵌入层中预先存储有对每个分支设置的分割数目;
通过所述特征提取层的三个分支,得到三个不同尺度的特征图;
根据所述嵌入层预先设置的分割数目,分别对三个特征图进行分割,得到三组分割后的局部特征图,对每组局部特征图分别进行拼接,得到多个特征张量;
通过所述全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及线性整流ReLU激活函数,将所述多个特征张量转化为一维向量;
将得到的一维向量进行拼接,获取多个待检测图像对应的一维向量,计算所述待识别图像的一维向量分别与所述多个待检测图像的一维向量的相似度,根据得到的多个相似度,确定所述待识别图像对应的待检测图像。
2.根据权利要求1所述的方法,其特征在于,所述特征提取层的结构包括:
所述特征提取层的前三层完全继承Resnet-50网络的前三层结构,所述三个分支中,第一个分支的结构与Resnet-50网络的第四层以及第五层结构相同,第二个分支的结构与Resnet-50网络的第四层以及改进后的第五层结构相同,第三个分支的结构与Resnet-50网络改进后的第四层以及改进后的第五层结构相同;其中,所述改进后的第五层结构为删除了下采样环节的第五层结构,所述改进后的第四层结构为删除了下采样环节的第四层结构。
3.根据权利要求1所述的方法,其特征在于,所述嵌入层中预先存储的对每个分支设置的分割数目包括:
第一个分支的分割数目为1,第二个分支的分割数目为2,所述第三个分支的分割数目为3。
4.根据权利要求1所述的方法,其特征在于,所述对每组局部特征图分别进行拼接,得到多个特征张量,包括:
对于任一组局部特征图,确定所述组局部特征图的数量X,则所述组的局部特征图经过X轮拼接,其中,第i轮拼接包括i次拼接,所述i次拼接包括的局部特征图的数量分别为X、X-1、X-2、……、X-i+1,每次拼接得到一个特征张量,则对所述组局部特征图进行拼接后得到
Figure FDA0003154827770000021
个特征张量。
5.根据权利要求1所述的方法,其特征在于,所述行人重识别模型的训练方法如下述过程:
获取训练样本数据集;
采用交叉熵损失Softmax Loss函数对初始行人重识别模型进行初步训练,得到预训练行人重识别模型;
将所述训练样本数据集输入所述预训练行人重识别模型中,将难样本三元组损失TriHard Loss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据所述综合损失函数对所述预训练行人重识别模型进行训练,直到综合损失函数收敛,完成对所述行人重识别模型的训练,得到训练好的行人重识别模型。
6.根据权利要求5所述的方法,其特征在于,所述综合损失函数定义为:
L=Lsoftmax+γLHardtrip+βLc
其中,Lsoftmax表示交叉熵损失函数Softmax Loss,Lsoftmax定义为:
Figure FDA0003154827770000022
式中,p(yi|xi)代表标签为yi的输入xi被正确识别的概率;
其中,γ表示第一预设参数,LHardtrip表示难样本三元组损失函数TriHard Loss,LHardtrip定义为:
Figure FDA0003154827770000023
式中,α是设定的阈值,d表示两张图像之间的欧几里得距离,(z)+表示max(z,0),P,K分别指构成三元组的P个行人以及每个行人对应的K张图像,a,p表示正样本对,a,n表示负样本对;
其中,β表示第二预设参数,Lc表示中心损失函数Center Loss,Lc定义为:
Figure FDA0003154827770000031
7.根据权利要求5所述的方法,其特征在于,初始行人重识别模型包括全连接层以及Softmax Loss函数;
所述将所述训练样本数据集输入初始行人重识别模型中,将难样本三元组损失TriHard Loss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据所述综合损失函数对所述预训练行人重识别模型进行训练,包括:
将所述训练样本数据集输入所述预训练行人重识别模型中,根据所述预训练行人重识别模型中ReLU激活函数的输出数据、TriHard Loss函数、以及Center Loss函数,对所述预训练行人重识别模型进行训练;
将所述ReLU激活函数的输出数据输入全连接层,根据所述全连接层的输出数据以及Softmax Loss函数,对所述预训练行人重识别模型进行训练。
8.根据权利要求5所述的方法,其特征在于,所述行人重识别模型训练过程中使用随机梯度下降SGD优化器进行参数更新。
9.一种多尺度多特征融合的行人重识别装置,其特征在于,所述装置包括:
输入单元,用于将待识别图像输入预先训练好的行人重识别模型中,所述行人重识别模型包括特征提取层、嵌入层、全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及激活函数;其中,所述特征提取层设置三个分支,所述嵌入层中预先存储有对每个分支设置的分割数目;
特征提取单元,用于通过所述特征提取层的三个分支,得到三个不同尺度的特征图;
拼接单元,用于根据所述嵌入层预先设置的分割数目,分别对三个特征图进行分割,得到三组分割后的局部特征图,对每组局部特征图分别进行拼接,得到多个特征张量;
转化单元,用于通过所述全局最大池化层GMP、全局平均池化层GAP、卷积层、批处理归一化层以及线性整流ReLU激活函数,将所述多个特征张量转化为一维向量;
获取结果单元,将得到的一维向量进行拼接,获取多个待检测图像对应的一维向量,计算所述待识别图像的一维向量分别与所述多个待检测图像的一维向量的相似度,根据得到的多个相似度,确定所述待识别图像对应的待检测图像。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括训练单元,所述训练单元,用于:
获取训练样本数据集;
采用交叉熵损失Softmax Loss函数对初始行人重识别模型进行初步训练,得到预训练行人重识别模型;
将所述训练样本数据集输入所述预训练行人重识别模型中,将难样本三元组损失TriHard Loss函数、中心损失Center Loss函数以及Softmax Loss函数相结合得到综合损失函数,根据所述综合损失函数对所述预训练行人重识别模型进行训练,直到综合损失函数收敛,完成对所述行人重识别模型的训练,得到训练好的行人重识别模型。
CN202110776004.9A 2021-07-08 2021-07-08 一种多尺度多特征融合的行人重识别方法及装置 Pending CN113449671A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110776004.9A CN113449671A (zh) 2021-07-08 2021-07-08 一种多尺度多特征融合的行人重识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110776004.9A CN113449671A (zh) 2021-07-08 2021-07-08 一种多尺度多特征融合的行人重识别方法及装置

Publications (1)

Publication Number Publication Date
CN113449671A true CN113449671A (zh) 2021-09-28

Family

ID=77815732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110776004.9A Pending CN113449671A (zh) 2021-07-08 2021-07-08 一种多尺度多特征融合的行人重识别方法及装置

Country Status (1)

Country Link
CN (1) CN113449671A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114359970A (zh) * 2022-01-12 2022-04-15 平安科技(深圳)有限公司 行人重识别方法、装置、电子设备及存储介质
CN114429524A (zh) * 2022-04-07 2022-05-03 深圳市城市交通规划设计研究中心股份有限公司 单目视觉下的三维目标检测模型的构建方法及检测方法
CN116912633A (zh) * 2023-09-12 2023-10-20 深圳须弥云图空间科技有限公司 目标追踪模型的训练方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114359970A (zh) * 2022-01-12 2022-04-15 平安科技(深圳)有限公司 行人重识别方法、装置、电子设备及存储介质
CN114429524A (zh) * 2022-04-07 2022-05-03 深圳市城市交通规划设计研究中心股份有限公司 单目视觉下的三维目标检测模型的构建方法及检测方法
CN116912633A (zh) * 2023-09-12 2023-10-20 深圳须弥云图空间科技有限公司 目标追踪模型的训练方法及装置
CN116912633B (zh) * 2023-09-12 2024-01-05 深圳须弥云图空间科技有限公司 目标追踪模型的训练方法及装置

Similar Documents

Publication Publication Date Title
CN113378632B (zh) 一种基于伪标签优化的无监督域适应行人重识别方法
CN113449671A (zh) 一种多尺度多特征融合的行人重识别方法及装置
CN110069985B (zh) 基于图像的目标点位置检测方法、装置、电子设备
CN111696101A (zh) 一种基于SE-Inception的轻量级茄科病害识别方法
CN111754532B (zh) 图像分割模型搜索方法、装置、计算机设备及存储介质
CN112580515B (zh) 一种基于高斯热图回归的轻量级人脸关键点检测方法
CN112150493A (zh) 一种基于语义指导的自然场景下屏幕区域检测方法
CN108197669B (zh) 卷积神经网络的特征训练方法及装置
CN109829414B (zh) 一种基于标签不确定性和人体组件模型的行人再识别方法
CN115223082A (zh) 一种基于时空多尺度Transformer的航拍视频分类方法
CN113065402A (zh) 一种基于变形注意力机制的人脸检测方法
CN112070010B (zh) 一种联合多损失动态训练策略增强局部特征学习的行人重识别方法
CN109190666B (zh) 基于改进的深度神经网络的花卉图像分类方法
CN113297959A (zh) 一种基于角点注意力孪生网络的目标跟踪方法及系统
CN112669343A (zh) 一种基于深度学习的壮族少数民族服饰分割方法
CN112633154A (zh) 一种异源人脸特征向量之间的转换方法及系统
CN113177464A (zh) 基于深度学习的端到端的多模态步态识别方法
CN114581486A (zh) 基于全卷积孪生网络多层特征的模板更新目标跟踪算法
CN115965864A (zh) 一种用于农作物病害识别的轻量级注意力机制网络
CN114492634B (zh) 一种细粒度装备图片分类识别方法及系统
CN114463812B (zh) 基于双通道多分支融合特征蒸馏的低分辨率人脸识别方法
CN114463340A (zh) 一种边缘信息引导的敏捷型遥感图像语义分割方法
CN114764870A (zh) 对象定位模型处理、对象定位方法、装置及计算机设备
CN111898510B (zh) 一种基于渐进式神经网络的跨模态行人再识别方法
CN111695450A (zh) 一种基于IMobileNet的人脸快速识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination