CN111259850A - 一种融合随机批掩膜和多尺度表征学习的行人重识别方法 - Google Patents

一种融合随机批掩膜和多尺度表征学习的行人重识别方法 Download PDF

Info

Publication number
CN111259850A
CN111259850A CN202010076639.3A CN202010076639A CN111259850A CN 111259850 A CN111259850 A CN 111259850A CN 202010076639 A CN202010076639 A CN 202010076639A CN 111259850 A CN111259850 A CN 111259850A
Authority
CN
China
Prior art keywords
pedestrian
training
learning
network
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010076639.3A
Other languages
English (en)
Other versions
CN111259850B (zh
Inventor
黄德双
伍永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202010076639.3A priority Critical patent/CN111259850B/zh
Publication of CN111259850A publication Critical patent/CN111259850A/zh
Priority to JP2020138754A priority patent/JP6830707B1/ja
Application granted granted Critical
Publication of CN111259850B publication Critical patent/CN111259850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明涉及一种融合随机批掩膜和多尺度表征学习的行人重识别方法,包括:构建行人重识别训练网络;按照预设训练参数进行网络超参数调节,得到学习网络;屏蔽多尺度表征学习和随机批掩膜分支,得到测试网络,将测试集输入测试网络后得到对应测试识别结果;判断测试识别结果准确率是否大于或等于预设值,若判断为是,则将实际数据集输入学习网络,否则重新训练网络;最后屏蔽多尺度表征学习和随机批掩膜分支,得到应用网络,将查询图像输入应用网络后得到对应的识别结果。与现有技术相比,本发明使用随机批掩膜策略、多尺度表征学习以及损失函数联合训练,能够捕获行人图像更细节性的判别力特征,并提取到局部的重要的被抑制的特征。

Description

一种融合随机批掩膜和多尺度表征学习的行人重识别方法
技术领域
本发明涉及计算机模式识别图像处理技术领域,尤其是涉及一种融合随机批掩膜和多尺度表征学习的行人重识别方法。
背景技术
行人重识别(Person Re-identification,PReID)是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,广泛被认为是一个图像检索的子问题,在给定一个监控行人图像后,能够自动检索跨设备下的该行人图像。目前,城市里用于公共治安领域的摄像头已经大量部署,几乎到了几十米到几百米一个覆盖的程度,尽管如此,不同的摄像头之间仍然存在无法覆盖的区域。行人重识别的目标就是要确定一个摄像头下发现的目标,在离开摄像头的视野后去哪了,这有点像视频搜索,就是在其他的摄像头采集到的视频中找到目标,行人重识别的任务就是在无重复视域的不同摄像机采集的行人图像或是视频样本之间建立连接关系的处理过程,即识别出不同位置的摄像机在不同时刻拍摄的行人是否为同一人。
现有的行人重识别研究是基于数据集的,就是通过架设几个摄像头,采集行人图像,然后人工标注或自动标注。这些图像一部分用于训练和学习,一部分用于识别。为了提高识别精度,识别算法主要分为两部分,一部分是提取更好的图像特征,另一部分是为了更有效的计算比对不同特征之间的距离。
在提取图像特征时,传统方式多利用深度学习模型,基于卷积神经网络自动学习特征,并利用注意力机制来提取特征,但这种方式通常只着重提取图像中的面部特征或其他突出特征,对于手部或脚步等局部被抑制的特征,则不进行提取,导致这些局部被抑制的重要细节性特征无法被有效提取到,也就不能保证后续识别的准确率。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种融合随机批掩膜和多尺度表征学习的行人重识别方法。
本发明的目的可以通过以下技术方案来实现:一种融合随机批掩膜和多尺度表征学习的行人重识别方法,包括以下步骤:
S1、获取基准数据集,并对基准数据集进行数据扩充;
S2、将数据扩充之后的基准数据集分为训练集和测试集;
S3、基于ResNet50卷积神经网络,构建包含依次连接的注意力学习模块、特征提取模块和识别输出模块的行人重识别训练网络,其中,特征提取模块包括特征处理分支、多尺度表征学习分支和随机批掩膜分支,所述特征处理分支包括全局平均池化和批归一化处理;
S4、将训练集输入行人重识别训练网络,按照预设训练参数进行网络超参数调节,得到行人重识别学习网络;
S5、屏蔽行人重识别学习网络中特征提取模块的多尺度表征学习分支和随机批掩膜分支,得到行人重识别测试网络,将测试集输入行人重识别测试网络,输出对应的测试识别结果;
S6、计算测试识别结果的准确率,判断识别结果准确率是否大于或等于预设值,若判断为是,则执行步骤S7,否则返回步骤S4;
S7、获取实际数据集,并将实际数据集输入行人重识别学习网络,以学习实际数据集对应的图像特征;
S8、屏蔽行人重识别学习网络中特征提取模块的多尺度表征学习分支和随机批掩膜分支,得到行人重识别应用网络,将查询图像输入行人重识别应用网络,输出该查询对象对应的识别结果。
进一步地,所述步骤S1中数据扩充具体包括以下步骤:
S11、在基准数据集中随机抽取若干图片进行水平翻转处理;
S12、在基准数据集中随机抽取若干图片进行高斯、椒盐噪声处理。
进一步地,所述步骤S3中注意力学习模块分为三阶段,以加强目标的特征表达;
所述特征处理分支采用标签损失和排序损失联合训练,以获取图像全局信息;
所述多尺度表征学习分支采用两组标签损失训练,以获取图像中局部细节性特征和空间信息相关性;
所述随机批掩膜分支采用标签损失训练,以捕获图像中被抑制的局部特征。
进一步地,所述随机批掩膜分支具体是通过设置大小随机且位置区域随机的遮挡块,利用该遮挡块遮挡图像的某一部分,以捕获未被遮挡的局部信息。
进一步地,所述注意力学习模块包含通道注意力模块和空间注意力模块,所述通道注意力模块由一层平均池化运算、一层多层感知机、一层线性层和一层批归一化层组成,用于增大有效通道权重、减少无效通道权重;
所述空间注意力模块包含两个1*1卷积层和两个3*3卷积层,所述1*1卷积层用于减少卷积特征图维度,所述3*3卷积层用于有效提取特征。
进一步地,所述注意力学习模块具体为:
Figure BDA0002378651520000031
Patt=BN(reduce(conv23*3(conv13*3(reduce(F)))))
Catt=BN(Linear(MLP(Mca)))
Figure BDA0002378651520000032
其中,ATL为注意力学习模块,s为sigmoid函数,Catt为通道注意力,Patt为空间注意力,
Figure BDA0002378651520000033
为逐元素相加运算,BN为批归一化层,Linear为线性层,MLP为多层感知机,Mca为平均池化运算,F为特征图,
Figure BDA0002378651520000034
为输入特征图的维度,
Figure BDA0002378651520000035
为经过平均池化运算后得到特征图的维度。
进一步地,所述多尺度表征学习分支中两组标签损失训练分别为小尺度特征训练和大尺度特征训练。
进一步地,所述标签损失训练采用交叉熵损失函数:
Figure BDA0002378651520000036
Figure BDA0002378651520000037
其中,L(ID)为交叉熵损失函数,ID为数据标签,Qn为指示变量,Pn为模型预测的概率分布,N为数据集中行人的全部类别数,r为设置的常量,n为模型预测的行人标签,m为真实的行人标签。
进一步地,所述排序损失训练采用排序损失三元组函数:
Lm(Xi,Xj;f)=(1-Yij)[α-Dij]++Yij[Dij-(α-d)]+
其中,Xi为第i个训练集的样本,Xj为第j个训练集样本的标签,f为模型学习函数,Yij为Xi与Xj的概率分布值,Dij为Xi与Xj之间的欧式距离,α为负样本之间设置的阈值,α-d为正样本之间设置的阈值,正负样本之间至少有d的间隔。
进一步地,所述特征提取模块的融合损失函数具体为:
LAll=λ1LID2LRLL3LRBFM4LSSL5LLSL
其中,LID为特征处理分支中训练的分类损失,LRLL为特征处理分支中训练的排序损失,LRBFM为随机批掩膜分支中训练的分类损失,LSSL为多尺度表征学习分支中小尺度特征训练的分类损失,LLSL为多尺度表征学习分支中大尺度特征训练的分类,λ1为特征处理分支中训练的分类损失所占比例的权重值,λ2为特征处理分支中训练的排序损失所占比例的权重值,λ3为随机批掩膜分支中训练的分类损失所占比例的权重值,λ4为多尺度表征学习分支中小尺度特征训练的分类损失所占比例的权重值,λ5为多尺度表征学习分支中大尺度特征训练的分类损失所占比例的权重值。
与现有技术相比,本发明具有以下优点:
一、本发明采用随机批掩膜方式,能够学习到图像中被抑制的局部细节性特征,采用多尺度表征学习方式,将多尺度特征向量中的小尺度特征和大尺度特征进行分离训练,能够有效增强空间信息的相关性,进一步保证特征提取的全面性和可靠性,有利于提高后续识别的准确度。
二、本发明在特征提取模块结合分类损失和排序三元组损失两种损失函数,以度量特征之间的距离,在对图像进行训练或学习的过程中,能够在拉开类间距离的同时拉近类内距离,从而提高图像特征的有效性。
三、本发明在训练或学习过程中,采用特征处理、随机批掩膜和多尺度表征学习三分支的方式,以有效全面地提取到图像特征,在测试或实际应用过程中,则采用屏蔽随机批掩膜和多尺度表征学习分支的方式,以此实现在保证识别准确率的基础上节约网络开支,加快识别速度。
附图说明
图1为本发明的方法流程示意图;
图2为本发明的网络整体框图;
图3为行人重识别网络训练或学习的流程示意图;
图4为随机批掩膜的设计算法示意图;
图5为行人重识别网络测试或应用的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
如图1所示,一种融合随机批掩膜和多尺度表征学习的行人重识别方法,包括以下步骤:
S1、获取基准数据集,并对基准数据集进行数据扩充;
S2、将数据扩充之后的基准数据集分为训练集和测试集;
S3、基于ResNet50卷积神经网络,构建包含依次连接的注意力学习模块、特征提取模块和识别输出模块的行人重识别训练网络,其中,特征提取模块包括特征处理分支、多尺度表征学习分支和随机批掩膜分支,所述特征处理分支包括全局平均池化和批归一化处理;
S4、将训练集输入行人重识别训练网络,按照预设训练参数进行网络超参数调节,得到行人重识别学习网络;
S5、屏蔽行人重识别学习网络中特征提取模块的多尺度表征学习分支和随机批掩膜分支,得到行人重识别测试网络,将测试集输入行人重识别测试网络,输出对应的测试识别结果;
S6、计算测试识别结果的准确率,判断识别结果准确率是否大于或等于预设值,若判断为是,则执行步骤S7,否则返回步骤S4;
S7、获取实际数据集,并将实际数据集输入行人重识别学习网络,以学习实际数据集对应的图像特征;
S8、屏蔽行人重识别学习网络中特征提取模块的多尺度表征学习分支和随机批掩膜分支,得到行人重识别应用网络,将查询图像输入行人重识别应用网络,输出该查询对象对应的识别结果。
本发明采用随机批掩膜(Random Batch Feature Mask,RBFM)训练策略和多尺度表征学习(Multi-scale Feature Representations Learning)方法来提取行人图像中更具有判别力的、细节性的、包含行人的空间关联性的特征信息,其中,随机批掩膜学习分支和多尺度表征学习方法分支仅在网络训练以及学习阶段中使用,在网络测试以及实际应用阶段中将屏蔽不使用,如图2所示,本发明采用ResNet-50作为特征提取网络,在ResNet50的特征提取过程中的阶段1(Stage 1),阶段2(Stage2),阶段3(Stage 3),首先引入注意力学习模块(Attention Learning Module)来加强目标的特征表达,然后将ResNet50的第4阶段(Stage 4)的特征向量经过特征处理分支、随机批掩膜训练学习分支和多尺度表征学习方法分支:特征处理分支采用分类损失(Identification Loss)和排序损失(Ranked ListLoss)联合训练获取行人的全局信息,主要包括GAP(全局平均池化)和BN(批归一化处理);随机批掩膜学习分支采用标签损失训练来捕获被抑制的、局部的特征,以提高特征提取能力;多尺度表征学习则是采用标签损失训练来获取行人图像中局部细节性特征和空间信息的相关性,这种创新的学习策略能够进一步提高特征提取能力和识别性能,三条分支一共采用四个分类损失和一个排序损失来度量特征之间的距离。
在具体应用过程中,首先需要利用基准数据集依次进行网络训练及测试,通过网络训练得到学习网络,屏蔽学习网络中的随机批掩膜分支和多尺度表征学习分支,得到测试网络,当测试网络达到识别准确度预设值之后,再将实际数据集输入学习网络进行特征学习,之后,屏蔽学习网络中的随机批掩膜分支和多尺度表征学习分支,以得到应用网络,最后通过应用网络对待查询图像进行行人重识别。行人重识别网络训练流程如图3所示,基准数据集需要进行使用如下的数据预处理方式进行数据扩充:
1)在数据集中随机抽取若干图片进行水平翻转处理;
2)在数据集中随机抽取若干图片加高斯、椒盐噪声处理。
在对基准数据集进行过相应的组织和上述的数据处理之后,将图片输入到卷积神经网络中(ResNet50)进行特征提取。
对于整个网络训练,在特征提取部分,使用identification loss(分类损失)和ranked list loss(排序损失)融合的方式进行联合训练,包括三个分支的特征学习结构,通过各个分支特征提取得到图片的特征图,然后通过联合的损失函数进行网络训练,权重更新。
对于注意力学习模块(Attention Learning Module),包含有通道注意力模块和空间注意力模块,通道注意力主要思路是增大有效通道权重,减少无效通道的权重,通道注意力模块由一层平均池化运算、一层多层感知机、一层线性层和一层批归一化层组成,平均池化运算如下公式所示:
Mca=GloAvePool(F)
其中,
Figure BDA0002378651520000061
采用的平均池化层、多层感知机和线性层是为评估各个通道注意力以及调节通道注意力的尺寸,通道注意力公式如下所示:
Catt=BN(Linear(MLP(Mca)))
其中Catt,MLP,Linear,BN分别表示通道注意力,多层感知机,线性层和批归一化层。
而空间注意力模块关注的是图像中的位置信息,使网络理解特征图中的哪些部分可能在空间层面上有着更高的响应,空间注意力模块包含有四个卷积层,其中的两个卷积层是用1*1卷积减少卷积特征图的维度,两个3*3卷积在减少维度后用来有效提取特征,空间注意力如下所示:
Patt=BN(reduc(conv23*3(conv13*3(reduc(F)))))
最终的注意力学习模块是将通道注意力和空间注意力相结合:
Figure BDA0002378651520000071
其中ATL代表的是注意力学习模块,s表示sigmoid函数。
对于随机批掩膜分支,主要是学习被抑制的、局部的、细节性的特征,提高模型的特征提取能力,随机批掩膜训练策略主要是通过在特征向量的训练中,通过设置大小随机、位置区域随机的遮挡块去捕获细节的局部的信息,其设计算法如图4所示。
在网络训练和网络学习阶段,首先根据网络中第四阶段输出的N个维度大小为C×H×W的特征图谱,其中,C为特征图谱的通道数,H,W分别为特征图谱的高度和宽度,随机生成高度掩膜比率值Rh和宽度掩膜比率值Rw
之后,将高度掩膜比率值Rh与输入特征图谱的高H相乘得到掩膜高度Hm、将宽度掩膜比率值Rw与输入特征图谱的宽W相乘得到掩膜宽度Wn
再随机生成0到(H-Hm)数值之间的整数Xa,以及0到(W-Wn)数值之间的整数Yb
生成H行W列的数值全为1的矩阵P,并将矩阵P中Xa~Xa+Hm以及Yb~Yb+Wn的区域全部赋值为0,得到掩膜矩阵P’;
最后将得到的掩膜矩阵P’与输入的N个特征图谱对应进行相乘,即将输入的N个特征图谱对应进行掩膜处理。
在网络测试和实际应用阶段,将摒弃随机批掩膜学习分支。
对于多尺度表征学习分支,则采用多尺度分组卷积策略,将ResNet50中Stage-4中特征向量进行拆分,采用多组卷积核大小3*3对分组特征进行特征提取,并将多尺度特征向量中的小尺度特征和大尺度特征进行分离训练,从而可以提取行人图像中更具有判别力的、细节性的特征和增强空间信息的相关性。
对于identification loss(分类损失),和一般分类任务所用损失函数相同,一般使用交叉熵损失函数,具体公式如下:
Figure BDA0002378651520000081
当m不等于n时,Qn值为0;当m等于n时,Qn值为1。
由于行人数据集中训练集和测试集中没有相同的部分,行人重识别可被视为one-shot学习任务,从而容易引起模型训练出现过拟合情况。而Label smoothing是分类任务中避免过拟合的常用方法。所以Qn被调整为:
Figure BDA0002378651520000082
对于ranked list loss(排序损失),为将正负样本区分开,设置负样本之间的距离大于某个阈值α,并且正样本之间的距离小于α-d,即正负样本之间至少有d的间隔:
Lm(Xi,Xj;f)=(1-Yij)[α-Dij]++Yij[Dij-(α-d)]+
Yij=1表示Xi,Xj属于同一类别的行人,否则Yij=0,距离使用欧式距离。对样本进行合适采样可以加快模型的收敛速率和提高模型性能,对于正样本,损失函数不为0意味着它们与anchor(锚样本)之间的距离大于α-d,类似的,对于负样本,损失函数不为0意味着它们与anchor(锚样本)之间的距离小于α。
通过使用三元组损失,交叉熵损失来联合训练网络的特征提取能量,融合的损失函数表达如下:
LAll=λ1LID2LRLL3LRBFM4LSSL5LLSL
LID为特征处理分支中训练的分类损失,LRLL为特征处理分支中训练的排序损失,LRBFM为随机批掩膜分支中训练的分类损失,LSSL为多尺度表征学习分支中小尺度特征训练的分类损失,LLSL为多尺度表征学习分支中大尺度特征训练的分类,λ1为特征处理分支中训练的分类损失所占比例的权重值,λ2为特征处理分支中训练的排序损失所占比例的权重值,λ3为随机批掩膜分支中训练的分类损失所占比例的权重值,λ4为多尺度表征学习分支中小尺度特征训练的分类损失所占比例的权重值,λ5为多尺度表征学习分支中大尺度特征训练的分类损失所占比例的权重值。
本实施例中,网络训练过程中的训练参数包括:训练总周期(epoch)设置为120,权重衰减参数(weight decay)为0.0005,批量大小(batch size)为32,学习率更新方式如下形式:
Figure BDA0002378651520000091
通过网络训练后,得到学习网络,屏蔽学习网络中的随机批掩膜分支和多尺度表征学习分支,得到测试网络,具体的测试过程如图5所示,在特征提取时仅利用特征处理分支进行特征提取。采用本发明提出的方法,本实施例在CUHK03-Labeled数据集上与其他识别方法进行比较,得到对应识别结果如表1所示:
表1
Figure BDA0002378651520000092
从表1的数据可知,采用本发明提出的行人重识别方法,其Rank-1正确率值和mAP值均优于现有的其他识别方法,表明本发明通过全面有效提取图像特征,尤其是图像中局部被抑制的重要细节特征,能够提高后续识别的准确度。

Claims (10)

1.一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,包括以下步骤:
S1、获取基准数据集,并对基准数据集进行数据扩充;
S2、将数据扩充之后的基准数据集分为训练集和测试集;
S3、基于ResNet50卷积神经网络,构建包含依次连接的注意力学习模块、特征提取模块和识别输出模块的行人重识别训练网络,其中,特征提取模块包括特征处理分支、多尺度表征学习分支和随机批掩膜分支,所述特征处理分支包括全局平均池化和批归一化处理;
S4、将训练集输入行人重识别训练网络,按照预设训练参数进行网络超参数调节,得到行人重识别学习网络;
S5、屏蔽行人重识别学习网络中特征提取模块的多尺度表征学习分支和随机批掩膜分支,得到行人重识别测试网络,将测试集输入行人重识别测试网络,输出对应的测试识别结果;
S6、计算测试识别结果的准确率,判断识别结果准确率是否大于或等于预设值,若判断为是,则执行步骤S7,否则返回步骤S4;
S7、获取实际数据集,并将实际数据集输入行人重识别学习网络,以学习实际数据集对应的图像特征;
S8、屏蔽行人重识别学习网络中特征提取模块的多尺度表征学习分支和随机批掩膜分支,得到行人重识别应用网络,将查询图像输入行人重识别应用网络,输出该查询对象对应的识别结果。
2.根据权利要求1所述的一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,所述步骤S1中数据扩充具体包括以下步骤:
S11、在基准数据集中随机抽取若干图片进行水平翻转处理;
S12、在基准数据集中随机抽取若干图片进行高斯、椒盐噪声处理。
3.根据权利要求1所述的一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,所述步骤S3中注意力学习模块分为三阶段,以加强目标的特征表达;
所述特征处理分支采用标签损失和排序损失联合训练,以获取图像全局信息;
所述多尺度表征学习分支采用两组标签损失训练,以获取图像中局部细节性特征和空间信息相关性;
所述随机批掩膜分支采用标签损失训练,以捕获图像中被抑制的局部特征。
4.根据权利要求3所述的一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,所述随机批掩膜分支具体是通过设置大小随机且位置区域随机的遮挡块,利用该遮挡块遮挡图像的某一部分,以捕获未被遮挡的局部信息。
5.根据权利要求3所述的一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,所述注意力学习模块包含通道注意力模块和空间注意力模块,所述通道注意力模块由一层平均池化运算、一层多层感知机、一层线性层和一层批归一化层组成,用于增大有效通道权重、减少无效通道权重;
所述空间注意力模块包含两个1*1卷积层和两个3*3卷积层,所述1*1卷积层用于减少卷积特征图维度,所述3*3卷积层用于有效提取特征。
6.根据权利要求5所述的一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,所述注意力学习模块具体为:
Figure FDA0002378651510000021
Patt=BN(reduce(conv23*3(conv13*3(reduce(F)))))
Catt=BN(Linear(MLP(Mca)))
Figure FDA0002378651510000022
其中,ATL为注意力学习模块,s为sigmoid函数,Catt为通道注意力,Patt为空间注意力,
Figure FDA0002378651510000023
为逐元素相加运算,BN为批归一化层,Linear为线性层,MLP为多层感知机,Mca为平均池化运算,F为特征图,
Figure FDA0002378651510000024
为输入特征图的维度,
Figure FDA0002378651510000025
为经过平均池化运算后得到特征图的维度。
7.根据权利要求3所述的一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,所述多尺度表征学习分支中两组标签损失训练分别为小尺度特征训练和大尺度特征训练。
8.根据权利要求7所述的一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,所述标签损失训练采用交叉熵损失函数:
Figure FDA0002378651510000026
Figure FDA0002378651510000031
其中,L(ID)为交叉熵损失函数,ID为数据标签,Qn为指示变量,Pn为模型预测的概率分布,N为数据集中行人的全部类别数,r为设置的常量,n为模型预测的行人标签,m为真实的行人标签。
9.根据权利要求8所述的一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,所述排序损失训练采用排序三元组损失函数:
Lm(Xi,Xj;f)=(1-Yij)[α-Dij]++Yij[Dij-(α-d)]+
其中,Xi为第i个训练集的样本,Xj为第j个训练集样本的标签,f为模型学习函数,Yij为Xi与Xj的概率分布值,Dij为Xi与Xj之间的欧式距离,α为负样本之间设置的阈值,α-d为正样本之间设置的阈值,正负样本之间至少有d的间隔。
10.根据权利要求9所述的一种融合随机批掩膜和多尺度表征学习的行人重识别方法,其特征在于,所述特征提取模块的融合损失函数具体为:
LAll=λ1LID2LRLL3LRBFM4LSSL5LLSL
其中,LID为特征处理分支中训练的分类损失,LRLL为特征处理分支中训练的排序损失,LRBFM为随机批掩膜分支中训练的分类损失,LSSL为多尺度表征学习分支中小尺度特征训练的分类损失,LLSL为多尺度表征学习分支中大尺度特征训练的分类,λ1为特征处理分支中训练的分类损失所占比例的权重值,λ2为特征处理分支中训练的排序损失所占比例的权重值,λ3为随机批掩膜分支中训练的分类损失所占比例的权重值,λ4为多尺度表征学习分支中小尺度特征训练的分类损失所占比例的权重值,λ5为多尺度表征学习分支中大尺度特征训练的分类损失所占比例的权重值。
CN202010076639.3A 2020-01-23 2020-01-23 一种融合随机批掩膜和多尺度表征学习的行人重识别方法 Active CN111259850B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010076639.3A CN111259850B (zh) 2020-01-23 2020-01-23 一种融合随机批掩膜和多尺度表征学习的行人重识别方法
JP2020138754A JP6830707B1 (ja) 2020-01-23 2020-08-19 ランダムバッチマスクとマルチスケール表現学習を融合した人物再同定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010076639.3A CN111259850B (zh) 2020-01-23 2020-01-23 一种融合随机批掩膜和多尺度表征学习的行人重识别方法

Publications (2)

Publication Number Publication Date
CN111259850A true CN111259850A (zh) 2020-06-09
CN111259850B CN111259850B (zh) 2022-12-16

Family

ID=70949122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010076639.3A Active CN111259850B (zh) 2020-01-23 2020-01-23 一种融合随机批掩膜和多尺度表征学习的行人重识别方法

Country Status (2)

Country Link
JP (1) JP6830707B1 (zh)
CN (1) CN111259850B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814854A (zh) * 2020-06-28 2020-10-23 北京交通大学 一种无监督域适应的目标重识别方法
CN111814705A (zh) * 2020-07-14 2020-10-23 广西师范大学 一种基于批次分块遮挡网络的行人再辨识方法
CN112084338A (zh) * 2020-09-18 2020-12-15 达而观数据(成都)有限公司 一种文档自动归类方法、系统、计算机设备及存储介质
CN112183295A (zh) * 2020-09-23 2021-01-05 上海眼控科技股份有限公司 行人重识别方法、装置、计算机设备及存储介质
CN112200111A (zh) * 2020-10-19 2021-01-08 厦门大学 一种全局与局部特征融合的遮挡鲁棒行人重识别方法
CN112396036A (zh) * 2020-12-09 2021-02-23 中山大学 一种结合空间变换网络和多尺度特征提取的遮挡行人重识别方法
CN112434796A (zh) * 2020-12-09 2021-03-02 同济大学 一种基于局部信息学习的跨模态行人再识别方法
CN112434599A (zh) * 2020-11-23 2021-03-02 同济大学 一种基于噪声通道的随机遮挡恢复的行人重识别方法
CN112464775A (zh) * 2020-11-21 2021-03-09 西北工业大学 一种基于多分支网络的视频目标重识别方法
CN112749667A (zh) * 2021-01-15 2021-05-04 中国科学院宁波材料技术与工程研究所 一种基于深度学习的线虫分类识别方法
CN112785479A (zh) * 2021-01-21 2021-05-11 南京信息工程大学 一种基于少样本学习的图像隐形水印通用检测方法
CN112883880A (zh) * 2021-02-25 2021-06-01 电子科技大学 一种基于人体结构多尺度分割的行人属性识别方法、存储介质和终端
CN113128466A (zh) * 2021-05-11 2021-07-16 深圳大学 行人重识别方法、系统、电子装置及存储介质
CN113158815A (zh) * 2021-03-27 2021-07-23 复旦大学 一种无监督行人重识别方法、系统及计算机可读介质
CN113239776A (zh) * 2021-05-10 2021-08-10 北方工业大学 一种基于能量模型的行人重识别方法
CN113239784A (zh) * 2021-05-11 2021-08-10 广西科学院 一种基于空间序列特征学习的行人重识别系统及方法
CN113283320A (zh) * 2021-05-13 2021-08-20 桂林安维科技有限公司 一种基于通道特征聚合的行人重识别方法
CN113312961A (zh) * 2021-04-03 2021-08-27 国家计算机网络与信息安全管理中心 一种logo识别加速方法
CN113537032A (zh) * 2021-07-12 2021-10-22 南京邮电大学 一种基于图片分块丢弃的分集多支路行人重识别方法
CN113656628A (zh) * 2021-05-24 2021-11-16 江苏省特种设备安全监督检验研究院 一种基于注意力机制和特征融合的起重机图像检索方法
CN113780243A (zh) * 2021-09-29 2021-12-10 平安科技(深圳)有限公司 行人图像识别模型的训练方法、装置、设备以及存储介质
CN113963150A (zh) * 2021-11-16 2022-01-21 北京中电兴发科技有限公司 一种基于多尺度孪生级联网络的行人重识别方法
CN114743128A (zh) * 2022-03-09 2022-07-12 华侨大学 一种基于异种神经网络的多模态东北虎再辨识方法及装置
CN115050044A (zh) * 2022-04-02 2022-09-13 广西科学院 一种基于MLP-Mixer的跨模态行人重识别方法
CN116721351A (zh) * 2023-07-06 2023-09-08 内蒙古电力(集团)有限责任公司内蒙古超高压供电分公司 一种架空线路通道内道路环境特征遥感智能提取方法

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112990007B (zh) * 2021-03-13 2022-08-09 山东大学 基于区域分组与内部关联融合的人脸表情识别方法及系统
CN113191386B (zh) * 2021-03-26 2023-11-03 中国矿业大学 基于网格重构学习的染色体分类模型
CN113177579A (zh) * 2021-04-08 2021-07-27 北京科技大学 一种基于注意力机制的特征融合方法
CN113156376B (zh) * 2021-04-15 2023-08-11 中国人民解放军空军航空大学 基于sacnn的雷达辐射源信号识别方法
CN113050042B (zh) * 2021-04-15 2023-08-15 中国人民解放军空军航空大学 基于改进UNet3+网络的雷达信号调制类型识别方法
CN113158905A (zh) * 2021-04-23 2021-07-23 佛山市南海区广工大数控装备协同创新研究院 一种基于注意力机制的行人重识别方法
CN113204977B (zh) * 2021-04-29 2023-09-26 北京有竹居网络技术有限公司 信息翻译方法、装置、设备和存储介质
CN113255495A (zh) * 2021-05-17 2021-08-13 开放智能机器(上海)有限公司 一种养猪场生猪清点方法以及清点系统
CN113313173B (zh) * 2021-06-01 2023-05-30 中山大学 基于图表示和改进Transformer的人体解析方法
CN113221854A (zh) * 2021-06-11 2021-08-06 公安部物证鉴定中心 一种基于多尺度深度特征的赤足足迹图像人身识别方法
CN113297624B (zh) * 2021-06-23 2023-04-18 支付宝(杭州)信息技术有限公司 图像的预处理方法及装置
CN113673303B (zh) * 2021-06-28 2024-02-02 中国科学院大学 一种人脸面部动作单元强度回归方法、装置和介质
CN113627093B (zh) * 2021-07-01 2023-11-21 武汉大学 一种基于改进Unet网络的水下机构跨尺度流场特征预测方法
CN113625227B (zh) * 2021-07-05 2023-07-04 西安电子科技大学 基于注意力变换网络的雷达高分辨距离像目标识别方法
CN113378791B (zh) * 2021-07-09 2022-08-05 合肥工业大学 基于双注意力机制和多尺度特征融合的宫颈细胞分类方法
CN113627259A (zh) * 2021-07-12 2021-11-09 西安理工大学 基于图卷积网络的细微动作识别方法
CN113723447B (zh) * 2021-07-15 2024-03-08 西北工业大学 一种多模态影像的端到端的模板匹配方法
CN113627266B (zh) * 2021-07-15 2023-08-18 武汉大学 基于Transformer时空建模的视频行人重识别方法
CN113537111A (zh) * 2021-07-26 2021-10-22 南京信息工程大学 基于双支路深度卷积网络的虹膜分割方法
CN113706406B (zh) * 2021-08-11 2023-08-04 武汉大学 基于特征空间多分类对抗机制的红外可见光图像融合方法
CN113569990B (zh) * 2021-08-25 2024-03-05 浙江工业大学 面向强噪声干扰环境的演艺装备故障诊断模型构建方法
CN113705476A (zh) * 2021-08-30 2021-11-26 国网四川省电力公司营销服务中心 一种基于神经网络的现场作业违章行为分析方法及系统
CN113792744B (zh) * 2021-09-14 2023-09-05 东北农业大学 一种低功耗广域网内农作物生长数据传输系统及方法
CN113689356B (zh) * 2021-09-14 2023-11-24 三星电子(中国)研发中心 一种图像修复的方法和装置
CN113763373B (zh) * 2021-09-17 2023-10-13 上海交通大学 域泛化的尺度对齐翻拍图片检测系统
CN113868449A (zh) * 2021-09-22 2021-12-31 西安理工大学 基于多尺度特征与空间注意力机制融合的图像检索方法
CN113837080B (zh) * 2021-09-24 2023-07-25 江西理工大学 一种基于信息增强与感受野增强的小目标检测方法
CN113780241B (zh) * 2021-09-29 2024-02-06 北京航空航天大学 一种显著物体检测的加速方法与装置
CN113869418A (zh) * 2021-09-29 2021-12-31 哈尔滨工程大学 一种基于全局注意力关系网络的小样本船舶目标识别方法
CN113888501B (zh) * 2021-09-29 2024-02-06 西安理工大学 一种基于注意力定位网络的无参考型图像质量评价方法
CN113947782A (zh) * 2021-10-14 2022-01-18 哈尔滨工程大学 一种基于注意力机制的行人目标对齐方法
CN113920472A (zh) * 2021-10-15 2022-01-11 中国海洋大学 一种基于注意力机制的无监督目标重识别方法及系统
CN113947144B (zh) 2021-10-15 2022-05-17 北京百度网讯科技有限公司 用于对象检测的方法、装置、设备、介质和程序产品
CN114022930B (zh) * 2021-10-28 2024-04-16 天津大学 一种人像证件照自动生成方法
CN114021458B (zh) * 2021-11-05 2022-11-04 西安晟昕科技发展有限公司 基于并行原型网络的小样本雷达辐射源信号识别方法
CN114332007A (zh) * 2021-12-28 2022-04-12 福州大学 一种基于Transformer的工业缺陷检测和识别方法
CN114419671B (zh) * 2022-01-18 2024-03-26 北京工业大学 一种基于超图神经网络的遮挡行人重识别方法
CN114596218B (zh) * 2022-01-25 2023-11-07 西北大学 基于卷积神经网络的古代绘画图像修复方法、模型和装置
CN114638256A (zh) * 2022-02-22 2022-06-17 合肥华威自动化有限公司 基于声波信号及注意力网络的变压器故障检测方法及其系统
CN114548132A (zh) * 2022-02-22 2022-05-27 广东奥普特科技股份有限公司 条形码检测模型的训练方法、装置及条形码检测方法、装置
CN114581560B (zh) * 2022-03-01 2024-04-16 西安交通大学 基于注意力机制的多尺度神经网络红外图像彩色化方法
CN114821699B (zh) * 2022-03-02 2024-03-08 西北工业大学 一种基于抑制模糊度自训练的人脸表情识别方法
CN114693693A (zh) * 2022-03-31 2022-07-01 四川大学华西医院 一种基于卷积神经网络的胎儿胼胝体超声图像分割方法
CN114742800B (zh) * 2022-04-18 2024-02-20 合肥工业大学 基于改进Transformer的强化学习电熔镁炉工况识别方法
CN114882590B (zh) * 2022-05-06 2024-04-02 中国科学技术大学 一种基于事件相机的多粒度时空特征感知的唇读方法
CN114926877B (zh) * 2022-05-10 2024-02-20 西北工业大学 一种基于对比域差异的跨域人脸表情识别方法
CN114973317B (zh) * 2022-05-13 2023-04-28 杭州像素元科技有限公司 一种基于多尺度邻接交互特征的行人重识别方法
CN115035170B (zh) * 2022-05-17 2024-03-05 合肥工业大学 基于全局纹理与结构的图像修复方法
CN115050048B (zh) * 2022-05-25 2023-04-18 杭州像素元科技有限公司 一种基于局部细节特征的跨模态行人重识别方法
CN114937199B (zh) * 2022-07-22 2022-10-25 山东省凯麟环保设备股份有限公司 一种基于判别性特征增强的垃圾分类方法与系统
CN115082966B (zh) * 2022-07-22 2022-12-06 中国科学院自动化研究所 行人重识别模型训练方法、行人重识别方法、装置和设备
CN115546223A (zh) * 2022-12-05 2022-12-30 南京天创电子技术有限公司 一种列车车下设备紧固螺栓的缺失检测方法和系统
CN115950888B (zh) * 2023-01-09 2024-04-09 湖南艾科瑞生物工程有限公司 qPCR孔板的质量检测方法及相关设备
CN115862120B (zh) * 2023-02-21 2023-11-10 天度(厦门)科技股份有限公司 可分离变分自编码器解耦的面部动作单元识别方法及设备
CN116188436B (zh) * 2023-03-03 2023-11-10 合肥工业大学 基于局部特征和全局特征融合的膀胱镜图像分类方法
CN116563615B (zh) * 2023-04-21 2023-11-07 南京讯思雅信息科技有限公司 基于改进多尺度注意力机制的不良图片分类方法
CN116311483B (zh) * 2023-05-24 2023-08-01 山东科技大学 基于局部面部区域重构和记忆对比学习的微表情识别方法
CN116311387B (zh) * 2023-05-25 2023-09-01 浙江工业大学 一种基于特征交集的跨模态行人重识别方法
CN116342363B (zh) * 2023-05-31 2023-07-28 齐鲁工业大学(山东省科学院) 基于两阶段深度神经网络的可见水印去除方法
CN116758631B (zh) * 2023-06-13 2023-12-22 杭州追形视频科技有限公司 大数据驱动的行为智能分析方法及系统
CN116432870B (zh) * 2023-06-13 2023-10-10 齐鲁工业大学(山东省科学院) 一种城市流量预测方法
CN116630639B (zh) * 2023-07-20 2023-12-12 深圳须弥云图空间科技有限公司 对象图像的识别方法及装置
CN116612122B (zh) * 2023-07-20 2023-10-10 湖南快乐阳光互动娱乐传媒有限公司 图像显著性区域的检测方法及装置、存储介质及电子设备
CN116958148B (zh) * 2023-09-21 2023-12-12 曲阜师范大学 输电线路关键部件缺陷的检测方法、装置、设备、介质
CN117252892B (zh) * 2023-11-14 2024-03-08 江西师范大学 基于轻量化视觉自注意力网络的双分支人像自动抠图装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427927A (zh) * 2018-03-16 2018-08-21 深圳市商汤科技有限公司 目标再识别方法和装置、电子设备、程序和存储介质
CN110070073A (zh) * 2019-05-07 2019-07-30 国家广播电视总局广播电视科学研究院 基于注意力机制的全局特征和局部特征的行人再识别方法
CN110188611A (zh) * 2019-04-26 2019-08-30 华中科技大学 一种引入视觉注意力机制的行人重识别方法及系统
CN110533024A (zh) * 2019-07-10 2019-12-03 杭州电子科技大学 基于多尺度roi特征的双二次池化细粒度图像分类方法
CN110598654A (zh) * 2019-09-18 2019-12-20 合肥工业大学 多粒度交叉模态特征融合行人再识别方法和再识别系统
CN110647794A (zh) * 2019-07-12 2020-01-03 五邑大学 基于注意力机制的多尺度sar图像识别方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9436895B1 (en) * 2015-04-03 2016-09-06 Mitsubishi Electric Research Laboratories, Inc. Method for determining similarity of objects represented in images
AU2018236433B2 (en) * 2017-03-17 2022-03-03 Magic Leap, Inc. Room layout estimation methods and techniques
JP2018160200A (ja) * 2017-03-24 2018-10-11 富士通株式会社 ニューラルネットワークの学習方法、ニューラルネットワークの学習プログラム及びニューラルネットワークの学習装置
JP6822929B2 (ja) * 2017-09-19 2021-01-27 株式会社東芝 情報処理装置、画像認識方法および画像認識プログラム
US10515295B2 (en) * 2017-10-27 2019-12-24 Adobe Inc. Font recognition using triplet loss neural network training
JP7124404B2 (ja) * 2018-04-12 2022-08-24 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置
JP6935868B2 (ja) * 2018-05-11 2021-09-15 日本電信電話株式会社 画像認識装置、画像認識方法、およびプログラム
US11651206B2 (en) * 2018-06-27 2023-05-16 International Business Machines Corporation Multiscale feature representations for object recognition and detection
JP7372017B2 (ja) * 2018-07-03 2023-10-31 株式会社神戸製鋼所 鋼材成分学習装置、鋼材成分推定装置、鋼種判定装置、鋼材成分学習方法、鋼材成分推定方法、鋼種判定方法、及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427927A (zh) * 2018-03-16 2018-08-21 深圳市商汤科技有限公司 目标再识别方法和装置、电子设备、程序和存储介质
CN110188611A (zh) * 2019-04-26 2019-08-30 华中科技大学 一种引入视觉注意力机制的行人重识别方法及系统
CN110070073A (zh) * 2019-05-07 2019-07-30 国家广播电视总局广播电视科学研究院 基于注意力机制的全局特征和局部特征的行人再识别方法
CN110533024A (zh) * 2019-07-10 2019-12-03 杭州电子科技大学 基于多尺度roi特征的双二次池化细粒度图像分类方法
CN110647794A (zh) * 2019-07-12 2020-01-03 五邑大学 基于注意力机制的多尺度sar图像识别方法及装置
CN110598654A (zh) * 2019-09-18 2019-12-20 合肥工业大学 多粒度交叉模态特征融合行人再识别方法和再识别系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
H. CAI ET AL: "Multi-Scale Body-Part Mask Guided Attention for Person Re-Identification", 《2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION WORKSHOPS》 *

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814854A (zh) * 2020-06-28 2020-10-23 北京交通大学 一种无监督域适应的目标重识别方法
CN111814854B (zh) * 2020-06-28 2023-07-28 北京交通大学 一种无监督域适应的目标重识别方法
CN111814705A (zh) * 2020-07-14 2020-10-23 广西师范大学 一种基于批次分块遮挡网络的行人再辨识方法
CN111814705B (zh) * 2020-07-14 2022-08-02 广西师范大学 一种基于批次分块遮挡网络的行人再辨识方法
CN112084338A (zh) * 2020-09-18 2020-12-15 达而观数据(成都)有限公司 一种文档自动归类方法、系统、计算机设备及存储介质
CN112084338B (zh) * 2020-09-18 2024-02-06 达而观数据(成都)有限公司 一种文档自动归类方法、系统、计算机设备及存储介质
CN112183295A (zh) * 2020-09-23 2021-01-05 上海眼控科技股份有限公司 行人重识别方法、装置、计算机设备及存储介质
CN112200111A (zh) * 2020-10-19 2021-01-08 厦门大学 一种全局与局部特征融合的遮挡鲁棒行人重识别方法
CN112200111B (zh) * 2020-10-19 2022-05-17 厦门大学 一种全局与局部特征融合的遮挡鲁棒行人重识别方法
CN112464775A (zh) * 2020-11-21 2021-03-09 西北工业大学 一种基于多分支网络的视频目标重识别方法
CN112434599A (zh) * 2020-11-23 2021-03-02 同济大学 一种基于噪声通道的随机遮挡恢复的行人重识别方法
CN112434796A (zh) * 2020-12-09 2021-03-02 同济大学 一种基于局部信息学习的跨模态行人再识别方法
CN112396036A (zh) * 2020-12-09 2021-02-23 中山大学 一种结合空间变换网络和多尺度特征提取的遮挡行人重识别方法
CN112396036B (zh) * 2020-12-09 2023-08-08 中山大学 一种结合空间变换网络和多尺度特征提取的遮挡行人重识别方法
CN112434796B (zh) * 2020-12-09 2022-10-25 同济大学 一种基于局部信息学习的跨模态行人再识别方法
CN112749667A (zh) * 2021-01-15 2021-05-04 中国科学院宁波材料技术与工程研究所 一种基于深度学习的线虫分类识别方法
CN112749667B (zh) * 2021-01-15 2023-04-07 中国科学院宁波材料技术与工程研究所 一种基于深度学习的线虫分类识别方法
CN112785479A (zh) * 2021-01-21 2021-05-11 南京信息工程大学 一种基于少样本学习的图像隐形水印通用检测方法
CN112785479B (zh) * 2021-01-21 2023-05-23 南京信息工程大学 一种基于少样本学习的图像隐形水印通用检测方法
CN112883880A (zh) * 2021-02-25 2021-06-01 电子科技大学 一种基于人体结构多尺度分割的行人属性识别方法、存储介质和终端
CN113158815A (zh) * 2021-03-27 2021-07-23 复旦大学 一种无监督行人重识别方法、系统及计算机可读介质
CN113312961A (zh) * 2021-04-03 2021-08-27 国家计算机网络与信息安全管理中心 一种logo识别加速方法
CN113239776A (zh) * 2021-05-10 2021-08-10 北方工业大学 一种基于能量模型的行人重识别方法
CN113128466B (zh) * 2021-05-11 2023-12-05 深圳大学 行人重识别方法、系统、电子装置及存储介质
CN113128466A (zh) * 2021-05-11 2021-07-16 深圳大学 行人重识别方法、系统、电子装置及存储介质
CN113239784A (zh) * 2021-05-11 2021-08-10 广西科学院 一种基于空间序列特征学习的行人重识别系统及方法
CN113283320A (zh) * 2021-05-13 2021-08-20 桂林安维科技有限公司 一种基于通道特征聚合的行人重识别方法
CN113656628B (zh) * 2021-05-24 2023-03-28 江苏省特种设备安全监督检验研究院 一种基于注意力机制和特征融合的起重机图像检索方法
CN113656628A (zh) * 2021-05-24 2021-11-16 江苏省特种设备安全监督检验研究院 一种基于注意力机制和特征融合的起重机图像检索方法
CN113537032B (zh) * 2021-07-12 2023-11-28 南京邮电大学 一种基于图片分块丢弃的分集多支路行人重识别方法
CN113537032A (zh) * 2021-07-12 2021-10-22 南京邮电大学 一种基于图片分块丢弃的分集多支路行人重识别方法
CN113780243A (zh) * 2021-09-29 2021-12-10 平安科技(深圳)有限公司 行人图像识别模型的训练方法、装置、设备以及存储介质
CN113780243B (zh) * 2021-09-29 2023-10-17 平安科技(深圳)有限公司 行人图像识别模型的训练方法、装置、设备以及存储介质
CN113963150B (zh) * 2021-11-16 2022-04-08 北京中电兴发科技有限公司 一种基于多尺度孪生级联网络的行人重识别方法
CN113963150A (zh) * 2021-11-16 2022-01-21 北京中电兴发科技有限公司 一种基于多尺度孪生级联网络的行人重识别方法
CN114743128A (zh) * 2022-03-09 2022-07-12 华侨大学 一种基于异种神经网络的多模态东北虎再辨识方法及装置
CN115050044A (zh) * 2022-04-02 2022-09-13 广西科学院 一种基于MLP-Mixer的跨模态行人重识别方法
CN115050044B (zh) * 2022-04-02 2023-06-23 广西科学院 一种基于MLP-Mixer的跨模态行人重识别方法
CN116721351A (zh) * 2023-07-06 2023-09-08 内蒙古电力(集团)有限责任公司内蒙古超高压供电分公司 一种架空线路通道内道路环境特征遥感智能提取方法

Also Published As

Publication number Publication date
JP2021117969A (ja) 2021-08-10
CN111259850B (zh) 2022-12-16
JP6830707B1 (ja) 2021-02-17

Similar Documents

Publication Publication Date Title
CN111259850B (zh) 一种融合随机批掩膜和多尺度表征学习的行人重识别方法
CN110348376B (zh) 一种基于神经网络的行人实时检测方法
CN111709311B (zh) 一种基于多尺度卷积特征融合的行人重识别方法
Tao et al. Smoke detection based on deep convolutional neural networks
CN107341452B (zh) 基于四元数时空卷积神经网络的人体行为识别方法
CN107016357B (zh) 一种基于时间域卷积神经网络的视频行人检测方法
CN108830188A (zh) 基于深度学习的车辆检测方法
CN111325111A (zh) 一种融合逆注意力和多尺度深度监督的行人重识别方法
CN111783576B (zh) 基于改进型YOLOv3网络和特征融合的行人重识别方法
CN111767882A (zh) 一种基于改进yolo模型的多模态行人检测方法
CN108388896A (zh) 一种基于动态时序卷积神经网络的车牌识别方法
CN107463892A (zh) 一种结合上下文信息和多级特征的图像中行人检测方法
CN111931624A (zh) 基于注意力机制的轻量级多分支行人重识别方法及系统
CN104504395A (zh) 基于神经网络实现人车分类的方法和系统
CN114067444A (zh) 基于元伪标签和光照不变特征的人脸欺骗检测方法和系统
CN110097029B (zh) 基于Highway网络多视角步态识别的身份认证方法
CN108520203A (zh) 基于融合自适应多外围框与十字池化特征的多目标特征提取方法
CN113610046B (zh) 一种基于深度视频联动特征的行为识别方法
CN112149616A (zh) 基于动态信息的人物交互行为识别方法
CN110298248A (zh) 一种基于语义分割的多目标跟踪方法及系统
CN109472733A (zh) 基于卷积神经网络的图像隐写分析方法
CN111339967B (zh) 一种基于多视域图卷积网络的行人检测方法
CN115496971A (zh) 一种红外目标检测方法、装置、电子设备及存储介质
CN115393788B (zh) 一种基于增强全局信息注意力的多尺度监控行人重识别方法
Putro et al. Fast person detector with efficient multi-level contextual block for supporting assistive robot

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant