CN110929679A - 一种基于gan的无监督自适应行人重识别方法 - Google Patents

一种基于gan的无监督自适应行人重识别方法 Download PDF

Info

Publication number
CN110929679A
CN110929679A CN201911234544.3A CN201911234544A CN110929679A CN 110929679 A CN110929679 A CN 110929679A CN 201911234544 A CN201911234544 A CN 201911234544A CN 110929679 A CN110929679 A CN 110929679A
Authority
CN
China
Prior art keywords
training
picture
model
data set
gan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911234544.3A
Other languages
English (en)
Other versions
CN110929679B (zh
Inventor
殷海兵
郑声晟
章天杰
黄晓峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Electronic Science and Technology University
Original Assignee
Hangzhou Electronic Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Electronic Science and Technology University filed Critical Hangzhou Electronic Science and Technology University
Priority to CN201911234544.3A priority Critical patent/CN110929679B/zh
Publication of CN110929679A publication Critical patent/CN110929679A/zh
Application granted granted Critical
Publication of CN110929679B publication Critical patent/CN110929679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于GAN的无监督自适应行人重识别方法,包括如下步骤:步骤一,源域训练,在带有标签的源数据集上预训练CNN模型,通过采用批量归一化、一个全连接层、Adam优化器代替SGD,共同作用来训练CNN模型,解决了在源数据集上预训练CNN模型基线性能不足的问题;步骤二,自训练,采用所述预训练的CNN模型提取无标签目标数据集的特征,通过聚类获得伪标签,通过GAN来调整所述聚类,通过所述聚类获得的伪标签训练所述CNN模型。

Description

一种基于GAN的无监督自适应行人重识别方法
技术领域
本发明涉及智能监控领域,尤其是涉及了一种基于GAN(Generative AdversarialNetworks,生成式对抗网络)的无监督自适应行人重识别方法。
背景技术
随着城市人口的不断增长和视频监控系统的大量普及,社会公共安全问题越来越受到人们的重视。为了增强摄像头网络的安防水平,行人重识别技术在人员检索上也得到了广泛关注。行人重识别,也称行人再识别,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。当前行人重识别方法主要通过基于特定场景下大量带标签的视频图像数据训练出一个稳定可靠的模型,但是这类监督学习方法忽略了在实际应用中系统对新场景的适应性,并且依赖于大量带标签的行人数据,而标签工作往往需要耗费大量的人力和物力,不利于系统的部署。此外由于行人图像都存在光照变化,视角姿势变化与遮挡等诸多挑战,仅仅利用无标签的数据进行无监督学习也难以达到令人满意的性能。
近年来,随着迁移学习研究的深入和发展,通过迁移学习算法思想,将在带标签源数据集上训练所得的网络模型应用到无标签目标数据集的学习任务中,从而实现了较高的识别准确率。但当前迁移学习主要解决不同数据域存在共同类别的问题,行人重识别在不同场景往往不存在相同的行人,故难以直接应用于解决行人重识别问题。因此如何利用旧场景的带标签行人数据以及新场景下的无标签行人数据进行迁移学习,从而实现在新场景下的高识别准确率是目前亟待解决的问题。
该方法提出了一种适用于无监督域自适应重识别(Re-identification,reID)任务的新型自训练方案,分为源域训练和自训练两部分。首先进行源域训练,即在带有标签的源数据集上预训练CNN(Convolutional Neural Networks,卷积神经网络)模型,或称特征提取器。然后进行自训练,采用预训练的CNN模型提取无标签目标数据集的特征并聚类猜测目标数据,最后基于聚类得到的伪标签来训练CNN模型。但是该方法会导致识别准确率不高的缺陷有两点,一是在源数据集上预训练CNN模型基线性能不足,二是在自训练聚类猜测目标数据标签的过程中聚类的效果不佳导致reID识别准确率较低。
发明内容
为解决现有技术的不足,实现更高识别准确率的目的,本发明采用如下的技术方案:
一种基于GAN的无监督自适应行人重识别方法,包括如下步骤:
步骤一,源域训练,在带有标签的源数据集上预训练CNN模型,包括如下步骤:
(1)将待识别的行人图片输入所述CNN模型的骨干网络中;
(2)将所述骨干网络中最后一个全局池化层产生的全局池化特征输入到批量归一化层中生成最终的特征表示;批量归一化可以提供更稳定的梯度,这减轻了对预训练模型的不必要干扰,在实验中,批量归一化通常会有更快的收敛速度和更好的性能。
(3)使用一个全连接层,对所述最终的特征表示执行行人的ID分类;传统的方法有两个全连接层,删除第一个全连接层以提高最终效果,同时,由于减少了第一个全连接层,在softmax损失的梯度可以直接返回到卷积层,有利于减轻过度拟合的问题,以确保测试性能;
(4)通过softmax对所属全连接层的分类结果进行归一化处理;
步骤二,自训练,采用所述预训练的CNN模型提取无标签目标数据集的特征,通过聚类获得伪标签,通过所述伪标签训练所述CNN模型,包括如下步骤:
(1)利用在源域上训练好的所述CNN模型提取无标签目标数据集的特征,获得大小为mt×mt的矩阵M,其中Mij=||xi-xj||2为矩阵中xi和xj之间的距离,mt表示M矩阵的大小,其值为所述目标数据集图片总数,xi、xj表示矩阵M中的元素,源数据集与目标数据集之间的距离矩阵表示为:
d(xi,xj)=(1-λ)dJ(xi,xj)+λ(dW(xi)+dW(xj))
Figure BDA0002304526140000021
Figure BDA0002304526140000022
所述λ∈[0,1]表示平衡参数,所述NS(xi)表示源数据集S与xi最近的元素;
(2)采用DBSCAN(Density-Based Spatial Clustering of Applications withNoise,具有噪声的基于密度的聚类方法)进行聚类,获得伪标签;
D=DBSCAN(MST,τ,n)
所述D表示数据,包括图片及其伪标签,所述τ为半径,其取值为所述MST内前1.6‰元素的平均值,所述n为密度阈值;
(3)通过所述聚类获得的伪标签训练所述CNN模型。
所述步骤一,还包括(5)采用Adam优化器来训练所述CNN模型;Adam是基于低阶矩的自适应估计的优化算法,它使梯度变化更平滑的同时,减轻了对预先训练的所述CNN模型的不必要的干扰,防止了过度拟合;
所述Adam优化器的参数如下:
Figure BDA0002304526140000031
所述t表示时间步长,所述gt表示t时刻的梯度,所述
Figure BDA0002304526140000032
表示求ft关于θ的梯度,所述f表示目标函数,Θt表示更新的参数,所述mt表示一阶矩的估计,即mean均值,所诉vt表示二阶矩的估计,即variance方差,所述
Figure BDA0002304526140000033
表示对mean进行校正后的mean,所述
Figure BDA0002304526140000034
表示t时刻的β1,所述
Figure BDA0002304526140000035
表示对variance进行校正后的variance,所述
Figure BDA0002304526140000036
表示t时刻的β2,所述α表示学习率,所述β1、β2和ε是超参数。
所述超参数设置为β1=0.9,β2=0.999,ε=10-8
通过采用批量归一化、一个全连接层、Adam优化器,共同作用来训练CNN模型,解决了在源数据集上预训练CNN模型基线性能不足的问题。
所述步骤二,还包括(3)通过GAN来调整所述聚类,通过所述聚类获得的伪标签训练所述CNN模型,解决了在自训练聚类猜测目标数据标签的过程中聚类的效果不佳,导致reID识别准确率较低的问题;包括如下步骤:
(a)训练阶段,根据所述聚类结果,对所述类中的各个不同ID的行人图片数量进行统计;取出每个类中相同ID行人图片数量最多的行人相应的图片,并计算人体关键点生成热图;挑选质量合格的图片进行同一ID行人不同姿势的图片随机配对训练所述GAN;
所述GAN包括生成模型G(Generator)和判别模型D(Discriminator),在所述训练过程中,所述生成模型根据原图片和目标图片不断生成出样本图片,将所述目标图片和所述样本图片输送到判别模型中,所述判别模型在所述目标图片和所述样本图片中,识别出目标图片;所述生成模型最大化所述判别模型出错的概率,这样就形成了互相博弈的过程,公式如下:
Figure BDA0002304526140000037
所述
Figure BDA0002304526140000038
和所述
Figure BDA0002304526140000039
分别是求最小和求最大的运算符号,所述LGAN表示所述GAN的损失函数,所述
Figure BDA00023045261400000310
和所述
Figure BDA00023045261400000311
分别是取期望的运算符号,所述D(x)表示对原图片的判断,所述G(z)表示生成的样本图片,所述D(G(z))表示对样本图片的判断,所述x表示原图片,所述z表示原图片和目标图片,所述Pdata(x)和所述Pz(z)分别是所述x的分布和高斯分布z~N(0,1);
在所述训练过程中,分别使用公式LD=-LGAN和LG=LGAN迭代更新所述生成模型G和所述判别模型D的参数;所述LD表示判别模型D的损失函数,所述LG表示生成模型G的损失函数;
(b)生成阶段,从所述训练阶段选定一组规范姿势,利用训练好的所述GAN将目标数据集图片生成对应规范姿势的图片,将所述生成对应规范姿势的图片与所述目标数据集图片一起放入所述自训练的聚类中;
(c)调整阶段,根据所述自训练聚类结果,找出每一个类中,图片数量最多的行人身份ID,若某一ID的行人图片数量占比最多的类存在多个,则进行聚类调整,将调整后的结果作为所述伪标签放入所述自训练中对所述目标数据集进行训练。所述聚类调整,以生成的规范姿势图片为纽带,将同一ID图片错分的多个类重新合并成一个类。
所述步骤(a),所述质量合格的图片,是指所述人体关键点存在一半以上的图片。
所述步骤(b),所述一组规范姿势,至少有四个以上,且不同角度的姿势。
本发明的优势和有益效果在于:
本法明通过调整在源数据集上预训练CNN模型基线可以提高模型识别准确率,在原有框架上提高了2%的性能;通过生成式对抗网络GAN调整聚类,解决了在自训练聚类猜测目标数据标签的过程中,由于姿势不同或摄像头角度变化导致的聚类效果不佳,进而导致重识别reID的识别准确率较低的问题,在调整后的框架上,可以提高11%的识别准确率。
附图说明
图1是本发明中CNN模型基线主要技术流程图。
图2是本发明中调整聚类的流程图。
图3是本发明中因姿势的不同错将同一ID的行人分成两类的示意图。
图4是本发明中规范姿势示意图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
一种基于GAN的无监督自适应行人重识别方法,包括如下步骤:
步骤一,源域训练,在带有标签的源数据集上预训练CNN模型,包括如下步骤:
(1)将待识别的行人图片输入所述CNN模型的骨干网络中,CNN模型采用Resnet50网络;
(2)将所述骨干网络中最后一个全局池化层产生的全局池化特征输入到批量归一化层中生成最终的特征表示,即图1中的IDs;由于Resnet是在较大数据集(例如ImageNet)进行训练所得,为防止将该模型直接应用于较小数据集(例如reID数据集)所造成高方差、低偏差的过拟合问题,需要对Resnet模型进行微调;常见的方法是使用Dropout,但在训练过程中,Dropout会随机丢弃隐藏神经元的输出,如图1所示,本发明采用在全局特征池层之后执行批量归一化,与Dropout相比,批量归一化可以提供更稳定的梯度,这减轻了对预训练模型的不必要干扰,在实验中,批量归一化通常会有更快的收敛速度和更好的性能。
(3)使用一个全连接层,对所述最终的特征表示执行行人的ID分类;传统的方法有两个全连接层,第一个全连接层起到“瓶颈”的作用,以进行特征维数的减小,而第二个全连接层执行人的ID分类,由于第一个全连接层起到的“瓶颈”作用实质上会导致最终效果的下降,因此,删除第一个全连接层以提高最终效果,同时,由于减少了第一个全连接层,在softmax损失的梯度可以直接返回到卷积层,有利于减轻过度拟合的问题,以确保测试性能;
(4)通过softmax对所属全连接层的分类结果进行归一化处理;
(5)采用Adam优化器来训练所述CNN模型;传统的行人重新识别技术选择随机梯度下降(Stochastic Gradient Descent,SGD)来训练CNN模型,与SGD相比,Adam是基于低阶矩的自适应估计的优化算法,它使梯度变化更平滑的同时,减轻了对预先训练的所述CNN模型的不必要的干扰,防止了过度拟合。
所述Adam优化器的参数如下:
Figure BDA0002304526140000051
所述t表示时间步长,所述gt表示t时刻的梯度,所述
Figure BDA0002304526140000052
表示求ft关于θ的梯度,所述f表示目标函数,Θt表示更新的参数,所述mt表示一阶矩的估计,即mean均值,所诉vt表示二阶矩的估计,即variance方差,所述
Figure BDA0002304526140000053
表示对mean进行校正后的mean,所述
Figure BDA0002304526140000054
表示t时刻的β1,所述
Figure BDA0002304526140000055
表示对variance进行校正后的variance,所述
Figure BDA0002304526140000056
表示t时刻的β2,所述α表示学习率,所述β1、β2和ε是超参数。
所述超参数设置为β1=0.9,β2=0.999,ε=10-8
通过采用批量归一化、一个全连接层、Adam优化器代替SGD,共同作用来训练CNN模型,解决了在源数据集上预训练CNN模型基线性能不足的问题。
步骤二,自训练,采用所述预训练的CNN模型提取无标签目标数据集的特征,通过聚类获得伪标签,即聚类猜测目标数据标签,通过GAN来调整所述聚类,通过所述聚类获得的伪标签训练所述CNN模型,包括如下步骤:
(1)利用在源域上训练好的所述CNN模型提取无标签目标数据集的特征,获得大小为mt×mt的矩阵M,其中Mij=||xi-xj||2为矩阵中xi和xj之间的距离,mt表示M矩阵的大小,其值为所述目标数据集图片总数,xi、xj表示矩阵M中的元素,源数据集与目标数据集之间的距离矩阵表示为:
d(xi,xj)=(1-λ)dJ(xi,xj)+λ(dW(xi)+dW(xj))
Figure BDA0002304526140000061
Figure BDA0002304526140000063
所述λ∈[0,1]表示平衡参数,所述NS(xi)表示源数据集S与xi最近的元素;源数据集和目标数据集都是行人图片,实验中源数据集用的是Martket1501数据集,目标数据集用的是DukeMTMC-reID数据集;
(2)采用DBSCAN进行聚类,获得伪标签;所述聚类方法是将具有足够密度的区域划分为类,在具有噪声的空间数据库中发现任意形状的类,并将类定义为密度相连的点的最大集合;
D=DBSCAN(MST,τ,n)
所述D表示数据,包括图片及其伪标签,所述τ为半径,其取值为所述MST内前1.6‰元素的平均值,所述n为密度阈值;
但是,在聚类时,由于行人姿势不同或摄像头角度不同等原因,常常将同一ID的行人图片错分为多个类,如图3所示。在实验中,虽然聚类结果显示将目标图片数据集(dukemtmc训练集)分为1009个类,即使与实际ID数702个较为接近,但是根据公式:
Figure BDA0002304526140000062
得到的兰德系数(Rand Index,RI)仅为43.96%,其中TP为真阳性,TN为真阴性,FP为假阳性,FN为假阴性。因此,针对这一问题,通过GAN网络来调整聚类。
(3)通过GAN来调整所述聚类,通过所述聚类获得的伪标签训练所述CNN模型,解决了在自训练聚类猜测目标数据标签的过程中聚类的效果不佳,导致reID识别准确率较低的问题;包括如下步骤:
(a)训练阶段,根据所述聚类结果,对所述1009个类中的各个不同ID的行人图片数量进行统计;取出每个类中相同ID行人图片数量最多的行人相应的图片,并计算人体关键点生成热图;挑选质量合格的图片进行同一ID行人不同姿势的图片随机配对训练所述GAN;所述质量合格的图片,是指所述人体关键点存在一半以上的图片。
所述GAN包括生成模型G(Generator)和判别模型D(Discriminator),在所述训练过程中,所述生成模型根据原图片和目标图片不断生成出样本图片,将所述目标图片和所述样本图片输送到判别模型中,所述判别模型在所述目标图片和所述样本图片中,尽可能识别出目标图片;所述生成模型最大化所述判别模型出错的概率,这样就形成了互相博弈的过程,公式如下:
Figure BDA0002304526140000071
所述
Figure BDA0002304526140000072
和所述
Figure BDA0002304526140000073
分别是求最小和求最大的运算符号,所述LGAN表示所述GAN的损失函数,所述
Figure BDA0002304526140000074
和所述
Figure BDA0002304526140000075
分别是取期望的运算符号,所述D(x)表示对原图片的判断,所述G(z)表示生成的样本图片,所述D(G(z))表示对样本图片的判断,所述x表示原图片,所述z表示原图片和目标图片,所述Pdata(x)和所述Pz(z)分别是所述x的分布和高斯分布z~N(0,1);
在所述训练过程中,分别使用公式LD=-LGAN和LG=LGAN迭代更新所述生成模型G和所述判别模型D的参数;所述LD表示判别器D的损失函数,所述LG表示生成器G的损失函数;
(b)生成阶段,从所述训练阶段选定一组规范姿势,利用训练好的所述GAN将目标数据集图片生成对应规范姿势的图片,将所述生成对应规范姿势的图片与所述目标数据集图片一起放入所述自训练的聚类中;所述一组规范姿势,至少有四个以上,且不同角度的姿势。如图4所示,这里选取了前后左右四个方向的姿势作为规范姿势,也可以选择8个,每45°选取一个姿势,理论上越多效果越好。
(c)调整阶段,根据所述自训练聚类结果,找出每一个类中,图片数量最多的行人身份ID,若某一ID的行人图片数量占比最多的类存在多个,则进行聚类调整,将调整后的结果作为所述伪标签放入所述自训练中对所述目标数据集进行训练。所述聚类调整,以生成的规范姿势图片为纽带,将同一ID图片错分的多个类重新合并成一个类;例如,某个ID的行人图片数量占比最多的类有两个,分别称为类1和类2,如果在类1中存在由类2里目标数据集图片生成的规范姿势图片,或者在类2中存在由类1里目标数据集图片生成的规范姿势图片,则将类1和类2合并成一类。

Claims (6)

1.一种基于GAN的无监督自适应行人重识别方法,其特征在于,包括如下步骤:
步骤一,源域训练,在带有标签的源数据集上预训练CNN模型,包括如下步骤:
(1)将待识别的行人图片输入所述CNN模型的骨干网络中;
(2)将所述骨干网络中最后一个全局池化层产生的全局池化特征输入到批量归一化层中生成最终的特征表示;
(3)使用一个全连接层,对所述最终的特征表示执行行人的ID分类;
(4)通过softmax对所属全连接层的分类结果进行归一化处理;
步骤二,自训练,采用所述预训练的CNN模型提取无标签目标数据集的特征,通过聚类获得伪标签,通过所述伪标签训练所述CNN模型,包括如下步骤:
(1)利用在源域上训练好的所述CNN模型提取无标签目标数据集的特征,获得大小为mt×mt的矩阵M,其中Mij=||xi-xj||2为矩阵中xi和xj之间的距离,mt表示M矩阵的大小,其值为所述目标数据集图片总数,xi、xj表示矩阵M中的元素,源数据集与目标数据集之间的距离矩阵表示为:
d(xi,xj)=(1-λ)dJ(xi,xj)+λ(dW(xi)+dW(xj))
Figure FDA0002304526130000011
Figure FDA0002304526130000012
所述λ∈[0,1]表示平衡参数,所述NS(xi)表示源数据集S与xi最近的元素;
(2)采用DBSCAN进行聚类,获得伪标签;
D=DBSCAN(MST,τ,n)
所述D表示数据,包括图片及其伪标签,所述τ为半径,其取值为所述MST内前1.6‰元素的平均值,所述n为密度阈值;
(3)通过所述聚类获得的伪标签训练所述CNN模型。
2.根据权利要求1所述的一种基于GAN的无监督自适应行人重识别方法,其特征在于,所述步骤一,还包括(5)采用Adam优化器来训练所述CNN模型;
所述Adam优化器的参数如下:
Figure FDA0002304526130000013
所述t表示时间步长,所述gt表示t时刻的梯度,所述
Figure FDA0002304526130000021
表示求ft关于θ的梯度,所述f表示目标函数,Θt表示更新的参数,所述mt表示一阶矩的估计,即mean均值,所诉vt表示二阶矩的估计,即variance方差,所述
Figure FDA0002304526130000022
表示对mean进行校正后的mean,所述
Figure FDA0002304526130000023
表示t时刻的β1,所述
Figure FDA0002304526130000024
表示对variance进行校正后的variance,所述
Figure FDA0002304526130000025
表示t时刻的β2,所述α表示学习率,所述β1、β2和ε是超参数。
3.根据权利要求2所述的一种基于GAN的无监督自适应行人重识别方法,其特征在于,所述超参数设置为β1=0.9,β2=0.999,ε=10-8
4.根据权利要求1所述的一种基于GAN的无监督自适应行人重识别方法,其特征在于,所述步骤二,还包括(3)通过GAN来调整所述聚类,通过所述聚类获得的伪标签训练所述CNN模型,包括如下步骤:
(a)训练阶段,根据所述聚类结果,对所述类中的各个不同ID的行人图片数量进行统计;取出每个类中相同ID行人图片数量最多的行人相应的图片,并计算人体关键点生成热图;挑选质量合格的图片进行同一ID行人不同姿势的图片随机配对训练所述GAN;
所述GAN包括生成模型G和判别模型D,在所述训练过程中,所述生成模型根据原图片和目标图片不断生成出样本图片,将所述目标图片和所述样本图片输送到判别模型中,所述判别模型在所述目标图片和所述样本图片中,识别出目标图片;所述生成模型最大化所述判别模型出错的概率,公式如下:
Figure FDA0002304526130000026
所述
Figure FDA0002304526130000027
和所述
Figure FDA0002304526130000028
分别是求最小和求最大的运算符号,所述LGAN表示所述GAN的损失函数,所述
Figure FDA0002304526130000029
和所述
Figure FDA00023045261300000210
分别是取期望的运算符号,所述D(x)表示对原图片的判断,所述G(z)表示生成的样本图片,所述D(G(z))表示对样本图片的判断,所述x表示原图片,所述z表示原图片和目标图片,所述Pdata(x)和所述Pz(z)分别是所述x的分布和高斯分布z~N(0,1);
在所述训练过程中,分别使用公式LD=-LGAN和LG=LGAN迭代更新所述生成模型G和所述判别模型D的参数;所述LD表示判别模型D的损失函数,所述LG表示生成模型G的损失函数;
(b)生成阶段,从所述训练阶段选定一组规范姿势,利用训练好的所述GAN将目标数据集图片生成对应规范姿势的图片,将所述生成对应规范姿势的图片与所述目标数据集图片一起放入所述自训练的聚类中;
(c)调整阶段,根据所述自训练聚类结果,找出每一个类中,图片数量最多的行人身份ID,若某一ID的行人图片数量占比最多的类存在多个,则进行聚类调整,将调整后的结果作为所述伪标签放入所述自训练中对所述目标数据集进行训练。
5.根据权利要求4所述的一种基于GAN的无监督自适应行人重识别方法,其特征在于,所述步骤(a),所述质量合格的图片,是指所述人体关键点存在一半以上的图片。
6.根据权利要求4所述的一种基于GAN的无监督自适应行人重识别方法,其特征在于,所述步骤(b),所述一组规范姿势,至少有四个以上,且不同角度的姿势。
CN201911234544.3A 2019-12-05 2019-12-05 一种基于gan的无监督自适应行人重识别方法 Active CN110929679B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911234544.3A CN110929679B (zh) 2019-12-05 2019-12-05 一种基于gan的无监督自适应行人重识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911234544.3A CN110929679B (zh) 2019-12-05 2019-12-05 一种基于gan的无监督自适应行人重识别方法

Publications (2)

Publication Number Publication Date
CN110929679A true CN110929679A (zh) 2020-03-27
CN110929679B CN110929679B (zh) 2023-06-16

Family

ID=69857087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911234544.3A Active CN110929679B (zh) 2019-12-05 2019-12-05 一种基于gan的无监督自适应行人重识别方法

Country Status (1)

Country Link
CN (1) CN110929679B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738095A (zh) * 2020-05-28 2020-10-02 复旦大学 一种基于骨架姿态的人物识别方法
CN111753684A (zh) * 2020-06-11 2020-10-09 昆明理工大学 一种利用目标姿势进行生成的行人重识别方法
CN112016687A (zh) * 2020-08-20 2020-12-01 浙江大学 一种基于互补伪标签的跨域行人重识别方法
CN112016633A (zh) * 2020-09-25 2020-12-01 北京百度网讯科技有限公司 一种模型训练方法、装置、电子设备及存储介质
CN112149645A (zh) * 2020-11-10 2020-12-29 西北工业大学 基于生成对抗学习和图神经网络的人体姿势关键点识别方法
CN112434599A (zh) * 2020-11-23 2021-03-02 同济大学 一种基于噪声通道的随机遮挡恢复的行人重识别方法
CN112507893A (zh) * 2020-12-14 2021-03-16 华南理工大学 一种基于边缘计算的分布式无监督行人重识别方法
CN112733695A (zh) * 2021-01-04 2021-04-30 电子科技大学 一种行人重识别领域中的非监督关键帧挑选方法
CN113139496A (zh) * 2021-05-08 2021-07-20 青岛根尖智能科技有限公司 一种基于时序多尺度融合的行人重识别方法及系统
CN114998925A (zh) * 2022-04-22 2022-09-02 四川大学 一种面向孪生噪声标签的鲁棒跨模态行人重识别方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673346A (zh) * 2008-09-09 2010-03-17 日电(中国)有限公司 对图像进行处理的方法、设备和系统
US20130181988A1 (en) * 2012-01-16 2013-07-18 Samsung Electronics Co., Ltd. Apparatus and method for creating pose cluster
AU2014240213A1 (en) * 2014-09-30 2016-04-14 Canon Kabushiki Kaisha System and Method for object re-identification
WO2017088470A1 (zh) * 2015-11-27 2017-06-01 小米科技有限责任公司 图像分类方法及装置
CN107909104A (zh) * 2017-11-13 2018-04-13 腾讯数码(天津)有限公司 一种图片的人脸聚类方法、装置及存储介质
CN108875510A (zh) * 2017-11-28 2018-11-23 北京旷视科技有限公司 图像处理的方法、装置、系统及计算机存储介质
CN109145844A (zh) * 2018-08-29 2019-01-04 北京旷视科技有限公司 用于城市安防监控的档案管理方法、装置以及电子设备
CN110135295A (zh) * 2019-04-29 2019-08-16 华南理工大学 一种基于迁移学习的无监督行人重识别方法
CN110245679A (zh) * 2019-05-08 2019-09-17 北京旷视科技有限公司 图像聚类方法、装置、电子设备及计算机可读存储介质
CN110516586A (zh) * 2019-08-23 2019-11-29 深圳力维智联技术有限公司 一种人脸图像聚类方法、系统、产品及介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101673346A (zh) * 2008-09-09 2010-03-17 日电(中国)有限公司 对图像进行处理的方法、设备和系统
US20130181988A1 (en) * 2012-01-16 2013-07-18 Samsung Electronics Co., Ltd. Apparatus and method for creating pose cluster
AU2014240213A1 (en) * 2014-09-30 2016-04-14 Canon Kabushiki Kaisha System and Method for object re-identification
WO2017088470A1 (zh) * 2015-11-27 2017-06-01 小米科技有限责任公司 图像分类方法及装置
CN107909104A (zh) * 2017-11-13 2018-04-13 腾讯数码(天津)有限公司 一种图片的人脸聚类方法、装置及存储介质
CN108875510A (zh) * 2017-11-28 2018-11-23 北京旷视科技有限公司 图像处理的方法、装置、系统及计算机存储介质
CN109145844A (zh) * 2018-08-29 2019-01-04 北京旷视科技有限公司 用于城市安防监控的档案管理方法、装置以及电子设备
CN110135295A (zh) * 2019-04-29 2019-08-16 华南理工大学 一种基于迁移学习的无监督行人重识别方法
CN110245679A (zh) * 2019-05-08 2019-09-17 北京旷视科技有限公司 图像聚类方法、装置、电子设备及计算机可读存储介质
CN110516586A (zh) * 2019-08-23 2019-11-29 深圳力维智联技术有限公司 一种人脸图像聚类方法、系统、产品及介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
FU XIONG: "Towards Good Practices on Building Effective CNN Baseline Model for Person Re-identification", 《ARXIV:1087.11042V1》 *
LIANGCHEN SONG: "Unsupervised Domain Adaptive Re-Identification:Theory and Practice", 《ARXIV:1807.11334V1》 *
LIQIAN MA: "Pose Guided Person Image Generation", 《ARXIV:1705.09368V6》 *
XUELIN QIAN: "Pose-Normalized Image Generation for Person Re-identification", 《ARXIV:1712.02225V6》 *
白雪: "聚类分析中的相似性度量及其应用研究", 《中国博士学位论文全文数据库 (信息科技辑)》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111738095A (zh) * 2020-05-28 2020-10-02 复旦大学 一种基于骨架姿态的人物识别方法
CN111738095B (zh) * 2020-05-28 2022-06-21 复旦大学 一种基于骨架姿态的人物识别方法
CN111753684A (zh) * 2020-06-11 2020-10-09 昆明理工大学 一种利用目标姿势进行生成的行人重识别方法
CN111753684B (zh) * 2020-06-11 2022-07-08 昆明理工大学 一种利用目标姿势进行生成的行人重识别方法
CN112016687B (zh) * 2020-08-20 2022-05-10 浙江大学 一种基于互补伪标签的跨域行人重识别方法
CN112016687A (zh) * 2020-08-20 2020-12-01 浙江大学 一种基于互补伪标签的跨域行人重识别方法
CN112016633A (zh) * 2020-09-25 2020-12-01 北京百度网讯科技有限公司 一种模型训练方法、装置、电子设备及存储介质
CN112149645A (zh) * 2020-11-10 2020-12-29 西北工业大学 基于生成对抗学习和图神经网络的人体姿势关键点识别方法
CN112434599A (zh) * 2020-11-23 2021-03-02 同济大学 一种基于噪声通道的随机遮挡恢复的行人重识别方法
CN112507893A (zh) * 2020-12-14 2021-03-16 华南理工大学 一种基于边缘计算的分布式无监督行人重识别方法
CN112733695A (zh) * 2021-01-04 2021-04-30 电子科技大学 一种行人重识别领域中的非监督关键帧挑选方法
CN112733695B (zh) * 2021-01-04 2023-04-25 电子科技大学 一种行人重识别领域中的非监督关键帧挑选方法
CN113139496A (zh) * 2021-05-08 2021-07-20 青岛根尖智能科技有限公司 一种基于时序多尺度融合的行人重识别方法及系统
CN114998925A (zh) * 2022-04-22 2022-09-02 四川大学 一种面向孪生噪声标签的鲁棒跨模态行人重识别方法
CN114998925B (zh) * 2022-04-22 2024-04-02 四川大学 一种面向孪生噪声标签的鲁棒跨模态行人重识别方法

Also Published As

Publication number Publication date
CN110929679B (zh) 2023-06-16

Similar Documents

Publication Publication Date Title
CN110929679B (zh) 一种基于gan的无监督自适应行人重识别方法
CN113378632B (zh) 一种基于伪标签优化的无监督域适应行人重识别方法
CN110414368B (zh) 一种基于知识蒸馏的无监督行人重识别方法
CN111611905B (zh) 一种可见光与红外融合的目标识别方法
CN111368683B (zh) 基于模约束CenterFace的人脸图像特征提取方法及人脸识别方法
CN109598268A (zh) 一种基于单流深度网络的rgb-d显著目标检测方法
CN107230267B (zh) 基于人脸识别算法的幼儿园智能签到方法
CN110348416A (zh) 一种基于多尺度特征融合卷积神经网络的多任务人脸识别方法
CN108427740B (zh) 一种基于深度度量学习的图像情感分类与检索算法
CN112819065B (zh) 基于多重聚类信息的无监督行人难样本挖掘方法和系统
CN113326731A (zh) 一种基于动量网络指导的跨域行人重识别算法
CN112434599B (zh) 一种基于噪声通道的随机遮挡恢复的行人重识别方法
CN107977610B (zh) 一种基于海量视频处理的人脸追踪方法
CN114782977B (zh) 一种基于拓扑信息和亲和度信息引导行人重识别方法
CN113642547A (zh) 一种基于密度聚类的无监督域适应人物重识别方法及系统
CN110348505B (zh) 车辆颜色分类模型训练方法、装置和车辆颜色识别方法
KR20190059225A (ko) 점진적 딥러닝 학습을 이용한 적응적 영상 인식 기반 감성 추정 방법 및 장치
CN112801019B (zh) 基于合成数据消除无监督车辆再识别偏差的方法及系统
CN107220598A (zh) 基于深度学习特征和Fisher Vector编码模型的虹膜图像分类方法
CN114092742A (zh) 一种基于多角度的小样本图像分类装置和方法
CN113033345B (zh) 基于公共特征子空间的v2v视频人脸识别方法
Sarker et al. Transformer-based person re-identification: a comprehensive review
CN116824270A (zh) 一种基于注意力机制改进的小样本车型识别方法
CN109815887B (zh) 一种基于多智能体协作的复杂光照下人脸图像的分类方法
CN114821809B (zh) 基于标记分布学习的多源域领域泛化行人重识别系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant