CN113822262B - 一种基于无监督学习的行人重识别方法 - Google Patents

一种基于无监督学习的行人重识别方法 Download PDF

Info

Publication number
CN113822262B
CN113822262B CN202111412831.6A CN202111412831A CN113822262B CN 113822262 B CN113822262 B CN 113822262B CN 202111412831 A CN202111412831 A CN 202111412831A CN 113822262 B CN113822262 B CN 113822262B
Authority
CN
China
Prior art keywords
pedestrian
class
image data
feature vector
feature vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111412831.6A
Other languages
English (en)
Other versions
CN113822262A (zh
Inventor
贺菁菁
徐晓刚
王军
何鹏飞
曹卫强
朱亚光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202111412831.6A priority Critical patent/CN113822262B/zh
Publication of CN113822262A publication Critical patent/CN113822262A/zh
Application granted granted Critical
Publication of CN113822262B publication Critical patent/CN113822262B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于无监督学习的行人重识别方法,在特征存储器中只保存聚类得到的类中心,采用分组采样的方式获取小样本集,并结合难例挖掘的方法更新存储器中的特征向量和特征提取网络模型参数,实现了在无标签数据集上的伪标签自动生成,增强了模型对于噪声数据的鲁棒性,大大减小了存储器对于内存空间的高额要求。本发明剔除了离群样本点对聚类中心的干扰,避免了随机采样导致的过拟合等问题,在小样本迭代过程中不更改数据标签,降低了标签跳变等噪声数据对于模型稳定性的影响,加速了模型的收敛,提高行人重识别模型在不同场景下的泛化能力。

Description

一种基于无监督学习的行人重识别方法
技术领域
本发明涉及机器学习领域,尤其是涉及一种基于无监督学习的行人重识别方法。
背景技术
在行人重识别(Person Re-identification,re-ID)任务中,利用无标签数据进行无监督学习的方法得到了广泛关注和应用。目前主流的方式是训练一个深度神经网络模型,提取行人的特征表示,再利用一个特征存储器,将行人特征向量进行实例级的存储,同时使用聚类方法为存储器中的样本生成伪标签,最后利用伪标签进行有监督的分类模型训练,更新存储器中的特征,达到模型参数更新和调整的效果。在无监督Re-ID中,实例级的特征存储器需较大的内存空间,且带有噪声的伪标签对于特征提取和分类模型都会产生消极的影响,导致模型产生过拟合,减弱泛化能力。同时,聚类得到的集群大小不同也使模型在更新过程类之间产生不一致性,当更新小集群中的所有实例时,在大集群中只能更新一小部分实例特性,难以学习到稳定的样本特征,限制了实际应用效果。
发明内容
为解决现有技术的不足,实现在无标签数据集上的伪标签自动生成,增强模型对于噪声数据的鲁棒性,大大减小存储器对于内存空间的高额要求,通过难例挖掘的方法加快模型参数更新速度,提高训练效率,结合分组采样减少类之间的不一致性,提升模型应用的泛化能力的目的,本发明采用如下的技术方案:
一种基于无监督学习的行人重识别方法,包括如下步骤:
S1,构建用于提取行人特征向量的无监督re-ID深度神经网络并初始化;包括骨干网络、全连接层,初始化深度神经网络参数、超参数、迭代训练的第一迭代终止条件参数和第二迭代终止条件参数;
S2,通过深度神经网络,获取无标签的行人图像数据作为训练集,得到对应的行人特征向量,通过聚类,将行人特征向量对应的行人图像数据,划分为多个类别,同一类行人图像数据拥有同一个伪标签,标记不归属于任何类别的行人图像数据的伪标签,通过每个类中对应的行人特征向量,获取各类中心的特征向量,进行存储并初始化;
S3,通过伪标签,重新获取训练集的行人特征向量,排除不归属于任何类的行人图像数据对应的行人特征向量;
S4,对重新获取的行人特征向量,进行分组采样,将得到的小批量样本,与存储的类中心特征向量的距离,计算分类损失,并迭代更新无监督re-ID深度神经网络和存储的类中心特征向量,直到达到第一收敛条件,包括如下步骤:
S41,对重新获取的行人特征向量,进行分组采样,得到小批量样本;
S42,以伪标签作为监督信息,计算小批量样本与存储的类中心特征向量之间的分类损失函数,使小批量样本中,根据行人图像数据提取的行人特征向量,与存储的类中心特征向量越近,与其他类中心特征向量越远;
S43,从当前迭代次数中的小批量样本中,找到其所属的部分类中,距离类中心特征向量最远的行人图像数据,通过动量法,叠加到最远的行人图像数据对应存储的原类中心特征向量上,进行一次存储器中类中心特征向量的参数更新,得到新的特征存储器中的类中心特征向量,从而实现在每一次迭代中,在线更新存储的部分类中心原本的类特征向量;
S44,若第一迭代终止条件未达到,则继续重复执行S4,若达到,则进入S5;
S5,若第二迭代终止条件未达到,则返回S2,若达到,则结束流程;
S6,通过训练好的深度神经网络,获取行人图像数据,将提取行人特征向量,与存储的类中心特征向量比对,找出属于同一类的图像数据序列,达到图像检索的效果。
进一步地,所述S41的分组采样,包括如下步骤:
S411,根据重新获取的行人特征向量
Figure 294689DEST_PATH_IMAGE001
进行分类;
S412,随机重排类中的行人图像数据,在类内部,将属于同一个类的行人图像数据顺序打乱,这样同一个类中的样本点,不再是以添加到类时的先后顺序为排列依据,具有一定的随机性;
S413,将类中的行人图像数据分组并添加到分组列表,针对类别列表中的每一类,以预先设置的正整数S ≥ 1进行组内的划分,并将划分后的组分别添加到分组列表中,这样分组列表中每组最多为S个样本;
S414,随机重排分组列表,将分组列表随机打乱顺序,此操作之后,同一个组中的仍然属于同一类,但是相邻两组之间不一定再属于同一类别,得到最终的分组后的采样列表,根据预设的批尺寸,得到小批量样本。
进一步地,所述S411中,随机重排所有类,根据重新获取的行人特征向量
Figure 539726DEST_PATH_IMAGE001
进行分 类,并按类别分组,属于同一个类的行人特征向量对应的行人图像数据为一组,保存入类别 列表中,再将类别列表按组打乱顺序,由于是以类别为单位,所以属于同一个类中的顺序保 持不变。
进一步地,所述S42的损失函数:
Figure 132512DEST_PATH_IMAGE002
其中,q表示行人图像数据对应的行人特征向量,c +表示行人图像数据所存储的所属类中心的特征向量,c i 表示第i类的类中心特征向量,N表示类别数,L q 越小表示q与类c +越相近,与其他类越远,τ为模型超参数。
进一步地,所述S43包括如下步骤:
S431,计算小批量样本中,所有行人图像数据的行人特征向量,到其存储的所属类中心的特征向量的距离,行人图像数据所属的类中心,由聚类得到的伪标签决定;
S432,从小批量样本属于同一类的行人图像数据中,找到距离类中心最远的行人 图像数据对应的行人特征向量
Figure 793301DEST_PATH_IMAGE003
S433,使用
Figure 686302DEST_PATH_IMAGE003
和动量值
Figure 774343DEST_PATH_IMAGE004
,通过动量法,叠加到对应的原类中心特征向量上,从而 更新存储的对应类的中心特征向量
Figure 103694DEST_PATH_IMAGE005
Figure 381222DEST_PATH_IMAGE006
S434,通过深度神经网络的反向参数传递计算,在每一次迭代中更新深度神经网络的参数,由于mini batch中不可能包含所有的类别,所以在一次迭代中,只更新minibatch中包含的部分聚类中心。
进一步地,所述S2包括如下步骤:
S21,通过初始化后的无监督re-ID深度神经网络前向传播方式,获取无标签行人图像数据集中,每个行人图像数据的行人特征向量;
S22,通过聚类算法和距离计算方法,得到行人特征向量样本簇,作为每个行人图 像数据的伪标签i,拥有同一个伪标签的行人图像数据视为同一类
Figure 315680DEST_PATH_IMAGE007
,其中
Figure 402321DEST_PATH_IMAGE008
x j 表示伪 标签为i的行人图像数据,将不归属于任何类别的行人图像数据的伪标签标记为-1;
S23,通过计算每个类中行人特征向量的均值,得到类中心特征向量,不属于任何 类的样本不参与类中心的计算,存储所有类中心特征向量并初始化,
Figure 218967DEST_PATH_IMAGE009
N表示 类别数。
进一步地,所述S23中的类中心特征向量,从类
Figure 221558DEST_PATH_IMAGE007
中的行人图像数据对应的行人特 征向量中,随机挑选一个得到。
进一步地,所述S3遍历所有的行人图像数据,若行人图像数据的伪标签为-1,则忽 略,若不为-1,则将该行人图像数据,加入新的训练集中,根据新的训练集,重新得到对应的 行人特征向量
Figure 823572DEST_PATH_IMAGE001
,从而排除掉离群样本点。
进一步地,所述特征向量的距离,采用jaccard距离计算方法,通过DBSCAN聚类算法,将jaccard计算得到的距离矩阵,按距离的远近进行聚类,距离相近的点全部归类为一类;距离其他点都比较远的点单独为一类。
进一步地,所述S2中的聚类,采用K(K=30)近邻聚类算法。
本发明的优势和有益效果在于:
本发明的技术方案,针对无监督re-ID任务中存储实例特征消耗存储空间大、类的参数更新不一致导致的模型训练难等缺陷,设计了存储器只保存类中心的方式,大大缓解了保存所有样本特征的空间消耗,并针对性的提出类中心的实时有监督的更新方法;在以所述第二迭代次数的更新过程中,通过不更改样本的标签标注数据,使数据标签更稳定,缓解了传统无监督re-ID训练时标注数据不稳定导致的难以稳定的学习到样本特征的问题;在训练过程中剔除了离群点对类的影响,采用分组采样的方式获取mini batch中的样本,避免了随机采样导致的过拟合等问题,分组采样大大降低了噪声数据对于模型稳定性的影响,有利于加速模型的收敛。
附图说明
图1是本发明方法中迭代训练的步骤流程图。
图2是本发明方法中的分组采样的步骤流程图。
图3是本发明方法的随机重排分组列表示意图。
图4是本发明方法的行人重识别检索流程示意图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
如图1所示,一种基于无监督学习的行人重识别方法,在存储器中只保存聚类得到的类中的一个实例特征值,在存储器的特征更新阶段,将属于同一个类别的样本特征分组采样,并用难例挖掘的方法更新存储器特征,包括下述步骤:
步骤一:初始化用于提取行人特征向量的深度神经网络参数和其他超参数,包括用于控制迭代训练收敛条件的第一迭代终止条件参数和第二迭代终止条件参数。
首先构建一个无监督re-ID神经网络模型,例如卷积神经网络CNN模型,并进行初始化。具体的,该神经网络模型至少包含骨干网络,例如Resnet50,保留到网络最后一个全连接层,维数可以是1024或者2048或者256,此处得到的即为行人的特征向量。
行人重识别:是指通过将视频或者图像中要查询的行人图片向量化,与数据库中已有的图片进行比对,找出属于同一个ID的图片序列,达到图像检索的效果。这里,所述模型可以通过在线进行迭代训练后,存储并可在线进行检索识别时使用甚至数据更新。
初始化模型包括:将所述模型的骨干网络进行初始化,主要是参数的初始化,还包括用于控制迭代终止的第一、第二迭代参数,其中,第一迭代终止条件为mini batch训练的迭代次数,可以是200或者400,第二迭代终止条件是所有样本重新开始训练的迭代次数,可以是50或者100。
步骤二:使用深度神经网络提取得到行人样本数据
Figure 518996DEST_PATH_IMAGE010
的特征向量
Figure 839250DEST_PATH_IMAGE011
,对特征向量聚类得到类中心和样本伪标签,将类中心存入存储器中对其进 行初始化,包括如下步骤:
首先,使用深度神经网络得到所有行人的特征向量;
具体地,利用所述初始化后的无监督re-ID神经网络模型前向传播方式,获取所述无标签数据集中每个样本(例如图片)的特征向量。
其次,使用聚类算法和距离计算方法K(K=30)近邻得到行人特征向量样本簇,从而 得到每个样本数据的伪标签,拥有同一个伪标签的样本视为同一类
Figure 379952DEST_PATH_IMAGE007
,其中
Figure 85740DEST_PATH_IMAGE008
x j 伪标 签为i,特别地,不归属于任何类别的样本标签标记为-1;
样本集数量通常较大,在万级以上,为了便于描述,以较小的数据量10进行说明举例。假设数据样本集为[x1,x2,x3,x4,x5,x6,x7,x8,x9,x10],其中每个样本是一个人体图像的特征向量。将这些样本,经过聚类算法后得到了3个类别C1,C2,C3(也有可能会聚类得到4个或5个类别等,类别数量由算法自动生成,这里假设得到了3个),属于C1的样本为[x1,x4,x8],属于C2的样本为[x2,x9],属于C3的样本为[x3,x6,x7,x10],不属于任何类别的单独样本为x5。这种情况下,[x1,x4,x8]就是同一个类,都属于C1,剩下的C2\C3同理,x5的伪标签为-1。
具体地,利用聚类算法,对数据集中的所有样本的所述特征向量进行聚类,将所述特征向量所在的该无标签的数据集,划分为多个类别,将对应特征向量的样本划分到不同的聚集/聚类中,并获取对应各类的类中心,每个类中心有一个中心向量。
最后,通过计算每个类中所包含特征向量的均值,得到类中心,特别地,类中心也 可以从类
Figure 499535DEST_PATH_IMAGE007
中样本随机挑选一个得到,且不属于任何类的样本不参与类中心的计算;将所 有类中心放入存储器中,则存储器中有
Figure 494036DEST_PATH_IMAGE012
个类
Figure 382970DEST_PATH_IMAGE009
例如:聚类算法为DBSCAN,距离计算方式为jaccard,对所有的所述特征向量进行聚类后得到N个类别,每个类别有一个类中心,类中心可以通过计算归属于同一类别的所有样本的均值,或者随机挑选一个样本点的特征向量得到,保存这些中心向量到存储器中。
将无标签的该数据集中的所有样本划分到所述N个类别中,并分配所属类别的标签给所有样本。
jaccard是一种确定的、具体的算法,他可以计算得到向量之间的距离。假设待计算距离的样本有4个,分别为[x1,x2,x3,x4],其中每个样本是一个向量,这里假设向量是5维的(实际上是128或256或512等比较大的),则样本向量就是如下形式的x1=[0.1,0.3,0.3,0.2,0.3]。
利用jaccard算法计算样本的距离,则得到了一个4*4的矩阵,表示样本两两之间的距离计算结果,例如结果是:
[1.0 , 0.3, 0.02, 0.03],
[0.3 , 1.0, 0.01 , 0.04],
[0.02 , 0.01 , 1.0 , 0.23],
[0.03 , 0.04 , 0.23 , 1.0]。
DBSACN聚类:DBSACN利用上面jaccard计算得到的距离矩阵,按照距离的远近进行聚类,距离相近的点全部归类为一类;距离其他点都比较远的点单独为一类。
步骤三:利用上述步骤二中得到的样本伪标签,重新得到行人训练数据的特征向 量集合
Figure 208844DEST_PATH_IMAGE013
,排除掉离群样本点:若样本的伪标签为-1,即为离群点,则忽略不 计;若样本的伪标签不为-1,则加入到
Figure 246070DEST_PATH_IMAGE001
中。
遍历所有的行人样本,若该样本的伪标签为-1,则忽略,若不为-1,则将该样本的 特性向量加入新的训练样本集中,将新的样本集的行人特征向量
Figure 275337DEST_PATH_IMAGE001
作为步骤四的输入。
例如:聚类算法DBSCAN得到的样本中,未分类的样本定义为离群点,标签为-1;在构建用于训练的新数据集时,排除掉离群样本点:若样本的标签为-1,即为离群点,则忽略不计;若样本的标签不为-1,则加入到新的训练样本集中。
步骤四:从上述步骤三中得到行人特征向量
Figure 220159DEST_PATH_IMAGE001
中,使用分组采样得到小批量样本, 通过与存储器中的所有类中心的距离计算分类损失,并迭代更新无监督re-ID神经网络参 数和存储器的类中心特征向量,直到达到第一收敛条件,如图2所示,包括如下步骤:
首先,从新的特征向量
Figure 588955DEST_PATH_IMAGE001
中执行分组采样得到mini batch个小批量样本,包括如下 步骤:
(1)随机重排所有类:将新训练数据集中的特征向量按类别进行分组,属于同一个类的样本为一组,保存入类别列表中,再将该列表打乱顺序。由于是以类别为单位,所以属于同一个类中的列表顺序保持不变。
(2)在每个类中,随机重排所有的样本:在类内部,将属于同一个类的样本顺序打乱,这样同一个类中的样本点不再是以添加到类时的先后顺序为排列依据,具有一定的随机性。
(3)将每个类中的样本分组,添加到分组列表:针对类列表中的每一类,以预先设 置的正整数
Figure 859399DEST_PATH_IMAGE014
进行组内的划分,并将划分后的组分别添加到新的分组列表,这样分组列表中 每组最多为
Figure 562913DEST_PATH_IMAGE014
个样本。
(4)随机重排分组列表:将分组列表随机打乱顺序,此操作之后,同一个组中的仍然属于同一类,但是相邻两组之间不一定再属于同一类别。
具体地,先对所有的类
Figure 796579DEST_PATH_IMAGE015
随机打乱后重新排列,接着在每个类
Figure 597045DEST_PATH_IMAGE016
的内部 针对属于该类的样本随机打乱后重排,再将每个类
Figure 526473DEST_PATH_IMAGE007
中的样本数按照正整数
Figure 717283DEST_PATH_IMAGE014
Figure 20220DEST_PATH_IMAGE017
)的个 数进行分组,并按组添加到分组列表
Figure 144034DEST_PATH_IMAGE018
中,直到将所有的类都处理完成后,再将分组列表
Figure 241434DEST_PATH_IMAGE018
按组随机打乱后重新排列,得到最终的分组后的采样列表。
如图3所示,以C1、C2、C3这3个类为例,属于同一个类的样本有相同的灰度,数字表示在类中的原始位置序号。首先对3个类进行随机重排,得到新的类排序;之后,针对每个类,将类内的样本随机重排,可见类内的顺序会被打乱;再将类内打乱样本进行分组,图中每个组内以S=3为例,实现了分组操作;最后,将分组后的列表进行随机重排,得到最终的采样列表。
其次,依据上述已知的样本伪标签作为监督信息,计算小批量样本与存储器中所 有类之间的分类损失函数,损失函数
Figure 919540DEST_PATH_IMAGE019
通过如下公式计算的得到:
Figure 9856DEST_PATH_IMAGE020
其中,
Figure 270067DEST_PATH_IMAGE021
表示样本
Figure 256477DEST_PATH_IMAGE022
所属存储器中的类特征向量,
Figure 966420DEST_PATH_IMAGE019
越小表示样本
Figure 860426DEST_PATH_IMAGE022
与类
Figure 975144DEST_PATH_IMAGE021
越相近, 与其他类越远,
Figure 601297DEST_PATH_IMAGE023
为模型超参数;
再次,从当前迭次中的小样本集中,找到所属的部分类别中距离类中心最远的样本点,通过动量法叠加到样本点对应的存储器中原来的类特征向量上,进行一次存储器中类中心向量的参数更新,得到新的特征存储器中的类特征向量,从而实现在每一次迭代中,在线更新存储器中部分聚类中心原本的类特征向量,通过以下步骤来实现:
(1)计算mini batch中所有样本到存储器中所属类中心的距离,例如欧式距离,样本所属的类中心由所述聚类得到的伪标签决定。
(2)从mini batch属于同一类的样本中,找到所述距离中最小的一个样本
Figure 598203DEST_PATH_IMAGE003
Figure 233584DEST_PATH_IMAGE003
为距离类中心最远的样本对应的特征向量。
(3)使用所述
Figure 202808DEST_PATH_IMAGE003
和动量值
Figure 62180DEST_PATH_IMAGE004
,通过动量法,叠加到对应类中心原本的特征向量上, 从而更新存储器中对应类的特征值
Figure 936595DEST_PATH_IMAGE005
Figure 179927DEST_PATH_IMAGE024
以特征维度是5进行举例,即在上一个mini batch计算时,类中心的特征向量
Figure 456187DEST_PATH_IMAGE005
为 一个5个浮点数的行向量,这里假设:
Figure 237193DEST_PATH_IMAGE025
按照上述挑选规则得到的距离类中心最远的样本点
Figure 661221DEST_PATH_IMAGE003
的特征向量也同样是一 个包含5个浮点数的行向量:
Figure 638404DEST_PATH_IMAGE026
Figure 582220DEST_PATH_IMAGE004
是预先设置的超参数,假设为0.2,则在当前步骤中得到的新的类中心向量为:
Figure 986657DEST_PATH_IMAGE027
Figure 648714DEST_PATH_IMAGE028
Figure 960746DEST_PATH_IMAGE029
Figure 211599DEST_PATH_IMAGE030
Figure 331477DEST_PATH_IMAGE031
(4)通过所述分类网络的反向参数传递计算,在每一次迭代中更新所述深度神经网络的参数。由于mini batch中不可能包含所有的类别,所以在一次迭代中,只更新minibatch中包含的部分聚类中心。
最后,若第一迭代终止条件未达到,例如:是否已经达到了预定的第一迭代次数,则继续重复执行该步骤,若达到,则进入下一个步骤。
例如:具体可以取出样本输入数据、样本标签、分类等各项数据,计算输入数据、使用损失函数计算标签、分类损失等,调用反向传播进行梯度下降的优化,统计损失函数的累计值以及分类的正确模型,每次迭代完成时计算正确率等。由此,调用反向传播可以对所述模型的参数进行一次更新。
步骤五:若第二迭代终止条件未达到,则从所述步骤二重新开始,并依次执行步骤二、步骤三、步骤四,直到达到迭代终止条件,具体包括:
更新完参数之后,若第二迭代次数达到次数限制,则流程结束,输出模型;若第二迭代次数未达到次数限制,则记录训练好的无监督re-ID神经网络模型,继续重复执行步骤二、步骤三、步骤四。
特别地,在每次迭代中,都会重新聚类和分配样本标签,聚类的个数跟之前迭代的聚类结果没有直接关系,所以类的个数、样本的标签值和类中心在每次迭代都不同。
在实施本发明的技术方案中,通过无监督re-ID模型前向传播获取样本的特征向量,利用聚类算法,给未标注数据集中每个样本分配类别标签,并保存每个聚集的中心向量;在每个mini batch中,基于当前样本的特征向量及类别标签,通过计算该特征向量与类中心的距离进行有监督的学习,计算新的类中心的中心向量,并更新re-ID神经网络模型的权重参数,继续下一次迭代,直到收敛。
步骤六:如图4所示,通过训练好的深度神经网络,获取行人图像数据,将提取行人特征向量,与存储的类中心特征向量比对,找出属于同一类的图像数据序列,达到图像检索的效果。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims (8)

1.一种基于无监督学习的行人重识别方法,其特征在于包括如下步骤:
S1,构建用于提取行人特征向量的深度神经网络并初始化;
S2,通过深度神经网络,获取无标签的行人图像数据作为训练集,得到对应的行人特征向量,通过聚类,将行人特征向量对应的行人图像数据,划分为多个类别,同一类行人图像数据拥有同一个伪标签,通过每个类中对应的行人特征向量,获取各类中心的特征向量,进行存储;
S3,通过伪标签,重新获取训练集的行人特征向量,排除不归属于任何类的行人图像数据对应的行人特征向量;
S4,对重新获取的行人特征向量,进行分组采样,将得到的小批量样本,与存储的类中心特征向量的距离,计算分类损失,并迭代更新深度神经网络和存储的类中心特征向量,包括如下步骤:
S41,对重新获取的行人特征向量,进行分组采样,得到小批量样本;
S42,以伪标签作为监督信息,计算小批量样本与存储的类中心特征向量之间的分类损失函数,使小批量样本中,根据行人图像数据提取的行人特征向量,与存储的类中心特征向量越近,与其他类中心特征向量越远;
所述损失函数:
Figure DEST_PATH_IMAGE001
其中,q表示行人图像数据对应的行人特征向量,c +表示行人图像数据所存储的所属类中心的特征向量,c i 表示第i类的类中心特征向量,N表示类别数,L q 越小表示q与类c +越相近,与其他类越远,τ为模型超参数;
S43,从当前小批量样本中,找到其所属的部分类中,距离类中心特征向量最远的行人图像数据,通过动量法,叠加到最远的行人图像数据对应存储的原类中心特征向量上;
S44,若第一迭代终止条件未达到,则继续重复执行S4,若达到,则进入S5;
S5,若第二迭代终止条件未达到,则返回S2,若达到,则结束流程;
S6,通过训练好的深度神经网络,获取行人图像数据,将提取行人特征向量,与存储的类中心特征向量比对,找出属于同一类的图像数据序列。
2.根据权利要求1所述的一种基于无监督学习的行人重识别方法,其特征在于所述S41的分组采样,包括如下步骤:
S411,根据重新获取的行人特征向量进行分类;
S412,随机重排类中的行人图像数据,在类内部,将属于同一个类的行人图像数据顺序打乱;
S413,将类中的行人图像数据分组并添加到分组列表,针对类别列表中的每一类,以预先设置的正整数S ≥ 1进行组内的划分,并将划分后的组分别添加到分组列表中;
S414,随机重排分组列表,得到最终的分组后的采样列表,根据预设的批尺寸,得到小批量样本。
3.根据权利要求2所述的一种基于无监督学习的行人重识别方法,其特征在于所述S411中,随机重排所有类,根据重新获取的行人特征向量进行分类,并按类别分组,属于同一个类的行人特征向量对应的行人图像数据为一组,保存入类别列表中,再将类别列表按组打乱顺序。
4.根据权利要求1所述的一种基于无监督学习的行人重识别方法,其特征在于所述S43包括如下步骤:
S431,计算小批量样本中,所有行人图像数据的行人特征向量,到其存储的所属类中心的特征向量的距离,行人图像数据所属的类中心,由聚类得到的伪标签决定;
S432,从小批量样本属于同一类的行人图像数据中,找到距离类中心最远的行人图像 数据对应的行人特征向量
Figure DEST_PATH_IMAGE002
S433,使用
Figure 733471DEST_PATH_IMAGE002
和动量值
Figure DEST_PATH_IMAGE003
,通过动量法,叠加到对应的原类中心特征向量上,从而更新 存储的对应类的中心特征向量
Figure DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
S434,通过深度神经网络的反向参数传递计算,在每一次迭代中更新深度神经网络的参数。
5.根据权利要求1所述的一种基于无监督学习的行人重识别方法,其特征在于所述S2包括如下步骤:
S21,通过初始化后的深度神经网络前向传播方式,获取无标签行人图像数据集中,每个行人图像数据的行人特征向量;
S22,通过聚类算法和距离计算方法,得到行人特征向量样本簇,作为每个行人图像数 据的伪标签i,拥有同一个伪标签的行人图像数据视为同一类
Figure DEST_PATH_IMAGE006
,其中
Figure DEST_PATH_IMAGE007
x j 表示伪标 签为i的行人图像数据,将不归属于任何类别的行人图像数据的伪标签标记为-1;
S23,通过计算每个类中行人特征向量的均值,得到类中心特征向量,存储类中心特征 向量
Figure DEST_PATH_IMAGE008
N表示类别数。
6.根据权利要求5所述的一种基于无监督学习的行人重识别方法,其特征在于所述S23 中的类中心特征向量,从类
Figure 431038DEST_PATH_IMAGE006
中的行人图像数据对应的行人特征向量中,随机挑选一个得 到。
7.根据权利要求5所述的一种基于无监督学习的行人重识别方法,其特征在于所述S3中的伪标签,是通过遍历所有的行人图像数据,若行人图像数据的伪标签为-1,则忽略,若不为-1,则将该行人图像数据,加入新的训练集中,根据新的训练集,重新得到对应的行人特征向量。
8.根据权利要求1所述的一种基于无监督学习的行人重识别方法,其特征在于所述S2中的聚类,采用K近邻聚类算法。
CN202111412831.6A 2021-11-25 2021-11-25 一种基于无监督学习的行人重识别方法 Active CN113822262B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111412831.6A CN113822262B (zh) 2021-11-25 2021-11-25 一种基于无监督学习的行人重识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111412831.6A CN113822262B (zh) 2021-11-25 2021-11-25 一种基于无监督学习的行人重识别方法

Publications (2)

Publication Number Publication Date
CN113822262A CN113822262A (zh) 2021-12-21
CN113822262B true CN113822262B (zh) 2022-04-15

Family

ID=78918811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111412831.6A Active CN113822262B (zh) 2021-11-25 2021-11-25 一种基于无监督学习的行人重识别方法

Country Status (1)

Country Link
CN (1) CN113822262B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836300B (zh) * 2021-09-24 2024-10-18 中国电信股份有限公司 日志分析方法、系统、设备及存储介质
CN114550221B (zh) * 2022-04-22 2022-07-22 苏州浪潮智能科技有限公司 一种行人重识别方法、装置、设备及存储介质
CN115130592B (zh) * 2022-07-01 2023-04-18 中昊芯英(杭州)科技有限公司 一种样本生成芯片
CN114818839B (zh) * 2022-07-01 2022-09-16 之江实验室 一种基于深度学习的光纤传感水声信号识别方法及装置
CN116030502A (zh) * 2023-03-30 2023-04-28 之江实验室 一种基于无监督学习的行人重识别方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263697A (zh) * 2019-06-17 2019-09-20 哈尔滨工业大学(深圳) 基于无监督学习的行人重识别方法、装置及介质
CN110942025A (zh) * 2019-11-26 2020-03-31 河海大学 一种基于聚类的无监督跨域行人重识别方法
CN111967294A (zh) * 2020-06-23 2020-11-20 南昌大学 一种无监督域自适应的行人重识别方法
CN112069929A (zh) * 2020-08-20 2020-12-11 之江实验室 一种无监督行人重识别方法、装置、电子设备及存储介质
CN112232439A (zh) * 2020-11-06 2021-01-15 四川云从天府人工智能科技有限公司 非监督ReID中的伪标签更新方法及系统
CN112507901A (zh) * 2020-12-14 2021-03-16 华南理工大学 一种基于伪标签自纠正的无监督行人重识别方法
CN112836675A (zh) * 2021-03-01 2021-05-25 中山大学 一种基于聚类生成伪标签的无监督行人重识别方法及系统
CN112966647A (zh) * 2021-03-25 2021-06-15 东北林业大学 一种基于逐层聚类及增强判别的行人重识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11537817B2 (en) * 2018-10-18 2022-12-27 Deepnorth Inc. Semi-supervised person re-identification using multi-view clustering
CN111597887B (zh) * 2020-04-08 2023-02-03 北京大学 一种行人再识别方法及系统
CN112766237A (zh) * 2021-03-12 2021-05-07 东北林业大学 一种基于簇特征点聚类的无监督行人重识别方法
CN113326731B (zh) * 2021-04-22 2024-04-19 南京大学 一种基于动量网络指导的跨域行人重识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110263697A (zh) * 2019-06-17 2019-09-20 哈尔滨工业大学(深圳) 基于无监督学习的行人重识别方法、装置及介质
CN110942025A (zh) * 2019-11-26 2020-03-31 河海大学 一种基于聚类的无监督跨域行人重识别方法
CN111967294A (zh) * 2020-06-23 2020-11-20 南昌大学 一种无监督域自适应的行人重识别方法
CN112069929A (zh) * 2020-08-20 2020-12-11 之江实验室 一种无监督行人重识别方法、装置、电子设备及存储介质
CN112232439A (zh) * 2020-11-06 2021-01-15 四川云从天府人工智能科技有限公司 非监督ReID中的伪标签更新方法及系统
CN112507901A (zh) * 2020-12-14 2021-03-16 华南理工大学 一种基于伪标签自纠正的无监督行人重识别方法
CN112836675A (zh) * 2021-03-01 2021-05-25 中山大学 一种基于聚类生成伪标签的无监督行人重识别方法及系统
CN112966647A (zh) * 2021-03-25 2021-06-15 东北林业大学 一种基于逐层聚类及增强判别的行人重识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Unsupervised and Self-Adaptative Techniques for Cross-Domain Person Re-Identification;Gabriel C.B.等;《IEEE Transactions on Information Forensics and Security》;20210824;第4419-4434页 *
融合多聚类信息的无监督行人重识别算法;苏荻翔 等;《计算机工程与应用》;20210625;第1-12页 *

Also Published As

Publication number Publication date
CN113822262A (zh) 2021-12-21

Similar Documents

Publication Publication Date Title
CN113822262B (zh) 一种基于无监督学习的行人重识别方法
CN111967294B (zh) 一种无监督域自适应的行人重识别方法
CN108920720B (zh) 基于深度哈希和gpu加速的大规模图像检索方法
CN111199242A (zh) 一种基于动态修正向量的图像增量学习方法
CN112784929B (zh) 一种基于双元组扩充的小样本图像分类方法及装置
Zhang et al. Oracle character recognition by nearest neighbor classification with deep metric learning
CN111125469B (zh) 一种社交网络的用户聚类方法、装置以及计算机设备
CN109885728B (zh) 基于元学习的视频摘要方法
Dozono et al. Convolutional self organizing map
US20180349766A1 (en) Prediction guided sequential data learning method
CN107783998A (zh) 一种数据处理的方法以及装置
CN115098732B (zh) 数据处理方法及相关装置
CN108491891A (zh) 一种基于决策树局部相似性的多源在线迁移学习方法
CN112270398A (zh) 一种基于基因编程的集群行为学习方法
CN114299362A (zh) 一种基于k-means聚类的小样本图像分类方法
Yang et al. Geometry and uncertainty-aware 3d point cloud class-incremental semantic segmentation
CN115293919A (zh) 面向社交网络分布外泛化的图神经网络预测方法及系统
Xie et al. Towards general and efficient active learning
CN116030502A (zh) 一种基于无监督学习的行人重识别方法和装置
CN116595343B (zh) 基于流形排序学习的在线无监督跨模态检索方法及系统
Yao et al. Continual recognition with adaptive memory update
CN110188219B (zh) 面向图像检索的深度强化去冗余哈希方法
WO2021059527A1 (ja) 学習装置、学習方法、及び、記録媒体
CN111984842A (zh) 银行客户数据处理方法及装置
CN114429648B (zh) 一种基于对比特征的行人重识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant