CN112613433B - 一种行人重识别的生成数据的伪标签分配方法及系统 - Google Patents

一种行人重识别的生成数据的伪标签分配方法及系统 Download PDF

Info

Publication number
CN112613433B
CN112613433B CN202011582655.6A CN202011582655A CN112613433B CN 112613433 B CN112613433 B CN 112613433B CN 202011582655 A CN202011582655 A CN 202011582655A CN 112613433 B CN112613433 B CN 112613433B
Authority
CN
China
Prior art keywords
data
pedestrian
label
data set
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011582655.6A
Other languages
English (en)
Other versions
CN112613433A (zh
Inventor
吴俊毅
姚灿荣
高志鹏
赵建强
杜新胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN202011582655.6A priority Critical patent/CN112613433B/zh
Publication of CN112613433A publication Critical patent/CN112613433A/zh
Application granted granted Critical
Publication of CN112613433B publication Critical patent/CN112613433B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Complex Calculations (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明给出了一种行人重识别的生成数据的伪标签分配方法及系统,包括利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据并构成无标签数据集;根据动态标签分布为无标签数据集中的无标签的数据分配虚拟标签,再通过设置稀疏化因子随机将一定数量的虚拟标签的权重设置为0,得到稀疏正则化多伪标签;利用Softmax进行预测获得行人属于某个预定义类的概率;根据标签分布和概率,得到优化的交叉熵损失函数;将无标签数据集与稀疏正则化多伪标签进行结合,再与真实数据集融合构成训练样本,根据损失函数对训练样本进行训练得到行人重识别模型。避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力。

Description

一种行人重识别的生成数据的伪标签分配方法及系统
技术领域
本发明涉及图像识别技术领域,尤其是一种行人重识别的生成数据的伪标签分配方法及系统。
背景技术
行人重识别是智能监控系统中一个重要的研究课题,其目的主要是在跨区域的非重叠摄像机视角下识别出同一个行人。行人重识别是一个具有挑战性的课题,其性能常受行人姿态、光照变化、行人遮挡或错位等因素影响。目前,行人重识别常利用卷积神经网络并结合监督学习的方式获得具有判别力的模型。监督学习的方式需要大量的训练数据集,然而,目前行人重识别的数据集相比于ImageNet这种大型的数据集还是远远不够的。若采用人工方式扩充数据集,需要大量的人工介入。
随着生成对抗网络的发展,生成对抗网络可以用来解决扩充数据集需要大量人工介入的问题。目前,利用生成对抗网络生成数据可分为两种类型,一种是利用条件生成对抗网络生成接近真实数据的数据,直接用这些数据来扩充现有数据集;另一种是利用无条件生成对抗网络再生成无标签数据,结合合适的伪标签方式为生成数据打上标签,从而来扩充现有数据集训练样本。
目前有许多为生成对抗网络产生的生成数据打上标签的方式,有的会直接将这些生成数据当做新的一类数据。另外一种方式是One-hot虚拟标签策略,选择预定类中最大概率作为生成数据的虚拟标签。在行人重识别,LSRO采用统一分布为生成数据分配标签,MpRL考虑每个预定义类对生成数据的贡献,动态的为生成数据分配虚拟标签。
生成对抗网络的生成器会根据原始数据中的特征生成数据,例如根据原始图像中的服装颜色、纹理生成数据。然而,这种方式会造成以下问题:当原始数据中的服装颜色多为暗色,这样生成数据上会倾向生成暗色衣服的行人。由于这样的方式,MpRL在动态分配预定类权重时,会倾向分配更大的权重给这些有暗色衣服的预定义类,这样浅色衣服特征在训练的过程中会被忽略,模型的泛化性会被极大地降低。
针对现有技术的不足,本发明提供了一种行人重识别的生成数据的伪标签分配方法及系统,用来扩充行人重识别数据集,增加模型的泛化性。首先根据每个预定义类对生成数据集的贡献分配标签,然后对分配的虚拟标签设置稀疏化因子,对某些权重随机设置为0,避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力。
发明内容
本发明提出了一种行人重识别的生成数据的伪标签分配方法及系统,以解决上文提到的现有技术的缺陷。
在一个方面,本发明提出了一种行人重识别的生成数据的伪标签分配方法,该方法包括以下步骤:
S1:利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集Gdata
S2:根据动态标签分布q为所述数据集Gdata中的所述无标签的数据分配虚拟标签,再通过设置稀疏化因子γ随机将一定数量(记为
Figure BDA0002866252380000021
)的所述虚拟标签的权重设置为0,得到稀疏正则化多伪标签;
S3:利用Softmax层预测所述数据集Gdata中的行人X所属于的预定义类,获得所述行人X属于预定义类c的概率p(Xc);
S4:根据所述标签分布q和所述概率p(Xc),得到优化的交叉熵损失函数l;
S5:将所述数据集Gdata与所述稀疏正则化多伪标签进行结合,再与所述真实数据集融合构成训练样本,根据所述l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。
以上方法首先根据每个预定义类对生成数据集的贡献分配标签,然后对分配的虚拟标签设置稀疏化因子,对某些权重随机设置为0,避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力。
在具体的实施例中,所述步骤S2中的
Figure BDA0002866252380000035
根据公式
Figure BDA0002866252380000036
得到,其中K表示预定义类的个数。
在具体的实施例中,所述步骤S2中的动态标签分布q具体包括:
Figure BDA0002866252380000031
其中αk表示所述数据集Gdata中的行人X的数据与预定义类k之间的相似度,Is表示权重为0的所述虚拟标签的集合,K表示预定义类的个数,k表示所述预定义类中的第k个类别。
在具体的实施例中,所述优化的交叉熵损失函数l为:
Figure BDA0002866252380000032
其中,λ和β为超参数,y表示真实数据和生成数据的区分标签。
在具体的实施例中,所述λ和β表示为:
Figure BDA0002866252380000033
其中K表示预定义类的个数。
在具体的实施例中,所述稀疏化因子γ的取值区间是[0,1],值越大表示稀疏程度越大,且所述
Figure BDA0002866252380000034
的值越大。
在具体的实施例中,所述步骤S4中根据所述l对所述训练样本在神经网络中进行多次迭代训练包括,训练一次后对所述αk进行动态更新再重新执行所述步骤S2-S4。
在具体的实施例中,所述y的取值为0或1,当所述X为真实数据时y的取值为0,当所述X为所述数据集Gdata中的数据时y的取值为1。
根据本发明的第二方面,提出了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机处理器执行时实施上述方法。
根据本发明的第三方面,提出一种行人重识别的生成数据的伪标签分配系统,该系统包括:
无标签数据生成模块:配置用于利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集Gdata
虚拟标签分配模块:配置用于根据动态标签分布q为所述数据集Gdata中的所述无标签的数据分配虚拟标签,再通过设置稀疏化因子γ随机将一定数量(记为
Figure BDA0002866252380000041
)的所述虚拟标签的权重设置为0,得到稀疏正则化多伪标签;
数据类型判断模块:配置用于利用Softmax层预测所述数据集Gdata中的行人X所属于的预定义类,获得所述行人X属于预定义类c的概率p(Xc);
损失函数构建模块:配置用于根据所述标签分布q和所述概率p(Xc),得到优化的交叉熵损失函数l;
行人重识别模型训练模块:配置用于将所述数据集Gdata与所述稀疏正则化多伪标签进行结合,再与所述真实数据集融合构成训练样本,根据所述l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。
本发明提供了一种行人重识别的生成数据的伪标签分配方法及系统,用来扩充行人重识别数据集,增加模型的泛化性。首先根据每个预定义类对生成数据集的贡献分配标签,然后对分配的虚拟标签设置稀疏化因子,对某些权重随机设置为0,避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力。
附图说明
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是本发明的一个实施例的一种行人重识别的生成数据的伪标签分配方法的流程图;
图3是本发明的一个具体的实施例的IDE网络结构图;
图4是本发明的一个具体的实施例的Two-Stream网络结构图;
图5是本发明的一个实施例的一种行人重识别的生成数据的伪标签分配系统的框架图;
图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请实施例的一种行人重识别的生成数据的伪标签分配方法的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如数据处理类应用、数据可视化类应用、网页浏览器应用等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上展示的稀疏正则化多伪标签提供支持的后台信息处理服务器。后台信息处理服务器可以对获取的稀疏正则化多伪标签进行处理,并生成处理结果(例如行人重识别模型)。
需要说明的是,本申请实施例所提供的方法可以由服务器105执行,也可以由终端设备101、102、103执行,相应的装置一般设置于服务器105中,也可以设置于终端设备101、102、103中。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
根据本发明的一个实施例的一种行人重识别的生成数据的伪标签分配方法,图2示出了根据本发明的实施例的一种行人重识别的生成数据的伪标签分配方法的流程图。如图2所示,该方法包括以下步骤:
S201:利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集Gdata
S202:根据动态标签分布q为所述数据集Gdata中的所述无标签的数据分配虚拟标签,再通过设置稀疏化因子γ随机将一定数量(记为
Figure BDA0002866252380000061
)的所述虚拟标签的权重设置为0,得到稀疏正则化多伪标签。
在具体的实施例中,所述步骤S202中的
Figure BDA0002866252380000062
根据公式
Figure BDA0002866252380000063
得到,其中K表示预定义类的个数。
在具体的实施例中,所述步骤S202中的动态标签分布q具体包括:
Figure BDA0002866252380000064
在优选的实施例中,其中αk表示所述数据集Gdata中的行人X的数据与预定义类k之间的相似度,Is表示权重为0的所述虚拟标签的集合,K表示预定义类的个数,k表示所述预定义类中的第k个类别。
在具体的实施例中,所述优化的交叉熵损失函数l为:
Figure BDA0002866252380000071
其中,λ和β为超参数,y表示真实数据和生成数据的区分标签。
在具体的实施例中,所述λ和β表示为:
Figure BDA0002866252380000072
其中K表示预定义类的个数。
在具体的实施例中,所述稀疏化因子γ的取值区间是[0,1],值越大表示稀疏程度越大,且所述
Figure BDA0002866252380000073
的值越大。
S203:利用Softmax层预测所述数据集Gdata中的行人X所属于的预定义类,获得所述行人X属于预定义类c的概率p(Xc)。
S204:根据所述标签分布q和所述概率p(Xc),得到优化的交叉熵损失函数l。
在具体的实施例中,所述步骤S204中根据所述l对所述训练样本在神经网络中进行多次迭代训练包括,训练一次后对所述αk进行动态更新再重新执行所述步骤S202-S204。
在具体的实施例中,所述y的取值为0或1,当所述X为真实数据时y的取值为0,当所述X为所述数据集Gdata中的数据时y的取值为1。
S205:将所述数据集Gdata与所述稀疏正则化多伪标签进行结合,再与所述真实数据集融合构成训练样本,根据所述l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。
下面选用行人重识别经典的IDE(ID-discriminative Embedding)网络和two-stream网络,对本申请的方案进行性能验证,其网络结构如图3和图4所示。
图3示出了本发明的一个具体的实施例的IDE网络结构图,图4示出了本发明的一个具体的实施例的Two-Stream网络结构图。
验证结果如下:
本发明在两个行人重识别数据集上Market-1501和DukeMTMC-reID上进行验证,均可以获得具有竞争力的性能;
本发明选用经典的IDE和two-stream上进行验证,在两个数据集上获得的性能均超过现有为Gdata分配虚拟标签的方式。在Market-1501上Rank-1性能为81.52%和86.67%,在DukeMTMC-reID的Rank-1性能为69.50%和77.70%。在只扩充数据集上的情况下,利用合适的虚拟标签,在经典的网络上获得极具竞争力的性能。
图5示出了本发明的一个实施例的一种行人重识别的生成数据的伪标签分配系统的框架图。该系统包括无标签数据生成模块501、虚拟标签分配模块502、数据类型判断模块503、损失函数构建模块504和行人重识别模型训练模块505。
在具体的实施例中,无标签数据生成模块501被配置用于利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集Gdata;虚拟标签分配模块502被配置用于根据动态标签分布q为所述数据集Gdata中的所述无标签的数据分配虚拟标签,再通过设置稀疏化因子γ随机将一定数量(记为
Figure BDA0002866252380000081
)的所述虚拟标签的权重设置为0,得到稀疏正则化多伪标签;数据类型判断模块503被配置用于利用Softmax层预测所述数据集Gdata中的行人X所属于的预定义类,获得所述行人X属于预定义类c的概率p(Xc);损失函数构建模块504被配置用于根据所述标签分布q和所述概率p(Xc),得到优化的交叉熵损失函数l;行人重识别模型训练模块505被配置用于将所述数据集Gdata与所述稀疏正则化多伪标签进行结合,再与所述真实数据集融合构成训练样本,根据所述l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。通过无标签数据生成模块501、虚拟标签分配模块502、数据类型判断模块503、损失函数构建模块504和行人重识别模型训练模块505,本系统根据每个预定义类对生成数据集的贡献分配标签,然后对分配的虚拟标签设置稀疏化因子,对某些权重随机设置为0,避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力。
下面参考图6,其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,并且这些单元的名称在某种情况下并不构成对该单元本身的限定。
本发明的实施例还涉及一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机处理器执行时实施上文中的方法。该计算机程序包含用于执行流程图所示的方法的程序代码。需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。
本发明提供了一种行人重识别的生成数据的伪标签分配方法及系统,首先根据每个预定义类对生成数据集的贡献分配标签,然后对分配的虚拟标签设置稀疏化因子,对某些权重随机设置为0,避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力,并提升了行人重识别基准网络的性能。与此同时,本发明在真实场景中的训练样本不足的情况下,利用生成对抗网络来生成数据并分配虚拟标签,增强模型泛化性,具有较好的应用意义。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (7)

1.一种行人重识别的生成数据的伪标签分配方法,其特征在于,包括以下步骤:
S1:利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集
Figure 990728DEST_PATH_IMAGE001
S2:根据动态标签分布q为所述数据集
Figure 977138DEST_PATH_IMAGE001
中的所述无标签的数据分配虚拟标签,所述动态标签分布q具体包括:
Figure 408120DEST_PATH_IMAGE002
其中
Figure 256121DEST_PATH_IMAGE003
表示所述数据集
Figure 823369DEST_PATH_IMAGE004
中的行人
Figure 980681DEST_PATH_IMAGE005
的数据与预定义类k之间的相似度,
Figure 898958DEST_PATH_IMAGE006
表示权重为0的所述虚拟标签的集合,K表示预定义类的个数,k表示所述预定义类中的第k个类别;
再通过设置稀疏化因子
Figure 285071DEST_PATH_IMAGE007
随机将一定数量
Figure 972404DEST_PATH_IMAGE008
的所述虚拟标签的权重设置为0,得到稀疏正则化多伪标签,其中,
Figure 300618DEST_PATH_IMAGE008
根据公式
Figure 440612DEST_PATH_IMAGE009
得到,其中K表示预定义类的个数;
S3:利用Softmax层预测所述数据集
Figure 895995DEST_PATH_IMAGE010
中的行人
Figure 437835DEST_PATH_IMAGE011
所属于的预定义类,获得所述行人
Figure 936949DEST_PATH_IMAGE011
属于预定义类c的概率
Figure 564240DEST_PATH_IMAGE012
S4:根据所述标签分布q和所述概率
Figure 275844DEST_PATH_IMAGE012
,得到优化的交叉熵损失函数l,所述优化的交叉熵损失函数l为:
Figure 951151DEST_PATH_IMAGE013
其中,
Figure 621167DEST_PATH_IMAGE014
Figure 470174DEST_PATH_IMAGE015
为超参数,y表示真实数据和生成数据的区分标签;
S5:将所述数据集
Figure 251049DEST_PATH_IMAGE016
与所述稀疏正则化多伪标签进行结合,再与所述真实数据集融合构成训练样本,根据所述优化的交叉熵损失函数l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。
2.根据权利要求1所述的方法,其特征在于,所述
Figure 518213DEST_PATH_IMAGE017
Figure 359130DEST_PATH_IMAGE018
表示为:
Figure 961013DEST_PATH_IMAGE019
其中K表示预定义类的个数。
3.根据权利要求1所述的方法,其特征在于,所述稀疏化因子
Figure 545578DEST_PATH_IMAGE020
的取值区间是[0,1],值越大表示稀疏程度越大,且所述
Figure 667249DEST_PATH_IMAGE021
的值越大。
4.根据权利要求1所述的方法,其特征在于,所述步骤S5中根据所述优化的交叉熵损失函数l对所述训练样本在神经网络中进行多次迭代训练包括,训练一次后对所述
Figure 679067DEST_PATH_IMAGE022
进行动态更新再重新执行所述步骤S2-S4。
5.根据权利要求1所述的方法,其特征在于,所述y的取值为0或1,当所述
Figure 237087DEST_PATH_IMAGE023
为真实数据时y的取值为0,当所述
Figure 890923DEST_PATH_IMAGE023
为所述数据集
Figure 601521DEST_PATH_IMAGE024
中的数据时y的取值为1。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被计算机处理器执行时实施权利要求1至5中任一项所述的方法。
7.一种行人重识别的生成数据的伪标签分配系统,其特征在于,包括:
无标签数据生成模块:配置用于利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集
Figure 784240DEST_PATH_IMAGE024
虚拟标签分配模块:配置用于根据动态标签分布q为所述数据集
Figure 360715DEST_PATH_IMAGE024
中的所述无标签的数据分配虚拟标签,所述动态标签分布q具体包括:
Figure 287083DEST_PATH_IMAGE025
其中
Figure 120696DEST_PATH_IMAGE026
表示所述数据集
Figure 739897DEST_PATH_IMAGE027
中的行人
Figure 538088DEST_PATH_IMAGE028
的数据与预定义类k之间的相似度,
Figure 284459DEST_PATH_IMAGE029
表示权重为0的所述虚拟标签的集合,K表示预定义类的个数,k表示所述预定义类中的第k个类别;
再通过设置稀疏化因子
Figure 484496DEST_PATH_IMAGE030
随机将一定数量
Figure 274597DEST_PATH_IMAGE031
的所述虚拟标签的权重设置为0,得到稀疏正则化多伪标签,其中,
Figure 294506DEST_PATH_IMAGE031
根据公式
Figure 578988DEST_PATH_IMAGE032
得到,其中K表示预定义类的个数;
数据类型判断模块:配置用于利用Softmax层预测所述数据集
Figure 633532DEST_PATH_IMAGE033
中的行人
Figure 328955DEST_PATH_IMAGE034
所属于的预定义类,获得所述行人
Figure 101739DEST_PATH_IMAGE034
属于预定义类c的概率
Figure 924333DEST_PATH_IMAGE035
损失函数构建模块:配置用于根据所述标签分布q和所述概率
Figure 98962DEST_PATH_IMAGE035
,得到优化的交叉熵损失函数l,所述优化的交叉熵损失函数l为:
Figure 230866DEST_PATH_IMAGE036
其中,
Figure 225367DEST_PATH_IMAGE037
Figure 848722DEST_PATH_IMAGE038
为超参数,y表示真实数据和生成数据的区分标签;
行人重识别模型训练模块:配置用于将所述数据集
Figure 612278DEST_PATH_IMAGE039
与所述稀疏正则化多伪标签进行结合,再与所述真实数据集融合构成训练样本,根据所述优化的交叉熵损失函数l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。
CN202011582655.6A 2020-12-28 2020-12-28 一种行人重识别的生成数据的伪标签分配方法及系统 Active CN112613433B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011582655.6A CN112613433B (zh) 2020-12-28 2020-12-28 一种行人重识别的生成数据的伪标签分配方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011582655.6A CN112613433B (zh) 2020-12-28 2020-12-28 一种行人重识别的生成数据的伪标签分配方法及系统

Publications (2)

Publication Number Publication Date
CN112613433A CN112613433A (zh) 2021-04-06
CN112613433B true CN112613433B (zh) 2022-08-19

Family

ID=75248477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011582655.6A Active CN112613433B (zh) 2020-12-28 2020-12-28 一种行人重识别的生成数据的伪标签分配方法及系统

Country Status (1)

Country Link
CN (1) CN112613433B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008842A (zh) * 2019-03-09 2019-07-12 同济大学 一种基于深度多损失融合模型的行人重识别方法
CN110443174A (zh) * 2019-07-26 2019-11-12 浙江大学 一种基于解耦自适应判别性特征学习的行人重识别方法
CN110852152A (zh) * 2019-09-27 2020-02-28 中山大学 一种基于数据增强的深度哈希行人重识别方法
CN111401281A (zh) * 2020-03-23 2020-07-10 山东师范大学 基于深度聚类和样例学习的无监督行人重识别方法及系统
CN112115781A (zh) * 2020-08-11 2020-12-22 西安交通大学 基于对抗攻击样本和多视图聚类的无监督行人重识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11138469B2 (en) * 2019-01-15 2021-10-05 Naver Corporation Training and using a convolutional neural network for person re-identification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008842A (zh) * 2019-03-09 2019-07-12 同济大学 一种基于深度多损失融合模型的行人重识别方法
CN110443174A (zh) * 2019-07-26 2019-11-12 浙江大学 一种基于解耦自适应判别性特征学习的行人重识别方法
CN110852152A (zh) * 2019-09-27 2020-02-28 中山大学 一种基于数据增强的深度哈希行人重识别方法
CN111401281A (zh) * 2020-03-23 2020-07-10 山东师范大学 基于深度聚类和样例学习的无监督行人重识别方法及系统
CN112115781A (zh) * 2020-08-11 2020-12-22 西安交通大学 基于对抗攻击样本和多视图聚类的无监督行人重识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Research on Extending Person Re-identification Datasets Based on Generative Adversarial Network;Yujie Liu .et al;《2019 Chinese Automation Congress (CAC)》;20200213;全文 *
基于CNN的改进行人重识别技术;熊炜等;《计算机工程与科学》;20190415(第04期);全文 *
软多标签和深度特征融合的无监督行人重识别;张宝华 等;《光电工程 》;20201215;第47卷(第12期);全文 *

Also Published As

Publication number Publication date
CN112613433A (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
WO2020155907A1 (zh) 用于生成漫画风格转换模型的方法和装置
US11164306B2 (en) Visualization of inspection results
CN113139628B (zh) 样本图像的识别方法、装置、设备及可读存储介质
US20170372221A1 (en) Cognitive machine learning classifier generation
CN112149699B (zh) 用于生成模型的方法、装置和用于识别图像的方法、装置
CN112966701A (zh) 目标分类的方法和装置
CN114330588A (zh) 一种图片分类方法、图片分类模型训练方法及相关装置
CN111522979A (zh) 图片排序推荐方法、装置、电子设备、存储介质
US11321397B2 (en) Composition engine for analytical models
CN113920296A (zh) 一种基于对比学习的文本识别方法与系统
CN112613433B (zh) 一种行人重识别的生成数据的伪标签分配方法及系统
CN113111684B (zh) 神经网络模型的训练方法、装置和图像处理系统
CN110704650B (zh) Ota图片标签的识别方法、电子设备和介质
CN116128048A (zh) 光学遥感图像云检测模型训练方法、检测方法和装置
CN116468970A (zh) 模型训练方法、图像处理方法、装置、设备及介质
CN113255819B (zh) 用于识别信息的方法和装置
Zhang et al. AE-FPN: adaptive enhance feature learning for detecting wire defects
CN116012841A (zh) 一种基于深度学习的开集图像场景匹配方法及装置
US20210358022A1 (en) Machine learning based tiered graphical user interface (gui)
Jia et al. Dynamic thresholding for video anomaly detection
CN111598599B (zh) 用户表征方法、装置、电子设备及计算机可读介质
CN116704593A (zh) 预测模型训练方法、装置、电子设备和计算机可读介质
CN111091198B (zh) 一种数据处理方法及装置
CN111784377B (zh) 用于生成信息的方法和装置
CN113822324A (zh) 基于多任务模型的图像处理方法、装置及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant