CN113221656B - 基于域不变特征的跨域行人重识别装置及其方法 - Google Patents

基于域不变特征的跨域行人重识别装置及其方法 Download PDF

Info

Publication number
CN113221656B
CN113221656B CN202110391720.5A CN202110391720A CN113221656B CN 113221656 B CN113221656 B CN 113221656B CN 202110391720 A CN202110391720 A CN 202110391720A CN 113221656 B CN113221656 B CN 113221656B
Authority
CN
China
Prior art keywords
features
feature
domain
pedestrian
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110391720.5A
Other languages
English (en)
Other versions
CN113221656A (zh
Inventor
殷光强
王文超
李耶
贾召钱
游长江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202110391720.5A priority Critical patent/CN113221656B/zh
Publication of CN113221656A publication Critical patent/CN113221656A/zh
Application granted granted Critical
Publication of CN113221656B publication Critical patent/CN113221656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了基于域不变特征的跨域行人重识别装置及其方法,由于实例归一化可以将原始进行归一化,减少样本间差异,但同时会过滤掉一些行人身份相关信息和行人重识别判别信息。为解决这一问题,本发明提出了注意力和风格归一化模块用于恢复所丢失行人身份相关信息和行人重识别判别信息;具体实现时,在域不变特征提取网络的残差模块之后设置跨域行人重识别装置(即注意力和风格归一化模块ASN),用于恢复所丢失行人身份相关信息和行人重识别判别信息,以便将最后输出的图像域不变特征用于后续的分类器中进行行人重识别。

Description

基于域不变特征的跨域行人重识别装置及其方法
技术领域
本发明涉及计算机视觉领域中的行人重识别技术领域,具体的说,是基于域不变特征的跨域行人重识别装置及其方法。
背景技术
行人重识别也称行人再识别,是利用计算机视觉技术在跨设备、时间和地点的条件下判断图像或者视频序列中是否存在特定行人的技术。因其能够对特定人员进行大范围跟踪监控,当前广泛应用于智能监控,智能安保等领域。
对于如何提高行人重识别模型的性能,已经提出了很多的方法。在最新研究中行人重识别算法的性能已经达到很高,然而如此强大的性能是建立在使用单域的基础上。一旦将这些训练好的模型放在不同数据集上进行测试时,其性能就会大幅下降。不同域之间往往存在着巨大的差异,比如亮度、色调、分辨率,背景,行人服装风格等等,这些差异对模型的泛化能力提出了巨大的考验。降低不同域之间的差异性可以提高行人重识别算法的跨域性能。
目前,降低不同域之间差异性的方法主要有三种:第一种是去除数据集之间的风格差异,风格迁移中常用的实例归一化(IN)对每个样本和每个通道进行归一化,减少样本间的风格差异,提高模型的泛化能力。但是将每个样本进行独立的归一化不可避免地会丢失一些样本间的共性和一些有辨别性的信息,这对重识别是极其不利的。第二种是无监督域自适应(UDA)方法,基于UDA的行人重识别方法可以大致分为三类:风格转移、属性识别和目标域伪标签估计。UDA模型使用未标记的目标域数据进行更新,解放了标记工作。然而,这需要目标数据的收集和模型更新,增加了额外的成本。第三种是领域泛化(DG),DG旨在设计可推广到以前未见过的领域的模型,无需访问目标领域数据和标签,也无需更新模型。然而,行人重识别是一个开放集问题,其中目标域通常与源域有不同的实体,因此一般的DG方法不能直接应用于行人重识别。
由于不同数据域之间必然存在域差异,所以目前许多先进的重识别算法虽然在单个数据集上测试时能取得很好的表现,但是其泛化到另一个数据域的能力却很差。为了尽量提高模型的泛化能力,近几年出现了许多跨域行人重识别方法,力求使模型更好的适应目标域。通常的做法是先收集一部分目标域的数据,使用某种聚类算法将提取到的特征进行聚类生成伪标签。最后利用生成的伪标签训练模型,更新模型参数,迭代进行上述步骤直至收敛。虽然许多跨域行人重识别方法确实有效提升了模型的泛化能力,但是目标域数据的收集同样是费时费力的,在实际应用中甚至根本无法收集目标域的数据。
现有技术针对跨域行人重识别的方法,提出了一种使用结合实例归一化(IN)和批量归一化(BN)优势的IBN-Net的方法。通常实例归一化用于处理底层视觉任务,比如图像风格化,而批量归一化用于处理高层视觉任务,比如目标检测,图像识别等。IBN-Net首次将实例归一化和批量归一化集成起来,同时提高了模型的学习能力和泛化能力。方法如下:
IBN-Net设计原则是:(1)在网络的浅层同时使用实例归一化和批量归一化;(2)在网络的深层仅仅使用批量归一化。
如图1所示,IBN-Net有两种结合实例归一化和批量归一化的方式,IBN-a和IBN-b。作为提升跨域行人重识别泛化能力的结构,IBN通常加在残差网络(ResNet)中。ResNet由4组残差块组成,在IBN-Net的改进中,仅仅在Conv2_x,Conv3_x,Conv4_x三个块中加入IN,Conv5_x不进行改动。
发明内容
本发明的目的在于提供基于域不变特征的跨域行人重识别装置及其方法,所述跨域行人重识别装置用于消除不同域之间的风格差异,提高模型泛化能力,所述方法有效提取行人域不变特征并提高跨域行人重识别性能。
本发明通过下述技术方案实现:基于域不变特征的跨域行人重识别装置(即注意力和风格归一化模块),该跨域行人重识别装置设置在域不变特征提取网络的残差模块之后,包括用于得到恢复特征的恢复特征模块,用于得到判别特征的特征增强模块,以及一个用于将恢复特征和判别特征进行叠加得到完整输出特征的特征叠加器
Figure GDA0003680528510000031
所述恢复特征模块设置有:
实例归一化模块IN,用于将输入的原始特征进行归一化处理,得到实例归一化后的特征;
特征残余计算器
Figure GDA0003680528510000032
用于进行输入的原始特征与实例归一化后的特征之间的残差计算,得到残余特征;
第一注意力机制模块(包括通道注意力模块CA1和空间注意力模块SA1),将残余特征基于通道注意力机制和空间注意力机制自适应的提取出行人身份信息相关的特征;
及特征叠加器
Figure GDA0003680528510000033
用于将行人身份信息相关的特征与实例归一化后的特征进行叠加得到恢复特征。
进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别装置,所述特征增强模块设置有:
批量归一化模块BN,用于将输入的原始特征进行批量归一化处理,得到批量归一化特征;
第二注意力机制模块(包括通道注意力模块CA2和空间注意力模块SA2),将批量归一化特征基于通道注意力机制和空间注意力机制得到判别特征。
进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别装置,在进行跨域行人重识别装置的训练时,采用ASN损失函数对参数进行约束;由于针对风格归一化的特征,添加有价值的信息会使得特征更具有鉴别性;而添加干扰信息,会使得特征的鉴别性降低。设定代表有价值的信息和干扰信息的计算公式分别如下:
F+=D++wx3
F-=D-+(1-w)x3
其中F+代表有价值的信息,F-代表干扰信息,为便于区分在该公式中将对残余特征D进行操作得到行人身份信息相关的特征x2用D+表示,D-表示残余特征中与行人身份信息无关的特征,w表示自适应权重。对一个训练批次遍历一次,将每个样本依次作为锚样本,在剩下的样本中随机挑选出一个正样本p和负样本n,其特征分别为ya(锚样本的特征)、yp(正样本的特征)和yn(负样本的特征),设定添加有价值的信息后的输出和添加干扰信息后的输出公式分别如下:
y+=x1+F+
y-=x1+F-
其中y+为添加有价值的信息后的输出,y-为添加干扰信息后的输出。添加有价值的信息会使得锚样本与正样本的距离减小,与负样本之间的距离拉大;添加干扰信息会使得锚样本与正样本的距离拉大,与负样本之间的距离减小。
则ASN损失函数计算公式如下:
Figure GDA0003680528510000051
其中
Figure GDA0003680528510000052
trip(x,y)=max(x-y,0),从而通过这一思想约束ASN模块的训练过程。
基于域不变特征的跨域行人重识别方法,采用所述的基于域不变特征的跨域行人重识别装置实现,包括下述步骤:
1)输入的原始特征通过实例归一化模块IN减少样本特征间的域差异性,得到实例归一化后的特征;
2)利用特征残余计算器
Figure GDA0003680528510000053
对输入的原始特征与实例归一化后的特征进行残差计算,得到残余特征;
3)将残余特征利用第一注意力机制模块(包括通道注意力模块CA1和空间注意力模块SA1)基于通道注意力机制和空间注意力机制自适应的提取出行人身份信息相关的特征;
4)将实例归一化后的特征与行人身份信息相关的特征通过一个特征叠加器
Figure GDA0003680528510000054
叠加得到恢复特征;
5)将恢复特征和特征增强模块所形成的判别特征通过特征叠加器
Figure GDA0003680528510000055
进行叠加得到完整输出特征。
进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别方法,所述特征增强模块通过下述步骤得到判别特征:
A)输入的原始特征通过批量归一化模块BN进行批量归一化处理,得到批量归一化特征;
B)将批量归一化特征经第二注意力机制模块基于通道注意力机制和空间注意力机制得到判别特征。
进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别方法,所述输入的原始特征设为x,且x∈Rb×c×h×w,其中,b、c、h、w分别表示批次大小、通道数、特征图的高度和宽度,Rb×c×h×w为b×c×h×w维矩阵,则经过注意力和风格归一化模块ASN(即跨域行人重识别装置)后完整的输出特征为y∈Rb×c×h×w
所述实例归一化后的特征设为x1,在所述步骤1)中,所述输入的原始特征经实例归一化模块IN采用下述公式得到实例归一化后的特征:
Figure GDA0003680528510000061
Figure GDA0003680528510000062
其中,μ(·)和σ(·)分别表示每个通道和每个样本在空间维度上计算所得的平均值和标准偏差,γ和β是通过数据训练所学习到的参数。
进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别方法,所述残余特征通过下述公式得到:D=x-x1,其中,D表示输入的原始特征x与实例归一化后的特征x1的差值;
所述行人身份信息相关的特征设为x2,且在第一注意力机制模块中通过下述公式:x2=sa1(ca1(D))得到,其中,中ca1(·)表示特征通过通道注意力机制,sa1(·)表示特征通过空间注意力机制;
进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别方法,所述恢复特征记为x12,且实例归一化后的特征x1与行人身份信息相关的特征x2在特征叠加器
Figure GDA0003680528510000063
中通过下述公式计算得到恢复特征x12:x12=x1+x2
进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别方法,所述判别特征记为x3,且在所述第二注意力机制模块中通过下述公式得到:x3=sa2(ca2(BN(x))),其中,中BN(·)为特征通过批量归一化层,ca2(·)表示特征通过通道注意力机制,sa2(·)表示特征通过空间注意力机制。
进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别方法,所述完整输出特征记为y,且恢复特征和判断特征在特征叠加器
Figure GDA0003680528510000071
通过下述公式得到完整输出特征:y=x12+wx3,其中,w表示自适应权重。
本发明与现有技术相比,具有以下优点及有益效果:
本发明有效的消除了不同域之间的风格差异,增强了模型的跨域泛化能力。
本发明使用灵活,可以和许多行人重识别算法网络相结合作为即插即用模块来提高网络跨域泛化能力。
本发明与IBN-Net相比,跨域行人重识别性能有了明显的提高。通过在Market1501数据集到DukeMTMC数据集上实验,本发明的准确率比IBN-Net高了3.7%;通过在DukeMTMC数据集到Market1501数据集上实验,本发明的准确率比IBN-Net高了5.0%。
附图说明
图1实例-批量归一化块结构图。
图2为本发明所述的跨域行人重识别装置(注意力和风格归一化模块ASN)。
图3为域不变特征提取网络。
具体实施方式
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
实施例1:
本发明设计出基于域不变特征的跨域行人重识别装置,该跨域行人重识别装置设置在域不变特征提取网络的残差模块之后,如图2所示,包括用于得到恢复特征的恢复特征模块,用于得到判别特征的特征增强模块,以及一个用于将恢复特征和判别特征进行叠加得到完整输出特征的特征叠加器
Figure GDA0003680528510000081
所述恢复特征模块设置有:
实例归一化模块IN,用于将输入的原始特征进行归一化处理,得到实例归一化后的特征;
特征残余计算器
Figure GDA0003680528510000082
用于进行输入的原始特征与实例归一化后的特征之间的残差计算,得到残余特征;
第一注意力机制模块(包括通道注意力模块CA1和空间注意力模块SA1),将残余特征基于通道注意力机制和空间注意力机制自适应的提取出行人身份信息相关的特征;
及特征叠加器
Figure GDA0003680528510000083
用于将行人身份信息相关的特征与实例归一化后的特征进行叠加得到恢复特征。
所述特征增强模块设置有:
批量归一化模块BN,用于将输入的原始特征进行批量归一化处理,得到批量归一化特征;
第二注意力机制模块(包括通道注意力模块CA2和空间注意力模块SA2),将批量归一化特征基于通道注意力机制和空间注意力机制得到判别特征。
实施例2:
本实施例是在上述实施例的基础上进一步优化,基于域不变特征的跨域行人重识别方法,采用所述的基于域不变特征的跨域行人重识别装置实现,如图2所示,包括下述步骤:
1)输入的原始特征通过实例归一化模块IN减少样本特征间的域差异性,得到实例归一化后的特征;
2)利用特征残余计算器
Figure GDA0003680528510000091
对输入的原始特征与实例归一化后的特征进行残差计算,得到残余特征;
3)将残余特征利用第一注意力机制模块(包括通道注意力模块CA1和空间注意力模块SA1)基于通道注意力机制和空间注意力机制自适应的提取出行人身份信息相关的特征;
4)将实例归一化后的特征与行人身份信息相关的特征通过一个特征叠加器
Figure GDA0003680528510000092
叠加得到恢复特征;
5)将恢复特征和特征增强模块所形成的判别特征通过特征叠加器
Figure GDA0003680528510000093
进行叠加得到完整输出特征。
所述特征增强模块通过下述步骤得到判别特征:
A)输入的原始特征通过批量归一化模块BN进行批量归一化处理,得到批量归一化特征;
B)将批量归一化特征经第二注意力机制模块基于通道注意力机制和空间注意力机制得到判别特征。
实施例3:
本实施例是在上述实施例的基础上进一步优化,与前述技术方案相同部分在此将不再赘述,如图2所示,进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别方法,所述输入的原始特征设为x,且x∈Rb×c×h×w,其中,b、c、h、w分别表示批次大小、通道数、特征图的高度和宽度,Rb×c×h×w为b×c×h×w维矩阵,则经过注意力和风格归一化模块ASN(即跨域行人重识别装置)后完整的输出特征为y∈Rb×c×h×w
所述实例归一化后的特征设为x1,在所述步骤1)中,所述输入的原始特征经实例归一化模块IN采用下述公式得到实例归一化后的特征:
Figure GDA0003680528510000101
Figure GDA0003680528510000102
其中,μ(·)和σ(·)分别表示每个通道和每个样本在空间维度上计算所得的平均值和标准偏差,γ和β是通过数据训练所学习到的参数。
所述残余特征通过下述公式得到:D=x-x1,其中,D表示输入的原始特征x与实例归一化后的特征x1的差值;
所述行人身份信息相关的特征设为x2,且在第一注意力机制模块中通过下述公式:x2=sa1(ca1(D))得到,其中,中ca1(·)表示特征通过通道注意力机制,sa1(·)表示特征通过空间注意力机制;
所述恢复特征记为x12,且实例归一化后的特征x1和行人身份信息相关的特征x2在特征叠加器
Figure GDA0003680528510000103
中通过下述公式计算得到恢复特征x12:x12=x1+x2
所述判别特征记为x3,且在所述第二注意力机制模块中通过下述公式得到:x3=sa2(ca2(BN(x))),其中,中BN(·)为特征通过批量归一化层,ca2(·)表示特征通过通道注意力机制,sa2(·)表示特征通过空间注意力机制。
所述完整输出特征记为y,且恢复特征和判断特征在特征叠加器
Figure GDA0003680528510000104
通过下述公式得到完整输出特征:y=x12+wx3,其中,w表示自适应权重。
实施例4:
本实施例是在实施例2或实施例3的基础上进一步优化,与前述技术方案相同部分在此将不再赘述,如图2所示,进一步的为更好地实现本发明所述的基于域不变特征的跨域行人重识别装置,在进行跨域行人重识别装置的训练时,采用ASN损失函数对参数进行约束;由于针对风格归一化的特征,添加有价值的信息会使得特征更具有鉴别性;而添加干扰信息,会使得特征的鉴别性降低。设定代表有价值的信息和干扰信息的计算公式分别如下:
F+=D++wx3
F-=D-+(1-w)x3
其中F+代表有价值的信息,F-代表干扰信息,为便于区分在该公式中将对残余特征D进行操作得到行人身份信息相关的特征x2用D+表示,D-表示残余特征中与行人身份信息无关的特征,w表示自适应权重。对一个训练批次遍历一次,将每个样本依次作为锚样本,在剩下的样本中随机挑选出一个正样本p和负样本n,其特征分别为ya(锚样本的特征)、yp(正样本的特征)和yn(负样本的特征),设定添加有价值的信息后的输出和添加干扰信息后的输出公式分别如下:
y+=x1+F+
y-=x1+F-
其中y+为添加有价值的信息后的输出,y-为添加干扰信息后的输出。添加有价值的信息会使得锚样本与正样本的距离减小,与负样本之间的距离拉大;添加干扰信息会使得锚样本与正样本的距离拉大,与负样本之间的距离减小。
则ASN损失函数计算公式如下:
Figure GDA0003680528510000111
其中
Figure GDA0003680528510000112
trip(x,y)=max(x-y,0),从而通过这一思想约束ASN模块的训练过程。
实施例5:
如图3所示,在实现本发明时,会设置一个域不变特征提取网络,该域不变特征提取网络设置有多个残差模块(残差块1、残差块2、残差块3、残差块4)构成的残差-50(ResNet-50)网络结构、多个注意力和风格归一化模块ASN(ASN1、ASN2、ASN3、ASN4),其具体网络结构为:将注意力和风格归一化模块作为插入式结构插入残差-50网络结构中,即在每一个残差模块后插入一个注意力和风格归一化模块ASN,在使用时,从域不变特征提取网络中输出的图像域不变特征将被送入到分类器中进行行人重识别。
如图2所给出的注意力和风格归一化模块(ASN),其中,CA表示通道注意力模块,SA表示空间注意力模块,IN表示实例归一化,BN表示批量归一化,
Figure GDA0003680528510000121
代表相减以求特征残余(即特征残余计数器),
Figure GDA0003680528510000122
代表相加以求特征叠加(即特征叠加器)。
由于实例归一化可以将原始进行归一化,减少样本间差异,但同时会过滤掉一些行人身份相关信息和行人重识别判别信息。为解决这一问题,本发明提出了注意力和风格归一化模块用于恢复所丢失行人身份相关信息和行人重识别判别信息。图2展示了注意力和风格归一化模块的结构,x∈Rb×c×h×w代表输入,y∈Rb×c×h×w代表输出,其中b、c、h、w分别表示批次大小、通道数、特征图的高度和宽度。
基于域不变特征的跨域行人重识别方法,其具体方法如下:
输入的原始特征首先通过实例归一化模块IN减少样本特征间的域差异性,得到实例归一化后的特征x1,公式如下:
Figure GDA0003680528510000123
其中μ(·)和σ(·)分别表示每个通道和每个样本在空间维度上计算所得的平均值和标准偏差,γ和β是通过数据训练所学习到的参数。然后,因数学计算的具体性和目的性,必定会导致输入的原始特征通过实例归一化后丢失一部分行人身份相关信息,因此本发明提出从残余特征D中找回这些有用的信息。为从残余特征D中找回这些有用的信息,本发明通过下述公式得到残余特征D
D=x-x1
其中D表示原始特征x与通过实例归一化后的特征x1的差值。残余特征D包含两部分:与身份信息有关的特征和与身份信息无关的特征。为找回有用信息,本发明联合使用通道注意力机制和空间注意力机制以求定位到感兴趣的空间位置(即提取出行人信息相关的特征x2)。
x2=sa1(ca1(D))
其中ca1(·)表示特征通过通道注意力机制,sa1(·)表示特征通过空间注意力机制。本发明通过注意力机制能够自适应地提取与行人信息相关的特征。本发明进一步将通过实例归一化后的特征x1与找回的行人信息相关的特征x2进行叠加得到恢复特征x12
x12=x1+x2
由于完全进行风格归一化会损失一些不同样本间有利于重识别的判别信息,故本发明提出在恢复的风格归一化的特征(恢复特征)上加权叠加一部分原始信息(特征增强模块所得到的判别特征):
首先输入的原始特征进行批量归一化,同样的利用空间注意力机制和通道注意力机制定位所需要的位置,找出样本间有利于重识别的判别特征x3
x3=sa2(ca2(BN(x)));
其中BN(·)为特征通过批量归一化层,ca2(·)表示特征通过通道注意力机制,sa2(·)表示特征通过空间注意力机制。然后,通过设置一个自适应的权重向量将恢复特征x12和样本间有利于重识别的判别特征x3进行加权叠加,
使得特征信息更加完整。最后输出特征(即完整输出特征)用y表示:
y=x12+wx3
其中,w表示自适应权重。
本发明在对跨域行人重识别装置进行训练时,设计了ASN损失函数以便对参数进行约束。由于针对风格归一化的特征,添加有价值的信息会使得特征更具有鉴别性;而添加干扰信息,会使得特征的鉴别性降低。设定代表有价值的信息和干扰信息的计算公式分别如下:
F+=D++wx3
F-=D-+(1-w)x3
其中F+代表有价值的信息,F-代表干扰信息,为便于区分在该公式中将对残余特征D进行操作得到行人身份信息相关的特征x2用D+表示,D-表示残余特征中与行人身份信息无关的特征,w表示自适应权重。在运用时,首先对一个训练批次遍历一次,将每个样本依次作为锚样本,在剩下的样本中随机挑选出一个正样本p和负样本n,其特征分别为ya(锚样本的特征)、yp(正样本的特征)和yn(负样本的特征),设定添加有价值的信息后的输出和添加干扰信息后的输出公式分别如下:
y+=x1+F+
y-=x1+F-
其中y+为添加有价值的信息后的输出,y-为添加干扰信息后的输出。添加有价值的信息会使得锚样本与正样本的距离减小,与负样本之间的距离拉大;添加干扰信息会使得锚样本与正样本的距离拉大,与负样本之间的距离减小。
则ASN损失函数计算公式如下:
Figure GDA0003680528510000151
其中
Figure GDA0003680528510000152
trip(x,y)=max(x-y,0),从而通过这一思想约束ASN模块的训练过程。
以上所述,仅是本发明的较佳实施例,并非对本发明做任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本发明的保护范围之内。

Claims (9)

1.基于域不变特征的跨域行人重识别装置,该跨域行人重识别装置设置在域不变特征提取网络的残差模块之后,其特征在于:包括用于得到恢复特征的恢复特征模块,用于得到判别特征的特征增强模块,以及一个用于将恢复特征和判别特征进行叠加得到完整输出特征的特征叠加器
Figure FDA0003660055840000011
所述恢复特征模块设置有:
实例归一化模块IN,用于将输入的原始特征进行归一化处理,得到实例归一化后的特征;
特征残余计算器
Figure FDA0003660055840000012
用于进行输入的原始特征与实例归一化后的特征之间的残差计算,得到残余特征;
第一注意力机制模块,将残余特征基于通道注意力机制和空间注意力机制自适应的提取出行人身份信息相关的特征;
及特征叠加器
Figure FDA0003660055840000013
用于将行人身份信息相关的特征与实例归一化后的特征进行叠加得到恢复特征;
所述特征增强模块设置有:
批量归一化模块BN,用于将输入的原始特征进行批量归一化处理,得到批量归一化特征;
第二注意力机制模块,将批量归一化特征基于通道注意力机制和空间注意力机制得到判别特征。
2.基于域不变特征的跨域行人重识别方法,采用如权利要求1所述的基于域不变特征的跨域行人重识别装置实现,其特征在于:包括下述步骤:
1)输入的原始特征通过实例归一化模块IN减少样本特征间的域差异性,得到实例归一化后的特征;
2)利用特征残余计算器
Figure FDA0003660055840000014
对输入的原始特征与实例归一化后的特征进行残差计算,得到残余特征;
3)将残余特征利用第一注意力机制模块基于通道注意力机制和空间注意力机制自适应的提取出行人身份信息相关的特征;
4)将实例归一化后的特征与行人身份信息相关的特征通过一个特征叠加器
Figure FDA0003660055840000021
叠加得到恢复特征;
5)将恢复特征和特征增强模块所形成的判别特征通过特征叠加器
Figure FDA0003660055840000022
进行叠加得到完整输出特征。
3.根据权利要求2所述的基于域不变特征的跨域行人重识别方法,其特征在于:所述特征增强模块通过下述步骤得到判别特征:
A)输入的原始特征通过批量归一化模块BN进行批量归一化处理,得到批量归一化特征;
B)将批量归一化特征经第二注意力机制模块基于通道注意力机制和空间注意力机制得到判别特征。
4.根据权利要求3所述的基于域不变特征的跨域行人重识别方法,其特征在于:所述输入的原始特征设为x,且x∈Rb×c×h×w,其中,b、c、h、w分别表示批次大小、通道数、特征图的高度和宽度,Rb×c×h×w为b×c×h×w维矩阵;
所述实例归一化后的特征设为x1,在所述步骤1)中,所述输入的原始特征经实例归一化模块IN采用下述公式得到实例归一化后的特征:x1
Figure FDA0003660055840000023
其中,μ(·)和σ(·)分别表示每个通道和每个样本在空间维度上计算所得的平均值和标准偏差,γ和β是通过数据训练所学习到的参数。
5.根据权利要求4所述的基于域不变特征的跨域行人重识别方法,其特征在于:所述残余特征通过下述公式得到:D=x-x1,其中,D表示输入的原始特征x与实例归一化后的特征x1的差值;
所述行人身份信息相关的特征设为x2,且在第一注意力机制模块中通过下述公式:x2=sa1(ca1(D))得到,其中,中ca1(·)表示特征通过通道注意力机制,sa1(·)表示特征通过空间注意力机制;
6.根据权利要求5所述的基于域不变特征的跨域行人重识别方法,其特征在于:所述恢复特征记为x12,且实例归一化后的特征x1与行人身份信息相关的特征x2在特征叠加器
Figure FDA0003660055840000031
中通过下述公式计算得到恢复特征x12:x12=x1+x2
7.根据权利要求5所述的基于域不变特征的跨域行人重识别方法,其特征在于:所述判别特征记为x3,且在所述第二注意力机制模块中通过下述公式得到:x3=sa2(ca2(BN(x))),其中,中BN(·)为特征通过批量归一化层,ca2(·)表示特征通过通道注意力机制,sa2(·)表示特征通过空间注意力机制。
8.根据权利要求7所述的基于域不变特征的跨域行人重识别方法,其特征在于:所述完整输出特征记为y,且恢复特征和判断特征在特征叠加器
Figure FDA0003660055840000032
通过下述公式得到完整输出特征:y=x12+wx3,其中,w表示自适应权重。
9.根据权利要求2所述的基于域不变特征的跨域行人重识别方法,其特征在于:在进行基于域不变特征的跨域行人重识别装置的训练时,采用ASN损失函数对参数进行约束。
CN202110391720.5A 2021-04-13 2021-04-13 基于域不变特征的跨域行人重识别装置及其方法 Active CN113221656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110391720.5A CN113221656B (zh) 2021-04-13 2021-04-13 基于域不变特征的跨域行人重识别装置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110391720.5A CN113221656B (zh) 2021-04-13 2021-04-13 基于域不变特征的跨域行人重识别装置及其方法

Publications (2)

Publication Number Publication Date
CN113221656A CN113221656A (zh) 2021-08-06
CN113221656B true CN113221656B (zh) 2022-07-22

Family

ID=77087164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110391720.5A Active CN113221656B (zh) 2021-04-13 2021-04-13 基于域不变特征的跨域行人重识别装置及其方法

Country Status (1)

Country Link
CN (1) CN113221656B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814854A (zh) * 2020-06-28 2020-10-23 北京交通大学 一种无监督域适应的目标重识别方法
CN111832514A (zh) * 2020-07-21 2020-10-27 内蒙古科技大学 基于软多标签的无监督行人重识别方法及装置
CN112069940A (zh) * 2020-08-24 2020-12-11 武汉大学 一种基于分阶段特征学习的跨域行人重识别方法
CN112464730A (zh) * 2020-11-03 2021-03-09 南京理工大学 一种基于域无关前景特征学习的行人再识别方法
JP2021051375A (ja) * 2019-09-20 2021-04-01 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126360B (zh) * 2019-11-15 2023-03-24 西安电子科技大学 基于无监督联合多损失模型的跨域行人重识别方法
CN111666851B (zh) * 2020-05-28 2022-02-15 大连理工大学 一种基于多粒度标签的交叉域自适应行人重识别方法
CN111860678B (zh) * 2020-07-29 2024-02-27 中国矿业大学 一种基于聚类的无监督跨域行人重识别方法
CN112069920B (zh) * 2020-08-18 2022-03-15 武汉大学 基于属性特征驱动聚类的跨域行人重识别方法
CN112528788B (zh) * 2020-12-01 2023-11-21 重庆兆光科技股份有限公司 一种基于域不变特征和时空特征的重识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021051375A (ja) * 2019-09-20 2021-04-01 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
CN111814854A (zh) * 2020-06-28 2020-10-23 北京交通大学 一种无监督域适应的目标重识别方法
CN111832514A (zh) * 2020-07-21 2020-10-27 内蒙古科技大学 基于软多标签的无监督行人重识别方法及装置
CN112069940A (zh) * 2020-08-24 2020-12-11 武汉大学 一种基于分阶段特征学习的跨域行人重识别方法
CN112464730A (zh) * 2020-11-03 2021-03-09 南京理工大学 一种基于域无关前景特征学习的行人再识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Seokeon Choi et.al.Meta Batch-Instance Normalization for Generalizable Person Re-Identification.《Computer Vision and Pattern Recognition》.2021, *
Ye Li et.al.Feature Pyramid Attention Model and Multi-Label Focal Loss for Pedestrian Attribute Recognition.《IEEE Access》.2020, *
祁磊等.弱监督场景下的行人重识别研究综述.《软件学报》.2020,(第09期),全文. *

Also Published As

Publication number Publication date
CN113221656A (zh) 2021-08-06

Similar Documents

Publication Publication Date Title
CN111784747B (zh) 一种基于关键点检测和校正的车辆多目标跟踪系统及方法
CN110210335B (zh) 一种行人重识别学习模型的训练方法、系统和装置
CN111639564B (zh) 一种基于多注意力异构网络的视频行人重识别方法
CN108875645B (zh) 一种煤矿井下复杂光照条件下的人脸识别方法
CN112990316B (zh) 基于多显著性特征融合的高光谱遥感图像分类方法及系统
CN112464730B (zh) 一种基于域无关前景特征学习的行人再识别方法
CN112434599B (zh) 一种基于噪声通道的随机遮挡恢复的行人重识别方法
CN105760898A (zh) 一种基于混合组回归方法的视觉映射方法
CN112215780B (zh) 基于类特征修复融合的图像取证对抗性攻击防御方法
CN110321969B (zh) 一种基于mtcnn的车脸对齐方法
Velliangira et al. A novel forgery detection in image frames of the videos using enhanced convolutional neural network in face images
CN112396036A (zh) 一种结合空间变换网络和多尺度特征提取的遮挡行人重识别方法
CN107679467B (zh) 一种基于hsv和sdalf的行人重识别算法实现方法
Wang et al. Coarse-to-fine grained image splicing localization method based on noise level inconsistency
CN113221656B (zh) 基于域不变特征的跨域行人重识别装置及其方法
CN111127407A (zh) 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法
CN108647679B (zh) 一种基于车窗粗定位的车标识别方法
US20240104885A1 (en) Method and system for unsupervised deep representation learning based on image translation
CN116311345A (zh) 一种基于Transformer的遮挡行人重识别方法
Angadi et al. Human identification using histogram of oriented gradients (HOG) and non-maximum suppression (NMS) for atm video surveillance
CN114639013A (zh) 基于改进Orient RCNN模型的遥感图像飞机目标检测识别方法
CN111951298B (zh) 一种融合时间序列信息的目标跟踪方法
CN114638356A (zh) 一种静态权重引导的深度神经网络后门检测方法及系统
Vivekanandam et al. Face recognition from video frames using hidden markov model classification model based on modified random feature extraction
Jia et al. SVM Ensemble-based Noise Detection Method for Image Denoising

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant