CN108875448B - 一种行人再识别方法及装置 - Google Patents

一种行人再识别方法及装置 Download PDF

Info

Publication number
CN108875448B
CN108875448B CN201710322952.9A CN201710322952A CN108875448B CN 108875448 B CN108875448 B CN 108875448B CN 201710322952 A CN201710322952 A CN 201710322952A CN 108875448 B CN108875448 B CN 108875448B
Authority
CN
China
Prior art keywords
matrix
potential
level
feature
test sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710322952.9A
Other languages
English (en)
Other versions
CN108875448A (zh
Inventor
黄欢
赵刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jinghong Technology Co., Ltd
Original Assignee
Shenzhen Jinghong Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jinghong Technology Co ltd filed Critical Shenzhen Jinghong Technology Co ltd
Priority to CN201710322952.9A priority Critical patent/CN108875448B/zh
Publication of CN108875448A publication Critical patent/CN108875448A/zh
Application granted granted Critical
Publication of CN108875448B publication Critical patent/CN108875448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种行人再识别方法及装置,所述方法包括:S1,基于不同摄像头场景下图像特征的基矩阵,按照重构误差最小的优化目标,逐一获取测试集中每个测试样本对的潜在中级特征;S2,根据不同摄像头场景下图像特征的特征转换矩阵和所述每个测试样本对的潜在中级特征,基于欧式距离,对所述每个测试样本对的相似距离进行逐一度量,并将所有测试样本对的相似距离度量结果进行排序,获得距离度量矩阵。本发明提出的一种行人再识别方法及装置,增强了特征表达的鲁棒性和稳定性,并将特征提取和度量学习过程结合,提供了更有效的度量。

Description

一种行人再识别方法及装置
技术领域
本发明涉及信息处理技术领域,更具体地,涉及一种行人再识别方法及装置。
背景技术
行人再识别指的是在非重叠监控视频中,检索某个监控视频中出现的目标是否出现在其他的监控视频中。行人再识别能够有效解决现有监控网络中的目标轨迹连续性问题,大大提高监控视频中犯罪嫌疑的识别追踪的效率和精度,在安防、军事以及辅助刑侦等领域具有广阔的应用前景。监控视频中的目标图像分辨率低、场景中存在着光照变化、视角变化、行人姿态变化以及摄像机自身属性的问题,导致同一目标在不同的监控视频中外观区别很大,使得行人再识别问题遇到了很大的挑战。
目前行人再识别的方法可以分为三类:基于表观特征模型的方法、基于度量学习的方法以及基于深度学习的方法。其中,基于表观特征模型的方法是基于行人图像的色彩纹理等显著特征,设计一种手工特征表达方式作为对图像的描述,使得不同个体的图像特征具有显著的可判别性。基于度量学习的方法是一种利用机器学习的算法得出一个度量子空间,在该空间内,使得正样本对之间的距离尽量小,负样本对之间的距离尽可能大的方法。例如一种基于线性判别分析思想的度量学习方法,并引入KISSE算法思想,在投影子空间中学习一个马氏距离,该方法大大提高了行人再识别问题的识别精度。基于深度学习的方法采用siamese网络结构,同时输入两张图像,用两个并行的CNN网络结构分别进行特征提取,并在全连接层通过一个相似度量函数对两个输出特征进行连接,实现样本相似性的度量。深度学习方法的优势在于强大的特征表达能够,且训练和识别是端到端的学习方法。
然而,上述三类方法都存在一定的问题:基于特征表示的方法会由于光线、姿态、拍摄角度以及背景的剧烈变化而出现特征表达不稳定、鲁棒性差的问题,从而影响识别精度;基于度量学习的方法由于特征提取与度量学习过程是分离的,度量学习过程会受限于样本特征表达,并且基于手工特征进行分类识别,样本特征具有较高维度,同时由于优化准则的约束,学习得到的度量空间会对训练样本过拟合;基于深度学习的行人再识别算法需要非常大的训练数据库,导致训练时间较长、资源消耗大,不利于该方法的推广。
发明内容
为了克服现有行人再识别方法中存在的特征表达不稳定、鲁棒性差,特征提取与度量学习过程分离的问题,本发明提出一种行人再识别的方法及装置。
根据本发明的一个方面,提供一种行人再识别的方法,包括:
S1,基于不同摄像头场景下图像特征的基矩阵,按照重构误差最小的优化目标,逐一获取测试集中每个测试样本对的潜在中级特征;
S2,根据不同摄像头场景下图像特征的特征转换矩阵和所述每个测试样本对的潜在中级特征,基于欧式距离,对所述每个测试样本对的相似距离进行逐一度量,并将所有测试样本对的相似距离度量结果进行排序,获得距离度量矩阵。
其中,在步骤S1之前还包括:
S01,对训练集中不同摄像头场景下的正样本对集合进行矩阵分解,将原始手工特征转换为基于潜在中级特征的表达;
S02,基于重构误差最小以及正样本对距离最小的优化目标,通过学习获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵。
在步骤S01之前还包括:
对数据集中的行人编号进行随机排序,选取前k个行人的图像作为训练集,剩余图像则作为测试集;
将所述测试集和训练集中的每个行人图像按照摄像头的不同进行分类,并提取两个不同摄像头场景下行人图像的原始手工特征,获得两个不同摄像头场景下的样本集。
其中,所述步骤S01进一步包括:
S11,通过矩阵分解,将所述正样本对集合中两个样本集所对应的原始手工特征均转换为基矩阵和潜在中级特征的乘积;
S12,对所获得的两个不同摄像头场景下的潜在中级特征进行连接,获得特征转换矩阵。
其中,所述步骤S02进一步包括:
S21,基于重构误差最小以及正样本对潜在特征差异最小的优化目标,建立潜在中级特征学习的损失函数;
S22,通过交替优化的方法对所述潜在中级特征学习的损失函数进行最优化问题求解,获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵。
其中,所述步骤S1进一步包括:
S31,按照重构误差最小原则,构建对每个测试样本对的潜在中级特征进行求解的目标函数;
S32,基于不同摄像头场景下图像特征的基矩阵,求解所述目标函数,获得每个测试样本对的潜在中级特征。
其中,步骤S2中对所述每个测试样本对的相似距离进行逐一度量进一步包括:
根据不同摄像头场景下图像特征的特征转换矩阵对所述每个测试样本对中的一个样本的潜在中级特征进行投影,将投影所得的矩阵与所述每个测试样本对中的另一个样本的潜在中级特征进行欧式距离计算,得到所述每个测试样本对的相似距离度量结果。
其中,步骤S21中所述潜在中级特征学习的损失函数具体为:
Figure BDA0001290364950000041
s.t.||mi||2≤1,||pi||2≤1,||ri||2≤1
其中,M,P分别为训练集正样本对集合中两个样本集对应的基矩阵,U,V为所述两个样本集对应的潜在中级特征,R为连接U,V的特征转换矩阵,
Figure BDA0001290364950000042
为正则项,α,λ,ρ均为常量。
其中,所述步骤S22进一步包括:
固定所述损失函数中的参数M,P,V,R,学习U,通过对所述损失函数进行求导得到第一问题,通过不断迭代对所述第一问题进行求解,得到潜在中级特征U的表达式;
固定所述损失函数中的参数M,P,U,R,学习V,通过对所述损失函数进行求导得到第二问题,通过不断迭代对所述第二问题进行求解,得到潜在中级特征V的表达式;
基于U和V的表达式,通过求解拉格朗日对偶问题,得到不同摄像头场景下图像特征的基矩阵M,P以及特征转换矩阵R。
其中,在步骤S2之后还包括:
根据所述距离度量矩阵计算累计精度。
根据本发明的另一个方面,提供一种行人再识别方法,包括:
步骤1,对训练集中不同摄像头场景下的正样本对集合进行矩阵分解,将原始手工特征转换为基于潜在中级特征的表达;
步骤2,基于重构误差最小以及正样本对距离最小的优化目标,通过学习获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵;
步骤3,基于所述不同摄像头场景下图像特征的基矩阵,获取测试集中每个测试样本对的潜在中级特征,并基于所述潜在中级特征和所述特征转换矩阵,对所述每个测试样本对的相似距离进行逐一度量,将所有测试样本对的相似距离从小到大排序,获得距离度量矩阵。
根据本发明的又一个方面,提供一种行人再识别装置,包括:
特征获取模块,用于基于不同摄像头场景下图像特征的所述基矩阵,按照重构误差最小的优化目标,逐一获取测试集中每个测试样本对的潜在中级特征;
距离度量模块,用于根据所述特征转换矩阵和所述每个测试样本对的潜在中级特征,基于欧式距离,对所述每个测试样本对的相似距离进行逐一度量,并将所有测试样本对的相似距离度量结果从小到大进行排序,获得距离度量矩阵。
本发明提出的一种行人再识别方法及装置,对不同摄像头采集得到的图像集合,分别通过矩阵分解的方法转换为基矩阵与潜在中级特征,并对两个样本的潜在中级特征通过一个特征转换矩阵进行连接,对通过学习得到潜在的中级特征进行相似距离度量,增强了特征表达的鲁棒性和稳定性,并将特征提取和度量学习结合,提供了更有效的度量,提高了识别精度。
附图说明
图1为本发明一实施例提供的一种行人再识别方法的流程示意图;
图2为根据本发明实施例提供的方法进行仿真实验的过程示意图;
图3为仿真实验的识别结果查询的示意图;
图4为本发明另一实施例提供的一种行人再识别装置的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所述,为本发明一实施例提供的一种行人再识别方法的流程图,包括:
S1,基于不同摄像头场景下图像特征的基矩阵,按照重构误差最小的优化目标,逐一获取测试集中每个测试样本对的潜在中级特征;
S2,根据不同摄像头场景下图像特征的特征转换矩阵和所述每个测试样本对的潜在中级特征,基于欧式距离,对所述每个测试样本对的相似距离进行逐一度量,并将所有测试样本对的相似距离度量结果进行排序,获得距离度量矩阵。
行人再识别的具体任务是在两个不同摄像头下对行人目标进行匹配。本发明实施例提出的一种行人再识别方法,基于两个不同摄像头场景下图像特征之间的匹配关系进行样本相似距离的度量,从而完成行人再识别任务。具体流程如下:
步骤S1基于不同摄像头场景下图像特征的基矩阵,按照重构误差最小的优化目标建立用于求解潜在中级特征的目标函数,对目标函数进行最小值求解,分别获取测试集中任一测试样本对中的两个样本的潜在中级特征,对测试集中的所有测试样本对均进行上述操作,获取所有测试样本对的潜在中级特征。
步骤S2根据不同摄像头场景下图像特征的特征转换矩阵和步骤S1获得的所述每个测试样本对的潜在中级特征,基于欧式距离,对所述每个测试样本对的相似距离进行逐一度量,其中,每个测试样本对的相似距离的度量是通过特征转换矩阵对所述测试样本对中的一个样本的潜在中级特征进行投影,将投影后的矩阵与另一个样本的潜在中级特征进行欧式距离的计算,即将一个摄像头场景下的每个图像的潜在中级特征与另一个摄像头场景下的所有图像的潜在中级特征进行逐一的匹配。通过特征转换矩阵将上述对潜在中级特征进行距离度量的过程与特征提取的过程结合起来了,具有更好的度量效果和识别精度。获取到测试集中的所有测试样本对的相似距离度量结果后,将所述结果按照从小到大进行排序,获得距离度量矩阵,对所述距离度量矩阵进行分析,即可以得到两个不同摄像头下行人目标的再识别结果。
本发明实施例提供的一种行人再识别方法,基于不同摄像头场景下图像特征之间的基矩阵和转换特征矩阵,通过学习得到图像特征的潜在中级特征,基于潜在中级特征对每个测试样本对进行相似距离度量,将特征提取和度量学习过程结合,提供了更有效的度量,提高了识别精度。
本发明另一实施例,在上述实施例的基础上,在步骤S1之前还包括:
S01,对训练集中不同摄像头场景下的正样本对集合进行矩阵分解,将原始手工特征转换为基于潜在中级特征的表达;
S02,基于重构误差最小以及正样本对距离最小的优化目标,通过学习获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵。
具体地,步骤S01中正样本对集合是指训练集中同一行人在两个不同摄像头下的图像特征样本对的集合。对训练集中不同摄像头场景下的的正样本对集合,通过矩阵分解的方法,将原始手工特征转换为基于潜在中级特征的表达,所述基于潜在中级特征的表达是指样本矩阵经过矩阵分解后转换为基矩阵与潜在中级特征,同时通过一个特征转换矩阵对样本矩阵中两个不同摄像头下的样本的潜在中级特征进行连接,可以克服采用现有手工特征表达时由于光线、姿态、拍摄角度以及背景的剧烈变化而出现特征表达不稳定、鲁棒性差的问题。
步骤S2基于重构误差最小以及正样本对距离最小的优化目标,构建潜在中级特征学习的损失函数,通过对所述损失函数的最优化问题进行求解,获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵。
本发明实施例提供的一种行人再识别方法,通过矩阵分解的方法将两个不同摄像头的行人图像特征转换为基矩阵与潜在中级特征,并对两个样本集的潜在中级特征通过一个特征转换矩阵进行连接,增强了特征表达的鲁棒性和稳定性。
基于上述实施例,在步骤S01之前还包括:
对数据集中的行人编号进行随机排序,选取前k个行人的图像作为训练集,剩余图像则作为测试集;
将所述测试集和训练集中的每个行人图像按照摄像头的不同进行分类,并提取两个不同摄像头场景下行人图像的原始手工特征,获得两个不同摄像头场景下的样本集。
本发明实施例提出的一种行人再识别方法,首先通过训练获得两个不同摄像头场景下图像特征之间的匹配关系,然后基于所述匹配关系去进行行人目标的识别。为了获得两个不同摄像头场景下图像特征之间的匹配关系,首先需要通过随机抽样的方式将数据集划分为训练集和测试集。具体地,在步骤S1之前对样本数据集进行划分。将数据集中通过随机抽样的方式划分为训练集和测试集,对行人编号进行随机排序,选取前k个行人的样本图像作为训练集,剩余图像则作为测试集。其中,k的取值可以根据需要进行灵活调整,
将测试和训练集中的每个行人的图像按照拍摄摄像头的不同进行分类,其中,摄像头A采集得到的行人图像为gallery集合,摄像头B采集得到的行人图像为probe集合。结合现有的手工特征提取方法,提取两个不同摄像头场景下行人图像的原始手工特征,获得两个不同摄像头场景下的样本集,即获得gallery集合中的行人图像的原始手工特征和probe集合中的行人图像的原始手工特征。基于上述实施例,所述步骤S01进一步包括:
S11,通过矩阵分解,将所述正样本对集合中两个样本集所对应的原始手工特征均转换为基矩阵和潜在中级特征的乘积;
S12,通过特征转换矩阵对所获得的两个不同摄像头场景下的潜在中级特征进行连接。
具体地,首先定义训练集中不同摄像头场景下的样本集合为(X,Y),X为训练集的gallery集合中的行人图像的原始手工特征,Y为训练集的probe集合中的行人图像的原始手工特征,X={xi},Y={yj},(i,j=1,2,…,N),当i=j时,说明两个图像对应同一个人,(X,Y)为正样本对集合。对训练集正样本对集合中样本集分别进行矩阵分解,建立类似字典表达的潜在特征:
X=MU,Y=PV
其中,M,P分别为两个样本集X,Y对应的基矩阵,U,V为两个样本集X,Y对应的潜在中级特征。
S12,对所获得的两个不同摄像头场景下的潜在中级特征U,V进行连接,增强特征对行人跨摄像头造成的形态变化的鲁棒性:
V=RU
其中,U,V为两个样本集X,Y对应的潜在中级特征,R为连接U,V的特征转换矩阵。
基于上述实施例,所述步骤S02进一步包括:
S21,基于重构误差最小以及正样本对潜在特征差异最小的优化目标,建立潜在中级特征学习的损失函数;
S22,通过交替优化的方法对所述潜在中级特征学习的损失函数进行最优化问题求解,获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵。
具体地,重构是指从经过变换的数据中恢复出原始数据,如上述实施例所述,所述正样本对集合中两个样本集所对应的原始手工特征均通过矩阵分解的方法转换成了基矩阵和潜在中级特征的乘积,需要使得经过矩阵分解后的样本集的重构误差最小。同时度量学习的目标是使得正样本对的距离尽可能小,因此将正样本对通过矩阵分解的方法转换为潜在中级特征表达后,需要使得正样本对的潜在中级特征差异最小,以约束正样本对的距离,综上所述,可获得潜在中级特征学习的损失函数。
所述潜在中级特征学习的损失函数具体为:
Figure BDA0001290364950000101
s.t.||mi||2≤1,||pi||2≤1,||ri||2≤1
其中,M,P分别为训练集正样本对集合中两个样本集对应的基矩阵,U,V分别为所述两个样本集对应的潜在中级特征,R为连接U,V的特征转换矩阵,
Figure BDA0001290364950000102
为正则项,α,λ,ρ均为常量。
建立了潜在中级特征学习的损失函数之后,对所述损失函数的最优化问题进行求解,由于所述损失函数是基于重构误差最小以及正样本距离最小的原则获得的,是非凸的,需要通过交替优化的方法对所述问题进行求解,最终获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵。
基于上述各个实施例,所述步骤S1进一步包括:
S31,按照重构误差最小原则,构建对每个测试样本对的潜在中级特征进行求解的目标函数;
S32,基于不同摄像头场景下图像特征的基矩阵,求解所述目标函数,获得每个测试样本对的潜在中级特征。
对测试集中的任意一个样本对(xi,yj),基于不同摄像头场景下图像特征的基矩阵M,P,求解出该样本对所对应的潜在中级特征,具体步骤如下:
按照重构误差最小原则,构建对每个测试样本对的潜在中级特征进行求解的目标函数,所述目标函数具体为:
Figure BDA0001290364950000103
其中,M,P分别为两个不同摄像头场景下图像特征的基矩阵,ρ为常量,ui,vj分别为测试样本对中不同摄像头场景下样本所对应的潜在中级特征。
已知xi,yj,M,P,通过迭代求解上述目标函数,可获得ui,vj,即获得所述测试样本对的潜在中级特征。同理,对测试集中其他样本对的潜在中级特征进行逐一求解,获得所有测试样本对的潜在中级特征。
基于上述实施例,步骤S2中对所述每个测试样本对的相似距离进行逐一度量进一步包括:
根据不同摄像头场景下图像特征的特征转换矩阵对所述每个测试样本对中的一个样本的潜在中级特征进行投影,将投影所得的矩阵与所述每个测试样本对中的另一个样本的潜在中级特征进行欧式距离计算,得到所述每个测试样本对的相似距离度量结果。
具体地,对任意一个测试样本对
Figure BDA0001290364950000111
通过特征转换矩阵,基于欧式距离对样本对的相似距离进行度量,样本对的相似距离度量公式如下:
Figure BDA0001290364950000112
本发明实施例提供的度量方法,没有直接对所获得的样本对的潜在中级特征进行相似性度量,而是通过一个特征转换矩阵,将测试样本对中的一个样本的潜在中级特征进行投影,将投影所得的矩阵与所述每个测试样本对中的另一个样本的潜在中级特征进行欧式距离计算,例如将样本
Figure BDA0001290364950000113
的潜在中级特征ui进行投影,得到Rui,与样本
Figure BDA0001290364950000114
的潜在中级特征vj进行欧式距离的计算。
基于上述实施例,所述步骤S22进一步包括:
固定所述损失函数中的参数M,P,V,R,学习U,通过对所述损失函数进行求导得到第一问题,通过不断迭代对所述第一问题进行求解,得到潜在中级特征U的表达式;
固定所述损失函数中的参数M,P,U,R,学习V,通过对所述损失函数进行求导得到第二问题,通过不断迭代对所述第二问题进行求解,得到潜在中级特征V的表达式;
基于U和V的表达式,通过求解拉格朗日对偶问题,得到不同摄像头场景下图像特征的基矩阵M,P以及特征转换矩阵R。
具体地,由于上述实施例中给出的潜在中级特征学习的损失函数为非凸的,需要通过交替优化的方法对潜在中级特征进行学习。上述损失函数中存在5个矩阵M,P,V,R,U,学习U时,固定M,P,V,R是指将M,P,V,R分别赋值为随机数矩阵,对所述损失函数进行求导得到第一问题:
Figure BDA0001290364950000121
上式中,X,M,V,R均为已知,通过不断迭代求得U的计算表达式为:
U=(MTM+λRTR+ρI)-1(MTX+λRTV)
同理,固定M,P,U,R,学习V,通过对所述损失函数进行求导得到第二问题:
Figure BDA0001290364950000122
通过不断迭代对所述第二问题进行求解,得到V的计算表达式为:
V=(αPTP+λI+ρI)-1(αPTY+λRU)
需要说明的是,学习U和学习V的步骤没有限定的顺序。基于U和V的计算表达式,通过求解朗格朗日对偶问题,得到M,P,R,即两个摄像头场景下图像特征的基矩阵和特征转换矩阵。
基于上述实施例,所述行人再识别方法在步骤S2之后还包括:
根据所述距离度量矩阵计算累计精度。
具体地,统计测试集相似度量结果,将度量结果按照距离有小到大排序,同时记录下每个距离所对应的probe集合中图像的序号,组成度量距离矩阵D。根据所述距离度量矩阵计算累计精度(CMC曲线):
Figure BDA0001290364950000131
CMC曲线的横坐标为rank数值,即对应的排序,rank=1表示最相似的匹配结果,如果与标签信息一致,则认为识别正确。纵坐标是随着rank增加的累计精度,表示正确的标签图像度量结果出现在rank≤m的所有图像占样本总体的比率。其中l表示CMC累积精度的rank=l,即测试距离按照从小到大的排名为l,N为测试样本中gallery的样本个数。
Figure BDA0001290364950000132
为符号函数,即函数内变量为真时则对应函数值为1,否则为0。rank(·)表示样本距离排名计算,Pi为第i个gallery样本的正样本距离,rank(Pi)表示其正样本的排序。通常,我们希望正确匹配的目标对应的相似距离度量结果最小,即rank=1所对应的图像就是正确匹配图像,然而由于行人在识别问题的复杂性,样本受到光线、行人姿态、拍摄视角、背景等多方面因素影响,特征变化剧烈。因此,在rank=1的条件下,识别率有限,于是,我们通常考虑rank排在前20的累积识别率。
本发明另一实施例,提供一种行人再识别方法,其特征在于,包括:
步骤1,对训练集中不同摄像头场景下的正样本对集合进行矩阵分解,将原始手工特征转换为基于潜在中级特征的表达;
步骤2,基于重构误差最小以及正样本对距离最小的优化目标,通过学习获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵;
步骤3,基于所述不同摄像头场景下图像特征的基矩阵,获取测试集中每个测试样本对的潜在中级特征,并基于所述潜在中级特征和所述特征转换矩阵,对所述每个测试样本对的相似距离进行逐一度量,将所有测试样本对的相似距离从小到大排序,获得距离度量矩阵。
具体地,步骤1中正样本对集合是指训练集中同一行人在两个不同摄像头下的图像特征样本对的集合。对训练集中不同摄像头场景下的的正样本对集合,通过矩阵分解的方法,将原始手工特征转换为基于潜在中级特征的表达,所述基于潜在中级特征的表达是指样本矩阵经过矩阵分解后转换为基矩阵与潜在中级特征,同时通过一个特征转换矩阵对样本矩阵中两个不同摄像头下的样本的潜在中级特征进行连接,可以克服采用现有手工特征表达时由于光线、姿态、拍摄角度以及背景的剧烈变化而出现特征表达不稳定、鲁棒性差的问题。
步骤2基于重构误差最小以及正样本对距离最小的优化目标,构建潜在中级特征学习的损失函数,通过对所述损失函数的最优化问题进行求解,获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵。
步骤3,基于步骤2中获得的基矩阵,基于重构误差最小的原则,获取测试集中每个测试样本对的潜在中级特征,并基于所述潜在中级特征以及步骤2中获得的特征转换矩阵,对所述每个测试样本对的相似距离进行逐一度量,将所有测试样本对的相似距离从小到大排序,获得距离度量矩阵。
本发明实施例提供的一种行人再识别方法,可以用在现有原始手工特征提取技术的基础之上,通过矩阵分解的方法,将原始手工特征表达转换为潜在中级特征表达,减少了原始手工特征表达不稳定、不鲁棒缺陷对度量学习过程的影响,提高了识别精度,并且能够较好地兼容现有特征提取技术。
下面结合实验进一步具体说明本发明实施例提供的行人再识别方法。
1.仿真条件
本发明是在中央处理器为Intel(R)Core i3-2130 3.4GHZ、内存16G、WINDOWS 8操作系统上,运用MATLAB软件进行的仿真。
实验所使用的图像测试数据库为加州大学公开的行人再识别权威数据库VIPeR以及香港中文大学的最新数据库CUHK01。其中VIPeR图像是由两个室外摄像机拍摄得到的,共有632个行人的样本图像,每个行人在每个摄像机下均有且仅有一张图像。CUHK01则包含了971个行人的3884张图像,每个行人在每个场景中包含2张图像。
2.仿真内容
首先,如图2所示,基于VIPeR数据集和CUHK01数据集,完成本发明实施例提供的行人再识别方法实验,用样本数据库,通过随机抽样划分测试集和训练集,按照上述实施例中提供的具体步骤验证本发明算法的效果。根据相似距离度量公式,计算测试集中gallery集合与probe集的距离,并计算累计精度。然后,为了证明本发明实施例所提供的方法的有效性,综合考虑算法的流行性、崭新性,选取了4个对比方法SLDDL、KCCA、XQDA、MLAPG来对本发明实施例提供的方法进行精度比较。其中SLDDL是在“X.Jing,X.zhu,F.Wu,and X.You,“Super-resolution person re-identification with semi-coupled low-rankdiscriminant dictionary learning,”in IEEE Conference on Computer Vision andPattern Recognition,pp.695–704,2014.”中提出的。KCCA是在“G.Lisanti,I.Masi,andA.Del Bimbo,“Matching people across camera views using kernel canonicalcorrelation analysis,”in International Conference on Distributed SmartCameras,p.10,ACM,2014.”提出的。XQDA即为S.Liao等人在“S.Liao,Y.Hu,X.Zhu,andS.Z.Li,“Person re-identification by local maximal occurrence representationand metric learning,”vol.8,no.4,pp.2197–2206,2015.”中提出的。MLAPG在“S.Liaoand S.Z.Li,“Efficient psd constrained asymmetric metric learning for personre-identification,”in IEEE International Conference on Computer Vision,2015.”中有详细的介绍。
在实验中,为了保证结果的准确性,进行重复并行实验(相同试验条件下,重复进行实验10次),计算平均精度作为最终识别结果,其结果如表1所示。
r表示rank,从表1可见,本发明的识别率比现有的流行方法的识别率要高,其中当rank=1,在两个测试数据库上本方法比其他方法精度有了明显的提高,在VIPeR和CUHK01两个数据库中,rank-1分别提高了1.84%和1.60%,并且在所有统计数据中(rank-1、r-5、r-10、r-20),本文方法均达到了最好的精度。同时在VIPeR数据库上,我们对集成学习的方法进行了实验,识别精度有了进一步的大幅提升。因此本方法比其他方法更有效,学习得到的潜在中级特征更鲁棒。
表1行人再识别识别率
Figure BDA0001290364950000161
图3中给出了识别结果查询的示意图,最左侧一列为测试集的摄像头A中的待匹配图像,右侧给出了rank-10的识别结果,即相似性排名前10的识别结果,如右侧不存在带有红框的图像,则对应待识别图像的正确结果的相似性度量在10名以外。从图3可以看出,本发明能够准确的找出查询目标,学习一种更加强健的潜在中级特征,将特征学习与度量有效的结合在一起,对行人再识别问题中复杂的特征变化具有更强的鲁棒性。
本发明另一实施例,提供一种行人再识别装置,如图4所示,包括:特征获取模块41和距离度量模块42,其中,
不同摄像头场景下图像特征的基矩阵以及特征转换矩阵;
特征获取模块41,用于基于不同摄像头场景下图像特征的基矩阵,按照重构误差最小的优化目标,逐一获取测试集中每个测试样本对的潜在中级特征;
距离度量模块42,用于根据不同摄像头场景下图像特征的特征转换矩阵和所述每个测试样本对的潜在中级特征,基于欧式距离,对所述每个测试样本对的相似距离进行逐一度量,并将所有测试样本对的相似距离度量结果从小到大进行排序,获得距离度量矩阵。
具体地,特征获取模块41基于所述不同摄像头场景下图像特征的基矩阵,按照重构误差最小的优化目标建立用于求解潜在中级特征的目标函数,对目标函数进行最小值求解,分别获取测试集中任一测试样本对中的两个样本的潜在中级特征,对测试集中的所有测试样本对均进行上述操作,获取所有测试样本对的潜在中级特征。
距离度量模块42根据特征转换矩阵和潜在中级特征,基于欧式距离,对所述每个测试样本对的相似距离进行逐一度量,其中,每个测试样本对的相似距离度量是通过特征转换矩阵对所述测试样本对中的一个样本的潜在中级特征进行投影,将投影后的矩阵与另一个样本的潜在中级特征进行欧式距离的计算,即将一个摄像头场景下的每个图像的潜在中级特征特征与另一个摄像头场景下的所有图像的潜在中级特征进行逐一的匹配。将测试集中的所有测试样本对的相似距离度量结果按照从小到大进行排序,获得距离度量矩阵,对所述距离度量矩阵进行分析,即可以得到两个不同摄像头下行人目标的再识别结果。
本发明实施例提出的一种行人再识别装置,对不同摄像头采集得到的图像集合,通过矩阵分解的方法转换为基矩阵与潜在中级特征,并对两个样本的潜在中级特征通过一个特征转换矩阵进行连接,基于潜在中级特征进行相似距离度量,增强了特征表达的鲁棒性和稳定性,并将特征提取和度量学习过程结合,提高了识别精度。
最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种行人再识别方法,其特征在于,包括:
S1,基于不同摄像头场景下图像特征的基矩阵,按照重构误差最小的优化目标,逐一获取测试集中每个测试样本对的潜在中级特征;
S2,根据不同摄像头场景下图像特征的特征转换矩阵和所述每个测试样本对的潜在中级特征,基于欧式距离,对所述每个测试样本对的相似距离进行逐一度量,并将所有测试样本对的相似距离度量结果进行排序,获得距离度量矩阵;
在步骤S1之前还包括:
S01,对训练集中不同摄像头场景下的正样本对集合进行矩阵分解,将原始手工特征转换为基于潜在中级特征的表达;
S02,基于重构误差最小以及正样本对距离最小的优化目标,通过学习获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵;
其中,所述基于潜在中级特征的表达是指样本矩阵经过矩阵分解后转换为基矩阵与潜在中级特征,同时通过一个特征转换矩阵对样本矩阵中两个不同摄像头下的样本的潜在中级特征进行连接;
步骤S2中对所述每个测试样本对的相似距离进行逐一度量进一步包括:
根据不同摄像头场景下图像特征的特征转换矩阵对所述每个测试样本对中的一个样本的潜在中级特征进行投影,将投影所得的矩阵与所述每个测试样本对中的另一个样本的潜在中级特征进行欧式距离计算,得到所述每个测试样本对的相似距离度量结果。
2.根据权利要求1所述的方法,其特征在于,在步骤S01之前还包括:
对数据集中的行人编号进行随机排序,选取前k个行人的图像作为训练集,剩余图像则作为测试集;
将所述测试集和训练集中的每个行人图像按照摄像头的不同进行分类,并提取两个不同摄像头场景下行人图像的原始手工特征,获得两个不同摄像头场景下的样本集。
3.根据权利要求1所述的方法,其特征在于,所述步骤S01进一步包括:
S11,通过矩阵分解,将所述正样本对集合中两个样本集所对应的原始手工特征均转换为基矩阵和潜在中级特征的乘积;
S12,对所获得的两个不同摄像头场景下的潜在中级特征进行连接,获得特征转换矩阵。
4.根据权利要求1所述的方法,其特征在于,所述步骤S02进一步包括:
S21,基于重构误差最小以及正样本对潜在特征差异最小的优化目标,建立潜在中级特征学习的损失函数;
S22,通过交替优化的方法对所述潜在中级特征学习的损失函数进行最优化问题求解,获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵。
5.根据权利要求1至4任一所述的方法,其特征在于,所述步骤S1进一步包括:
S31,按照重构误差最小原则,构建对每个测试样本对的潜在中级特征进行求解的目标函数;
S32,基于不同摄像头场景下图像特征的基矩阵,求解所述目标函数,获得每个测试样本对的潜在中级特征。
6.根据权利要求4所述的方法,其特征在于,步骤S21中所述潜在中级特征学习的损失函数具体为:
Figure FDA0003019519550000021
s.t.||mi||2≤1,||pi||2≤1,||ri||2≤1
其中,M,P分别为训练集正样本对集合中两个样本集对应的基矩阵,U,V为所述两个样本集对应的潜在中级特征,R为连接U,V的特征转换矩阵,
Figure FDA0003019519550000031
为正则项,α,λ,ρ均为常量。
7.根据权利要求6所述的方法,其特征在于,所述步骤S22进一步包括:
固定所述损失函数中的参数M,P,V,R,学习U,通过对所述损失函数进行求导得到第一问题,通过不断迭代对所述第一问题进行求解,得到潜在中级特征U的表达式;
固定所述损失函数中的参数M,P,U,R,学习V,通过对所述损失函数进行求导得到第二问题,通过不断迭代对所述第二问题进行求解,得到潜在中级特征V的表达式;
基于U和V的表达式,通过求解拉格朗日对偶问题,得到不同摄像头场景下图像特征的基矩阵M,P以及特征转换矩阵R。
8.根据权利要求1所述的方法,其特征在于,在步骤S2之后还包括:
根据所述距离度量矩阵计算累计精度。
9.一种行人再识别装置,其特征在于,包括:
特征获取模块,用于基于不同摄像头场景下图像特征的基矩阵,按照重构误差最小的优化目标,逐一获取测试集中每个测试样本对的潜在中级特征;
距离度量模块,用于根据特征转换矩阵和所述每个测试样本对的潜在中级特征,基于欧式距离,对所述每个测试样本对的相似距离进行逐一度量,并将所有测试样本对的相似距离度量结果从小到大进行排序,获得距离度量矩阵;
还包括:
矩阵分解模块,用于对训练集中不同摄像头场景下的正样本对集合进行矩阵分解,将原始手工特征转换为基于潜在中级特征的表达;
学习模块,用于基于重构误差最小以及正样本对距离最小的优化目标,通过学习获得不同摄像头场景下图像特征的基矩阵以及特征转换矩阵;
其中,所述基于潜在中级特征的表达是指样本矩阵经过矩阵分解后转换为基矩阵与潜在中级特征,同时通过一个特征转换矩阵对样本矩阵中两个不同摄像头下的样本的潜在中级特征进行连接;
其中,对所述每个测试样本对的相似距离进行逐一度量进一步包括:
根据不同摄像头场景下图像特征的特征转换矩阵对所述每个测试样本对中的一个样本的潜在中级特征进行投影,将投影所得的矩阵与所述每个测试样本对中的另一个样本的潜在中级特征进行欧式距离计算,得到所述每个测试样本对的相似距离度量结果。
CN201710322952.9A 2017-05-09 2017-05-09 一种行人再识别方法及装置 Active CN108875448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710322952.9A CN108875448B (zh) 2017-05-09 2017-05-09 一种行人再识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710322952.9A CN108875448B (zh) 2017-05-09 2017-05-09 一种行人再识别方法及装置

Publications (2)

Publication Number Publication Date
CN108875448A CN108875448A (zh) 2018-11-23
CN108875448B true CN108875448B (zh) 2021-06-08

Family

ID=64287433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710322952.9A Active CN108875448B (zh) 2017-05-09 2017-05-09 一种行人再识别方法及装置

Country Status (1)

Country Link
CN (1) CN108875448B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919183B (zh) * 2019-01-24 2020-12-18 北京大学 一种基于小样本的图像识别方法、装置、设备及存储介质
CN109782811B (zh) * 2019-02-02 2021-10-08 绥化学院 一种无人模型车的自动跟随控制系统及方法
CN110929558B (zh) * 2019-10-08 2022-10-18 杭州电子科技大学 一种基于深度学习的行人重识别方法
WO2022116135A1 (zh) * 2020-12-04 2022-06-09 康佳集团股份有限公司 一种行人重识别方法、装置及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216878A (zh) * 2007-12-28 2008-07-09 西安电子科技大学 基于广义非线性判别分析的人脸识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711146B2 (en) * 2006-03-09 2010-05-04 General Electric Company Method and system for performing image re-identification
US20140184803A1 (en) * 2012-12-31 2014-07-03 Microsoft Corporation Secure and Private Tracking Across Multiple Cameras

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216878A (zh) * 2007-12-28 2008-07-09 西安电子科技大学 基于广义非线性判别分析的人脸识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种特征矩阵的相似性度量方法及其在图像检索中的应用;刘跃虎等;《模式识别与人工智能》;20060831;第19卷(第4期);全文 *

Also Published As

Publication number Publication date
CN108875448A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
Zhao et al. Learning mid-level filters for person re-identification
CN109961051B (zh) 一种基于聚类和分块特征提取的行人重识别方法
CN108846426B (zh) 基于深度双向lstm孪生网络的极化sar分类方法
CN107506703B (zh) 一种基于无监督局部度量学习和重排序的行人再识别方法
CN105574505B (zh) 一种多摄像机间人体目标再识别的方法及系统
CN106778595B (zh) 基于高斯混合模型的人群中异常行为的检测方法
Huo et al. Deep age distribution learning for apparent age estimation
CN113516012B (zh) 一种基于多层级特征融合的行人重识别方法及系统
CN111709311B (zh) 一种基于多尺度卷积特征融合的行人重识别方法
Borji et al. Human vs. computer in scene and object recognition
CN108875448B (zh) 一种行人再识别方法及装置
CN108509854B (zh) 一种基于投影矩阵约束结合判别字典学习的行人再识别方法
CN111325115A (zh) 带有三重约束损失的对抗跨模态行人重识别方法和系统
CN106897669B (zh) 一种基于一致迭代多视角迁移学习的行人再辨识方法
CN102804208A (zh) 为视觉搜索应用自动挖掘名人的个人模型
CN108960142B (zh) 基于全局特征损失函数的行人再识别方法
CN105989369A (zh) 基于度量学习的行人再识别方法
CN113283362B (zh) 一种跨模态的行人重识别方法
CN113221625A (zh) 一种利用深度学习的局部特征对齐行人重识别方法
CN104966075B (zh) 一种基于二维判别特征的人脸识别方法与系统
CN109492534A (zh) 一种基于Faster RCNN的跨场景多姿态的行人检测方法
CN109165612B (zh) 基于深度特征和双向knn排序优化的行人再识别方法
CN108446613A (zh) 一种基于距离中心化与投影向量学习的行人重识别方法
CN105868711B (zh) 一种基于稀疏低秩的人体行为识别方法
CN110874576B (zh) 一种基于典型相关分析融合特征的行人再识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200102

Address after: 518109 first floor, building 1b, yunantong Industrial Park, langrong Road, Dalang community, Dalang street, Longhua District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen Jinghong Technology Co., Ltd

Address before: 201203 Shanghai Pudong New Area Shanghai free trade trial area, 1 spring 3, 400 Fang Chun road.

Applicant before: Shanghai Jinghong Electronic Technology Co., Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant