CN106897669B - 一种基于一致迭代多视角迁移学习的行人再辨识方法 - Google Patents
一种基于一致迭代多视角迁移学习的行人再辨识方法 Download PDFInfo
- Publication number
- CN106897669B CN106897669B CN201710043339.3A CN201710043339A CN106897669B CN 106897669 B CN106897669 B CN 106897669B CN 201710043339 A CN201710043339 A CN 201710043339A CN 106897669 B CN106897669 B CN 106897669B
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- view
- matrix
- image
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000013508 migration Methods 0.000 title claims abstract description 42
- 230000005012 migration Effects 0.000 title claims abstract description 42
- 230000000007 visual effect Effects 0.000 claims abstract description 62
- 238000005457 optimization Methods 0.000 claims abstract description 26
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 62
- 238000009826 distribution Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 238000013526 transfer learning Methods 0.000 claims description 7
- 230000003190 augmentative effect Effects 0.000 claims description 6
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 4
- 238000005286 illumination Methods 0.000 abstract description 3
- 238000012163 sequencing technique Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 13
- 238000012549 training Methods 0.000 description 11
- 241000271897 Viperidae Species 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 230000004927 fusion Effects 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000036544 posture Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于一致迭代多视角迁移学习的行人再辨识方法,所述的方法包括以下步骤:对行人图像进行特征提取,获得局部和全局多视角图像视觉词;采用迁移学习和鉴别分析方法构建一致迭代多视角迁移学习优化模型并对模型求解,获取中层次图像特征描述符;对得到的低层次特征描述符和中层次特征描述符进行计算,获得最终的多层次图像特征描述符;利用基于交叉视角二次鉴别分析方法来度量行人的相似性,进而获得行人图像相似度排序结果。与现有技术相比,本发明具有对于多视角下产生的光照、旋转等因素变化有着较好的鲁棒性和可靠性,能够提取图像底层次和中层次的特征描述符,具有良好的行人辨识能力等优点。
Description
技术领域
本发明涉及智能监控视频分析领域,尤其是涉及一种基于一致迭代多视角迁移学习的行人再辨识方法。
背景技术
行人再辨识(Re-ID)的核心问题是研究在多摄像机无重叠系统中,如何精准匹配同一个行人。由于受到视角变化、光照条件和姿势变化等环境因素和人自身因素的影响,摄像机捕获到的同一行人的图像存在很大差异,这也使得行人再辨识问题具有一定的挑战性。目前,该问题的解决方案主要分为两种:基于行人外观特征的方法和基于度量学习的方法。其中,基于行人外观特征的方法主要是从行人的外观上提取鲁棒的特征描述符。然而,由于环境的复杂和不可控制或者小样本的限制,该方法难以提取到有效的特征。而基于度量学习的方法则试图学习一个相似性度量函数或者一个鲁棒距离来优化匹配结果。基于上述两种不同的方案,国内外学者已经提出了各种不同的算法和模型。
目前,大多数基于行人外观特征的方法主要关注低层视觉特征,例如颜色和纹理。此外,为了提高行人再辨识的识别效果,各种各样的融合性方法也被提了出来,例如:分层高斯特征描述符(GOG)、局部极大出现特征描述符(LOMO)、基于结构学习的特征描述符和基于显著性的特征描述符。除了这些方法,基于深度学习的特征提取方法也表现出优异的识别效果。另外,专利CN104992142A提出了一种基于深度学习和属性学习相结合的行人识别方法,能够从更高语义层描述行人特征,然而,训练模型过于复杂,并且受限于行人属性的选择。进一步,由于光照变化、姿态、视角、遮挡、图像分辨率等各方面因素的影响,这使得在监控视频智能分析中行人再辨识性能依然不佳。
基于度量学习的行人再辨识方法主要包括了基于相对距离比较的度量学习(RDC)、基于局部Fisher鉴别分析的方法(LFDA)、基于核的方法,基于交叉视角二次鉴别分析的方法(XQDA),基于双规KISS的方法(DR-KISS),基于鉴别零空间的方法,基于图模型的方法和基于深度度量学习的方法。还有许多其他种类的方法,例如:通过排序方法(RankSVM等)来试图解决行人再辨识问题。虽然这些基于度量的方法比现存的行人再辨识方法效果好,但是它们仍被一些经典问题所局限,例如:模型学习时,多个视角数据分布不一致分布和小样本等问题。
在传统机器学习模型中,往往存在一个重要的前提,即:假设训练集和测试集样本数据分布存在一致性,然而,在实际生活中采集到的数据,很难保证这一假设的成立。同样在,行人再辨识问题中,不同视角下采集到的行人图像也存在数据分布不一致这样的问题,而采用迁移学习的方法,找到一个具有一致分布的新空间,能够在数据分布一致前提下,进行后续的再辨识,能够为该问题的解决提供了新的思路。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于一致迭代多视角迁移学习的行人再辨识方法。涉及行人再辨识(person re-identification)中的多视角视觉词模型、多视角迁移学习和鉴别分析技术。
本发明的目的可以通过以下技术方案来实现:
一种基于一致迭代多视角迁移学习的行人再辨识方法,所述的方法包括以下步骤:
S1、对行人图像进行特征提取,获得局部和全局多视角图像视觉词,即低层次图像特征描述符的提取;
S2、根据S1得到的低层次图像特征描述符,采用迁移学习和鉴别分析方法构建一致迭代多视角迁移学习优化模型;
S3、利用扩展的增广拉格朗日乘子法求解S2中的一致迭代多视角迁移学习优化模型,并获取中层次图像特征描述符;
S4、对S1得到的低层次特征描述符和S3得到的中层次特征描述符进行计算,获得最终的多层次图像特征描述符;
S5、针对S4中的多层次图像特征描述符,利用基于交叉视角二次鉴别分析方法来度量行人的相似性,进而获得行人图像相似度排序结果,即行人再辨识结果。
步骤S1具体为:
S11、将行人图像在垂直方向上平均划分成n个水平条纹,并从不同条纹中分别提取n组局部图像视觉词,同时从整体的行人图像中提取1组全局图像视觉词;
S12、利用一种聚类方法K-means方法来融合多视角信息,获得n+1组多视角图像视觉词,定义为:MvVW={Di},i=1,2,3,…n,n+l;其中,D表示不同行人图像结构区域下的多视角图像视觉词;
{Di},i=1,2,3,…n表示局部多视角图像视觉词,{Di},i=n+1表示全局多视角图像视觉词。
步骤S2具体为:
利用局部和全局多视角图像视觉词,对原始样本进行重构,对MvVW的每一组多视角图像视觉词,分别利用迁移学习找到一个使原始样本和多视角视觉词具有一致数据分布的投影子空间,原始样本在该投影子空间下利用MvVM来进行重构;引入鉴别分析,将鉴别优化问题同迁移优化问题相结合,定义为一致迭代多视角迁移学习优化模型:
约束条件为:s.t.PTX=PTDZ+E,PTP=IP,Zh∈Z
其中,α,β为惩罚因子,||*||1为1范数约束,P为迁移矩阵,E为噪声矩阵,Z为重构系数矩阵,φ(Zh)为基于Fisher准则的鉴别度量学习函数,||Z‖*矩阵的核范数,Zh∈Z是有标签样本的重构系数矩阵,D表示不同行人图像结构区域下的多视角图像视觉词。
步骤S3具体为:
采用扩展的增广拉格朗日乘子法方法求解一致迭代的多视角迁移学习模型中的参数的闭形式解,得到中层次图像特征描述符。
步骤S3具体为:
引进变量Z1和新约束Z=Z1,并引进拉格朗日乘子L1∈Rm×n、L2∈Rm×P和L3∈Rm×n,将S1中得到的优化模型转换为:
其中,α,β,γ,μ表示惩罚因子,P表示迁移矩阵,PT表示矩阵P的转置,φ(Zh)为基于Fisher准则的鉴别度量学习函数,||||*为矩阵的核范数,||*||1为1范数约束,D表示不同行人图像结构区域下的多视角图像视觉词,表示矩阵的2范式,E为噪声矩阵,Z为重构系数矩阵,Zh为有标签样本的重构系数矩阵,Z1为Z的近似解;
S32,分步求解迁移矩阵P,并计算其闭形式解;
S33,分步求解重构系数矩阵Z,并计算其闭形式解;
S34,分步求解对于有标签样本的重构系数矩阵Zh,并计算其闭形式解;
S35,分步求解Z1,并计算其闭形式解;
S36,分步求解噪声矩阵E,并计算其闭形式解;
S37,对于拉格朗日乘子和和迭代步长μ,进行更新;
所述的中层次图像特征描述符即为重构系数矩阵Z,Z*、Zh和Z1均为Z的近似解。
与现有技术相比,本发明具有以下优点:
(1)结合行人图像在垂直方向分布的特点,将行人图像平均分为6块(分别为头部、躯干和腿,并结合身体的对称性,划分为6个局部块),并分别从6个局部块区域内提取局部视觉词,同时从整体行人图像中提取全局视觉词(1个全局),获得初始的7组(6个局部+1个全局)不同结构下的单视角下的视觉词组。
(2)利用非监督聚类方法(k-means)对7组单视角下的视觉词组进行聚类操作,一方面融合多视角信息,另一方面去掉视觉词中的冗余信息,获得多视角视觉词。
(3)提出一致迭代的多视角迁移学习(CIMvTL)模型,来求解基于多视角视觉词的原始样本重构问题。其中该模型重点在于寻找一个迁移子空间,能够确保多视角视觉词同原始样本空间的数据分布的一致性,同时,在低秩和稀疏的约束下,确保在利用多视角视觉词对原始样本进行重构表示时,能够具有保持一定的结构信息和尽可能少的视觉词来重构原始样本。另外,在鉴别分析约束的前提下,本发明提取重构系数矩阵,并将其定义为中层特征描述符,用来后续的识别问题。
(4)采用不精确的增广拉格朗日乘子法(IALM)方法求解一致迭代的多视角迁移学习(CIMvTL)模型中的参数的闭形式解,来提升算法迭代速率,确保模型的复杂度降低。
(5)融合底层次图像特征描述符和中层次图像特征描述符,并利用交叉视角二次鉴别分析的度量方法来提升行人再辨识的问题的准确率。
附图说明
图1为本发明一种基于一致迭代多视角迁移学习的行人再辨识方法的流程图;
图2为本发明算法(CIMvTL+MvVW)同其他方法在VIPeR行人再辨识公开数据集上性能比较图;
图3为本发明算法基于不同聚类数目下在VIPeR行人再辨识公开数据集上性能比较图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
实施例
如图1所示为本发明的流程图,本发明中方法包括以下步骤:
步骤S1,基于局部和全局的多视角图像视觉词特征提取,具体描述如下:将行人图像在垂直方向上平均划分成6个水平条纹,并从中不同条纹中分别提取6组局部视觉词,同时从整体的行人图像中提取1组全局视觉字词;利用一种非监督的聚类方法(K-means)来融合多视角信息,获得7组多视角视觉词,定义为:MvVW={Di},i=1,2,3,4,5,6,7。其中,D表示不同行人结构区域下的多视角视觉词(其中,{Di},i=1,2,3,4,5,6表示局部多视角视觉词,{Di},i=7表示全局多视角视觉词)。
步骤S2,基于迁移学习和鉴别分析来对原始样本空间进行迁移鉴别分析,找到分布一致的公共子空间,并在该鉴别迁移空间下对原始样本进行重构,该问题被描述为一致迭代多视角迁移学习(CIMvTL)的优化模型,具体描述如下:
S21,利用多视角视觉词,对原始样本进行重构。对MvVm的每一个组多视角视觉词,分别利用迁移学习找到一个确保原始样本和多视角视觉词具有一致数据分布的投影子空间,在该空间下,原始的样本可以在低秩和稀疏约束下利用MvVM来进行重构。其中低秩和稀疏的约束是为了增强结构的鲁棒性和抗干扰性,该模型定义为:
约束条件为:s.t.PTX=PTDZ+E,PTP=IP
其中,α,β为惩罚参数。||*||1为1范数约束,P为迁移矩阵,E为噪声矩阵,Z为重构系数矩阵,即从低层次视觉词特征中获得中层次特征,D表示视觉词矩阵rank(Z)是低秩函数、X表示原始样本特征空间。
S22,引入鉴别分析,确保迁移后的子空间不仅在数据分布上保证了一致性,且具有鉴别性,即:能够最大化类间差异和最小化类内差异。为了确保同S21求解的一致性,将鉴别优化问题同迁移优化问题相结合,并定义为一致迭代多视角迁移学习的优化模型:
s.t.PTX=PTDZ+E,PTP=IP,Zh∈Z
其中,α为惩罚参数,φ(Zh)为基于Fisher准则的鉴别度量学习函数,||Z||*矩阵的核范数(即对低秩问题的求解),Zh∈Z是有标签样本的重构系数矩阵,从上述模型可以看出,该模型属于半监督模型的一种。本发明定义基于Fisher准则的鉴别度量学习函数为φ(Zh),φ(Zh)=Tr(SB(Zh))-Tr(Sw(Zh)),其中Zh∈Z是有标签样本的重构系数矩阵,Tr(Zh)是矩阵的迹,SB(Zh)和Sw(Zh)是标记样本Xh的类间和类内散射矩阵,它们定义为:
其中mi代表Zh中的第i个人的平均样本,m是Zh的总体样本的平均值,是Zh中的第i个样本中的第j个行人图像特征对应的重构系数,ni表示第i个人的图片(样本)个数。
步骤S3,通过扩展的的增广拉格朗日乘子法(IALM)求解一致迭代多视图迁移学习(CIMvTL)的优化模型,并获取图像的中层次特征,具体描述如下:
S31,引进变量Z1和新约束Z=Z1,放宽原来的问题,并引进拉格朗日乘子和将步骤1中得到的优化问题转换为:
其中,其中,α,β,γ,μ表示惩罚因子,P表示迁移矩阵,PT表示矩阵P的转置,φ(Zh)为基于Fisher准则的鉴别度量学习函数,||||*为矩阵的核范数,||*||1为1范数约束,D表示视觉词矩阵,表示矩阵的2范式,E为噪声矩阵,Z为重构系数矩阵,Zh为有标签样本的重构系数矩阵,Z1和Z*均为Z的近似解;
S32,对于迁移矩阵P,通过如下优化问题求解:
得到其闭形式解为:其中,G1=X-DZ且用于简化上述形式。
S33,对于重构系数矩阵Z,通过如下优化问题求解:
其中,Z,Z*,Z2均表示重构矩阵,得到其闭形式解为:Z*=(μDTPPTD+2μI)-1(G4+G5-DTPG3),其中,为了简化解的形式,定义 并且ψ代表转换函数,即由Zh替换Z中有标签样本中对应的重构系数矩阵;
S34,对于有标签样本的重构系数矩阵Zh,通过如下优化问题求解:
其中η表示惩罚因子,Hb和Ht表示两个常系数矩阵,如果两个样本xi和xj属于同一类则Ht(i,j)=0,否则Hb(i,j)=0,nc表示第c类样本数,p表示有标签数据总数。
得到其闭形式解为:其中,为了简化解的形式,定义G6=I-Hb,G7=Hb-Ht且
S35,对于Z1,通过如下优化问题求解:
得到其闭形式解为:
S36,对于噪声矩阵E,通过如下优化问题求解:
根据shrink算子,得到其闭形式解:
S37,对于拉格朗日乘子和和迭代步长μ(ρ>1),利用如下等式进行更新:
其中ρ表示步长变化率,μmax表示最大步长。
步骤S4,结合提取出的低层与中层特征描述符,获取最终的多层次行人图像特征描述符,具体描述如下:
S41,分别利用局部最大出现的低层次特征描述符(FLOMO)和分层高斯低层次特征描述符(FGOG),获得了中层特征描述符,分别定义为和都包括7个重构系数矩阵(6组局部特征和1组全局特征)。更进一步,本发明将低层次特征和中层次特征进行融合,即:对特征进行归一化后的直方图采用简单加权组合到一起,具体权重均为1,获得最终的多层次描述符,其中dLOMO表示FLOMO的维数,dGOG表示FGOG的维数,n表示样本数,Rm×n表示m*n维的实数空间。此外,为了减少本发明描述符的维度,本发明定义了新的低层次特征和
步骤S5,针对上述提出的多层次图像特征描述符,利用基于交叉视角二次鉴别分析(XQDQ)的方法来度量行人的相似性,进而获得最终的行人再辨识结果。
图2为本发明算法(CIMvTL+MvVW)同其他方法在VIPeR行人再辨识公开数据集上性能比较图。训练集共632个行人,每个行人两个视角各包括一张图,实验随机采用316个行人用于训练,余下316个行人用于测试,图中比较了提出算法CIMvTL和行人再识别最新方法LSSL,LOMO,GOG,KISSME,kLFDA算法的累积识别率,从图中可以看出,提出的算法CIMvTL(LOMO)对原始LOMO算法进行中层次特征抽取后能够实现更好的识别效果,同样CIMvTL(GoG)对原始GoG算法进行中层次特征抽取后,同样能够实现更好的识别效果;而结合两种低层次特征LOMO和GoG的CIMvTL(Fusion)方法能够实现图中最好的再辨识效果。
图3为本发明算法基于不同聚类数目下在VIPeR行人再辨识公开数据集上性能比较图。实验随机采用316个行人用于训练,余下316个行人用于测试,从图中可以看出M=150,即视觉词聚类结果为150个视觉词时,包含必要的信息且存在较少冗余,因此相比于其他聚类数目下的CIMvTL算法能够实现效果最优。
表1为本发明算法(CIMvTL+MvVW)同其它算法在VIPeR行人再辨识公开数据集上性能比较。
实验随机采用316个行人用于训练,余下316个行人用于测试,表中比较了提出算法CIMvTL和行人再识别最新方法LSSL,LOMO,GOG,KISSME,kLFDA算法在Rank=1,5,10时的累积识别率,同样从表中可以看出,提出的方法在CIMvTL(LOMO)实现了比LOMO+XQDA更好的效果,CIMvTL(GoG)实现了比GoG更好的效果,CIMvTL(Fusion)结合LOMO+GoG两种特征,故而实现了最优的实验效果。
表1
表2为本发明算法(CIMvTL+MvVW)同其它度量方法在VIPeR行人再辨识公开数据集上性能比较。其中第一排为比较算法,后续为别为Rank=1,10,15,20时的累积识别率。
表2
算法 | Rank=1 | Rank=10 | Rank=15 | Rank=20 |
CIMvTL+XQDA | 56.0 | 91.0 | 94.2 | 95.8 |
CIMvTL+kLFDA | 22.5 | 49.6 | 54.1 | 60.8 |
CIMvTL+L1-Norm | 9.2 | 24.7 | 29.1 | 34.5 |
表3为本发明算法利用K-means聚类算法获取不同视觉词个数(MvVM)在VIPeR行人再辨识公开数据集上性能比较。实验随机采用316个行人用于训练,余下316个行人用于测试,表中比较了提出算法CIMvTL在不同视觉词个数(M=50,100,150,200和全部)等不同参数设定下,在Rank=1,5,10,20时的累积识别率,同样从表中可以看出,提出的方法在CIMvTL在M=200时,在Rank=1时实现了最优的效果,然而从整体上来看,算法在M=150时识别效果整体上相对最优。
表3
算法 | Rank=1 | Rank=5 | Rank=10 | Rank=20 |
CIMvTL(50-MvVW) | 47.6 | 78.8 | 90.0 | 96.0 |
CIMvTL(100-MvVW) | 56.0 | 83.0 | 91.0 | 95.8 |
CIMvTL(150-MvVW) | 57.7 | 81.2 | 88.8 | 95 |
CIMvTL(200-MvVW) | 57.7 | 80.6 | 87.9 | 93.2 |
CIMvTL(ALL-MvVW) | 49.8 | 70.1 | 78.5 | 86.5 |
表4为本发明算法(CIMvTL+MvVW)同其它算法在CUHK01行人再辨识公开数据集上性能比较。训练集共971个行人,每个行人两个视角各包括两张图,实验随机采用386个行人用于训练,余下385个行人用于测试,图中比较了提出算法CIMvTL和行人再识别最新方法GoG+XQDA、LOMO+XQDA、Semantic和SalMatch算法在rank=1,5,10时的累积识别率,从表中可以看出,提出的算法相比于最优算法GoG+XQDA的方法在rank=1(识别率)能够实现7.7%的效果提升。
表4
算法 | Rank=1 | Rank=5 | Rank=10 |
MvVW+CIMvTL | 65.5 | 90.7 | 91.6 |
GoG+XQDA | 57.8 | 88.6 | 86.2 |
LOMO+XQDA | 49.2 | 76.2 | 84.2 |
Semantic | 32.7 | 51.2 | 64.4 |
SalMatch | 28.5 | 45 | 55 |
表5为本发明算法(CIMvTL+MvVW)同其它算法在PRID450S行人再辨识公开数据集上性能比较。训练集共450个行人,每个行人两个视角各包括一张图,实验随机采用225个行人用于训练,余下225个行人用于测试,图中比较了提出算法CIMvTL和行人再识别最新方法GoG+XQDA、LOMO+XQDA、SCNCD和Semantic算法在rank=1,5,10时的累积识别率,从表中可以看出,提出的算法相比于最优算法GoG+XQDA的方法在rank=1(识别率)能够实现3.7%的效果提升。
表5
算法 | Rank=1 | Rank=5 | Rank=10 |
MvVW+CIMvTL | 71.6 | 90.7 | 94.9 |
GoG+XQDA | 67.9 | 88.6 | 94.4 |
LOMO+XQDA | 52.3 | 76.2 | 84.6 |
SCNCD | 41.6 | 68.9 | 79.4 |
Semantic | 43.1 | 70.5 | 78.2 |
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (3)
1.一种基于一致迭代多视角迁移学习的行人再辨识方法,其特征在于,所述的方法包括以下步骤:
S1、对行人图像进行特征提取,获得局部和全局多视角图像视觉词,即低层次图像特征描述符的提取,步骤S1具体为:
S11、将行人图像在垂直方向上平均划分成n个水平条纹,并从不同条纹中分别提取n组局部图像视觉词,同时从整体的行人图像中提取1组全局图像视觉词;
S12、利用一种聚类方法K-means方法来融合多视角信息,获得n+1组多视角图像视觉词,定义为:MvVW={Di},i=1,2,3,…n,n+1;其中,D表示不同行人图像结构区域下的多视角图像视觉词;
{Di},i=1,2,3,…n表示局部多视角图像视觉词,{Di},i=n+1表示全局多视角图像视觉词;
S2、根据S1得到的低层次图像特征描述符,采用迁移学习和鉴别分析方法构建一致迭代多视角迁移学习优化模型,步骤S2具体为:
利用局部和全局多视角图像视觉词,对原始样本进行重构,对MvVW的每一组多视角图像视觉词,分别利用迁移学习找到一个使原始样本和多视角视觉词具有一致数据分布的投影子空间,原始样本在该投影子空间下利用MvVM来进行重构;引入鉴别分析,将鉴别优化问题同迁移优化问题相结合,定义为一致迭代多视角迁移学习优化模型:
约束条件为:s.t.PTX=PTDZ+E,PTP=IP,Zh∈Z
其中,α,β为惩罚因子,||*||1为1范数约束,P为迁移矩阵,E为噪声矩阵,Z为重构系数矩阵,φ(Zh)为基于Fisher准则的鉴别度量学习函数,||Z||*矩阵的核范数,Zh∈Z是有标签样本的重构系数矩阵,D表示不同行人图像结构区域下的多视角图像视觉词;
S3、利用扩展的增广拉格朗日乘子法求解S2中的一致迭代多视角迁移学习优化模型,并获取中层次图像特征描述符;
S4、对S1得到的低层次特征描述符和S3得到的中层次特征描述符进行计算,获得最终的多层次图像特征描述符;
S5、针对S4中的多层次图像特征描述符,利用基于交叉视角二次鉴别分析方法来度量行人的相似性,进而获得行人图像相似度排序结果,即行人再辨识结果。
2.根据权利要求1所述的一种基于一致迭代多视角迁移学习的行人再辨识方法,其特征在于,步骤S3具体为:
采用扩展的增广拉格朗日乘子法方法求解一致迭代的多视角迁移学习模型中的参数的闭形式解,得到中层次图像特征描述符。
3.根据权利要求1或2所述的一种基于一致迭代多视角迁移学习的行人再辨识方法,其特征在于,步骤S3具体为:
引进变量Z1和新约束Z=Z1,并引进拉格朗日乘子L1∈Rm×n、L2∈Rm×p和L3∈Rm×n,将S1中得到的优化模型转换为:
其中,α,β,γ,μ表示惩罚因子,P表示迁移矩阵,PT表示矩阵P的转置,φ(Zh)为基于Fisher准则的鉴别度量学习函数,|| ||*为矩阵的核范数,||*||1为1范数约束,D表示不同行人图像结构区域下的多视角图像视觉词,表示矩阵的2范式,E为噪声矩阵,Z为重构系数矩阵,Zh为有标签样本的重构系数矩阵,Z1为Z的近似解;
S32,分步求解迁移矩阵P,并计算其闭形式解;
S33,分步求解重构系数矩阵Z,并计算其闭形式解;
S34,分步求解对于有标签样本的重构系数矩阵Zh,并计算其闭形式解;
S35,分步求解Z1,并计算其闭形式解;
S36,分步求解噪声矩阵E,并计算其闭形式解;
S37,对于拉格朗日乘子和和迭代步长μ,进行更新;
所述的中层次图像特征描述符即为重构系数矩阵Z,Z*、Zh和Z1均为Z的近似解。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710043339.3A CN106897669B (zh) | 2017-01-19 | 2017-01-19 | 一种基于一致迭代多视角迁移学习的行人再辨识方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710043339.3A CN106897669B (zh) | 2017-01-19 | 2017-01-19 | 一种基于一致迭代多视角迁移学习的行人再辨识方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106897669A CN106897669A (zh) | 2017-06-27 |
CN106897669B true CN106897669B (zh) | 2019-12-27 |
Family
ID=59198129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710043339.3A Expired - Fee Related CN106897669B (zh) | 2017-01-19 | 2017-01-19 | 一种基于一致迭代多视角迁移学习的行人再辨识方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106897669B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509854B (zh) * | 2018-03-05 | 2020-11-17 | 昆明理工大学 | 一种基于投影矩阵约束结合判别字典学习的行人再识别方法 |
CN108596245B (zh) * | 2018-04-20 | 2021-10-15 | 九江学院 | 一种基于多视图协同完整鉴别子空间学习的人脸识别方法 |
CN108798641B (zh) * | 2018-06-19 | 2021-06-11 | 东北大学 | 一种基于子空间迁移学习的有杆泵抽油井故障诊断方法 |
CN108960331A (zh) * | 2018-07-10 | 2018-12-07 | 重庆邮电大学 | 一种基于行人图像特征聚类的行人再识别方法 |
CN109409201B (zh) * | 2018-09-05 | 2021-06-18 | 昆明理工大学 | 一种基于共享及特有字典对联合学习的行人再识别方法 |
CN109447123B (zh) * | 2018-09-28 | 2021-07-16 | 昆明理工大学 | 一种基于标签一致性约束与拉伸正则化字典学习的行人再识别方法 |
CN109726725B (zh) * | 2018-12-28 | 2021-05-04 | 中南大学 | 一种基于大间隔类间互异性多核学习的油画作者识别方法 |
CN109902590B (zh) * | 2019-01-30 | 2022-09-16 | 西安理工大学 | 深度多视图特征距离学习的行人重识别方法 |
CN111476883B (zh) * | 2020-03-30 | 2023-04-07 | 清华大学 | 多视角无标记动物的三维姿态轨迹重建方法及装置 |
CN113177487B (zh) * | 2021-05-06 | 2023-07-18 | 南京信息工程大学 | 行人重识别方法、装置、计算机设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514443A (zh) * | 2013-10-15 | 2014-01-15 | 中国矿业大学 | 一种基于lpp特征提取的单样本人脸识别迁移学习方法 |
CN103839084A (zh) * | 2014-03-12 | 2014-06-04 | 湖州师范学院 | 一种应用于行人再识别的多核支持向量机多示例学习算法 |
CN104680178A (zh) * | 2015-03-06 | 2015-06-03 | 西安电子科技大学 | 基于迁移学习多吸引子细胞自动机的图像分类方法 |
CN105095870A (zh) * | 2015-07-27 | 2015-11-25 | 中国计量学院 | 基于迁移学习的行人重识别方法 |
CN105760834A (zh) * | 2016-02-14 | 2016-07-13 | 北京飞搜科技有限公司 | 一种人脸特征点定位方法 |
CN105893947A (zh) * | 2016-03-29 | 2016-08-24 | 江南大学 | 基于多局部相关特征学习的两视角人脸识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110320387A1 (en) * | 2010-06-28 | 2011-12-29 | International Business Machines Corporation | Graph-based transfer learning |
-
2017
- 2017-01-19 CN CN201710043339.3A patent/CN106897669B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514443A (zh) * | 2013-10-15 | 2014-01-15 | 中国矿业大学 | 一种基于lpp特征提取的单样本人脸识别迁移学习方法 |
CN103839084A (zh) * | 2014-03-12 | 2014-06-04 | 湖州师范学院 | 一种应用于行人再识别的多核支持向量机多示例学习算法 |
CN104680178A (zh) * | 2015-03-06 | 2015-06-03 | 西安电子科技大学 | 基于迁移学习多吸引子细胞自动机的图像分类方法 |
CN105095870A (zh) * | 2015-07-27 | 2015-11-25 | 中国计量学院 | 基于迁移学习的行人重识别方法 |
CN105760834A (zh) * | 2016-02-14 | 2016-07-13 | 北京飞搜科技有限公司 | 一种人脸特征点定位方法 |
CN105893947A (zh) * | 2016-03-29 | 2016-08-24 | 江南大学 | 基于多局部相关特征学习的两视角人脸识别方法 |
Non-Patent Citations (6)
Title |
---|
A Survey on Transfer Learning;Sinno Jialin Pan 等;《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》;20101031;第22卷(第10期);第1345-1359页 * |
Learning Mid-level Filters for Person Re-identification;Rui Zhao 等;《CVPR2014》;20141231;第1-8页 * |
TrSVM:一种基于领域相似性的迁移学习算法;洪佳明 等;《计算机研究与发展》;20111231;第48卷(第10期);第1823-1830页 * |
基于HSV模型和特征点匹配的行人重识别算法基于HSV模型和特征点匹配的行人重识别算法;彭志勇 等;《光电子·激光》;20150831;第26卷(第8期);第1575-1582页 * |
基于多特征子空间与核学习的行人再识别;齐美彬 等;《自动化学报》;20160229;第42卷(第2期);第299-308页 * |
视频监控中基于在线多核学习的目标再现识别;陈方 等;《光电工程》;20120930;第39卷(第9期);第65-71页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106897669A (zh) | 2017-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106897669B (zh) | 一种基于一致迭代多视角迁移学习的行人再辨识方法 | |
Wu et al. | Kernel slow feature analysis for scene change detection | |
Xia et al. | AID: A benchmark data set for performance evaluation of aerial scene classification | |
Cai et al. | Island loss for learning discriminative features in facial expression recognition | |
US10102443B1 (en) | Hierarchical conditional random field model for labeling and segmenting images | |
Liu et al. | Scene classification via triplet networks | |
CN111738143B (zh) | 一种基于期望最大化的行人重识别方法 | |
Cimpoi et al. | Describing textures in the wild | |
CN110659665B (zh) | 一种异维特征的模型构建方法及图像识别方法、装置 | |
CN108509854B (zh) | 一种基于投影矩阵约束结合判别字典学习的行人再识别方法 | |
CN112949740B (zh) | 一种基于多级度量的小样本图像分类方法 | |
CN104063721B (zh) | 一种基于语义特征自动学习与筛选的人类行为识别方法 | |
CN111414958B (zh) | 一种视觉词袋金字塔的多特征图像分类方法及系统 | |
Zhao et al. | Maximal granularity structure and generalized multi-view discriminant analysis for person re-identification | |
Wu et al. | Manifold kernel sparse representation of symmetric positive-definite matrices and its applications | |
Nie et al. | Convolutional deep learning for 3D object retrieval | |
Perina et al. | Image analysis by counting on a grid | |
CN109165698A (zh) | 一种面向智慧交通的图像分类识别方法及其存储介质 | |
CN108932501A (zh) | 一种基于多核关联集成降维的人脸识别方法 | |
CN111723759B (zh) | 基于加权张量稀疏图映射的非约束人脸识别方法 | |
CN105868711B (zh) | 一种基于稀疏低秩的人体行为识别方法 | |
CN111680579A (zh) | 一种自适应权重多视角度量学习的遥感图像分类方法 | |
CN108170729A (zh) | 利用超图融合多模态信息的图像检索方法 | |
CN112990340B (zh) | 一种基于特征共享的自学习迁移方法 | |
Chen et al. | Mmml: Multi-manifold metric learning for few-shot remote sensing image scene classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191227 |
|
CF01 | Termination of patent right due to non-payment of annual fee |