CN107832711A

CN107832711A - 一种基于迁移学习的行人重识别方法

Info

Publication number: CN107832711A
Application number: CN201711112527.3A
Authority: CN
Inventors: 王洪元; 王冲; 丁宗元
Original assignee: Changzhou University
Current assignee: Changzhou University
Priority date: 2017-11-13
Filing date: 2017-11-13
Publication date: 2018-03-23

Abstract

本发明公开了一种基于迁移学习的行人重识别方法，包括以下步骤：1)对数据集中图片运用多尺度Retinex彩色图像增强算法预处理，去除光照带来的影响2)在预处理后的数据集中提取行人的相关特征；3)建立非对称多任务判别模型；4)运用无标签数据的流形结构对模型进行精化；5)运用共轭梯度法对目标函数进行优化，得到最终分类器；6)基于行人重识别标准数据库对分类器进行行人重识别率的测试；本发明合理的运用少量的有标签数据和无标签数据，训练得到的模型可以很好的提高行人重识别率。

Description

一种基于迁移学习的行人重识别方法

技术领域

本发明涉及一种基于迁移学习的行人重识别方法，属于计算机视觉技术领域。

背景技术

随着城市化发展的步伐，人们对公共安全越来越重视，许多重要的公共场所都安装了大量的监控摄像头，为寻找犯罪分子的踪迹提供了便利，因此，行人重识别技术得到了广泛的关注。行人重识别技术指从不同摄像机，不同时间段的行人图像数据集中找出与要检索的行人相匹配的图像。在行人重识别系统中，一个很重要的技术问题就是在一个新的场景下的部署性和适应性。然而，在实际应用场景中，由于在新场景中用于训练的标签信息很匮乏，而且很难获得，使得已有的训练样本不足以训练得到一个可靠的模型。另一方面，要标记目标领域的数据也是相当困难，即使是少量的，也要消耗很大的人力物力。这就引起了机器学习中关注的一个重要问题，如何利用少量的有标签训练样本或者源领域数据，建立一个可靠的模型对目标领域数据进行预测。

近年来，迁移学习已经引起了广泛的关注和研究，其运用已知存在的知识对不同但相关领域问题进行求解的一种新的机器学习方法，它放宽了传统机器学习中的两个基本假设：(1)用于学习的训练样本与新的测试样本满足独立同分布的条件。(2)必须有足够可利用的训练样本才能学习得到一个好的分类模型。目的是迁移已有的知识解决目标领域中仅有少量有标签样本数据甚至没有的学习问题。迁移学习的关键是寻找源域与目标域之间的“共同点”，从而实现知识的迁移。现有技术中，提出将不同问题领域中的特征分为领域相关特征和领域独立特征，通过领域相关特征建立领域间联系实现知识的迁移，再基于谱图划分对数据进行分类；还提出了一种方法,即估计源领域中的每个样本与目标领域中少量标签数据之间的不匹配程度,并把该信息应用到逻辑回归中。另外，提出了基于同步聚类的分类方法，该方法通过对类别和特征进行同步聚类，实现类别标签的迁移。还提出了一种桥接精化的迁移学习方法，该方法在精化的过程中不断地修正由源领域训练得到的模型在测试数据集上的预测类别，从而获得较高的预测准确率。

自学习也是一种利用大量无标签数据来提高给定分类聚类任务性能的方法,自学习被应用于迁移学习中，因为它不要求无标签数据的分布与目标领域中的数据分布相同。纵观基于迁移学习分类算法，尽管其取得了一定效果，但也存在不足之处：1)共同特征表示是在源域和目标域中提取，存在类别比例漂移问题；2)由于标签信息主要来自源域数据，因此使得学习到的模型容易过拟合或对目标领域不可靠。

发明内容

目的：为了克服现有技术中存在的不足，本发明提供一种基于迁移学习的行人重识别方法。

技术方案：为解决上述技术问题，本发明采用的技术方案为：

一种基于迁移学习的行人重识别方法，包括如下步骤：

步骤1，对数据集中原始图片运用多尺度Retinex彩色图像增强算法预处理，去除光照带来的影响；

步骤2，对预处理后的数据集提取行人的相关特征作为行人的原始特征；

步骤3，初始模型建立——非对称多任务判别模型；

步骤4，运用目标领域部分无标签数据的流形结构对初始模型进行精化；

步骤5，运用共轭梯度法对目标函数进行优化，得到最终分类器；

步骤6，在行人重识别标准数据库中对分类器进行行人重识别，并用CMC曲线来表示重识别测试的效果。

作为优选方案，所述原始图像经多尺度Retinex彩色图像增强算法预处理：

I(x,y)＝L(x,y)*R(x,y) (1)

式中，I(x,y)代表原始图像，L(x,y)代表在环境光的照射分量；R(x,y)表示携带图像细节信息的目标物体的反射分量；针对一幅原始图像I(x,y)，通过Retinex算法计算出对应的R(x,y)，则R(x,y)是增强后的图像；处理后的图像大大缓解光照的影响，使图像更接近原色。

作为优选方案，所述步骤2包括如下步骤：

2.1：每一幅行人图片的像素被统一成128×48的大小，对图像分别取像素大小为16×16的重叠区域；

2.2：在垂直和水平方向每次移动间隔8个像素，重叠率为50％；

2.3：对于每一个16x16大小的区域块，颜色特征是通过连接的8个颜色通道，包括：RGB，YCbCr，HS，创建16个bin的直方图；

2.4：分别提取HOG特征和LBP特征，并建立直方图统计特征；

2.5：通过计算，每一个16x16大小的区域块提取color、HOG、LBP三种共484维的特征向量，对于一张行人图片，总共有75块，合计36300维。

作为优选方案，所述步骤3包括如下步骤：

3.1：取为源数据集的局部类间散度矩阵和局部类内散度矩阵，是目标数据集的局部类间散度矩阵和局部类内散度矩阵；对散射矩阵计算如下：

其中q∈{s,t}，代表来自源数据集或目标数据集中的样本，每一个样本对x_i和x_j之间的联系用亲和矩阵A_i,j权衡，亲和矩阵A_i,j是通过局部缩放来计算；当q＝s时，即在源数据集中计算S_w和S_b，若x_i和x_j表示同一类即同一个行人的不同图片，取n_c代表c类的样本数量，n代表所有类别的全部数量；反之，若x_i和x_j表示不同的行人，则

3.2：采用联合最大化源数据集和目标数据集的局部类内和类间距离的方式，提出如下近似的目标函数：

其中，W₁＝(1-β)W₀+βW_S，W₂＝(1-β)W₀+βW_t，0≤β≤1，W_S是源数据集映射矩阵，W_t是目标数据集映射矩阵，W₀是共享隐空间的映射矩阵；通过Fisher准则获得，W₁＝(1-β)W₀+βW_S是度量源数据集的可分性，W₂＝(1-β)W₀+βW_t是度量目标数据集的可分性；γ为控制目标任务的学习强度；

3.3：取W＝[W₀；W_s；W_t]，Θ_s＝[(1-β)I_d,βI_d,O_d*d]，Θ_t＝[(1-β)I_d,O_d*d,βI_d]替换公式(4)中相关变量，其中，I_d是d×d维的单位矩阵，O_d×d是d×d维的零矩阵；将公式(4)进行优化，得到如下形式：

其中，A用来度量局部类间距离，B是度量局部类内距离；本文中A和B都是半正定矩阵；

公式(5)通过常用的广义特征值分解来求解，如公式(6)：

AW＝λBW (6)

W的闭式解则由B^-1A的N-1个最大广义特征值所对应的特征向量组成的矩阵；λ表示广义特征值，λ的个数等于N-1。

作为优选方案，所述γ取0.75。

作为优选方案，所述步骤4包括如下步骤：

4.1：将效开发利用有标签和无标签数据的流形结构的方法用于迁移学习中，作用于部分目标领域无标签数据上，其中是目标领域数据集无标签数据的样本数；通过最小化公式(7)来实现：

其中，K是样本x_i的近邻个数，x_i,k是样本x_i的第k个近邻，1≤k≤K；

4.2：采用任一种相似性度量方式来计算样本之间的相邻关系，W是公式(6)求得的初始模型；函数σ表示条件概率P(y＝±1|x)，指在给定样本x的情况下，求x属于类别y的概率；由逻辑回归分类模型求得，如公式(8)所示。

作为优选方案，所述步骤5包括如下步骤：对目标函数如公式(9)进行最终优化：

f(W)＝W^TW+αg_m (9)

其中，α为正则化的平衡因子；为了解决该优化问题，首先对公式(9)中变量W进行求偏导，如公式(10)所示：

由于目标函数f不是凸函数，但给定了初始分类器W₁，所以用非线性数值优化方法得到局部最优解，且这个解是优于由公式(6)所求得的初始值；算法如下所示：

输入：初始分类器W＝W₁，近邻个数K，参数α，误差阈值ε；

输出：精化后的分类器W；

步骤5.1：计算偏导数如果

转到步骤5.7，否则计算初始的搜索方向d0，

步骤5.2：t＝0；

步骤5.3：求第t次迭代的最佳步长λ_t，由精确一维搜索，最小化式：

f(W_t+λ_td_t)＝min_λf(W_t+λd_t)；

步骤5.4：得到t次迭代的最佳步长λ_t后，计算第t+1次的分类器

W_t+1＝W_t+λ_td_t；

步骤5.5：计算偏导数如果转到步骤5.7，否则计

算第t+1次的搜索方向d_t+1，其中μ_t由PRP公式计算

得到，

步骤5.6：t＝t+1，转步骤5.3；

步骤5.7：返回精后化的分类器W。

有益效果：本发明提供的一种基于迁移学习的行人重识别方法，结合这两方面，本发明提出基于迁移学习的行人重识别模型：第一步，选出源领域和目标领域共有的特征映射到共享隐空间，缓解比例不平衡问题。然后，运用非对称多任务学习对特征进行学习，得到初始模型。第二步，从目标领域无标签样本中选择特有特征(空间分布信息)来对初始模型进行精化，缓解模型过拟合现象，从而得到适合于目标领域数据的模型，最终通过非线性数值优化技术求得最终解。此外，本文采用了共轭梯度法来对目标函数进行优化，由于机器学习中常用的梯度下降算法收敛慢，效率不高，有时达不到最优解的缺点，但对于共轭梯度法，其将共轭性与梯度下降法相结合，使得运算量减小，其收敛速度也不慢。而且对于二次函数，具有二次终止性，能很好的提升训练速度。本发明对基于少量有标签数据和无标签数据训练，可很好的应用于新场景。

附图说明

图1是本发明基于迁移学习的行人重识别方法的流程图；

图2是行人特征提取；

图3是基于CAVIAR数据集训练和测试的识别率；

图4是基于VIPeR数据集训练，CAVIAR数据集测试的识别率；

图5是基于VIPeR数据集和部分的CAVIAR数据集训练的识别率；

图6是有无精化学习的影响；

具体实施方式

下面结合附图对本发明作更进一步的说明。

如图1、2所示，一种基于迁移学习的行人重识别方法，包括步骤如下：

步骤1：对数据集中原始图片运用Retinex算法预处理；

行人原始图像经多尺度Retinex彩色图像增强算法预处理：

I(x,y)＝L(x,y)*R(x,y) (1)

式中，I(x,y)代表原始图像，L(x,y)代表在环境光的照射分量；R(x,y)表示携带图像细节信息的目标物体的反射分量；针对一幅原始图像I(x,y)，通过retinex算法计算出对应的R(x,y)，则R(x,y)是增强后的图像；处理后的图像可以大大缓解光照的影响，使图像更接近原色。

步骤2：对预处理后的数据集提取行人目标特征：

每一幅行人图片的像素被统一成128×48的大小，本发明对图像分别取像素大小为16×16的重叠区域。在垂直和水平方向每次移动间隔8个像素，重叠率为50％。对于每一个16x16大小的区域块，颜色特征是通过连接的8个颜色通道，包括：RGB，YCbCr，HS，创建16个bin的直方图。分别提取HOG特征和LBP特征，并建立直方图统计特征。通过计算，每一个16x16大小的区域块提取color、HOG、LBP三种共484维的特征向量，对于一张行人图片，总共有75块，合计36300维。

步骤3、初始模型—非对称多任务判别模型的建立：

本文提出的基于迁移学习的行人重识别方法，目的是利用已存在的有标签的数据进行训练，迁移得到共性知识，提高模型对目标数据集匹配率的鲁棒性。本文借鉴多任务学习机制，其旨在训练相关联源数据集的同时运用跨数据集中共同部分来提高目标任务的匹配率。本文使用的源数据集是非目标任务相关的数据集，目标数据集是我们关心的安防系统得到的数据集。本文对不同任务提取共性特征，所述任务表示源数据集和部分目标数据集，并进行模型化，将共性特征映射到共享隐空间，用映射矩阵W₀的列向量表示。同时将少量标记的目标数据映射到W_t，源数据有标签数据映射到W_s。因此，将一张行人图片提取的特征向量，以线性关系映射到矩阵W₀，W_t，W_s；

例如，一个目标数据集样本x_j以一个线性组合的方式映射到两个子空间，表示如下：z_t＝((1-β)W₀+βW_t)′x_j，其中，0≤β≤1，其作用是平衡共享隐空间与目标数据或源数据的耦合关系。类似的，一个源数据集样本x_i映射到两个子空间，表示如下：z_s＝((1-β)W₀+βW_s)′x_i。

本发明用距离刻画行人间相似度，同一行人图像尽可能相似，即类内距离尽可能小，不同行人图像尽可能不相似，即类间距离尽可能大。本发明取为源数据集的局部类间散度矩阵和局部类内散度矩阵，是目标数据集的局部类间散度矩阵和局部类内散度矩阵。因此，对散射矩阵计算如下：

其中q∈{s,t}，在上面的公式中，代表来自源数据集或目标数据集中的样本，每一个样本对x_i和x_j之间的联系用亲和矩阵A_i,j权衡，亲和矩阵A_i,j是通过局部缩放来计算。当q＝s时，即在源数据集中计算S_w和S_b，若x_i和x_j表示同一类即同一个行人的不同图片，则在计算矩阵时，矩阵尽可能小(类间距离尽可能小)，矩阵尽可能大(类内距离尽可能大)换言之，取n_c代表c类的样本数量，n代表所有类别的全部数量。通过计算离的近的样本对整体影响更大。反之，若x_i和x_j表示不同的行人，则即矩阵最大(类间距离最大)，矩阵最小(类内距离最小)，换言之，通过计算远远分开的样本对整体影响更小。这个方法处理后使得目标函数更具泛化性能。

为了求得目标函数的整体最优解，需同时在目标数据集和源数据集中最大化局部类内距离和最小化局部类间距离。本发明采用联合最大化源数据集和目标数据集的局部类内和类间距离的方式，提出如下近似的目标函数：

其中，W₁＝(1-β)W₀+βW_S，W₂＝(1-β)W₀+βW_t，0≤β≤1，W_S是源数据集映射矩阵，W_t是目标数据集映射矩阵，W₀是共享隐空间的映射矩阵。通过Fisher准则获得，W₁＝(1-β)W₀+βW_S是度量源数据集的可分性，W₂＝(1-β)W₀+βW_t是度量目标数据集的可分性。公式中γ为控制目标任务的学习强度，当γ＝1时，模型只对目标集进行学习。当γ＝0时，模型只对源数据集进行学习。如果γ＞0.5，意味着在映射函数中对目标域学习的比重大于源域。通过实验获取本文中γ取0.75时，平均匹配率最好，本发明中非对称的含义主要体现在有利于目标任务的学习。

但对公式(4)最优化求解是一个挑战，因为其解同时与W₀，W_t，W_s有关。本发明提出的解决办法是运用分块矩阵进行最优化处理，然后通过广义特征值分解求得最优解。取W＝[W₀；W_s；W_t]，Θ_s＝[(1-β)I_d,βI_d,O_d*d]，Θ_t＝[(1-β)I_d,O_d*d,βI_d]替换公式(4)中相关变量，其中，I_d是d×d维的单位矩阵，O_d×d是d×d维的零矩阵。将公式(4)进行优化，得到如下形式：

其中，A用来度量局部类间距离，B是度量局部类内距离。本文中A和B都是半正定矩阵，因此能够保证得到的解为全局最优解。

公式(5)通过常用的广义特征值分解来求解，如公式(6)：

AW＝λBW (6)

W的闭式解则由B^-1A的N-1个最大广义特征值所对应的特征向量组成的矩阵。λ表示广义特征值，λ的个数等于N-1。

步骤4，运用无标签数据的流形结构对模型进行精化；

Belkin等人在研究中提出了有效开发利用有标签和无标签数据的流形结构的方法，该准则要求样本的类别标签与周围样本的类别标签是相似的。本文中将其用于迁移学习中，作用于部分目标领域无标签数据上，其中是目标领域数据集无标签数据的样本数。对于目标领域无标签数据运用样本的空间分布信息，起到对模型半监督的作用。通过最小化公式(7)来实现：

其中K是样本x_i的近邻个数，x_i,k是样本x_i的第k个近邻(1≤k≤K)。本文中可以采用任一种相似性度量方式来计算样本之间的相邻关系。W是公式(6)求得的初始模型。函数σ表示条件概率P(y＝±1|x)，指在给定样本x的情况下，求x属于类别y的概率。本实验是判断是否是同一个行人，属于二分类问题。由逻辑回归分类模型求得，如公式(8)所示：

步骤5，运用共轭梯度法对目标函数进行优化，得到最终分类器；对目标函数如公式(9)进行最终优化：

f(W)＝W^TW+αg_m (9)

其中α为正则化的平衡因子。为了解决该优化问题，首先对公式(9)中变量W进行求偏导，如公式(10)所示：

由于目标函数f不是凸函数，但给定了初始分类器W₁，所以可以用非线性数值优化方法得到局部最优解，且这个解是优于由公式(6)所求得的初始值。算法如下所示：

输入：初始分类器W＝W₁，近邻个数K，参数α，误差阈值ε。

输出：精化后的分类器W。

步骤5.1：计算偏导数如果转到步骤5.7，否则计算初始的搜索方向d₀，

步骤5.2：t＝0；

f(W_t+λ_td_t)＝min_λf(W_t+λd_t)

步骤5.4：得到t次迭代的最佳步长λ_t后，计算第t+1次的分类器W_t+1＝W_t+λ_td_t。

步骤5.5：计算偏导数如果转到步骤5.7，否则计算第t+1次的搜索方向d_t+1，其中μ_t由PRP公式计算得到，

步骤5.6：t＝t+1，转步骤5.3。

步骤5.7：返回精后化的分类器W。

步骤6，在行人重识别标准数据库中对精后化的分类器W进行行人重识别，并用行人重识别通用的评价指标：累计匹配特征曲线CMC(Cumulative Match Characteristic)CMC曲线来表示本发明测试的效果；

本发明选择了三个与行人重识别相关的度量学习算法进行比较，包括：LFDA，KISSME，LMNN。其中LFDA算法是基于子空间的度量方法，KISSME算法是基于判别性距离度量方法，LMNN算法是基于最优方法的度量方法。同时，为了说明不同领域间知识迁移的有效性，每一个方法都用以下三种不同的方式进行训练。

图3是基于CAVIAR数据集训练和测试的识别率；

图3是仅使用目标数据，取三分之一有标签数据和三分之一无标记数据训练，剩余三分之一数据测试。从中可以看出：本发明提出的方法在行人重识别的识别率方面和综合检索能力比其他三种的要好很多。

图4是基于VIPeR数据集训练，CAVIAR数据集测试的识别率；

图4是使用VIPeR数据集和一半的CAVIAR无标签数据进行训练。从图中我们可以看到：与图3相比，使用与目标域相关联的源数据进行训练，对提高目标域的行人重识别率有很大的提升。随着Rank的增长，所有方法匹配率都大幅提高，且本文方法匹配率比其他三种方法提高在5％左右。虽然综合检索能力在缩小。

图5是基于VIPeR数据集和部分的CAVIAR数据集训练的识别率；

图5是使用相关联的有标签的源数据和部分目标集数据共同用于训练，四种方法在提高识别率上都比前两个图中的识别率有所提高，虽然其他三种方法匹配率与本发明差距缩小，但本发明在各个Rank上都有着最好的匹配率。说明本发明提出的使用相关域中已标记的数据提取共性部分用于训练的方法在提高行人重识别匹配率上的有效性。

图6是有无精化学习的影响；

图6使用无标签数据对提升模型有显著作用。基本上每一个Rank下都有所提高，其中在Rank10时，本发明的识别率效果提升最大。说明利用无标签数据的空间信息能够很好的对模型起到半监督作用，提高模型识别率。

本发明的方法是解决目标领域中少量标签数据的问题，以多任务学习的模型为框架提出基于迁移学习的行人重识别模型，此模型是训练已标记的数据并用目标领域无标记数据精化的方式，提高目标任务的性能。本发明先运用非对称多任务学习模型进行初始模型构建，并且引入流形正则化项进行精化，使得最终模型对目标域更具泛化性，同时缓解了因目标集有标签数据不足导致的过拟合现象。最后运用共轭梯度法优化目标函数，使得运算和复杂度大大降低。通过实验对比，在训练有限的标记样本的情况下，运用流形正则化精化模型的方法，在性能上得到了很大的提高，说明本发明运用在新的安防系统上是可行的。

本发明的方法可以很好地完成对于行人姿态变化及光照变化都具有比较好的鲁棒性。以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均包含在本发明的保护范围之内。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于迁移学习的行人重识别方法，其特征在于：包括如下步骤：

步骤3，初始模型建立——非对称多任务判别模型；

2.根据权利要求1所述的一种基于迁移学习的行人重识别方法，其特征在于：所述原始图像经多尺度Retinex彩色图像增强算法预处理：

I(x,y)＝L(x,y)*R(x,y) (1)

3.根据权利要求1所述的一种基于迁移学习的行人重识别方法，其特征在于：所述步骤2包括如下步骤：

2.4：分别提取HOG特征和LBP特征，并建立直方图统计特征；

4.根据权利要求1所述的一种基于迁移学习的行人重识别方法，其特征在于：所述步骤3包括如下步骤：

<mrow> <msubsup> <mi>S</mi> <mi>b</mi> <mi>q</mi> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mover> <mi>A</mi> <mo>&OverBar;</mo> </mover> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mi>b</mi> </msubsup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>q</mi> </msubsup> <mo>-</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>q</mi> </msubsup> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>q</mi> </msubsup> <mo>-</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>q</mi> </msubsup> <mo>)</mo> </mrow> <mo>&prime;</mo> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msubsup> <mi>S</mi> <mi>w</mi> <mi>q</mi> </msubsup> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mover> <mi>A</mi> <mo>&OverBar;</mo> </mover> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mi>w</mi> </msubsup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>q</mi> </msubsup> <mo>-</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>q</mi> </msubsup> <mo>)</mo> </mrow> <msup> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>q</mi> </msubsup> <mo>-</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>q</mi> </msubsup> <mo>)</mo> </mrow> <mo>&prime;</mo> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <munder> <mi>max</mi> <mrow> <msub> <mi>W</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>W</mi> <mn>2</mn> </msub> </mrow> </munder> <mfrac> <mrow> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <mo>(</mo> <mrow> <mn>1</mn> <mo>-</mo> <mi>&gamma;</mi> </mrow> <mo>)</mo> <msup> <msub> <mi>W</mi> <mn>1</mn> </msub> <mo>&prime;</mo> </msup> <msubsup> <mi>S</mi> <mi>b</mi> <mi>s</mi> </msubsup> <msub> <mi>W</mi> <mn>1</mn> </msub> <mo>+</mo> <msup> <msub> <mi>&gamma;W</mi> <mn>2</mn> </msub> <mo>&prime;</mo> </msup> <msubsup> <mi>S</mi> <mi>b</mi> <mi>t</mi> </msubsup> <msub> <mi>W</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <mo>(</mo> <mrow> <mn>1</mn> <mo>-</mo> <mi>&gamma;</mi> </mrow> <mo>)</mo> <msub> <msup> <mi>W</mi> <mo>&prime;</mo> </msup> <mn>1</mn> </msub> <msubsup> <mi>S</mi> <mi>w</mi> <mi>s</mi> </msubsup> <msub> <mi>W</mi> <mn>1</mn> </msub> <mo>+</mo> <msup> <msub> <mi>&gamma;W</mi> <mn>2</mn> </msub> <mo>&prime;</mo> </msup> <msubsup> <mi>S</mi> <mi>w</mi> <mi>t</mi> </msubsup> <msub> <mi>W</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msup> <mi>W</mi> <mo>*</mo> </msup> <mo>=</mo> <mi>arg</mi> <munder> <mi>max</mi> <mi>W</mi> </munder> <mfrac> <mrow> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>W</mi> <mo>&prime;</mo> </msup> <mi>A</mi> <mi>W</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>W</mi> <mo>&prime;</mo> </msup> <mi>B</mi> <mi>W</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

公式(5)通过常用的广义特征值分解来求解，如公式(6)：

AW＝λBW (6)

5.根据权利要求4所述的一种基于迁移学习的行人重识别方法，其特征在于：所述γ取0.75。

6.根据权利要求1所述的一种基于迁移学习的行人重识别方法，其特征在于：所述步骤4包括如下步骤：

<mrow> <msub> <mi>g</mi> <mi>m</mi> </msub> <mrow> <mo>(</mo> <mi>W</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msubsup> <mi>n</mi> <mi>t</mi> <mi>u</mi> </msubsup> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msubsup> <mi>n</mi> <mi>t</mi> <mi>u</mi> </msubsup> </munderover> <msup> <mrow> <mo>&lsqb;</mo> <mfrac> <mn>1</mn> <mi>K</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mi>&sigma;</mi> <mrow> <mo>(</mo> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>y</mi> <mo>=</mo> <mo>&PlusMinus;</mo> <mn>1</mn> <mo>|</mo> <mi>x</mi> <mo>;</mo> <mi>W</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <mi>y</mi> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <mi>x</mi> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mi>y</mi> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <mi>x</mi> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>

7.根据权利要求1所述的一种基于迁移学习的行人重识别方法，其特征在于：所述步骤5包括如下步骤：对目标函数如公式(9)进行最终优化：

f(W)＝W^TW+αg_m (9)

<mrow> <mtable> <mtr> <mtd> <mrow> <msub> <mo>&dtri;</mo> <mi>W</mi> </msub> <mi>f</mi> <mo>=</mo> <mn>2</mn> <mi>W</mi> <mo>+</mo> <mi>&alpha;</mi> <msub> <mo>&dtri;</mo> <mi>W</mi> </msub> <msub> <mi>g</mi> <mi>m</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mn>2</mn> <mi>W</mi> <mo>+</mo> <mi>&alpha;</mi> <mfrac> <mn>2</mn> <msubsup> <mi>n</mi> <mi>t</mi> <mi>u</mi> </msubsup> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <msubsup> <mi>n</mi> <mi>t</mi> <mi>u</mi> </msubsup> </munderover> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <mi>K</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </munderover> <mi>&sigma;</mi> <mo>(</mo> <mrow> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> </mrow> <mo>)</mo> <mo>-</mo> <mi>&sigma;</mi> <mo>(</mo> <mrow> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>&times;</mo> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <mi>K</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </munderover> <mi>&sigma;</mi> <mo>(</mo> <mrow> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> </mrow> <mo>)</mo> <mo>(</mo> <mrow> <mn>1</mn> <mo>-</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <mrow> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>-</mo> <mi>&sigma;</mi> <mo>(</mo> <mrow> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> </mrow> <mo>)</mo> <mo>(</mo> <mrow> <mn>1</mn> <mo>-</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <mrow> <mo>|</mo> <mo>|</mo> <msup> <mi>W</mi> <mi>T</mi> </msup> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>

输入：初始分类器W＝W₁，近邻个数K，参数α，误差阈值ε；

输出：精化后的分类器W；

步骤5.1：计算偏导数▽_Wf(W₁)，▽_Wf(W₁)＝2W₁+α▽_Wg_m(W₁)；如果||▽_Wf(W₁)||＜ε，

转到步骤5.7，否则计算初始的搜索方向d₀，d₀＝-▽_Wf(W₁)；

步骤5.2：t＝0；

f(W_t+λ_td_t)＝min_λf(W_t+λd_t)；

W_t+1＝W_t+λ_td_t；

步骤5.5：计算偏导数▽_Wf(W_t+1)；如果||▽_Wf(W_t+1)||＜ε，转到步骤5.7，否则计算第t+1次的搜索方向d_t+1，d_t+1＝-▽_wf(W_t+1)+μ_td_t，其中μ_t由PRP公式计算得到，

步骤5.6：t＝t+1，转步骤5.3；

步骤5.7：返回精后化的分类器W。