CN107832711A - 一种基于迁移学习的行人重识别方法 - Google Patents
一种基于迁移学习的行人重识别方法 Download PDFInfo
- Publication number
- CN107832711A CN107832711A CN201711112527.3A CN201711112527A CN107832711A CN 107832711 A CN107832711 A CN 107832711A CN 201711112527 A CN201711112527 A CN 201711112527A CN 107832711 A CN107832711 A CN 107832711A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- msup
- msubsup
- mfrac
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于迁移学习的行人重识别方法,包括以下步骤:1)对数据集中图片运用多尺度Retinex彩色图像增强算法预处理,去除光照带来的影响2)在预处理后的数据集中提取行人的相关特征;3)建立非对称多任务判别模型;4)运用无标签数据的流形结构对模型进行精化;5)运用共轭梯度法对目标函数进行优化,得到最终分类器;6)基于行人重识别标准数据库对分类器进行行人重识别率的测试;本发明合理的运用少量的有标签数据和无标签数据,训练得到的模型可以很好的提高行人重识别率。
Description
技术领域
本发明涉及一种基于迁移学习的行人重识别方法,属于计算机视觉技术领域。
背景技术
随着城市化发展的步伐,人们对公共安全越来越重视,许多重要的公共场所都安装了大量的监控摄像头,为寻找犯罪分子的踪迹提供了便利,因此,行人重识别技术得到了广泛的关注。行人重识别技术指从不同摄像机,不同时间段的行人图像数据集中找出与要检索的行人相匹配的图像。在行人重识别系统中,一个很重要的技术问题就是在一个新的场景下的部署性和适应性。然而,在实际应用场景中,由于在新场景中用于训练的标签信息很匮乏,而且很难获得,使得已有的训练样本不足以训练得到一个可靠的模型。另一方面,要标记目标领域的数据也是相当困难,即使是少量的,也要消耗很大的人力物力。这就引起了机器学习中关注的一个重要问题,如何利用少量的有标签训练样本或者源领域数据,建立一个可靠的模型对目标领域数据进行预测。
近年来,迁移学习已经引起了广泛的关注和研究,其运用已知存在的知识对不同但相关领域问题进行求解的一种新的机器学习方法,它放宽了传统机器学习中的两个基本假设:(1)用于学习的训练样本与新的测试样本满足独立同分布的条件。(2)必须有足够可利用的训练样本才能学习得到一个好的分类模型。目的是迁移已有的知识解决目标领域中仅有少量有标签样本数据甚至没有的学习问题。迁移学习的关键是寻找源域与目标域之间的“共同点”,从而实现知识的迁移。现有技术中,提出将不同问题领域中的特征分为领域相关特征和领域独立特征,通过领域相关特征建立领域间联系实现知识的迁移,再基于谱图划分对数据进行分类;还提出了一种方法,即估计源领域中的每个样本与目标领域中少量标签数据之间的不匹配程度,并把该信息应用到逻辑回归中。另外,提出了基于同步聚类的分类方法,该方法通过对类别和特征进行同步聚类,实现类别标签的迁移。还提出了一种桥接精化的迁移学习方法,该方法在精化的过程中不断地修正由源领域训练得到的模型在测试数据集上的预测类别,从而获得较高的预测准确率。
自学习也是一种利用大量无标签数据来提高给定分类聚类任务性能的方法,自学习被应用于迁移学习中,因为它不要求无标签数据的分布与目标领域中的数据分布相同。纵观基于迁移学习分类算法,尽管其取得了一定效果,但也存在不足之处:1)共同特征表示是在源域和目标域中提取,存在类别比例漂移问题;2)由于标签信息主要来自源域数据,因此使得学习到的模型容易过拟合或对目标领域不可靠。
发明内容
目的:为了克服现有技术中存在的不足,本发明提供一种基于迁移学习的行人重识别方法。
技术方案:为解决上述技术问题,本发明采用的技术方案为:
一种基于迁移学习的行人重识别方法,包括如下步骤:
步骤1,对数据集中原始图片运用多尺度Retinex彩色图像增强算法预处理,去除光照带来的影响;
步骤2,对预处理后的数据集提取行人的相关特征作为行人的原始特征;
步骤3,初始模型建立——非对称多任务判别模型;
步骤4,运用目标领域部分无标签数据的流形结构对初始模型进行精化;
步骤5,运用共轭梯度法对目标函数进行优化,得到最终分类器;
步骤6,在行人重识别标准数据库中对分类器进行行人重识别,并用CMC曲线来表示重识别测试的效果。
作为优选方案,所述原始图像经多尺度Retinex彩色图像增强算法预处理:
I(x,y)=L(x,y)*R(x,y) (1)
式中,I(x,y)代表原始图像,L(x,y)代表在环境光的照射分量;R(x,y)表示携带图像细节信息的目标物体的反射分量;针对一幅原始图像I(x,y),通过Retinex算法计算出对应的R(x,y),则R(x,y)是增强后的图像;处理后的图像大大缓解光照的影响,使图像更接近原色。
作为优选方案,所述步骤2包括如下步骤:
2.1:每一幅行人图片的像素被统一成128×48的大小,对图像分别取像素大小为16×16的重叠区域;
2.2:在垂直和水平方向每次移动间隔8个像素,重叠率为50%;
2.3:对于每一个16x16大小的区域块,颜色特征是通过连接的8个颜色通道,包括:RGB,YCbCr,HS,创建16个bin的直方图;
2.4:分别提取HOG特征和LBP特征,并建立直方图统计特征;
2.5:通过计算,每一个16x16大小的区域块提取color、HOG、LBP三种共484维的特征向量,对于一张行人图片,总共有75块,合计36300维。
作为优选方案,所述步骤3包括如下步骤:
3.1:取为源数据集的局部类间散度矩阵和局部类内散度矩阵,是目标数据集的局部类间散度矩阵和局部类内散度矩阵;对散射矩阵计算如下:
其中q∈{s,t},代表来自源数据集或目标数据集中的样本,每一个样本对xi和xj之间的联系用亲和矩阵Ai,j权衡,亲和矩阵Ai,j是通过局部缩放来计算;当q=s时,即在源数据集中计算Sw和Sb,若xi和xj表示同一类即同一个行人的不同图片,取nc代表c类的样本数量,n代表所有类别的全部数量;反之,若xi和xj表示不同的行人,则
3.2:采用联合最大化源数据集和目标数据集的局部类内和类间距离的方式,提出如下近似的目标函数:
其中,W1=(1-β)W0+βWS,W2=(1-β)W0+βWt,0≤β≤1,WS是源数据集映射矩阵,Wt是目标数据集映射矩阵,W0是共享隐空间的映射矩阵;通过Fisher准则获得,W1=(1-β)W0+βWS是度量源数据集的可分性,W2=(1-β)W0+βWt是度量目标数据集的可分性;γ为控制目标任务的学习强度;
3.3:取W=[W0;Ws;Wt],Θs=[(1-β)Id,βId,Od*d],Θt=[(1-β)Id,Od*d,βId]替换公式(4)中相关变量,其中,Id是d×d维的单位矩阵,Od×d是d×d维的零矩阵;将公式(4)进行优化,得到如下形式:
其中,A用来度量局部类间距离,B是度量局部类内距离;本文中A和B都是半正定矩阵;
公式(5)通过常用的广义特征值分解来求解,如公式(6):
AW=λBW (6)
W的闭式解则由B-1A的N-1个最大广义特征值所对应的特征向量组成的矩阵;λ表示广义特征值,λ的个数等于N-1。
作为优选方案,所述γ取0.75。
作为优选方案,所述步骤4包括如下步骤:
4.1:将效开发利用有标签和无标签数据的流形结构的方法用于迁移学习中,作用于部分目标领域无标签数据上,其中是目标领域数据集无标签数据的样本数;通过最小化公式(7)来实现:
其中,K是样本xi的近邻个数,xi,k是样本xi的第k个近邻,1≤k≤K;
4.2:采用任一种相似性度量方式来计算样本之间的相邻关系,W是公式(6)求得的初始模型;函数σ表示条件概率P(y=±1|x),指在给定样本x的情况下,求x属于类别y的概率;由逻辑回归分类模型求得,如公式(8)所示。
作为优选方案,所述步骤5包括如下步骤:对目标函数如公式(9)进行最终优化:
f(W)=WTW+αgm (9)
其中,α为正则化的平衡因子;为了解决该优化问题,首先对公式(9)中变量W进行求偏导,如公式(10)所示:
由于目标函数f不是凸函数,但给定了初始分类器W1,所以用非线性数值优化方法得到局部最优解,且这个解是优于由公式(6)所求得的初始值;算法如下所示:
输入:初始分类器W=W1,近邻个数K,参数α,误差阈值ε;
输出:精化后的分类器W;
步骤5.1:计算偏导数如果
转到步骤5.7,否则计算初始的搜索方向d0,
步骤5.2:t=0;
步骤5.3:求第t次迭代的最佳步长λt,由精确一维搜索,最小化式:
f(Wt+λtdt)=minλf(Wt+λdt);
步骤5.4:得到t次迭代的最佳步长λt后,计算第t+1次的分类器
Wt+1=Wt+λtdt;
步骤5.5:计算偏导数如果转到步骤5.7,否则计
算第t+1次的搜索方向dt+1,其中μt由PRP公式计算
得到,
步骤5.6:t=t+1,转步骤5.3;
步骤5.7:返回精后化的分类器W。
有益效果:本发明提供的一种基于迁移学习的行人重识别方法,结合这两方面,本发明提出基于迁移学习的行人重识别模型:第一步,选出源领域和目标领域共有的特征映射到共享隐空间,缓解比例不平衡问题。然后,运用非对称多任务学习对特征进行学习,得到初始模型。第二步,从目标领域无标签样本中选择特有特征(空间分布信息)来对初始模型进行精化,缓解模型过拟合现象,从而得到适合于目标领域数据的模型,最终通过非线性数值优化技术求得最终解。此外,本文采用了共轭梯度法来对目标函数进行优化,由于机器学习中常用的梯度下降算法收敛慢,效率不高,有时达不到最优解的缺点,但对于共轭梯度法,其将共轭性与梯度下降法相结合,使得运算量减小,其收敛速度也不慢。而且对于二次函数,具有二次终止性,能很好的提升训练速度。本发明对基于少量有标签数据和无标签数据训练,可很好的应用于新场景。
附图说明
图1是本发明基于迁移学习的行人重识别方法的流程图;
图2是行人特征提取;
图3是基于CAVIAR数据集训练和测试的识别率;
图4是基于VIPeR数据集训练,CAVIAR数据集测试的识别率;
图5是基于VIPeR数据集和部分的CAVIAR数据集训练的识别率;
图6是有无精化学习的影响;
具体实施方式
下面结合附图对本发明作更进一步的说明。
如图1、2所示,一种基于迁移学习的行人重识别方法,包括步骤如下:
步骤1:对数据集中原始图片运用Retinex算法预处理;
行人原始图像经多尺度Retinex彩色图像增强算法预处理:
I(x,y)=L(x,y)*R(x,y) (1)
式中,I(x,y)代表原始图像,L(x,y)代表在环境光的照射分量;R(x,y)表示携带图像细节信息的目标物体的反射分量;针对一幅原始图像I(x,y),通过retinex算法计算出对应的R(x,y),则R(x,y)是增强后的图像;处理后的图像可以大大缓解光照的影响,使图像更接近原色。
步骤2:对预处理后的数据集提取行人目标特征:
每一幅行人图片的像素被统一成128×48的大小,本发明对图像分别取像素大小为16×16的重叠区域。在垂直和水平方向每次移动间隔8个像素,重叠率为50%。对于每一个16x16大小的区域块,颜色特征是通过连接的8个颜色通道,包括:RGB,YCbCr,HS,创建16个bin的直方图。分别提取HOG特征和LBP特征,并建立直方图统计特征。通过计算,每一个16x16大小的区域块提取color、HOG、LBP三种共484维的特征向量,对于一张行人图片,总共有75块,合计36300维。
步骤3、初始模型—非对称多任务判别模型的建立:
本文提出的基于迁移学习的行人重识别方法,目的是利用已存在的有标签的数据进行训练,迁移得到共性知识,提高模型对目标数据集匹配率的鲁棒性。本文借鉴多任务学习机制,其旨在训练相关联源数据集的同时运用跨数据集中共同部分来提高目标任务的匹配率。本文使用的源数据集是非目标任务相关的数据集,目标数据集是我们关心的安防系统得到的数据集。本文对不同任务提取共性特征,所述任务表示源数据集和部分目标数据集,并进行模型化,将共性特征映射到共享隐空间,用映射矩阵W0的列向量表示。同时将少量标记的目标数据映射到Wt,源数据有标签数据映射到Ws。因此,将一张行人图片提取的特征向量,以线性关系映射到矩阵W0,Wt,Ws;
例如,一个目标数据集样本xj以一个线性组合的方式映射到两个子空间,表示如下:zt=((1-β)W0+βWt)′xj,其中,0≤β≤1,其作用是平衡共享隐空间与目标数据或源数据的耦合关系。类似的,一个源数据集样本xi映射到两个子空间,表示如下:zs=((1-β)W0+βWs)′xi。
本发明用距离刻画行人间相似度,同一行人图像尽可能相似,即类内距离尽可能小,不同行人图像尽可能不相似,即类间距离尽可能大。本发明取为源数据集的局部类间散度矩阵和局部类内散度矩阵,是目标数据集的局部类间散度矩阵和局部类内散度矩阵。因此,对散射矩阵计算如下:
其中q∈{s,t},在上面的公式中,代表来自源数据集或目标数据集中的样本,每一个样本对xi和xj之间的联系用亲和矩阵Ai,j权衡,亲和矩阵Ai,j是通过局部缩放来计算。当q=s时,即在源数据集中计算Sw和Sb,若xi和xj表示同一类即同一个行人的不同图片,则在计算矩阵时,矩阵尽可能小(类间距离尽可能小),矩阵尽可能大(类内距离尽可能大)换言之,取nc代表c类的样本数量,n代表所有类别的全部数量。通过计算离的近的样本对整体影响更大。反之,若xi和xj表示不同的行人,则即矩阵最大(类间距离最大),矩阵最小(类内距离最小),换言之,通过计算远远分开的样本对整体影响更小。这个方法处理后使得目标函数更具泛化性能。
为了求得目标函数的整体最优解,需同时在目标数据集和源数据集中最大化局部类内距离和最小化局部类间距离。本发明采用联合最大化源数据集和目标数据集的局部类内和类间距离的方式,提出如下近似的目标函数:
其中,W1=(1-β)W0+βWS,W2=(1-β)W0+βWt,0≤β≤1,WS是源数据集映射矩阵,Wt是目标数据集映射矩阵,W0是共享隐空间的映射矩阵。通过Fisher准则获得,W1=(1-β)W0+βWS是度量源数据集的可分性,W2=(1-β)W0+βWt是度量目标数据集的可分性。公式中γ为控制目标任务的学习强度,当γ=1时,模型只对目标集进行学习。当γ=0时,模型只对源数据集进行学习。如果γ>0.5,意味着在映射函数中对目标域学习的比重大于源域。通过实验获取本文中γ取0.75时,平均匹配率最好,本发明中非对称的含义主要体现在有利于目标任务的学习。
但对公式(4)最优化求解是一个挑战,因为其解同时与W0,Wt,Ws有关。本发明提出的解决办法是运用分块矩阵进行最优化处理,然后通过广义特征值分解求得最优解。取W=[W0;Ws;Wt],Θs=[(1-β)Id,βId,Od*d],Θt=[(1-β)Id,Od*d,βId]替换公式(4)中相关变量,其中,Id是d×d维的单位矩阵,Od×d是d×d维的零矩阵。将公式(4)进行优化,得到如下形式:
其中,A用来度量局部类间距离,B是度量局部类内距离。本文中A和B都是半正定矩阵,因此能够保证得到的解为全局最优解。
公式(5)通过常用的广义特征值分解来求解,如公式(6):
AW=λBW (6)
W的闭式解则由B-1A的N-1个最大广义特征值所对应的特征向量组成的矩阵。λ表示广义特征值,λ的个数等于N-1。
步骤4,运用无标签数据的流形结构对模型进行精化;
Belkin等人在研究中提出了有效开发利用有标签和无标签数据的流形结构的方法,该准则要求样本的类别标签与周围样本的类别标签是相似的。本文中将其用于迁移学习中,作用于部分目标领域无标签数据上,其中是目标领域数据集无标签数据的样本数。对于目标领域无标签数据运用样本的空间分布信息,起到对模型半监督的作用。通过最小化公式(7)来实现:
其中K是样本xi的近邻个数,xi,k是样本xi的第k个近邻(1≤k≤K)。本文中可以采用任一种相似性度量方式来计算样本之间的相邻关系。W是公式(6)求得的初始模型。函数σ表示条件概率P(y=±1|x),指在给定样本x的情况下,求x属于类别y的概率。本实验是判断是否是同一个行人,属于二分类问题。由逻辑回归分类模型求得,如公式(8)所示:
步骤5,运用共轭梯度法对目标函数进行优化,得到最终分类器;对目标函数如公式(9)进行最终优化:
f(W)=WTW+αgm (9)
其中α为正则化的平衡因子。为了解决该优化问题,首先对公式(9)中变量W进行求偏导,如公式(10)所示:
由于目标函数f不是凸函数,但给定了初始分类器W1,所以可以用非线性数值优化方法得到局部最优解,且这个解是优于由公式(6)所求得的初始值。算法如下所示:
输入:初始分类器W=W1,近邻个数K,参数α,误差阈值ε。
输出:精化后的分类器W。
步骤5.1:计算偏导数如果转到步骤5.7,否则计算初始的搜索方向d0,
步骤5.2:t=0;
步骤5.3:求第t次迭代的最佳步长λt,由精确一维搜索,最小化式:
f(Wt+λtdt)=minλf(Wt+λdt)
步骤5.4:得到t次迭代的最佳步长λt后,计算第t+1次的分类器Wt+1=Wt+λtdt。
步骤5.5:计算偏导数如果转到步骤5.7,否则计算第t+1次的搜索方向dt+1,其中μt由PRP公式计算得到,
步骤5.6:t=t+1,转步骤5.3。
步骤5.7:返回精后化的分类器W。
步骤6,在行人重识别标准数据库中对精后化的分类器W进行行人重识别,并用行人重识别通用的评价指标:累计匹配特征曲线CMC(Cumulative Match Characteristic)CMC曲线来表示本发明测试的效果;
本发明选择了三个与行人重识别相关的度量学习算法进行比较,包括:LFDA,KISSME,LMNN。其中LFDA算法是基于子空间的度量方法,KISSME算法是基于判别性距离度量方法,LMNN算法是基于最优方法的度量方法。同时,为了说明不同领域间知识迁移的有效性,每一个方法都用以下三种不同的方式进行训练。
图3是基于CAVIAR数据集训练和测试的识别率;
图3是仅使用目标数据,取三分之一有标签数据和三分之一无标记数据训练,剩余三分之一数据测试。从中可以看出:本发明提出的方法在行人重识别的识别率方面和综合检索能力比其他三种的要好很多。
图4是基于VIPeR数据集训练,CAVIAR数据集测试的识别率;
图4是使用VIPeR数据集和一半的CAVIAR无标签数据进行训练。从图中我们可以看到:与图3相比,使用与目标域相关联的源数据进行训练,对提高目标域的行人重识别率有很大的提升。随着Rank的增长,所有方法匹配率都大幅提高,且本文方法匹配率比其他三种方法提高在5%左右。虽然综合检索能力在缩小。
图5是基于VIPeR数据集和部分的CAVIAR数据集训练的识别率;
图5是使用相关联的有标签的源数据和部分目标集数据共同用于训练,四种方法在提高识别率上都比前两个图中的识别率有所提高,虽然其他三种方法匹配率与本发明差距缩小,但本发明在各个Rank上都有着最好的匹配率。说明本发明提出的使用相关域中已标记的数据提取共性部分用于训练的方法在提高行人重识别匹配率上的有效性。
图6是有无精化学习的影响;
图6使用无标签数据对提升模型有显著作用。基本上每一个Rank下都有所提高,其中在Rank10时,本发明的识别率效果提升最大。说明利用无标签数据的空间信息能够很好的对模型起到半监督作用,提高模型识别率。
本发明的方法是解决目标领域中少量标签数据的问题,以多任务学习的模型为框架提出基于迁移学习的行人重识别模型,此模型是训练已标记的数据并用目标领域无标记数据精化的方式,提高目标任务的性能。本发明先运用非对称多任务学习模型进行初始模型构建,并且引入流形正则化项进行精化,使得最终模型对目标域更具泛化性,同时缓解了因目标集有标签数据不足导致的过拟合现象。最后运用共轭梯度法优化目标函数,使得运算和复杂度大大降低。通过实验对比,在训练有限的标记样本的情况下,运用流形正则化精化模型的方法,在性能上得到了很大的提高,说明本发明运用在新的安防系统上是可行的。
本发明的方法可以很好地完成对于行人姿态变化及光照变化都具有比较好的鲁棒性。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均包含在本发明的保护范围之内。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (7)
1.一种基于迁移学习的行人重识别方法,其特征在于:包括如下步骤:
步骤1,对数据集中原始图片运用多尺度Retinex彩色图像增强算法预处理,去除光照带来的影响;
步骤2,对预处理后的数据集提取行人的相关特征作为行人的原始特征;
步骤3,初始模型建立——非对称多任务判别模型;
步骤4,运用目标领域部分无标签数据的流形结构对初始模型进行精化;
步骤5,运用共轭梯度法对目标函数进行优化,得到最终分类器;
步骤6,在行人重识别标准数据库中对分类器进行行人重识别,并用CMC曲线来表示重识别测试的效果。
2.根据权利要求1所述的一种基于迁移学习的行人重识别方法,其特征在于:所述原始图像经多尺度Retinex彩色图像增强算法预处理:
I(x,y)=L(x,y)*R(x,y) (1)
式中,I(x,y)代表原始图像,L(x,y)代表在环境光的照射分量;R(x,y)表示携带图像细节信息的目标物体的反射分量;针对一幅原始图像I(x,y),通过Retinex算法计算出对应的R(x,y),则R(x,y)是增强后的图像;处理后的图像大大缓解光照的影响,使图像更接近原色。
3.根据权利要求1所述的一种基于迁移学习的行人重识别方法,其特征在于:所述步骤2包括如下步骤:
2.1:每一幅行人图片的像素被统一成128×48的大小,对图像分别取像素大小为16×16的重叠区域;
2.2:在垂直和水平方向每次移动间隔8个像素,重叠率为50%;
2.3:对于每一个16x16大小的区域块,颜色特征是通过连接的8个颜色通道,包括:RGB,YCbCr,HS,创建16个bin的直方图;
2.4:分别提取HOG特征和LBP特征,并建立直方图统计特征;
2.5:通过计算,每一个16x16大小的区域块提取color、HOG、LBP三种共484维的特征向量,对于一张行人图片,总共有75块,合计36300维。
4.根据权利要求1所述的一种基于迁移学习的行人重识别方法,其特征在于:所述步骤3包括如下步骤:
3.1:取为源数据集的局部类间散度矩阵和局部类内散度矩阵,是目标数据集的局部类间散度矩阵和局部类内散度矩阵;对 散射矩阵计算如下:
<mrow>
<msubsup>
<mi>S</mi>
<mi>b</mi>
<mi>q</mi>
</msubsup>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msubsup>
<mover>
<mi>A</mi>
<mo>&OverBar;</mo>
</mover>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
<mi>b</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>i</mi>
<mi>q</mi>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>x</mi>
<mi>j</mi>
<mi>q</mi>
</msubsup>
<mo>)</mo>
</mrow>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>i</mi>
<mi>q</mi>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>x</mi>
<mi>j</mi>
<mi>q</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo>&prime;</mo>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msubsup>
<mi>S</mi>
<mi>w</mi>
<mi>q</mi>
</msubsup>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mn>2</mn>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msubsup>
<mover>
<mi>A</mi>
<mo>&OverBar;</mo>
</mover>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>j</mi>
</mrow>
<mi>w</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>i</mi>
<mi>q</mi>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>x</mi>
<mi>j</mi>
<mi>q</mi>
</msubsup>
<mo>)</mo>
</mrow>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>x</mi>
<mi>i</mi>
<mi>q</mi>
</msubsup>
<mo>-</mo>
<msubsup>
<mi>x</mi>
<mi>j</mi>
<mi>q</mi>
</msubsup>
<mo>)</mo>
</mrow>
<mo>&prime;</mo>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
其中q∈{s,t},代表来自源数据集或目标数据集中的样本,每一个样本对xi和xj之间的联系用亲和矩阵Ai,j权衡,亲和矩阵Ai,j是通过局部缩放来计算;当q=s时,即在源数据集中计算Sw和Sb,若xi和xj表示同一类即同一个行人的不同图片,取nc代表c类的样本数量,n代表所有类别的全部数量;反之,若xi和xj表示不同的行人,则
3.2:采用联合最大化源数据集和目标数据集的局部类内和类间距离的方式,提出如下近似的目标函数:
<mrow>
<munder>
<mi>max</mi>
<mrow>
<msub>
<mi>W</mi>
<mn>1</mn>
</msub>
<mo>,</mo>
<msub>
<mi>W</mi>
<mn>2</mn>
</msub>
</mrow>
</munder>
<mfrac>
<mrow>
<mi>t</mi>
<mi>r</mi>
<mrow>
<mo>(</mo>
<mo>(</mo>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mi>&gamma;</mi>
</mrow>
<mo>)</mo>
<msup>
<msub>
<mi>W</mi>
<mn>1</mn>
</msub>
<mo>&prime;</mo>
</msup>
<msubsup>
<mi>S</mi>
<mi>b</mi>
<mi>s</mi>
</msubsup>
<msub>
<mi>W</mi>
<mn>1</mn>
</msub>
<mo>+</mo>
<msup>
<msub>
<mi>&gamma;W</mi>
<mn>2</mn>
</msub>
<mo>&prime;</mo>
</msup>
<msubsup>
<mi>S</mi>
<mi>b</mi>
<mi>t</mi>
</msubsup>
<msub>
<mi>W</mi>
<mn>2</mn>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>t</mi>
<mi>r</mi>
<mrow>
<mo>(</mo>
<mo>(</mo>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mi>&gamma;</mi>
</mrow>
<mo>)</mo>
<msub>
<msup>
<mi>W</mi>
<mo>&prime;</mo>
</msup>
<mn>1</mn>
</msub>
<msubsup>
<mi>S</mi>
<mi>w</mi>
<mi>s</mi>
</msubsup>
<msub>
<mi>W</mi>
<mn>1</mn>
</msub>
<mo>+</mo>
<msup>
<msub>
<mi>&gamma;W</mi>
<mn>2</mn>
</msub>
<mo>&prime;</mo>
</msup>
<msubsup>
<mi>S</mi>
<mi>w</mi>
<mi>t</mi>
</msubsup>
<msub>
<mi>W</mi>
<mn>2</mn>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,W1=(1-β)W0+βWS,W2=(1-β)W0+βWt,0≤β≤1,WS是源数据集映射矩阵,Wt是目标数据集映射矩阵,W0是共享隐空间的映射矩阵;通过Fisher准则获得,W1=(1-β)W0+βWS是度量源数据集的可分性,W2=(1-β)W0+βWt是度量目标数据集的可分性;γ为控制目标任务的学习强度;
3.3:取W=[W0;Ws;Wt],Θs=[(1-β)Id,βId,Od*d],Θt=[(1-β)Id,Od*d,βId]替换公式(4)中相关变量,其中,Id是d×d维的单位矩阵,Od×d是d×d维的零矩阵;将公式(4)进行优化,得到如下形式:
<mrow>
<msup>
<mi>W</mi>
<mo>*</mo>
</msup>
<mo>=</mo>
<mi>arg</mi>
<munder>
<mi>max</mi>
<mi>W</mi>
</munder>
<mfrac>
<mrow>
<mi>t</mi>
<mi>r</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>W</mi>
<mo>&prime;</mo>
</msup>
<mi>A</mi>
<mi>W</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>t</mi>
<mi>r</mi>
<mrow>
<mo>(</mo>
<msup>
<mi>W</mi>
<mo>&prime;</mo>
</msup>
<mi>B</mi>
<mi>W</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,A用来度量局部类间距离,B是度量局部类内距离;本文中A和B都是半正定矩阵;
公式(5)通过常用的广义特征值分解来求解,如公式(6):
AW=λBW (6)
W的闭式解则由B-1A的N-1个最大广义特征值所对应的特征向量组成的矩阵;λ表示广义特征值,λ的个数等于N-1。
5.根据权利要求4所述的一种基于迁移学习的行人重识别方法,其特征在于:所述γ取0.75。
6.根据权利要求1所述的一种基于迁移学习的行人重识别方法,其特征在于:所述步骤4包括如下步骤:
4.1:将效开发利用有标签和无标签数据的流形结构的方法用于迁移学习中,作用于部分目标领域无标签数据上,其中是目标领域数据集无标签数据的样本数;通过最小化公式(7)来实现:
<mrow>
<msub>
<mi>g</mi>
<mi>m</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>W</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<msubsup>
<mi>n</mi>
<mi>t</mi>
<mi>u</mi>
</msubsup>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<msubsup>
<mi>n</mi>
<mi>t</mi>
<mi>u</mi>
</msubsup>
</munderover>
<msup>
<mrow>
<mo>&lsqb;</mo>
<mfrac>
<mn>1</mn>
<mi>K</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>k</mi>
</munderover>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>k</mi>
</mrow>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
</mrow>
<mn>2</mn>
</msup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,K是样本xi的近邻个数,xi,k是样本xi的第k个近邻,1≤k≤K;
4.2:采用任一种相似性度量方式来计算样本之间的相邻关系,W是公式(6)求得的初始模型;函数σ表示条件概率P(y=±1|x),指在给定样本x的情况下,求x属于类别y的概率;由逻辑回归分类模型求得,如公式(8)所示。
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>=</mo>
<mo>&PlusMinus;</mo>
<mn>1</mn>
<mo>|</mo>
<mi>x</mi>
<mo>;</mo>
<mi>W</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<mi>x</mi>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mn>1</mn>
<mo>+</mo>
<mi>exp</mi>
<mrow>
<mo>(</mo>
<mo>-</mo>
<mi>y</mi>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<mi>x</mi>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
7.根据权利要求1所述的一种基于迁移学习的行人重识别方法,其特征在于:所述步骤5包括如下步骤:对目标函数如公式(9)进行最终优化:
f(W)=WTW+αgm (9)
其中,α为正则化的平衡因子;为了解决该优化问题,首先对公式(9)中变量W进行求偏导,如公式(10)所示:
<mrow>
<mtable>
<mtr>
<mtd>
<mrow>
<msub>
<mo>&dtri;</mo>
<mi>W</mi>
</msub>
<mi>f</mi>
<mo>=</mo>
<mn>2</mn>
<mi>W</mi>
<mo>+</mo>
<mi>&alpha;</mi>
<msub>
<mo>&dtri;</mo>
<mi>W</mi>
</msub>
<msub>
<mi>g</mi>
<mi>m</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>=</mo>
<mn>2</mn>
<mi>W</mi>
<mo>+</mo>
<mi>&alpha;</mi>
<mfrac>
<mn>2</mn>
<msubsup>
<mi>n</mi>
<mi>t</mi>
<mi>u</mi>
</msubsup>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<msubsup>
<mi>n</mi>
<mi>t</mi>
<mi>u</mi>
</msubsup>
</munderover>
<mrow>
<mo>(</mo>
<mfrac>
<mn>1</mn>
<mi>K</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<mi>&sigma;</mi>
<mo>(</mo>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>k</mi>
</mrow>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
</mrow>
<mo>)</mo>
<mo>-</mo>
<mi>&sigma;</mi>
<mo>(</mo>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mo>&times;</mo>
<mrow>
<mo>(</mo>
<mfrac>
<mn>1</mn>
<mi>K</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>K</mi>
</munderover>
<mi>&sigma;</mi>
<mo>(</mo>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>k</mi>
</mrow>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
</mrow>
<mo>)</mo>
<mo>(</mo>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>k</mi>
</mrow>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mo>,</mo>
<mi>k</mi>
</mrow>
</msub>
<mo>-</mo>
<mi>&sigma;</mi>
<mo>(</mo>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
</mrow>
<mo>)</mo>
<mo>(</mo>
<mrow>
<mn>1</mn>
<mo>-</mo>
<mi>&sigma;</mi>
<mrow>
<mo>(</mo>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msup>
<mi>W</mi>
<mi>T</mi>
</msup>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
<msub>
<mo>|</mo>
<mn>1</mn>
</msub>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
<mo>)</mo>
<msub>
<mi>x</mi>
<mi>i</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>10</mn>
<mo>)</mo>
</mrow>
</mrow>
由于目标函数f不是凸函数,但给定了初始分类器W1,所以用非线性数值优化方法得到局部最优解,且这个解是优于由公式(6)所求得的初始值;算法如下所示:
输入:初始分类器W=W1,近邻个数K,参数α,误差阈值ε;
输出:精化后的分类器W;
步骤5.1:计算偏导数▽Wf(W1),▽Wf(W1)=2W1+α▽Wgm(W1);如果||▽Wf(W1)||<ε,
转到步骤5.7,否则计算初始的搜索方向d0,d0=-▽Wf(W1);
步骤5.2:t=0;
步骤5.3:求第t次迭代的最佳步长λt,由精确一维搜索,最小化式:
f(Wt+λtdt)=minλf(Wt+λdt);
步骤5.4:得到t次迭代的最佳步长λt后,计算第t+1次的分类器
Wt+1=Wt+λtdt;
步骤5.5:计算偏导数▽Wf(Wt+1);如果||▽Wf(Wt+1)||<ε,转到步骤5.7,否则计算第t+1次的搜索方向dt+1,dt+1=-▽wf(Wt+1)+μtdt,其中μt由PRP公式计算得到,
<mrow>
<msub>
<mi>&mu;</mi>
<mi>t</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mo>&dtri;</mo>
<mi>W</mi>
</msub>
<mi>f</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>W</mi>
<mrow>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
<mo>&lsqb;</mo>
<msub>
<mo>&dtri;</mo>
<mi>W</mi>
</msub>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>W</mi>
<mrow>
<mi>t</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<msub>
<mo>&dtri;</mo>
<mi>W</mi>
</msub>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>W</mi>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
</mrow>
<mrow>
<msub>
<mo>&dtri;</mo>
<mi>W</mi>
</msub>
<mi>f</mi>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>W</mi>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mi>T</mi>
</msup>
<msub>
<mo>&dtri;</mo>
<mi>W</mi>
</msub>
<mi>f</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>W</mi>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
步骤5.6:t=t+1,转步骤5.3;
步骤5.7:返回精后化的分类器W。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711112527.3A CN107832711A (zh) | 2017-11-13 | 2017-11-13 | 一种基于迁移学习的行人重识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711112527.3A CN107832711A (zh) | 2017-11-13 | 2017-11-13 | 一种基于迁移学习的行人重识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107832711A true CN107832711A (zh) | 2018-03-23 |
Family
ID=61655115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711112527.3A Pending CN107832711A (zh) | 2017-11-13 | 2017-11-13 | 一种基于迁移学习的行人重识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107832711A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108520517A (zh) * | 2018-04-10 | 2018-09-11 | 四川超影科技有限公司 | 基于机器视觉的漏液检测方法 |
CN108764915A (zh) * | 2018-04-26 | 2018-11-06 | 阿里巴巴集团控股有限公司 | 模型训练方法、数据类型识别方法和计算机设备 |
CN108764269A (zh) * | 2018-04-03 | 2018-11-06 | 华南理工大学 | 一种基于时空约束增量学习的跨数据集行人再识别方法 |
CN109034218A (zh) * | 2018-07-11 | 2018-12-18 | 东软集团股份有限公司 | 模型训练方法、装置、设备及存储介质 |
CN109446898A (zh) * | 2018-09-20 | 2019-03-08 | 暨南大学 | 一种基于迁移学习和特征融合的行人重识别方法 |
CN110135295A (zh) * | 2019-04-29 | 2019-08-16 | 华南理工大学 | 一种基于迁移学习的无监督行人重识别方法 |
CN110210335A (zh) * | 2019-05-16 | 2019-09-06 | 上海工程技术大学 | 一种行人重识别学习模型的训练方法、系统和装置 |
CN110222589A (zh) * | 2019-05-16 | 2019-09-10 | 五邑大学 | 一种行人再识别方法及其系统、装置、存储介质 |
CN110309810A (zh) * | 2019-07-10 | 2019-10-08 | 华中科技大学 | 一种基于批次中心相似度的行人重识别方法 |
CN110569727A (zh) * | 2019-08-06 | 2019-12-13 | 华南理工大学 | 基于运动想象分类的结合类内距和类间距的迁移学习方法 |
CN110598636A (zh) * | 2019-09-09 | 2019-12-20 | 哈尔滨工业大学 | 一种基于特征迁移的舰船目标识别方法 |
CN110858326A (zh) * | 2018-08-15 | 2020-03-03 | 第四范式(北京)技术有限公司 | 模型训练及获取附加特征数据的方法、装置、设备及介质 |
CN111062272A (zh) * | 2019-11-29 | 2020-04-24 | 南京甄视智能科技有限公司 | 基于色彩恢复的图像处理、行人识别方法、装置与可读存储介质 |
CN111444958A (zh) * | 2020-03-25 | 2020-07-24 | 北京百度网讯科技有限公司 | 一种模型迁移训练方法、装置、设备及存储介质 |
CN111488840A (zh) * | 2020-04-15 | 2020-08-04 | 桂林电子科技大学 | 一种基于多任务学习模型的人体行为分类方法 |
CN111553429A (zh) * | 2020-04-30 | 2020-08-18 | 中国银行股份有限公司 | 指纹识别模型迁移方法、装置及系统 |
CN112084881A (zh) * | 2020-08-18 | 2020-12-15 | 桂林电子科技大学 | 一种跨域行人再识别方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101398898A (zh) * | 2008-10-20 | 2009-04-01 | 中国科学院合肥物质科学研究院 | 基于流形学习的植物叶片识别方法 |
CN106709449A (zh) * | 2016-12-22 | 2017-05-24 | 深圳市深网视界科技有限公司 | 一种基于深度学习和强化学习的行人重识别方法及系统 |
CN107341687A (zh) * | 2017-06-01 | 2017-11-10 | 华南理工大学 | 一种基于多维标签与分类排序的推荐算法 |
-
2017
- 2017-11-13 CN CN201711112527.3A patent/CN107832711A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101398898A (zh) * | 2008-10-20 | 2009-04-01 | 中国科学院合肥物质科学研究院 | 基于流形学习的植物叶片识别方法 |
CN106709449A (zh) * | 2016-12-22 | 2017-05-24 | 深圳市深网视界科技有限公司 | 一种基于深度学习和强化学习的行人重识别方法及系统 |
CN107341687A (zh) * | 2017-06-01 | 2017-11-10 | 华南理工大学 | 一种基于多维标签与分类排序的推荐算法 |
Non-Patent Citations (6)
Title |
---|
SERGIO VELASTIN等: "Local Fisher Discriminant Analysis for Pedestrian Re-identification", 《2013 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
XIANG LI等: "Multi-scale Learning for Low-resolution Person Re-identification", 《2015 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 * |
XIAOJUAN WANG等: "Cross-Scenario Transfer Person Reidentification", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 * |
丁宗元等: "基于距离中心化与投影向量学习的行人重识别", 《计算机研究与发展》 * |
左信等: "非凸共轭梯度p范数正则化SVM分类算法", 《广西师范大学学报:自然科学版》 * |
郭宝龙,孙伟主编: "《数字图像处理系统工程导论》", 31 July 2012, 西安:西安电子科技大学出版社 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764269A (zh) * | 2018-04-03 | 2018-11-06 | 华南理工大学 | 一种基于时空约束增量学习的跨数据集行人再识别方法 |
CN108520517A (zh) * | 2018-04-10 | 2018-09-11 | 四川超影科技有限公司 | 基于机器视觉的漏液检测方法 |
CN108764915A (zh) * | 2018-04-26 | 2018-11-06 | 阿里巴巴集团控股有限公司 | 模型训练方法、数据类型识别方法和计算机设备 |
CN108764915B (zh) * | 2018-04-26 | 2021-07-30 | 创新先进技术有限公司 | 模型训练方法、数据类型识别方法和计算机设备 |
CN109034218A (zh) * | 2018-07-11 | 2018-12-18 | 东软集团股份有限公司 | 模型训练方法、装置、设备及存储介质 |
CN110858326A (zh) * | 2018-08-15 | 2020-03-03 | 第四范式(北京)技术有限公司 | 模型训练及获取附加特征数据的方法、装置、设备及介质 |
CN109446898A (zh) * | 2018-09-20 | 2019-03-08 | 暨南大学 | 一种基于迁移学习和特征融合的行人重识别方法 |
CN109446898B (zh) * | 2018-09-20 | 2021-10-15 | 暨南大学 | 一种基于迁移学习和特征融合的行人重识别方法 |
CN110135295A (zh) * | 2019-04-29 | 2019-08-16 | 华南理工大学 | 一种基于迁移学习的无监督行人重识别方法 |
CN110210335A (zh) * | 2019-05-16 | 2019-09-06 | 上海工程技术大学 | 一种行人重识别学习模型的训练方法、系统和装置 |
CN110210335B (zh) * | 2019-05-16 | 2021-05-11 | 上海工程技术大学 | 一种行人重识别学习模型的训练方法、系统和装置 |
CN110222589A (zh) * | 2019-05-16 | 2019-09-10 | 五邑大学 | 一种行人再识别方法及其系统、装置、存储介质 |
CN110309810A (zh) * | 2019-07-10 | 2019-10-08 | 华中科技大学 | 一种基于批次中心相似度的行人重识别方法 |
CN110309810B (zh) * | 2019-07-10 | 2021-08-17 | 华中科技大学 | 一种基于批次中心相似度的行人重识别方法 |
CN110569727B (zh) * | 2019-08-06 | 2022-03-29 | 华南理工大学 | 用于运动想象分类的结合类内距和类间距的迁移学习方法 |
CN110569727A (zh) * | 2019-08-06 | 2019-12-13 | 华南理工大学 | 基于运动想象分类的结合类内距和类间距的迁移学习方法 |
CN110598636A (zh) * | 2019-09-09 | 2019-12-20 | 哈尔滨工业大学 | 一种基于特征迁移的舰船目标识别方法 |
CN110598636B (zh) * | 2019-09-09 | 2023-01-17 | 哈尔滨工业大学 | 一种基于特征迁移的舰船目标识别方法 |
CN111062272A (zh) * | 2019-11-29 | 2020-04-24 | 南京甄视智能科技有限公司 | 基于色彩恢复的图像处理、行人识别方法、装置与可读存储介质 |
CN111444958A (zh) * | 2020-03-25 | 2020-07-24 | 北京百度网讯科技有限公司 | 一种模型迁移训练方法、装置、设备及存储介质 |
CN111444958B (zh) * | 2020-03-25 | 2024-02-13 | 北京百度网讯科技有限公司 | 一种模型迁移训练方法、装置、设备及存储介质 |
CN111488840A (zh) * | 2020-04-15 | 2020-08-04 | 桂林电子科技大学 | 一种基于多任务学习模型的人体行为分类方法 |
CN111553429B (zh) * | 2020-04-30 | 2023-11-03 | 中国银行股份有限公司 | 指纹识别模型迁移方法、装置及系统 |
CN111553429A (zh) * | 2020-04-30 | 2020-08-18 | 中国银行股份有限公司 | 指纹识别模型迁移方法、装置及系统 |
CN112084881B (zh) * | 2020-08-18 | 2022-04-19 | 桂林电子科技大学 | 一种跨域行人再识别方法、装置及存储介质 |
CN112084881A (zh) * | 2020-08-18 | 2020-12-15 | 桂林电子科技大学 | 一种跨域行人再识别方法、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107832711A (zh) | 一种基于迁移学习的行人重识别方法 | |
US20200285896A1 (en) | Method for person re-identification based on deep model with multi-loss fusion training strategy | |
Oh et al. | Approaching the computational color constancy as a classification problem through deep learning | |
Singh et al. | A deeply coupled ConvNet for human activity recognition using dynamic and RGB images | |
CN106295601B (zh) | 一种改进的安全带检测方法 | |
CN105844292B (zh) | 一种基于条件随机场和二次字典学习的图像场景标注方法 | |
Ling et al. | Improving person re-identification by multi-task learning | |
CN110363122A (zh) | 一种基于多层特征对齐的跨域目标检测方法 | |
CN106951867A (zh) | 基于卷积神经网络的人脸识别方法、装置、系统及设备 | |
CN108416370A (zh) | 基于半监督深度学习的图像分类方法、装置和存储介质 | |
CN106991382A (zh) | 一种遥感场景分类方法 | |
CN106529499A (zh) | 基于傅里叶描述子和步态能量图融合特征的步态识别方法 | |
CN104850865A (zh) | 一种多特征迁移学习的实时压缩跟踪方法 | |
CN109902573A (zh) | 面向矿井下视频监控的多摄像机无标注行人重识别方法 | |
CN111832511A (zh) | 一种增强样本数据的无监督行人重识别方法 | |
Aditya et al. | Batik classification using neural network with gray level co-occurence matrix and statistical color feature extraction | |
CN110633708A (zh) | 一种基于全局模型和局部优化的深度网络显著性检测方法 | |
CN108564121A (zh) | 一种基于自编码器的未知类别图像标签预测方法 | |
CN110555060A (zh) | 基于成对样本匹配的迁移学习方法 | |
CN108681696A (zh) | 融合多特征降维和迁移学习的红外目标稳健性识别方法 | |
CN107220598A (zh) | 基于深度学习特征和Fisher Vector编码模型的虹膜图像分类方法 | |
CN108416270A (zh) | 一种基于多属性联合特征的交通标志识别方法 | |
CN111126464A (zh) | 一种基于无监督域对抗领域适应的图像分类方法 | |
CN110458022A (zh) | 一种基于域适应的可自主学习目标检测方法 | |
CN109753962A (zh) | 基于混合网络的自然场景图像中文本区域的处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180323 |
|
WD01 | Invention patent application deemed withdrawn after publication |