CN103500345A - 一种基于距离度量学习行人重验证的方法 - Google Patents
一种基于距离度量学习行人重验证的方法 Download PDFInfo
- Publication number
- CN103500345A CN103500345A CN201310461132.XA CN201310461132A CN103500345A CN 103500345 A CN103500345 A CN 103500345A CN 201310461132 A CN201310461132 A CN 201310461132A CN 103500345 A CN103500345 A CN 103500345A
- Authority
- CN
- China
- Prior art keywords
- phi
- sigma
- lambda
- formula
- beta
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开一种基于距离度量学习行人重验证的方法,包括以下步骤:步骤1:构造基本距离度量模型;步骤2:对基本距离度量模型进行光滑正则化。本发明通过采用新设计的光滑正则化距离度量模型进行行人重验证,充分考虑了模型中协方差矩阵估计偏差问题。具有不需要复杂的优化迭代过程,训练时间短,在训练样本少的情况下,能有效改善距离度量模型的匹配性能,提升用户体验等优点。
Description
技术领域
本发明涉及一种模式识别与人工智能技术,特别涉及一种基于距离度量学习行人重验证的方法。
背景技术
随着智能监控(intelligent video surveillance,IVS)的兴起,行人重验证(person re-identification)作为检索问题重要的应用引起了越来越多的关注。简单说,行人重验证的目的从当前摄像机A中检测到的行人作为检索数据,在其他摄像机A的记录数据中寻找同一个人。由于不同摄像机检测到的行人的姿态以及当时的拍摄环境的复杂性,我们很难直接正确返回正确匹配,因此分类问题并不适用于这里。退而求其次,我们希望正确匹配的结果尽量靠前,因此前n(这个n越小越好)排序匹配率是行人重验证系统的技术指标。
通常来说完整的行人重验证系统的工作过程通常包括以下几步:1)利用行人检测的方法,收集多个行人不同拍摄位置、光照条件下的样本数据;2)从每个样本中提取纹理特征和颜色直方图特征;3)将所有特征描述子连接在一起后降维,从而获得每个样本的低维表达;4)训练能够判断两个样本是否为同一个人的距离度量模型;5)对新收集的行人不同拍摄位置、光照条件下的样本数据,利用学习好的距离度量模型判断哪些样本为同一个人。
然而常用的距离度量学习模型对训练样本数量比较敏感,在手工标注样本较少的情况下,行人重验证系统工作性能下降,为了获得系统性能,不得不大量手工标注样本,这使得行人重验证系统开发成本大量增加。另外许多距离度量模型的求解过程是一个复杂的优化迭代过程,因此训练时间较长。因此,从工程的角度出发,需要寻找一个需要少量训练样本,并且算法实现简单的距离度量模型是非常必要的。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于距离度量学习行人重验证的方法,该方法只需要少量人工标注样本的基于距离度量学习的简单算法就可以实现行人重验证方法。
本发明的目的通过下述技术方案实现:一种基于距离度量学习行人重验证的方法,具体实现方式:
1)利用行人检测的方法,收集多个行人不同拍摄位置、光照条件下的样本数据,这里行人类别数目为p;
2)从每个样本中提取纹理特征和颜色直方图特征;
3)将所有特征描述子连接在一起后执行PCA,从而获得每个样本的低维表达;
4)训练能够判断两个样本是否为同一个人的光滑正则化距离度量模型;
具体包括以下步骤:
步骤1:构造基本距离度量模型:
假设给定一特征向量对xi和xj,H0代表特征向量对是不相似的(xi和xj是不同的人),H1代表特征向量对是相似的(xi和xj是同一个人),两者的概率的比的对数为:
从分类的角度来说,δ(xi,xj)是正值则代表xi和xj是不同的人,而负值则代表相同的人,我们用xij=xi-xj来代表特征向量对的差,因此可得:
δ(xij)=log(p(H0|xij)/p(H1|xij)), (2)
上式可以写为:
δ(xij)=log(f(xij|H0)/f(xij|H1))+log(p(H0)/p(H1)), (3)
其中,f(xij|H0)和f(xij|H1)分别是在假设H0和H1下xij的概率密度函数,即f(xij|H0)是相似的特征向量对的差异的概率密度函数,而f(xij|H1)是不相似的特征向量对的差异的概率密度函数,由于xij的均值是0,通常假设xij服从高斯分布,所以,可得:
其中,k∈{0,1},d是特征向量的维数,Σk是xij的协方差矩阵。
式(4)和式(3)可以简化为:
去掉常数项,可得:
定义yij为xi和xj的示性变量:如果xi和xj是相同的人,则yij=1,否则yij=0。N0代表相似特征向量对的数量,N1代表不相似特征向量的数量,协方差矩阵的估计为:
令
步骤2:对基本距离度量模型进行光滑正则化:
式(6)中的协方差矩阵的估计对于身份再识别系统的鲁棒性来说是至关重要的。众所周知,协方差矩阵的估计总是有偏差的。由于训练样本的规模有限,真实协方差矩阵的大特征值会被高估,与此同时小的特征值会被低估。
在统计学中,有很多方法可以获得鲁棒性的估计。因此引入平滑技术和正则化技术来改善基本距离度量模型中的协方差矩阵的估计,平滑技术可以增大对协方差矩阵的小特征值的估计,而正则化可以减小被高估的大特征值的影响。通过将他们无缝地结合起来,我们可以改善用于身份再识别距离度量模型的性能。
首先,我们对协方差矩阵Σi进行对角化
这里,Λi=diag[λi1,λi2,…,λid],λij是Σi的特征值,Φi=[φi1,φi2,…,φid],φij是Σi的特征向量。
将式(9)代入式(6)中可得:
根据平滑技术,我们首先将协方差矩阵中小的特征值用一个小的常数βi来代替,然后可得:
这里,βi是所有小特征值的平均值:
因此,式(10)可以写成:
根据正则化技术,协方差矩阵式(9)用一个单位矩阵进行修改,
将式(11)代入式(15)可得:
定义:
在式(10)中用代替Σi,得到:
将式(17)代入式(18)可得:
式(19)是对于给定的查询目标xi,直接根据δ(xij)得出的排名参考图像xj进行匹配或者检索,δ(xij)的值越小的相应参考图像排得越前。
5)对新收集p'个行人的不同拍摄位置、光照条件下的样本数据,利用学习好的光滑正则化距离度量模型判断哪些样本为同一个人。
本发明相对于现有技术具有如下的优点及效果:
1、本发明一种基于距离度量学习行人重验证的方法,通过采用新设计的光滑正则化距离度量模型进行行人重验证,充分考虑了模型中协方差矩阵估计偏差问题。这样设计与传统的方法比较,不需要复杂的优化迭代过程,因此训练时间短。
2、在训练样本少的情况下,能够有效改善以往的距离度量模型的匹配性能,提升用户体验。
3、本发明可以用少量的样本获得不错的识别率,因此有效的减少了训练和测试过程中的存储成本。
附图说明
图1是本发明实施例的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
下面结合附图1对本发明做进一步的说明,如图1所示,一种基于距离度量学习行人重验证的方法,具体实施步骤如下:
步骤1:利用行人检测的方法,收集多个行人不同拍摄位置、光照条件下的数据,这里行人类别数目为p;
步骤2:从每张图中以8×8的间隔,8×16的重叠块中提取以下纹理特征和颜色直方图特征;LBP描述子、HSV直方图和LBP特征。所有的特征描述子都被连接在一起;然后用PCA来获得一个低维的表达,从而加快学习过程同时减低信号噪声。
步骤3:将所有特征描述子连接在一起后执行PCA,保留64维特征,从而获得每个样本的低维表达;
步骤4:训练能够判断两个样本是否为同一个人的光滑正则化距离度量模型;
具体包括以下步骤:
步骤4.1:构造基本距离度量模型:
假设给定一特征向量对xi和xj,H0代表特征向量对是不相似的(xi和xj是不同的人),H1代表特征向量对是相似的(xi和xj是同一个人)。两者的概率的比的对数为:
从分类的角度来说,δ(xi,xj)是正值则代表xi和xj是不同的人,而负值则代表相同的人。我们用xij=xi-xj来代表特征向量对的差,因此可得:
δ(xij)=log(p(H0|xij)/p(H1|xij)), (21)
上式可以写为:
δ(xij)=log(f(xij|H0)/f(xij|H1))+log(p(H0)/p(H1)), (22)
其中,f(xij|H0)和f(xij|H1)分别是在假设H0和H1下xij的概率密度函数,即f(xij|H0)是相似的特征向量对的差异的概率密度函数,而f(xij|H1)是不相似的特征向量对的差异的概率密度函数。由于xij的均值是0,通常假设xij服从高斯分布。所以,可得:
其中,k∈{0,1},d是特征向量的维数,Σk是xij的协方差矩阵。
式子(4)和(3)可以简化为:
去掉常数项,可得:
定义yij为xi和xj的示性变量:如果xi和xj是相同的人,则yij=1,否则yij=0。N0代表相似特征向量对的数量,N1代表不相似特征向量的数量。协方差矩阵的估计为:
令
步骤4.2:对基本距离度量模型进行光滑正则化:
式子(6)中的协方差矩阵的估计对于身份再识别系统的鲁棒性来说是至关重要的。众所周知,协方差矩阵的估计总是有偏差的。由于训练样本的规模有限,真实协方差矩阵的大特征值会被高估,与此同时小的特征值会被低估。
在统计学中,有很多方法可以获得鲁棒性的估计。因此引入平滑技术和正则化技术来改善基本距离度量模型中的协方差矩阵的估计,平滑技术可以增大对协方差矩阵的小特征值的估计,而正则化可以减小被高估的大特征值的影响。通过将他们无缝地结合起来,我们可以改善用于身份再识别距离度量模型的性能。
首先,我们对协方差矩阵Σi进行对角化
这里,Λi=diag[λi1,λi2,…,λid],λij是Σi的特征值,Φi=[φi1,φi2,…,φid],φij是Σi的特征向量。
将(9)代入(6)中可得:
根据平滑技术,我们首先将协方差矩阵中小的特征值用一个小的常数βi来代替,然后可得:
这里,βi是所有小特征值的平均值:
因此,(10)可以写成:
根据正则化技术,协方差矩阵(9)用一个单位矩阵进行修改,
式中,αi=(1/d)tr(Σi),0<γ<1。参数γ可以令趋向单位矩阵,从而改善实际应用中的预测性能。
将(11)代入(15)可得:
定义
将(17)代入(18)可得:
(19)是对于给定的查询目标xi,直接根据δ(xij)得出的排名参考图像xj进行匹配或者检索。δ(xij)的值越小的相应参考图像排得越前。
步骤5:将新收集的行人不同拍摄位置、光照条件下的样本数据,这些数据来自于不同的摄像机,比如编号为A,A1,...,A2,然后利用学习好的光滑正则化距离度量模型判断编号A摄像机出现的行人,与A1,...,A2中收集的哪个样本是同一个人。
为了进一步说明实施例的效果,我们利用公开的ETHZ数据集进行了行人重验证试验。该数据集中包含了从146个人身上获得的8,555张图像。ETHZ数据集对于每个对象的图像样本数较多。样本中包括有视觉、姿势、拍摄位置、光照条件和图像质量等方面的细小变化。实验中,我们将p=76个对象的所有样本图像都用来组成训练集,剩余的p'=70个对象的样本则作为测试集。并重复10次以上过程。另外与常见的LMNN距离度量学习模型进行试验结果对比。
排序匹配率是行人重验证的重要指标,是指返回的前n个结果,正确结果出现的概率。表1排序匹配率是通过10次实验获得的,以评估行人重验证方法的效果。鉴于该问题的复杂性,前n个排序匹配率(n是一个尽量小的数)也纳入考虑范围。
表1对光滑正则化距离度量学习与LMNN距离度量学习的实验结果进行了比较,可以看出光滑正则化距离度量学习有明显的优势。
表1为光滑正则化距离学习与LMNN距离度量学习的在ETHZ数据集上的实验结果:
表1
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (3)
1.一种基于距离度量学习行人重验证的方法,包括以下步骤:
1)利用行人检测的方法,收集多个行人不同拍摄位置、光照条件下的样本数据,设置行人类别数目为p;
2)从每个样本中提取纹理特征和颜色直方图特征;
3)将所有特征描述子连接在一起后执行PCA,从而获得每个样本的低维表达;
4)训练能够判断两个样本是否为同一个人的光滑正则化距离度量模型;
5)对新收集p'个行人的不同拍摄位置、光照条件下的样本数据,利用学习好的光滑正则化距离度量模型判断哪些样本为同一个人;
其特征在于,所述步骤4)中,训练光滑正则化距离度量模型的实现方式,包括以下步骤:
步骤1:构造基本距离度量模型;
步骤2:对基本距离度量模型进行光滑正则化。
2.根据权利要求1所述的基于距离度量学习行人重验证的方法,其特征在于,所述步骤1包括以下步骤:
步骤Ⅰ、假设给定一特征向量对xi和xj代表两个样本,H1代表特征向量对相似,即:xi和xj是同一个人,H0代表特征向量对不相似,即:xi和xj是不同的人,H1和H0的概率的比的对数为:
从分类的角度进行分析,δ(xi,xj)是正值则代表xi和xj是不同的人,而负值则代表相同的人,用xij=xi-xj来代表特征向量对的差,因此得到:
δ(xij)=log(p(H0|xij)/p(H1|xij)), (40)
上式写为:
δ(xij)=log(f(xij|H0)/f(xij|H1))+log(p(H0)/p(H1)), (41)
其中,f(xij|H0)和f(xij|H1)分别是在假设H0和H1下xij的概率密度函数,即:f(xij|H0)是相似的特征向量对的差异的概率密度函数,而f(xij|H1)是不相似的特征向量对的差异的概率密度函数,由于xij的均值是0,假设xij服从高斯分布,得到:
其中,k∈{0,1},d是特征向量的维数,Σk是xij的协方差矩阵;
式(4)和式(3)简化为:
去掉常数项,得到:
步骤Ⅱ、定义yij为xi和xj的示性变量:如果xi和xj是相同的人,则:yij=1,否则,yij=0;N0代表相似特征向量对的数量,N1代表不相似特征向量的数量,协方差矩阵的估计为:
令
其中,M作为距离度量矩阵,xij=xi-xj来代表特征向量对的差。
3.根据权利要求1所述的基于距离度量学习行人重验证的方法,其特征在于,所述步骤2包括以下步骤:
步骤ⅰ、对协方差矩阵Σi进行对角化:
式中,Λi=diag[λi1,λi2,…,λid],λij是Σi的特征值,Φi=[φi1,φi2,…,φid],φij是Σi的特征向量;
将式(9)代入式(6)中得到:
步骤ⅱ、将协方差矩阵中小的特征值用一个常数βi代替,得到:
式中,βi是所有小特征值的平均值:
因此,式(10)写成:
根据正则化技术,协方差矩阵式(9)用一个单位矩阵进行修改:
式中,αi=(1/d)tr(Σi),参数γ的取值范围为:0<γ<1;
步骤ⅲ、将式(11)代入式(15)得到:
定义:
将(17)代入(18)得到:
式(19)是对于给定的查询目标xi,直接根据δ(xij)得出的排名参考图像xj进行匹配或者检索。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310461132.XA CN103500345A (zh) | 2013-09-29 | 2013-09-29 | 一种基于距离度量学习行人重验证的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310461132.XA CN103500345A (zh) | 2013-09-29 | 2013-09-29 | 一种基于距离度量学习行人重验证的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103500345A true CN103500345A (zh) | 2014-01-08 |
Family
ID=49865550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310461132.XA Pending CN103500345A (zh) | 2013-09-29 | 2013-09-29 | 一种基于距离度量学习行人重验证的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103500345A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105138998A (zh) * | 2015-09-07 | 2015-12-09 | 上海交通大学 | 基于视角自适应子空间学习算法的行人重识别方法及系统 |
US9373036B1 (en) | 2015-01-16 | 2016-06-21 | Toyota Motor Engineering & Manufacturing North America, Inc. | Collaborative distance metric learning for method and apparatus visual tracking |
CN105989369A (zh) * | 2015-02-15 | 2016-10-05 | 中国科学院西安光学精密机械研究所 | 基于度量学习的行人再识别方法 |
CN106202329A (zh) * | 2016-07-01 | 2016-12-07 | 北京市商汤科技开发有限公司 | 样本数据处理、数据识别方法和装置、计算机设备 |
CN103793702B (zh) * | 2014-02-28 | 2017-02-01 | 武汉大学 | 基于协同尺度学习的行人重识别方法 |
CN107122755A (zh) * | 2017-05-09 | 2017-09-01 | 四川大学 | 行人相似度计算方法及装置 |
CN107145826A (zh) * | 2017-04-01 | 2017-09-08 | 浙江大学 | 基于双约束度量学习和样本重排序的行人再识别方法 |
CN108875765A (zh) * | 2017-11-14 | 2018-11-23 | 北京旷视科技有限公司 | 扩充数据集的方法、装置、设备及计算机存储介质 |
CN109034109A (zh) * | 2018-08-16 | 2018-12-18 | 新智数字科技有限公司 | 一种基于聚类算法的行人重识别方法和装置 |
CN109859204A (zh) * | 2019-02-22 | 2019-06-07 | 厦门美图之家科技有限公司 | 卷积神经网络模型检验方法及装置 |
US12008078B2 (en) | 2020-09-22 | 2024-06-11 | Grazper Technologies ApS | Concept for anonymous re-identification |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103207993A (zh) * | 2013-04-10 | 2013-07-17 | 浙江工业大学 | 基于核的判别随机近邻嵌入分析的人脸识别方法 |
-
2013
- 2013-09-29 CN CN201310461132.XA patent/CN103500345A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103207993A (zh) * | 2013-04-10 | 2013-07-17 | 浙江工业大学 | 基于核的判别随机近邻嵌入分析的人脸识别方法 |
Non-Patent Citations (2)
Title |
---|
DAPENG TAO,ET AL.: "Person Re-Identification by Regularized Smoothing KISS Metric Learning", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 * |
ZHAO YANG,ET AL.: "A Comparative Study of Several Feature Extraction Methods for Person Re-identification", 《7TH CHINESE CONFERENCE,CCBR 2012 PROCEEDINGS》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103793702B (zh) * | 2014-02-28 | 2017-02-01 | 武汉大学 | 基于协同尺度学习的行人重识别方法 |
US9373036B1 (en) | 2015-01-16 | 2016-06-21 | Toyota Motor Engineering & Manufacturing North America, Inc. | Collaborative distance metric learning for method and apparatus visual tracking |
CN105989369A (zh) * | 2015-02-15 | 2016-10-05 | 中国科学院西安光学精密机械研究所 | 基于度量学习的行人再识别方法 |
CN105989369B (zh) * | 2015-02-15 | 2020-07-31 | 中国科学院西安光学精密机械研究所 | 基于度量学习的行人再识别方法 |
CN105138998B (zh) * | 2015-09-07 | 2019-01-11 | 上海交通大学 | 基于视角自适应子空间学习算法的行人重识别方法及系统 |
CN105138998A (zh) * | 2015-09-07 | 2015-12-09 | 上海交通大学 | 基于视角自适应子空间学习算法的行人重识别方法及系统 |
CN106202329A (zh) * | 2016-07-01 | 2016-12-07 | 北京市商汤科技开发有限公司 | 样本数据处理、数据识别方法和装置、计算机设备 |
CN107145826A (zh) * | 2017-04-01 | 2017-09-08 | 浙江大学 | 基于双约束度量学习和样本重排序的行人再识别方法 |
CN107145826B (zh) * | 2017-04-01 | 2020-05-08 | 浙江大学 | 基于双约束度量学习和样本重排序的行人再识别方法 |
CN107122755A (zh) * | 2017-05-09 | 2017-09-01 | 四川大学 | 行人相似度计算方法及装置 |
CN108875765A (zh) * | 2017-11-14 | 2018-11-23 | 北京旷视科技有限公司 | 扩充数据集的方法、装置、设备及计算机存储介质 |
CN109034109A (zh) * | 2018-08-16 | 2018-12-18 | 新智数字科技有限公司 | 一种基于聚类算法的行人重识别方法和装置 |
CN109034109B (zh) * | 2018-08-16 | 2021-03-23 | 新智数字科技有限公司 | 一种基于聚类算法的行人重识别方法和装置 |
CN109859204A (zh) * | 2019-02-22 | 2019-06-07 | 厦门美图之家科技有限公司 | 卷积神经网络模型检验方法及装置 |
US12008078B2 (en) | 2020-09-22 | 2024-06-11 | Grazper Technologies ApS | Concept for anonymous re-identification |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103500345A (zh) | 一种基于距离度量学习行人重验证的方法 | |
Xiong et al. | Spatiotemporal modeling for crowd counting in videos | |
Hur et al. | Multi-lane detection in urban driving environments using conditional random fields | |
Kwak et al. | Learning occlusion with likelihoods for visual tracking | |
Mei et al. | Robust multitask multiview tracking in videos | |
Chen et al. | Robust feature matching with alternate hough and inverted hough transforms | |
CN104851094A (zh) | 一种基于rgb-d的slam算法的改进方法 | |
Ma et al. | Robust feature matching via neighborhood manifold representation consensus | |
Wang et al. | Detection based visual tracking with convolutional neural network | |
ElMikaty et al. | Detection of cars in high-resolution aerial images of complex urban environments | |
Jiang et al. | Robust image matching via local graph structure consensus | |
Ye et al. | A two-stage real-time YOLOv2-based road marking detector with lightweight spatial transformation-invariant classification | |
CN103325122A (zh) | 基于双向排序的行人检索方法 | |
Zhang et al. | Weakly supervised human fixations prediction | |
Moranduzzo et al. | A fast object detector based on high-order gradients and Gaussian process regression for UAV images | |
Deng et al. | ReDFeat: Recoupling detection and description for multimodal feature learning | |
An et al. | Hypergraph propagation and community selection for objects retrieval | |
Elmikaty et al. | Car detection in aerial images of dense urban areas | |
Cheng et al. | Object tracking via collaborative multi-task learning and appearance model updating | |
CN104036528A (zh) | 一种基于全局搜索的实时分布场目标跟踪方法 | |
Jain et al. | Learning what and how of contextual models for scene labeling | |
Wu et al. | Prior-based vanishing point estimation through global perspective structure matching | |
Chen et al. | Multi-gait identification based on multilinear analysis and multi-target tracking | |
Yang et al. | Robust visual tracking using adaptive local appearance model for smart transportation | |
Tian et al. | Discriminative and semantic feature selection for place recognition towards dynamic environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140108 |