CN103500345A

CN103500345A - 一种基于距离度量学习行人重验证的方法

Info

Publication number: CN103500345A
Application number: CN201310461132.XA
Authority: CN
Inventors: 陶大鹏; 金连文; 王永飞
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2013-09-29
Filing date: 2013-09-29
Publication date: 2014-01-08

Abstract

本发明公开一种基于距离度量学习行人重验证的方法，包括以下步骤：步骤1：构造基本距离度量模型；步骤2：对基本距离度量模型进行光滑正则化。本发明通过采用新设计的光滑正则化距离度量模型进行行人重验证，充分考虑了模型中协方差矩阵估计偏差问题。具有不需要复杂的优化迭代过程，训练时间短，在训练样本少的情况下，能有效改善距离度量模型的匹配性能，提升用户体验等优点。

Description

一种基于距离度量学习行人重验证的方法

技术领域

本发明涉及一种模式识别与人工智能技术，特别涉及一种基于距离度量学习行人重验证的方法。

背景技术

随着智能监控（intelligent video surveillance，IVS）的兴起，行人重验证（person re-identification）作为检索问题重要的应用引起了越来越多的关注。简单说，行人重验证的目的从当前摄像机A中检测到的行人作为检索数据，在其他摄像机A的记录数据中寻找同一个人。由于不同摄像机检测到的行人的姿态以及当时的拍摄环境的复杂性，我们很难直接正确返回正确匹配，因此分类问题并不适用于这里。退而求其次，我们希望正确匹配的结果尽量靠前，因此前n（这个n越小越好）排序匹配率是行人重验证系统的技术指标。

通常来说完整的行人重验证系统的工作过程通常包括以下几步：1）利用行人检测的方法，收集多个行人不同拍摄位置、光照条件下的样本数据；2）从每个样本中提取纹理特征和颜色直方图特征；3）将所有特征描述子连接在一起后降维，从而获得每个样本的低维表达；4）训练能够判断两个样本是否为同一个人的距离度量模型；5）对新收集的行人不同拍摄位置、光照条件下的样本数据，利用学习好的距离度量模型判断哪些样本为同一个人。

然而常用的距离度量学习模型对训练样本数量比较敏感，在手工标注样本较少的情况下，行人重验证系统工作性能下降，为了获得系统性能，不得不大量手工标注样本，这使得行人重验证系统开发成本大量增加。另外许多距离度量模型的求解过程是一个复杂的优化迭代过程，因此训练时间较长。因此，从工程的角度出发，需要寻找一个需要少量训练样本，并且算法实现简单的距离度量模型是非常必要的。

发明内容

本发明的目的在于克服现有技术的缺点与不足，提供一种基于距离度量学习行人重验证的方法，该方法只需要少量人工标注样本的基于距离度量学习的简单算法就可以实现行人重验证方法。

本发明的目的通过下述技术方案实现：一种基于距离度量学习行人重验证的方法，具体实现方式：

1）利用行人检测的方法，收集多个行人不同拍摄位置、光照条件下的样本数据，这里行人类别数目为p；

2）从每个样本中提取纹理特征和颜色直方图特征；

3）将所有特征描述子连接在一起后执行PCA，从而获得每个样本的低维表达；

4）训练能够判断两个样本是否为同一个人的光滑正则化距离度量模型；

具体包括以下步骤：

步骤1：构造基本距离度量模型：

假设给定一特征向量对x_i和x_j，H₀代表特征向量对是不相似的(x_i和x_j是不同的人)，H₁代表特征向量对是相似的(x_i和x_j是同一个人)，两者的概率的比的对数为：

δ (x_{i}, x_{j}) = \log (\frac{p (H_{0} | x_{i}, x_{j})}{p (H_{1} | x_{i}, x_{j})}), - - - (1)

从分类的角度来说，δ(x_i,x_j)是正值则代表x_i和x_j是不同的人，而负值则代表相同的人，我们用x_ij=x_i-x_j来代表特征向量对的差，因此可得：

δ(x_ij)=log(p(H₀|x_ij)/p(H₁|x_ij))， (2)

上式可以写为：

δ(x_ij)=log(f(x_ij|H₀)/f(x_ij|H₁))+log(p(H₀)/p(H₁)), (3)

其中，f(x_ij|H₀)和f(x_ij|H₁)分别是在假设H₀和H₁下x_ij的概率密度函数，即f(x_ij|H₀)是相似的特征向量对的差异的概率密度函数，而f(x_ij|H₁)是不相似的特征向量对的差异的概率密度函数，由于x_ij的均值是0，通常假设x_ij服从高斯分布，所以，可得：

f (x_{ij} | H_{k}) = \frac{1}{{(2 π)}^{d / 2} {| Σ_{k} |}^{1 / 2}} \exp (- \frac{1}{2} x_{ij}^{T} Σ_{k}^{- 1} x_{ij}), - - - (4)

其中，k∈{0,1},d是特征向量的维数，Σ_k是x_ij的协方差矩阵。

式（4）和式（3）可以简化为：

δ (x_{ij}) = \frac{1}{2} x_{ij}^{T} (Σ_{1}^{- 1} - Σ_{0}^{- 1}) x_{ij} + \frac{1}{2} \log (\frac{| Σ_{1} |}{| Σ_{0} |}) + \log (\frac{p (H_{0})}{p (H_{1})}), - - - (5)

去掉常数项，可得：

δ (x_{ij}) = x_{ij}^{T} (Σ_{1}^{- 1} - Σ_{0}^{- 1}) x_{ij}, - - - (6)

定义y_ij为x_i和x_j的示性变量:如果x_i和x_j是相同的人，则y_ij=1，否则y_ij=0。N₀代表相似特征向量对的数量，N₁代表不相似特征向量的数量，协方差矩阵的估计为：

\begin{matrix} Σ_{0} = \frac{1}{N_{0}} \underset{y_{ij} = 0}{Σ} x_{ij} x_{ij}^{T} = \frac{1}{N_{0}} \underset{y_{ij} = 0}{Σ} (x_{i} - x_{j}) {(x_{i} - x_{j})}^{T}, \\ Σ_{1} = \frac{1}{N_{1}} \underset{y_{ij} = 1}{Σ} x_{ij} x_{ij}^{T} = \frac{1}{N_{1}} \underset{y_{ij} = 1}{Σ} (x_{i} - x_{j}) {(x_{i} - x_{j})}^{T}, \end{matrix} - - - (7)

令

M = Σ_{1}^{- 1} - Σ_{0}^{- 1},

δ (x_{ij}) = x_{ij}^{T} M x_{ij}, - - - (8)

步骤2：对基本距离度量模型进行光滑正则化：

式（6）中的协方差矩阵的估计对于身份再识别系统的鲁棒性来说是至关重要的。众所周知，协方差矩阵的估计总是有偏差的。由于训练样本的规模有限，真实协方差矩阵的大特征值会被高估，与此同时小的特征值会被低估。

在统计学中，有很多方法可以获得鲁棒性的估计。因此引入平滑技术和正则化技术来改善基本距离度量模型中的协方差矩阵的估计，平滑技术可以增大对协方差矩阵的小特征值的估计，而正则化可以减小被高估的大特征值的影响。通过将他们无缝地结合起来，我们可以改善用于身份再识别距离度量模型的性能。

首先，我们对协方差矩阵Σ_i进行对角化

Σ_{i} = Φ_{i} Λ_{i} Φ_{i}^{T}, - - - (9)

这里，Λ_i=diag[λ_i1,λ_i2,…,λ_id]，λ_ij是Σ_i的特征值，Φ_i=[φ_i1,φ_i2,…,φ_id]，φ_ij是Σ_i的特征向量。

将式（9）代入式（6）中可得：

\begin{matrix} δ (x_{ij}) = x_{ij} (Σ_{1}^{- 1} - Σ_{0}^{- 1}) x_{ij}^{T} \\ = x_{ij} (Φ_{1} Λ_{1}^{- 1} Φ_{1}^{T} - Φ_{0} Λ_{0}^{- 1} Φ_{0}^{T}) x_{ij}^{T} \\ = {[Φ_{1}^{T} x_{ij}]}^{T} Λ_{1}^{- 1} [Φ_{1}^{T} x_{ij}] - {[Φ_{0}^{T} x_{ij}]}^{T} Λ_{0}^{- 1} [Φ_{0}^{T} x_{ij}] \\ = Σ_{n = 1}^{d} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} - Σ_{n = 1}^{d} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (10)

根据平滑技术，我们首先将协方差矩阵中小的特征值用一个小的常数β_i来代替，然后可得：

这里，β_i是所有小特征值的平均值：

β_{i} = \frac{1}{d - k} \overset{n = k + 1}{Σ} λ_{in}, - - - (12)

因此，式（10）可以写成：

\begin{matrix} δ (x_{ij}) = Σ_{n = 1}^{d} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} - Σ_{n = 1}^{d} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2} \\ = Σ_{n = 1}^{k} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} + Σ_{n = k + 1}^{d} \frac{1}{β_{1}} {(φ_{1 n}^{T} x_{ij})}^{2} \\ - Σ_{n = 1}^{k} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2} - Σ_{n = k + 1}^{d} \frac{1}{β_{0}} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (13)

通过在式（13）中引入||x_ij||²，可以避免

和

的计算，然后可得：

\begin{matrix} δ (x_{ij}) = Σ_{n = 1}^{k} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} + \frac{1}{β_{1}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2}) \\ - Σ_{j = 1}^{k} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2} - \frac{1}{β_{0}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}) \\ = (\frac{1}{λ_{1 n}} - \frac{1}{β_{1}}) Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2} + (\frac{1}{β_{1}} - \frac{1}{β_{0}}) {| | x_{ij} | |}^{2} \\ - (\frac{1}{λ_{0 n}} - \frac{1}{β_{0}}) Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (14)

根据正则化技术，协方差矩阵式（9）用一个单位矩阵进行修改，

\begin{matrix} {\tilde{Σ}}_{i} = (1 - γ) Σ_{i} + γ α_{i} I \\ = (1 - γ) Φ_{i} Λ_{i} Φ_{i}^{T} + γ α_{i} Φ_{i} Φ_{i}^{T} \\ = Φ_{i} [(1 - γ) Λ_{i} + γ α_{i} I] Φ_{i}^{T}, \end{matrix} - - - (15)

这里，α_i=(1/d)tr(Σ_i)，0<γ<1。参数γ可以令

趋向单位矩阵，从而改善实际应用中的预测性能。

将式（11）代入式（15）可得：

定义：

在式（10）中用代替Σ_i，得到：

\begin{matrix} δ (x_{ij}) = x_{ij} ({\tilde{Σ}}_{1}^{- 1} - {\tilde{Σ}}_{0}^{- 1}) x_{ij}^{T} \\ = x_{ij} (Φ_{1} {\tilde{Λ}}_{1}^{- 1} Φ_{1}^{T} - Φ_{0} {\tilde{Λ}}_{0}^{- 1} Φ_{0}^{T}) x_{ij}^{T} \\ = {[Φ_{1}^{T} x_{ij}]}^{T} {\tilde{Λ}}_{1}^{- 1} [Φ_{1}^{T} x_{ij}] - {[Φ_{0}^{T} x_{ij}]}^{T} {\tilde{Λ}}_{0}^{- 1} [Φ_{0}^{T} x_{ij}], \end{matrix} - - - (18)

将式（17）代入式（18）可得：

\begin{matrix} δ (x_{ij}) = Σ_{n = 1}^{k} \frac{1}{(1 - γ) λ_{1 n} + γ α_{1}} {(φ_{1 n}^{T} x_{ij})}^{2} \\ + \frac{1}{(1 - γ) β_{1} + γ α_{1}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2}) \\ - Σ_{n = 1}^{k} \frac{1}{(1 - γ) λ_{0 n} + γ α_{0}} {(φ_{0 n}^{T} x_{ij})}^{2} \\ - \frac{1}{(1 - γ) β_{0} + γ α_{0}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}) \\ = (\frac{1}{(1 - γ) λ_{1 n} + γ α_{1}} - \frac{1}{(1 - γ) β_{1} + γ α_{1}}) Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2} \\ + (\frac{1}{(1 - γ) β_{1} + γ α_{1}} - \frac{1}{(1 - γ) β_{0} + γ α_{0}}) {| | x_{ij} | |}^{2} \\ - (\frac{1}{(1 - γ) λ_{0 n} + γ α_{0}} - \frac{1}{(1 - γ) β_{0} + γ α_{0}}) Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (19)

式（19）是对于给定的查询目标xi，直接根据δ(x_ij)得出的排名参考图像x_j进行匹配或者检索，δ(x_ij)的值越小的相应参考图像排得越前。

5）对新收集p'个行人的不同拍摄位置、光照条件下的样本数据，利用学习好的光滑正则化距离度量模型判断哪些样本为同一个人。

本发明相对于现有技术具有如下的优点及效果：

1、本发明一种基于距离度量学习行人重验证的方法，通过采用新设计的光滑正则化距离度量模型进行行人重验证，充分考虑了模型中协方差矩阵估计偏差问题。这样设计与传统的方法比较，不需要复杂的优化迭代过程，因此训练时间短。

2、在训练样本少的情况下，能够有效改善以往的距离度量模型的匹配性能，提升用户体验。

3、本发明可以用少量的样本获得不错的识别率，因此有效的减少了训练和测试过程中的存储成本。

附图说明

图1是本发明实施例的流程图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例

下面结合附图1对本发明做进一步的说明，如图1所示，一种基于距离度量学习行人重验证的方法，具体实施步骤如下：

步骤1：利用行人检测的方法，收集多个行人不同拍摄位置、光照条件下的数据，这里行人类别数目为p；

步骤2：从每张图中以8×8的间隔，8×16的重叠块中提取以下纹理特征和颜色直方图特征；LBP描述子、HSV直方图和LBP特征。所有的特征描述子都被连接在一起；然后用PCA来获得一个低维的表达，从而加快学习过程同时减低信号噪声。

步骤3：将所有特征描述子连接在一起后执行PCA，保留64维特征，从而获得每个样本的低维表达；

步骤4：训练能够判断两个样本是否为同一个人的光滑正则化距离度量模型；

具体包括以下步骤：

步骤4.1：构造基本距离度量模型：

假设给定一特征向量对x_i和x_j，H₀代表特征向量对是不相似的(x_i和x_j是不同的人)，H₁代表特征向量对是相似的(x_i和x_j是同一个人)。两者的概率的比的对数为：

δ (x_{i}, x_{j}) = \log (\frac{p (H_{0} | x_{i}, x_{j})}{p (H_{1} | x_{i}, x_{j})}), - - - (20)

从分类的角度来说，δ(x_i,x_j)是正值则代表x_i和x_j是不同的人，而负值则代表相同的人。我们用x_ij=x_i-x_j来代表特征向量对的差，因此可得：

δ(x_ij)=log(p(H₀|x_ij)/p(H₁|x_ij))， (21)

上式可以写为：

δ(x_ij)=log(f(x_ij|H₀)/f(x_ij|H₁))+log(p(H₀)/p(H₁)), (22)

其中，f(x_ij|H₀)和f(x_ij|H₁)分别是在假设H₀和H₁下x_ij的概率密度函数，即f(x_ij|H₀)是相似的特征向量对的差异的概率密度函数，而f(x_ij|H₁)是不相似的特征向量对的差异的概率密度函数。由于x_ij的均值是0，通常假设x_ij服从高斯分布。所以，可得：

f (x_{ij} | H_{k}) = \frac{1}{{(2 π)}^{d / 2} {| Σ_{k} |}^{1 / 2}} \exp (- \frac{1}{2} x_{ij}^{T} Σ_{k}^{- 1} x_{ij}), - - - (23)

其中，k∈{0,1},d是特征向量的维数，Σ_k是x_ij的协方差矩阵。

式子（4）和（3）可以简化为：

δ (x_{ij}) = \frac{1}{2} x_{ij}^{T} (Σ_{1}^{- 1} - Σ_{0}^{- 1}) x_{ij} + \frac{1}{2} \log (\frac{| Σ_{1} |}{| Σ_{0} |}) + \log (\frac{p (H_{0})}{p (H_{1})}), - - - (24)

去掉常数项，可得：

δ (x_{ij}) = x_{ij}^{T} (Σ_{1}^{- 1} - Σ_{0}^{- 1}) x_{ij}, - - - (25)

定义y_ij为x_i和x_j的示性变量:如果x_i和x_j是相同的人，则y_ij=1，否则y_ij=0。N₀代表相似特征向量对的数量，N₁代表不相似特征向量的数量。协方差矩阵的估计为：

\begin{matrix} Σ_{0} = \frac{1}{N_{0}} \underset{y_{ij} = 0}{Σ} x_{ij} x_{ij}^{T} = \frac{1}{N_{0}} \underset{y_{ij} = 0}{Σ} (x_{i} - x_{j}) {(x_{i} - x_{j})}^{T}, \\ Σ_{1} = \frac{1}{N_{1}} \underset{y_{ij} = 1}{Σ} x_{ij} x_{ij}^{T} = \frac{1}{N_{1}} \underset{y_{ij} = 1}{Σ} (x_{i} - x_{j}) {(x_{i} - x_{j})}^{T}, \end{matrix} - - - (26)

令

M = Σ_{1}^{- 1} - Σ_{0}^{- 1},

δ (x_{ij}) = x_{ij}^{T} M x_{ij}, - - - (27)

步骤4.2：对基本距离度量模型进行光滑正则化：

式子（6）中的协方差矩阵的估计对于身份再识别系统的鲁棒性来说是至关重要的。众所周知，协方差矩阵的估计总是有偏差的。由于训练样本的规模有限，真实协方差矩阵的大特征值会被高估，与此同时小的特征值会被低估。

首先，我们对协方差矩阵Σ_i进行对角化

Σ_{i} = Φ_{i} Λ_{i} Φ_{i}^{T}, - - - (28)

将（9）代入（6）中可得：

\begin{matrix} δ (x_{ij}) = x_{ij} (Σ_{1}^{- 1} - Σ_{0}^{- 1}) x_{ij}^{T} \\ = x_{ij} (Φ_{1} Λ_{1}^{- 1} Φ_{1}^{T} - Φ_{0} Λ_{0}^{- 1} Φ_{0}^{T}) x_{ij}^{T} \\ = {[Φ_{1}^{T} x_{ij}]}^{T} Λ_{1}^{- 1} [Φ_{1}^{T} x_{ij}] - {[Φ_{0}^{T} x_{ij}]}^{T} Λ_{0}^{- 1} [Φ_{0}^{T} x_{ij}] \\ = Σ_{n = 1}^{d} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} - Σ_{n = 1}^{d} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (29)

这里，β_i是所有小特征值的平均值：

β_{i} = \frac{1}{d - k} \overset{n = k + 1}{Σ} λ_{in}, - - - (31)

因此，（10）可以写成：

\begin{matrix} δ (x_{ij}) = Σ_{n = 1}^{d} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} - Σ_{n = 1}^{d} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2} \\ = Σ_{n = 1}^{k} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} + Σ_{n = k + 1}^{d} \frac{1}{β_{1}} {(φ_{1 n}^{T} x_{ij})}^{2} \\ - Σ_{n = 1}^{k} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2} - Σ_{n = k + 1}^{d} \frac{1}{β_{0}} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (32)

通过在（13）中引入||x_ij||²，可以避免

和的计算，然后可得：

\begin{matrix} δ (x_{ij}) = Σ_{n = 1}^{k} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} + \frac{1}{β_{1}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2}) \\ - Σ_{j = 1}^{k} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2} - \frac{1}{β_{0}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}) \\ = (\frac{1}{λ_{1 n}} - \frac{1}{β_{1}}) Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2} + (\frac{1}{β_{1}} - \frac{1}{β_{0}}) {| | x_{ij} | |}^{2} \\ - (\frac{1}{λ_{0 n}} - \frac{1}{β_{0}}) Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (33)

根据正则化技术，协方差矩阵（9）用一个单位矩阵进行修改，

\begin{matrix} {\tilde{Σ}}_{i} = (1 - γ) Σ_{i} + γ α_{i} I \\ = (1 - γ) Φ_{i} Λ_{i} Φ_{i}^{T} + γ α_{i} Φ_{i} Φ_{i}^{T} \\ = Φ_{i} [(1 - γ) Λ_{i} + γ α_{i} I] Φ_{i}^{T}, \end{matrix} - - - (34)

式中，α_i=(1/d)tr(Σ_i)，0<γ<1。参数γ可以令趋向单位矩阵，从而改善实际应用中的预测性能。

将（11）代入（15）可得：

定义

在（10）中用

代替Σ_i，得到：

\begin{matrix} δ (x_{ij}) = x_{ij} ({\tilde{Σ}}_{1}^{- 1} - {\tilde{Σ}}_{0}^{- 1}) x_{ij}^{T} \\ = x_{ij} (Φ_{1} {\tilde{Λ}}_{1}^{- 1} Φ_{1}^{T} - Φ_{0} {\tilde{Λ}}_{0}^{- 1} Φ_{0}^{T}) x_{ij}^{T} \\ = {[Φ_{1}^{T} x_{ij}]}^{T} {\tilde{Λ}}_{1}^{- 1} [Φ_{1}^{T} x_{ij}] - {[Φ_{0}^{T} x_{ij}]}^{T} {\tilde{Λ}}_{0}^{- 1} [Φ_{0}^{T} x_{ij}], \end{matrix} - - - (37)

将（17）代入（18）可得：

\begin{matrix} δ (x_{ij}) = Σ_{n = 1}^{k} \frac{1}{(1 - γ) λ_{1 n} + γ α_{1}} {(φ_{1 n}^{T} x_{ij})}^{2} \\ + \frac{1}{(1 - γ) β_{1} + γ α_{1}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2}) \\ - Σ_{n = 1}^{k} \frac{1}{(1 - γ) λ_{0 n} + γ α_{0}} {(φ_{0 n}^{T} x_{ij})}^{2} \\ - \frac{1}{(1 - γ) β_{0} + γ α_{0}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}) \\ = (\frac{1}{(1 - γ) λ_{1 n} + γ α_{1}} - \frac{1}{(1 - γ) β_{1} + γ α_{1}}) Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2} \\ + (\frac{1}{(1 - γ) β_{1} + γ α_{1}} - \frac{1}{(1 - γ) β_{0} + γ α_{0}}) {| | x_{ij} | |}^{2} \\ - (\frac{1}{(1 - γ) λ_{0 n} + γ α_{0}} - \frac{1}{(1 - γ) β_{0} + γ α_{0}}) Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (38)

（19）是对于给定的查询目标x_i，直接根据δ(x_ij)得出的排名参考图像x_j进行匹配或者检索。δ(x_ij)的值越小的相应参考图像排得越前。

步骤5：将新收集的行人不同拍摄位置、光照条件下的样本数据，这些数据来自于不同的摄像机，比如编号为A，A₁，...，A₂，然后利用学习好的光滑正则化距离度量模型判断编号A摄像机出现的行人，与A₁，...，A₂中收集的哪个样本是同一个人。

为了进一步说明实施例的效果，我们利用公开的ETHZ数据集进行了行人重验证试验。该数据集中包含了从146个人身上获得的8,555张图像。ETHZ数据集对于每个对象的图像样本数较多。样本中包括有视觉、姿势、拍摄位置、光照条件和图像质量等方面的细小变化。实验中，我们将p=76个对象的所有样本图像都用来组成训练集，剩余的p'=70个对象的样本则作为测试集。并重复10次以上过程。另外与常见的LMNN距离度量学习模型进行试验结果对比。

排序匹配率是行人重验证的重要指标，是指返回的前n个结果，正确结果出现的概率。表1排序匹配率是通过10次实验获得的，以评估行人重验证方法的效果。鉴于该问题的复杂性，前n个排序匹配率（n是一个尽量小的数）也纳入考虑范围。

表1对光滑正则化距离度量学习与LMNN距离度量学习的实验结果进行了比较，可以看出光滑正则化距离度量学习有明显的优势。

表1为光滑正则化距离学习与LMNN距离度量学习的在ETHZ数据集上的实验结果：

表1

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于距离度量学习行人重验证的方法，包括以下步骤：

1）利用行人检测的方法，收集多个行人不同拍摄位置、光照条件下的样本数据，设置行人类别数目为p；

2）从每个样本中提取纹理特征和颜色直方图特征；

5）对新收集p'个行人的不同拍摄位置、光照条件下的样本数据，利用学习好的光滑正则化距离度量模型判断哪些样本为同一个人；

其特征在于，所述步骤4）中，训练光滑正则化距离度量模型的实现方式，包括以下步骤：

步骤1：构造基本距离度量模型；

步骤2：对基本距离度量模型进行光滑正则化。

2.根据权利要求1所述的基于距离度量学习行人重验证的方法，其特征在于，所述步骤1包括以下步骤：

步骤Ⅰ、假设给定一特征向量对x_i和x_j代表两个样本，H₁代表特征向量对相似，即：x_i和x_j是同一个人，H₀代表特征向量对不相似，即：x_i和x_j是不同的人，H₁和H₀的概率的比的对数为：

δ (x_{i}, x_{j}) = \log (\frac{p (H_{0} | x_{i}, x_{j})}{p (H_{1} | x_{i}, x_{j})}), - - - (39)

从分类的角度进行分析，δ(x_i,x_j)是正值则代表x_i和x_j是不同的人，而负值则代表相同的人，用x_ij=x_i-x_j来代表特征向量对的差，因此得到：

δ(x_ij)=log(p(H₀|x_ij)/p(H₁|x_ij))， (40)

上式写为：

δ(x_ij)=log(f(x_ij|H₀)/f(x_ij|H₁))+log(p(H₀)/p(H₁)), (41)

其中，f(x_ij|H₀)和f(x_ij|H₁)分别是在假设H₀和H₁下x_ij的概率密度函数，即：f(x_ij|H₀)是相似的特征向量对的差异的概率密度函数，而f(x_ij|H₁)是不相似的特征向量对的差异的概率密度函数，由于x_ij的均值是0，假设x_ij服从高斯分布，得到：

f (x_{ij} | H_{k}) = \frac{1}{{(2 π)}^{d / 2} {| Σ_{k} |}^{1 / 2}} \exp (- \frac{1}{2} x_{ij}^{T} Σ_{k}^{- 1} x_{ij}), - - - (42)

其中，k∈{0,1},d是特征向量的维数，Σ_k是x_ij的协方差矩阵；

式（4）和式（3）简化为：

δ (x_{ij}) = \frac{1}{2} x_{ij}^{T} (Σ_{1}^{- 1} - Σ_{0}^{- 1}) x_{ij} + \frac{1}{2} \log (\frac{| Σ_{1} |}{| Σ_{0} |}) + \log (\frac{p (H_{0})}{p (H_{1})}), - - - (43)

去掉常数项，得到：

δ (x_{ij}) = x_{ij}^{T} (Σ_{1}^{- 1} - Σ_{0}^{- 1}) x_{ij}, - - - (44)

步骤Ⅱ、定义y_ij为x_i和x_j的示性变量:如果x_i和x_j是相同的人，则：y_ij=1，否则，y_ij=0；N₀代表相似特征向量对的数量，N₁代表不相似特征向量的数量，协方差矩阵的估计为：

\begin{matrix} Σ_{0} = \frac{1}{N_{0}} \underset{y_{ij} = 0}{Σ} x_{ij} x_{ij}^{T} = \frac{1}{N_{0}} \underset{y_{ij} = 0}{Σ} (x_{i} - x_{j}) {(x_{i} - x_{j})}^{T}, \\ Σ_{1} = \frac{1}{N_{1}} \underset{y_{ij} = 1}{Σ} x_{ij} x_{ij}^{T} = \frac{1}{N_{1}} \underset{y_{ij} = 1}{Σ} (x_{i} - x_{j}) {(x_{i} - x_{j})}^{T}, \end{matrix} - - - (45)

令

M = Σ_{1}^{- 1} - Σ_{0}^{- 1},

δ (x_{ij}) = x_{ij}^{T} M x_{ij}, - - - (46)

其中，M作为距离度量矩阵，x_ij=x_i-x_j来代表特征向量对的差。

3.根据权利要求1所述的基于距离度量学习行人重验证的方法，其特征在于，所述步骤2包括以下步骤：

步骤ⅰ、对协方差矩阵Σ_i进行对角化：

Σ_{i} = Φ_{i} Λ_{i} Φ_{i}^{T}, - - - (47)

式中，Λ_i=diag[λ_i1,λ_i2,…,λ_id]，λ_ij是Σ_i的特征值，Φ_i=[φ_i1,φ_i2,…,φ_id]，φ_ij是Σ_i的特征向量；

将式（9）代入式（6）中得到：

\begin{matrix} δ (x_{ij}) = x_{ij} (Σ_{1}^{- 1} - Σ_{0}^{- 1}) x_{ij}^{T} \\ = x_{ij} (Φ_{1} Λ_{1}^{- 1} Φ_{1}^{T} - Φ_{0} Λ_{0}^{- 1} Φ_{0}^{T}) x_{ij}^{T} \\ = {[Φ_{1}^{T} x_{ij}]}^{T} Λ_{1}^{- 1} [Φ_{1}^{T} x_{ij}] - {[Φ_{0}^{T} x_{ij}]}^{T} Λ_{0}^{- 1} [Φ_{0}^{T} x_{ij}] \\ = Σ_{n = 1}^{d} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} - Σ_{n = 1}^{d} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (48)

步骤ⅱ、将协方差矩阵中小的特征值用一个常数β_i代替，得到：

式中，β_i是所有小特征值的平均值：

β_{i} = \frac{1}{d - k} \overset{n = k + 1}{Σ} λ_{in}, - - - (50)

因此，式（10）写成：

\begin{matrix} δ (x_{ij}) = Σ_{n = 1}^{d} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} - Σ_{n = 1}^{d} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2} \\ = Σ_{n = 1}^{k} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} + Σ_{n = k + 1}^{d} \frac{1}{β_{1}} {(φ_{1 n}^{T} x_{ij})}^{2} \\ - Σ_{n = 1}^{k} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2} - Σ_{n = k + 1}^{d} \frac{1}{β_{0}} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (51)

通过在式（13）中引入||x_ij||²，以避免

和的计算，然后得到：

\begin{matrix} δ (x_{ij}) = Σ_{n = 1}^{k} \frac{1}{λ_{1 n}} {(φ_{1 n}^{T} x_{ij})}^{2} + \frac{1}{β_{1}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2}) \\ - Σ_{j = 1}^{k} \frac{1}{λ_{0 n}} {(φ_{0 n}^{T} x_{ij})}^{2} - \frac{1}{β_{0}} ({| | x_{ij} | |}^{2} - Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}) \\ = (\frac{1}{λ_{1 n}} - \frac{1}{β_{1}}) Σ_{n = 1}^{k} {(φ_{1 n}^{T} x_{ij})}^{2} + (\frac{1}{β_{1}} - \frac{1}{β_{0}}) {| | x_{ij} | |}^{2} \\ - (\frac{1}{λ_{0 n}} - \frac{1}{β_{0}}) Σ_{n = 1}^{k} {(φ_{0 n}^{T} x_{ij})}^{2}, \end{matrix} - - - (52)

根据正则化技术，协方差矩阵式（9）用一个单位矩阵进行修改：

\begin{matrix} {\tilde{Σ}}_{i} = (1 - γ) Σ_{i} + γ α_{i} I \\ = (1 - γ) Φ_{i} Λ_{i} Φ_{i}^{T} + γ α_{i} Φ_{i} Φ_{i}^{T} \\ = Φ_{i} [(1 - γ) Λ_{i} + γ α_{i} I] Φ_{i}^{T}, \end{matrix} - - - (53)

式中，α_i=(1/d)tr(Σ_i)，参数γ的取值范围为：0<γ<1；

步骤ⅲ、将式（11）代入式（15）得到：

定义：

在式（10）中用

代替Σ_i，得到：

\begin{matrix} δ (x_{ij}) = x_{ij} ({\tilde{Σ}}_{1}^{- 1} - {\tilde{Σ}}_{0}^{- 1}) x_{ij}^{T} \\ = x_{ij} (Φ_{1} {\tilde{Λ}}_{1}^{- 1} Φ_{1}^{T} - Φ_{0} {\tilde{Λ}}_{0}^{- 1} Φ_{0}^{T}) x_{ij}^{T} \\ = {[Φ_{1}^{T} x_{ij}]}^{T} {\tilde{Λ}}_{1}^{- 1} [Φ_{1}^{T} x_{ij}] - {[Φ_{0}^{T} x_{ij}]}^{T} {\tilde{Λ}}_{0}^{- 1} [Φ_{0}^{T} x_{ij}], \end{matrix} - - - (56)

将（17）代入（18）得到：

式（19）是对于给定的查询目标x_i，直接根据δ(x_ij)得出的排名参考图像x_j进行匹配或者检索。