CN107194338A

CN107194338A - 基于人体树图模型的交通环境行人检测方法

Info

Publication number: CN107194338A
Application number: CN201710336956.2A
Authority: CN
Inventors: 段建民; 孟晓燕; 郑榜贵; 刘丹; 李岳
Original assignee: Beijing University of Technology
Current assignee: Beijing University of Technology
Priority date: 2017-05-14
Filing date: 2017-05-14
Publication date: 2017-09-22

Abstract

本发明公开了基于人体树图模型的交通环境行人检测方法。属于道路交通行人检测领域。首先选取具有人体关节标注信息的数据集作为模型的训练样本，并将关节点扩充为所需的人体部件；基于各父子部件的相对位置关系，采用样本相对距离、样本相关差异度均值和样本集总体相关差异度均值的概念，对K‑means算法初始聚类中心进行优化，实现对人体各部件类型的聚类，进而获取训练样本的隐藏变量；利用坐标下降法解决隐结构SVM问题，训练获取检测判别模型；在检测阶段，依据所构筑的人体树图结构、部件状态转移方程和离线训练模型，融合动态规划思想实现对测试样本特征金字塔的遍历，进而获取图像的全部人体检测结果，并利用非极大值抑制算法得到最终的检测包围盒。

Description

基于人体树图模型的交通环境行人检测方法

技术领域

本发明属于道路交通行人检测领域。结合改进的人体树图模型对人体各部分之间的共生及空间关系进行编码，涉及一种基于部件姿态估计算法的交通行人检测方法。

背景技术

近年来，由于汽车保有量与使用率的增加，交通事故的发生呈现逐年上升趋势。其中行人作为交通事故的主要受害者，保证其生命财产安全是智能车辆研究领域的重要课题。随着先进驾驶辅助系统(Advanced Driver Assistance Systems，ADAS)的有效应用，智能车辆在辅助驾驶及触险报警等方面的功能已经日趋完善。如何快速、准确的检测出行驶过程中的行人，有效提升驾驶系统的鲁棒性及安全性，为后续的车辆避障与路径规划提供可靠保障是智能车辆自主驾驶技术亟需解决的问题。

智能车辆行人检测技术属于机器视觉研究领域，目前的检测机制从提升系统鲁棒性和实时性的角度出发，主要围绕行人特征的描述性能、分类器的设计结构及判别能力，以及多姿态、多视角下的检测问题进行了研究。但是上述工作往往是将目标行人视为一个整体或是将人体划分为多个独立的部分进行训练，忽视了人体各部分之间的空间及共生关系，难以实现对行人姿态的准确判别，进而影响检测结果的准确度及包围盒对人体的覆盖率。

K-means作为一种动态聚类算法，能根据训练样本的类别对树执行剪枝进而实现对样本的分类，具有计算复杂度低、耗时短且聚类性能优良的特点。本发明在改进的部件树图模型基础上对人体各部分之间的空间关系和局部刚度进行描述，提出了一种离线训练、在线检测的交通环境行人检测方法。以训练样本的部件类型为隐藏变量，针对其在K-means聚类过程中对初始聚类中心存在较强依赖性的缺陷，采用基于数据空间分布的初始聚类中心选取方法，并将模型学习过程转化为解决结构化SVM问题，利用坐标下降法完成模型的训练。在检测阶段，利用动态规划思想求解状态转移方程获取不同尺度下的人体检测包围盒，通过非极大值抑制算法得到图像的最终行人检测结果。

发明内容

本发明的目的在于提供了一种准确且可靠的交通环境行人检测方法。

为实现上述目的，本发明采用的技术方案为基于人体树图模型的交通环境行人检测方法，从提高行人检测准确度及包围盒对人体的覆盖率角度出发，提出基于改进树图模型的行人检测方法。首先选取具有人体关节标注信息的数据集作为模型的训练样本，根据实际需要将标注关节点扩充为所需的人体部分，定义各个部件之间的父子关系，并将以父部件为原点获取的子部件相对位置作为K-means算法的数据输入；采用样本间的相对距离、样本相关差异度均值以及样本集总体相关差异度均值的概念，根据各个样本的差异度均值进行样本排序，依次选出初始聚类中心。选取依据为相关差异度均值较大，且与已选定聚类中心的距离均大于样本集的差异度均值，并通过设置各个部件的类型数量，得到相应的聚类结果，进而完成对训练集样本部件的类型标注；之后以样本的部件类型为隐藏变量，利用坐标下降法解决隐结构化SVM问题，训练获取检测判别模型；在检测阶段，依据所构筑的人体树图结构、部件状态转移方程和离线训练所得的模型，融合动态规划的思想实现对测试样本特征金字塔的遍历，进而获取某一图像的全部人体检测结果，并利用非极大值抑制算法获取最终的行人检测包围盒。

本方法的技术实现过程如下：

(1)训练样本预处理及部件类型聚类

利用隐结构SVM训练行人检测模型首先需要大量带有人体关节标注信息的数据集，如PennAction Dataset、sub-JHMDB Dataset、Image Parse Dataset和Buffy Dataset等。不同数据集定义的关节点对人体的覆盖率差别较大，涉及人体的上半身或全身，在实际应用过程中应根据行人检测场合及环境的需要选取恰当的模型训练数据集。通过对数据集中的关节点进行扩充以提高部件对人体的覆盖率，实现更加准确、完整的人体部件检测，进而获取更加精准的行人检测包围盒。训练样本预处理包括以下两个步骤：

步骤一，设数据集中人体关节标注信息为n×2的矩阵O，T为m×n的变换矩阵，则扩充后的人体部件信息为m×2的矩阵S，S＝T·O。n表示数据集中人体关节标注点个数，m表示扩充后的人体部件数量。

步骤二，对全部部件按照空间次序进行排序标号，构筑人体树图模型，令头部部件为模型的根节点，并依次定义部件之间的父子关系。

采用改进的K-means算法对人体各个部件的类型进行聚类，进而获取训练样本的隐藏变量，用于隐结构SVM的训练过程。

由于K-means算法是对其自身目标函数求解近似的局部最优解，并不能确信得到全局最优，因此聚类结果会随着初始聚类中心的不同发生较大偏差。样本与其所属聚类中心的相关差异度较小，与其它聚类中心的相关差异度较大。鉴于上述特点，在初始化聚类中心时，选择相关差异度大于样本集相关差异度均值的样本，并且聚类中心之间的相关差异度也应大于样本集的整体差异度均值。与标准K-means采用随机采样方式获取的聚类中心相比，采用改进的K-means算法更有利于得到好的聚类结果。具体聚类的步骤如下：

步骤一，设图片h中某一子部件与其父部件的相对位置为P_h，h∈{1,2,…,H}，H表示图片个数，且P_h均为二维向量。计算P_A与任意P_B的欧氏距离d_AB，

其中,A、B∈{1,2,…,H}，且A≠B，P_A＝[P_A1,P_A2]，P_B＝[P_B1,P_B2]。

步骤二，依据步骤一计算全部d_AB，并求解P_A的相关差异度α_A，如公式(2)所示。

步骤三，通过计算全部的α_A，得出全部图片的相关差异度均值η：

步骤四，对全部的相关差异度进行排序，提取最大相关差异度α_max所对应的父子部件相对位置作为第1个初始聚类中心，并将当前最大相关差异度从排序中删除，得到新的相关差异度排序。

步骤五，提取出新的相关差异度排序中的α_max所对应的父子部件相对位置，若该相对位置与已选定的全部初始聚类中心的欧氏距离均大于相关差异度均值η，则将该父子部件相对位置视为第2个初始聚类中心，并将当前α_max从排序中删除；否则，直接删除当前的α_max，重复执行步骤五，直至选出全部的初始聚类中心。

步骤六，设第u个聚类集合S_u的聚类中心为c_u，则S_u可由如下公式表示。其中P_h分配给S_u的依据是，对于任意其它聚类中心c_v均满足公式(4)中的成员属性，

其中c_u、c_v表示两个聚类中心，u、v∈{1,2,…,K}，K为聚类中心个数，即树图模型的部件类型数量，且u≠v。

步骤七，根据人体树图模型中部件类型的聚类结果，更新聚类中心：

步骤八，若迭代达到最大次数或者是相邻两代的差值小于设定的阈值时，运算结束，获取最终的部件类型聚类中心；否则重复步骤六。

(2)基于隐结构SVM的检测模型训练

结构化SVM是传统SVM分类器的扩展模型，其主要解决的问题往往包含较为丰富的结构信息，如树图模型、场景关联等。隐结构SVM则是在其基础上考虑了包含隐藏变量的情况，从而令原始的凸优化问题转变为了非凸，增加了模型优化的难度。本方法将数据集中带有人体标注信息的样本视为正样本，随机选取任意适当分辨率下不含行人的图像作为负样本，并以K-means聚类获取的正样本部件类型为隐藏变量，基于隐结构SVM框架训练行人检测模型。具体模型训练步骤如下：

步骤一，为构建树图结构的评分模型，定义一幅图像为I，图像中人体部件的像素位置为p_i＝(x，y)，其中i∈{1,...,m}，。t_i表示部件i的类型，t_i∈{1,...,K}，是通过子部件与其父部件之间的位置关系进行定义的，这种位置关系的类型数量取决于训练时所设立的K-means聚类中心个数K。设t＝{t₁,…,t_K}，构建的人体树图G＝(V，E)，其中V表示人体树图的部件节点集合，E表示部件之间的关系集合，通过定义一个兼顾局部得分和父子部件得分的求和函数来计算部件得分，

其中，表示部件i属于某一种特定类型的支持度，表示部件i、j特定共生关系下的支持度，即视为偏置部分。通过如下公式计算图像中部件的类型及其位置的总得分：

其中，表示从图像I中的像素点位置p_i提取的HOG特征向量，ψ(p_i-p_j)＝[dxdx²dy dy²]表示部件i对于部件j的相对位置，其中dx＝x_i-x_j，dy＝y_i-y_j。此外，为部件i在类型t_i时的滤波器模板；表示部件i和j在特定类型组合下的滤波器模板，编码一对部件的静态位置关系和刚度信息，即为共生信息。

步骤二，将正样本集合表示为{I_o，p_o，t_o}，负样本集合为{I_o}，其中I_o表示图像集合，p_o为相应的部件像素点集合，t_o为图像中人体的部件类型集合。令z_o＝(p_o，t_o)，待训练的模型参数为β＝(w，b)，将公式(7)简写为线性函数的形式S(I，z)＝β·f(I，z)，则求解以下公式完成模型训练，

公式(8)的约束条件是正样本的得分应该高于1；负样本对于每个位置和类型的所有配置的得分都应该低于-1。ξ_o为松弛变量，便于在更大的可行域内求解。C为惩罚因子。

步骤三，采用坐标下降法求解上述二次规划问题，获取检测模型。

(3)基于树图模型与动态规划算法的行人检测

基于上述人体树图结构和离线训练所得的模型，结合动态规划的思想对不同尺度下的测试图像执行人体部件检测，利用非极大值抑制算法获取最优的部件包围盒，并通过合并全部的部件包围盒得到最终的行人检测结果。具体检测步骤如下：

步骤一，设金字塔总层数为θ，求解当前测试图像I的HOG特征金字塔。首先利用高斯金字塔对图形进行降采样，计算公式如下，

其中G_k(x,y)为第k层高斯金字塔图像，x、y为图像的像素坐标；G₀为原始图像，作为金字塔的底层；q(e,g)＝q(g)·q(g)为高斯卷积核，q为高斯核函数。基于所得的θ层图像金字塔求取相应的HOG特征，获取测试图像的HOG特征金字塔。

步骤二，由于采用的部件模型是树形结构，因此检测图像人体部件的问题可以通过动态规划的思想解决。将公式(7)转化为动态规划算法的状态转移方程，如下所示，

其中kids(i)表示树图G中部件i的子部件集合。公式(10)融合了部件i的子部件信息，并计算i在所有像素位置p_i及可能类型t_i下的局部得分。公式(11)用于计算子部件i向父部件j传递的信息，包括父子部件之间的最大共生关系支持度、最大子部件得分和父子部件在特定类型组合下的滤波器模板与父子部件相对位置的卷积。

步骤三，对经过步骤二获取的不同图像尺度下的检测结果执行非极大值抑制算法，获取当前图像的最优人体部件检测，并针对全部部件包围盒坐标求取相应的x_max、x_min、y_max和y_min，完成对测试图像的行人检测任务。

附图说明

图1基于改进树图模型的行人检测流程图。

图2改进K-means聚类算法流程图。

图3全身及半身部件标注点构型示意图。

图4实际行人检测效果图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步说明。

本发明在改进的树图模型基础上提出了一种高准确度的行人检测方法。针对部件类型聚类过程中K-means算法对初始聚类中心存在较强依赖性的缺陷，采用了基于数据空间分布获取初始聚类中心的策略，并以此为隐藏变量，利用隐结构SVM完成检测模型的训练；之后，依据树图模型定义相应的状态转移方程，基于动态规划算法思想及所训练的模型完成行人检测任务。所涉及的方法整体流程如附图1所示，具体实施过程分为以下步骤：

步骤一，在训练样本预处理阶段，考虑交通环境下距离车载摄像头较远的目标人体往往可以检测出全身，而距离较近时通常只能检测出半身，则依据实际需求，分别选取具有全身和半身标注的数据集。为提高检测包围盒对人体的覆盖率，设计变换矩阵对部件信息进行扩充，并增加镜像图像以保证训练时的正负样本平衡。

步骤二，完成对训练集样本部件的标号，并定义除头部以外全部部件的对应父部件。

步骤三，在部件类型聚类阶段，为了解决K-means算法对初始聚类中心存在较强依赖性的问题，选择相关差异度大于样本集相关差异度均值的样本，并且聚类中心之间的相关差异度也应大于样本集的整体差异度均值。依据公式(1)至公式(5)和图2(改进K-means聚类算法流程图)，获取人体各个部件的类型聚类结果。

步骤四，在模型训练阶段，根据公式(6)和公式(7)构筑的人体树图模型，利用步骤三所得的各部件类型聚类结果对训练集样本的部件类型进行标注，并以此为隐藏变量，基于隐结构SVM框架对行人检测模型进行训练。

步骤五，采用坐标下降法对公式(8)所示问题进行求解，获取检测模型。

步骤六，在行人检测阶段，利用公式(9)求解测试样本的图像金字塔，获取HOG特征金字塔。引入动态规划算法思想，将树图模型评分函数转化为检测所需的状态转移方程，如公式(10)和公式(11)所示。利用前文所述的各部件之间的父子关系，遵循子到父的传递规律求解出各个人体部件的当前状态信息，进而获取根部件的最终得分。

步骤七，对全部的根部件得分执行非极大值抑制算法，得到测试样本的最优检测评分。利用此结果对各个部件的位置进行检索，获取人体全身或半身的部件包围盒，计算全部包围盒的x_max、x_min、y_max和y_min信息，完成对测试图像的行人检测任务。

下面为本发明的在智能车辆系统中的一个应用实例。

选取Image Parse Dataset为人体全身检测的训练样本集，包含305张关节点标注准确且覆盖全身的人体图像。该数据集中预先标注的人体关节信息矩阵大小为14×2，本发明在其基础上利用26×14的变换矩阵对部件信息进行扩充，最终得到26×2的标注矩阵。对26个人体部件进行依次标号，定义其相应的父部件标号向量为F₁＝[0 1 2 3 4 5 6 3 8 910 11 12 13 2 15 16 17 18 15 20 21 22 23 24 25]，头部部件为根部件，其父部件为0。选取Buffy Dataset为人体半身检测的训练样本集，该数据集标注了人体半身的10个关节点信息，本发明利用18×10的变换矩阵对其部件信息进行扩充，得到18×2的部件信息矩阵。定义父部件标号向量为F₂＝[0 1 2 3 4 5 6 3 8 9 2 11 12 13 14 11 16 17]。详细的全身及半身部件标注点构型示意如图3所示，其中星号代表扩充的人体部件。

分别设置全身和半身人体模型的部件类型个数为4和6，采用本发明所提改进的K-means聚类算法得到相应的聚类中心。对2个数据集中的人体部件类型进行标注，作为隐结构SVM模型训练的隐藏变量，通过坐标下降法得到行人检测模型。在检测阶段，利用动态规划算法获取不同尺度下的部件检测包围盒，经过非极大值抑制算法得到图像的最终行人检测结果，实际行人检测效果如图4所示，检测完毕。

Claims

1.基于人体树图模型的交通环境行人检测方法，其特征在于：

本方法的实现过程如下，

(1)训练样本预处理及部件类型聚类

利用隐结构SVM训练行人检测模型首先需要大量带有人体关节标注信息的数据集，不同数据集定义的关节点对人体的覆盖率差别较大，涉及人体的上半身或全身，在实际应用过程中应根据行人检测场合及环境的需要选取恰当的模型训练数据集；通过对数据集中的关节点进行扩充以提高部件对人体的覆盖率，实现更加准确、完整的人体部件检测，进而获取更加精准的行人检测包围盒；训练样本预处理包括以下两个步骤：

步骤一，设数据集中人体关节标注信息为n×2的矩阵O，T为m×n的变换矩阵，则扩充后的人体部件信息为m×2的矩阵S，S＝T·O；n表示数据集中人体关节标注点个数，m表示扩充后的人体部件数量；

步骤二，对全部部件按照空间次序进行排序标号，构筑人体树图模型，令头部部件为模型的根节点，并依次定义部件之间的父子关系；

采用改进的K-means算法对人体各个部件的类型进行聚类，进而获取训练样本的隐藏变量，用于隐结构SVM的训练过程；

在初始化聚类中心时，选择相关差异度大于样本集相关差异度均值的样本，并且聚类中心之间的相关差异度也应大于样本集的整体差异度均值；采用改进的K-means算法具体聚类的步骤如下：

步骤一，设图片h中某一子部件与其父部件的相对位置为P_h，h∈{1,2,…,H}，H表示图片个数，且P_h均为二维向量；计算P_A与任意P_B的欧氏距离d_AB，

其中,A、B∈{1,2,…,H}，且A≠B，P_A＝[P_A1,P_A2]，P_B＝[P_B1,P_B2]；

步骤二，依据步骤一计算全部d_AB，并求解P_A的相关差异度α_A，如公式(2)所示；

<mrow> <msub> <mi>&alpha;</mi> <mi>A</mi> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>B</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mi>B</mi> <mo>&NotEqual;</mo> <mi>A</mi> </mrow> <mi>H</mi> </munderover> <msub> <mi>d</mi> <mrow> <mi>A</mi> <mi>B</mi> </mrow> </msub> </mrow> <mi>H</mi> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>&eta;</mi> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>A</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>H</mi> </munderover> <msub> <mi>&alpha;</mi> <mi>A</mi> </msub> </mrow> <mi>H</mi> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

步骤四，对全部的相关差异度进行排序，提取最大相关差异度α_max所对应的父子部件相对位置作为第1个初始聚类中心，并将当前最大相关差异度从排序中删除，得到新的相关差异度排序；

步骤五，提取出新的相关差异度排序中的α_max所对应的父子部件相对位置，若该相对位置与已选定的全部初始聚类中心的欧氏距离均大于相关差异度均值η，则将该父子部件相对位置视为第2个初始聚类中心，并将当前α_max从排序中删除；否则，直接删除当前的α_max，重复执行步骤五，直至选出全部的初始聚类中心；

步骤六，设第u个聚类集合S_u的聚类中心为c_u，则S_u由如下公式表示；其中P_h分配给S_u的依据是，对于任意其它聚类中心c_v均满足公式(4)中的成员属性，

其中c_u、c_v表示两个聚类中心，u、v∈{1,2,…,K}，K为聚类中心个数，即树图模型的部件类型数量，且u≠v；

<mrow> <msub> <mi>c</mi> <mi>u</mi> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mo>|</mo> <msub> <mi>S</mi> <mi>u</mi> </msub> <mo>|</mo> </mrow> </mfrac> <munder> <mo>&Sigma;</mo> <mrow> <msub> <mi>P</mi> <mi>h</mi> </msub> <mo>&Element;</mo> <msub> <mi>S</mi> <mi>u</mi> </msub> </mrow> </munder> <msub> <mi>P</mi> <mi>h</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

步骤八，若迭代达到最大次数或者是相邻两代的差值小于设定的阈值时，运算结束，获取最终的部件类型聚类中心；否则重复步骤六；

(2)基于隐结构SVM的检测模型训练

结构化SVM是传统SVM分类器的扩展模型，隐结构SVM则是在其基础上考虑了包含隐藏变量的情况，从而令原始的凸优化问题转变为了非凸，增加了模型优化的难度；本方法将数据集中带有人体标注信息的样本视为正样本，随机选取任意适当分辨率下不含行人的图像作为负样本，并以K-means聚类获取的正样本部件类型为隐藏变量，基于隐结构SVM框架训练行人检测模型；具体模型训练步骤如下：

步骤一，为构建树图结构的评分模型，定义一幅图像为I，图像中人体部件的像素位置为p_i＝(x，y)，其中i∈{1,...,m}，；t_i表示部件i的类型，t_i∈{1,...,K}，是通过子部件与其父部件之间的位置关系进行定义的，这种位置关系的类型数量取决于训练时所设立的K-means聚类中心个数K；设t＝{t₁,…,t_K}，构建的人体树图G＝(V，E)，其中V表示人体树图的部件节点集合，E表示部件之间的关系集合，通过定义一个兼顾局部得分和父子部件得分的求和函数来计算部件得分，

<mrow> <mi>S</mi> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>&Element;</mo> <mi>V</mi> </mrow> </munder> <msubsup> <mi>b</mi> <mi>i</mi> <msub> <mi>t</mi> <mi>i</mi> </msub> </msubsup> <mo>+</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>&Element;</mo> <mi>E</mi> </mrow> </munder> <msubsup> <mi>b</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mrow> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> </mrow> </msubsup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>

其中，表示部件i属于某一种特定类型的支持度，表示部件i、j特定共生关系下的支持度，即视为偏置部分；通过如下公式计算图像中部件的类型及其位置的总得分：

其中，表示从图像I中的像素点位置p_i提取的HOG特征向量，ψ(p_i-p_j)＝[dx dx²dy dy²]表示部件i对于部件j的相对位置，其中dx＝x_i-x_j，dy＝y_i-y_j；此外，为部件i在类型t_i时的滤波器模板；表示部件i和j在特定类型组合下的滤波器模板，编码一对部件的静态位置关系和刚度信息，即为共生信息；

步骤二，将正样本集合表示为{I_o，p_o，t_o}，负样本集合为{I_o}，其中I_o表示图像集合，p_o为相应的部件像素点集合，t_o为图像中人体的部件类型集合；令z_o＝(p_o，t_o)，待训练的模型参数为β＝(w，b)，将公式(7)简写为线性函数的形式S(I，z)＝β·f(I，z)，则求解以下公式完成模型训练，

<mrow> <mtable> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>arg</mi> <munder> <mi>min</mi> <mrow> <mi>w</mi> <mo>,</mo> <msub> <mi>&xi;</mi> <mi>o</mi> </msub> <mo>&GreaterEqual;</mo> <mn>0</mn> </mrow> </munder> </mrow> </mtd> <mtd> <mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mi>&beta;</mi> <mo>&CenterDot;</mo> <mi>&beta;</mi> <mo>+</mo> <mi>C</mi> <munder> <mi>&Sigma;</mi> <mi>o</mi> </munder> <msub> <mi>&xi;</mi> <mi>o</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <mo>&ForAll;</mo> <mi>o</mi> <mo>&Element;</mo> <mi>p</mi> <mi>o</mi> <mi>s</mi> </mrow> </mtd> <mtd> <mrow> <mi>&beta;</mi> <mo>&CenterDot;</mo> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>I</mi> <mi>o</mi> </msub> <mo>,</mo> <msub> <mi>z</mi> <mi>o</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>1</mn> <mo>-</mo> <msub> <mi>&xi;</mi> <mi>o</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mo>&ForAll;</mo> <mi>o</mi> <mo>&Element;</mo> <mi>n</mi> <mi>e</mi> <mi>g</mi> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mo>&ForAll;</mo> <mi>z</mi> </mrow> </mtd> <mtd> <mrow> <mi>&beta;</mi> <mo>&CenterDot;</mo> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>I</mi> <mi>o</mi> </msub> <mo>,</mo> <msub> <mi>z</mi> <mi>o</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>&le;</mo> <mo>-</mo> <mn>1</mn> <mo>+</mo> <msub> <mi>&xi;</mi> <mi>o</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>

公式(8)的约束条件是正样本的得分应该高于1；负样本对于每个位置和类型的所有配置的得分都应该低于-1；ξ_o为松弛变量，便于在更大的可行域内求解；C为惩罚因子；

步骤三，采用坐标下降法求解上述二次规划问题，获取检测模型；

(3)基于树图模型与动态规划算法的行人检测

基于上述人体树图结构和离线训练所得的模型，结合动态规划的思想对不同尺度下的测试图像执行人体部件检测，利用非极大值抑制算法获取最优的部件包围盒，并通过合并全部的部件包围盒得到最终的行人检测结果；具体检测步骤如下：

步骤一，设金字塔总层数为θ，求解当前测试图像I的HOG特征金字塔；首先利用高斯金字塔对图形进行降采样，计算公式如下，

<mrow> <msub> <mi>G</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>e</mi> <mo>=</mo> <mo>-</mo> <mn>2</mn> </mrow> <mn>2</mn> </munderover> <munderover> <mo>&Sigma;</mo> <mrow> <mi>g</mi> <mo>=</mo> <mo>-</mo> <mn>2</mn> </mrow> <mn>2</mn> </munderover> <mi>q</mi> <mrow> <mo>(</mo> <mi>e</mi> <mo>,</mo> <mi>g</mi> <mo>)</mo> </mrow> <msub> <mi>G</mi> <mrow> <mi>k</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mn>2</mn> <mi>x</mi> <mo>+</mo> <mi>e</mi> <mo>,</mo> <mn>2</mn> <mi>y</mi> <mo>+</mo> <mi>g</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>

其中G_k(x,y)为第k层高斯金字塔图像，x、y为图像的像素坐标；G₀为原始图像，作为金字塔的底层；q(e,g)＝q(g)·q(g)为高斯卷积核，q为高斯核函数；基于所得的θ层图像金字塔求取相应的HOG特征，获取测试图像的HOG特征金字塔；

步骤二，由于采用的部件模型是树形结构，因此检测图像人体部件的问题通过动态规划的思想解决；将公式(7)转化为动态规划算法的状态转移方程，如下所示，

<mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>,</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msub> <mi>t</mi> <mi>i</mi> </msub> </munder> <msubsup> <mi>b</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mrow> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> </mrow> </msubsup> <mo>+</mo> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <msub> <mi>p</mi> <mi>i</mi> </msub> </munder> <mi>s</mi> <mi>c</mi> <mi>o</mi> <mi>r</mi> <mi>e</mi> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msubsup> <mi>w</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mrow> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> </mrow> </msubsup> <mo>&CenterDot;</mo> <mi>&psi;</mi> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>11</mn> <mo>)</mo> </mrow> </mrow>

其中kids(i)表示树图G中部件i的子部件集合；公式(10)融合了部件i的子部件信息，并计算i在所有像素位置p_i及可能类型t_i下的局部得分；公式(11)用于计算子部件i向父部件j传递的信息，包括父子部件之间的最大共生关系支持度、最大子部件得分和父子部件在特定类型组合下的滤波器模板与父子部件相对位置的卷积；