CN106650667A

CN106650667A - 一种基于支持向量机的行人检测方法及系统

Info

Publication number: CN106650667A
Application number: CN201611221282.3A
Authority: CN
Inventors: 邢薇薇; 魏翔; 卢苇; 杨宇翔; 张顺利
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2016-12-26
Filing date: 2016-12-26
Publication date: 2017-05-10

Abstract

本发明公开了一种基于支持向量机的行人检测方法，所述方法包括：S1：提取训练图像中的边缘和文理信息，处理得到特征向量；S2：对所述特征向量进行降维，得到降维的特征向量；S3：采用引入模拟退火接受准则的遗传算法对支持向量机进行模型训练与特征权重学习；S4：将待检测的图像进行S1和S2的处理，然后输入所述支持向量机进行行人检测，本发明同时公开了一种基于支持向量机的行人检测系统，本发明采用引入模拟退火接受准则的遗传算法对支持向量机进行模型训练与特征权重学习，考虑特征组合对行人检测分类效果的影响，并为所有维度的特征制定权值，提高行人检测的准确度。

Description

一种基于支持向量机的行人检测方法及系统

技术领域

本发明涉及行人检测领域，更具体地，涉及一种基于支持向量机的行人检测方法及系统。

背景技术

随着人类社会的进步和科技的发展，利用计算机来实现行人的自动检测成为了目前计算机领域中最热门的课题之一。行人检测的研究是人工智能与模式识别的一个重要研究课题。行人检测就是检测场景中存在的行人，给出场景中行人的确切位置情况，其在军事管理、安全工程、医疗保健等许多领域内都有着广泛的应用，因此具有重要的使用价值和广阔的发展前景。

目前该领域主要采用的技术路线为训练一个行人分类器，在检测阶段，通过此分类器判断输入图片是否为行人即可。目前所广泛应用的分类器之一为支持向量机。首先通过对人及非人训练数据的特征提取及降维操作，将图片抽象为特征向量。之后将所有训练数据输入于支持向量机模型中对模型进行训练操作。最后在实际检测中，我们通过同样的图像预处理方法将待检测图像抽象为特征向量作为训练好的支持向量机模型的输入，输出结果即分类结果便是对该幅图片是否存在行人的检测结果。

运用支持向量机是一种经典的行人检测方法，由于其快速准确的分类性能，在模式识别领域中有着广泛的应用。但是，由于支持向量机将每一维输入特征同等对待以寻找最优分类超平面，这也就使得支持向量机不能很好地控制特征权重分配问题以达到更佳的分类目的。通常现有的特征加权方法运用熵增益等方式分别确定特征对标签的关联度从而对特征进行权重设定，这类方法在某种程度上能够找出对分类有积极贡献作用的单个特征。然而，此类方法在实践中却往往不能综合考虑特征之间的联系，不能够组合性地为所有维度特征同时赋予权重因子，从而造成了在实际行人检测中，训练出的分类器预测效果反而有所下降的问题。

因此，需要提供一种能够综合考虑特征之间的联系而进行权重改进的基于支持向量机的行人检测方法。

发明内容

本发明要解决的一个技术问题是提供了一种基于支持向量机的行人检测方法，采用引入模拟退火接受准则的遗传算法对支持向量机进行模型训练与特征权重学习，考虑特征组合对行人检测分类效果的影响，并为所有维度的特征制定权值，提高行人检测的准确度，本发明要解决的另一个技术问题是提供一种应用所述方法的一种基于支持向量机的行人检测系统。

为了解决以上技术问题，本发明采用下述技术方案：

本发明一方面公开了一种基于支持向量机的行人检测方法，其特征在于，所述方法包括：

S1：提取训练图像中的边缘和文理信息，处理得到特征向量；

S2：对所述特征向量进行降维，得到降维的特征向量；

S3：采用引入模拟退火接受准则的遗传算法对支持向量机进行模型训练与特征权重学习；

S4：将待检测的图像进行S1和S2的处理，然后输入所述支持向量机进行行人检测。

优选的，采用引入模拟退火接受准则的遗传算法中种群的父代选择方式为随着繁衍代数的增加动态降低接受当前个体作为下一代父代的概率。

优选的，所述S1包括：

S11：将所述训练图像转化为灰度图，并调整所述灰度图的对比度和亮度；

S12：利用方向梯度直方图特征描述算子和局部二值模式特征描述算子分别对图像的边缘及文理特征进行提取，得到方向梯度直方图特征向量和局部二值模式特征向量；

S13：将所述方向梯度直方图特征向量和局部二值模式特征向量进行拼接，得到方向梯度直方图-局部二值模式特征向量。

优选的，所述S2包括：

S21：用主成分分析算法和线性判别分析算法对所述特征向量进行降维，得到基于主成分分析降维的特征向量和基于线性判别分析降维的特征向量；

S22：将所述基于主成分分析降维的特征向量和基于线性判别分析降维的特征向量进行拼接，得到基于主成分分析-线性判别分析降维的特征向量。

优选的，所述S3包括：

S31：根据所述降维的特征向量对引入模拟退火接受准则的遗传算法中的个体及参数进行初始化操作；

S32：设置交叉点的数目，采用混沌序列生成交叉点，并对所述交叉点进行变异操作；

S33：采用引入模拟退火接受准则的遗传算法训练所述支持向量机得到权重向量和固有参数。

优选的，所述交叉点为

x(n+1)＝4*x(n)*(1-x(n))

其中，x(n)代表第n个交叉点归一化后的位置，初始x(0)为一个0～1之间的随机数；

真实的交叉点的设置为

其中，l表示引入模拟退火接受准则的遗传算法的种群中个体的维度。

优选的，所述引入模拟退火接受准则的遗传算法进行计算时，父代的选择过程包括：

S331：计算一个个体的个体适应度；

S332：将所述个体适应度与预设的阈值进行比较，

若所述个体适应度大于所述阈值，则接受所述个体作为下一代繁衍之父代，

否则随机生成一个0～1之间随机数，并进行下一步骤；

S333：计算所述个体的接受概率，

若所述随机数大于所述接受概率，则接受所述个体作为下一代繁衍之父代，

否则抛弃该个体；

S334：进行下一个体的考察，重复S331-S333，直到考察完所有个体。

优选的，所述接受概率为

其中，f(x')表示当前个体的适应度函数，f(x₀)表示个体适应度阈值，k为一个大于0的定值系数，θ为接受概率的衰减系数，0<θ<1，g为当前的迭代代数。

优选的，所述S33进一步得到所述支持向量机的行人检测函数为

其中，sign()为符号函数，若括号中表达式的计算结果大于0，则sign()为1，代表图像中存在行人，否则sign()为-1，代表图像中不存在行人；x为样本的输入特征，y为样本的输出类别；α_i为支持向量机的拉格朗日系数；b为支持向量机判别式中的偏置参数；Ω为遗传算法中的个体。

本发明同时公开了一种基于支持向量机的行人检测系统，其特征在于，所述系统包括：

图像处理模块、权重训练模块和行人检测模块；

所述图像处理模块用于提取训练图像中的边缘和文理信息，处理得到特征向量，并对所述特征向量进行降维，得到降维的特征向量；

所述权重学习模块用于采用引入模拟退火接受准则的遗传算法对所述行人检测模块进行模型训练与特征权重学习；

所述行人检测模块包括支持向量机，用于对所述图片处理模块传输的所述特征向量进行行人检测。

本发明的有益效果如下：

本发明公开的一种基于支持向量机的行人检测系统与方法在传统行人检测系统与方法的基础上引入了特征加权的思想，并通过采用引入模拟退火接受准则的遗传算法综合考虑特征与行人检测准确性、特征组合与行人检测准确性之间的综合联系以实现更为合理的加权，且通过引入模拟退火接受准则增强遗传算法的寻优能力，提高了行人检测分类的准确率。

附图说明

下面结合附图对本发明的具体实施方式作进一步详细的说明。

图1示出一种基于支持向量机的行人检测方法的流程图。

图2示出方向梯度直方图特征描述算子提取特征向量的流程图。

图3示出实施例中局部二值模式特征描述算子提取特征向量的流程图。

图4示出引入模拟退火接受准则的遗传算法流程图。

图5示出引入模拟退火接受准则的遗传算法进行父代选择的流程图。

图6示出本发明行人检测系统与方法在真实场景中进行行人检测的效果图。

图7示出传统遗传算法与本发明中引入模拟退火接受准则的遗传算法在20次寻优中的准确率示意图。

图8示出传统遗传算法与本发明中引入模拟退火接受准则的遗传算法在单次迭代寻优中的收敛曲线图。

图9示出了传统行人检测系统与本发明的行人检测系统在行人检测准确率上的对比示意图。

具体实施方式

为了更清楚地说明本发明，下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解，下面所具体描述的内容是说明性的而非限制性的，不应以此限制本发明的保护范围。

如图1所示，本发明一方面公开了一种基于支持向量机的行人检测方法，其特征在于，所述方法包括：

S1：提取训练图像中的边缘和文理信息，处理得到特征向量。通过特征向量的提取，将训练图像从3维图像信息特征映射至1维，同时保留了图像本身的文理及边缘特性，所述训练图像可采用正例图像和反例图像，所述正例图像为包括行人的图像，所述反例图像为不包括行人的图像。

S11：将所述训练图像转化为灰度图，并调整所述灰度图的对比度及亮度。其中，可选用伽马函数调整所述灰度图的对比度及亮度。

S12：如图2所示，利用方向梯度直方图(HOG)特征描述算子和局部二值模式(LBP)特征描述算子分别对图像的边缘及文理特征进行提取，得到HOG特征向量和LBP特征向量。

根据训练图像的复杂边缘特性表现，可通过运用HOG特征描述算子提取图片中的边缘特征。首先，声明细胞的大小以及以细胞为基础的块的大小。其次，计算训练图像中每一个像素的梯度信息。再次，将梯度信息离散化并以块中细胞为单位对梯度信息进行统计并将所有统计向量进行拼接。最终得到HOG特征向量。HOG是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。HOG通过计算和统计图像局部区域的梯度方向直方图来构成特征，采用HOG对训练图像特征的提取往往能够很好的把握图像的边缘特性。

根据训练图像的复杂文理特性表现，可通过运用LBP特征描述算子提取图片中的纹理特征。同样的，首先，声明细胞的大小以及以细胞为基础的块的大小。其次，对图像进行LBP特征提取。再次，将块中细胞为单位对每一个块中包括的文理向量进行拼接，得到LBP特征向量。

S13：如图3所示，将所述HOG特征向量和LBP特征向量进行拼接，得到HOG-LBP特征向量。

S2：对所述特征向量进行降维，得到降维的特征向量。根据提取的特征向量的多维性以及信息的冗余性，采用降维的方法对提取到的特征向量进行降维操作，在不损失提取的特征向量的主要信息的同时能够大大降低原有数据的维度，并且有效过滤一些冗余信息。

S21：用主成分分析(PCA)和线性判别分析(LDA)算法对所述特征向量进行降维，得到基于PCA降维的特征向量和基于LDA降维的特征向量；

S22：将所述基于PCA降维的特征向量和基于LDA降维的特征向量进行拼接，得到基于PCA-LDA降维的特征向量。

S3：如图4所示，采用引入模拟退火接受准则的遗传算法(MGA)对支持向量机进行模型训练与特征权重学习。

S31：根据所述基于PCA-LDA降维的特征向量对MGA中的种群和参数进行初始化操作，初始化定义种群及其规模，同时初始化种群中的个体为与特征向量同维的向量Ω，其中每一维均为随机生成。

S32：设置交叉点的数目，采用混沌序列生成交叉点，并对所述交叉点进行变异操作。所述交叉点为

x(n+1)＝4*x(n)*(1-x(n))

真实的交叉点的设置为

其中，l表示MGA的种群中个体的维度。

变异操作可采用3点分割4段交叉方式实现。

S33：采用MGA训练所述支持向量机得到权重向量和固有参数。

如图5所示，所述MGA进行迭代计算时，父代的选择过程包括：

S331：计算一个个体的个体适应度；

S332：将所述个体适应度与预设的阈值进行比较，

否则随机生成一个0～1之间随机数，并进行下一步骤；

S333：计算所述个体的接受概率，

否则抛弃该个体；

其中，接受概率为

当达到预定迭代代数时，MGA求解结束，得到最优的权重向量和支持向量机的固有参数。其中，支持向量机中核函数可选择线性核函数。通过求解特征加权支持向量机中固有参数及权重向量，最终得到支持向量机的行人检测函数为

其中，sign()为符号函数，若括号中表达式的计算结果大于0，则sign()为1，代表图像中存在行人，否则sign()为-1，代表图像中不存在行人；x为样本的输入特征，y为样本的输出类别；α为支持向量机的拉格朗日系数，若对应α_i不为0，则该样本为支持向量，否则不是支持向量；b为支持向量机判别式中的偏置参数；Ω为MGA中的个体。

可以看出，在同一代中，具有更高适应度值的个体有更高几率被选为下一代的父代。并且，随着迭代代数的增长，exp分母将变大，最终致使整体接受概率变小，从而满足了随着迭代代数的增加，动态减少接受概率的目的。此种动态改变接受概率的思想与传统父代选择方法相比更加贴近自然界的演化过程，本发明中MGA的演化过程为初期由于环境并不稳定，个体繁多且竞争激烈，但是随着时间的推移，环境日趋平稳，并且种类逐渐减少，优胜劣汰现象日趋稳定。

本发明另一方面同时公开了一种基于支持向量机的行人检测系统，其特征在于，所述系统包括：

图像处理模块、权重训练模块和行人检测模块。

具体的，所述图像处理模块用于提取训练图像中的边缘和文理信息，处理得到特征向量。通过特征向量的提取，将训练图像从3维图像信息特征映射至1维，同时保留了图像本身的文理及边缘特性，所述训练图像可采用正例图像和反例图像，所述正例图像为包括行人的图像，所述反例图像为不包括行人的图像。其中，所述图像处理模块用于将所述训练图像转化为灰度图，并调整所述灰度图的对比度及亮度。其中，可选用伽马函数调整所述灰度图的对比度及亮度。利用HOG特征描述算子和LBP特征描述算子分别对图像的边缘及文理特征进行提取，得到HOG特征向量和LBP特征向量。根据训练图像的复杂边缘特性表现，可通过运用HOG特征描述算子提取图片中的边缘特征。首先，声明细胞的大小以及以细胞为基础的块的大小。其次，计算训练图像中每一个像素的梯度信息。再次，将梯度信息离散化并以块中细胞为单位对梯度信息进行统计并将所有统计向量进行拼接。最终得到HOG特征向量。HOG是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。HOG通过计算和统计图像局部区域的梯度方向直方图来构成特征，采用HOG对训练图像特征的提取往往能够很好的把握图像的边缘特性。根据训练图像的复杂文理特性表现，可通过运用LBP特征描述算子提取图片中的纹理特征。同样的，首先，声明细胞的大小以及以细胞为基础的块的大小。其次，对图像进行LBP特征提取。再次，将块中细胞为单位对每一个块中包括的文理向量进行拼接，得到LBP特征向量。将所述HOG特征向量和LBP特征向量进行拼接，得到HOG-LBP特征向量。所述图像处理模块还用于对所述特征向量进行降维，得到降维的特征向量。根据提取的特征向量的多维性以及信息的冗余性，采用降维的方法对提取到的特征向量进行降维操作，在不损失提取的特征向量的主要信息的同时能够大大降低原有数据的维度，并且有效过滤一些冗余信息。其中，所述图像处理模块用于用PCA和LDA算法对所述特征向量进行降维，得到基于PCA降维的特征向量和基于LDA降维的特征向量，将所述基于PCA降维的特征向量和基于LDA降维的特征向量进行拼接，得到基于PCA-LDA降维的特征向量。

所述权重学习模块用于采用引入模拟退火接受准则的遗传算法对所述行人检测模块进行模型训练与特征权重学习。

所述权重学习模块用于采用MGA对支持向量机进行模型训练与特征权重学习。具体的，所述权重学习模块用于根据所述基于PCA-LDA降维的特征向量对MGA中的种群和参数进行初始化操作，初始化定义种群及其规模，同时初始化种群中的个体为与特征向量同维的向量Ω，其中每一维均为随机生成，设置交叉点的数目，采用混沌序列生成交叉点，并对所述交叉点进行变异操作。所述交叉点为

x(n+1)＝4*x(n)*(1-x(n))

真实的交叉点的设置为

其中，l表示MGA的种群中个体的维度。

变异操作可采用3点分割4段交叉方式实现，采用MGA训练所述支持向量机得到权重向量和固有参数。

所述权重学习模块用于所述MGA的父代选择：计算一个个体的个体适应度；将所述个体适应度与预设的阈值进行比较，若所述个体适应度大于所述阈值，则接受所述个体作为下一代繁衍之父代，否则随机生成一个0～1之间随机数，计算所述个体的接受概率，若所述随机数大于所述接受概率，则接受所述个体作为下一代繁衍之父代，否则抛弃该个体；同样的，进行下一个体的考察，直到考察完所有个体。

其中，接受概率为

下面通过一个具体实施例来对本发明作进一步的说明，本实施例中训练图像为64*128像素分辨率，声明细胞的大小为8*8个像素，声明块的大小为2*2个细胞，每一幅图片将最终提取到105个块，每个块将包含一个36维的向量来表示其梯度特征，最终每幅图将被抽象为105*36＝3780维度的HOG特征向量；声明离散化梯度方向为9个无符号方向并以细胞为单位进行梯度统计，运用参数对图像进行LBP特征提取，其中下标的8，2代表每一个像素选择半径为2个像素的8个位置进行纹理编码，上标的2代表了此处的LBP特征为均匀LBP模式。通过与中心像素灰度值的比较，8个位置中大于此值的将赋值为1，否则为0，组成8位向量。注意由于采用了均匀LBP，此处仅有59个不同类型的8位向量。与HOG中块的声明一致，此处每一幅图也将得到105个块，对于每一个块将包含一个59维的纹理统计描述向量，最终每一幅图将被抽象为一个59*105＝6195维度的LBP特征。最终将两种特征进行拼接，组装成9975维的HOG-LBP的特征向量。

运用PCA对9975维的HOG-LBP的特征向量进行降维。考虑到信息的保留量以及冗余信息的有效过滤，本实施例中中我们将维度降至200维。运用LDA对9975维的HOG-LBP的特征向量进行降维。由于原本数据为2分类问题，此处我们将数据降至1维。将以上提取到的降维后特征向量进行拼接，最终组成201维的特征向量。

运用MGA解决支持向量机中特征加权问题，此时将充分考虑特征与分类以及特征间的协同关系来对特征进行加权操作。与传统方法比较，本发明方法能够找到更为合理的组合权重而非单独对每一维特征权重进行赋值。

本实施例首先将对MGA中的参数进行初始化操作。其中种群个体的初始化定义为201维的向量Ω，其中每一维均为随机生成(0～1之间)，并且设定初始种群规模为100。

本实施例在MGA交叉过程中运用混沌序列生成交叉点，所述交叉点的公式如下：

x(n+1)＝4*x(n)*(1-x(n))

其中，x(n)代表第n个交叉点归一化后的位置。

真实的交叉点设置为P(n)，公式如下：

其中l代表种群中个体Ω的维度，本实施例中为201。本发明中设置交叉点的数目为50，初始化x(0)为一个0～1之间的随机数。假设初始化x(0)为0.3，则x(1)为0.84，x(2)为0.5376,并以此类推得出剩余的位置。最终，真实的交叉点为61,169,109……

变异操作过程通过3点分割4段交叉实现。

本实施例中使选择过程优化为随着繁衍代数的增加动态降低接受x'作为下一代父代的概率p(x→x')。公式如下：

其中，个体的适应度函数为在该个体所表示的特征加权条件下支持向量机的分类准确率，即如若此时的特征加权分类效果更佳，则其在MGA中体现的适应度函数值越高。f(x₀)表示一个适应度阈值，仅当个体适应度小于此阈值时才进行概率性选择接受，在本发明中我们经验性地设置其为当前种群中排名四分之一处的适应度。k为一个大于0的定值系数，用于控制初始接受概率，本实施例中设置其为1。θ为接受概率的衰减系数(0<θ<1)，本实施例中设置其为0.9。g为当前的迭代代数。

MGA直到达到预定迭代次数后终止迭代，并且返回学习到的权重向量以及支持向量机参数。得到包含支持向量机的行人检测模块之后，当有待检测之图像或视频提供后，通过特征向量提取对整幅图像进行切分并进行特征向量提取及降维，之后运用学习到的行人检测模型判断其采样是否为行人，本发明对行人检测的结果如图6所示。

如图7所示，原始遗传算法(原始GA)与本发明中的MGA在20次运行中的准确率，可以明显看出，MGA拥有更强的优化性能。

如图8所示，本发明采用的MGA在单次训练收敛曲线中的寻优及收敛能力为97.47％，原始GA在单次训练收敛曲线中的寻优及收敛能力为98.21％，本发明所训练的行人检测系统能够达到更为准确的行人检测之目的。

如图9所示，在FPR10^-2的考量指标下，本发明提出的基于MGA加权的行人检测系统(MGA-SVM)达到了97.67％的准确率，相比较最原始的无特征加权情况下的行人检测系统(PCA-SVM)的准确率为90.74％，基于AUC曲线确定特征权值方法的行人检测系统(AUC-SVM)的准确率为90.96％，原始GA进行特征加权的行人检测系统(原始GA-SVM)的准确率为93.37％，本发明显然拥有意想不到的在分类准确率上的提升。

本发明首先引入特征加权思想于支持向量机中以提高其检测准确率；其次本发明首次运用优化的遗传算法思想，综合考虑特征与分类准确性、特征组合与分类准确性之间的综合联系制定特征权重向量，以能够实现更为合理的加权操作，且与传统GA不同，本发明所提出并使用的MGA在迭代寻优能力上明显强于现有传统GA。

综上，本发明公开的一种基于支持向量机的行人检测系统与方法，通过引入特征加权思想于行人检测系统的支持向量机中，并且首次运用MGA来解决此支持向量机中的特征加权问题，提高了现有行人检测算法的准确率。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定，对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims

1.一种基于支持向量机的行人检测方法，其特征在于，所述方法包括：

S2：对所述特征向量进行降维，得到降维的特征向量；

2.根据权利要求1所述方法，其特征在于，采用引入模拟退火接受准则的遗传算法中种群的父代选择方式为随着繁衍代数的增加动态降低接受当前个体作为下一代父代的概率。

3.根据权利要求1所述方法，其特征在于，所述S1包括：

4.根据权利要求1所述方法，其特征在于，所述S2包括：

5.根据权利要求1所述方法，其特征在于，所述S3包括：

6.根据权利要求5所述方法，其特征在于，所述交叉点为

x(n+1)＝4*x(n)*(1-x(n))

真实的交叉点的设置为

7.根据权利要求5所述方法，其特征在于，所述引入模拟退火接受准则的遗传算法进行计算时，父代的选择过程包括：

S331：计算一个个体的个体适应度；

S332：将所述个体适应度与预设的阈值进行比较，

否则随机生成一个0～1之间随机数，并进行下一步骤；

S333：计算所述个体的接受概率，

否则抛弃该个体；

8.根据权利要求7所述方法，其特征在于，所述接受概率为

p (x &RightArrow; x^{'}) = \{\begin{matrix} 1, & \begin{matrix} i f & f (x^{'}) &GreaterEqual; f (x_{0}) \end{matrix} \\ \exp (- \frac{f (x_{0}) - f (x^{'})}{k * θ^{g}}), & e l s e \end{matrix}

9.根据权利要求5所述方法，其特征在于，所述S33进一步得到所述支持向量机的行人检测函数为

s (x) = s i g n (Σ_{i = 1}^{l} α_{i} y^{(i)} {(x^{(i)})}^{T} {ΩΩ}^{T} x + b)

10.一种基于支持向量机的行人检测系统，其特征在于，所述系统包括：

图像处理模块、权重训练模块和行人检测模块；