CN105975907B

CN105975907B - 基于分布式平台的svm模型行人检测方法

Info

Publication number: CN105975907B
Application number: CN201610269005.3A
Authority: CN
Inventors: 武克杰; 吴建伟; 鲁星星
Original assignee: Jiangsu Huatong Sheng Yun Technology Co Ltd
Current assignee: Shandong Jinjia Packaging Technology Co., Ltd
Priority date: 2016-04-27
Filing date: 2016-04-27
Publication date: 2019-05-21
Anticipated expiration: 2036-04-27
Also published as: CN105975907A

Abstract

本发明公开了一种基于分布式平台的SVM模型行人检测方法，包括：采用分布式spark平台的开源通信模块接收并存储监控设备中的图片流；使用行人检测框将图片流生成多个弹性分布式数据集RDD，对每个RDD进行独立计算；将RDD中的数据集通过非线性SVM检测算法，来确定对应检测框是否为行人，如果为行人，将检测框的位置保存到新的RDD中；将所有检测为行人的RDD合并成一个新的RDD，将所有检测框中为同一个行人的检测框合并；在图片上绘制合并后的检测框的位置，并保存至分布式spark平台。将检测图片分成多个弹性分布式数据集，有效的提高行人检测的效率。同时通过对支持向量机中权值进行改进，提高对行人检测的准确度。

Description

基于分布式平台的SVM模型行人检测方法

技术领域

本发明涉及一种应用分布式平台的目标提取，快速准确检测到视频帧中行人位置的方法，具体地涉及一种基于分布式平台的SVM模型行人检测方法。

背景技术

传统的行人检测方法采用视频背景建模方法、运动差帧检测法、光流目标检测法等，这些方法先是提取目标，然后通过分类的方法提取行人。这些方法适合于背景比较简单的场景，但是在背景比较复杂的情况下，提取的目标会出现粘连现象，在分类时将其误认为是其它目标，还有背景受到光照的影响，会将背景误检测为目标。

同时，传统检测方法当行人在视频中运动速度过小、静止的情况下、运动目标受到光照的影响时，也不能有效提取出行人目标。

近期出现了许多基于模型的行人检测算法，其中检测算法分为计算性能比较好但检测精确不是较高、检测精度比较高但计算性能比较慢的两种模型。如快速线性SVM模型、adaboost检测HOG特征模型、卷积神经网络就是快速模型，非线性SVM模型、DPM模型、深度神经网络模型就是准确度比较好的模型。

中国专利文献CN 104899559公开了一种基于视频监控的快速行人检测方法，检测方法包括图像采样、参数设定和图像预处理、运动检测、利用CENTRIST描述符和线性SVM分类器进行行人检测等步骤。在原有SVM分类算法基础上提出了一种改进算法——快速分类的支持向量机算法(FCSVM)。在不明显降低SVM算法分类效果的基础上减少训练出来的支持向量的个数，减少了检测时决策函数的时间开销。该检测方法仅仅是减少支持向量机的个数，无法从根本上提高行人检测的运行速度。

发明内容

针对上述技术问题，本发明目的是：提供一种基于分布式平台的SVM模型行人检测方法，利用Spark平台中多个弹性分布式数据集能同时计算的优势，将检测图片分成多个弹性分布式数据集，然后同时进行图片块处理，能有效的提高行人检测的效率。同时通过对支持向量机中权值进行改进，增强了训练模型的泛化能力，进一步提高对行人检测的准确度。

本发明的技术方案是：

一种基于分布式平台的SVM模型行人检测方法，其特征在于，包括以下步骤：

S01：采用分布式spark平台的开源通信模块akka接收并存储监控设备中的图片流；

S02：使用行人检测框将图片流生成多个弹性分布式数据集RDD，对每个RDD进行独立计算；

S03：将RDD中的数据集通过非线性SVM检测算法，来确定对应检测框是否为行人，如果为行人，将检测框的位置保存到新的RDD中；

S04：将所有检测为行人的RDD合并成一个新的RDD，将所有检测框中为同一个行人的检测框合并；

S05：在图片上绘制合并后的检测框的位置，并保存至分布式spark平台。

优选的，所述步骤S02具体包括：

S11：将图片高度分成hd＝height/xdiv*2-2块，图片宽度分成wd＝width/ydiv*2-2块，其中，ydiv为行人检测框的行人高度，xdiv为行人检测框的行人宽度，height为图片高度，width为图片宽度；

S12：行人检测框扫描时按照水平方向扫描，当前水平方向结束时，按照垂直方向步长移动到下一个水平方向，进行下一个水平方向扫描，直至扫描完整个图片，并将对应检测框和检测框数据生成RDD，水平方向扫描的步长为行人宽度，垂直方向的步长为行人高度；

S13：缩小图片，重复步骤S11到S12，直至图片宽度和高度分别小于行人高度和宽度。

优选的，所述步骤S03具体包括：

S21：将检测框生成的图片块RDD通过SOBEL边缘检测算子再次分成3*8块的细胞块RDD；

S22：对每个细胞块RDD进行CT直方图统计，再联合生成3*8*256维移动图片块的CT特征直方图RDD；

S23：加载精确非线性SVM检测模型，通过该检测模型对联合生成的3*8*256维移动图片块的CT特征直方图RDD进行预测，如果预测结果大于0则为行人，反之则为背景。

优选的，所述步骤S22包括：以3*3模版检测框扫描细胞块RDD，若边缘值小于中心值则将边缘对应值置为0，如果大于中心值则将边缘值置为1，最后从中心开始按逆时针连接数据，转换成十进制后赋值给中心点像素值，然后将整个细胞块RDD生成对应CT特征图片块，再对图片块进行直方图统计，最终生成256维的CT特征直方图图片块。

优选的，所述步骤S23包括以下步骤：

S31：选取改进的支持向量机模型作为训练模型，其训练模型目标函数为其对应的约束条件为y＝w'φ(x_i)+b+ε_i，通过目标函数和约束条件推导出判别函数其中权值α_i＝Cs_iε_i，C为惩罚因子，是一个可调参数，i是1到n个训练样本数目，w为权向量，s_i是正样本和负样本的欧式距离，并作为目标函数中惩罚因子的加权系数，b为阈值，ε_i为误差，φ(x_i)为核函数；

S32：将惩罚因子C设成1到100之间，对预先准备好的行人的正负样本进行特征提取，对应的核函数φ(x_i)为min(x(i),x_s(i))，其中x(i),x_s(i)是任意两个正负样本提取到的特征向量；正样本的标签是值为1，负样本标签值为-1，离线训练得到判别函数的α_i和b，其中判别函数就是对应的非线性SVM检测模型；

S33：通过判断检测模型的结果y_i，如果大于0，则认为该检测框里是行人，反之，则认为该检测框是背景。

优选的，所述合并检测框包括以下步骤：

S41：把检测框之间横向距离小于0.55-0.65宽度和纵向距离小于0.55-0.65高度的检测框合并；

S42：将检测框宽度超过图像宽度和高度一半的去掉，同时把检测框高度和宽度小于9-11个像素检测框去掉。

与现有技术相比，本发明的优点是：

本发明改进了训练模型和检测算法，其中主要是在训练模型目标函数中添加了惩罚因子的加权系数，增强了训练模型的泛化能力，同时采用了核函数min(x(i),x_s(i))，使得检测模型更适合复杂情况和光照不稳定情况，能稳定地检测到行人。同时通过分布式spark平台将一幅图片分成多个RDD，解决了传统检测算法计算时间长和计算负载比较大的问题，能快速检测到图片中的行人，能很好地处理静态和动态图片的检测。

附图说明

下面结合附图及实施例对本发明作进一步描述：

图1为本发明基于分布式平台的SVM模型行人检测方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面结合具体实施方式并参照附图，对本发明进一步详细说明。应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

实施例：

(1)如图1中所示，把监控设备产生的需要行人检测的数据传送到分布式Spark平台上。

(2)搭建spark平台集群，使用一台服务器作为Master，4台服务器作为Slaver。其中Master主要记录了数据流之间的依赖关系并负责任务调度以及生成新的RDD。Slaver主要是实现算法的计算和数据的存储功能

(3)将接收到的图片转换成spark Streaming，然后按照行人检测框将图片流分成多个RDD来分片处理。

(4)选取改进的支持向量机模型作为训练模型，其训练模型目标函数为其对应的约束条件为y＝w'φ(x_i)+b+ε_i，通过目标函数和约束条件推导出判别函数其中权值α_i＝Cs_iε_i，C为惩罚因子，是一个可调参数，i是1到n个训练样本数目，w为权向量，s_i是正样本和负样本的欧式距离，并作为目标函数中惩罚因子的加权系数，b为阈值，ε_i为误差，φ(x_i)为核函数；

将惩罚因子C设成1到100之间，对预先准备好的行人的正负样本进行特征提取，对应的核函数φ(x_i)为min(x(i),x_s(i))，其中x(i),x_s(i)是任意两个正负样本提取到的特征向量；正样本的标签是值为1，负样本标签值为-1，离线训练得到判别函数的α_i和b，其中判别函数就是对应的非线性SVM检测模型；

通过判断检测模型的结果y_i，如果大于0，则认为该检测框里是行人，反之，则认为该检测框是背景。

(5)对检测的到为行人的检测框通过spark中的join将检测框的数据放到一个新的RDD中，然后再对检测框进行合并，其中合并比较近的检测框，删除比较大和比较小的检测框。

(6)在图片上绘制合并后的检测框的位置，将检测框的位置数据赋值为255，使得保存后的图片上绘制出对应的检测框。

本发明解决模型检测性能和准确率不能兼容的问题，通过分布式中的spark平台可以快速、准确、稳定的检测到目标，同时spark平台可以并行处理多个监控设备传来的视频监控图像。

应当理解的是，本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理，而不构成对本发明的限制。因此，在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。此外，本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims

1.一种基于分布式平台的SVM模型行人检测方法，其特征在于，包括以下步骤：

所述步骤S03具体包括：

S22：对每个细胞块RDD进行CT直方图统计，再联合生成3*8*256维移动图片块的CT直方图RDD；

S23：加载精确非线性SVM检测模型，通过该检测模型对联合生成的3*8*256维移动图片块的CT直方图RDD进行预测，如果预测结果大于0则为行人，反之则为背景；

所述步骤S23包括以下步骤：

S33：通过判断检测模型的结果y_i，如果大于0，则认为该检测框里是行人，反之，则认为该检测框是背景；

2.根据权利要求1所述的基于分布式平台的SVM模型行人检测方法，其特征在于，所述步骤S02具体包括：

3.根据权利要求1所述的基于分布式平台的SVM模型行人检测方法，其特征在于，所述步骤S22包括：以3*3模版检测框扫描细胞块RDD，若边缘值小于中心值则将边缘对应值置为0，如果大于中心值则将边缘值置为1，最后从中心开始按逆时针连接数据，转换成十进制后赋值给中心点像素值，然后将整个细胞块RDD生成对应CT图片块，再对图片块进行直方图统计，最终生成256维的CT直方图图片块。

4.根据权利要求1所述的基于分布式平台的SVM模型行人检测方法，其特征在于，所述合并检测框包括以下步骤：

S41：把检测框之间横向距离小于0.65宽度和纵向距离小于0.65高度的检测框合并；

S42：将检测框宽度超过图像宽度和高度一半的去掉，同时把检测框高度和宽度小于11个像素检测框去掉。