CN109117717A

CN109117717A - 一种城市行人检测方法

Info

Publication number: CN109117717A
Application number: CN201810696570.7A
Authority: CN
Inventors: 杨军
Original assignee: Guangzhou Fiberhome Zhongzhi Digital Technology Co Ltd
Current assignee: Guangzhou Fiberhome Zhongzhi Digital Technology Co Ltd
Priority date: 2018-06-29
Filing date: 2018-06-29
Publication date: 2019-01-01

Abstract

本发明公开了一种城市行人检测方法，包括以下步骤：S1、通过图像特征获取模块接收原始图像；S2、将接收的原始图像通过图像处理模块进行处理；S3、特征图扩展；S4、将所述整体特征图像和所述局部特征放大图像依次连接；S5、分类网络训练：利用多种尺度行人在不同特征图中的的分布训练深度神经网络；S6、行人检测标注：将得到的两种规模特征图的候选窗口数目按比例汇总，经过S5中训练好的分类器分类，经过非极大值抑制后框出行人；S7、检测结果显示。本发明采用整体特征图像与局部放大特征图像配合检测，提高了行人检测的准确性，并且利不同特征图上检测用不同权值加权有效避免了单一特征图检测的误判和漏检。

Description

一种城市行人检测方法

技术领域

本发明涉及目标检测领域，具体是一种城市行人检测方法。

背景技术

行人检测(Pedestrian Detection)是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可与行人跟踪，行人重识别等技术结合，应用于人工智能系统、车辆辅助驾驶系统、智能机器人、智能视频监控、人体行为分析、智能交通等领域。由于行人兼具刚性和柔性物体的特性，外观易受穿着、尺度、遮挡、姿态和视角等影响，使得行人检测成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。

现有行人检测方法有三种，分别为基于全局特征的方法、基于人体部位的方法、基于立体视觉的方法。

近年来，行人检测技术在智能监控、自动驾驶、机器人视觉等方面具有广泛的应用。实际应用中行人的着装，姿态尤其是视频中捕捉到的行人尺寸多变使得行人检测面临极大的挑战性。行人检测主要有两大方式：一种是基于滑动窗口的传统的行人检测方法，一种是基于深度学习提取特征的行人检测方法。传统的行人检测方法计算量大且没有利用GPU资源检测速度受限，由于计算机性能不断增强并且利用了GPU计算能力，大多基于学习特征的深度学习方法检测速度优于传统方法，但是往往难以解决行人的多尺度问题。

发明内容

本发明的目的在于提供一种城市行人检测方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种城市行人检测方法，包括以下步骤：

S1、通过安装于城市道路旁的摄像头采集行人图像，并将采集的图像上传，通过图像特征获取模块接收原始图像；

S2、将接收的原始图像通过图像处理模块进行处理，并提取其中的局部特征，进行放大，其中，所述图像特征图(或者叫地标图)是指利用参数化特征(如点和线)的全局位置来表示环境；

S3、特征图扩展：通过图像幂率规则和图像特征金字塔规则计算图像临近规模对应的特征图；

S4、将所述整体特征图像和所述局部特征放大图像依次连接，并将整体特征图像和所述局部特征放大图像输送到特征数据库模块进行比对；

S5、分类网络训练：利用多种尺度行人在不同特征图中的的分布训练深度神经网络；

S6、行人检测标注：将得到的两种规模特征图的候选窗口数目按比例汇总，经过S5中训练好的分类器分类，经过非极大值抑制后框出行人；

S7、检测结果显示。

作为本发明进一步的方案：所述S2中将接收的图像进行提取放大的步骤为：从整体特征图像中，扫面选取行人的明显特征，并通过放大，清晰的处理，将局部特征显现处理，并进行保存。

作为本发明再进一步的方案：所述S3中扩展的图片规模和扩展次数不设限。

作为本发明再进一步的方案：所述S3中对特征图扩展的步骤为：通过图像幂率规则和图像特征金字塔规则计算图像I1临近规模对应的特征图，一般利用fm＝Cp(S(I1，M))，式中I1代表原图像，M代表缩放规模，S代表将原图缩放，Cp代表卷积池化操作计算特征，现在为减少卷积运算提高运行速度，利用公式：

其中：参数m表示当前规模，m’表示缩放后的规模，S代表将特征图缩放m’/m倍，f表示特征，常系数α可以在训练集上通过实验测得，以上公式表明原图Im通过卷积池化操作得到特征，临近缩放规模图像特征由已知特征图近似计算得到，如1/2*I1可以计算得到f1/2，因为图像上采样没有高频损失，上采样图片的信息内容与低分辨率的内容相似，特征计算公式为：

fσ＝σ*S(f1，σ)(3.2)

式中f1代表原图对应特征图，S代表将特征图f1放大σ倍，fσ为上采样图像。

作为本发明再进一步的方案：所述S5中对分类网络训练包括：选择在有多种行人尺度的KITTI数据集上实验，我们在训练数据集上将行人按高度分为X个尺寸的行人。

作为本发明再进一步的方案：利用卷积层特征共享训练RPN(region proposalnetwork)网络和softmax分类器联合网络，采用交叉轮流训练的方式，先训练区域提议网络(R P N)，再用提议(proposal)训练基于区域的分类器网络，再用分类器网络训练区域提议网络，损失层(losslayer)是卷积神经网络(CNN)的终点，接受两个值作为输入，其中一个是CNN的预测值，另一个是真实标签。

作为本发明再进一步的方案：所述损失层则将这两个输入进行一系列运算，得到当前网络的损失函数(LossFunction)，一般记做L(W)，其中W是当前网络权值构成的向量空间，训练网络的目的是在权值空间中找到让损失函数L(W)最小的权值W(opt)，可以采用随机梯度下降(stochasticgradient descent)的最优化方法逼近权值W(opt)，网络中有两个损失函数，一个是分类损失函数一个是回归损失函数。

作为本发明再进一步的方案：所述S6中对行人检测标注的步骤为：每个规模的候选行人分别与S5中训练得到的权重lx相乘，通过非极大值抑制，除去与最大置信度窗口重叠超过65％的窗口。

与现有技术相比，本发明的有益效果是：本发明采用整体特征图像与局部放大特征图像配合检测，提高了行人检测的准确性，并且利不同特征图上检测用不同权值加权有效避免了单一特征图检测的误判和漏检。

附图说明

图1为城市行人检测方法的流程框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明实施例中，一种城市行人检测方法，包括以下步骤：

S3、特征图扩展：通过图像幂率规则和图像特征金字塔规则计算图像临近规模对应的特征图，此处扩展的图片规模和扩展次数不设限；

S7、检测结果显示。

所述S2中将接收的图像进行提取放大的步骤为：从整体特征图像中，扫面选取行人的明显特征，并通过放大，清晰的处理，将局部特征显现处理，并进行保存。

所述S3中对特征图扩展的步骤为：通过图像幂率规则和图像特征金字塔规则计算图像I₁临近规模对应的特征图，一般利用f_m＝C_p(S(I₁，M))，式中I₁代表原图像，M代表缩放规模，S代表将原图缩放，C_p代表卷积池化操作计算特征，现在为减少卷积运算提高运行速度，利用公式：

其中：参数m表示当前规模，m`表示缩放后的规模，S代表将特征图缩放m`/m倍，f表示特征，常系数α可以在训练集上通过实验测得，以上公式表明原图Im通过卷积池化操作得到特征，临近缩放规模图像特征由已知特征图近似计算得到，如1/2*I1可以计算得到f1/2，因为图像上采样没有高频损失，上采样图片的信息内容与低分辨率的内容相似，特征计算公式为：

fσ＝σ*S(f1，σ))(3.2)

式中f₁代表原图对应特征图，S代表将特征图f₁放大σ倍，fσ为上采样图像。

所述S5中对分类网络训练的步骤为：

1、选择在有多种行人尺度的KITTI数据集上实验，我们在训练数据集上将行人按高度分为X个尺寸的行人(此处尺寸级数不设限)；

2、利用卷积层特征共享训练RPN(region proposal network)网络和softmax分类器联合网络，采用交叉轮流训练的方式，先训练区域提议网络(RPN)，再用提议(proposal)训练基于区域的分类器网络，再用分类器网络训练区域提议网络。损失层(losslayer)是卷积神经网络(CNN)的终点，接受两个值作为输入，其中一个是CNN的预测值，另一个是真实标签。损失层则将这两个输入进行一系列运算，得到当前网络的损失函数(LossFunction)，一般记做L(W)，其中W是当前网络权值构成的向量空间。训练网络的目的是在权值空间中找到让损失函数L(W)最小的权值W(opt)，可以采用随机梯度下降(stochasticgradientdescent)的最优化方法逼近权值W(opt)，网络中有两个损失函数，一个是分类损失函数一个是回归损失函数；

所述S6中对行人检测标注的步骤为：每个规模的候选行人分别与S5中训练得到的权重lx相乘，通过非极大值抑制，除去与最大置信度窗口重叠超过65％的窗口。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种城市行人检测方法，其特征在于，包括以下步骤：

S7、检测结果显示。

2.根据权利要求1所述的一种城市行人检测方法，其特征在于，所述S2中将接收的图像进行提取放大的步骤为：从整体特征图像中，扫面选取行人的明显特征，并通过放大，清晰的处理，将局部特征显现处理，并进行保存。

3.根据权利要求1所述的一种城市行人检测方法，其特征在于，所述S3中扩展的图片规模和扩展次数不设限。

4.根据权利要求1所述的一种城市行人检测方法，其特征在于，所述S3中对特征图扩展的步骤为：通过图像幂率规则和图像特征金字塔规则计算图像I₁临近规模对应的特征图，一般利用f_m＝C_p(S(I₁，M))，式中I₁代表原图像，M代表缩放规模，S代表将原图缩放，C_p代表卷积池化操作计算特征，现在为减少卷积运算提高运行速度，利用公式：

其中：参数m表示当前规模，m′表示缩放后的规模，S代表将特征图缩放m′/m倍，f表示特征，常系数α可以在训练集上通过实验测得，以上公式表明原图Im通过卷积池化操作得到特征，临近缩放规模图像特征由已知特征图近似计算得到，如1/2*I1可以计算得到f1/2，因为图像上采样没有高频损失，上采样图片的信息内容与低分辨率的内容相似，特征计算公式为：

fσ＝σ*S(f1，σ)) (3.2)

5.根据权利要求1所述的一种城市行人检测方法，其特征在于，所述S5中对分类网络训练包括：选择在有多种行人尺度的KITTI数据集上实验，我们在训练数据集上将行人按高度分为X个尺寸的行人。

6.根据权利要求5所述的一种城市行人检测方法，其特征在于，利用卷积层特征共享训练RPN(region proposal network)网络和softmax分类器联合网络，采用交叉轮流训练的方式，先训练区域提议网络(R P N)，再用提议(proposal)训练基于区域的分类器网络，再用分类器网络训练区域提议网络，损失层(losslayer)是卷积神经网络(CNN)的终点，接受两个值作为输入，其中一个是CNN的预测值，另一个是真实标签。

7.根据权利要求6所述的一种城市行人检测方法，其特征在于，所述损失层则将这两个输入进行一系列运算，得到当前网络的损失函数(LossFunction)，一般记做L(W)，其中W是当前网络权值构成的向量空间，训练网络的目的是在权值空间中找到让损失函数L(W)最小的权值W(opt)，可以采用随机梯度下降(stochasticgradient descent)的最优化方法逼近权值W(opt)，网络中有两个损失函数，一个是分类损失函数一个是回归损失函数。

8.根据权利要求1所述的一种城市行人检测方法，其特征在于，所述S6中对行人检测标注的步骤为：每个规模的候选行人分别与S5中训练得到的权重1x相乘，通过非极大值抑制，除去与最大置信度窗口重叠超过65％的窗口。