CN110895681A

CN110895681A - 基于yolo v3的行人识别方法

Info

Publication number: CN110895681A
Application number: CN201910962299.1A
Authority: CN
Inventors: 尚振宏; 孟本成
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2019-10-11
Filing date: 2019-10-11
Publication date: 2020-03-20

Abstract

本发明公开了一种基于YOLO V3网络结构的行人识别方法。发明的方法使用INRRIA数据集中的图像对改进的YLOL V3神经网络进行学习，从而使改进的YOLO V3能对行人进行识别，最后得到结果。本发明显著提高了行人识别速度和准确率。

Description

基于YOLO V3的行人识别方法

技术领域

本发明属于图像处理技术领域，特别涉及一种基于YOLO V3网络结构的行人识别方法

背景技术

行人检测技术在智能监控、智能驾驶等领域得到了广泛关注。行人检测技术经过十几年的快速发展，在检测速度和精度上都有所提升。传统行人检测方法中，通过人工提取特征，例如从训练样本中提取Haar方向梯度直方图行人特征，再用提取的行人特征训练支持向量机等分类器，进行行人检测任务。随着卷积神经网络的发展，深度网络模型也在行人检测领域得到了瞩目的成果。YOLO V3采用一个CNN网络来实现检测，不仅大大加快了目标检测的速度，精确度也得到了提升。

发明内容

本发明的目的在于提供一种基于YOLO V3神经网络的复杂背景下的行人检测识别方法。本发明解决其技术问题采用的技术方案如下：

基于YOLO V3神经网络的行人检测方法，包括如下步骤：

1一种基于YOLO V3网络结构的行人识别方法，包括如下步骤：

⑴对INRRIA图像进行人工划分，作为训练集；

⑵第一次学习，使用在公共图像数据库上训练的模型参数对YOLO v3神经网络进行初始化；

⑶第二次学习，使用训练集图像对改进的YOLO V3神经网络进行二次预训练；⑷对改进的YOLO V3神经网络进行有监督学习，使用所述训练集中已知行人区域的行人检测图像在二次预训练的基础上对改进的YOLO V3神经网络进行进一步训练；

⑸行人检测，将待检测图像作为训练好改进的YOLO V3神经网络模型的输入，其输出即为划分结果。

2进一步的，所诉的基于YOLO V3网络结构的行人识别方法，其特征在于，改进的YOLO V3神经网络包括53层卷积层，由一系列1×1和3×3的卷积层组成。 3进一步的，所诉的基于YOLO V3网络结构的行人识别方法，其特征在于，改变训练时输入图像的大小，使图像大小为32的倍数；增加一个预测层，融合更多的细粒度特征从而提升检测精确度；在卷积层设置(convolutional set)中减少两个卷积层，进而减少计算量，提高运算速度。

本发明基于YOLO V3神经网络，YOLO V3神经网络是非常有效地目标检测深度学习方法，使用该方法进行行人检测能有效提高准确率和较高的识别速度。

附图说明

图1是本发明的网络结构图。

具体实施方式

本发明具体包括如下步骤：

步骤一、训练集准备

本发明的训练数据集包含正样本图像614张，行人数目589个。改变图像大小为416×416。

步骤二、YOLO神经网络第一次预训练

在复杂的深度网络结构的训练中，如果直接对网络进行训练，常常会由于梯度消失陷入局部极小值等原因，导致网络收敛困难，无法达到预期效果，所以，对于这类网络的训练，通常会使用逐步预训练的方式对网络参数进行初始化。根据图1所诉的53层卷积层网络结构进行特征提取并预测。

该预训练模型途中的前52层网络后接一个全连接层构成，在训练数据集训练10个循环后得到预训练参数。

步骤三、YOLO V3神经网络第二次预训练，固定前两次预测所得到的参数，使用步骤一中准备的行人识别数据集训练集进行后两次预测，输出层使用Leaky ReLU激活函数。网络函数为：

f(x)＝max(x，0.1x) (1)

步骤四、图像的行人检测

对于一张给定待检测的图像，将其作为训练好的YOLO V3神经网络输入，经过训练好的YOLO V3网络，最终得到行人检测的结果。

Claims

1.一种基于YOLO V3网络结构的行人识别方法，包括如下步骤：

⑴对INRRIA图像进行人工划分，作为训练集；

⑶第二次学习，使用训练集图像对改进的YOLO V3神经网络进行二次预训练；

⑷对改进的YOLO V3神经网络进行有监督学习，使用所述训练集中已知行人区域的行人检测图像在二次预训练的基础上对改进的YOLO V3神经网络进行进一步训练；

2.根据权利要求1所诉的一种基于YOLO V3网络结构的行人识别方法，其特征在于，改进的YOLO V3神经网络包括53层卷积层，由一系列1×1和3×3的卷积层组成。

3.根据权利要求2所诉的一种基于YOLO V3网络结构的行人识别方法，其特征在于，改变训练时输入图像的大小，使图像大小为32的倍数；增加一个预测层，融合更多的细粒度特征从而提升检测精确度；在卷积层设置(convolutional set)中减少两个卷积层，进而减少计算量，提高运算速度。