CN110895681A - 基于yolo v3的行人识别方法 - Google Patents

基于yolo v3的行人识别方法 Download PDF

Info

Publication number
CN110895681A
CN110895681A CN201910962299.1A CN201910962299A CN110895681A CN 110895681 A CN110895681 A CN 110895681A CN 201910962299 A CN201910962299 A CN 201910962299A CN 110895681 A CN110895681 A CN 110895681A
Authority
CN
China
Prior art keywords
yolo
neural network
pedestrian
training
improved
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910962299.1A
Other languages
English (en)
Inventor
尚振宏
孟本成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201910962299.1A priority Critical patent/CN110895681A/zh
Publication of CN110895681A publication Critical patent/CN110895681A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于YOLO V3网络结构的行人识别方法。发明的方法使用INRRIA数据集中的图像对改进的YLOL V3神经网络进行学习,从而使改进的YOLO V3能对行人进行识别,最后得到结果。本发明显著提高了行人识别速度和准确率。

Description

基于YOLO V3的行人识别方法
技术领域
本发明属于图像处理技术领域,特别涉及一种基于YOLO V3网络结构的行人识别方法
背景技术
行人检测技术在智能监控、智能驾驶等领域得到了广泛关注。行人检测技术经过十几年的快速发展,在检测速度和精度上都有所提升。传统行人检测方法中,通过人工提取特征,例如从训练样本中提取Haar方向梯度直方图行人特征,再用提取的行人特征训练支持向量机等分类器,进行行人检测任务。随着卷积神经网络的发展,深度网络模型也在行人检测领域得到了瞩目的成果。YOLO V3采用一个CNN网络来实现检测,不仅大大加快了目标检测的速度,精确度也得到了提升。
发明内容
本发明的目的在于提供一种基于YOLO V3神经网络的复杂背景下的行人检测识别方法。本发明解决其技术问题采用的技术方案如下:
基于YOLO V3神经网络的行人检测方法,包括如下步骤:
1一种基于YOLO V3网络结构的行人识别方法,包括如下步骤:
⑴对INRRIA图像进行人工划分,作为训练集;
⑵第一次学习,使用在公共图像数据库上训练的模型参数对YOLO v3神经网络进行初始化;
⑶第二次学习,使用训练集图像对改进的YOLO V3神经网络进行二次预训练;⑷对改进的YOLO V3神经网络进行有监督学习,使用所述训练集中已知行人区域的行人检测图像在二次预训练的基础上对改进的YOLO V3神经网络进行进一步训练;
⑸行人检测,将待检测图像作为训练好改进的YOLO V3神经网络模型的输入,其输出即为划分结果。
2进一步的,所诉的基于YOLO V3网络结构的行人识别方法,其特征在于,改进的YOLO V3神经网络包括53层卷积层,由一系列1×1和3×3的卷积层组成。 3进一步的,所诉的基于YOLO V3网络结构的行人识别方法,其特征在于,改变训练时输入图像的大小,使图像大小为32的倍数;增加一个预测层,融合更多的细粒度特征从而提升检测精确度;在卷积层设置(convolutional set)中减少两个卷积层,进而减少计算量,提高运算速度。
本发明基于YOLO V3神经网络,YOLO V3神经网络是非常有效地目标检测深度学习方法,使用该方法进行行人检测能有效提高准确率和较高的识别速度。
附图说明
图1是本发明的网络结构图。
具体实施方式
本发明具体包括如下步骤:
步骤一、训练集准备
本发明的训练数据集包含正样本图像614张,行人数目589个。改变图像大小为416×416。
步骤二、YOLO神经网络第一次预训练
在复杂的深度网络结构的训练中,如果直接对网络进行训练,常常会由于梯度消失陷入局部极小值等原因,导致网络收敛困难,无法达到预期效果,所以,对于这类网络的训练,通常会使用逐步预训练的方式对网络参数进行初始化。根据图1所诉的53层卷积层网络结构进行特征提取并预测。
该预训练模型途中的前52层网络后接一个全连接层构成,在训练数据集训练10个循环后得到预训练参数。
步骤三、YOLO V3神经网络第二次预训练,固定前两次预测所得到的参数,使用步骤一中准备的行人识别数据集训练集进行后两次预测,输出层使用Leaky ReLU激活函数。网络函数为:
f(x)=max(x,0.1x) (1)
步骤四、图像的行人检测
对于一张给定待检测的图像,将其作为训练好的YOLO V3神经网络输入,经过训练好的YOLO V3网络,最终得到行人检测的结果。

Claims (3)

1.一种基于YOLO V3网络结构的行人识别方法,包括如下步骤:
⑴对INRRIA图像进行人工划分,作为训练集;
⑵第一次学习,使用在公共图像数据库上训练的模型参数对YOLO v3神经网络进行初始化;
⑶第二次学习,使用训练集图像对改进的YOLO V3神经网络进行二次预训练;
⑷对改进的YOLO V3神经网络进行有监督学习,使用所述训练集中已知行人区域的行人检测图像在二次预训练的基础上对改进的YOLO V3神经网络进行进一步训练;
⑸行人检测,将待检测图像作为训练好改进的YOLO V3神经网络模型的输入,其输出即为划分结果。
2.根据权利要求1所诉的一种基于YOLO V3网络结构的行人识别方法,其特征在于,改进的YOLO V3神经网络包括53层卷积层,由一系列1×1和3×3的卷积层组成。
3.根据权利要求2所诉的一种基于YOLO V3网络结构的行人识别方法,其特征在于,改变训练时输入图像的大小,使图像大小为32的倍数;增加一个预测层,融合更多的细粒度特征从而提升检测精确度;在卷积层设置(convolutional set)中减少两个卷积层,进而减少计算量,提高运算速度。
CN201910962299.1A 2019-10-11 2019-10-11 基于yolo v3的行人识别方法 Pending CN110895681A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910962299.1A CN110895681A (zh) 2019-10-11 2019-10-11 基于yolo v3的行人识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910962299.1A CN110895681A (zh) 2019-10-11 2019-10-11 基于yolo v3的行人识别方法

Publications (1)

Publication Number Publication Date
CN110895681A true CN110895681A (zh) 2020-03-20

Family

ID=69785658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910962299.1A Pending CN110895681A (zh) 2019-10-11 2019-10-11 基于yolo v3的行人识别方法

Country Status (1)

Country Link
CN (1) CN110895681A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113673326A (zh) * 2021-07-14 2021-11-19 南京邮电大学 一种基于图像深度学习的无人机平台人群计数方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241814A (zh) * 2018-06-26 2019-01-18 武汉科技大学 基于yolo神经网络的行人检测方法
CN109886245A (zh) * 2019-03-02 2019-06-14 山东大学 一种基于深度学习级联神经网络的行人检测识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241814A (zh) * 2018-06-26 2019-01-18 武汉科技大学 基于yolo神经网络的行人检测方法
CN109886245A (zh) * 2019-03-02 2019-06-14 山东大学 一种基于深度学习级联神经网络的行人检测识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孟本成,: "基于YOLOV3算法的行人检测方法", 《电视技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113673326A (zh) * 2021-07-14 2021-11-19 南京邮电大学 一种基于图像深度学习的无人机平台人群计数方法及系统
CN113673326B (zh) * 2021-07-14 2023-08-15 南京邮电大学 一种基于图像深度学习的无人机平台人群计数方法及系统

Similar Documents

Publication Publication Date Title
Lei et al. Intelligent fault detection of high voltage line based on the Faster R-CNN
CN111950453A (zh) 一种基于选择性注意力机制的任意形状文本识别方法
CN109902806A (zh) 基于卷积神经网络的噪声图像目标边界框确定方法
CN111898432B (zh) 一种基于改进YOLOv3算法的行人检测系统及方法
CN111178120B (zh) 一种基于作物识别级联技术的害虫图像检测方法
CN107301376B (zh) 一种基于深度学习多层刺激的行人检测方法
CN111079847A (zh) 一种基于深度学习的遥感影像自动标注方法
CN107247952B (zh) 基于深层监督的循环卷积神经网络的视觉显著性检测方法
CN109919073B (zh) 一种具有光照鲁棒性的行人再识别方法
CN112801019B (zh) 基于合成数据消除无监督车辆再识别偏差的方法及系统
CN112949510A (zh) 基于Faster R-CNN热红外影像人物探测方法
CN110675421A (zh) 基于少量标注框的深度图像协同分割方法
Liu et al. Development of face recognition system based on PCA and LBP for intelligent anti-theft doors
CN110348492A (zh) 一种基于上下文信息及多特征融合的相关滤波目标跟踪方法
Su et al. FSRDD: An efficient few-shot detector for rare city road damage detection
CN116416503A (zh) 一种基于多模态融合的小样本目标检测方法、系统及介质
WO2020119624A1 (zh) 一种基于深度学习的类别敏感型边缘检测方法
CN111126155A (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN114581789A (zh) 一种高光谱图像分类方法及系统
CN112927266B (zh) 基于不确定性引导训练的弱监督时域动作定位方法及系统
CN110895681A (zh) 基于yolo v3的行人识别方法
CN111160282B (zh) 一种基于二值化Yolov3网络的红绿灯检测方法
CN107392246A (zh) 一种基于特征模型到背景模型距离的背景建模方法
Fang Detection of white blood cells using YOLOV3 network
Rao et al. Roads detection of aerial image with FCN-CRF model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200320

RJ01 Rejection of invention patent application after publication