CN110895681A - 基于yolo v3的行人识别方法 - Google Patents
基于yolo v3的行人识别方法 Download PDFInfo
- Publication number
- CN110895681A CN110895681A CN201910962299.1A CN201910962299A CN110895681A CN 110895681 A CN110895681 A CN 110895681A CN 201910962299 A CN201910962299 A CN 201910962299A CN 110895681 A CN110895681 A CN 110895681A
- Authority
- CN
- China
- Prior art keywords
- yolo
- neural network
- pedestrian
- training
- improved
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000003062 neural network model Methods 0.000 claims description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于YOLO V3网络结构的行人识别方法。发明的方法使用INRRIA数据集中的图像对改进的YLOL V3神经网络进行学习,从而使改进的YOLO V3能对行人进行识别,最后得到结果。本发明显著提高了行人识别速度和准确率。
Description
技术领域
本发明属于图像处理技术领域,特别涉及一种基于YOLO V3网络结构的行人识别方法
背景技术
行人检测技术在智能监控、智能驾驶等领域得到了广泛关注。行人检测技术经过十几年的快速发展,在检测速度和精度上都有所提升。传统行人检测方法中,通过人工提取特征,例如从训练样本中提取Haar方向梯度直方图行人特征,再用提取的行人特征训练支持向量机等分类器,进行行人检测任务。随着卷积神经网络的发展,深度网络模型也在行人检测领域得到了瞩目的成果。YOLO V3采用一个CNN网络来实现检测,不仅大大加快了目标检测的速度,精确度也得到了提升。
发明内容
本发明的目的在于提供一种基于YOLO V3神经网络的复杂背景下的行人检测识别方法。本发明解决其技术问题采用的技术方案如下:
基于YOLO V3神经网络的行人检测方法,包括如下步骤:
1一种基于YOLO V3网络结构的行人识别方法,包括如下步骤:
⑴对INRRIA图像进行人工划分,作为训练集;
⑵第一次学习,使用在公共图像数据库上训练的模型参数对YOLO v3神经网络进行初始化;
⑶第二次学习,使用训练集图像对改进的YOLO V3神经网络进行二次预训练;⑷对改进的YOLO V3神经网络进行有监督学习,使用所述训练集中已知行人区域的行人检测图像在二次预训练的基础上对改进的YOLO V3神经网络进行进一步训练;
⑸行人检测,将待检测图像作为训练好改进的YOLO V3神经网络模型的输入,其输出即为划分结果。
2进一步的,所诉的基于YOLO V3网络结构的行人识别方法,其特征在于,改进的YOLO V3神经网络包括53层卷积层,由一系列1×1和3×3的卷积层组成。 3进一步的,所诉的基于YOLO V3网络结构的行人识别方法,其特征在于,改变训练时输入图像的大小,使图像大小为32的倍数;增加一个预测层,融合更多的细粒度特征从而提升检测精确度;在卷积层设置(convolutional set)中减少两个卷积层,进而减少计算量,提高运算速度。
本发明基于YOLO V3神经网络,YOLO V3神经网络是非常有效地目标检测深度学习方法,使用该方法进行行人检测能有效提高准确率和较高的识别速度。
附图说明
图1是本发明的网络结构图。
具体实施方式
本发明具体包括如下步骤:
步骤一、训练集准备
本发明的训练数据集包含正样本图像614张,行人数目589个。改变图像大小为416×416。
步骤二、YOLO神经网络第一次预训练
在复杂的深度网络结构的训练中,如果直接对网络进行训练,常常会由于梯度消失陷入局部极小值等原因,导致网络收敛困难,无法达到预期效果,所以,对于这类网络的训练,通常会使用逐步预训练的方式对网络参数进行初始化。根据图1所诉的53层卷积层网络结构进行特征提取并预测。
该预训练模型途中的前52层网络后接一个全连接层构成,在训练数据集训练10个循环后得到预训练参数。
步骤三、YOLO V3神经网络第二次预训练,固定前两次预测所得到的参数,使用步骤一中准备的行人识别数据集训练集进行后两次预测,输出层使用Leaky ReLU激活函数。网络函数为:
f(x)=max(x,0.1x) (1)
步骤四、图像的行人检测
对于一张给定待检测的图像,将其作为训练好的YOLO V3神经网络输入,经过训练好的YOLO V3网络,最终得到行人检测的结果。
Claims (3)
1.一种基于YOLO V3网络结构的行人识别方法,包括如下步骤:
⑴对INRRIA图像进行人工划分,作为训练集;
⑵第一次学习,使用在公共图像数据库上训练的模型参数对YOLO v3神经网络进行初始化;
⑶第二次学习,使用训练集图像对改进的YOLO V3神经网络进行二次预训练;
⑷对改进的YOLO V3神经网络进行有监督学习,使用所述训练集中已知行人区域的行人检测图像在二次预训练的基础上对改进的YOLO V3神经网络进行进一步训练;
⑸行人检测,将待检测图像作为训练好改进的YOLO V3神经网络模型的输入,其输出即为划分结果。
2.根据权利要求1所诉的一种基于YOLO V3网络结构的行人识别方法,其特征在于,改进的YOLO V3神经网络包括53层卷积层,由一系列1×1和3×3的卷积层组成。
3.根据权利要求2所诉的一种基于YOLO V3网络结构的行人识别方法,其特征在于,改变训练时输入图像的大小,使图像大小为32的倍数;增加一个预测层,融合更多的细粒度特征从而提升检测精确度;在卷积层设置(convolutional set)中减少两个卷积层,进而减少计算量,提高运算速度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910962299.1A CN110895681A (zh) | 2019-10-11 | 2019-10-11 | 基于yolo v3的行人识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910962299.1A CN110895681A (zh) | 2019-10-11 | 2019-10-11 | 基于yolo v3的行人识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110895681A true CN110895681A (zh) | 2020-03-20 |
Family
ID=69785658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910962299.1A Pending CN110895681A (zh) | 2019-10-11 | 2019-10-11 | 基于yolo v3的行人识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110895681A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673326A (zh) * | 2021-07-14 | 2021-11-19 | 南京邮电大学 | 一种基于图像深度学习的无人机平台人群计数方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241814A (zh) * | 2018-06-26 | 2019-01-18 | 武汉科技大学 | 基于yolo神经网络的行人检测方法 |
CN109886245A (zh) * | 2019-03-02 | 2019-06-14 | 山东大学 | 一种基于深度学习级联神经网络的行人检测识别方法 |
-
2019
- 2019-10-11 CN CN201910962299.1A patent/CN110895681A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241814A (zh) * | 2018-06-26 | 2019-01-18 | 武汉科技大学 | 基于yolo神经网络的行人检测方法 |
CN109886245A (zh) * | 2019-03-02 | 2019-06-14 | 山东大学 | 一种基于深度学习级联神经网络的行人检测识别方法 |
Non-Patent Citations (1)
Title |
---|
孟本成,: "基于YOLOV3算法的行人检测方法", 《电视技术》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673326A (zh) * | 2021-07-14 | 2021-11-19 | 南京邮电大学 | 一种基于图像深度学习的无人机平台人群计数方法及系统 |
CN113673326B (zh) * | 2021-07-14 | 2023-08-15 | 南京邮电大学 | 一种基于图像深度学习的无人机平台人群计数方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lei et al. | Intelligent fault detection of high voltage line based on the Faster R-CNN | |
CN111950453A (zh) | 一种基于选择性注意力机制的任意形状文本识别方法 | |
CN109902806A (zh) | 基于卷积神经网络的噪声图像目标边界框确定方法 | |
CN111898432B (zh) | 一种基于改进YOLOv3算法的行人检测系统及方法 | |
CN111178120B (zh) | 一种基于作物识别级联技术的害虫图像检测方法 | |
CN107301376B (zh) | 一种基于深度学习多层刺激的行人检测方法 | |
CN111079847A (zh) | 一种基于深度学习的遥感影像自动标注方法 | |
CN107247952B (zh) | 基于深层监督的循环卷积神经网络的视觉显著性检测方法 | |
CN109919073B (zh) | 一种具有光照鲁棒性的行人再识别方法 | |
CN112801019B (zh) | 基于合成数据消除无监督车辆再识别偏差的方法及系统 | |
CN112949510A (zh) | 基于Faster R-CNN热红外影像人物探测方法 | |
CN110675421A (zh) | 基于少量标注框的深度图像协同分割方法 | |
Liu et al. | Development of face recognition system based on PCA and LBP for intelligent anti-theft doors | |
CN110348492A (zh) | 一种基于上下文信息及多特征融合的相关滤波目标跟踪方法 | |
Su et al. | FSRDD: An efficient few-shot detector for rare city road damage detection | |
CN116416503A (zh) | 一种基于多模态融合的小样本目标检测方法、系统及介质 | |
WO2020119624A1 (zh) | 一种基于深度学习的类别敏感型边缘检测方法 | |
CN111126155A (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
CN114581789A (zh) | 一种高光谱图像分类方法及系统 | |
CN112927266B (zh) | 基于不确定性引导训练的弱监督时域动作定位方法及系统 | |
CN110895681A (zh) | 基于yolo v3的行人识别方法 | |
CN111160282B (zh) | 一种基于二值化Yolov3网络的红绿灯检测方法 | |
CN107392246A (zh) | 一种基于特征模型到背景模型距离的背景建模方法 | |
Fang | Detection of white blood cells using YOLOV3 network | |
Rao et al. | Roads detection of aerial image with FCN-CRF model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200320 |
|
RJ01 | Rejection of invention patent application after publication |