CN109033939A - 一种杂乱环境下改进的YOLOv2物体检测方法 - Google Patents

一种杂乱环境下改进的YOLOv2物体检测方法 Download PDF

Info

Publication number
CN109033939A
CN109033939A CN201810564643.7A CN201810564643A CN109033939A CN 109033939 A CN109033939 A CN 109033939A CN 201810564643 A CN201810564643 A CN 201810564643A CN 109033939 A CN109033939 A CN 109033939A
Authority
CN
China
Prior art keywords
yolov2
picture
bounding box
model
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810564643.7A
Other languages
English (en)
Inventor
魏国亮
余玉琴
蔡晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201810564643.7A priority Critical patent/CN109033939A/zh
Publication of CN109033939A publication Critical patent/CN109033939A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种物体检测方法,特别是一种杂乱环境下改进的YOLOv2物体检测方法。使用YOLOv2物体检测模型检测物体,输出检测物体边界框的长和宽,输出的长和宽分别缩小K1和K2倍,K1=1.47,K2=1.0612。本发明通过将YOLOv2模型输出检测物体边界框的长和宽分别缩小K1和K2倍,缩小后每个边界框只包含一个物体,多个物体边界框的交集减少,既能保证检测到图片中的所有物体,又大大减小了后续计算目标物体的三维坐标信息、及目标物体到摄像机的距离时的误差,提高了检测精度。

Description

一种杂乱环境下改进的YOLOv2物体检测方法
技术领域
本发明涉及一种物体检测方法,特别是一种杂乱环境下改进的YOLOv2物体检测方法。
背景技术
在实现杂乱环境下的物体抓取中,如现实生活中的垃圾分类,需要用彩色摄像机采集彩色图片,然后使用物体检测方法检测目标物体的类别和目标物体在图像中的位置,再通过数据处理计算出目标物体的三维坐标,最后控制机械臂进行目标物体抓取。现有的物体检测算法有多种,如RCNN、Fast-RCNN、Faster-RCNN,YOLO,YOLOv2。前三种物体检测算法速度较慢,目前达不到物体抓取环境下实时检测目标物体的要求。
YOLO检测速度可以达到每秒45帧,但目标物体在图像中的定位误差很大,直接导致YOLO的检测精度并不高。YOLOv2是在YOLO版本上做出的改进,包括新的基础网络、更细的网格划分、多尺度训练、全卷积网络、使用Faster-RCNN的anchor机制、更多的训练技巧等等,使得yolov2在保持原有速度的优势之下,精度上得以提升,YOLOv2对图像中目标物体检测的准确率达到78.6%,检测速度为每秒40帧,使其适用于杂乱环境下物体抓取的目标物体检测。
但YOLOv2和YOLO物体检测算法具有同一缺点:在图像中检测得到的目标物体的边界框太大。在杂乱环境下存在多个物体,边界框太大会导致目标物体的边界框将邻近的物体包括进来。并且目标物体和其他物体边界框的交集很大,进而导致在后续计算目标物体的三维坐标信息、以及目标物体到摄像机的距离时存在很大偏差,降低了检测精度。
发明内容
针对以上不足,本发明提供了一种杂乱环境下改进的YOLOv2物体检测方法,该方法能使物体检测的边界框缩小到合适的范围内,一个边界框只包含一个物体,并且和其它物体边界的交集极小,大大减小了后续的计算误差。
本发明的技术方案为:
一种杂乱环境下改进的YOLOv2物体检测方法,使用YOLOv2物体检测模型检测物体,输出检测物体边界框的长和宽,所述输出的长和宽分别缩小K1和K2倍,所述K1=1.47,所述K2=1.0612。
所述YOLOv2模型的搭建过程包括以下步骤:
S1,使用图像采集设备,采集N类物体的图片,每类物体有M张图片(M≥200);
S2,使用软件标出M×N张图片中各类物体的类别和边界框;
S3,每类物体随机选取0.8×M张图片作为训练集,随机选取0.2×M张图片作为测试集;
S4,使用训练集训练YOLOv2模型,使用测试集测试YOLOv2模型,得到含有模型参数的YOLOv2物体检测模型。
本发明通过将YOLOv2模型输出检测物体边界框的长和宽分别缩小K1和K2倍,K1=1.47,K2=1.0612,缩小后每个边界框只包含一个物体,多个物体边界框的交集减少,既能保证检测到图片中的所有物体,又大大减小了后续计算目标物体的三维坐标信息、及目标物体到摄像机的距离时的误差,提高了检测精度。经过实验证明,本发明的经过改进的YOLOv2物体检测方法,对图像中目标特体检测的准确率达到91%,相对于YOLOv2而言准确率提高了16%。
附图说明
图1为原始YOLOv2模型结构;
图2为本发明YOLOv2模型结构;
图3为YOLOv2物体检测模型检测物体时的场景图;
图4为原始YOLOv2物体检测模型检测效果图;
图5为本发明YOLOv2物体检测模型检测效果图。
具体实施方式
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
本发明的一种杂乱环境下改进的YOLOv2物体检测方法,使用YOLOv2物体检测模型检测物体,YOLOv2模型的搭建过程包括以下步骤:
S11,使用图像采集设备,采集N类物体的图片,每类物体有M张图片,M≥200;
S12,使用labelImg软件标出M×N张图片中各类物体的类别和边界框;
S13,每类物体随机选取0.8×M张图片作为训练集,随机选取0.2×M张图片作为测试集;
S14,按照Darknet官网给出的教程安装Darknet框架,选择YOLOv2模型作为训练模型,使用训练集训练YOLOv2模型,使用测试集测试YOLOv2模型,得到含有模型参数的YOLOv2物体检测模型。
参考图1和图2,在杂乱环境下做物体抓取时,使用含有模型参数的YOLOv2物体检测模型实时检测物体,输出检测物体边界框的长和宽,输出的长和宽分别缩小K1和K2倍,所述K1=1.47,所述K2=1.0612。图1和图2分别为缩小前后的YOLOv2模型结构图。
参考图3,当摄像机20对前方的物体11、物体12进行检测时,分别得到如图4和图5的物体检测效果图。图4和图5分别为缩小前后的效果图,图片中共有2个物体,对应检测出的2个物体边界框。可以看到,图5的每个物体边界框中只包含一个物体,2个物体边界框的交集没有(在某种情况下也可能是交集极少),而图4中2个物体边界框的交集很大。
如图3所示,由于物体11和物体12距离摄像机20的远近位置不同,如果物体边界框交集太大,在后续计算中会导致计算的较近物体的距离是较远物体的距离,计算较远物体的距离是较近物体的距离,即在计算目标物体到摄像机的距离时产生误差;同时,在计算目标物体的三维坐标信息时也会产生误差。当输出物体边界框的长和宽分别缩小1.47倍和1.0612倍时,物体边界框覆盖的范围缩小到基本在物体的实体边界框以内或略大于实体边界框,摒除了相邻物体边界框之间的过大交集对计算精度产生的影响,保证了检测的准确率,提高了检测精度。
以上公开的仅为本发明的实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (2)

1.一种杂乱环境下改进的YOLOv2物体检测方法,使用YOLOv2物体检测模型检测物体,输出检测物体边界框的长和宽,其特征在于,所述输出的长和宽分别缩小K1和K2倍,所述K1=1.47,所述K2=1.0612。
2.根据权利要求1所述的杂乱环境下改进的YOLOv2物体检测方法,其特征在于,所述YOLOv2模型的搭建过程包括以下步骤:
S1,使用图像采集设备,采集N类物体的图片,每类物体有M张图片(M≥200);
S2,使用软件标出M×N张图片中各类物体的类别和边界框;
S3,每类物体随机选取0.8×M张图片作为训练集,随机选取0.2×M张图片作为测试集;
S4,使用训练集训练YOLOv2模型,使用测试集测试YOLOv2模型,得到含有模型参数的YOLOv2物体检测模型。
CN201810564643.7A 2018-06-04 2018-06-04 一种杂乱环境下改进的YOLOv2物体检测方法 Pending CN109033939A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810564643.7A CN109033939A (zh) 2018-06-04 2018-06-04 一种杂乱环境下改进的YOLOv2物体检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810564643.7A CN109033939A (zh) 2018-06-04 2018-06-04 一种杂乱环境下改进的YOLOv2物体检测方法

Publications (1)

Publication Number Publication Date
CN109033939A true CN109033939A (zh) 2018-12-18

Family

ID=64611848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810564643.7A Pending CN109033939A (zh) 2018-06-04 2018-06-04 一种杂乱环境下改进的YOLOv2物体检测方法

Country Status (1)

Country Link
CN (1) CN109033939A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852243A (zh) * 2019-11-06 2020-02-28 中国人民解放军战略支援部队信息工程大学 一种基于改进YOLOv3的道路交叉口检测方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150235092A1 (en) * 2014-02-14 2015-08-20 Toyota Motor Engineering & Manufacturing North America, Inc. Parts based object tracking method and apparatus
CN107316010A (zh) * 2017-06-13 2017-11-03 武汉理工大学 一种识别前方车辆尾灯及判断其状态的方法
CN107527009A (zh) * 2017-07-11 2017-12-29 浙江汉凡软件科技有限公司 一种基于yolo目标检测的遗留物检测方法
CN107563446A (zh) * 2017-09-05 2018-01-09 华中科技大学 一种微操作系统目标检测方法
CN107833213A (zh) * 2017-11-02 2018-03-23 哈尔滨工业大学 一种基于伪真值自适应法的弱监督物体检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150235092A1 (en) * 2014-02-14 2015-08-20 Toyota Motor Engineering & Manufacturing North America, Inc. Parts based object tracking method and apparatus
CN107316010A (zh) * 2017-06-13 2017-11-03 武汉理工大学 一种识别前方车辆尾灯及判断其状态的方法
CN107527009A (zh) * 2017-07-11 2017-12-29 浙江汉凡软件科技有限公司 一种基于yolo目标检测的遗留物检测方法
CN107563446A (zh) * 2017-09-05 2018-01-09 华中科技大学 一种微操作系统目标检测方法
CN107833213A (zh) * 2017-11-02 2018-03-23 哈尔滨工业大学 一种基于伪真值自适应法的弱监督物体检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张强: "静态图像上的行人检测方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李云鹏 等: "基于YOLOv2的复杂场景下车辆目标检测", 《电视技术》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852243A (zh) * 2019-11-06 2020-02-28 中国人民解放军战略支援部队信息工程大学 一种基于改进YOLOv3的道路交叉口检测方法及装置

Similar Documents

Publication Publication Date Title
CN103471512B (zh) 一种基于机器视觉的玻璃板宽检测系统
CN106225678B (zh) 基于3d相机的动态物体定位与体积测量方法
US9025875B2 (en) People counting device, people counting method and people counting program
CN108090458A (zh) 人体跌倒检测方法和装置
CN107657244B (zh) 一种基于多摄像机的人体跌倒行为检测系统及其检测方法
US10999519B2 (en) Target tracking method and device, movable platform, and storage medium
CN109583285A (zh) 对象识别方法
CN109165589A (zh) 基于深度学习的车辆重识别方法和装置
CN110287907B (zh) 一种对象检测方法和装置
JPWO2020179065A1 (ja) 画像処理装置、画像処理方法及びプログラム
CN109035330A (zh) 箱体拟合方法、设备和计算机可读存储介质
CN109059770B (zh) 一种基于tof深度相机的包裹体积测量方法
CN110400315A (zh) 一种缺陷检测方法、装置及系统
CN109815787B (zh) 目标识别方法、装置、存储介质及电子设备
CN107862713B (zh) 针对轮询会场的摄像机偏转实时检测预警方法及模块
CN106600628A (zh) 一种基于红外热像仪的目标物识别的方法与装置
CN106296708B (zh) 车辆追踪方法和装置
CN115690496A (zh) 基于YOLOv5的实时区域入侵检测方法
CN109033939A (zh) 一种杂乱环境下改进的YOLOv2物体检测方法
CN115880643B (zh) 一种基于目标检测算法的社交距离监测方法和装置
CN106874829B (zh) 提高监测系统的可靠性的方法
CN105203045A (zh) 一种基于异步时域视觉传感器的产品形状完整性检测系统及检查方法
CN112598738A (zh) 一种基于深度学习的人物定位方法
CN110826455A (zh) 一种目标识别方法及图像处理设备
JP2019087130A (ja) 人属性認識システムおよびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218