CN115661614A - 一种基于轻量化YOLO v1的目标检测方法 - Google Patents
一种基于轻量化YOLO v1的目标检测方法 Download PDFInfo
- Publication number
- CN115661614A CN115661614A CN202211576459.7A CN202211576459A CN115661614A CN 115661614 A CN115661614 A CN 115661614A CN 202211576459 A CN202211576459 A CN 202211576459A CN 115661614 A CN115661614 A CN 115661614A
- Authority
- CN
- China
- Prior art keywords
- layer
- output
- yolo
- module
- conv
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 39
- 238000005070 sampling Methods 0.000 claims abstract description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000012986 modification Methods 0.000 abstract description 4
- 230000004048 modification Effects 0.000 abstract description 4
- 238000000605 extraction Methods 0.000 abstract description 3
- 238000000034 method Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于轻量化YOLO v1的目标检测方法,轻量化YOLO v1的主干网络包括第一层至第五层结构,以及对第三层输出进行下采样后与第四层输出进行深度上的拼接后输入第五层的支路。本发明采用Conv层+GConv层+Conv层的组合作为一个基本特征提取卷积模块,在卷积过程中使输出的通道数等于输入通道数,从而使存储读取成本最小。通过对传统YOLO v1主干网络的修改精简,降低其网络权重参数的大小;此外,不用设置Anchor Box,能够直接从数据中得到检测框的位置及大小信息。
Description
技术领域
本发明涉及一种图像处理方法,具体涉及一种图像的目标检测方法。
背景技术
深度神经网络已经被证明可以有效的解决图像、自然语言等不同领域的问题。同时伴随着移动互联网技术的不断发展,便携式设备得到了迅速的普及,用户提出了越来越多的需求。工业界对深度学习网络在终端应用的关注度越来越高,尤其是对于如何保持速度和精度上的平衡,也形成了不小的研究热度。
在目标检测领域,one-stage的目标检测网络因结构相对简单并且速度很快,所以目前对于轻量化的已部署在移动端的网络多以one-stage网络为主。但即便其相对精简,但是其动辄数百MB的网络参数权重对于移动终端仍然过于庞大,因而需将网络进行轻量化处理才能将其部署至移动终端。
在one-stage中,较为经典的有YOLO系列网络,YOLO系列网络自YOLO v2之后采用了Anchor Box进行目标边界框检测以提升精度,但利用Anchor进行目标检测需要预先设定Anchor Box的尺寸,而针对不同的数据集、不同的检测目标其Anchor Box的尺寸会有着差别,因而其泛化性能将会受到一定程度的限制,并且每应用于不同的数据集时都需重新设定Anchor Box的尺寸,增加了网络部署的难度。
发明内容
发明目的:针对上述现有技术,提出一种基于轻量化YOLO v1的目标检测方法,降低网络参数权重,并且不用设置Anchor Box。
技术方案:一种基于轻量化YOLO v1的目标检测方法,包括:对采集的数据进行预处理,预处理后的数据输入轻量化YOLO v1,所述轻量化YOLO v1的输出包括检测框的位置及大小信息;
所述轻量化YOLO v1的主干网络包括第一层至第五层结构,以及对第三层输出进行下采样后与第四层输出进行深度上的拼接后输入第五层的支路;
第一层由Mode1模块构成,第一层的输入与输出尺寸分别为:3*448*448、36*112*112;
第二层至第四层均为由Mode2模块连接Mode3模块构成,第二层至第四层的输入与输出尺寸分别为:36*112*112、72*56*56,72*56*56、144*28*28,144*28*28、288*14*14;
第五层由Mode1模块构成,第五层的输入与输出尺寸分别为:288*14*14、30*7*7;
所述支路的输入与输出尺寸分别为:144*28*28、144*14*14;
其中,Mode1模块的结构为:依次连接的1个Conv层以及1个MaxPooling层;
Mode2模块的结构为:依次连接的1个Conv层、2个Gconv层以及1个Conv层;
Mode3模块的结构为:依次连接的1个Conv层、1个Gconv层以及1个Conv层。
进一步的,所述主干网络还包括连接第五层输出的三个检测头,所述三个检测头均由1个Conv层组成,三个检测头的输出尺寸分别为5*7*7、5*7*7、20*7*7,三个检测头的输出数据进行深度拼接后形成最终的输出数据。
有益效果:1.轻量化:通过对传统YOLO v1主干网络的修改精简,降低其网络权重参数的大小。
2.不用设置Anchor Box,能够直接从数据中得到检测框的位置及大小信息。
传统YOLO v1中,Anchor Box使用预设尺寸的Box进行定位,因而最终输出的数据格式为(x,y,q,e),其中,x、y分别为目标中心点相对于box中心点差值,q、e分别为目标长和宽相对于box长和宽的缩放指数;而本方法对YOLO v1主干网络改进后不再需要使用AnchorBox,而是能够将物体所在的特征区域(cell)的中心点直接作为目标中心点,最终输出目标4个边框到中心点的距离,其输出格式为(x1,x2,y1,y2)。
附图说明
图1为本发明中轻量化YOLO v1的主干网络所采用的三种模块结构图;
图2为实施例1中轻量化YOLO v1的主干网络结构图;
图3为实施例2中轻量化YOLO v1的主干网络结构图。
具体实施方式
下面结合附图对本发明做更进一步的解释。
实施例1:
一种基于轻量化YOLO v1的目标检测方法,首先对采集的数据进行预处理,预处理包括图像裁剪以及去向去噪处理,预处理后的数据输入轻量化YOLO v1,轻量化YOLO v1的输出包括检测框的位置、大小信息,此外还包括置信度信息。
如图2所示,轻量化YOLO v1的主干网络包括第一层至第五层结构,以及对第三层输出进行下采样后与第四层输出进行深度上的拼接后输入第五层的支路。
第一层由Mode1模块构成,第一层的输入与输出尺寸分别为:3*448*448、36*112*112。
第二层至第四层均由Mode2模块连接Mode3模块构成,第二层至第四层的输入与输出尺寸分别为:36*112*112、72*56*56,72*56*56、144*28*28,144*28*28、288*14*14。
第五层由Mode1模块构成,第五层的输入与输出尺寸分别为:288*14*14、30*7*7。
支路的输入与输出尺寸分别为:144*28*28、144*14*14。
如图1所示,Mode1模块的结构为:1个普通卷积(Conv)层+1个最大池化下采样(MaxPooling)层;用于网络第一层进行第一步的特征图通道数扩展以及最后一层的通道数调整。
Mode2模块的结构为:1个普通卷积(Conv)层+2个深度可分卷积(Gconv)层+1个普通卷积(Conv)层;用于除了第一层以外的对特征图深度需要进行扩展的情况。
Mode3模块的结构为:1个普通卷积(Conv)层+1个深度可分卷积(Gconv)层+1个普通卷积(Conv)层;用于网络中的正向传播。
第一层特征提取时采用扩展深度的普通卷积(Conv)层将特征图像深度由3通道扩展为36通道。第二层至第四层中,Mode2模块利用两个输出深度与输入深度一致的深度可分卷积(Gconv)层进行深度拼接以完成深度扩展;Mode3模块采用普通卷积(Conv)层+深度可分卷积(GConv)层+普通卷积(Conv)层的组合作为一个基本特征提取卷积模块。本发明中,Mode2模块和Mode3模块只采用了1个或2个深度可分卷积(GConv)层,GConv层的输入与输出保持一致,而网络整体深度越来越大是必然的,为尽量实现轻量化,采用Gconv层时保持其输入与输出通道数一致,在必要的扩展阶段采取深度拼接,本质上不涉及通过卷积进行通道扩展,以此降低计算量。
网络的碎片化程度越高,其运行速度越慢;且网络中算子的运算操作也是影响效率的重要因素。本实施例中,仅采用Mode1、Mode2、Mode3模块,最大程度的降低了网络的碎片化程度,且减少了需用到的算子。
主干网络通过第一层至第五层结构完成网络轻量化,但由于参数量的减少,导致网络的精度降低并且收敛困难。因此,本实施例通过一条分支将第三层输出的特征图引出,对其进行下采样后与第四层输出进行深度上的拼接后再输入第五层中。网络第四层输出的特征图具有强语义信息,但尺寸较小,期望能检测到大目标;第三层引出的分支其尺寸较大,感受野较小,具有强定位信息,期望能够检测到小目标;通过支路将强语义信息与强定位信息集合,即增强语义表达又可以增强定位能力,如此即可提升网络的精度。
完成将网络主干替换后,网络的参数权重文件由107.2MB降低至3.86MB,降低为原大小的3.6%。
实施例2:
为了增加在有限数据量的情况下获取更多的数据结果,本发明的主干网络还增加了检测头的机制,与实施例1的区别在于,如图3所示,主干网络还包括连接第五层输出的三个检测头,三个检测头均由1个Conv层组成,三个检测头的输出尺寸分别为5*7*7、5*7*7、20*7*7,三个检测头的输出数据进行深度拼接后形成最终的输出数据。
网络第五层输出数据尺寸为30*7*7,其中7*7为特征图的高宽,30个数据通道构成为“5+5+20”,两个“5”分别为目标检测得到的两个检测框的4个边框到中心点的距离及置信度(x1,x2,y1,y2,c),“20”为检测目标的数量,其分别对应20个数字标签,当第n个为1时,就表示检测到的目标为目标集合中第n个目标。增加的三个检测头均是由普通卷积(Conv)层构成,三个检测头的输出尺寸分别为5*7*7、5*7*7、20*7*7,三个检测头的输出数据进行深度拼接后形成最终的输出数据,如此即可以权重略微增大为代价,增加检测参数来提升检测精度。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (2)
1.一种基于轻量化YOLO v1的目标检测方法,其特征在于,包括:对采集的数据进行预处理,预处理后的数据输入轻量化YOLO v1,所述轻量化YOLO v1的输出包括检测框的位置及大小信息;
所述轻量化YOLO v1的主干网络包括第一层至第五层结构,以及对第三层输出进行下采样后与第四层输出进行深度上的拼接后输入第五层的支路;
第一层由Mode1模块构成,第一层的输入与输出尺寸分别为:3*448*448、36*112*112;
第二层至第四层均为由Mode2模块连接Mode3模块构成,第二层至第四层的输入与输出尺寸分别为:36*112*112、72*56*56,72*56*56、144*28*28,144*28*28、288*14*14;
第五层由Mode1模块构成,第五层的输入与输出尺寸分别为:288*14*14、30*7*7;
所述支路的输入与输出尺寸分别为:144*28*28、144*14*14;
其中,Mode1模块的结构为:依次连接的1个Conv层以及1个MaxPooling层;
Mode2模块的结构为:依次连接的1个Conv层、2个Gconv层以及1个Conv层;
Mode3模块的结构为:依次连接的1个Conv层、1个Gconv层以及1个Conv层。
2.根据权利要求1所述的基于轻量化YOLO v1的目标检测方法,其特征在于,所述主干网络还包括连接第五层输出的三个检测头,所述三个检测头均由1个Conv层组成,三个检测头的输出尺寸分别为5*7*7、5*7*7、20*7*7,三个检测头的输出数据进行深度拼接后形成最终的输出数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211576459.7A CN115661614B (zh) | 2022-12-09 | 2022-12-09 | 一种基于轻量化YOLO v1的目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211576459.7A CN115661614B (zh) | 2022-12-09 | 2022-12-09 | 一种基于轻量化YOLO v1的目标检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115661614A true CN115661614A (zh) | 2023-01-31 |
CN115661614B CN115661614B (zh) | 2024-05-24 |
Family
ID=85019951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211576459.7A Active CN115661614B (zh) | 2022-12-09 | 2022-12-09 | 一种基于轻量化YOLO v1的目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115661614B (zh) |
Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689118A (zh) * | 2019-09-29 | 2020-01-14 | 华南理工大学 | 一种基于YOLO V3-tiny改进的目标检测方法 |
CN111144209A (zh) * | 2019-11-25 | 2020-05-12 | 浙江工商大学 | 一种基于异构多分支深度卷积神经网络的监控视频人头检测方法 |
US20200293891A1 (en) * | 2019-04-24 | 2020-09-17 | Jiangnan University | Real-time target detection method deployed on platform with limited computing resources |
CN112257581A (zh) * | 2020-10-21 | 2021-01-22 | 广州云从凯风科技有限公司 | 一种人脸检测方法、装置、介质及设备 |
CN112257794A (zh) * | 2020-10-27 | 2021-01-22 | 东南大学 | 一种基于yolo的轻量级的目标检测方法 |
CN113378890A (zh) * | 2021-05-17 | 2021-09-10 | 浙江工业大学 | 一种基于改进YOLO v4的轻量级行人车辆检测方法 |
CN113807276A (zh) * | 2021-09-23 | 2021-12-17 | 江苏信息职业技术学院 | 基于优化的YOLOv4模型的吸烟行为识别方法 |
CN113807464A (zh) * | 2021-09-29 | 2021-12-17 | 东南大学 | 基于改进yolo v5的无人机航拍图像目标检测方法 |
US11222217B1 (en) * | 2020-08-14 | 2022-01-11 | Tsinghua University | Detection method using fusion network based on attention mechanism, and terminal device |
CN114298286A (zh) * | 2022-01-10 | 2022-04-08 | 江苏稻源科技集团有限公司 | 一种对轻量化卷积神经网络训练得到预训练模型的方法 |
CN114332482A (zh) * | 2022-01-04 | 2022-04-12 | 电子科技大学 | 一种基于特征融合的轻量化目标检测方法 |
CN114373078A (zh) * | 2021-12-20 | 2022-04-19 | 深圳云天励飞技术股份有限公司 | 目标检测方法、装置、终端设备及存储介质 |
WO2022083784A1 (zh) * | 2020-10-23 | 2022-04-28 | 西安科锐盛创新科技有限公司 | 一种基于车联网的道路检测方法 |
CN114463759A (zh) * | 2022-04-14 | 2022-05-10 | 浙江霖研精密科技有限公司 | 一种基于无锚框算法的轻量化文字检测方法及装置 |
CN114612758A (zh) * | 2022-03-15 | 2022-06-10 | 长沙理工大学 | 一种基于深度分组可分离卷积的目标检测方法 |
WO2022166293A1 (zh) * | 2021-02-03 | 2022-08-11 | 歌尔股份有限公司 | 一种目标检测方法和装置 |
CN114898200A (zh) * | 2022-05-25 | 2022-08-12 | 西安建筑科技大学 | 一种基于轻量化YOLOV4-tiny的传送带工件图像目标检测方法及系统 |
CN114943697A (zh) * | 2022-05-16 | 2022-08-26 | 福建农林大学 | 一种基于轻量化改进yolo的番茄成熟度检测方法 |
CN114972780A (zh) * | 2022-04-11 | 2022-08-30 | 西北大学 | 一种基于改进YOLOv5的轻量化目标检测网络 |
CN114998220A (zh) * | 2022-05-12 | 2022-09-02 | 湖南中医药大学 | 一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法 |
CN115205274A (zh) * | 2022-07-26 | 2022-10-18 | 西南石油大学 | 一种基于轻量化级联网络的布匹瑕疵检测方法 |
-
2022
- 2022-12-09 CN CN202211576459.7A patent/CN115661614B/zh active Active
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200293891A1 (en) * | 2019-04-24 | 2020-09-17 | Jiangnan University | Real-time target detection method deployed on platform with limited computing resources |
CN110689118A (zh) * | 2019-09-29 | 2020-01-14 | 华南理工大学 | 一种基于YOLO V3-tiny改进的目标检测方法 |
CN111144209A (zh) * | 2019-11-25 | 2020-05-12 | 浙江工商大学 | 一种基于异构多分支深度卷积神经网络的监控视频人头检测方法 |
US11222217B1 (en) * | 2020-08-14 | 2022-01-11 | Tsinghua University | Detection method using fusion network based on attention mechanism, and terminal device |
CN112257581A (zh) * | 2020-10-21 | 2021-01-22 | 广州云从凯风科技有限公司 | 一种人脸检测方法、装置、介质及设备 |
WO2022083784A1 (zh) * | 2020-10-23 | 2022-04-28 | 西安科锐盛创新科技有限公司 | 一种基于车联网的道路检测方法 |
CN112257794A (zh) * | 2020-10-27 | 2021-01-22 | 东南大学 | 一种基于yolo的轻量级的目标检测方法 |
WO2022166293A1 (zh) * | 2021-02-03 | 2022-08-11 | 歌尔股份有限公司 | 一种目标检测方法和装置 |
CN113378890A (zh) * | 2021-05-17 | 2021-09-10 | 浙江工业大学 | 一种基于改进YOLO v4的轻量级行人车辆检测方法 |
CN113807276A (zh) * | 2021-09-23 | 2021-12-17 | 江苏信息职业技术学院 | 基于优化的YOLOv4模型的吸烟行为识别方法 |
CN113807464A (zh) * | 2021-09-29 | 2021-12-17 | 东南大学 | 基于改进yolo v5的无人机航拍图像目标检测方法 |
CN114373078A (zh) * | 2021-12-20 | 2022-04-19 | 深圳云天励飞技术股份有限公司 | 目标检测方法、装置、终端设备及存储介质 |
CN114332482A (zh) * | 2022-01-04 | 2022-04-12 | 电子科技大学 | 一种基于特征融合的轻量化目标检测方法 |
CN114298286A (zh) * | 2022-01-10 | 2022-04-08 | 江苏稻源科技集团有限公司 | 一种对轻量化卷积神经网络训练得到预训练模型的方法 |
CN114612758A (zh) * | 2022-03-15 | 2022-06-10 | 长沙理工大学 | 一种基于深度分组可分离卷积的目标检测方法 |
CN114972780A (zh) * | 2022-04-11 | 2022-08-30 | 西北大学 | 一种基于改进YOLOv5的轻量化目标检测网络 |
CN114463759A (zh) * | 2022-04-14 | 2022-05-10 | 浙江霖研精密科技有限公司 | 一种基于无锚框算法的轻量化文字检测方法及装置 |
CN114998220A (zh) * | 2022-05-12 | 2022-09-02 | 湖南中医药大学 | 一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法 |
CN114943697A (zh) * | 2022-05-16 | 2022-08-26 | 福建农林大学 | 一种基于轻量化改进yolo的番茄成熟度检测方法 |
CN114898200A (zh) * | 2022-05-25 | 2022-08-12 | 西安建筑科技大学 | 一种基于轻量化YOLOV4-tiny的传送带工件图像目标检测方法及系统 |
CN115205274A (zh) * | 2022-07-26 | 2022-10-18 | 西南石油大学 | 一种基于轻量化级联网络的布匹瑕疵检测方法 |
Non-Patent Citations (8)
Title |
---|
KUMAR, A: ""A cascaded deep-learning-based model for face mask detection"", 《DATA TECHNOLOGIES AND APPLICATIONS》, pages 147 - 148 * |
N ZHANG, J FAN: ""A lightweight object detection algorithm based on YOLOv3 for vehicle and pedestrian detection"", 《IEEE XPLORE》, 31 December 2021 (2021-12-31) * |
PRANAV ADARSH; PRATIBHA RATHI; MANOJ KUMAR: ""YOLO v3-Tiny: Object Detection and Recognition using one stage improved model"", 《2020 6TH INTERNATIONAL CONFERENCE ON ADVANCED COMPUTING AND COMMUNICATION SYSTEMS (ICACCS)》 * |
严春满等: ""卷积神经网络模型发展及应用"", 《计算机科学与探索》, vol. 15, no. 01, 31 January 2021 (2021-01-31) * |
刘泽西等: ""针对轻量化网络的安全帽检测方法"", 《测控技术》, vol. 41, no. 08, 31 August 2022 (2022-08-31) * |
杨玉敏等: ""轻量化卷积神经网络目标检测算法综述"", 《舰船电子工程》, vol. 41, no. 4 * |
邵伟平等: ""基于MobileNet与YOLOv3的轻量化卷积神经网络设计"", 《计算机应用》, vol. 40, no. 1 * |
齐榕;贾瑞生;徐志峰;毛其超;: "基于YOLOv3的轻量级目标检测网络", 《计算机应用与软件》, no. 10 * |
Also Published As
Publication number | Publication date |
---|---|
CN115661614B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110874563B (zh) | 通过cnn的多个图像输出的提供集成的特征图的方法及装置 | |
CN105678292A (zh) | 基于卷积及递归神经网络的复杂光学文字序列识别系统 | |
CN105678300A (zh) | 一种复杂图像文字序列识别方法 | |
CN110852295A (zh) | 一种基于多任务监督学习的视频行为识别方法 | |
CN111008979A (zh) | 一种鲁棒的夜晚图像语义分割方法 | |
CN116469100A (zh) | 一种基于Transformer的双波段图像语义分割方法 | |
CN115082928A (zh) | 面向复杂场景的不对称双分支实时语义分割网络的方法 | |
CN112883964B (zh) | 一种自然场景文字检测的方法 | |
CN111914853B (zh) | 一种用于立体匹配的特征提取方法 | |
CN115661614A (zh) | 一种基于轻量化YOLO v1的目标检测方法 | |
US20240161531A1 (en) | Transformer-based multi-scale pedestrian re-identification method | |
CN109446933A (zh) | 一种基于卷积神经网络的道路场景语义分割方法 | |
CN115984574B (zh) | 一种基于循环Transformer的图像信息提取模型、方法及其应用 | |
CN112164065A (zh) | 一种基于轻量化卷积神经网络的实时图像语义分割方法 | |
CN116543155A (zh) | 基于上下文级联和多尺度特征细化的语义分割方法及装置 | |
CN115761594B (zh) | 一种基于全局与局部耦合的光流计算方法 | |
CN116977631A (zh) | 一种基于DeepLabV3+的街景语义分割方法 | |
CN114782936B (zh) | 一种基于改进yolov5s网络的行为检测方法 | |
CN116246109A (zh) | 一种多尺度孔洞邻域注意力计算骨干网络模型及其应用 | |
CN115965819A (zh) | 一种基于Transformer结构的轻量化害虫识别方法 | |
CN113011429A (zh) | 一种基于阶段性特征语义对齐的实时街景图像语义分割方法 | |
Saidane et al. | The image text recognition graph (iTRG) | |
CN111461169A (zh) | 基于正反卷积和多层分支深度网络的行人属性识别方法 | |
CN113989507B (zh) | 一种水下图像语义分割模型及分割方法 | |
CN118072146B (zh) | 一种基于多层级特征融合的无人机航拍小目标检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |