CN115035354A - 基于改进yolox的水库水面漂浮物目标检测方法 - Google Patents

基于改进yolox的水库水面漂浮物目标检测方法 Download PDF

Info

Publication number
CN115035354A
CN115035354A CN202210964547.8A CN202210964547A CN115035354A CN 115035354 A CN115035354 A CN 115035354A CN 202210964547 A CN202210964547 A CN 202210964547A CN 115035354 A CN115035354 A CN 115035354A
Authority
CN
China
Prior art keywords
improved
training
water surface
yolox
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210964547.8A
Other languages
English (en)
Other versions
CN115035354B (zh
Inventor
许小华
包学才
王海菁
曾祥君
李德龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Institute of Technology
Jiangxi Academy of Water Resources
Original Assignee
Nanchang Institute of Technology
Jiangxi Academy of Water Resources
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Institute of Technology, Jiangxi Academy of Water Resources filed Critical Nanchang Institute of Technology
Priority to CN202210964547.8A priority Critical patent/CN115035354B/zh
Publication of CN115035354A publication Critical patent/CN115035354A/zh
Application granted granted Critical
Publication of CN115035354B publication Critical patent/CN115035354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/30Assessment of water resources

Abstract

本发明公开了一种基于改进YOLOX的水库水面漂浮物目标检测方法,其方法为:图像数据集收集和预处理操作;改进YOLOX算法模型,提出一种改进特征融合模块,增强输出特征信息的丰富度,提升大目标和小目标水库漂浮物的精度;判断是否要调整学习率以降低训练损失值,提升检测精度:若是,则在训练过程中手动更改超参数的取值并继续训练;否则,保持按原超参数训练;完成训练,获取最优权重:最后水库水面漂浮物图片检测识别。本发明的有益效果是:采用改进YOLOX算法模型进行目标检测,训练参数量适中,检测精度更好,实现了水库水面漂浮物的自动化高精度检测和识别。

Description

基于改进YOLOX的水库水面漂浮物目标检测方法
技术领域
本发明涉及一种图像分析检测技术领域,特别是涉及一种基于改进YOLOX 的水库水面漂浮物目标检测方法。
背景技术
当前水库工程管理大部分还停留在基于信息化的人工巡查和监管的阶段,造成水库工程标准管理的人工成本增加,管理效率降低。而且监测区域地处偏远,对于水库水面漂浮物污染情况巡查,由于人员作业是按一定周期进行,不能持续不间断巡查,对水库水面工程出现的一些问题不能及时发现,特别在阴雨或炎热等天气环境下,人员按规定时间周期实施标准化作业存在一定难度。如何提升水库水面漂浮物的智能化检测巡查水平,迫切需要人工智能、物联网等新兴技术提供一种有效的水面漂浮物智能化识别方法,有降低人工成本并大幅提升水库标准化智能化管理水平。
发明内容
本发明提供一种基于改进YOLOX的水库水面漂浮物目标检测方法,采用改进YOLOX算法模型进行目标检测,训练参数量适中,检测精度更好,实现了水库水面漂浮物的自动化高精度检测和识别。
本发明采用以下技术方案:一种基于改进YOLOX的水库水面漂浮物目标检测方法,其特征在于,包括步骤如下:
S1、图像数据集收集和预处理操作:针对不同水库检测场景制作大量水面漂浮物的图像;将图像数据进行分类和筛选得到数据集,剔除无效图像;保证每一类的数据集相同;利用图像预处理模块将水面漂浮物的图像进行尺寸变化以适应网络模型的输入,并对数据集进行标注,最后确定训练集、验证集和测试集;
S2、改进YOLOX算法模型,具体改进如下:
构建9层CSPLayer残差结构组成的dark2模块,即修改YOLOX主干网络,将原有1层的160*160*128的残差结构层CSPLayer改为9层,强化提取目标特征;
提出一种改进特征融合模块,增强输出特征信息的丰富度,提升小目标水库漂浮物的精度;
S3、判断是否要调整学习率以降低训练损失值,提升检测精度:若是,则在训练过程中手动更改超参数的取值并继续训练;否则,保持按原超参数训练;
S4、完成训练,获取最优权重:当训练和验证损失值均小于3%时,结束训练,保存当前权重作为最优权重;
S5、水库水面漂浮物图片检测识别:利用基于最优权重的改进YOLOX算法模型对水库的水面进行检测,判断是否有水面漂浮物,如果有则确定漂浮物的具体位置、大小和置信度并进行输出。
进一步的,步骤S1具体过程如下:
S1-1,收集水库中常出现的垃圾漂浮物类别并针对不同场景水库获取大量删除具有水面漂浮物图片,收集完后进行筛选工作将无效图片进行剔除;将剔除后的图片整理成漂浮物数据集;
S1-2,采用VOC、COCO数据集相同的目标检测标记手法,通过数据集标记软件Labelimg 标记已收集水面各类漂浮物数据集,默认使用矩形框进行标注,将“bottle”作为瓶子标识,“snakeBags”作为零食袋标识,“branch”作为树枝标识,“plasticBag”作为塑料袋标识;获得一组xml与相应jpg图片对应的标注集;
S1-3,确定训练集、验证集和测试集:根据标记完成的数据集数量以7:2:1的比例将数据集分为训练集、验证集和测试集,在训练过程中训练集和验证集不断对权重进行校正,以使得得到真实框GT的位置信息,将xml位置信息和对应图像的地址储存在一个.txt文件中,让改进YOLOX算法模型读取.txt文件进行训练。
进一步的,步骤S2中提出一种改进特征融合模块的具体改进如下:
A.在YOLOX的特征融合结构上,新增特征图大小为160*160*128的融合结构,并与修改主干网络中由9层大小为160*160*128 CSPLayer残差结构组成的dark2模块输出相连;
B. 将新增特征图大小为160*160*128的融合结构与由主干网络中3层大小为80*80*256 CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为80*80*256CSPLayer残差结构相连;
C. 将特征图大小80*80*256的融合结构与主干网络中3层大小为40*40*512CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为40*40*512 CSPLayer残差结构相连;
D. 将特征图大小40*40*512的融合结构与主干网络中3层大小为20*20*1024CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为20*20*1024 CSPLayer残差结构相连。
本发明的有益效果:本发明的改进算法模型针对小目标将水面漂浮物图像进行固定大小的剪裁实现特征提取。极大减少了针对此应用场景的训练参数,提升训练效率,并且由于修改了主干网络中某一层的结构层数以及提出了ZL-FPN特征融合模块,对小目标的检测效果起到了极大的提升效果。(1)预处理过程中加入了图像各种使数据鲁棒性增强的方法例如MixUp混合等数据增强操作,并剪裁原图大小以适应模型的输入。(2)对比传统的YOLOv3、YOLOv4、YOLOX模型,采用改进YOLOX算法模型MAP分别提升了49.85%、19.77%、9.27%精确度。
本发明采用改进的YOLOX模型在进行目标检测时,精确率大大提升;实时性更好;检测效率更高;实现了水库水面漂浮物检测的需求,在模型中针对数据集的鲁棒性和实时性进行优化,并且加入feat2特征图进行ZL-FPN特征融合操作,使得精度更高,检测效果更好,更好应用于水库监测。
附图说明
图1为本发明整体流程图。
图2是本发明改进YOLOX算法模型整体架构图。
图3是本发明改进YOLOX算法模型分解图一。
图4是本发明改进YOLOX算法模型分解图二。
图5是本发明改进YOLOX算法模型分解图三。
具体实施方式
为了使本领域的技术人员更好的理解本申请方案,接下来将配合上述配图,对本申请实施例中的技术方案进行清晰,完整,详细的描述,且所描述的实施例部分为本申请的一部分实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范畴。
基于改进YOLOX算法模型,采用的流程包括图像数据集收集和预处理操作、改进算法模型训练、选取最优权重、水库图片检测识别,如图1所示,具体为:
S1、图像数据集收集和预处理操作:针对不同水库检测场景制作大量水面漂浮物的图像;将图像数据进行基本的分类和筛选,剔除无效图像;并且尽可能保证每一类的检测数量相同;利用图像预处理模块将水面漂浮物图像进行尺寸变化以适应网络模型的输入,并对数据集进行标注,最后确定训练集、验证集和测试集;
S2、搭建改进YOLOX算法模型,具体改进有修改主干网络中某一层的结构层数,使得产生针对小目标更好的特征图,并将此特征图融入进特征融合操作;提出一种新型的特征融合模块(ZL-FPN),增强对最终的三个输出特征图进行分类与预测,提出了一种改进的YOLOX模型并利用改进YOLOX模型对分配好的数据集进行训练。
S3、判断是否要调整学习率、图像增强以降低训练损失值,提升检测精度:若是,则在训练过程中手动更改超参数的取值并继续训练。否则,保持原超参数进行训练。
S4、选取最优权重:在经过几百轮次训练之后,并不是最后一次的权重即为最优权重,很可能因为设置训练轮次过多造成后面的训练会产生过拟合现象。因此等训练结束后,对比训练损失值以及验证损失值,找到两个值同时都比较小的权重,通常此权重就是本次训练最优权重。
S5、水库水面漂浮物图片检测识别:对改进YOLOX算法模型利用最优权重对水库的水面进行检测,判断是否有水面漂浮物,如果有则确定漂浮物的具体位置、大小和置信度并进行输出。
步骤S1具体过程如下:
S1-1,收集水库中常出现的垃圾漂浮物类别并针对不同场景水库获取大量具有水面漂浮物图片,收集完后进行筛选工作将无效图片进行剔除。
S1-2,采用VOC、COCO数据集相同的目标检测标记手法,通过数据集标记软件Labelimg 标记已收集水面各类漂浮物数据集,默认使用矩形框进行标注,将 “bottle” 作为瓶子标识,“snakeBags” 作为零食袋标识,“branch” 作为树枝标识,“plasticBag” 作为塑料袋标识等。获得一组 xml 与相应 jpg 图片对应的标注集。
S1-3.确定训练集、验证集和测试集:根据标记完成的数据集数量以7:2:1的比例将数据集分为训练集、验证集和测试集。这样做的好处是在训练过程中训练集和验证集不断对权重进行校正,以使得尽可能达到GT(真实框)的位置信息。将xml位置信息和对应图像的地址储存在一个.txt文件中,让模型读取 .txt进行训练。
步骤S2具体改进模块对两个改进部分进一步说明如下:
A. 在原YOLOX的特征融合结构上,新增特征图大小为160*160*128的融合结构,并与修改主干网络中由9层大小为160*160*128 CSPLayer残差结构组成的dark2模块输出相连;
B. 将新增特征图大小为160*160*128的融合结构与主干网络中3层大小为80*80*256 CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为80*80*256CSPLayer残差结构相连;
C. 将特征图大小80*80*256的融合结构与主干网络中3层大小为40*40*512CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为40*40*512 CSPLayer残差结构相连;
D. 将特征图大小40*40*512的融合结构与主干网络中3层大小为20*20*1024CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为20*20*1024 CSPLayer残差结构相连。
传统YOLOX中只提取了dark3、dark4、dark5的特征信息,并进行最基础特征融合操作。在这个过程中,感受野小的特征图一是提取信息能力还不充分,二是未充分利用感受野小的特征图。而在水库水面漂浮物检测中,感受野小的特征是很重要的,可以更好判断水面漂浮物。进一步提升检测精度。本发明对传统的YOLOX模型进行改进,在主干网络中新增9层160*160*128 CSPLayer残差结构的dark2模块,使得产生更好感受野小的输出特征图,并将此输出特征图连接到改进特征融合模块。经验证表明,改进YOLOX的识别精度MAP较原始YOLOX模型提升了9.27%精确率,实现水库水面漂浮物识别精度的显著提升。
如图2-图5所示,为了进一步理解提出改进YOLOX的水库水面漂浮物目标检测方法的推理过程,以输入大小为640*640*3的水库水面漂浮物图像进行详细描述检测识别过程,具体步骤如下:
步骤1:输入一张640*640*3的水面漂浮物图像。
步骤2:图像数据经过Focus网络结构,生成大小为320*320*12的特征图。
步骤3:生成的特征图使用卷积核为64,步长为1的BN归一化和SiLU激活函数的CBS块,生成特征图大小为320*320*64的输出feat1。
步骤4:主干网络dark2模块对输出feat1使用卷积核为128,步长为2的BN归一化和SiLU激活函数的CBS块操作,生成特征为160*160*128,再经过新增的9个CSPLayer残差块,生成特征图大小为160*160*128为feat2,每个CSPLayer具体操作为残差块一边进行短边连接操作,另一边进行卷积提取特征操作,最后使用 concate 操作,把两条边的通道数相加,同样形成160*160*128的特征图。
步骤5:主干网络dark3模块对feat2使用卷积核为256,步长为2的BN归一化和SiLU激活函数的CBS块操作,生成特征为80*80*256,再经过3层CSPLayer残差块,生成特征图大小为80*80*256的输出feat3。
步骤6:主干网络dark4模块对输出feat3使用卷积核为512,步长为2的BN归一化和SiLU激活函数的CBS块操作,生成特征为40*40*512,再经过3层CSPLayer残差块,生成特征图大小为40*40*512的输出feat4。
步骤7:主干网络dark5模块对feat4使用卷积核为1024,步长为2的BN归一化和SiLU激活函数的CBS块操作,生成特征为20*20*1024,再经过SPPBottleneck结构再经过1个CSPLayer 残差块,生成特征图大小为20*20*1024的输出feat5。
步骤8:如图4所示,然后分别对 新增dark2和原始dark3、dark4、dark5主干层提取相对应输出的特征层,即feat2、feat3、feat4、feat5。
步骤9:对 输出feat5进行通道数减半卷积操作,紧接着进行上采样操作与 feat4进行融合,紧接着进行一个降通道的残差块结构得到P5_US_2。
步骤10:将 P5_US_2进行一个降通道的卷积操作得到P4,P4进行上采样与 feat3进行融合,紧接着进行一个降通道的残差块结构得到P4_US_2。
步骤11:将P4_US_2进行一个降通道的卷积操作得到P3,P3进行上采样与feat2进行融合,紧接着进行一个降通道的残差块结构得P2_out_1,紧接着P2_out_1与feat2再进行add 操作生成P2_out。
步骤12:将P2_out进行下采样操作得到P2_DS,将P2_DS与P3进行融合操作生成P3_DS,紧接着feat3与P3_DS进行add 操作,最后经过通道数不变的残差结构生成 P3_out。
步骤13:将P3_out进行下采样操作得到P4_DS_1,将P4_DS_1与P4进行融合操作生成P4_DS,紧接着 feat4与P4_DS进行 add操作,最后经过通道数不变的残差结构生成P4_out。
步骤14:将 P4_out进行下采样操作得到P5_DS_1,将P5_DS_1与P5进行融合操作生成 P5_DS,紧接着 feat5与 P5_DS进行 add 操作,最后经过通道数不变的残差结构生成P5_out,经过创新的ZL-FPN模块后输出的特征图(P3_out、P4_out、P5_out)信息丰富度更大。
步骤15:如图5所示,将 P3_out 输入YoloHead中即首先通过卷积核为256,步长为1的BN归一化和SiLU激活函数的CBS块,此时有两个分支,第一个分支进行卷积核为256,步长为1的BN归一化和SiLU激活函数的CBS块两遍,最后输出类别信息;第二个分支进行卷积核为256,步长为1的BN归一化和SiLU激活函数的CBS块两遍,最后分别输出框的位置信息和该物体的置信度。
步骤16:将P4_out输入YoloHead中即首先通过卷积核为512,步长为1的BN归一化和SiLU激活函数的 CBS块,此时有两个分支,第一个分支进行卷积核为512,步长为1的BN归一化和 SiLU激活函数的CBS块两遍,最后输出类别信息;第二个分支进行卷积核为512,步长为1的 BN 归一化和 SiLU 激活函数的 CBS 块两遍,最后分别输出框的位置信息和该物体的置信度。
步骤17:将P5_ou t输入YoloHead中即首先通过卷积核为1024,步长为1的BN归一化和 SiLU激活函数的 CBS 块,此时有两个分支,第一个分支进行卷积核为1024,步长为1的BN归一化和SiLU激活函数的CBS块两遍,最后输出类别信息;第二个分支进行卷积核为1024,步长为1的BN归一化和 SiLU激活函数的CBS块两遍,最后分别输出框的位置信息和该物体的置信度。
此外,在改进YOLOX的主干网络,新增由9层大小为160*160*128 CSPLayer残差结构组成的dark2模块的识别精度有明显提升,与1、3、6和12层相比的MAP值如表1所示:
Figure 91137DEST_PATH_IMAGE001
通过上述步骤,将瓶子、塑料垃圾袋、落叶、树枝、零食袋、一次性塑料盒、白色泡沫以及一次性杯子等八类水库水面漂浮物进行目标识别验证分析,本发明方法与YOLOV3、YOLOV4和原YOLOX算法作对比,在检测帧率基本不变的情况下,本发明方法在识别精度方面具有明显提升,对比结果如表2所示。
Figure 70594DEST_PATH_IMAGE002
以上对本发明所提供的一种基于改进YOLOX的水库水面漂浮物目标检测方法进行了详细的介绍,本文中应用了具体的实例对本发明的原理和实施方法进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法以及核心思想,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (3)

1.基于改进YOLOX的水库水面漂浮物目标检测方法,其特征在于,包括步骤如下:
S1、图像数据集收集和预处理操作:针对不同水库检测场景制作大量水面漂浮物的图像;将图像数据进行分类和筛选,剔除无效图像,得到数据集;保证每一类的数据集相同;利用图像预处理模块将水面漂浮物的图像进行尺寸变化以适应网络模型的输入,并对数据集进行标注,最后确定训练集、验证集和测试集;
S2、改进YOLOX算法模型,具体改进如下:
构建9层CSPLayer残差结构组成的dark2模块,即修改YOLOX主干网络,将原有1层的160*160*128的残差结构层CSPLayer改为9层,强化提取目标特征;
提出一种改进特征融合模块,增强输出特征信息的丰富度,提升目标水库漂浮物的精度;
S3、判断是否要调整学习率以降低训练损失值,提升检测精度:若是,则在训练过程中手动更改超参数的取值并继续训练;否则,保持按原超参数训练;
S4、完成训练,获取最优权重:当训练和验证损失值均小于3%时,结束训练,保存当前权重作为最优权重;
S5、水库水面漂浮物图片检测识别:利用基于最优权重的改进YOLOX算法模型对水库的水面进行检测,判断是否有水面漂浮物,如果有则确定漂浮物的具体位置、大小和置信度并进行输出。
2.如权利要求1所述基于改进YOLOX的水库水面漂浮物目标检测方法,其特征在于,步骤S1具体过程如下:
S1-1,收集水库中常出现的垃圾漂浮物类别并针对不同场景水库获取具有水面漂浮物图片,收集完后进行筛选工作将无效图片进行剔除;将剔除后的图片整理成漂浮物数据集;
S1-2,采用VOC、COCO数据集相同的目标检测标记手法,通过数据集标记软件 Labelimg标记已收集水面各类漂浮物数据集,默认使用矩形框进行标注,将“bottle”作为瓶子标识,“snakeBags”作为零食袋标识,“branch”作为树枝标识,“plasticBag”作为塑料袋标识;获得一组xml与相应jpg图片对应的标注集;
S1-3,确定训练集、验证集和测试集:根据标记完成的数据集数量以7:2:1的比例将数据集分为训练集、验证集和测试集,在训练过程中训练集和验证集不断对权重进行校正,以使得得到真实框GT的位置信息,将xml位置信息和对应图像的地址储存在一个.txt文件中,让改进YOLOX算法模型读取.txt文件进行训练。
3.如权利要求1所述的基于改进YOLOX的水库水面漂浮物目标检测方法,其特征在于,步骤S2中提出一种改进特征融合模块的具体改进如下:
在YOLOX的特征融合结构上,新增特征图大小为160*160*128的融合结构,并与修改主干网络中由9层大小为160*160*128 CSPLayer残差结构组成的dark2模块输出相连;
将新增特征图大小为160*160*128的融合结构与由主干网络中3层大小为80*80*256CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为80*80*256 CSPLayer残差结构相连;
将特征图大小80*80*256的融合结构与主干网络中3层大小为40*40*512 CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为40*40*512 CSPLayer残差结构相连;
将特征图大小40*40*512的融合结构与主干网络中3层大小为20*20*1024 CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为20*20*1024 CSPLayer残差结构相连。
CN202210964547.8A 2022-08-12 2022-08-12 基于改进yolox的水库水面漂浮物目标检测方法 Active CN115035354B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210964547.8A CN115035354B (zh) 2022-08-12 2022-08-12 基于改进yolox的水库水面漂浮物目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210964547.8A CN115035354B (zh) 2022-08-12 2022-08-12 基于改进yolox的水库水面漂浮物目标检测方法

Publications (2)

Publication Number Publication Date
CN115035354A true CN115035354A (zh) 2022-09-09
CN115035354B CN115035354B (zh) 2022-11-08

Family

ID=83130479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210964547.8A Active CN115035354B (zh) 2022-08-12 2022-08-12 基于改进yolox的水库水面漂浮物目标检测方法

Country Status (1)

Country Link
CN (1) CN115035354B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116704357A (zh) * 2023-08-09 2023-09-05 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) 基于YOLOv7的堤坝边坡滑坡智能识别与预警方法

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100041678A (ko) * 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
CA3076424A1 (en) * 2019-03-22 2020-09-22 Royal Bank Of Canada System and method for knowledge distillation between neural networks
CN112562655A (zh) * 2020-12-03 2021-03-26 北京猎户星空科技有限公司 残差网络的训练和语音合成方法、装置、设备及介质
CN113435269A (zh) * 2021-06-10 2021-09-24 华东师范大学 一种基于YOLOv3改进的水面漂浮物检测与识别方法及系统
CN114004811A (zh) * 2021-11-01 2022-02-01 西安交通大学医学院第二附属医院 一种基于多尺度残差编解码网络的图像分割方法及系统
CN114240821A (zh) * 2021-10-25 2022-03-25 上海电机学院 一种基于改进型yolox的焊缝缺陷检测方法
CN114299011A (zh) * 2021-12-27 2022-04-08 杭州电子科技大学 一种基于深度学习的遥感目标四边形框快速检测方法
CN114299492A (zh) * 2021-12-29 2022-04-08 浙江大学滨江研究院 基于yolox模型的中成药药材成分的检测方法及装置
CN114387538A (zh) * 2021-12-15 2022-04-22 江苏电力信息技术有限公司 基于YoloX网络的变电站作业现场安全识别方法
CN114419131A (zh) * 2022-01-05 2022-04-29 河南牧原智能科技有限公司 用于获取牲畜体重的方法、设备及计算机可读存储介质
CN114581848A (zh) * 2022-03-05 2022-06-03 中国农业科学院烟草研究所(中国烟草总公司青州烟草研究所) 一种用于烟草仓储害虫的检测方法、系统及装置
CN114638784A (zh) * 2022-02-17 2022-06-17 中南大学 一种基于fe-yolo的铜管表面缺陷检测方法及装置
CN114723750A (zh) * 2022-06-07 2022-07-08 南昌大学 基于改进yolox算法的输电线路耐张线夹缺陷检测方法
CN114782772A (zh) * 2022-04-08 2022-07-22 河海大学 一种基于改进ssd算法的水上漂浮物检测识别方法
CN114821341A (zh) * 2022-06-02 2022-07-29 昆明理工大学 基于fpn与pan网络的双重注意力的遥感小目标检测方法
CN114820490A (zh) * 2022-04-18 2022-07-29 大连工业大学 一种基于yolox改进算法的聚集血小板检测方法
CN114821480A (zh) * 2022-05-10 2022-07-29 东北林业大学 一种可调节算法计算参数量的监控视频人物跟踪方法
CN114821665A (zh) * 2022-05-24 2022-07-29 浙江工业大学 一种基于卷积神经网络的城市人流小目标检测方法
CN114863301A (zh) * 2022-05-07 2022-08-05 西南科技大学 一种面向无人机航拍图像的小目标检测方法

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100041678A (ko) * 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
CA3076424A1 (en) * 2019-03-22 2020-09-22 Royal Bank Of Canada System and method for knowledge distillation between neural networks
CN112562655A (zh) * 2020-12-03 2021-03-26 北京猎户星空科技有限公司 残差网络的训练和语音合成方法、装置、设备及介质
CN113435269A (zh) * 2021-06-10 2021-09-24 华东师范大学 一种基于YOLOv3改进的水面漂浮物检测与识别方法及系统
CN114240821A (zh) * 2021-10-25 2022-03-25 上海电机学院 一种基于改进型yolox的焊缝缺陷检测方法
CN114004811A (zh) * 2021-11-01 2022-02-01 西安交通大学医学院第二附属医院 一种基于多尺度残差编解码网络的图像分割方法及系统
CN114387538A (zh) * 2021-12-15 2022-04-22 江苏电力信息技术有限公司 基于YoloX网络的变电站作业现场安全识别方法
CN114299011A (zh) * 2021-12-27 2022-04-08 杭州电子科技大学 一种基于深度学习的遥感目标四边形框快速检测方法
CN114299492A (zh) * 2021-12-29 2022-04-08 浙江大学滨江研究院 基于yolox模型的中成药药材成分的检测方法及装置
CN114419131A (zh) * 2022-01-05 2022-04-29 河南牧原智能科技有限公司 用于获取牲畜体重的方法、设备及计算机可读存储介质
CN114638784A (zh) * 2022-02-17 2022-06-17 中南大学 一种基于fe-yolo的铜管表面缺陷检测方法及装置
CN114581848A (zh) * 2022-03-05 2022-06-03 中国农业科学院烟草研究所(中国烟草总公司青州烟草研究所) 一种用于烟草仓储害虫的检测方法、系统及装置
CN114782772A (zh) * 2022-04-08 2022-07-22 河海大学 一种基于改进ssd算法的水上漂浮物检测识别方法
CN114820490A (zh) * 2022-04-18 2022-07-29 大连工业大学 一种基于yolox改进算法的聚集血小板检测方法
CN114863301A (zh) * 2022-05-07 2022-08-05 西南科技大学 一种面向无人机航拍图像的小目标检测方法
CN114821480A (zh) * 2022-05-10 2022-07-29 东北林业大学 一种可调节算法计算参数量的监控视频人物跟踪方法
CN114821665A (zh) * 2022-05-24 2022-07-29 浙江工业大学 一种基于卷积神经网络的城市人流小目标检测方法
CN114821341A (zh) * 2022-06-02 2022-07-29 昆明理工大学 基于fpn与pan网络的双重注意力的遥感小目标检测方法
CN114723750A (zh) * 2022-06-07 2022-07-08 南昌大学 基于改进yolox算法的输电线路耐张线夹缺陷检测方法

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
BOXU CHEN: "A training method to improve the effect of small target detection", 《PROCEEDINGS OF SPIE》 *
H. PENG: "Improved YOLOX"s Anchor-Free SAR Image Ship Target Detection", 《IEEE ACCESS》 *
JUNCHI ZHOU: "Lightweight Detection Algorithm of Kiwifruit Based on Improved YOLOX-S", 《AGRICULTURE 2022》 *
SHUAIDONG LIAO: "Object detection of welding defects in SMT electronics production based on deep learning", 《2022 23RD INTERNATIONAL CONFERENCE ON ELECTRONIC PACKAGING TECHNOLOGY (ICEPT)》 *
TANRUI GAO: "Safety Helmet Wearing Detection Method Based on Improved YOLOX", 《2022 4TH INTERNATIONAL CONFERENCE ON COMMUNICATIONS, INFORMATION SYSTEM AND COMPUTER ENGINEERING (CISCE)》 *
XINJIE QIU: "ship detection in infrared images via bounding boxes based on improved yolox", 《ICCAID 2021》 *
唐小敏等: "基于SSD深度网络的河道漂浮物检测技术研究", 《计算机技术与发展》 *
张剑飞: "改进YOLOX火灾场景检测方法的研究", 《计算机与数字工程》 *
胡臣辰等: "基于YOLO改进残差网络结构的车辆检测方法", 《信息技术与网络安全》 *
贾振卿等: "基于YOLO和图像增强的海洋动物目标检测", 《电子测量技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116704357A (zh) * 2023-08-09 2023-09-05 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) 基于YOLOv7的堤坝边坡滑坡智能识别与预警方法
CN116704357B (zh) * 2023-08-09 2023-10-27 江西省水利科学院(江西省大坝安全管理中心、江西省水资源管理中心) 基于YOLOv7的堤坝边坡滑坡智能识别与预警方法

Also Published As

Publication number Publication date
CN115035354B (zh) 2022-11-08

Similar Documents

Publication Publication Date Title
CN109977812B (zh) 一种基于深度学习的车载视频目标检测方法
WO2022083784A1 (zh) 一种基于车联网的道路检测方法
CN104156734B (zh) 一种基于随机蕨分类器的全自主在线学习方法
CN111368815A (zh) 一种基于多部件自注意力机制的行人重识别方法
CN105117429A (zh) 基于主动学习和多标签多示例学习的场景图像标注方法
CN111723657B (zh) 一种基于YOLOv3与自优化的河道异物检测方法及装置
CN112837315B (zh) 一种基于深度学习的输电线路绝缘子缺陷检测方法
CN112529090B (zh) 一种基于改进YOLOv3的小目标检测方法
CN112434723B (zh) 一种基于注意力网络的日/夜间图像分类及物体检测方法
CN113591617B (zh) 基于深度学习的水面小目标检测与分类方法
CN114140665A (zh) 一种基于改进YOLOv5的密集小目标检测方法
CN115035354B (zh) 基于改进yolox的水库水面漂浮物目标检测方法
CN116385958A (zh) 一种用于电网巡检和监控的边缘智能检测方法
CN113420619A (zh) 一种遥感影像建筑物提取方法
CN113269224A (zh) 一种场景图像分类方法、系统及存储介质
CN115240069A (zh) 一种全雾天场景下的实时性障碍物检测方法
CN116385374A (zh) 基于卷积神经网络的细胞计数方法
CN112884135B (zh) 一种基于边框回归的数据标注校正方法
CN115082872B (zh) 一种面向边缘计算的河面采砂船及过往船只识别方法
CN114782762B (zh) 一种垃圾图像检测方法以及小区垃圾站
CN116912872A (zh) 图纸识别方法、装置、设备及可读存储介质
CN115880477A (zh) 一种基于深度卷积神经网络的苹果检测定位方法与系统
CN114998689A (zh) 一种轨道数据集的生成方法、轨道识别方法和系统
CN114973372A (zh) 婴儿表情分类检测方法
CN112199539A (zh) 无人机三维地图摄影图像内容自动标注方法、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant