CN117173542B - 一种基于yolov8模型的水上漂浮物检测优化方法和系统 - Google Patents

一种基于yolov8模型的水上漂浮物检测优化方法和系统 Download PDF

Info

Publication number
CN117173542B
CN117173542B CN202311393458.3A CN202311393458A CN117173542B CN 117173542 B CN117173542 B CN 117173542B CN 202311393458 A CN202311393458 A CN 202311393458A CN 117173542 B CN117173542 B CN 117173542B
Authority
CN
China
Prior art keywords
feature
feature map
module
map
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311393458.3A
Other languages
English (en)
Other versions
CN117173542A (zh
Inventor
崔玉涛
徐燕峰
蒋宜轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yitu Information Technology Co ltd
Original Assignee
Shandong Yitu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yitu Information Technology Co ltd filed Critical Shandong Yitu Information Technology Co ltd
Priority to CN202311393458.3A priority Critical patent/CN117173542B/zh
Publication of CN117173542A publication Critical patent/CN117173542A/zh
Application granted granted Critical
Publication of CN117173542B publication Critical patent/CN117173542B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开一种基于YOLOV8模型的水上漂浮物检测优化方法和系统,涉及图像处理技术领域;所述方法利用高效多尺度注意力模块中跨空间学习方法,在没有通道降维的情况下使得每个并行子网络建立局部跨通道交互,并通过跨空间学习方法融合两个并行子网络的输出特征图,以增强特征的聚合性。提升模型对于目标的识别能力,减少目标的漏检,该方法可以在复杂的环境下对水上漂浮物进行有效检测。

Description

一种基于YOLOV8模型的水上漂浮物检测优化方法和系统
技术领域
本发明公开一种基于YOLOV8模型的水上漂浮物检测优化方法和系统,涉及图像处理技术领域。
背景技术
水资源作为人类社会发展的命脉,而在淡水资源中也仅有0.01%水资源适合人类使用。在河流、湖泊、水库等区域和无人值守环境中,利用视频监控进行漂浮物检测已成为一个迫切的需求,通过监控视频实现水面漂浮物检测可提升河湖智能化管理水平。传统方法依靠人工判读视频图像进行漂浮物目标检测,不仅体现在工作量较大,而且检测精度和效率都无法得到保障。因此,及时从监控视频数据中捕捉关键信息,准确高效地识别并定位漂浮物,对实现河湖智能化管理具有十分重要的意义。
随着目标检测算法的不断发展,相比传统目标检测算法,基于深度学习的目标检测算法具有更强的泛化能力和鲁棒性。基于深度学习的目标检测算法可分为两类:基于候选区域的双阶段目标检测算法和基于逻辑回归的单阶段目标检测算法。两阶段目标检测算法,如Faster R-CNN和Mask R-CNN,首先在图像生成可能包含的一系列候选区域,进一步对候选区域进行分类和回归,得到最终的目标类别和位置。单阶段目标检测算法,如YOLO(YouOnly Look Once)系列和SSD(Single Shot multibox Detector)算法,使用回归的方式,可以分类任务和定位任务合并,在特征提取后获取目标的位置和类别。相比两阶段目标检测算法,单阶段目标检测算法在保证检测精度的同时,降低了模型复杂度,在目标检测的场景中应用更加广泛。这种模型不仅提高了检测精度,而且降低了模型的复杂度。由于水上漂浮物检测容易受到自然天气、光照强度等因素的影响,无法保证在不同场景下检测的实时性和准确性。
因此,如何避免在背景复杂、光照变化等复杂真实环境下,提升漂浮物的检测精度是本领域技术人员亟待解决的问题。
发明内容
本发明针对现有技术的问题,提供一种基于YOLOV8模型的水上漂浮物检测优化方法和系统,所采用的技术方案为:
第一方面,一种基于YOLOV8模型的水上漂浮物检测优化方法,所述方法包括:
根据采集的漂浮物图像数据构建水上漂浮物数据集;
根据所述水上漂浮物数据集对YOLOV8模型进行训练,得到水上漂浮物检测模型;其中,所述YOLOV8模型包括特征提取模块和特征融合模块,所述特征提取模块包括C2f_PConv模块,所述特征融合模块包括多尺度注意力模块;
根据所述水上漂浮物检测模型,对待检测的漂浮物图像数据进行检测。
在一些实现方式中,所述根据采集的漂浮物图像数据构建水上漂浮物数据集,包括:
所述漂浮物图像数据包括网络端的公开数据集,对所述公开数据集中的图像整理,并通过Labelimg工具进行标注,构建得到水上漂浮物数据集;
按照8:1:1的方式将所述水上漂浮物数据集划分为训练集、验证集和测试集。
在一些实现方式中,所述方法还包括:对所述水上漂浮物数据集进行Mosaic数据增强操作,得到增强数据集。
在一些实现方式中,所述YOLOV8模型的结构为9层:
将所述增强数据集通过第1层DBS 模块解析,得到特征图Feature0;
将所述特征图Feature0经过第2层DBS模块解析,得到特征图Feature1;
将所述特征图Feature1输入第3层C2f_PConv模块,通过并行梯度流分支解析得到特征图Feature2;
将所述特征图Feature2通过第4层DBS模块解析,得到特征图Feature3;
将所述特征图Feature3经过第5层C2f_PConv模块解析,得到特征图Feature4;
将所述特征图Feature4经过第6层DBS模块和第7层DBS模块解析,得到特征图Feature5和特征图Feature6;
将所述特征图Feature6经过第8层DBS模块和第9层DBS模块解析,得到特征图Feature7和特征图Feature8;
将所述特征图Feature8经过空间金字塔池化处理后,得到特征图Feature9,所述特征图Feature9作为所述特征融合模块的输入数据。
在一些实现方式中,所述多尺度注意力模块,包括:
对所述特征图Feature9进行上采样操作,其通道数为512层,获得特征图Feature_Up1;
将所述特征图Feature_Up1和所述特征图Feature6进行特征融合,得到特征图Feature_Cat1,将所述特征图Feature_Cat1经过所述C2f模块,其通道数为512层,得到特征图Feature10;
对所述特征图Feature10进行上采样操作得到特征图Feature_Up2;将所述特征图Feature_Up2和所述特征图Feature4进行特征融合,得到特征图Feature_Cat2;
将所述特征图Feature_Cat2通过所述C2f_EMA模块得到特征图Feature11;
将所述特征图Feature11通过DBS模块后得到特征图Feature12,将所述Feature12和所述特征图Feature10进行特征融合,得到特征图Feature_Cat3;
将所述特征图Feature11通过DBS模块后再通过卷积核大小为1×1卷积获得特征图F3,其特征尺寸为原图像的1/8,用于小目标检测;
将所述特征图Feature_Cat3经过所述C2f_EMA模块解析,得到特征图Feature13;
将所述特征图Feature13通过DBS模块后得到特征图Feature14;将所述Feature14和所述特征图Feature9进行特征融合,得到特征图Feature_Cat4;
将所述特征图Feature_Cat4经过所述DBS模块后再通过卷积核大小为1×1卷积获得特征图F2,其特征尺寸为原图像的1/16,用于中目标检测;
将所述特征图Feature_Cat4经过所述C2f_EMA模块后再通过卷积核大小为1×1卷积获得特征图F1,其特征尺寸为原图像的1/32,用于大目标检测。
在一些实现方式中,所述将所述特征图Feature_Cat2通过所述C2f_EMA模块得到特征图Feature11,包括:
所述特征图Feature_Cat2经过多尺度注意力模块,其中所述多尺度注意力模块将部分通道重塑为批量尺度,并将通道维度分组为多个子特征,使空间语义特征在每个特征组中均匀分布,得到特征图Feature11。
第二方面,本发明实施例提供一种基于YOLOV8模型的水上漂浮物检测优化系统,所述系统包括:
数据采集模块,用于根据采集的漂浮物图像数据构建水上漂浮物数据集;
模型训练模块,用于根据所述水上漂浮物数据集对YOLOV8模型进行训练,得到水上漂浮物检测模型;其中,所述YOLOV8模型包括特征提取模块和特征融合模块,所述特征提取模块包括C2f_PConv模块,所述特征融合模块包括多尺度注意力模块;
数据监测模块,用于根据所述水上漂浮物检测模型,对待检测的漂浮物图像数据进行检测。
在一些实现方式中,所述数据采集模块包括:
数据解析单元,用于所述漂浮物图像数据包括网络端的公开数据集,对所述公开数据集中的图像整理,并通过Labelimg工具进行标注,构建得到水上漂浮物数据集;
数据处理单元,用于按照8:1:1的方式将所述水上漂浮物数据集划分为训练集、验证集和测试集。
第三方面,本发明实施例提供一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时,实现如上述第一方面所述的方法。
第四方面,本发明实施例提供一种计算机存储介质,所述计算机可读取存储介质中存储有计算机程序,所述计算机程序被处理器执行时,用实现如第一方面所述的方法。
本发明的一个或多个实施例至少能够带来如下有益效果:
本发明提供一种基于YOLOV8模型的水上漂浮物检测优化方法;首先,使用Mosaic数据增强方法,丰富数据集中目标的特征;其次引入部分卷积,将部分卷积与C2f模块结合,设计C2f_PConv模块,PConv模块只在输入通道的一部分上应用常规Conv进行空间特征提取,并保持其余通道不变,进一步在PConv之后增加逐点卷积,使得输入特征图的有效感受野更加关注其中心位置,利用卷积核之间的冗余节省了计算量。在特征融合模块将C2f模块替换为C2f_EMA模块,利用高效多尺度注意力模块中跨空间学习方法,在没有通道降维的情况下使得每个并行子网络建立局部跨通道交互,并通过跨空间学习方法融合两个并行子网络的输出特征图,以增强特征的聚合性。提升模型对于目标的识别能力,减少目标的漏检,该方法可以在复杂的环境下对水上漂浮物进行有效检测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于YOLOV8模型的水上漂浮物检测优化方法的流程图;
图2是本发明实施例提供的一种基于YOLOV8模型的水上漂浮物检测优化系统的框图;
图3是本发明实施例提供的所述YOLOV8模型的结构示意图;
图4是本发明实施例提供的所述C2f_PConv模块的模型示意图;
图5是本发明实施例提供的所述C2f_EMA模块的模型示意图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1示出了一种基于YOLOV8模型的水上漂浮物检测优化方法的流程图,如图1所示,本实施例提供的基于YOLOV8模型的水上漂浮物检测优化方法,包括:
S1根据采集的漂浮物图像数据构建水上漂浮物数据集;
S2根据所述水上漂浮物数据集对YOLOV8模型进行训练,得到水上漂浮物检测模型;
其中,所述YOLOV8模型包括特征提取模块和特征融合模块,所述特征提取模块包括C2f_PConv模块,所述特征融合模块包括多尺度注意力模块;
S3根据所述水上漂浮物检测模型,对待检测的漂浮物图像数据进行检测。
在一些实现方式中,所述根据采集的漂浮物图像数据构建水上漂浮物数据集,包括:
S11所述漂浮物图像数据包括网络端的公开数据集,对所述公开数据集中的图像整理,并通过Labelimg工具进行标注,构建得到水上漂浮物数据集;
S12按照8:1:1的方式将所述水上漂浮物数据集划分为训练集、验证集和测试集。
按照本步骤,首先采集图像数据构建水上漂浮物数据集,图像采用Labelimg工具进行标注,构建水上漂浮物检测数据集,其中包括:瓶子、塑料袋、牛奶盒和草四种类别作为研究对象,再对获取图像数据进行标注,将标注完成后的图像按照8:1:1的方式将所述水上漂浮物数据集划分为训练集、验证集和测试集,并对数据集进行水平翻转、垂直翻转以及Mosaic数据增强操作;
所述8:1:1的划分方式为训练数据集通用方式,在一定程度上可以平衡训练、验证和测试的需求;所述水上漂浮物数据集中,80%的数据用于训练,能够使模型更好学习图像特征,10%验证数据用于模型调优,确保模型的泛化能力,10%测试数据用于最终评估模型性能,以确定模型是否成功应用到实际问题中。
进一步的,所述方法还包括:对所述水上漂浮物数据集进行Mosaic数据增强操作,得到增强数据集。
其中,所述Mosaic数据增强方法将多张不同照片合并为一张图像,重新设置一张图像,将其余四张图像裁剪后以重设图像中的中心点进行拼接,得到一张合并图像,然后将这张合并图像用作训练。
按照本步骤,能够增加训练数据的多样性,有助于模型更好地学习不同的图像特征,同时提高模型泛化能力,通过数据增强,以处理背景复杂,特征多变的图像。
进一步的,所述S2中YOLOV8模型的结构为9层:
S201将所述增强数据集通过第1层DBS 模块解析,得到特征图Feature0;
S202将所述特征图Feature0经过第2层DBS模块解析,得到特征图Feature1;
S203将所述特征图Feature1输入第3层C2f_PConv模块,通过并行梯度流分支解析得到特征图Feature2;
S204将所述特征图Feature2通过第4层DBS模块解析,得到特征图Feature3;
S205将所述特征图Feature3经过第5层C2f_PConv模块解析,得到特征图Feature4;
S206将所述特征图Feature4经过第6层DBS模块和第7层DBS模块解析,得到特征图Feature5和特征图Feature6;
S207将所述特征图Feature6经过第8层DBS模块和第9层DBS模块解析,得到特征图Feature7和特征图Feature8;
S208将所述特征图Feature8经过空间金字塔池化处理后,得到特征图Feature9,所述特征图Feature9作为所述特征融合模块的输入数据。
其中,所述YOLOV8模型为改进模型的特征提取模块,特征提取模块由9个子模块组成。
进一步的,所述S2中多尺度注意力模块,包括:
S211对所述特征图Feature9进行上采样操作,其通道数为512层,获得特征图Feature_Up1;
按照S211对特征图进行上采样后,特征图的通道数为512层。由于特征图是通过设定的卷积核进行的特征提取,本步骤设置为512层能够使特征融合模块的特征图与特征提取模块的特征图进行融合;
S212将所述特征图Feature_Up1和所述特征图Feature6进行特征融合,得到特征图Feature_Cat1,将所述特征图Feature_Cat1经过所述C2f模块,其通道数为512层,得到特征图Feature10;
本步骤中,C2f模块为整个模型的11层;C2f模块中包括两个卷积模块以及连个Bottleneck模块,首先特征图经过卷积模块后进行Split操作,将切分的特征与经过两个Bottleneck模块的特征进行跳跃连接,最终再将特征进行融合,将融合后的特征经过卷积模块后输出;
S213对所述特征图Feature10进行上采样操作得到特征图Feature_Up2;将所述特征图Feature_Up2和所述特征图Feature4进行特征融合,得到特征图Feature_Cat2;
S214将所述特征图Feature_Cat2通过所述C2f_EMA模块得到特征图Feature11;
所述C2f_EMA模块是在C2f模块的基础上增加EMA(高效多尺度注意力模块),该模块主要通过特征分组,对不同语义特征进行学习,并将学习的注意力权重增强子特征中感兴趣区域,为C2f模块的改进;
S215将所述特征图Feature11通过DBS模块后得到特征图Feature12,将所述Feature12和所述特征图Feature10进行特征融合,得到特征图Feature_Cat3;
本步骤中,所述DBS模块位于整体网络结构的第14层,属于特征统合模块;
S216将所述特征图Feature11通过DBS模块后再通过卷积核大小为1×1卷积获得特征图F3,其特征尺寸为原图像的1/8,用于小目标检测;
本步骤中,所述DBS模块位于目标检测头第1层,不计算在整体网络结构中,整体网络结构层数只包含特征提取模块和特征融合模块;
S217将所述特征图Feature_Cat3经过所述C2f_EMA模块解析,得到特征图Feature13;
S218将所述特征图Feature13通过DBS模块后得到特征图Feature14;将所述Feature14和所述特征图Feature9进行特征融合,得到特征图Feature_Cat4;
S219将所述特征图Feature_Cat4经过所述DBS模块后再通过卷积核大小为1×1卷积获得特征图F2,其特征尺寸为原图像的1/16,用于中目标检测;
S210将所述特征图Feature_Cat4经过所述C2f_EMA模块后再通过卷积核大小为1×1卷积获得特征图F1,其特征尺寸为原图像的1/32,用于大目标检测。
其中,多尺度注意力模块为改进模型的特征融合模块,用于将提取出的特征图进行融合,以丰富千层的位置信息和深层的语义信息;
特征图的处理规律:首先对于输入彩色图像,通过基础卷积神经网络对图像中不同尺度和层次的特征信息进行提取,包括浅层位置信息和深层语义信息;将不同层次的特征融合,以获取多尺度信息;进一步使用预定义的锚框在特征图进行物体检测;最后输出检测物体的类别和位置信息;
在本实施例中,将所述特征图Feature_Cat2经过C2f_EMA模块,其中C2f_EMA模块中首先通过C2f结构再经过高效多尺度注意力模块,其中高效多尺度注意力模块主要分三部分进行特征提取,首先通过特征分组,对于任意给定的输入特征图,将其在通道维度上划分为/>个子特征,以学习不同的语义特征,并将学习的注意力权重用于增强子特征中的感兴趣区域。其次采用并行子网络进行分组特征提取,主要包含三组并行分支,其中两个/>卷积分支和一个/>卷积分支,在/>卷积分支中,设计两个1D全局平均池化操作分别作用于两个空间方向,并对通道特征进行编码,而/>卷积分支用于捕获多尺度特征。两个分支实现了跨通道信息交互,并捕获了所在通道之间的依赖关系,不仅对通道间信息进行编码以调整不同通道的重要性,而且将精确的空间结构信息保存在通道中。最后实现了跨空间学习,利用2D全局平均池化操作对/>分支输出的空间信息进行编码,并将最小分支的输出特征转换成相应维度;类似地利用2D全局平均池化对/>分支进行全局空间信息编码,并将输出特征转为对应的维度,将两者在通道特征中进行拼接融合,通过融合不同尺度的上下文信息使神经网络对高级语义特征进行更精细化提取。得到特征图Feature11;
其2D全局平均池化的具体过程为:其中,H表示输入特征图X的高度,W表示输入特征图X的宽度,其中c表示第c个通道上全局平均化的值,Xc(i,j)表示输入特征图X在位置(i,j)处,第c个通道上的像素值;
为实现有效计算,在2D全局平均池化的输出处使用2D高斯映射的自然非线性函数Softmax进行拟合线性变换,实现对全局信息的编码并对长期依赖关系进行建模;
设置训练参数:图片的输入尺寸设置为640×640,初始学习率设为0.01,批次(batch size)大小设置为32,epoch迭代次数设置为200,并采用随机梯度下降策略进行随机衰减;
进一步的,S214将所述特征图Feature_Cat2通过所述C2f_EMA模块得到特征图Feature11,包括:
S2141所述特征图Feature_Cat2经过多尺度注意力模块,其中所述多尺度注意力模块将部分通道重塑为批量尺度,并将通道维度分组为多个子特征,使空间语义特征在每个特征组中均匀分布,得到特征图Feature11。
设置训练参数:图片的输入尺寸设置为640×640,初始学习率设为0.01,批次(batch size)大小设置为32,epoch迭代次数设置为200,并采用随机梯度下降策略进行随机衰减;
本发明实施例中,还采用上下翻转和左右翻转的方法增加不同角度的漂浮物图像并结合Mosaic方法提升对物体的识别能力;使用改进后的卷积神经网络进行训练,训练完成得到最终基于YOLOV8模型的水上漂浮物检测优化方法。
实施例二:
图2是本发明实施例提供的一种基于YOLOV8模型的水上漂浮物检测优化系统的框图;
图2示出了一种基于YOLOV8模型的水上漂浮物检测优化优化系统的框图,如图2所示,本实施例提供的基于YOLOV8模型的水上漂浮物检测优化系统,所述系统包括:
数据采集模块,用于根据采集的漂浮物图像数据构建水上漂浮物数据集;
模型训练模块,用于根据所述水上漂浮物数据集对YOLOV8模型进行训练,得到水上漂浮物检测模型;其中,所述YOLOV8模型包括特征提取模块和特征融合模块,所述特征提取模块包括C2f_PConv模块,所述特征融合模块包括多尺度注意力模块;
数据监测模块,用于根据所述水上漂浮物检测模型,对待检测的漂浮物图像数据进行检测。
进一步的,所述数据采集模块包括:
数据解析单元,用于所述漂浮物图像数据包括网络端的公开数据集,对所述公开数据集中的图像整理,并通过Labelimg工具进行标注,构建得到水上漂浮物数据集;
数据处理单元,用于按照8:1:1的方式将所述水上漂浮物数据集划分为训练集、验证集和测试集。
实施例三:
本实施例还提供一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现实施例一的方法;
在实际应用中,处理器可以是专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(ProgrammableLogic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器 (Microcontroller Unit, MCU)、微处理器或其他电子元件实现,用于执行上述实施例中的方法。
本实施例所实现的方法,如实施例所述方法记载。
实施例四:
本实施例还提供一种计算机存储介质,所述计算机可读取存储介质中存储有计算机程序,计算机程序被一个或多个处理器执行时,实现实施例一的方法;
其中,计算机可读存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本实施例所实现的方法,包括:
本实施例所实现的方法,如实施例所述方法记载。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统和方法实施例仅仅是示意性的。
需要说明的是,在本文中,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (7)

1.一种基于YOLOV8模型的水上漂浮物检测优化方法,其特征在于,所述方法包括:
根据采集的漂浮物图像数据构建水上漂浮物数据集;
根据所述水上漂浮物数据集对YOLOV8模型进行训练,得到水上漂浮物检测模型;对所述水上漂浮物数据集进行Mosaic数据增强操作,得到增强数据集;其中,所述YOLOV8模型包括特征提取模块和特征融合模块,所述特征提取模块包括C2f_PConv模块,所述特征融合模块包括多尺度注意力模块;
根据所述水上漂浮物检测模型,对待检测的漂浮物图像数据进行检测;
其中,所述YOLOV8模型的结构为9层:
将所述增强数据集通过第1层DBS 模块解析,得到特征图Feature0;
将所述特征图Feature0经过第2层DBS模块解析,得到特征图Feature1;
将所述特征图Feature1输入第3层C2f_PConv模块,通过并行梯度流分支解析得到特征图Feature2;
将所述特征图Feature2通过第4层DBS模块解析,得到特征图Feature3;
将所述特征图Feature3经过第5层C2f_PConv模块解析,得到特征图Feature4;
将所述特征图Feature4经过第6层DBS模块和第7层DBS模块解析,得到特征图Feature5和特征图Feature6;
将所述特征图Feature6经过第8层DBS模块和第9层DBS模块解析,得到特征图Feature7和特征图Feature8;
将所述特征图Feature8经过空间金字塔池化处理后,得到特征图Feature9,所述特征图Feature9作为所述特征融合模块的输入数据;
其中,所述多尺度注意力模块,包括:
对所述特征图Feature9进行上采样操作,其通道数为512层,获得特征图Feature_Up1;
将所述特征图Feature_Up1和所述特征图Feature6进行特征融合,得到特征图Feature_Cat1,将所述特征图Feature_Cat1经过C2f模块,其通道数为512层,得到特征图Feature10;
对所述特征图Feature10进行上采样操作得到特征图Feature_Up2;将所述特征图Feature_Up2和所述特征图Feature4进行特征融合,得到特征图Feature_Cat2;
将所述特征图Feature_Cat2通过C2f_EMA模块得到特征图Feature11;
将所述特征图Feature11通过DBS模块后得到特征图Feature12,将所述Feature12和所述特征图Feature10进行特征融合,得到特征图Feature_Cat3;
将所述特征图Feature11通过DBS模块后再通过卷积核大小为1×1卷积获得特征图F3,其特征尺寸为原图像的1/8,用于小目标检测;
将所述特征图Feature_Cat3经过所述C2f_EMA模块解析,得到特征图Feature13;
将所述特征图Feature13通过DBS模块后得到特征图Feature14;将所述Feature14和所述特征图Feature9进行特征融合,得到特征图Feature_Cat4;
将所述特征图Feature_Cat4经过所述DBS模块后再通过卷积核大小为1×1卷积获得特征图F2,其特征尺寸为原图像的1/16,用于中目标检测;
将所述特征图Feature_Cat4经过所述C2f_EMA模块后再通过卷积核大小为1×1卷积获得特征图F1,其特征尺寸为原图像的1/32,用于大目标检测。
2.根据权利要求1所述的方法,其特征在于,所述根据采集的漂浮物图像数据构建水上漂浮物数据集,包括:
所述漂浮物图像数据包括网络端的公开数据集,对所述公开数据集中的图像整理,并通过Labelimg工具进行标注,构建得到水上漂浮物数据集;
将所述水上漂浮物数据集划分为训练集、验证集和测试集。
3.根据权利要求2所述的方法,其特征在于,所述将所述特征图Feature_Cat2通过所述C2f_EMA模块得到特征图Feature11,包括:
所述特征图Feature_Cat2经过多尺度注意力模块,其中所述多尺度注意力模块将部分通道重塑为批量尺度,并将通道维度分组为多个子特征,使空间语义特征在每个特征组中均匀分布,得到特征图Feature11。
4.一种基于YOLOV8模型的水上漂浮物检测优化系统,其特征在于,所述系统包括:
数据采集模块,用于根据采集的漂浮物图像数据构建水上漂浮物数据集;
模型训练模块,用于根据所述水上漂浮物数据集对YOLOV8模型进行训练,得到水上漂浮物检测模型;用于对所述水上漂浮物数据集进行Mosaic数据增强操作,得到增强数据集;其中,所述YOLOV8模型包括特征提取模块和特征融合模块,所述特征提取模块包括C2f_PConv模块,所述特征融合模块包括多尺度注意力模块;
数据监测模块,用于根据所述水上漂浮物检测模型,对待检测的漂浮物图像数据进行检测;
其中,所述YOLOV8模型的结构为9层:
将所述增强数据集通过第1层DBS 模块解析,得到特征图Feature0;
将所述特征图Feature0经过第2层DBS模块解析,得到特征图Feature1;
将所述特征图Feature1输入第3层C2f_PConv模块,通过并行梯度流分支解析得到特征图Feature2;
将所述特征图Feature2通过第4层DBS模块解析,得到特征图Feature3;
将所述特征图Feature3经过第5层C2f_PConv模块解析,得到特征图Feature4;
将所述特征图Feature4经过第6层DBS模块和第7层DBS模块解析,得到特征图Feature5和特征图Feature6;
将所述特征图Feature6经过第8层DBS模块和第9层DBS模块解析,得到特征图Feature7和特征图Feature8;
将所述特征图Feature8经过空间金字塔池化处理后,得到特征图Feature9,所述特征图Feature9作为所述特征融合模块的输入数据;
其中,所述多尺度注意力模块,包括:
对所述特征图Feature9进行上采样操作,其通道数为512层,获得特征图Feature_Up1;
将所述特征图Feature_Up1和所述特征图Feature6进行特征融合,得到特征图Feature_Cat1,将所述特征图Feature_Cat1经过C2f模块,其通道数为512层,得到特征图Feature10;
对所述特征图Feature10进行上采样操作得到特征图Feature_Up2;将所述特征图Feature_Up2和所述特征图Feature4进行特征融合,得到特征图Feature_Cat2;
将所述特征图Feature_Cat2通过C2f_EMA模块得到特征图Feature11;
将所述特征图Feature11通过DBS模块后得到特征图Feature12,将所述Feature12和所述特征图Feature10进行特征融合,得到特征图Feature_Cat3;
将所述特征图Feature11通过DBS模块后再通过卷积核大小为1×1卷积获得特征图F3,其特征尺寸为原图像的1/8,用于小目标检测;
将所述特征图Feature_Cat3经过所述C2f_EMA模块解析,得到特征图Feature13;
将所述特征图Feature13通过DBS模块后得到特征图Feature14;将所述Feature14和所述特征图Feature9进行特征融合,得到特征图Feature_Cat4;
将所述特征图Feature_Cat4经过所述DBS模块后再通过卷积核大小为1×1卷积获得特征图F2,其特征尺寸为原图像的1/16,用于中目标检测;
将所述特征图Feature_Cat4经过所述C2f_EMA模块后再通过卷积核大小为1×1卷积获得特征图F1,其特征尺寸为原图像的1/32,用于大目标检测。
5.根据权利要求4所述的系统,其特征在于,所述数据采集模块包括:
数据解析单元,用于所述漂浮物图像数据包括网络端的公开数据集,对所述公开数据集中的图像整理,并通过Labelimg工具进行标注,构建得到水上漂浮物数据集;
数据处理单元,用于按照8:1:1的方式将所述水上漂浮物数据集划分为训练集、验证集和测试集。
6.一种电子设备,其特征在于,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如上述权利要求1-3中任意一项所述方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读取存储介质中存储有计算机程序,所述计算机程序被处理器执行时用以实现如上述权利要求1-3中任意一项所述方法。
CN202311393458.3A 2023-10-26 2023-10-26 一种基于yolov8模型的水上漂浮物检测优化方法和系统 Active CN117173542B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311393458.3A CN117173542B (zh) 2023-10-26 2023-10-26 一种基于yolov8模型的水上漂浮物检测优化方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311393458.3A CN117173542B (zh) 2023-10-26 2023-10-26 一种基于yolov8模型的水上漂浮物检测优化方法和系统

Publications (2)

Publication Number Publication Date
CN117173542A CN117173542A (zh) 2023-12-05
CN117173542B true CN117173542B (zh) 2024-05-28

Family

ID=88943402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311393458.3A Active CN117173542B (zh) 2023-10-26 2023-10-26 一种基于yolov8模型的水上漂浮物检测优化方法和系统

Country Status (1)

Country Link
CN (1) CN117173542B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202023103167U1 (de) * 2023-06-08 2023-06-19 Nasib Singh Gill Ein System zur Echtzeit-Erkennung von Müll unter Wasser mit Hilfe des fein abgestimmten YOLOv8
CN116385773A (zh) * 2023-03-09 2023-07-04 西交利物浦大学 小目标的检测方法、存储介质及电子设备
CN116758547A (zh) * 2023-06-27 2023-09-15 北京中超伟业信息安全技术股份有限公司 一种纸介质碳化方法、系统及存储介质
CN116863539A (zh) * 2023-07-20 2023-10-10 吴剑飞 一种基于优化YOLOv8s网络结构的跌倒人物目标检测方法
CN116883801A (zh) * 2023-07-20 2023-10-13 华北电力大学(保定) 基于注意力机制与多尺度特征融合的YOLOv8目标检测方法
CN116895030A (zh) * 2023-09-11 2023-10-17 西华大学 基于目标检测算法和注意力机制的绝缘子检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116385773A (zh) * 2023-03-09 2023-07-04 西交利物浦大学 小目标的检测方法、存储介质及电子设备
DE202023103167U1 (de) * 2023-06-08 2023-06-19 Nasib Singh Gill Ein System zur Echtzeit-Erkennung von Müll unter Wasser mit Hilfe des fein abgestimmten YOLOv8
CN116758547A (zh) * 2023-06-27 2023-09-15 北京中超伟业信息安全技术股份有限公司 一种纸介质碳化方法、系统及存储介质
CN116863539A (zh) * 2023-07-20 2023-10-10 吴剑飞 一种基于优化YOLOv8s网络结构的跌倒人物目标检测方法
CN116883801A (zh) * 2023-07-20 2023-10-13 华北电力大学(保定) 基于注意力机制与多尺度特征融合的YOLOv8目标检测方法
CN116895030A (zh) * 2023-09-11 2023-10-17 西华大学 基于目标检测算法和注意力机制的绝缘子检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Ghost-YOLOv8 Detection Algorithm for Traffic Signs;Xiong, E et al.;Computer Engineering and Applications;20231015;第200-207.页 *
基于SSD深度网络的河道漂浮物检测技术研究;唐小敏;舒远仲;刘文祥;刘金梅;;计算机技术与发展;20200910(09);第154-158页 *

Also Published As

Publication number Publication date
CN117173542A (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
Guo et al. CDnetV2: CNN-based cloud detection for remote sensing imagery with cloud-snow coexistence
CN107564025B (zh) 一种基于深度神经网络的电力设备红外图像语义分割方法
Shi et al. License plate recognition system based on improved YOLOv5 and GRU
CN111028255B (zh) 基于先验信息与深度学习的农田区域预筛选方法及装置
Pally et al. Application of image processing and convolutional neural networks for flood image classification and semantic segmentation
Luo et al. Learning high-level features by fusing multi-view representation of MLS point clouds for 3D object recognition in road environments
Huang et al. GraNet: Global relation-aware attentional network for semantic segmentation of ALS point clouds
CN111723657B (zh) 一种基于YOLOv3与自优化的河道异物检测方法及装置
CN112508079B (zh) 海洋锋面的精细化识别方法、系统、设备、终端及应用
CN104504395A (zh) 基于神经网络实现人车分类的方法和系统
CN104462494A (zh) 一种基于无监督特征学习的遥感图像检索方法及系统
Li et al. A comparison of deep learning methods for airborne lidar point clouds classification
CN116994140A (zh) 基于遥感影像的耕地提取方法、装置、设备和介质
CN112036249A (zh) 端对端行人检测及属性识别的方法、系统、介质及终端
CN114092487A (zh) 目标果实实例分割方法及系统
CN114283285A (zh) 交叉一致性自训练遥感图像语义分割网络训练方法及装置
Jiang et al. Forest-CD: Forest change detection network based on VHR images
CN114882380A (zh) 一种基于改进hrnet模型的湿地资源遥感识别算法
Hasan et al. Maize diseases image identification and classification by combining cnn with bi-directional long short-term memory model
Nagaraj et al. Multi scale feature extraction network with machine learning algorithms for water body extraction from remote sensing images
Wang et al. MSFF-CDNet: A Multi-Scale Feature Fusion Change Detection Network for Bi-temporal High-Resolution Remote Sensing Image
CN117173542B (zh) 一种基于yolov8模型的水上漂浮物检测优化方法和系统
CN109284752A (zh) 一种车辆的快速检测方法
CN114913402B (zh) 一种深度学习模型的融合方法、装置
Liu et al. Multispectral semantic land cover segmentation from aerial imagery with deep encoder–decoder network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant