WO2022062242A1

WO2022062242A1 - 一种基于深度学习的水下成像鱼网破损识别方法及系统

Info

Publication number: WO2022062242A1
Application number: PCT/CN2020/140287
Authority: WO
Inventors: 侯明鑫; 俞国燕; 王林; 梁贻察; 何泰华; 李军
Original assignee: 广东海洋大学; 南方海洋科学与工程广东省实验室(湛江)
Priority date: 2020-09-27
Filing date: 2020-12-28
Publication date: 2022-03-31
Also published as: CN112163517A; LU500649A1; LU500649B1

Abstract

本发明提出一种基于深度学习的水下成像鱼网破损识别方法，包括以下步骤：采集图像数据库并划分为训练集和测试集；对水下网破图像分别进行标注其网破位置并生成表格文件进行存储；构建鱼网破损识别模型；将训练集输入鱼网破损识别模型中进行训练，得到完成训练的鱼网破损识别模型；将测试集输入完成训练的鱼网破损识别模型中，输出测试集对应的鱼网破损识别结果，并验证模型的精准度，得到完成训练的鱼网破损识别模型；采用水下摄像头采集水下鱼网图像，将水下鱼网图像输入完成训练的鱼网破损识别模型中，输出得到鱼网破损识别结果。本发明还提出了一种基于深度学习的水下成像鱼网破损识别系统，能够搭载在水下作业的工程载体上使用。

Description

一种基于深度学习的水下成像鱼网破损识别方法及系统

技术领域

本发明涉及图像识别技术领域，更具体地，涉及一种基于深度学习的水下成像鱼网破损识别方法及系统。

背景技术

目标检测是对目标物体进行定位和分类的研究，随着数字图像处理的不断发展，目标检测成为当下研究者的重点研究方向之一。图像识别技术已被广泛应用于医学、军事、工业和农业领域，目前，尚未有应用于鱼网破损识别技术的相关研究。

相近的，研究者徐志刚等提出了路面破损图像自动处理技术，在对路面破损进行目标检测时，主要采用阈值分割法、边缘检测法、基于多尺度的裂缝检测方法、基于纹理的分割方法、基于多特征融合的方法、基于图论的分割方法、基于深度学习的方法等。其中，在基于深度学习的方法进行破损检测时，主要采用卷积神经网络CNN、深度卷积神经网络DCNN，且使用CNN方法能够弥补传统方法在准确率和检测效率方面的不足(徐志刚,车艳丽,李金龙,et al.路面破损图像自动处理技术研究进展[J].交通运输工程学报,2019,19(01):176-194.)。然而，在应用于水下成像鱼网破损识别领域时，直接采用卷积神经网络CNN、深度卷积神经网络DCNN会存在算法较复杂，难以搭载在水下作业的工程载体上使用。

发明内容

本发明为克服上述现有技术所述的算法复杂、难以搭载在水下作业的工程载体上使用的缺陷，提供一种基于深度学习的水下成像鱼网破损识别方法，以及一种基于深度学习的网箱水下成像鱼网破损识别系统。

为解决上述技术问题，本发明的技术方案如下：

一种基于深度学习的水下成像鱼网破损识别方法，包括以下步骤：

S1：采集水下网破图像组成图像数据库，将图像数据库中的水下网破图像划分为训练集和测试集；对水下网破图像分别进行标注其网破位置，将标注的网破位置数据生成表格文件进行存储；

S2：构建鱼网破损识别模型，选取鱼网破损识别模型训练需要的配置文件，并预设鱼网破损识别模型的分类标签目录；

S3：根据配置文件及分类标签目录调整鱼网破损识别模型的参数，然后将训练集输入鱼网破损识别模型中进行训练，得到完成训练的鱼网破损识别模型；

S4：将测试集输入完成训练的鱼网破损识别模型中，输出测试集对应的鱼网破损识别结果，将鱼网破损识别结果与表格文件中存储的网破位置数据进行对比验证模型的精准度：若精准度大于或等于预设的精准度阈值时，则执行S5步骤，否则跳转执行S1步骤；

S5：采用水下摄像头采集水下鱼网图像，将水下鱼网图像输入完成训练的鱼网破损识别模型中，输出得到鱼网破损识别结果。

优选地，鱼网破损识别模型采用SSD_MobileNet、YOLO、SSD_Inception、R-FCN_ResNet中的一种深度学习模型。

优选地，S1步骤中，对水下网破图像分别进行标注其网破位置的具体步骤包括：在水下网破图像中构建图像坐标系；在水下网破图像中网破位置标注外接矩形框作为真实框，记录真实框的中心坐标及框体尺寸、水下网破图像中破损类型作为真实网破信息，并将真实网破数据生成表格文件进行存储。

优选地，S3步骤中，其具体步骤包括：

S3.1：根据配置文件及分类标签目录调整鱼网破损识别模型的参数；

S3.2：将训练集中的水下网破图像依次输入鱼网破损识别模型中，鱼网破损识别模型识别水下网破图像中的网破位置并标注预测框，输出标注有预测框的水下网破图像，以及预测框的中心坐标及框体尺寸；

S3.3：鱼网破损识别模型对水下网破图像中的破损类型根据分类标签目录进行分类，输出水下网破图像中鱼网破损类型；

S3.4：将鱼网破损识别模型输出的预测框的中心坐标及框体尺寸、鱼网破损类型，与对应水下网破图像中的真实网破数据进行对比，计算鱼网破损识别模型的损失函数，并根据损失函数的结果对鱼网破损识别模型的参数进行优化，得到完成训练的鱼网破损识别模型。

优选地，S3步骤中，鱼网破损识别模型识别水下网破图像中的网破位置时，共生成N个默认框；鱼网破损识别模型对水下网破图像中的破损类型进行分类时，计算分类置信度的预测值c。

优选地，S3步骤中，损失函数L为鱼网网破定位损失函数L _loc和鱼网网破分类损失函数L _conf之和，其表达公式如下：

其中，l表示预测框值，g表示真实框值，x表示鱼网破损识别模型网络预测值；

表示鱼网破损识别模型预设值；鱼网网破分类损失函数L _conf的表达公式如下：

其中，

表示当鱼网网破预测框i与真实框j关于类别p匹配时的概率预测值；鱼网网破定位损失函数L _loc的表达公式如下：

其中，(cx,cy)表示预测框的中心坐标，w表示预测框的宽度，h表示预测框的高度；

表示预测框，

表示真实框；smooth _L1(·)表示平滑系数。

优选地，S4步骤中，预设的精准度阈值的取值范围为90％～95％。

本发明还提出了一种基于深度学习的水下成像鱼网破损识别系统，应用于上述任一技术方案提出的基于深度学习的水下成像鱼网破损识别方法，包括成像模块和微型电脑，其中：成像模块用于采集水下鱼网图像，成像模块的输出端与微型电脑的输入端连接；微型电脑嵌入设置有完成训练的鱼网破损识别模型，用于对采集的水下鱼网图像进行鱼网破损识别，输出得到鱼网破损识别结果；鱼网破损识别结果包括标注有鱼网破损识别预测框的图像，以及鱼网破损类别。

优选地，微型电脑采用树莓派微型电脑。

优选地，系统还包括通信模块，微型电脑的输出端与通信模块的输入端连接；通信模块用于将采集的水下鱼网图像以及微型电脑输出的鱼网破损识别结果发送至工作人员的通信终端。

与现有技术相比，本发明技术方案的有益效果是：本发明通过完成训练的鱼网破损识别模型对采集的水下鱼网图像进行鱼网破损识别，得到鱼网破损识别结果，从而避免出现养殖鱼从破损部位逃出养殖区域，减少渔民的经济损失；采用SSD_MobileNet轻量级深度学习模型构建鱼网破损识别模型，使其能够搭载在水下作业的工程载体上使用。

附图说明

图1为实施例1的基于深度学习的水下成像鱼网破损识别方法的流程图。

图2为实施例2的基于深度学习的水下成像鱼网破损识别系统的结构示意图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；

对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

本实施例提出一种基于深度学习的水下成像鱼网破损识别方法，如图1所示，为本实施例的基于深度学习的水下成像鱼网破损识别方法的流程图。

本实施例提出的基于深度学习的水下成像鱼网破损识别方法中，包括以下步骤：

S1：采集水下网破图像组成图像数据库，将图像数据库中的水下网破图像划分为训练集和测试集；对水下网破图像分别进行标注其网破位置，将标注的网破位置数据生成表格文件进行存储。

本步骤中，对水下网破图像分别进行标注其网破位置的具体步骤包括：在水下网破图像中构建图像坐标系；在水下网破图像中网破位置标注外接矩形框作为真实框，记录真实框的中心坐标及框体尺寸、水下网破图像中破损类型作为真实网破信息，并将真实网破数据生成表格文件进行存储。

S2：构建鱼网破损识别模型，选取鱼网破损识别模型训练需要的配置文件，并预设鱼网破损识别模型的分类标签目录。其中，鱼网破损识别模型采用SSD_MobileNet、YOLO、SSD_Inception、R-FCN_ResNet中的一种深度学习模型，本实施例中，采用SSD_MobileNet深度学习模型。

S3：根据配置文件及分类标签目录调整鱼网破损识别模型的参数，然后将训练集输入鱼网破损识别模型中进行训练，得到完成训练的鱼网破损识别模型。其具体步骤如下：

本步骤中，在鱼网破损识别模型识别水下网破图像中的网破位置时，共生成N个默认框；鱼网破损识别模型对水下网破图像中的破损类型进行分类时，计算分类置信度的预测值c。

本步骤中，损失函数L为鱼网网破定位损失函数L _loc和鱼网网破分类损失函数L _conf之和，其表达公式如下：

其中，l表示预测框值，g表示真实框值，x表示鱼网破损识别模型网络预测值；鱼网网破分类损失函数L _conf的表达公式如下：

其中，

表示当鱼网网破预测框i与真实框j关于类别p匹配时的概率预测值；

表示鱼网破损识别模型预设值；鱼网网破定位损失函数L _loc的表达公式如下：

表示预测框，

表示真实框；smooth _L1(·)表示平滑系数。

S4：将测试集输入完成训练的鱼网破损识别模型中，输出测试集对应的鱼网破损识别结果，将鱼网破损识别结果与表格文件中存储的网破位置数据进行对比验证模型的精准度：若精准度大于或等于预设的精准度阈值时，则执行S5步骤，否则跳转执行S1步骤。

其中，预设的精准度阈值的取值范围为90％～95％，在本实施例中，设置精准度阈值为95％。

本实施例中，为了适用于水下成像及鱼网破损识别，采用SSD_MobileNet轻量级深度学习模型构建鱼网破损识别模型，使其能够搭载在水下作业的工程载体上使用。在实际应用中，可针对网箱水下渔业养殖网破问题，及时识别出网箱水下养殖的网破部分，避免出现养殖鱼从破损部位逃出养殖区域，减少渔民的经济损失。

实施例2

本实施例提出一种基于深度学习的水下成像鱼网破损识别系统，应用于实施例1提出的基于深度学习的水下成像鱼网破损识别方法。如图2所示，为本实施例的基于深度学习的水下成像鱼网破损识别系统的结构示意图。

本实施例提出的基于深度学习的水下成像鱼网破损识别系统中，包括成像模块1和微型电脑2，其中：成像模块1用于采集水下鱼网图像，成像模块1的输出端与微型电脑2的输入端连接；微型电脑2嵌入设置有完成训练的鱼网破损识别模型，用于对采集的水下鱼网图像进行鱼网破损识别，输出得到鱼网破损识别结果；鱼网破损识别结果包括标注有鱼网破损识别预测框的图像，以及鱼网破损类别。

本实施例中，成像模块1采用水下摄像头，微型电脑2采用树莓派微型电脑2。

本实施例中，系统还包括通信模块3，微型电脑2的输出端与通信模块3的输入端连接；通信模块3用于将采集的水下鱼网图像以及微型电脑2输出的鱼网破损识别结果发送至工作人员的通信终端。本实施例中的通信模块3采用射频技术、水声通信、水下量子通信等水下无线通信技术进行该数据通信。

在具体实施过程中，成像模块1放置在水下进行水下鱼网图像的采集，成像模块1将其所采集的水下鱼网图像传输至微型电脑2中进行识别分析，其中，微型电脑2中搭载预设有完成训练的鱼网破损识别模型，将所采集的水下鱼网图像输入该完成训练的鱼网破损识别模型，模型输出得到鱼网破损识别结果，具体的，鱼网破损识别结果包括标注有鱼网破损识别预测框的图像，以及鱼网破损类别。微型电脑2将其输出得到的鱼网破损识别结果通过通信模块3发送至工作人员的通信终端，工作人员可以通过其通信终端查看鱼网破损识别结果，进一步判断网箱水下养殖的网破部分。

此外，本实施例提出的基于深度学习的水下成像鱼网破损识别系统可应用于水下遥控无人潜水器、无缆水下机器人、深海着陆器、海洋机器人等应用载体。

相同或相似的标号对应相同或相似的部件；

附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制；

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

一种基于深度学习的水下成像鱼网破损识别方法，其特征在于，包括以下步骤：

S1：采集水下网破图像组成图像数据库，将所述图像数据库中的水下网破图像划分为训练集和测试集；对所述水下网破图像分别进行标注其网破位置，将所述标注的网破位置数据生成表格文件进行存储；

S2：构建鱼网破损识别模型，选取所述鱼网破损识别模型训练需要的配置文件，并预设所述鱼网破损识别模型的分类标签目录；

S3：根据所述配置文件及分类标签目录调整所述鱼网破损识别模型的参数，然后将所述训练集输入所述鱼网破损识别模型中进行训练，得到完成训练的鱼网破损识别模型；

S4：将所述测试集输入所述完成训练的鱼网破损识别模型中，输出所述测试集对应的鱼网破损识别结果，将所述鱼网破损识别结果与所述表格文件中存储的网破位置数据进行对比验证模型的精准度：若精准度大于或等于预设的精准度阈值时，则执行S5步骤，否则跳转执行S1步骤；

S5：采用水下摄像头采集水下鱼网图像，将所述水下鱼网图像输入所述完成训练的鱼网破损识别模型中，输出得到鱼网破损识别结果。
根据权利要求1所述的水下成像鱼网破损识别方法，其特征在于：所述鱼网破损识别模型采用SSD_MobileNet、YOLO、SSD_Inception、R-FCN_ResNet中的一种深度学习模型。
根据权利要求1所述的水下成像鱼网破损识别方法，其特征在于：所述S1步骤中，对所述水下网破图像分别进行标注其网破位置的具体步骤包括：在所述水下网破图像中构建图像坐标系；在所述水下网破图像中网破位置标注外接矩形框作为真实框，记录所述真实框的中心坐标及框体尺寸、所述水下网破图像中破损类型作为真实网破信息，并将所述真实网破数据生成表格文件进行存储。
根据权利要求3所述的水下成像鱼网破损识别方法，其特征在于：所述S3步骤中，其具体步骤包括：

S3.1：根据所述配置文件及分类标签目录调整所述鱼网破损识别模型的参数；

S3.2：将所述训练集中的水下网破图像依次输入所述鱼网破损识别模型中，所述鱼网破损识别模型识别所述水下网破图像中的网破位置并标注预测框，输出标注有预测框的水下网破图像，以及所述预测框的中心坐标及框体尺寸；

S3.3：所述鱼网破损识别模型对所述水下网破图像中的破损类型根据所述分类标签目录进行分类，输出所述水下网破图像中鱼网破损类型；

S3.4：将所述鱼网破损识别模型输出的预测框的中心坐标及框体尺寸、鱼网破损类型，与对应水下网破图像中的真实网破数据进行对比，计算所述鱼网破损识别模型的损失函数，并根据所述损失函数的结果对所述鱼网破损识别模型的参数进行优化，得到完成训练的鱼网破损识别模型。
根据权利要求4所述的水下成像鱼网破损识别方法，其特征在于：所述S3步骤中，所述鱼网破损识别模型识别所述水下网破图像中的网破位置时，共生成N个默认框；所述鱼网破损识别模型对所述水下网破图像中的破损类型进行分类时，计算分类置信度的预测值c。
根据权利要求5所述的水下成像鱼网破损识别方法，其特征在于：所述S3步骤中，所述损失函数L为鱼网网破定位损失函数L _loc和鱼网网破分类损失函数L _conf之和，其表达公式如下：

其中，l表示预测框值，g表示真实框值，x表示鱼网破损识别模型网络预测值；鱼网网破分类损失函数L _conf的表达公式如下：

其中，
表示当鱼网网破预测框i与真实框j关于类别p匹配时的概率预测值；
为鱼网破损识别模型预设值；鱼网网破定位损失函数L _loc的表达公式如下：

其中，(cx,cy)表示预测框的中心坐标，w表示预测框的宽度，h表示预测框的高度；
表示预测框，
表示真实框；smooth _L1(·)表示平滑系数。
根据权利要求1所述的水下成像鱼网破损识别方法，其特征在于：所述S4步骤中，所述预设的精准度阈值的取值范围为90％～95％。
一种基于深度学习的水下成像鱼网破损识别系统，应用于权利要求1～7所述的基于深度学习的水下成像鱼网破损识别方法，其特征在于，包括成像模块和微型电脑，其中：

所述成像模块用于采集水下鱼网图像，所述成像模块的输出端与所述微型电脑的输入端连接；

所述微型电脑嵌入设置有完成训练的鱼网破损识别模型，用于对采集的水下鱼网图像进行鱼网破损识别，输出得到鱼网破损识别结果；所述鱼网破损识别结果包括标注有鱼网破损识别预测框的图像，以及鱼网破损类别。
根据权利要求8所述的水下成像鱼网破损识别系统，其特征在于：所述微型电脑采用树莓派微型电脑。
根据权利要求8所述的水下成像鱼网破损识别系统，其特征在于：所述系统还包括通信模块，所述微型电脑的输出端与所述通信模块的输入端连接；所述通信模块用于将采集的水下鱼网图像以及所述微型电脑输出的鱼网破损识别结果发送至工作人员的通信终端。