CN112465803A

CN112465803A - 一种结合图像增强的水下海参检测方法

Info

Publication number: CN112465803A
Application number: CN202011458021.XA
Authority: CN
Inventors: 李冀; 秦子钦; 王中帅; 罗笑南
Original assignee: Guilin Huigu Artificial Intelligence Industrial Technology Research Institute
Current assignee: Guilin Huigu Artificial Intelligence Industrial Technology Research Institute
Priority date: 2020-12-11
Filing date: 2020-12-11
Publication date: 2021-03-09

Abstract

本发明公开了一种结合图像增强的水下海参检测方法，步骤为：1）对获取的水下海参图像进行人工标注，得到标注后的图像；2）将标注后的海参图像转换成VOC2007格式数据，得到标注后的数据；3）获取海参图像并对图像进行预处理，得到增强的图像；4）使用k均值聚类算法将检测网络yolov4网络模型的先验框修改为对应的尺度，再将对应最大和最小的尺度取平均值替换中间值；5）对需要识别的图像进行预处理，得到增强的图像；6）将标注后的数据和预处理得到的图像作为训练数据，对网络模型训练，得到训练后的模型；7）将增强后的图像输入训练完成后的模型中对图像进行识别。该方法通过图像增强提高水下图像清晰度，减小对海参的识别难度。

Description

一种结合图像增强的水下海参检测方法

技术领域

本发明涉及水下海参识别技术领域，具体是一种结合图像增强的水下海参检测方法。

背景技术

水下海参识别在自动化捕捞海参中是非常重要的环节，只有正确识别了水下海参才能实现自动正确的捕捞，传统的方法主要是一下两种：第一种使用海底拖网捕捞，但是海底拖网会破坏海底生态环境。第二种是采用潜水员以下潜到海底的方式来收集海产品。常年下潜，即便是15米左右的海底，也会给潜水员带来不可恢复的身体伤害。水下自动化捕捞不仅可以保护潜水员的生命健康，还可以将海产品投放到不受潜水员最大下潜深度限制的深海区进行养殖，更有助于提高海产品质量。而在实现自动化捕捞的一个重要的环节就是水下海参识别。

目前深度学习识别技术已经逐渐成熟，通过网络对数据提取特征分析特征，在语音识别、文本识别、图像识别、医学及物体当中等取得了不错的进展。

虽然深度学习在识别领域取得了不错的进展，但是由于水对光的吸收作用，光在水中传播时往往会随指数衰减，这会导致水下得到的图像一般都具有较低的对比度。同时在水中存在浮游生物及悬浮颗粒杂质会扩大散散射影响，造成图像质量的退化，导致图像不清晰，图像饱和度降低。

发明内容

本发明的目的在于克服现有技术的不足，而提供一种结合图像增强的水下海参检测方法，该方法通过图像增强提高水下图像清晰度，减小对海参的识别难度。

实现本发明目的的技术方案是：

一种结合图像增强的水下海参检测方法，包括如下步骤：

1)将获取的水下海参图像通过labelme框出目标以及目标位置再用生成对应的JSON文件的方法对海参图像进行人工标注，得到标注后的图像；

2)将标注后的海参图像转换成VOC2007格式数据，得到标注后的数据；

3)获取海参图像并对图像进行预处理，得到增强的图像；

4)使用k均值聚类算法将检测网络yolov4网络模型的先验框修改为对应的尺度，再将对应最大和最小的尺度取平均值替换中间值；

5)对需要识别的图像进行预处理，得到增强的图像；

6)将步骤2)得到的标注后的数据和步骤3)预处理得到的图像作为训练数据，对步骤4)中的网络模型训练，得到训练后的模型；

7)将步骤5)增强后的图像输入训练完成后的模型中对图像进行识别。

步骤3)和步骤5)中，所述的预处理，是将图像拆分成R、G、B三个通道并进行改善的对比度拉伸；再将RGB色彩空间转换为HSV和HSI色彩空间，将这两个色彩空间增强图作为待融合分量，进行融合，具体步骤如下：

a)假设I(i,j)是一副大小为M×N的图像，其中，i＝1,2,...,Μ；j＝1,2,...,N；将图像拆分成R、G、B三个通道，三通道中的红、绿、蓝三种颜色的值分别用I_R(i,j)、I_G(i,j)、I_B(i,j)表示，则每个通道像素的平均值分别为R_avg、G_avg、B_avg：

在水下有R_avg＜＜G_avg且R_avg＜＜G_avg，将红通道设为通道3，蓝通道和绿通道设为通道1和通道2；

b)对三个通道进行拉伸：

对于通道1和通道2，其拉伸公式如下：

P_o＝(P_i-a)×(b-0)/(c-a)+0

其中P_o和P_i分别为输入和输出图像的像素，c分别表示输出图像中的像素最小值和最大值，a和b分别表示输入图像中像素最小值和最大值；

对于通道3，其拉伸公式如下：

c)再将RGB色彩空间转换为HSI和HSV色彩空间，在HSI色彩空间进行对比度拉伸，其拉升公式如下：

其中a是原图像素的最小值，b是原图像素的最大值，y是拉伸后的像素值，x是原图的像素值；

d)在HSV色彩空间进行伽马校正，其校正公式如下：

T(l)＝l_max(l/l_max)^γ

其中l_max是输入图像像素的最大强度，γ取值为0.5；

e)将HSI和HSV两个色彩空间的增强图作为待融合分量，进行融合，得到增强的图片。

步骤4)中，所述的yolov4网络模型，是运用k均值聚类算法计算出需要的先验框的尺寸，并将对应尺度的最大值与最小值求和取平均，设置学习率调整方式为adam优化梯度下降发，批处理32张图像，迭代400次，并使用Focal Loss作为分类损失函数，减少正负样本严重失调的问题，其公式如下：

本发明提供的一种结合图像增强的水下海参检测方法，应用了改善的对比度拉伸和图像融合，实现了提升图像清晰度，使得图像中特征更加明显。另外通过运用k均值聚类得到了更合适的先验框尺寸，使yolov4能更好的执行检测任务。通过使用Focal Loss作为分类损失函数减少了任务中正负样本严重失调的问题，最终达到水下海参的识别。

附图说明

图1为一种结合图像增强的水下海参检测方法流程图；

图2为本发明中图像增强方法流程图；

图3为原图与增强后图片对比图。

具体实施方式

下面结合附图和实施例对本发明内容做进一步阐述，但不是对本发明的限定。

实施例：

如图1所示，一种结合图像增强的水下海参检测方法，包括如下步骤：

3)获取海参图像并对图像进行预处理，得到增强的图像；

5)对需要识别的图像进行预处理，得到增强的图像；

步骤3)和步骤5)中，如图2所示，所述的预处理，是将图像拆分成R、G、B三个通道并进行改善的对比度拉伸；再将RGB色彩空间转换为HSV和HSI色彩空间，将这两个色彩空间增强图作为待融合分量，进行融合，具体步骤如下：

b)对三个通道进行拉伸：

对于通道1和通道2，其拉伸公式如下：

P_o＝(P_i-a)×(b-0)/(c-a)+0

对于通道3，其拉伸公式如下：

d)在HSV色彩空间进行伽马校正，其校正公式如下：

T(l)＝l_max(l/l_max)^γ

其中l_max是输入图像像素的最大强度，γ取值为0.5；

e)将HSI和HSV两个色彩空间的增强图作为待融合分量，进行融合，得到增强的图片，如图3所示。

Claims

1.一种结合图像增强的水下海参检测方法，其特征在于，包括如下步骤：

3)获取海参图像并对图像进行预处理，得到增强的图像；

5)对需要识别的图像进行预处理，得到增强的图像；

2.根据权利要求1所述的一种结合图像增强的水下海参检测方法，其特征在于，步骤3)和步骤5)中，所述的预处理，是将图像拆分成R、G、B三个通道并进行改善的对比度拉伸；再将RGB色彩空间转换为HSV和HSI色彩空间，将这两个色彩空间增强图作为待融合分量，进行融合，具体步骤如下：

b)对三个通道进行拉伸：

对于通道1和通道2，其拉伸公式如下：

P_o＝(P_i-a)×(b-0)/(c-a)+0

对于通道3，其拉伸公式如下：

d)在HSV色彩空间进行伽马校正，其校正公式如下：

T(l)＝l_max(l/l_max)^γ

其中l_max是输入图像像素的最大强度，γ取值为0.5；

3.根据权利要求1所述的一种结合图像增强的水下海参检测方法，其特征在于，步骤4)中，所述的yolov4网络模型，是运用k均值聚类算法计算出需要的先验框的尺寸，并将对应尺度的最大值与最小值求和取平均，设置学习率调整方式为adam优化梯度下降发，批处理32张图像，迭代400次，并使用Focal Loss作为分类损失函数，减少正负样本严重失调的问题，其公式如下：