CN115049918A

CN115049918A - 一种用于水下机器人的图像目标快速检测方法及装置

Info

Publication number: CN115049918A
Application number: CN202210668548.8A
Authority: CN
Inventors: 董旭洋; 田启岩; 王轶群; 孙宏林; 白金刚; 周雪山
Original assignee: Shenyang Institute of Automation of CAS
Current assignee: Shenyang Institute of Automation of CAS
Priority date: 2022-06-14
Filing date: 2022-06-14
Publication date: 2022-09-13

Abstract

本发明涉及水下机器人智能应用领域，提出一种用于水下机器人自主作业应用的目标快速检测技术，具体方法是采用基于多分辨率图像融合的图像增强处理算法快速处理水下图像，增强目标区域信息特征；接下来采用基于卷积神经网络的固定目标识别算法进行区域目标快速检测；同时构建一种快速图像处理的装置，集成到水下机器人，辅助水下机器人作业操作。相比传统声学目标识别具有距离近，识别分辨率高的特点。光学摄像机也具有应用范围广，识别目标多样性等优点。

Description

一种用于水下机器人的图像目标快速检测方法及装置

技术领域

本发明涉及水下机器人智能应用领域，尤其涉及一种针对水下智能机器人自主作业场景中，采用图像增强及识别技术快速检测目标的方法及装置。

背景技术

不同光波长在水中的衰减不同，使水下图像呈现颜色失真现象。随着水下深度增加，红光和黄光在水下衰减大于蓝光和绿光，导致水下图像普遍呈现一种以蓝绿为主的色调。水中存在微小杂质，使光在水中传输产生散射，导致图像模糊。光在水下随机的衰减是水下图像模糊的主要原因，散射的光降低了图像对比度。在一般的海水中，距离超过10米的物体几乎无法辨认，同时存在随着距离增加颜色衰退现象。水下图像模糊及颜色失真现象降低了水下图像的特征，使得水下目标检测十分困难。传统水下目标检测往往采用声学图像进行目标识别，声学信号在水下具有远距离探测的优势。尽管水下环境噪声干扰较多，目标识别有时候比较复杂，但目前有大量的方法对水下声学信号进行降噪处理和基于机器学习的分类训练，这些方法可有效处理水下声学信号。但是声学信号在水下具有局限性，随着水下机器人与目标距离接近，声学的物理特性导致近距离下无法得出准确的信号。水下机器人近距离作业经常依赖光学摄像头，因为光学摄像头可以在水下近距离捕获细节信息。水下光学图像识别存在水下图像颜色失真，一些浑浊水域拍摄的图像十分模糊，水下图像样本量少等特点。水下图像快速增强处理和水下固定目标物的识别技术是水下机器人自主作业的关键技术。

发明内容

本发明涉及水下机器人智能应用领域，尤其涉及一种针对水下智能机器人自主作业场景中，采用图像增强及识别技术快速检测目标的方法及装置。本发明包括：利用水下机器人光学摄像机采集水下视频图像，对水下图像进行快速增强处理，利用卷积神经网络训练水下固定目标物的识别网络模型，对增强处理后的水下图像进行特征提取。本发明具有如下优点：有效快速实现对水下图像的特征增强处理；采用特定网络模型及数据扩增方法降低对水下图像样本的需求；基于嵌入式处理器实时处理水下图像信息，满足水下机器人自主作业需求。

本发明为实现上述目的所采用的技术方案是：

一种用于水下机器人的图像目标快速检测方法，包括以下步骤：

通过水下摄像机获取水下图像；

对水下图像进行图像增强处理；

对增强后的图像进行目标识别，得到目标轮廓在图像中的位置；

水下机器人根据目标位置进行作业。

所述对水下图像进行图像增强处理，包括以下步骤：

采用白平衡算法对水下图像进行色彩恢复，得到多分辨率融合的图像I₁；

对图像I₁进行降噪处理，得到降噪后的图像I₂；

将图像I₁和图像I₂分别采用拉普拉斯金字塔分解，使图像I₁和图像I₂均分解成不同分辨率的多个图像；

分别提取图像I₁和图像I₂的亮度通道，并依次经过拉普拉斯滤波、局部对比度计算、显著性计算、归一化形成两个融合权重图像W₁与图像W₂；

将图像W₁与图像W₂分别经过高斯金字塔分解，得到不同分辨率的权重系数；

将不同分辨率的权重系数与该分辨率的图像相乘后，得到该分辨率下的加权图像，将相同分辨率下图像I₁₂和图像I₂的加权图像相加，得到该分辨率下单通道的融合图像；

采用金字塔重建，将多个分辨率的单通道重构成原始分辨率的图像。

所述白平衡算法为完美反射法。

使用双边滤波法对图像进行降噪处理。

使用卷积神经网络对增强后的图像进行目标识别，卷积神经网络的输入为待检测图像，输出为目标的轮廓，并使用带有轮廓标记的水下图像对卷积神经网络进行训练。

所述对增强后的图像进行目标识别，包括以下步骤：

1)对输入的图像依次经过两次卷积和两次激活函数处理；

2)将处理后的图像进行下采样，降低图像分辨率至长宽各二分之一尺度；

3)重复执行步骤1)～步骤2)，直至图像的分辨率达到设定的大小；

4)对图像进行上采样，提高图像分辨率至长宽各二倍尺度；

5)对输入的图像依次经过两次卷积和两次激活函数处理；

6)重复执行步骤4)～步骤5)，直至图像的分辨率达到原始大小。

一种用于水下机器人的图像目标快速检测装置，包括：

水下摄像机，用于获取水下图像；

图像增强程序，用于对水下图像进行图像增强处理；

图像识别程序，用于对增强后的图像进行目标识别，得到目标轮廓在图像中的位置；

嵌入式并行计算单元，用于部署图像增强程序和图像识别程序，并将识别后的目标位置发送给水下机器人。

所述嵌入式并行计算单元为移动设备的图像处理单元GPU。

所述图像增强程序，执行以下步骤：

对图像I₁进行降噪处理，得到降噪后的图像I₂；

将不同分辨率的权重系数与该分辨率的图像相乘后，得到该分辨率下的加权图像，将相同分辨率下图像I₁和图像I₂的加权图像相加，得到该分辨率下单通道的融合图像；

所述图像识别程序，执行以下步骤：

1)对输入的图像依次经过两次卷积和激活函数处理；

4)对图像进行上采样，提高图像分辨率至长宽各二倍尺度；

5)对输入的图像依次经过两次卷积和激活函数处理；

本发明具有以下有益效果及优点：

1.基于水下光学摄像机的水下目标识别系统，相比传统声学目标识别具有距离近，识别分辨率高的特点。光学摄像机也具有应用范围广，识别目标多样性等优点。

2.实时水下视频图像增强算法用于水下图像的增强，提升水下目标识别的精度。

3.嵌入式芯片与水下摄像头构成的水下光学目标识别系统，可搭载于水下机器人中，实现固定目标的自主探测与定位，用于辅助水下机器人实现自主作业功能。

附图说明

图1本发明方法流程图；

图2实时水下图像增强处理方法；

图3基于卷积神经网络水下目标识别模型结构；

图4水下目标检测装置。

具体实施方式

下面结合附图及实施例对本发明做进一步的详细说明。

本发明包括一种水下目标的快速识别方法及其装置。其中水下目标快速识别方法主要由实时水下视频图像增强算法及目标识别算法组成。具体地，实时水下视频图像增强算法指水下图像多分辨率融合增强算法，目标识别算法指利用卷积神经网络训练水下图像目标形成目标识别网络模型。水下目标快速识别装置指搭载上述方法的水下嵌入式设备，可结合在水下机器人中，特别是无人水下机器人中，实现目标自主探测作业功能。图1为本发明主要流程。主要步骤为首先对水下图像进行采集，水下机器人搭载摄像机实时拍摄水下图像，通过程序接口获得水下视频图像。接下来对水下图像进行实时增强处理，基于高性能嵌入式模块可以使分辨率为1920*1080的三通道图像在1秒内完成增强处理，这种算法有利于水下图像实时识别。实际应用中图像分辨率可以适当降低，增强处理时间将会显著缩短。接下来对增强处理完成的图像进行基于目标模型的卷积神经网络目标识别，得出目标轮廓在图像中的位置，再根据图像与实际的物理空间的尺寸关系与机器人搭载的高度计，获得目标与机器人的相对位置关系。最后根据目标位置进行系统作业。

水下图像实时增强处理，主要基于多分辨率的图像融合实现图像降噪，色彩复原与细节增强。图像增强主要分为白平衡处理、降噪滤波处理、直方图均衡化处理、图像细节复原、多分辨率图像融合等步骤。

水下图像颜色失真比较明显，在浑浊水域拍摄的水下图像颜色有显著的发绿现象。首先采用白平衡算法对水下图像进行色彩恢复。完美反射法是一种常见的图像白平衡自动算法。首先将红绿蓝三通道图像进行通道分离得到R、G、B三个通道图像，对分离的三通道图像进行求和，得到一张合并通道的单通道图像。计算合并通道图像的像素最大值，根据最大值的一定的比例，确定一个参考阈值T及大于该阈值的像素位置序列Index。三个通道的白平衡系数分别为KR、KG、KB。根据公式KR＝max(R)/mean(R(Index))获得三个通道白平衡系数，其中max()表示该通道的最大值，mean()表示像素序列集的均值。由以下公式获得白平衡处理后的三个通道，合并三个通道得到白平衡处理完的图像。

将白平衡处理后的图像作为多分辨率融合的一个图像I₁。接下来对白平衡处理后的图像进行降噪处理，作为多分辨率融合的另一个图像。双边滤波是一种常见的图像降噪方法，本发明以双边滤波为例进行图像的基本降噪操作。实际应用过程中可采用多种不同的图像降噪方法，将图像的噪点去除，尽可能保留图像的细节。

双边滤波在高斯滤波的基础上增加了边缘保护滤波的方法，改善高斯滤波带来的图像目标边缘模糊问题。双边滤波BF表示为：

其中q为滤波窗中心，p为滤波窗中的任意一个点，W_q为像素权重：

其中G_s为空间距离权重，G_r为像素值权重，σ_s与σ_r分别为两者的方差，由程序自行设置。将双边滤波后的图像I₂作为多分辨率融合的另一个图像。图像I₁与I₂需要根据特定权重比例进行多分辨率融合。提取两个图像的亮度通道，经过拉普拉斯滤波、局部对比度计算、显著性计算、归一化等方法形成两个融合权重图像W₁与W₂。W₁与W₂经过高斯金字塔分解，得到对应分辨率的权重系数。I₁与I₂的三个通道相应地采用拉普拉斯金字塔分解，得到多个分辨率的图像。将不同分辨率的权重与该分辨率的图像相乘，两个图像相加，得到该分辨率下单通道的融合图像。接下来采用金字塔重建，将多个分辨率的单通道重构成原始分辨率的图像。拉普拉斯金字塔与高斯金字塔实现过程相似。高斯金字塔是将原始图像依次降低分辨率，在不同分辨率上进行高斯滤波操作；而拉普拉斯金字塔在高斯滤波过程引入差分，实现增强多分辨率下图像细节的操作。三个通道合并，得到最终处理后的图像。多分辨率的高斯及拉普拉斯金字塔操作使图像在不同尺度下的细节得到保留，降低了降噪算法对图像清晰度的影响。实时图像增强处理过程参考图2所示。

图像增强处理后的图像以卷积神经网络模型的方式进行特定目标识别，图3是一种典型的用于目标识别的卷积神经网络模型。原始三通道彩色图像经过灰度转化形成单通道灰度图像，采用3*3的卷积核进行卷积操作。对于一个图像f与卷积核h，卷积操作

定义如下:

ReLU是图像卷积操作中一种常见的激活函数，表达如下：

f(x)＝max(0,x)

输入图像经过重复二次卷积和激活函数操作后，下采样降低图像分辨率至长宽各二分之一尺度，重复两次卷积和激活函数操作，再次下采样二分之一重复操作。最终在最小尺度比如32*32的分辨率上进行卷积和激活函数操作后，进行上采样及卷积操作恢复图像分辨率。下采样与上采样的添加可以在不同维度上对图像进行特征提取，而卷积操作的核函数则在训练过程中对目标进行规律的识别，激活函数抑制了无意义的信号特征，使训练过程收敛。采用标记的图像对卷积神经网络训练，可以得到最有的卷积核等权重参数，从而形成网络的模型。模型训练过程，将少量标记好目标位置的图像进行随机旋转、裁剪等方式进行数据扩增，增大训练样本数量，根据梯度下降算法进行权重参数的计算。

图4为本发明提及的水下目标检测装置。图像增强及卷积神经网络对计算机计算性能要求较高，传统水下计算机性能无法满足计算要求，台式图像处理工作站可以满足计算要求，但是功耗较高。为了实现水下图像高算力低功耗的计算，本发明采用嵌入式并行计算单元，作为图像计算核心处理器。嵌入式并行计算单元是一种用于移动设备的GPU(图像处理单元)，适应于图像处理这种多个计算任务并行的算法。在嵌入式并行计算单元部署图像增强程序及图像识别程序，并将预先在台式工作站上计算出的卷积神经网络模型保存至嵌入式并行计算单元，用于图像的识别。嵌入式并行计算单元读取水下摄像机的图像，提供给图像增强程序，在图像增强处理完成后由图像识别程序进行目标识别。根据目标图像的物理尺寸映射，得到目标的平面坐标位置，结合水下机器人的高度计等传感器信息，获得目标的深度信息。程序得出的计算结果传递给水下机器人作业系统，辅助完成作业操作。

Claims

1.一种用于水下机器人的图像目标快速检测方法，其特征在于，包括以下步骤：

通过水下摄像机获取水下图像；

对水下图像进行图像增强处理；

水下机器人根据目标位置进行作业。

2.根据权利要求1所述的一种用于水下机器人的图像目标快速检测方法，其特征在于，所述对水下图像进行图像增强处理，包括以下步骤：

对图像I₁进行降噪处理，得到降噪后的图像I₂；

3.根据权利要求2所述的一种用于水下机器人的图像目标快速检测方法，其特征在于，所述白平衡算法为完美反射法。

4.根据权利要求2所述的一种用于水下机器人的图像目标快速检测方法，其特征在于，使用双边滤波法对图像进行降噪处理。

5.根据权利要求1所述的一种用于水下机器人的图像目标快速检测方法，其特征在于，使用卷积神经网络对增强后的图像进行目标识别，卷积神经网络的输入为待检测图像，输出为目标的轮廓，并使用带有轮廓标记的水下图像对卷积神经网络进行训练。

6.根据权利要求1所述的一种用于水下机器人的图像目标快速检测方法，其特征在于，所述对增强后的图像进行目标识别，包括以下步骤：

1)对输入的图像依次经过两次卷积和两次激活函数处理；

4)对图像进行上采样，提高图像分辨率至长宽各二倍尺度；

5)对输入的图像依次经过两次卷积和两次激活函数处理；

7.一种用于水下机器人的图像目标快速检测装置，其特征在于，包括：

水下摄像机，用于获取水下图像；

图像增强程序，用于对水下图像进行图像增强处理；

8.根据权利要求7所述的一种用于水下机器人的图像目标快速检测装置，其特征在于，所述嵌入式并行计算单元为移动设备的图像处理单元GPU。

9.根据权利要求7所述的一种用于水下机器人的图像目标快速检测装置，其特征在于，所述图像增强程序，执行以下步骤：

对图像I₁进行降噪处理，得到降噪后的图像I₂；

10.根据权利要求7所述的一种用于水下机器人的图像目标快速检测装置，其特征在于，所述图像识别程序，执行以下步骤：

1)对输入的图像依次经过两次卷积和激活函数处理；

4)对图像进行上采样，提高图像分辨率至长宽各二倍尺度；

5)对输入的图像依次经过两次卷积和激活函数处理；