CN107808161B

CN107808161B - 一种基于光视觉的水下目标识别方法

Info

Publication number: CN107808161B
Application number: CN201711011197.9A
Authority: CN
Inventors: 王红茹; 朱振杰; 王佳
Original assignee: Jiangsu University of Science and Technology
Current assignee: Jiangsu University of Science and Technology
Priority date: 2017-10-26
Filing date: 2017-10-26
Publication date: 2020-11-24
Anticipated expiration: 2037-10-26
Also published as: CN107808161A

Abstract

本发明公开一种基于光视觉的水下目标识别方法，包括以下步骤：通过水下图像采集系统分别在自然光照和人工光源环境下采集水下目标物图像；采集到的水下图像依次进行图像增强、噪点定位、去噪以及色偏校正；依次提取目标的形状特征、颜色特征和纹理特征；获得的形状特征矩阵、颜色特征矩阵和纹理特征矩阵组成训练样本集，然后进行目标训练，对自然光照与人工光源下的测试样本进行分类，输出分类结果。本发明能够可靠地对水下目标进行识别。

Description

一种基于光视觉的水下目标识别方法

技术领域

本发明属于海洋工程领域，具体涉及一种基于光视觉的水下目标识别方法。

背景技术

水下目标识别技术是水下工程的重要组成部分，在军工发展和民用开发与利用水下资源的进程中，水下目标识别技术是不可或缺的组成部分。

在军事上，水下目标识别技术可用于侦察、布雷、灭雷和援潜救生等；在民用领域，可用于数据收集、海底头探测、海底考察、管道铺设、水下设备的维护与维修等。目前，水下视觉在诸多重要领域得到广泛应用，常用水下机器人来承担水下目标提取的载体，水下机器人的视觉工作能力是其执行各种任务、获取水下信息的重要途径，所以用水下机器人对水下目标图像进行采集、对水下目标图像处理与识别就显得至关重要。

目标识别技术是设备智能化的关键技术。要准确地对水下目标进行识别，需要对水下复杂的场景环境和硬件设备有充分的了解，为了保证图像包含足够多的目标与环境信息，要有稳定均匀的光源照射。由于水对光有很大的衰减特性，即使在不含任何杂质的纯水中，光的衰减现象也是很严重的。试验表明，光在水中的衰减是由吸收和散射这两个互不相关的过程引起的，因此，要提出有效且识别准确率较高的水下目标识别方法，需对水下成像特点，目标提取技术和特征提取技术要有充分的研究。在实际情况中，待识别的水下图像目标总是处在复杂的环境下，图像失真严重，并且水下成像受光照环境影响较大。

发明内容

发明目的：本发明的目的在于解决现有技术中存在的不足，提供一种基于光视觉的水下目标识别方法，能够可靠地对水下目标进行识别。

技术方案：本发明一种基于光视觉的水下目标识别方法，包括以下步骤：

(1)采集水下图像，通过水下图像采集系统分别在自然光照和人工光源环境下采集水下目标物图像；

(2)图像预处理，将采集到的不同环境下的水下图像编为两组，然后对两组水下图像分别依次进行图像增强、噪点定位、去噪以及色偏校正；

(3)目标特征提取：依次提取两组预处理后的图像的目标的形状特征、颜色特征和纹理特征；

(4)目标训练与识别，将步骤(3)获得的形状特征矩阵、颜色特征矩阵和纹理特征矩阵组成训练样本集，然后进行目标训练，对自然光照与人工光源下的两组测试样本进行分类，输出分类结果。

上述水下图像采集系统包括水下摄像头、水下照明设备(例如Draglight-60LED照明光源)、图像采集卡(例如OK_C30A-E图像采集卡)、台式计算机、独立12V直流电源和图像处理软件；水下摄像头和水下照明设备均放在水下，12V直流电压放置在岸上同时为水下摄像头和水下照明设备提供电源，图像采集卡安装在台式计算机的PCI-E插槽上，图像处理软件在Windows xp系统上进行仿真实验。

所述步骤(2)中图像预处理的具体方法为：对采集到的水下图像首先用基于暗原色先验算法进行增强处理，去除雾气，凸显纹理细节；其次，噪点定位方法对增强后的图像进行噪点定位，再用中值滤波算法滤去定位出的噪点；最后，由于水下图像存在色偏现象，图像偏蓝绿色，会对后续的目标特征提取与目标识别产生不良影响，用视网膜大脑皮层理论(Retinex)法对图像进行色偏校正，还原图像本色。

所述步骤(3)中目标特征提取的详细过程为：

(3.1)提取形状特征：对完成预处理后的水下图像利用canny算子提取目标轮廓；因canny算子提取目标轮廓边缘附近有许多孤立的点，因此再用数学形态学方法对目标轮廓进行处理，即用开运算去掉目标外的孤立，又因去掉孤立点后的目标轮廓存在细小的空洞，则再用闭运算填充轮廓内的细小空洞，连接邻近物体以及平滑边界，开运算则是先进行腐蚀再进行膨胀，闭运算是先进行膨胀再进行腐蚀，最后用7个Hu不变矩提取形状特征；

(3.2)提取颜色特征：将完成预处理后的水下RGB图像转到HSV空间，再提取图像的三阶颜色矩特征；

(3.3)提取纹理特征：对完成预处理后的水下图像，用灰度共生矩阵提取水下图像的纹理特征，用角二矩阵、对比度、熵和相关性4种特征作为灰度共生矩阵的主要参数提取图像的纹理特征。

在图像纹理特征提取方法的基础上，采用基于canny算子的图像窗口自适应的纹理特征向量提取方法，这样既能保证图像纹理特征的完整性，又能有效解决原有算法计算量大的弊端。

所述步骤(4)中目标识别的具体过程为：将提取的形状、颜色和纹理特征矩阵组成训练样本集，训练样本集X＝{φ_1z、φ_2z、...、φ_7z、μ_z、σ_z、s_z、w_1θz、w_2θz、w_3θz、w_4θz}，其中，z是指训练集样本数，z＝{1,2,3,...,100}，θ＝{0°、45°、135°、180°}；φ_1z、φ_2z、...、φ_7z表示7个Hu不变矩特征，μ_z、σ_z、s_z表示颜色矩特征，w_1θz、w_2θz、w_3θz、w_4θz表示灰度共生矩阵。然后，将训练样本集作为支持向量机SVM的输入，对SVM分类器进行目标训练，在SVM分类器中采用多项式核函数和径向基核函数的混合核函数作为核函数，使用训练过的SVM分类器对自然光照与人工光源下的测试样本进行分类，输出分类结果。

所述噪点定位的方法为：以增强后的水下图像中的一点(x,y)为中心点，I_xy为对应点的灰度值，为了提高算法效率以及3×3滑动窗口能满足非密噪点图像的滤波要求，先以3×3的窗口开始滑动，获取窗口内灰度中值Imed、最大值I_max和最小值I_min；当满足公式(1)中的两种情况就判定点(x,y)为噪声点，否则视为非噪声点；

该方法确保噪声分布不密集的噪点(x,y)被进行中值滤波处理，当对于高密度噪声图像时，采用扩大窗口的方式来相对地减少冲击噪声空间密度，即如果I_med-I_min＝0或I_med-I_max＝0，表明噪点比较密集，则增大滤波窗口的尺寸为5×5，再按照式(1)进行滤波处理；

再用中值滤波算法滤去定位出的噪点，中值滤波算法用式(2)表示为：

g(x,y)＝med{f(x,y)},(x,y)∈N(x,y) 公式(2)

其中，f(x,y)是原图，g(x,y)是处理后图像，N(x,y)是以点(x,y)为中心的n×n矩形邻域，n是奇数，中心点(x，y)即为上述提出的水下图像中的任意一点I_ij；med{}是图像矩形邻域中灰度值按照大小排列后的中间值。

所述步骤(3.1)中提取形状特征的过程是：对预处理后的水下图像利用canny算子提取目标轮廓，再用数学形态学方法对目标轮廓进行处理，即用开运算去掉目标外的孤立，再用闭运算填充轮廓内的细小空洞，连接邻近物体以及平滑边界；

其中，开运算的公式为：

AΘS表示腐蚀运算，即原始图像A被结构元素S腐蚀，

表示原始图像A被结构元素S腐蚀后再被结构元素S膨胀；

闭运算的公式为：

表示膨胀运算，即原始图像A被结构元素S膨胀，

表示原始图像A被结构元素S膨胀后再被结构元素S腐蚀。

有益效果：与现有技术相比，本发明具有以下优点：

(1)采用本发明提出的噪点定位方法能准确可靠地定位出水下图像中的加性噪声，图像整体质量得到保障，并且不会对图像的形状特征提取产生影响；普通的中值滤波算法直接对图像中的每个像素点进行中值滤波，很可能会滤去图像中本有的高频信息。

(2)本发明利用canny算子提取出目标轮廓，用数学形态学方法对目标轮廓进行处理，即用开运算去掉目标外的孤立点，再用闭运算填充轮廓内的细小空洞，连接邻近物体以及平滑边界，该方法不仅使canny算子提取出的目标轮廓中的孤立点得到有效去除，轮廓空洞得到填补，而且图像边缘轮廓完整性得到进一步提升。

(3)在纹理特征提取中，本发明提出首先用canny算子对目标边缘进行检测，在目标边缘处选择3×3的滑动窗口，其他区域选择9×9的滑动窗口，选取步距d＝1，移动滑动窗口，依次计算窗口子图的纹理特征值，直到整幅图像形成了一个由纹理特征值组成的特征矩阵，相比用灰度共生矩阵对整幅图像进行纹理特征提取，本发明算法时间成本大大降低，纹理信息提取也合理。

(4)在本发明图像预处理中，用基于暗原色先验原理进行水下图像去雾时，在水下图像无穷远处背景光的估计中先提取图像最亮的前若干个像素点，再将图像分成4块，分别计算4块区域颜色饱和度方差，若最亮的点落在颜色饱和度方差最小的区域中，则该点被认为是无穷远处的背景光，否则选取次亮的像素点进行判断，直到该点落在颜色饱和度方差最小的区域中，则该像素点被认为是无穷远处的背景光。

(5)在本发明图像预处理中，用网膜大脑皮层理论(Retinex)法对图像进行色偏校正时，将图像I(x,y)转换到对数域，然后估计亮度分量图L(x,y)，由I(x,y)和L(x,y)求解得到反射分量r(x,y)，本发明对反射分量r(x,y)进行颜色提升处理，然后再转换到实数域求出R(x,y)，R(x,y)即为颜色校正后的图像。

附图说明

图1为本发明实施例的水下图像采集与处理平台示意图；

图2为本发明实施的流程过程图；

图3为实施例中canny算子提取的目标轮廓；

图4为实施例中开运算后的目标图像示意图；

图5为实施例中闭运算后的目标图像示意图。

具体实施方式

下面对本发明技术方案进行详细说明，但是本发明的保护范围不局限于所述实施例。

如图1和图2所示，本发明的一种基于光视觉的水下目标识别方法，包括以下步骤：

(2)图像预处理，即对采集到的水下图像依次进行图像增强、噪点定位、去噪以及色偏校正；

(3)目标特征提取：依次提取目标的形状特征、颜色特征和纹理特征；

(4)目标训练与识别，将步骤(3)获得的形状特征矩阵、颜色特征矩阵和纹理特征矩阵组成训练样本集，然后进行目标训练，对自然光照与人工光源下的测试样本进行分类，输出分类结果。

水下图像采集系统有水下摄像头、水下照明设备Draglight-60LED照明光源、OK_C30A-E图像采集卡、台式计算机windows xp系统、独立12V直流电源以及选用一种常用的视觉库，如MATLAB、opencv或Halcon等中一种来搭建图像采集系统，本发明选用MATLAB软件分别在自然光照和人工光源环境下采集水下目标物图像。

水下图像预处理为：

首先，用基于暗原色先验算法对采集到的水下图像进行增强处理，去除雾气，凸显纹理细节。

其次，对增强后的水下图像进行噪点定位，噪点定位方法是以图像上的一点(x,y)为中心点，I_xy为对应点的灰度值，先以3×3的窗口开始滑动，获取窗口内灰度中值Imed、最大值I_max和最小值I_min，经过实验得出式(1)结论，即当满足式(1)中的两种情况就判定(x,y)为噪声点，否则视为非噪声点。

该方法确保噪声分布不密集的噪点(x,y)被进行中值滤波处理，当对于高密度噪声图像时，采用扩大窗口的方式来相对地减少冲击噪声空间密度，即如果I_med-I_min＝0或I_med-I_max＝0，表明噪点比较密集，则增大滤波窗口的尺寸为5×5，再按照式(1)进行滤波处理；再用中值滤波算法滤去定位出的噪点，中值滤波算法用式(2)表示为：

g(x,y)＝med{f(x,y)},(x,y)∈N(x,y) (2)

其中，f(x,y)是原图，g(x,y)是处理后图像，N(x,y)是以点(x,y)为中心的n×n矩形邻域，n是奇数；中心点(x，y)即为上述提出的水下图像中的任意一点(x,y)；med{}是图像矩形邻域中灰度值按照大小排列后的中间值。增强与去噪后的水下图像质量得到显著提升。

最后，由于光在水下发生衰减，水下图像存在色偏现象，图像呈现蓝绿色，该现象会对后续的目标特征提取与目标识别产生不良影响，因此，用视网膜大脑皮层理论(Retinex)算法对图像进行色偏校正，减轻蓝绿色对图像的影响。

目标特征提取

目标形状特征提取：对完成预处理后的水下图像利用canny算子提取目标轮廓，再用数学形态学方法对目标轮廓进行处理，如图3所示，因canny算子提取目标轮廓边缘附近有许多孤立的点，如图4所示，用开运算去掉目标外的孤立，又因去掉孤立点后的目标轮廓存在细小的空洞，如图5所示，再用闭运算填充轮廓内的细小空洞，连接邻近物体以及平滑边界，开运算则是先进行腐蚀再进行膨胀，闭运算是先进行膨胀再进行腐蚀，最后用7个Hu不变矩提取形状特征，开运算的公式如式(3)所示：

其中，AΘS表示腐蚀运算，即原始图像A被结构元素S腐蚀，

表示原始图像A被结构元素S腐蚀后再被结构元素S膨胀。闭运算如式(4)所示：

其中，

表示膨胀运算，即原始图像A被结构元素S膨胀，

表示原始图像A被结构元素S膨胀后再被结构元素S腐蚀。

上述对水下图像进行轮廓提取与开闭运算之后就开始用7个Hu不变矩提取形状特征，Hu提出的不变矩是一种被广泛应用于基于图像形状特征的描述子、图像识别和模式分析等领域。它对图像的旋转、缩放、平移均不敏感。

假设一幅图像大小为M×N，g(x,y)是预处理后图像中(x,y)点处的灰度值，则图像的(p+q)阶原点矩为：

为保证图像在平移、旋转和缩放时的不变性，其中心距为：

式(6)中：x₀，y₀为整幅图像的中心坐标，x₀＝m₁₀/m₀₀，y₀＝m₀₁/m₀₀；(x₀,y₀)为图像的灰度质心。中心距u_pq是图像平移的不变量，对其规范化可得到平移和缩放不变矩：

对g(x,y)的(p+q)阶中心距归一化后得到7个Hu不变矩的公式如式(8)所示：

上述7个不变距具有平移、缩放和旋转不变性，但由于这7个不变矩变化范围较大，可能出现负值，通常用式(9)进行替换计算。

φ_k＝log₁₀|φ_k| k＝1,2,3,...,7 (9)

目标颜色特征提取，将完成预处理后的水下rgb图像转到HSV空间，再提取图像的三阶颜色矩特征，rgb空间转到HSV空间的计算公式如式(10)～(12)所述：

v＝max(r,g,b) (10)

其中，

在HSV颜色空间提取图像的三阶颜色矩特征。

一阶颜色矩(均值,mean)用μ_i表示、二阶颜色矩(方差,viarance)用σ_i，三阶颜色矩(斜度,skewness)用s_i表示，具体公式如式(13)～(15)所述：

在目标纹理特征提取时，将完成预处理后的水下图像用灰度共生矩阵(GLCM)提取纹理特征，灰度共生矩阵是像素距离和角度的矩阵函数，是从灰度级i的点离开某个固定位置d＝(dx,dy)达到灰度为j的概率，通过计算图像中一定距离和一定方向的两点灰度之间的相关性来反映图像在方向、间隔、变化幅度以及快慢上的综合信息，灰度共生矩阵可表示为g(i,j,d,θ)。通常用角二矩阵、对比度、熵和相关性这4种特征作为灰度共生矩阵的主要参数来提取图像的纹理特征，公式如式(16)～(19)所示：

角二矩阵：

对比度：

熵：

Claims

1.一种基于光视觉的水下目标识别方法，其特征在于：包括以下步骤：

(1)采集水下图像，通过水下图像采集系统分别在自然光照和人工光源环境下采集水下目标物图像；所述水下图像采集系统包括水下摄像头、水下照明设备、图像采集卡、工控计算机、独立12V直流电源和图像处理软件；水下摄像头和水下照明设备均放在水下，12V直流电压放置在岸上同时为水下摄像头和水下照明设备提供电源，图像采集卡安装在工控计算机的PCI-E插槽上，用MATLAB软件在Windows xp系统上进行仿真实验；

(2)图像预处理，将采集到的不同环境下的水下图像编为两组，分别依次进行图像增强、噪点定位、去噪以及色偏校正；

目标特征提取的详细过程为：

(3.1)提取形状特征：对完成预处理后的水下图像利用canny算子提取目标轮廓；再用数学形态学方法对目标轮廓进行处理，即用开运算去掉目标外的孤立，再用闭运算填充轮廓内的细小空洞，连接邻近物体以及平滑边界，开运算则是先进行腐蚀再进行膨胀，闭运算是先进行膨胀再进行腐蚀，最后用7个Hu不变矩提取形状特征；

(3.3)提取纹理特征：对完成预处理后的水下图像，用灰度共生矩阵提取水下图像的纹理特征，用角二矩阵、对比度、熵和相关性4种特征作为灰度共生矩阵的主要参数提取图像的纹理特征；

(4)目标训练与识别，将步骤(3)获得的形状特征矩阵、颜色特征矩阵和纹理特征矩阵组成训练样本集，然后进行目标训练，对自然光照与人工光源下的两组测试样本进行分类，输出分类结果；

其中，所述噪点定位方法为：I_xy为对应点的灰度值，为了提高算法效率，以3×3滑动窗口，以满足非密噪点图像的滤波原则，获取窗口内灰度中值Imed、最大值I_max和最小值I_min；当满足公式(1)中的两种情况就判定点(x,y)为噪声点，否则视为非噪声点；

该方法确保噪声分布不密集的噪点(x,y)被进行中值滤波处理，采用扩大窗口的方式来减少冲击噪声空间密度，即如果I_med-I_min＝0或I_med-I_max＝0，表明噪点比较密集，则增大滤波窗口的尺寸为5×5，再重新按照式(1)进行处理；

再用中值滤波算法滤去定位出的噪点，中值滤波算法用公式(2)表示为：

g(x,y)＝med{f(x,y)},(x,y)∈N(x,y) 公式(2)

其中，f(x,y)是原图，g(x,y)是处理后图像，N(x,y)是以点(x,y)为中心的n×n矩形邻域，n是奇数，中心点(x，y)即为水下图像中的任意一点；med{}是图像矩形邻域中灰度值按照大小排列后的中间值。

2.根据权利要求1所述的基于光视觉的水下目标识别方法，其特征在于：所述步骤(2)中图像预处理的具体方法为：

首先，对采集到的水下图像基于暗原色先验算法进行增强处理，去除雾气，凸显纹理细节；其次，用噪点定位方法对增强后的图像进行噪点定位，再用中值滤波算法滤去定位出的噪点；最后用视网膜大脑皮层理论法对图像进行色偏校正，还原图像本色。

3.根据权利要求1所述的基于光视觉的水下目标识别方法，其特征在于：所述步骤(4)中目标识别的具体过程为：将提取的形状、颜色和纹理特征矩阵组成训练样本集，训练样本集X＝{φ_1z、φ_2z、...、φ_7z、μ_z、σ_z、s_z、w_1θz、w_2θz、w_3θz、w_4θz}，其中，z是指训练集样本数，z＝{1,2,3,...,100}，θ＝{0°、45°、135°、180°}，φ_1z、φ_2z、...、φ_7z表示7个Hu不变矩特征，μ_z、σ_z、s_z表示颜色矩特征，w_1θz、w_2θz、w_3θz、w_4θz表示灰度共生矩阵；

将训练样本集作为支持向量机SVM的输入，对SVM分类器进行目标训练，在SVM分类器中采用多项式核函数和径向基核函数的混合核函数作为核函数，使用训练过的SVM分类器对自然光照与人工光源下的测试样本进行分类，输出分类结果。

4.根据权利要求1所述的基于光视觉的水下目标识别方法，其特征在于：所述步骤(3.1)中提取形状特征的过程是：对预处理后的水下图像利用canny算子提取目标轮廓，再用数学形态学方法对目标轮廓进行处理，即用开运算去掉目标外的孤立，再用闭运算填充轮廓内的细小空洞，连接邻近物体以及平滑边界；

其中，开运算的公式为：

AΘS表示腐蚀运算，即原始图像A被结构元素S腐蚀，

表示原始图像A被结构元素S腐蚀后再被结构元素S膨胀；

闭运算的公式为：

表示膨胀运算，即原始图像A被结构元素S膨胀，

表示原始图像A被结构元素S膨胀后再被结构元素S腐蚀。