CN107808161B - 一种基于光视觉的水下目标识别方法 - Google Patents
一种基于光视觉的水下目标识别方法 Download PDFInfo
- Publication number
- CN107808161B CN107808161B CN201711011197.9A CN201711011197A CN107808161B CN 107808161 B CN107808161 B CN 107808161B CN 201711011197 A CN201711011197 A CN 201711011197A CN 107808161 B CN107808161 B CN 107808161B
- Authority
- CN
- China
- Prior art keywords
- image
- underwater
- target
- features
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000003287 optical effect Effects 0.000 title claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000005286 illumination Methods 0.000 claims abstract description 14
- 238000012937 correction Methods 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims abstract description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 24
- 238000001914 filtration Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 18
- 238000012706 support-vector machine Methods 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 230000007797 corrosion Effects 0.000 claims description 5
- 238000005260 corrosion Methods 0.000 claims description 5
- 210000003710 cerebral cortex Anatomy 0.000 claims description 4
- 238000002955 isolation Methods 0.000 claims description 4
- 230000010339 dilation Effects 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 230000003628 erosive effect Effects 0.000 claims description 2
- 238000004088 simulation Methods 0.000 claims description 2
- 230000002207 retinal effect Effects 0.000 claims 1
- 238000013519 translation Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 210000001525 retina Anatomy 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000002411 adverse Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241001292396 Cirrhitidae Species 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration by the use of local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G06T5/70—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/155—Segmentation; Edge detection involving morphological operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
- G06T2207/20032—Median filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Abstract
本发明公开一种基于光视觉的水下目标识别方法,包括以下步骤:通过水下图像采集系统分别在自然光照和人工光源环境下采集水下目标物图像;采集到的水下图像依次进行图像增强、噪点定位、去噪以及色偏校正;依次提取目标的形状特征、颜色特征和纹理特征;获得的形状特征矩阵、颜色特征矩阵和纹理特征矩阵组成训练样本集,然后进行目标训练,对自然光照与人工光源下的测试样本进行分类,输出分类结果。本发明能够可靠地对水下目标进行识别。
Description
技术领域
本发明属于海洋工程领域,具体涉及一种基于光视觉的水下目标识别方法。
背景技术
水下目标识别技术是水下工程的重要组成部分,在军工发展和民用开发与利用水下资源的进程中,水下目标识别技术是不可或缺的组成部分。
在军事上,水下目标识别技术可用于侦察、布雷、灭雷和援潜救生等;在民用领域,可用于数据收集、海底头探测、海底考察、管道铺设、水下设备的维护与维修等。目前,水下视觉在诸多重要领域得到广泛应用,常用水下机器人来承担水下目标提取的载体,水下机器人的视觉工作能力是其执行各种任务、获取水下信息的重要途径,所以用水下机器人对水下目标图像进行采集、对水下目标图像处理与识别就显得至关重要。
目标识别技术是设备智能化的关键技术。要准确地对水下目标进行识别,需要对水下复杂的场景环境和硬件设备有充分的了解,为了保证图像包含足够多的目标与环境信息,要有稳定均匀的光源照射。由于水对光有很大的衰减特性,即使在不含任何杂质的纯水中,光的衰减现象也是很严重的。试验表明,光在水中的衰减是由吸收和散射这两个互不相关的过程引起的,因此,要提出有效且识别准确率较高的水下目标识别方法,需对水下成像特点,目标提取技术和特征提取技术要有充分的研究。在实际情况中,待识别的水下图像目标总是处在复杂的环境下,图像失真严重,并且水下成像受光照环境影响较大。
发明内容
发明目的:本发明的目的在于解决现有技术中存在的不足,提供一种基于光视觉的水下目标识别方法,能够可靠地对水下目标进行识别。
技术方案:本发明一种基于光视觉的水下目标识别方法,包括以下步骤:
(1)采集水下图像,通过水下图像采集系统分别在自然光照和人工光源环境下采集水下目标物图像;
(2)图像预处理,将采集到的不同环境下的水下图像编为两组,然后对两组水下图像分别依次进行图像增强、噪点定位、去噪以及色偏校正;
(3)目标特征提取:依次提取两组预处理后的图像的目标的形状特征、颜色特征和纹理特征;
(4)目标训练与识别,将步骤(3)获得的形状特征矩阵、颜色特征矩阵和纹理特征矩阵组成训练样本集,然后进行目标训练,对自然光照与人工光源下的两组测试样本进行分类,输出分类结果。
上述水下图像采集系统包括水下摄像头、水下照明设备(例如Draglight-60LED照明光源)、图像采集卡(例如OK_C30A-E图像采集卡)、台式计算机、独立12V直流电源和图像处理软件;水下摄像头和水下照明设备均放在水下,12V直流电压放置在岸上同时为水下摄像头和水下照明设备提供电源,图像采集卡安装在台式计算机的PCI-E插槽上,图像处理软件在Windows xp系统上进行仿真实验。
所述步骤(2)中图像预处理的具体方法为:对采集到的水下图像首先用基于暗原色先验算法进行增强处理,去除雾气,凸显纹理细节;其次,噪点定位方法对增强后的图像进行噪点定位,再用中值滤波算法滤去定位出的噪点;最后,由于水下图像存在色偏现象,图像偏蓝绿色,会对后续的目标特征提取与目标识别产生不良影响,用视网膜大脑皮层理论(Retinex)法对图像进行色偏校正,还原图像本色。
所述步骤(3)中目标特征提取的详细过程为:
(3.1)提取形状特征:对完成预处理后的水下图像利用canny算子提取目标轮廓;因canny算子提取目标轮廓边缘附近有许多孤立的点,因此再用数学形态学方法对目标轮廓进行处理,即用开运算去掉目标外的孤立,又因去掉孤立点后的目标轮廓存在细小的空洞,则再用闭运算填充轮廓内的细小空洞,连接邻近物体以及平滑边界,开运算则是先进行腐蚀再进行膨胀,闭运算是先进行膨胀再进行腐蚀,最后用7个Hu不变矩提取形状特征;
(3.2)提取颜色特征:将完成预处理后的水下RGB图像转到HSV空间,再提取图像的三阶颜色矩特征;
(3.3)提取纹理特征:对完成预处理后的水下图像,用灰度共生矩阵提取水下图像的纹理特征,用角二矩阵、对比度、熵和相关性4种特征作为灰度共生矩阵的主要参数提取图像的纹理特征。
在图像纹理特征提取方法的基础上,采用基于canny算子的图像窗口自适应的纹理特征向量提取方法,这样既能保证图像纹理特征的完整性,又能有效解决原有算法计算量大的弊端。
所述步骤(4)中目标识别的具体过程为:将提取的形状、颜色和纹理特征矩阵组成训练样本集,训练样本集X={φ1z、φ2z、...、φ7z、μz、σz、sz、w1θz、w2θz、w3θz、w4θz},其中,z是指训练集样本数,z={1,2,3,...,100},θ={0°、45°、135°、180°};φ1z、φ2z、...、φ7z表示7个Hu不变矩特征,μz、σz、sz表示颜色矩特征,w1θz、w2θz、w3θz、w4θz表示灰度共生矩阵。然后,将训练样本集作为支持向量机SVM的输入,对SVM分类器进行目标训练,在SVM分类器中采用多项式核函数和径向基核函数的混合核函数作为核函数,使用训练过的SVM分类器对自然光照与人工光源下的测试样本进行分类,输出分类结果。
所述噪点定位的方法为:以增强后的水下图像中的一点(x,y)为中心点,Ixy为对应点的灰度值,为了提高算法效率以及3×3滑动窗口能满足非密噪点图像的滤波要求,先以3×3的窗口开始滑动,获取窗口内灰度中值Imed、最大值Imax和最小值Imin;当满足公式(1)中的两种情况就判定点(x,y)为噪声点,否则视为非噪声点;
该方法确保噪声分布不密集的噪点(x,y)被进行中值滤波处理,当对于高密度噪声图像时,采用扩大窗口的方式来相对地减少冲击噪声空间密度,即如果Imed-Imin=0或Imed-Imax=0,表明噪点比较密集,则增大滤波窗口的尺寸为5×5,再按照式(1)进行滤波处理;
再用中值滤波算法滤去定位出的噪点,中值滤波算法用式(2)表示为:
g(x,y)=med{f(x,y)},(x,y)∈N(x,y) 公式(2)
其中,f(x,y)是原图,g(x,y)是处理后图像,N(x,y)是以点(x,y)为中心的n×n矩形邻域,n是奇数,中心点(x,y)即为上述提出的水下图像中的任意一点Iij;med{}是图像矩形邻域中灰度值按照大小排列后的中间值。
所述步骤(3.1)中提取形状特征的过程是:对预处理后的水下图像利用canny算子提取目标轮廓,再用数学形态学方法对目标轮廓进行处理,即用开运算去掉目标外的孤立,再用闭运算填充轮廓内的细小空洞,连接邻近物体以及平滑边界;
有益效果:与现有技术相比,本发明具有以下优点:
(1)采用本发明提出的噪点定位方法能准确可靠地定位出水下图像中的加性噪声,图像整体质量得到保障,并且不会对图像的形状特征提取产生影响;普通的中值滤波算法直接对图像中的每个像素点进行中值滤波,很可能会滤去图像中本有的高频信息。
(2)本发明利用canny算子提取出目标轮廓,用数学形态学方法对目标轮廓进行处理,即用开运算去掉目标外的孤立点,再用闭运算填充轮廓内的细小空洞,连接邻近物体以及平滑边界,该方法不仅使canny算子提取出的目标轮廓中的孤立点得到有效去除,轮廓空洞得到填补,而且图像边缘轮廓完整性得到进一步提升。
(3)在纹理特征提取中,本发明提出首先用canny算子对目标边缘进行检测,在目标边缘处选择3×3的滑动窗口,其他区域选择9×9的滑动窗口,选取步距d=1,移动滑动窗口,依次计算窗口子图的纹理特征值,直到整幅图像形成了一个由纹理特征值组成的特征矩阵,相比用灰度共生矩阵对整幅图像进行纹理特征提取,本发明算法时间成本大大降低,纹理信息提取也合理。
(4)在本发明图像预处理中,用基于暗原色先验原理进行水下图像去雾时,在水下图像无穷远处背景光的估计中先提取图像最亮的前若干个像素点,再将图像分成4块,分别计算4块区域颜色饱和度方差,若最亮的点落在颜色饱和度方差最小的区域中,则该点被认为是无穷远处的背景光,否则选取次亮的像素点进行判断,直到该点落在颜色饱和度方差最小的区域中,则该像素点被认为是无穷远处的背景光。
(5)在本发明图像预处理中,用网膜大脑皮层理论(Retinex)法对图像进行色偏校正时,将图像I(x,y)转换到对数域,然后估计亮度分量图L(x,y),由I(x,y)和L(x,y)求解得到反射分量r(x,y),本发明对反射分量r(x,y)进行颜色提升处理,然后再转换到实数域求出R(x,y),R(x,y)即为颜色校正后的图像。
附图说明
图1为本发明实施例的水下图像采集与处理平台示意图;
图2为本发明实施的流程过程图;
图3为实施例中canny算子提取的目标轮廓;
图4为实施例中开运算后的目标图像示意图;
图5为实施例中闭运算后的目标图像示意图。
具体实施方式
下面对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
如图1和图2所示,本发明的一种基于光视觉的水下目标识别方法,包括以下步骤:
(1)采集水下图像,通过水下图像采集系统分别在自然光照和人工光源环境下采集水下目标物图像;
(2)图像预处理,即对采集到的水下图像依次进行图像增强、噪点定位、去噪以及色偏校正;
(3)目标特征提取:依次提取目标的形状特征、颜色特征和纹理特征;
(4)目标训练与识别,将步骤(3)获得的形状特征矩阵、颜色特征矩阵和纹理特征矩阵组成训练样本集,然后进行目标训练,对自然光照与人工光源下的测试样本进行分类,输出分类结果。
水下图像采集系统有水下摄像头、水下照明设备Draglight-60LED照明光源、OK_C30A-E图像采集卡、台式计算机windows xp系统、独立12V直流电源以及选用一种常用的视觉库,如MATLAB、opencv或Halcon等中一种来搭建图像采集系统,本发明选用MATLAB软件分别在自然光照和人工光源环境下采集水下目标物图像。
水下图像预处理为:
首先,用基于暗原色先验算法对采集到的水下图像进行增强处理,去除雾气,凸显纹理细节。
其次,对增强后的水下图像进行噪点定位,噪点定位方法是以图像上的一点(x,y)为中心点,Ixy为对应点的灰度值,先以3×3的窗口开始滑动,获取窗口内灰度中值Imed、最大值Imax和最小值Imin,经过实验得出式(1)结论,即当满足式(1)中的两种情况就判定(x,y)为噪声点,否则视为非噪声点。
该方法确保噪声分布不密集的噪点(x,y)被进行中值滤波处理,当对于高密度噪声图像时,采用扩大窗口的方式来相对地减少冲击噪声空间密度,即如果Imed-Imin=0或Imed-Imax=0,表明噪点比较密集,则增大滤波窗口的尺寸为5×5,再按照式(1)进行滤波处理;再用中值滤波算法滤去定位出的噪点,中值滤波算法用式(2)表示为:
g(x,y)=med{f(x,y)},(x,y)∈N(x,y) (2)
其中,f(x,y)是原图,g(x,y)是处理后图像,N(x,y)是以点(x,y)为中心的n×n矩形邻域,n是奇数;中心点(x,y)即为上述提出的水下图像中的任意一点(x,y);med{}是图像矩形邻域中灰度值按照大小排列后的中间值。增强与去噪后的水下图像质量得到显著提升。
最后,由于光在水下发生衰减,水下图像存在色偏现象,图像呈现蓝绿色,该现象会对后续的目标特征提取与目标识别产生不良影响,因此,用视网膜大脑皮层理论(Retinex)算法对图像进行色偏校正,减轻蓝绿色对图像的影响。
目标特征提取
目标形状特征提取:对完成预处理后的水下图像利用canny算子提取目标轮廓,再用数学形态学方法对目标轮廓进行处理,如图3所示,因canny算子提取目标轮廓边缘附近有许多孤立的点,如图4所示,用开运算去掉目标外的孤立,又因去掉孤立点后的目标轮廓存在细小的空洞,如图5所示,再用闭运算填充轮廓内的细小空洞,连接邻近物体以及平滑边界,开运算则是先进行腐蚀再进行膨胀,闭运算是先进行膨胀再进行腐蚀,最后用7个Hu不变矩提取形状特征,开运算的公式如式(3)所示:
上述对水下图像进行轮廓提取与开闭运算之后就开始用7个Hu不变矩提取形状特征,Hu提出的不变矩是一种被广泛应用于基于图像形状特征的描述子、图像识别和模式分析等领域。它对图像的旋转、缩放、平移均不敏感。
假设一幅图像大小为M×N,g(x,y)是预处理后图像中(x,y)点处的灰度值,则图像的(p+q)阶原点矩为:
为保证图像在平移、旋转和缩放时的不变性,其中心距为:
式(6)中:x0,y0为整幅图像的中心坐标,x0=m10/m00,y0=m01/m00;(x0,y0)为图像的灰度质心。中心距upq是图像平移的不变量,对其规范化可得到平移和缩放不变矩:
对g(x,y)的(p+q)阶中心距归一化后得到7个Hu不变矩的公式如式(8)所示:
上述7个不变距具有平移、缩放和旋转不变性,但由于这7个不变矩变化范围较大,可能出现负值,通常用式(9)进行替换计算。
φk=log10|φk| k=1,2,3,...,7 (9)
目标颜色特征提取,将完成预处理后的水下rgb图像转到HSV空间,再提取图像的三阶颜色矩特征,rgb空间转到HSV空间的计算公式如式(10)~(12)所述:
v=max(r,g,b) (10)
在HSV颜色空间提取图像的三阶颜色矩特征。
一阶颜色矩(均值,mean)用μi表示、二阶颜色矩(方差,viarance)用σi,三阶颜色矩(斜度,skewness)用si表示,具体公式如式(13)~(15)所述:
在目标纹理特征提取时,将完成预处理后的水下图像用灰度共生矩阵(GLCM)提取纹理特征,灰度共生矩阵是像素距离和角度的矩阵函数,是从灰度级i的点离开某个固定位置d=(dx,dy)达到灰度为j的概率,通过计算图像中一定距离和一定方向的两点灰度之间的相关性来反映图像在方向、间隔、变化幅度以及快慢上的综合信息,灰度共生矩阵可表示为g(i,j,d,θ)。通常用角二矩阵、对比度、熵和相关性这4种特征作为灰度共生矩阵的主要参数来提取图像的纹理特征,公式如式(16)~(19)所示:
其中,k表示GLCM的行数或者列数,θ一般为{0°,45°,90°,135°},d表示两个像素间的空间位置关系,d∈{(0,d),(d,d),(d,0),(-d,d)},i,j表示对应像素的灰度级。μ1、μ2分别表示灰度共生矩阵的行、列方向上的均值;σ1、σ2分别代表行、列的均方差,μ1、μ2、σ1和σ2公式如式(20)~(23)所示:
在水下图像纹理特征提取的基础上,研究了用基于canny算子的图像窗口自适应的纹理特征向量提取方法,具体为:
通过灰度共生矩阵计算特定窗口图像的纹理特征值,然后将该值赋给该窗口子的中心像素点,作为该像素点的特征值。本发明首先用canny算子对目标边缘进行检测,在目标边缘处选择3×3的滑动窗口,其他区域选择9×9的滑动窗口,选取步距d=1,移动滑动窗口,依次计算窗口子图的纹理特征值,直到整幅图像形成了一个由纹理特征值组成的特征矩阵。
目标训练与识别:
所述目标训练样本集为X={φ1z、φ2z、...、φ7z、μz、σz、sz、w1θz、w2θz、w3θz、w4θz},其中,z是本发明中训练集样本数,z={1,2,3,...,100},θ={0°、45°、135°、180°};φ1z、φ2z、...、φ7z表示7个Hu不变矩特征,μz、σz、sz表示颜色矩特征,w1θz、w2θz、w3θz、w4θz表示灰度共生矩阵。将训练样本集X作为支持向量机(SVM)的输入,对SVM分类器进行目标训练,在SVM分类器中采用多项式核函数和径向基核函数的混合核函数作为核函数,混合核函数公式如式(24)~(26)所示:
kh=ηk1+(1-η)k2 (24)
k1=(x·xi+1)d (25)
其中,kh表示混合核函数,k1表示多项式核函数,k2表示径向基核函数,η是比例系数,用来调节多项式核函数和径向基核函数的占比,η∈[0,1],为了满足核函数优良的分类性能,径向基核半径γ一般取0.1~1,惩罚系数C取500~1000,多项式核函数阶数d一般取2或3。η根据训练样本分类性能取值,如果局部核函数分类正确率较高,则η取较大值;全局核函数分类性能较好,则η取较小值。本发明根据样本中目标特性以及SVM分类器初步训练情况,经过综合分析后,在本发明算法中,取最优值η=0.6。
所述目标识别是使用训练过的SVM分类器对自然光照与人工光源下的测试样本进行分类,输出分类结果并进行比较。
综上所述,和其他现有技术相比较,本发明的的噪点定位方法能够去除中值滤波算法原有的逐点去噪步骤,再用中值滤波算法中的中值提取方法进行去噪,使图像噪点得到有效去除,并引用基于暗原色先验原理进行水下图像去雾,提升图像目标背景对比度,引用视网膜大脑皮层理论(Retinex)算法对图像进行色偏校正,使待特征提取的图像目标清晰,提升视觉效果;目标特征提取中用canny算子提取目标轮廓,再用数学形态学开运算去掉目标外的孤立,又用闭运算填充轮廓内的细小空洞,最后用7个Hu不变矩提取形状特征,该步骤可提取到准确及完整的目标形状特征;所提取的图像三阶颜色矩特征能准确表达目标的颜色特征信息;本发明在canny算子的基础上,提出图像窗口自适应的纹理特征向量提取方法,既能保证图像纹理特征的完整性,又能有效解决原有算法计算量大的弊端。
简言之,本发明总体上目标识别准确率高、算法可靠性较高、算法识别率较高以及适用于不同光环境下的水下目标识别。
Claims (4)
1.一种基于光视觉的水下目标识别方法,其特征在于:包括以下步骤:
(1)采集水下图像,通过水下图像采集系统分别在自然光照和人工光源环境下采集水下目标物图像;所述水下图像采集系统包括水下摄像头、水下照明设备、图像采集卡、工控计算机、独立12V直流电源和图像处理软件;水下摄像头和水下照明设备均放在水下,12V直流电压放置在岸上同时为水下摄像头和水下照明设备提供电源,图像采集卡安装在工控计算机的PCI-E插槽上,用MATLAB软件在Windows xp系统上进行仿真实验;
(2)图像预处理,将采集到的不同环境下的水下图像编为两组,分别依次进行图像增强、噪点定位、去噪以及色偏校正;
(3)目标特征提取:依次提取目标的形状特征、颜色特征和纹理特征;
目标特征提取的详细过程为:
(3.1)提取形状特征:对完成预处理后的水下图像利用canny算子提取目标轮廓;再用数学形态学方法对目标轮廓进行处理,即用开运算去掉目标外的孤立,再用闭运算填充轮廓内的细小空洞,连接邻近物体以及平滑边界,开运算则是先进行腐蚀再进行膨胀,闭运算是先进行膨胀再进行腐蚀,最后用7个Hu不变矩提取形状特征;
(3.2)提取颜色特征:将完成预处理后的水下RGB图像转到HSV空间,再提取图像的三阶颜色矩特征;
(3.3)提取纹理特征:对完成预处理后的水下图像,用灰度共生矩阵提取水下图像的纹理特征,用角二矩阵、对比度、熵和相关性4种特征作为灰度共生矩阵的主要参数提取图像的纹理特征;
(4)目标训练与识别,将步骤(3)获得的形状特征矩阵、颜色特征矩阵和纹理特征矩阵组成训练样本集,然后进行目标训练,对自然光照与人工光源下的两组测试样本进行分类,输出分类结果;
其中,所述噪点定位方法为:Ixy为对应点的灰度值,为了提高算法效率,以3×3滑动窗口,以满足非密噪点图像的滤波原则,获取窗口内灰度中值Imed、最大值Imax和最小值Imin;当满足公式(1)中的两种情况就判定点(x,y)为噪声点,否则视为非噪声点;
该方法确保噪声分布不密集的噪点(x,y)被进行中值滤波处理,采用扩大窗口的方式来减少冲击噪声空间密度,即如果Imed-Imin=0或Imed-Imax=0,表明噪点比较密集,则增大滤波窗口的尺寸为5×5,再重新按照式(1)进行处理;
再用中值滤波算法滤去定位出的噪点,中值滤波算法用公式(2)表示为:
g(x,y)=med{f(x,y)},(x,y)∈N(x,y) 公式(2)
其中,f(x,y)是原图,g(x,y)是处理后图像,N(x,y)是以点(x,y)为中心的n×n矩形邻域,n是奇数,中心点(x,y)即为水下图像中的任意一点;med{}是图像矩形邻域中灰度值按照大小排列后的中间值。
2.根据权利要求1所述的基于光视觉的水下目标识别方法,其特征在于:所述步骤(2)中图像预处理的具体方法为:
首先,对采集到的水下图像基于暗原色先验算法进行增强处理,去除雾气,凸显纹理细节;其次,用噪点定位方法对增强后的图像进行噪点定位,再用中值滤波算法滤去定位出的噪点;最后用视网膜大脑皮层理论法对图像进行色偏校正,还原图像本色。
3.根据权利要求1所述的基于光视觉的水下目标识别方法,其特征在于:所述步骤(4)中目标识别的具体过程为:将提取的形状、颜色和纹理特征矩阵组成训练样本集,训练样本集X={φ1z、φ2z、...、φ7z、μz、σz、sz、w1θz、w2θz、w3θz、w4θz},其中,z是指训练集样本数,z={1,2,3,...,100},θ={0°、45°、135°、180°},φ1z、φ2z、...、φ7z表示7个Hu不变矩特征,μz、σz、sz表示颜色矩特征,w1θz、w2θz、w3θz、w4θz表示灰度共生矩阵;
将训练样本集作为支持向量机SVM的输入,对SVM分类器进行目标训练,在SVM分类器中采用多项式核函数和径向基核函数的混合核函数作为核函数,使用训练过的SVM分类器对自然光照与人工光源下的测试样本进行分类,输出分类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711011197.9A CN107808161B (zh) | 2017-10-26 | 2017-10-26 | 一种基于光视觉的水下目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711011197.9A CN107808161B (zh) | 2017-10-26 | 2017-10-26 | 一种基于光视觉的水下目标识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107808161A CN107808161A (zh) | 2018-03-16 |
CN107808161B true CN107808161B (zh) | 2020-11-24 |
Family
ID=61592541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711011197.9A Active CN107808161B (zh) | 2017-10-26 | 2017-10-26 | 一种基于光视觉的水下目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107808161B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596141B (zh) * | 2018-05-08 | 2022-05-17 | 深圳大学 | 一种深度网络生成人脸图像的检测方法及系统 |
CN109961012A (zh) * | 2019-02-20 | 2019-07-02 | 博雅工道(北京)机器人科技有限公司 | 一种水下目标跟踪识别方法 |
CN109948482A (zh) * | 2019-03-07 | 2019-06-28 | 中山市信息技术研究所 | 一种黑臭水体图像提取与识别方法 |
CN112580659A (zh) * | 2020-11-10 | 2021-03-30 | 湘潭大学 | 一种基于机器视觉的矿石识别方法 |
CN112589231A (zh) * | 2020-12-04 | 2021-04-02 | 江苏科技大学 | 一种基于视觉检测水下电弧切割状态的装置及方法 |
CN112613425B (zh) * | 2020-12-24 | 2022-03-22 | 山东船舶技术研究院 | 一种面向小样本水下图像的目标识别系统 |
CN112733914B (zh) * | 2020-12-31 | 2024-03-22 | 大连海事大学 | 一种基于支持向量机的水下目标视觉识别分类方法 |
CN112785619A (zh) * | 2020-12-31 | 2021-05-11 | 大连海事大学 | 一种基于视觉感知的无人水下航行器自主循迹方法 |
CN112926381B (zh) * | 2021-01-08 | 2022-06-21 | 浙江大学 | 一种基于激光检测技术的水下目标识别系统 |
CN113546921A (zh) * | 2021-07-26 | 2021-10-26 | 贵州电网有限责任公司 | 一种激光金属件清洗除锈钝化机器人和方法 |
CN115397073B (zh) * | 2022-10-26 | 2023-03-24 | 青州鑫聚隆装备制造有限公司 | 一种用于自航式两栖清淤机器人的照明系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100780151B1 (ko) * | 2005-11-22 | 2007-11-27 | 주식회사 휴맥스 | 최소/최대 필터를 이용한 에지 보상 장치 및 방법 |
CN102353346B (zh) * | 2011-06-23 | 2013-05-08 | 东华大学 | 自动寻边激光切割机ccd安装垂直度的检测方法和系统 |
RU2554640C2 (ru) * | 2013-06-18 | 2015-06-27 | Акционерное общество "Военно-промышленная корпорация "Научно-производственное объединение машиностроения" (АО "ВПК" "НПО Машиностроения") | Способ обнаружения морских целей |
CN104978715B (zh) * | 2015-05-11 | 2017-08-11 | 中国科学院光电技术研究所 | 一种基于滤波窗口及参数自适应的非局部均值图像去噪方法 |
CN105930815B (zh) * | 2016-05-04 | 2022-10-04 | 中国农业大学 | 一种水下生物检测方法和系统 |
CN106909925B (zh) * | 2017-03-03 | 2020-04-03 | 河海大学 | 一种水下图像目标检测方法 |
-
2017
- 2017-10-26 CN CN201711011197.9A patent/CN107808161B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107808161A (zh) | 2018-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107808161B (zh) | 一种基于光视觉的水下目标识别方法 | |
TW201732651A (zh) | 一種單詞的分割方法和裝置 | |
CN109919960B (zh) | 一种基于多尺度Gabor滤波器的图像连续边缘检测方法 | |
CN111833306A (zh) | 缺陷检测方法和用于缺陷检测的模型训练方法 | |
CN103198319B (zh) | 用于矿山井筒环境下的模糊图像角点提取方法 | |
CN110222661B (zh) | 一种用于运动目标识别及跟踪的特征提取方法 | |
Petraglia et al. | Pipeline tracking and event classification for an automatic inspection vision system | |
Li et al. | Research on a product quality monitoring method based on multi scale PP-YOLO | |
CN110660048B (zh) | 一种基于形状特征的皮革表面缺陷检测方法 | |
CN113705564B (zh) | 一种指针式仪表识别读数方法 | |
CN104102911A (zh) | 一种基于aoi的子弹表观缺陷检测系统的图像处理算法 | |
Wang et al. | Improved morphological band-pass filtering algorithm and its application in circle detection | |
Sabri et al. | Computer motherboard component recognition using texture and shape features | |
Cai et al. | Unfeatured weld positioning technology based on neural network and machine vision | |
KR102199572B1 (ko) | 딥러닝 기반의 역방향 사물 검사 방법 | |
Żak et al. | Segmentation algorithm using method of edge detection | |
CN108961248A (zh) | 一种应用于包含复杂信息的机箱表面划痕检测方法 | |
Khidkikar et al. | Segmentation and classification of side-scan sonar data | |
CN110991313B (zh) | 一种基于背景分类的运动小目标检测方法和系统 | |
Luo | Edge detection algorithm based on color space variables | |
Zhao et al. | Subsea Pipeline Inspection Based on Contrast Enhancement Module | |
Yi et al. | A pattern-based directional element extraction method for vehicle license plate detection in complex background | |
CN108171242A (zh) | 一种高效的挡圈检测系统 | |
Abdulkarem | Image quality enhancement and rain removal on images taken under different rain conditions | |
Yu et al. | A bullet hole recognition method based on visual detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |