CN116403100A - 一种基于矩阵分解的声呐图像小目标检测方法 - Google Patents
一种基于矩阵分解的声呐图像小目标检测方法 Download PDFInfo
- Publication number
- CN116403100A CN116403100A CN202310387225.6A CN202310387225A CN116403100A CN 116403100 A CN116403100 A CN 116403100A CN 202310387225 A CN202310387225 A CN 202310387225A CN 116403100 A CN116403100 A CN 116403100A
- Authority
- CN
- China
- Prior art keywords
- matrix
- noise
- image
- target
- sonar
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 82
- 238000001514 detection method Methods 0.000 title claims abstract description 38
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000001914 filtration Methods 0.000 claims abstract description 5
- 230000000877 morphologic effect Effects 0.000 claims abstract description 5
- 238000000605 extraction Methods 0.000 claims abstract description 4
- 238000007670 refining Methods 0.000 claims abstract description 4
- 238000005260 corrosion Methods 0.000 claims description 12
- 230000007797 corrosion Effects 0.000 claims description 12
- 238000005457 optimization Methods 0.000 claims description 7
- 230000009977 dual effect Effects 0.000 claims description 4
- 230000003628 erosive effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 4
- 238000003384 imaging method Methods 0.000 description 7
- 239000004973 liquid crystal related substance Substances 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/05—Underwater scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/36—Applying a local operator, i.e. means to operate on image points situated in the vicinity of a given point; Non-linear local filtering operations, e.g. median filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/72—Data preparation, e.g. statistical preprocessing of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Nonlinear Science (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Algebra (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明涉及图像处理技术领域,具体涉及一种基于矩阵分解的声呐图像小目标检测方法。本发明采用的检测方法为步骤1)对声呐图像去均值进行标准化,凸显目标的个体差异;步骤2)将声呐图像目标特征提取和噪声移除等问题表征为矩阵分解问题,构建矩阵分解模型,将声呐图像分解为低秩背景部分、稀疏目标部分与噪声部分之和,采用快速近端梯度方法优化求解目标函数,分别得到低秩矩阵、稀疏矩阵及噪声矩阵,其中,稀疏矩阵为目标,低秩矩阵为背景,噪声矩阵为噪声;步骤3)利用形态学运算滤除噪声,细化目标边缘。本发明算法无需依赖于大样本数据,且能够有效降低噪声干扰。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于矩阵分解的声呐图像小目标检测方法。
背景技术
随着成像声呐系统及图像处理技术的发展,水下成像探测技术在海洋研究领域发挥着越来越重要的作用。水下声呐成像探测距离远、穿透力强,因此,在海洋测绘、可疑目标探测、海洋资源勘探等领域得到了广泛应用。水下目标检测主要用于获取感兴趣目标的位置、姿态等信息,是后续进行高层语义分析或识别的前提条件。
目前用于水下探测的成像声呐系统主要分为侧扫声呐,前视声呐以及合成孔径声呐。与其他声呐传感器相比,侧扫声呐能够通过载体两侧所设的换能器基阵进行海底扫描,将接收到的回波信号转换成侧扫声呐图像。其探测范围广,在复杂且能见度低的水下环境中具备一定的可见度。
然而,目前基于水下侧扫声呐图像的检测算法研究面临两大困难:
第一,可获取的声呐图像样本稀少,且不同环境条件下的图像物理特征具有较大差异。
第二,由于水下环境复杂多变性,声波自身的传播损失和透射、散射特性,导致采集到的声呐图像往往空间分辨率和对比度较低、噪声与混响严重、边缘不清晰、小目标特征不明显。
由于水下场景的复杂多变性及噪声影响,给声呐图像的自动解译带来了巨大困难,如何准确定位声呐图像中的感兴趣目标至关重要。侧扫声呐图像如图1所示,其中白色矩形框内为柱状目标物,由于目标类型、观测视角、成像距离的不同,白色亮点的目标形状不同,目标的大小从5×5到10×10像素以上不等,其亮度也可能由暗到亮不同灰度级别,同时,图中可观测出背景较为复杂。
目前基于声呐目标检测算法分为传统及深度学习算法。近年来,出现了大量的深度学习检测算法。Kim等人将深度学习的单阶段目标检测模型YOLO应用于声呐目标的检测。Cao等人设计了一种新的分类网络,该网络由CNN结构和二阶池化组成。深度学习算法受大数据驱动,需要高质量、大样本的侧扫声呐图像数据。然而,在实际应用中很难获得大量的声呐图像,且图像的信噪比很低,上述基于深度学习模型的目标检测算法容易在小批量样本上过拟合,不具备泛化性。而传统的图像处理算法依赖于人为设计的特征,且方法鲁棒性较低,易受噪声和海底混响的影响,对于目标特征定义的准确与否直接影响检测效果。恒虚警率算法(constant false alarm rate,CFAR)及系列改进算法常用于水下声呐目标检测,通过比较像素与设定阈值的距离实现目标检测,但其只适用于目标与背景的对比度明显的情况之下,且需要先验假设。
发明内容
本发明提出了一种基于矩阵分解的声呐图像小目标检测方法,算法无需依赖于大样本数据,且能够有效降低噪声干扰。
为解决现有技术存在的问题,本发明采用的技术方案为:一种基于矩阵分解的声呐图像小目标检测方法,其特征在于:检测方法为:
步骤1)对声呐图像去均值进行标准化,凸显目标的个体差异;
步骤2)将声呐图像目标特征提取和噪声移除等问题表征为矩阵分解问题,构建矩阵分解模型,将声呐图像分解为低秩背景部分、稀疏目标部分与噪声部分之和,采用快速近端梯度方法优化求解目标函数,分别得到低秩矩阵、稀疏矩阵及噪声矩阵,其中,稀疏矩阵为目标,低秩矩阵为背景,噪声矩阵为噪声;
步骤3)利用形态学运算滤除噪声,细化目标边缘。
进一步,具体方法为:
步骤1)对声呐图像标准化的方法为:
设输入的声呐图像为Di,通过公式(1),得到标准化图像D,
D=Di-mean(Di) (1)
步骤2)假设随机噪声满足独立同分布,D是标准化图像,T是稀疏矩阵,B是低秩矩阵,N是噪声矩阵,则矩阵分解问题表征为:
其中,||B||*表示矩阵B的核范数,即奇异值的和,||T||1表示矩阵T的1范数,||N||F表示矩阵N的Frobenius范数;μ>0;正则化参数λ1,λ2为正,且m,n分别为图像D的高度和宽度,设置
使用最优化方法交替求解B,T,N,即每次只求解一个变量,其他变量设置为常数,则问题转化为三个子问题:
①估计低秩矩阵B,
②估计稀疏矩阵T,
③估计噪声矩阵N,
式(8)求得稀疏矩阵T,即目标像元;
步骤3)图像形态学操作
得到稀疏矩阵T后,对T进行图像侵蚀操作,生成侵蚀后的图像T1,腐蚀的具体过程为:
设T为输入,B1为结构元素,腐蚀的表达式如下:
再对T1进行膨胀操作,得到图像T2,膨胀是腐蚀的对偶运算,其具体表达式如下:
设T1为输入,B2为结构元素,腐蚀的表达式如下:
与现有技术相比,本发明的优点在于:
1)本发明方法将低秩稀疏矩阵分解引入声呐目标检测技术中,提出了一种强噪声背景下端到端声呐小目标检测算法,该算法不需要进行图像滤波预处理,在信噪比低的情况下,也可以直接检测出前景目标。
2)本发明方法不需要依靠大数据训练和手动设置检测门限,实时性强,可以不经过后处理就确定目标的中心位置。
3)本发明采用数学形态学方法进行弱噪声清除与目标细节填充处理,从而可以细化目标边缘,提高目标的检测精确性。
附图说明
图1为侧扫声呐图像;
图2为原始声呐图像及标准化图像;
图3为水下自主航行器的架构;
图4为原图及本发明的检测结果;
图5是本发明方法流程图。
具体实施方式
本发明一种基于低秩稀疏矩阵分解的声呐图像小目标检测方法,主要包括以下三部分内容,如图5所示:
(1)首先,对声呐图像去均值进行标准化,凸显目标的个体差异
对声呐图像标准化的方法为:设输入的声呐图像为Di,得到标准化图像D,D的求解公式如下:
D=Di-mean(Di) (1)
从PCA的角度来讲,减去均值是为了数据特征标准化,对于单幅声呐图像,应关注于目标等显著性区域。标准化可以移除图像的平均亮度值,去除部分噪声。图2分别显示了原图及去均值的结果,可明显看出,在去均值后的标准化图像中,混响噪声有一定消减,也突出了小目标的主要特征。
(2)将声呐图像目标特征提取和噪声移除等问题表征为矩阵分解问题,构建矩阵分解模型,将声呐图像分解为低秩背景部分、稀疏目标部分与噪声部分之和,采用快速近端梯度方法优化求解目标函数,分别得到低秩矩阵、稀疏矩阵及噪声矩阵,其中,稀疏矩阵为目标,低秩矩阵为背景,噪声矩阵为噪声;
假设随机噪声满足独立同分布,D为标准化图像,T为稀疏矩阵,B为低秩矩阵,N为噪声矩阵,问题可以描述为优化问题:
上述凸优化问题就是同时将背景、目标和噪声图像从声呐图像中分离出来,在低信噪比的声呐图像中,为解决背景和噪声估计问题,可将式(2)进一步演化为对偶问题,则矩阵分解问题表征为:
其中,||B||*表示矩阵B的核范数,即奇异值的和,||T||1表示矩阵T的1范数,||N||F表示矩阵N的Frobenius范数,μ>0;正则化参数λ1,λ2为正,且m,n分别为图像D的高度和宽度,设置
公式(2)是一个优化问题,借鉴加速近端梯度算法,其中等式约束替换为惩罚项,则等价为下式:
min F(B,T,N,μ)=g(B,T,N,μ)+f(B,T,N). (5)
没有直接优化公式,而是用二次模型来近似式(5),对B,T,N的偏导数交替求解,即一次只解一个变量,其他变量设为常数,因此优化问题转化为三个子问题,直到收敛,
①估计低秩矩阵B
其中,VT是矩阵V的转置。
②估计稀疏矩阵T
优化问题(8)是凸的,可以用加速近端梯度(APG)方法求解,对式(8)求导,最终得到:
③估计噪声矩阵N
(10)式求解可得:
最终得出稀疏矩阵T,即目标像元。
(3)最后,利用形态学运算滤除噪声,细化目标矩阵中的目标边缘,提高目标检测的精度。
对所获得的部分稀疏矩阵(目标图像)进行可视化,发现目标具有一定的孔洞或孤立噪点,因此需要进行清除与填充等后处理工作,数学形态学具有良好的滤波特性,同时可以细化目标边缘,使用形态学方法进行解决,从而提高目标检测的精确性。
先得到稀疏矩阵T后,对T首先进行图像腐蚀操作,生成侵蚀后的图像T1,腐蚀的具体过程如下:
设T为输入,B1为结构元素,腐蚀的表达式如下:
本方法采用的腐蚀算法具体总结为三点:
①创建半径为1的平坦型圆盘结构元素,扫描目标图像的每一个像素;
②用结构元素与其覆盖的二值图像进行“与”操作;
③如果都为1,输出图像的该像素为1,否则为0。
再对T1进行膨胀操作,得到图像T2,膨胀是腐蚀的对偶运算,其具体过程如下:
设T1为输入,B2为结构元素,腐蚀的表达式如下:
本方法采用的膨胀算法具体总结为三点:
①创建3×3的结构元素,扫描目标图像的每一个像素;
②用结构元素与其覆盖的二值图像进行“与”操作;
③如果都为0,输出图像的该像素为0,否则为1。
真实声呐数据测试
在真实场景中进行了声呐图像的小目标检测实验,基于真实的水下侧扫声呐图像,以验证本发明方法的性能。
将侧扫声呐安装在水下自主航行器(AUV)上,采集了不同信噪比的声呐图像序列。实验改变条件采集不同条件下的侧扫声呐图像,针对声呐扫描系统,改变了航行器的工作深度。不断调整扫描倾斜角度,采集不同光束角度下的目标图像。在相同深度下,航向角分别为0°、30°、60°和90°。AUV的运行模式设置为自主模式,初始导航方向不同,因此改变了侧扫描声呐的运动方向,从多个角度扫描目标。图3为AUV平台的结构,总体架构分为头段、动力推进段Ⅰ、能源与控制段、动力推进段Ⅱ、尾段,其后搭载拖曳缆。水下无人平台由声学成像单元、动力推进单元、导航与控制单元组成。
侧扫声呐图像识别结果如图4所示,其中第1行为原始侧扫声呐图像,图像中的框为目标的真值。第2行是本发明检测方法的检测结果,总体而言,本发明方法消除了大量的杂波和虚警,对不同信噪比的声呐图像的小目标检测具有较好的鲁棒性。
Claims (2)
1.一种基于矩阵分解的声呐图像小目标检测方法,其特征在于:检测方法为:
步骤1)对声呐图像去均值进行标准化,凸显目标的个体差异;
步骤2)将声呐图像目标特征提取和噪声移除等问题表征为矩阵分解问题,构建矩阵分解模型,将声呐图像分解为低秩背景部分、稀疏目标部分与噪声部分之和,采用快速近端梯度方法优化求解目标函数,分别得到低秩矩阵、稀疏矩阵及噪声矩阵,其中,稀疏矩阵为目标,低秩矩阵为背景,噪声矩阵为噪声;
步骤3)利用形态学运算滤除噪声,细化目标边缘。
2.根据权利要求1所述的一种基于矩阵分解的声呐图像小目标检测方法,其特征在于:具体方法为:
步骤1)对声呐图像标准化的方法为:
设输入的声呐图像为Di,通过公式(1),得到标准化图像D,
D=Di-mean(Di) (1)
步骤2)假设随机噪声满足独立同分布,D是标准化图像,T是稀疏矩阵,B是低秩矩阵,N是噪声矩阵,则矩阵分解问题表征为:
其中,||B||*表示矩阵B的核范数,即奇异值的和,||T||1表示矩阵T的1范数,||N||F表示矩阵N的Frobenius范数;μ>0;正则化参数λ1,λ2为正,且m,n分别为图像D的高度和宽度,设置
使用最优化方法交替求解B,T,N,即每次只求解一个变量,其他变量设置为常数,则问题转化为三个子问题:
①估计低秩矩阵B,
②估计稀疏矩阵T,
③估计噪声矩阵N,
式(8)求得稀疏矩阵T,即目标像元;
步骤3)图像形态学操作
得到稀疏矩阵T后,对T进行图像侵蚀操作,生成侵蚀后的图像T1,腐蚀的具体过程为:
设T为输入,B1为结构元素,腐蚀的表达式如下:
再对T1进行膨胀操作,得到图像T2,膨胀是腐蚀的对偶运算,其具体表达式如下:
设T1为输入,B2为结构元素,腐蚀的表达式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310387225.6A CN116403100A (zh) | 2023-04-12 | 2023-04-12 | 一种基于矩阵分解的声呐图像小目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310387225.6A CN116403100A (zh) | 2023-04-12 | 2023-04-12 | 一种基于矩阵分解的声呐图像小目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116403100A true CN116403100A (zh) | 2023-07-07 |
Family
ID=87017640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310387225.6A Pending CN116403100A (zh) | 2023-04-12 | 2023-04-12 | 一种基于矩阵分解的声呐图像小目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116403100A (zh) |
-
2023
- 2023-04-12 CN CN202310387225.6A patent/CN116403100A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3573783B2 (ja) | ソナー・システム | |
Acosta et al. | Accumulated CA–CFAR process in 2-D for online object detection from sidescan sonar data | |
CN107590468B (zh) | 一种基于多视角目标亮点特征信息融合的探测方法 | |
CN111505651B (zh) | 一种主动声呐回波图潜在运动目标的特征提取方法 | |
CN112766221A (zh) | 基于船舶方向和位置多任务的sar图像船舶目标检测方法 | |
CN112949380B (zh) | 一种基于激光雷达点云数据的智能水下目标识别系统 | |
Szyrowski et al. | Developments in subsea power and telecommunication cables detection: Part 1-Visual and hydroacoustic tracking. | |
CN105574529A (zh) | 一种侧扫声纳目标检测方法 | |
CN110570361B (zh) | 声呐图像结构化噪声的抑制方法、系统、装置和存储介质 | |
CN113807324A (zh) | 一种声呐图像识别方法、装置、电子设备和储存介质 | |
CN116188944A (zh) | 一种基于Swin-Transformer和多尺度特征融合的红外弱小目标检测方法 | |
Ye et al. | Mobilenetv3-yolov4-sonar: Object detection model based on lightweight network for forward-looking sonar image | |
Shih et al. | An adaptive bottom tracking algorithm for side-scan sonar seabed mapping | |
Chapple | Automated detection and classification in high-resolution sonar imagery for autonomous underwater vehicle operations | |
CN111142112B (zh) | 一种水下锚系小目标快速非成像检测方法 | |
CN116403100A (zh) | 一种基于矩阵分解的声呐图像小目标检测方法 | |
Vu et al. | Track-before-detect for an active towed array sonar | |
CN113792755A (zh) | 一种小波深度图像融合环境感知与目标识别方法 | |
Wang et al. | Deep learning-based robust positioning scheme for imaging sonar guided dynamic docking of autonomous underwater vehicle | |
Gao et al. | An Underwater Target Perception Framework for Underwater Operation Scene | |
Muduli et al. | A Review On Recent Advancements In Signal Processing and Sensing Technologies for AUVs | |
Oliveira et al. | Sonar-based cable detection for in-situ calibration of marine sensors | |
CN112305548B (zh) | 一种主动声呐回波图中运动小目标的实时检测方法 | |
M V | Survey on deep learning techniques used for classification of underwater sonar images | |
Zhang et al. | Technical Study on Underwater Target Detection and Recognition of Unmanned Surface Vehicles in Complex Environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |