CN110490816B - 一种水下异构信息数据降噪方法 - Google Patents
一种水下异构信息数据降噪方法 Download PDFInfo
- Publication number
- CN110490816B CN110490816B CN201910633686.0A CN201910633686A CN110490816B CN 110490816 B CN110490816 B CN 110490816B CN 201910633686 A CN201910633686 A CN 201910633686A CN 110490816 B CN110490816 B CN 110490816B
- Authority
- CN
- China
- Prior art keywords
- underwater
- information data
- heterogeneous information
- layer
- noise reduction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000009467 reduction Effects 0.000 title claims abstract description 159
- 238000000034 method Methods 0.000 title claims abstract description 147
- 238000012545 processing Methods 0.000 claims abstract description 86
- 238000012360 testing method Methods 0.000 claims abstract description 63
- 239000013598 vector Substances 0.000 claims abstract description 35
- 238000005070 sampling Methods 0.000 claims abstract description 26
- 238000010606 normalization Methods 0.000 claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 33
- 239000000654 additive Substances 0.000 claims description 21
- 230000000996 additive effect Effects 0.000 claims description 21
- 238000004088 simulation Methods 0.000 claims description 20
- 238000011176 pooling Methods 0.000 claims description 18
- 230000003287 optical effect Effects 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 description 44
- 230000003044 adaptive effect Effects 0.000 description 24
- 238000013527 convolutional neural network Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 21
- 238000011156 evaluation Methods 0.000 description 16
- 238000001914 filtration Methods 0.000 description 13
- 241000283153 Cetacea Species 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000011410 subtraction method Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 239000004575 stone Substances 0.000 description 5
- 238000012800 visualization Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000004445 quantitative analysis Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000003477 cochlea Anatomy 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000003345 natural gas Substances 0.000 description 1
- 239000009260 qiming Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种水下异构信息数据降噪方法,通过模拟水下异构信息数据集;对异构信息数据进行预处理,对异构信息数据进行im2col方法采样,将采样结果进行归一化处理;提取模拟水下异构信息数据中的过完备稀疏特征和水下异构信息数据深层特征,构建SCSDA模型;完成SCSDA模型的水下异构信息数据降噪处理,将水下异构信息数据作为测试集,利用SCSDA模型对其进行降噪处理得到降噪结果向量;对降噪结果向量进行反归一化处理及col2im方法处理,得到降噪处理后的水下异构信息数据。本发明提出的基于堆叠式卷积稀疏降噪自编码器的水下异构信息数据降噪方法,处理速度较快,具有良好的盲去噪能力,并能较好地保留水下异构信息数据边缘特征,具有一定的鲁棒性和有效性。
Description
技术领域
本发明属于信息数据降噪技术领域,具体涉及一种水下异构信息数据降噪方法。
背景技术
近年来随着对海洋科学的不断探索,发展海洋高新技术,已成为世界各国维护国家海洋权益和国土安全极其重要的战略目标。由于水下环境不同于陆地环境,海洋环境极其复杂,噪声干扰远大于陆地环境,而这些噪声往往会破坏信息数据的有用特征,影响后续处理工作,因此水下信息数据的降噪处理是至关重要的。水下信息数据来源多样,种类繁多,数据格式多种多样,对水下信息数据按数据格式进行非统一的降噪处理,存在处理效率低、分类管理复杂的缺点,因此提出一种水下异构信息数据的降噪处理方法是必要的。水下异构信息数据的组成以水下图像数据和水下音频数据为主。目前,对水下信息数据或水下异构信息数据的降噪处理方法研究极少,但关于图像数据或音频数据降噪技术的研究很广泛。其中在已有的文献中最著名和效果最好的相关降噪方法主要包括:1.基于观测模型的侧扫声纳图像盲估计方法:2016年James Rithu,Supriya M H.Blind Estimation ofSingle Look Side Scan Sonar Image from the Observation Model.ProcediaComputer Science,2016,93:336-343.提出利用一种基于无迹卡尔曼滤波的图像观测模型对侧扫声纳图像的噪声方差进行估计,完成盲去噪,实验结果验证了该方法的有效性。2.基于散射的合成孔径雷达三维块匹配算法:2016年Di Martino Gerardo,Di SimoneAlessio,Iodice Antonio,et al.Scattering-Based SARBM3D.IEEE Journal ofSelected Topics in Applied Earth Observations&Remote Sensing,2016,9(6):2131-2144.提出将散射的思想融入到三维块匹配算法中,使去除散斑噪声和保留有用信息之间达到良好的平衡。3.一种新的预白化变换域LMS算法及其在语音降噪中的应用:2017年Chergui Laid,Bouguezel Saad.A new pre-whitening transform domain LMSalgorithm and its application to speech denoising.Signal Processing,2017,130:118-128.提出利用一阶有限脉冲响应去相关滤波器进行预白化处理,然后应用变换对语音进行增强,在收敛速度、降噪等方面均有较好的效果。4.基于稀疏表示的水下声纳图像去噪方法:2018年Wu Di,Du Xue,Wang kaiyu.An Effective Approach for Underwater SonarImage Denoising Based on Sparse Representation.2018IEEE 3rd InternationalConference on Image,Vision and Computing(ICIVC).Chongqing China:IEEE ComputerSociety,2018:389-393.提出利用正交匹配算法对离散余弦变换字典上的水下声纳图像进行分解重建,对重建后的图像进行对数变换,使其适应稀疏表示的去噪模型,该方法能够有效地去除声纳图像中的噪声。5.一种对水下声纳图像的自适应去噪和检测方法:2019年Wang Xingmei,Li Qiming,Yin Jingwei,Han Xiao,Hao Wenqian.An Adaptive Denoisingand Detection Approach for Underwater Sonar Image.Remote Sensing,2019,11(4):1-21.提出一种基于黄金比例的自适应非局部空间信息去噪方法,能有效去除相对较大和较小的滤波度参数,提高去噪效果。
传统的图像数据和音频数据降噪方法,虽然能完成数据降噪,但存在着去除噪声和保留更多边缘特征上保持平衡的一个两难问题。同时,由于需要大量的迭代运算,处理时间较长、效率较低。近年来,深度学习在信息数据降噪领域得到了广泛的应用,深度学习模型较传统降噪方法,具有处理时间短,稳定性强的特点,是一种研究去除复杂噪声问题较好的解决方法。国内外学者对深度学习在图像数据和音频数据降噪领域进行了深入的分析研究。其中在已有的文献中最著名和效果最好的相关降噪方法主要包括:1.基于复杂递归神经网络的语音信号去噪方法:2015年Osako Keiichi,Rita Singh,and BhikshaRaj.Complex Recurrent Neural Networks for Denoising Speech Signals.IEEEWorkshop on Applications of Signal Processing to Audio and Acoustics(WASPAA).New York America:IEEE Computer Society,2015:1-5.提出将噪声估计和降噪过程组合在一个网络中,通过控制全连接层的输出向量值来交替进行估计噪声、提取纯净语音特征和噪声过滤过程,以达到较好的语音去噪效果。2.基于残差学习的深度卷积神经网络图像去噪方法:2017年Zhang Kai,Zuo Wangmeng,Chen Yunjin,et al.Beyond a GaussianDenoiser:Residual Learning of Deep CNN for Image Denoising.IEEE Transactionson Image Processing,2017,26(7):3142-3155.提出采用残差学习策略预测含噪图像和潜在纯净图像之间的差异,以达到未知噪声强度的盲高斯去噪能力。3.基于堆叠式稀疏降噪自编码器的图像底层结构特征提取方法:2017年Fan Zunlin,Bi Duyan,He Linyuan,etal.Low-level structure feature extraction for image processing via stackedsparse denoising autoencoder.Neurocomputing,2017,243(C):12-20.利用堆叠式稀疏降噪自编码器学习图像的底层结构特征,以改进保边滤波器,使降噪结果不再存在边缘模糊、过增强等缺点。4.一种提高人工耳蜗语音清晰度的深度降噪自编码方法:2017年LaiYinghui,Chen Fei,Wang Syusiang,et al.A Deep Denoising Autoencoder Approach toImproving the Intelligibility of Vocoded Speech in Cochlear ImplantSimulation.IEEE Transactions on Biomedical Engineering,2017,64(7):1568-1578.提出利用深度降噪自编码器模型对纯净语音进行精确建模,进行训练,将含噪语音转换为纯净语音,同时使模型明确地学习纯净语音和含噪语音之间的统计差异,实验证明能有效地提高人工耳蜗语音清晰度。5.深度像素点对网络的水下图像增强和恢复:2019年SunXin,Liu Lipeng,Li Qiong,et al.Deep pixel-to-pixel network for underwaterimage enhancement and restoration.提出采用卷积层作为编码器对噪声进行滤波,反卷积层作为解码器对缺失的细节进行恢复,并逐像素细化图像,同时引入跳跃连接,以避免在加速训练过程中丢失底层特征,对不同的数据集进行比较实验,验证该方法在水下图像去噪和色彩增强等方面具有较好的效果。
发明内容
本发明的目的在于提供一种水下异构信息数据降噪方法,具有较快处理速度,并具有良好的盲去噪能力的基于堆叠式卷积稀疏降噪自编码器的水下异构信息数据降噪方法。
本发明的目的是这样实现的:
步骤1.模拟水下异构信息数据集,利用已知的纯净光学图像数据进行高强度乘性散斑噪声污染模拟水下图像数据集,利用已知的纯净音频数据进行高强度加性高斯白噪声污染模拟水下音频数据集;
步骤2.对异构信息数据进行预处理,对异构信息数据进行im2col方法采样,将采样结果进行归一化处理;
步骤3.提取模拟水下异构信息数据中的过完备稀疏特征和水下异构信息数据深层特征,构建SCSDA模型;
步骤4.完成SCSDA模型的水下异构信息数据降噪处理,将水下异构信息数据作为测试集,利用SCSDA模型对其进行降噪处理得到降噪结果向量;对降噪结果向量进行反归一化处理及col2im方法处理,得到降噪处理后的水下异构信息数据。
所述步骤3的具体过程为:
步骤3.1.以3层SDA堆叠构成SSDA网络,提取模拟水下异构信息数据中的过完备稀疏特征;
步骤3.2.将SSDA网络最后一层编码层的输出结果作为CNN的输入,以1层输入层,2层二维卷积层,2层最大池化层以及1层全连接层构成CNN,提取模拟水下异构信息数据深层特征;
步骤3.3.采用级联微调的方式进一步优化网络参数,构建SCSDA模型。
所述步骤3.1的SSDA网络的训练过程为:
其中L(·)表示损失函数,θ(l)={w(l),b(l),w′(l),b′(l)},w(l)为第l层SSDA编码层权重、b(l)为第l层SSDA编码层偏置、w′(l)为第l层SSDA解码层权重、b′(l)为第l层SSDA解码层偏置,表示第l层SSDA编码层的隐层,表示第l层SSDA编码层隐层的重建结果,ρ是稀疏性参数,表示隐层上第j号神经元的所对应的平均激活值,表示第l层隐层的相对熵,β和λ为约束权重项;SSDA网络以逐步贪婪训练方法逐层训练,得到SSDA网络最后一层编码层提取模拟水下异构信息数据中的过完备稀疏特征。
所述步骤3.2中将SSDA网络输出的过完备稀疏特征输入至CNN,CNN中卷积操作提取模拟水下异构信息数据深层特征的过程为 是第c层卷积层的第i个特征向量,kij是二维卷积核,*是卷积操作,γj表示偏置项,表示激活函数。
所述步骤3.2中使用全连接层重建模拟水下异构信息数据,具体过程为:
wf为全连接层的权重、bf为全连接层的偏置,hf表示最后一层池化层的输出,y表示纯净异构信息数据向量。
所述步骤3.3中采用级联微调的方式进一步优化网络参数构建SCSDA模型,具体优化过程为:
为SCSDA模型输出的模拟水下异构信息数据向量,θ={w(l),b(l),w′(l),b′(l),w(c),b(c)},w(c)表示CNN中第c层卷积层的权重,b(c)表示CNN中第c层卷积层的偏置。
所述步骤1中利用任意非水下纯净光学图像数据,以强度为0.3的乘性散斑噪声污染纯净光学图像数据,模拟水下图像数据集;利用非水下纯净音频数据,以信噪比为1dB的加性高斯白噪声污染纯净音频数据,模拟水下音频数据集。
所述步骤2中对水下图像数据进行滑移窗口为8×8,滑移步长为1×1的im2col方法采样,将采样结果变形为向量并进行归一化处理,范围为[0,1];对水下音频数据进行滑移窗口为1×64,滑移步长为1×1的im2col方法采样,将采样结果变形为向量并进行归一化处理,范围为[-1,1]。
所述步骤4中对水下图像数据降噪结果向量进行反归一化处理,同时采用滑移窗口为8×8,滑移步长为1×1的col2im方法处理得到降噪处理后的水下图像数据;对水下音频数据降噪结果向量进行反归一化处理,同时采用滑移窗口为1×64,滑移步长为1×1的col2im方法处理得到降噪处理后的水下音频数据。。
本发明的有益效果在于:由于在神经网络降噪模型中训练过程需要含噪数据作为训练集,对应的纯净数据作为训练目标,而水下异构信息数据在获取和传输过程中会受到噪声的污染,无法获取纯净数据,本发明提出选用无关数据集模拟水下异构信息数据作为训练集;本发明提出构建的SCSDA模型,以SDA构成SSDA网络,提取模拟水下异构信息数据中的过完备稀疏特征,并将SSDA网络最后一层编码层的输出结果作为CNN的输入构成CNN,提取模拟水下异构信息数据深层特征,进一步采用级联微调的方式优化网络参数,实现水下异构信息数据降噪处理;本发明提出构建的SCSDA模型对水下异构信息数据的乘性噪声具有训练集和测试集不相关的特性,同时SCSDA模型具有强稀疏性,可将模拟水下异构信息数据转换到合适的特征空间,在该特征空间下学习的过完备稀疏特征能对水下异构信息数据进行模拟稀疏编码,对水下异构信息数据的加性噪声有一定的自适应能力。本发明提出的基于堆叠式卷积稀疏降噪自编码器的水下异构信息数据降噪方法,处理速度较快,具有良好的盲去噪能力,并能较好地保留水下异构信息数据边缘特征,具有一定的鲁棒性和有效性。
附图说明
图1为本发明方法的流程图。
图2为模拟水下图像数据集示例图。
图3为模拟水下音频数据集时域波形示例图。
图4为提出SCSDA模型的结构图。
图5(a)为SCSDA模型中提取过完备稀疏特征的第一层可视化结果图。
图5(b)为SCSDA模型中提取过完备稀疏特征的第二层可视化结果图。
图5(c)为SCSDA模型中提取过完备稀疏特征的第三层可视化结果图。
图6(a)为测试模拟水下图像数据集中模拟水下图像Plane的纯净图像。
图6(b)为强度为0.1、0.2和0.3的乘性散斑噪声污染的模拟水下图像Plane,以及依次采用Lee滤波算法、K-SVD算法、BM3D方法、SSDA网络和提出SCSDA模型的降噪结果;
图7(a)为测试模拟水下图像数据集中模拟水下图像Stone的纯净图像。
图7(b)为强度为0.1、0.2和0.3的乘性散斑噪声污染的模拟水下图像Stone,以及依次采用Lee滤波算法、K-SVD算法、BM3D方法、SSDA网络和提出SCSDA模型的降噪结果。
图8(a)为测试模拟水下图像数据集中模拟水下图像Fish的纯净图像。
图8(b)为强度为0.1、0.2和0.3的乘性散斑噪声污染的模拟水下图像Fish,以及依次采用Lee滤波算法、K-SVD算法、BM3D方法、SSDA网络和提出SCSDA模型的降噪结果。
图9为水下图像数据盲去噪结果图;
图10(a)为测试模拟水下音频数据集中模拟水下音频Park降噪结果对应的时域波形图。
图10(b)为测试模拟水下音频数据集中模拟水下音频Park降噪结果对应的时域波形图。
图10(c)为测试模拟水下音频Park采用LMS算法的降噪结果。
图10(d)为测试模拟水下音频Park采用多窗谱估计谱减法的降噪结果。
图10(e)为测试模拟水下音频Park采用自适应小波阈值法的降噪结果。
图10(f)为测试模拟水下音频Park采用SSDA网络的降噪结果。
图10(g)为测试模拟水下音频Park采用提出SCSDA模型的降噪结果。
图11(a)为测试模拟水下音频数据集中模拟水下音频Honk降噪结果对应的时域波形图。
图11(b)为测试模拟水下音频Honk对应的时域波形图。
图11(c)为测试模拟水下音频Honk采用LMS算法的降噪结果。
图11(d)为测试模拟水下音频Honk采用多窗谱估计谱减法的降噪结果。
图11(e)为测试模拟水下音频Honk采用自适应小波阈值法的降噪结果。
图11(f)为测试模拟水下音频Honk采用SSDA网络的降噪结果。
图11(g)为测试模拟水下音频Honk采用提出SCSDA模型的降噪结果。
图12(a)为测试模拟水下音频数据集中模拟水下音频Shot降噪结果对应的时域波形图。
图12(b)为测试模拟水下音频Shot对应的时域波形图。
图12(c)为测试模拟水下音频Shot采用LMS算法的降噪结果。
图12(d)为测试模拟水下音频Shot采用多窗谱估计谱减法的降噪结果。
图12(e)为测试模拟水下音频Shot采用自适应小波阈值法的降噪结果。
图12(f)为测试模拟水下音频Shot采用SSDA网络的降噪结果
图12(g)为测试模拟水下音频Shot采用提出SCSDA模型的降噪结果。
图13(a)为水下音频数据Whale盲去噪结果对应的时域波形图。
图13(b)为水下音频Whale采用LMS算法的降噪结果。
图13(c)为水下音频Whale采用多窗谱估计谱减法的降噪结果。
图13(d)为水下音频Whale采用自适应小波阈值法的降噪结果。
图13(e)为水下音频Whale采用SSDA网络的降噪结果。
图13(f)为水下音频Whale采用提出SCSDA模型的降噪结果。
图14(a)为水下音频数据Boat盲去噪结果对应的时域波形图。
图14(b)为水下音频Boat采用LMS算法的降噪结果。
图14(c)为水下音频Boat采用多窗谱估计谱减法的降噪结果。
图14(d)为水下音频Boat采用自适应小波阈值法的降噪结果。
图14(e)为水下音频Boat采用SSDA网络的降噪结果。
图14(f)为水下音频Boat采用提出SCSDA模型的降噪结果。
图15(a)为水下音频数据Purl盲去噪结果对应的时域波形图。
图15(b)为水下音频Purl采用LMS算法的降噪结果。
图15(c)为水下音频Purl采用多窗谱估计谱减法的降噪结果。
图15(d)为水下音频Purl采用自适应小波阈值法的降噪结果。
图15(e)为水下音频Purl采用SSDA的降噪结果。
图15(f)为水下音频Purl采用提出SCSDA模型的降噪结果。
具体实施方式
下面结合附图对本发明做进一步的描述:
实施例1
结合图1,本发明的具体步骤如下:
(1)模拟水下异构信息数据集
由于在神经网络降噪模型中训练过程需要含噪数据作为训练集,对应的纯净数据作为训练目标,而水下异构信息数据在获取和传输过程中会受到噪声的污染,无法获取纯净数据,本发明提出选用无关数据集模拟水下异构信息数据作为训练集。
①模拟水下图像数据集
本发明处理的水下图像数据主要为水下声纳图像数据。由于水下声纳图像数据的成像机理使图像数据产生乘性散斑噪声,这种噪声严重影响了图像数据的处理效果。乘性散斑噪声数学模型为:
g(x,y)=I(x,y)·ηm(x,y)+ηa(x,y)
式中:g(x,y)是含噪图像数据,I(x,y)是纯净图像数据,ηm(x,y)为乘性噪声,ηa(x,y)为加性噪声,由于||I(x,y)·ηm(x,y)||2>>||ηa(x,y)||2,可以忽略加性噪声。
本发明的纯净光学图像数据集采用PubFig数据集,以强度为0.3的乘性散斑噪声污染纯净光学图像数据集,得到模拟水下图像数据集作为训练集,原纯净光学图像数据作为训练目标。图2(a)、图2(b)、图2(c)、图2(d)、图2(e)、图2(f)、图2(g)、图2(h)和图2(i)是模拟水下图像数据集示例图。
②模拟水下音频数据集
由于水下复杂的环境扰动,使音频数据产生加性高斯白噪声,这种噪声严重影响了音频数据的处理效果。加性高斯白噪声的功率谱密度函数由Pn(ω)确定,一维概率密度函数由p(s)确定。具体的数学模型为:
式中:n0是一个常数,单位为W/Hz,s为音频数据,ξ为噪声的数学期望值,σ2为噪声的方差。
本发明的纯净音频数据集采用AISHELL-1数据集,以信噪比为1dB的加性高斯白噪声污染纯净音频数据集,得到模拟水下音频数据集作为训练集,原纯净音频数据集作为训练目标。图3(a)、图3(b)、图3(c)、图3(d)、图3(e)和图3(f)是模拟水下音频数据集时域波形示例图。
(2)对异构信息数据进行预处理
为了统一异构信息数据的输入格式,采取im2col方法采样并进行归一化处理。
图像数据的滑窗卷积核为8×8,滑移步长为1×1;音频数据的滑窗卷积核为1×64,滑移步长为1×1。将im2col方法采样结果变形为长度为64的向量。对异构信息数据向量使用归一化方法将图像数据映射到[0,1],将音频数据映射到[-1,1]。其中,x*为归一化结果,xraw为采样结果,xmax为样本数据的最大值,xmin为样本数据的最小值。
(3)提出构建SCSDA模型
为了使所选用的无关数据集能完成盲去噪训练,同时具有较传统降噪处理方法更快的处理速度,提出构建SCSDA模型。以3层SDA堆叠构成SSDA网络,提取模拟水下异构信息数据中的过完备稀疏特征,将SSDA网络最后一层编码层的输出结果作为CNN的输入,以1层输入层,2层二维卷积层,2层最大池化层以及1层全连接层构成CNN,提取模拟水下异构信息数据深层特征,采用级联微调的方式进一步优化网络参数,提出构建的SCSDA模型对水下异构信息数据的乘性噪声具有训练集和测试集不相关的特性,同时模型具有强稀疏性,对水下异构信息数据的加性噪声有一定的自适应能力。图4是提出SCSDA模型的结构图。
(3.1)SSDA网络的构成
SSDA网络由3层SDA堆叠而成,SDA可以在提取水下异构信息数据的过完备稀疏特征的同时保持一定的鲁棒性。具体的训练过程如下:
SDA的编码过程为:
SDA的解码过程为:
式中:x是模拟水下异构信息数据,表示SDA重建的模拟水下异构信息数据,SDA学习的参数为θSDA={w,w′,b,b′},w和b分别是SDA编码层权重和偏置,w′和b′分别是SDA解码层权重和偏置,h为SDA的隐层,e(·)表示编码,d(·)表示解码。
SSDA网络通过增加自编码网络深度,提升了SDA的学习能力,以逐步贪婪训练方法训练每一层SDA,前一层SDA隐层的输出作为后一层SDA的输入,依次连接至输出层。
SSDA网络的训练过程可以描述为:
(3.2)CNN的构成
CNN中的卷积层是对SSDA网络最后一层编码层提取的模拟水下异构信息数据中的过完备稀疏特征进行进一步的特征提取,得到模拟水下异构信息数据深层特征,从而更好地保持模拟水下异构信息数据的边缘特征,克服传统SSDA网络过度平滑边缘特征的缺陷。
CNN中卷积操作提取模拟水下异构信息数据深层特征的过程为:
采用最大池化操作,对模拟水下异构信息数据深层特征进行降维操作,进一步提取模拟水下异构信息数据的深层特征,并加快运行速度,缓解过拟合现象,提升鲁棒性。
最大池化操作表示为:
使用全连接层将深层特征重建模拟水下异构信息数据向量。具体过程可以描述为:
(3.3)级联微调
采用级联微调的方法进一步优化网络参数,调整SCSDA模型至收敛。具体过程描述为:
(3.4)SCSDA模型对乘性噪声具有训练集和测试集不相关的特性
水下异构信息数据的乘性噪声矩阵形式为:
G=I·η
式中:G表示乘性噪声污染的水下异构信息数据,I表示假定纯净的水下异构信息数据,η表示散斑噪声分布。
对G=I·η左右两边同时乘系数W=η-1,可得:
G·W=Iη·W=Iη·η-1=I
通过以上分析,仅需要学习水下异构信息数据的乘性噪声分布即可对任意水下异构信息数据进行乘性噪声降噪处理。图5(a)、图5(b)和图5(c)为SCSDA模型中提取过完备稀疏特征的可视化结果,进一步证明提出的SCSDA模型可以有效地学习乘性噪声分布,所以本发明提出的SCSDA模型对水下异构信息数据的乘性噪声具有训练集和测试集不相关的特性。
(3.5)SCSDA模型对加性噪声具有一定的自适应能力
为了验证提出的SCSDA模型对水下异构信息数据的加性噪声具有一定的自适应能力,采用与AISEHLL-1数据集无关的UrbanSound8K数据集作为测试纯净音频数据集,以信噪比为1dB的加性高斯白噪声污染测试纯净音频数据集,得到测试模拟水下音频数据集。由于存在测试纯净音频数据集,故可采用峰值信噪比(Peak Signal to Noise Ratio,PSNR)作为评价标准。表1提供了测试模拟水下音频数据集在稀疏度为SP=0.05、SP=0.01、SP=0.005、SP=0.001和SP=0.0005的情况下,降噪处理后的PSNR评价值。
表1测试模拟水下音频数据在不同稀疏度下降噪处理后的PSNR评价值
从表1中可以看出,提出的SCSDA模型在不同稀疏度下,对与训练集无关的测试模拟水下音频数据降噪结果的PSNR均高于测试模拟水下音频数据本身,因此,本发明提出的SCSDA模型具有强稀疏性,可将模拟水下异构信息数据转换到合适的特征空间,在该特征空间下学习的过完备稀疏特征能对水下异构信息数据进行模拟稀疏编码,对水下异构信息数据的加性噪声有一定的自适应能力。
(4)完成SCSDA模型的水下异构信息数据降噪处理
将水下异构信息数据作为测试集输入至SCSDA模型中,利用SSDA网络提取水下异构信息数据中的过完备稀疏特征,进一步利用CNN提取水下异构信息数据深层特征,得到较好的水下异构信息数据降噪结果向量。对降噪结果向量进行反归一化处理及col2im方法处理,即对水下图像数据降噪结果向量进行反归一化处理,同时采用滑移窗口为8×8,滑移步长为1×1的col2im方法处理得到降噪处理后的水下图像数据。对水下音频数据降噪结果向量进行反归一化处理,同时采用滑移窗口为1×64,滑移步长为1×1的col2im方法处理得到降噪处理后的水下音频数据。最终完成SCSDA模型的水下异构信息数据降噪。
为验证本发明提出的一种基于SCSDA模型的水下异构信息数据降噪方法的有效性,将SCSDA模型的相关参数设置为:SSDA网络隐层为3层,隐层神经元个数分别为256、128和64。卷积层和池化层均为2层。卷积层的卷积核尺寸均为3×3,步长为1×1。卷积层卷积核个数分别为128和64。池化层均为2×2的最大池化操作。全连接层隐层神经元个数为64。
采用与PubFig数据集无关的BSD68数据集作为测试纯净图像数据集,分别以强度为0.1、0.2和0.3的乘性散斑噪声进行污染,得到测试模拟水下图像数据集。图6(a)和图6(b)为测试模拟水下图像数据集中模拟水下图像Plane的降噪结果。图7(a)和图7(b)为测试模拟水下图像数据集中模拟水下图像Stone的降噪结果。图8(a)和图8(b)为测试模拟水下图像数据集中模拟水下图像Fish的降噪结果。图6(a)、图7(a)和图8(a)是Plane、Stone和Fish的纯净图像。图6(b)是强度为0.1、0.2和0.3的乘性散斑噪声污染的模拟水下图像Plane,以及依次采用Lee滤波算法、K-SVD算法(K-SVD Algorithm)、三维块匹配去噪方法(Block-matching and 3D Method,BM3D)、SSDA网络和提出的SCSDA模型的降噪结果。图7(b)是强度为0.1、0.2和0.3的乘性散斑噪声污染的模拟水下图像Stone,以及依次采用Lee滤波算法、K-SVD算法、BM3D方法、SSDA网络和提出的SCSDA模型的降噪结果。图8(b)是强度为0.1、0.2和0.3的乘性散斑噪声污染的模拟水下图像Fish,以及依次采用Lee滤波算法、K-SVD算法、BM3D方法、SSDA网络和提出的SCSDA模型的降噪结果。
为了定量分析降噪结果的性能,表2给出了图6(a)、图6(b)、图7(a)、图7(b)图8(a)和图8(b)中各算法降噪结果的PSNR评价值。
表2各算法降噪结果的PSNR评价值
从图6(a)、图6(b)、图7(a)、图7(b)图8(a)、图8(b)以及表2可以看出,Lee滤波算法、K-SVD算法、BM3D方法、SSDA网络和提出的SCSDA模型均具有一定的降噪能力,同时定量分析中各算法的PSNR评价值均高于测试模拟水下图像数据的PSNR评价值。在所有算法中提出的SCSDA模型对模拟水下图像数据具有更好的降噪处理性能,也进一步验证了SCSDA模型对乘性噪声具有训练集和测试集不相关的特性。
由于提出的SCSDA模型对乘性噪声具有训练集和测试集不相关的特性,图9给出真实的水下图像数据依次采用Lee滤波算法、K-SVD算法、BM3D方法、SSDA网络和提出的SCSDA模型的盲去噪结果。
由于水下图像数据在获取和传输过程中会受到噪声的污染,无法获取纯净数据,为了定量分析提出的SCSDA模型对水下图像数据的盲去噪性能,利用等效视数(EquivalentNumber of Looks,ENL)评价降噪处理后的效果,表3给出图9中各算法降噪结果的ENL评价值。
表3图9中各算法降噪结果的ENL评价值
水下图像数据 | 5.2503 | 4.3852 | 4.4571 | 4.7344 | 4.8384 | 2.4923 |
Lee滤波算法 | 7.4828 | 6.1557 | 4.9024 | 5.5706 | 5.8662 | 3.2404 |
K-SVD算法 | 8.2981 | 6.7145 | 4.9030 | 5.3814 | 5.8229 | 3.1166 |
BM3D方法 | 8.7053 | 6.8102 | 5.0498 | 5.5026 | 5.8422 | 3.1865 |
SSDA网络 | 8.5830 | 6.9868 | 4.9637 | 6.0387 | 6.6026 | 3.4151 |
SCSDA模型 | 9.1453 | 7.6795 | 5.7541 | 6.1426 | 7.4786 | 3.5404 |
从图9以及表3中可以看出,由于水下声纳图像数据有高强度的乘性散斑噪声,在降噪过程中,Lee滤波算法、K-SVD算法的降噪结果均含大量的散斑噪声残余,BM3D方法、SSDA网络的降噪结果中噪声残余较少,但平滑边缘特征严重,提出的SCSDA模型在去除大量的噪声的同时保留了更多的图像边缘特征。同时定量分析中提出的SCSDA模型ENL评价值均高于Lee滤波算法、K-SVD算法、BM3D方法和SSDA网络的ENL评价值。因此,本发明提出的SCSDA模型对水下图像数据具有更好的降噪处理性能和盲去噪能力。
为进一步验证提出的SCSDA模型对模拟水下音频数据具有较好的降噪性能,采用与AISEHLL-1数据集无关的UrbanSound8K数据集作为测试纯净音频数据集,以信噪比为1dB的加性高斯白噪声进行污染,得到测试模拟水下音频数据集。图10(a)、图10(b)、图10(c)、图10(d)、图10(e)、图10(f)和图10(g)为测试模拟水下音频数据集中模拟水下音频Park的降噪结果。图11(a)、图11(b)、图11(c)、图11(d)、图11(e)、图11(f)和图11(g)为测试模拟水下音频数据集中模拟水下音频Honk的降噪结果。图12(a)、图12(b)、图12(c)、图12(d)、图12(e)、图12(f)和图12(g)为测试模拟水下音频数据集中模拟水下音频Shot的降噪结果。图10(a)、图11(a)和图12(a)是音频Park、音频Honk和音频Shot对应的时域波形图。图10(b)、图11(b)和图12(b)是测试模拟水下音频Park、音频Honk、音频Shot对应的时域波形图。图10(c)、图10(d)、图10(e)、图10(f)和图10(g)分别是测试模拟水下音频Park采用最小均方算法(Least Mean Square Algorithm,LMS)、多窗谱估计谱减法、自适应小波阈值法、SSDA网络和提出的SCSDA模型的降噪结果。图11(c)、图11(d)、图11(e)、图11(f)和图11(g)分别是测试模拟水下音频Honk采用LMS算法、多窗谱估计谱减法、自适应小波阈值法、SSDA网络和提出的SCSDA模型的降噪结果。图12(c)、图12(d)、图12(e)、图12(f)和图12(g)分别是测试模拟水下音频Shot采用LMS算法、多窗谱估计谱减法、自适应小波阈值法、SSDA网络和提出的SCSDA模型的降噪结果。
为了定量分析降噪结果的性能,表4提供了图10(a)、图10(b)、图10(c)、图10(d)、图10(e)、图10(f)、图10(g)、图11(a)、图11(b)、图11(c)、图11(d)、图11(e)、图11(f)、图11(g)、图12(a)、图12(b)、图12(c)、图12(d)、图12(e)、图12(f)和图12(g)中各算法降噪结果的PSNR评价值。
表4各算法降噪结果的PSNR评价值
音频 | Park | Honk | Shot |
测试模拟水下音频数据 | 21.7224 | 19.4522 | 24.2404 |
LMS算法 | 30.6880 | 9.4223 | 6.2724 |
多窗谱估计谱减法 | 22.9010 | 26.5751 | 30.2064 |
自适应小波阈值法 | 25.3520 | 25.8106 | 28.8233 |
SSDA网络 | 25.6187 | 25.7690 | 27.6404 |
SCSDA模型 | 26.8281 | 25.9648 | 30.0858 |
从图10(a)、图10(b)、图10(c)、图10(d)、图10(e)、图10(f)、图10(g)、图11(a)、图11(b)、图11(c)、图11(d)、图11(e)、图11(f)、图11(g)、图12(a)、图12(b)、图12(c)、图12(d)、图12(e)、图12(f)、图12(g)和表4可以看出,LMS算法对音频数据的降噪性能差异较大,针对一些音频数据存在破坏特征结构的缺点,多窗谱估计谱减法、自适应小波阈值法以及SSDA网络能起到一定的降噪性能,但是多窗谱估计谱减法和自适应小波阈值法在小振幅部分降噪结果却并不理想,很多边缘特征在降噪过程中被去除,SSDA网络的降噪结果中则残留一定的噪声,而提出的SCSDA模型降噪处理后的模拟水下音频数据可以很好地保留原始纯净音频数据特征。同时定量分析中各算法的PSNR评价值均高于测试模拟水下音频数据的PSNR评价值。相较于LMS算法、多谱窗估计谱减法、自适应小波阈值法以及SSDA网络具备更稳定的降噪处理性能。
由于提出的SCSDA模型对水下异构信息数据的加性噪声具有一定的自适应能力,图13(a)、图13(b)、图13(c)、图13(d)、图13(e)和图13(f)分别给出真实的水下音频Whale依次采用LMS算法、多窗谱估计谱减法、自适应小波阈值法、SSDA网络和提出的SCSDA模型的盲去噪结果。图14(a)、图14(b)、图14(c)、图14(d)、图14(e)和图14(f)分别给出真实的水下音频Boat依次采用LMS算法、多窗谱估计谱减法、自适应小波阈值法、SSDA网络和提出的SCSDA模型的盲去噪结果。图15(a)、图15(b)、图15(c)、图15(d)、图15(e)和图15(f)分别给出真实的水下音频Purl依次采用LMS算法、多窗谱估计谱减法、自适应小波阈值法、SSDA网络和提出的SCSDA模型的盲去噪结果。图13(a)、图14(a)、图15(a)是水下音频Whale、水下音频Boat和水下音频Purl对应的时域波形图。图13(b)、图13(c)、图13(d)、图13(e)和图13(f)分别是水下音频Whale采用LMS算法、多窗谱估计谱减法、自适应小波阈值法、SSDA网络和提出的SCSDA模型的盲去噪结果。图14(b)、图14(c)、图14(d)、图14(e)和图14(f)分别水下音频Boat采用LMS算法、多窗谱估计谱减法、自适应小波阈值法、SSDA网络和提出的SCSDA模型的盲去噪结果。图15(b)、图15(c)、图15(d)、图15(e)和图15(f)分别水下音频Purl采用LMS算法、多窗谱估计谱减法、自适应小波阈值法、SSDA网络和提出的SCSDA模型的盲去噪结果。
从图13(a)、图13(b)、图13(c)、图13(d)、图13(e)、图13(f)、图14(a)、图14(b)、图14(c)、图14(d)、图14(e)、图14(f)和图15(a)、图15(b)、图15(c)、图15(d)、图15(e)和图15(f)可以看出,LMS算法在对水下音频数据进行降噪处理的过程中,破坏了水下音频数据的特征结构,降噪效果不明显。多窗谱估计谱减法、自适应小波阈值法虽保留了一些水下音频数据的有用特征,但是却大大削减了水下音频数据的振幅,导致音频质量不佳。SSDA网络起到了一定的降噪效果,但是并未明显保留水下音频数据的有用特征。而本发明提出的SCSDA模型降噪处理后的水下音频数据很好地保留了音频数据结构特征且去除了一定的噪声,在此基础上增大了音频数据的振幅,使得有用特征更加突出,所以SCSDA模型更适于对水下音频数据盲去噪处理。
由于水下音频数据在获取和传输过程中会受到噪声的污染,无法获取纯净数据,所以采用平均意见得分(Mean Opinion Score,MOS)方法,对水下音频数据的降噪效果做主观的评价。MOS法先给受众者听一些不同质量的音频数据作为参考,再听待测试的水下音频数据,根据水下音频数据的舒适度和可懂度为待测水下音频数据打分。
表5为MOS的打分标准。
表6是图13(a)、图13(b)、图13(c)、图13(d)、图13(e)、图13(f)、图14(a)、图14(b)、图14(c)、图14(d)、图14(e)、图14(f)和图15(a)、图15(b)、图15(c)、图15(d)、图15(e)和图15(f)中水下音频数据盲去噪结果的MOS评价值,实验选取实验室老师和学生作为受众者,对听到的18段音频数据进行打分。
表5MOS打分标准
MOS得分 | 语音等级 | 听者感受失真度 |
5 | 优 | 毫无感受 |
4 | 良 | 稍微有感受 |
3 | 中 | 有感受,有点讨厌 |
2 | 差 | 感受明显,感觉讨厌但可容忍 |
1 | 坏 | 不可容忍 |
表6水下音频数据盲去噪结果的MOS评价值
音频 | Whale | Boat | Purl |
水下音频数据 | 3.2 | 4.2 | 3.8 |
LMS算法 | 2.4 | 4.0 | 2.3 |
多窗谱估计谱减法 | 2.1 | 2.7 | 2.0 |
自适应小波阈值法 | 2.5 | 4.3 | 3.2 |
SSDA网络 | 3.6 | 4.4 | 4.0 |
SCSDA模型 | 4.1 | 4.5 | 4.3 |
从表6中可以看出,本发明提出的SCSDA模型降噪处理水下音频数据的MOS值最高,对水下音频数据的降噪结果较好。
在此基础上,为验证本发明提出的SCSDA模型具有更高的处理效率,对不同尺寸图像数据计算各算法单次降噪处理所需的平均时间,对不同采样点数的音频数据计算各算法单次降噪处理所需的平均时间。
表7是图像数据单次降噪处理所需的平均时间。
表8是音频数据单次降噪处理所需的平均时间。
表7图像数据单次降噪处理所需的平均时间(秒)
尺寸 | 481*321 | 256*256 | 150*150 | 100*100 |
Lee滤波法 | 3.2080 | 1.5590 | 0.6134 | 0.2684 |
K-SVD算法 | 420.9606 | 170.2375 | 58.3106 | 25.2870 |
BM3D方法 | 34.8539 | 13.9272 | 5.3702 | 2.1650 |
SSDA网络 | 0.2311 | 0.0757 | 0.0211 | 0.0094 |
SCSDA模型 | 2.1191 | 0.8893 | 0.1631 | 0.0694 |
表8音频数据单次降噪处理所需的平均时间(秒)
采样点数 | 10000 | 20000 | 30000 | 40000 |
LMS算法 | 0.2810 | 0.3430 | 0.3900 | 0.5580 |
多窗谱估计谱减法 | 0.6070 | 0.8780 | 1.2680 | 1.5450 |
自适应小波阈值法 | 0.6720 | 1.0840 | 1.3160 | 1.5790 |
SSDA网络 | 0.0110 | 0.0199 | 0.0240 | 0.0297 |
SCSDA模型 | 0.0891 | 0.1784 | 0.2650 | 0.3507 |
从表7和表8可以看出,当使用相同的硬件环境(本发明在64位Windows10操作系统,NVIDIA TITAN Xp显卡,i7-7820X处理器,32G内存以及tensorflow1.9.0版本)下运行时,提出的SCSDA模型处理图像数据的平均迭代时间明显优于Lee滤波算法、K-SVD算法和BM3D方法,处理音频数据的平均迭代时间明显优于LMS滤波法、多窗谱估计谱减法和自适应小波阈值法。由于提出的SCSDA模型包含3层SDA堆叠构成的SSDA网络,所以处理图像数据和音频数据的平均迭代时间均略逊于SSDA网络。因此,本发明提出的SCSDA模型能更有效地利用计算资源,降低计算开销。
通过对水下异构信息数据的实验比较分析,验证了本发明提出的基于堆叠式卷积稀疏降噪自编码器的水下异构信息数据降噪方法,处理速度较快,具有良好的盲去噪能力,并能较好地保留水下异构信息数据边缘特征,具有一定的鲁棒性和有效性。
实施例2
本发明的目的在于提供一种具有较快处理速度,并具有良好的盲去噪能力的基于堆叠式卷积稀疏降噪自编码器的水下异构信息数据降噪方法。
本发明在实现过程中包括如下步骤:
(1)模拟水下异构信息数据集:①利用已知的纯净光学图像数据进行高强度乘性散斑噪声污染模拟水下图像数据集;②利用已知的纯净音频数据进行高强度加性高斯白噪声污染模拟水下音频数据集;
(2)对异构信息数据进行预处理:①对异构信息数据进行im2col方法采样;②将采样结果进行归一化处理;
(3)提出构建SCSDA模型:①以3层SDA堆叠构成SSDA网络,提取模拟水下异构信息数据中的过完备稀疏特征;②将SSDA网络最后一层编码层的输出结果作为CNN的输入,以1层输入层,2层二维卷积层,2层最大池化层以及1层全连接层构成CNN,提取模拟水下异构信息数据深层特征;③采用级联微调的方式进一步优化网络参数,构建SCSDA模型;
(4)完成SCSDA模型的水下异构信息数据降噪处理:①将水下异构信息数据作为测试集,利用SCSDA模型对其进行降噪处理得到降噪结果向量;②对降噪结果向量进行反归一化处理及col2im方法处理,得到降噪处理后的水下异构信息数据。
本发明还可以包括:
1.在步骤(1)中利用任意非水下纯净光学图像数据,以强度为0.3的乘性散斑噪声污染纯净光学图像数据,模拟水下图像数据集。利用非水下纯净音频数据,以信噪比为1dB的加性高斯白噪声污染纯净音频数据,模拟水下音频数据集。
2.在步骤(2)中对水下图像数据进行滑移窗口为8×8,滑移步长为1×1的im2col方法采样,将采样结果变形为向量并进行归一化处理,范围为[0,1]。对水下音频数据进行滑移窗口为1×64,滑移步长为1×1的im2col方法采样,将采样结果变形为向量并进行归一化处理,范围为[-1,1]。
3.在步骤(3)中SSDA网络训练过程为:
L(·)表示损失函数,θ(l)={w(l),b(l),w′(l),b′(l)},w(l)、b(l)、w′(l)、b′(l)分别表示第l层SSDA编码层权重,第l层SSDA编码层偏置,第l层SSDA解码层权重和第l层SSDA解码层偏置;表示第l层SSDA编码层的隐层,表示第l层SSDA编码层隐层的重建结果;ρ是稀疏性参数,表示隐层上第j号神经元的所对应的平均激活值;表示第l层隐层的相对熵,相对熵可以保证每一隐层的稀疏性;β和λ为约束权重项。SSDA网络以逐步贪婪训练方法逐层训练,得到SSDA网络最后一层编码层提取模拟水下异构信息数据中的过完备稀疏特征。
4.所述步骤(3)中将SSDA网络输出的过完备稀疏特征输入至CNN,CNN中卷积操作提取模拟水下异构信息数据深层特征的过程为 是第c层卷积层的第i个特征向量,kij是二维卷积核,*是卷积操作,γj表示偏置项,表示激活函数。
7.所述步骤(3)中采用级联微调进一步优化网络参数构建SCSDA模型,具体过程为: 为SCSDA模型输出的模拟水下异构信息数据向量,θ={w(l),b(l),w′(l),b′(l),w(c),b(c)},w(c)表示CNN中第c层卷积层的权重,b(c)表示CNN中第c层卷积层的偏置。
8.所述步骤(3)中提出构建的SCSDA模型对水下异构信息数据的乘性噪声具有训练集和测试集不相关的特性,同时SCSDA模型具有强稀疏性,可将模拟水下异构信息数据转换到合适的特征空间,在该特征空间下学习的过完备稀疏特征能对水下异构信息数据进行模拟稀疏编码,对水下异构信息数据的加性噪声有一定的自适应能力。
9.在步骤(4)中将水下异构信息数据作为测试集输入至SCSDA模型中,利用SSDA网络提取水下异构信息数据中的过完备稀疏特征,进一步利用CNN提取水下异构信息数据深层特征,得到较好的水下异构信息数据降噪结果向量。
10.所述步骤(4)中对水下图像数据降噪结果向量进行反归一化处理,同时采用滑移窗口为8×8,滑移步长为1×1的col2im方法处理得到降噪处理后的水下图像数据。对水下音频数据降噪结果向量进行反归一化处理,同时采用滑移窗口为1×64,滑移步长为1×1的col2im方法处理得到降噪处理后的水下音频数据。最终完成SCSDA模型的水下异构信息数据降噪。
本发明为了取得良好的水下异构信息数据盲去噪效果,提出一种基于堆叠式卷积稀疏降噪自编码器的水下异构信息数据降噪方法。即由于在神经网络降噪模型中训练过程需要含噪数据作为训练集,对应的纯净数据作为训练目标,而水下异构信息数据在获取和传输过程中会受到噪声的污染,无法获取纯净数据,提出选用无关数据集模拟水下异构信息数据作为训练集;为了统一异构信息数据的输入格式,利用im2col方法对异构信息数据进行采样,并进行归一化处理;在此基础上,为了使所选用的无关数据集能完成盲去噪训练,提出构建SCSDA模型,以稀疏降噪自编码器构成堆叠式稀疏降噪自编码器网络,提取模拟水下异构信息数据中的过完备稀疏特征,并将SSDA网络最后一层编码层的输出结果作为卷积神经网络的输入构成CNN,提取模拟水下异构信息数据深层特征,进一步采用级联微调的方式优化网络参数,提出构建的SCSDA模型对水下异构信息数据的乘性噪声具有训练集和测试集不相关的特性,同时模型具有强稀疏性,对水下异构信息数据的加性噪声有一定的自适应能力;将水下异构信息数据作为测试集输入SCSDA模型,经过反归一化处理及col2im方法处理,实现较好的水下异构信息数据降噪。本发明提出的基于堆叠式卷积稀疏降噪自编码器的水下异构信息数据降噪方法,处理速度较快,具有良好的盲去噪能力,并能较好地保留水下异构信息数据边缘特征,具有一定的鲁棒性和有效性。
Claims (10)
1.一种水下异构信息数据降噪方法,其特征在于,具体的实现步骤为:
步骤1.模拟水下异构信息数据集,利用已知的纯净光学图像数据进行高强度乘性散斑噪声污染模拟水下图像数据集,利用已知的纯净音频数据进行高强度加性高斯白噪声污染模拟水下音频数据集;
步骤2.对异构信息数据进行预处理,对异构信息数据进行im2col方法采样,将采样结果进行归一化处理;
步骤3.提取模拟水下异构信息数据中的过完备稀疏特征和水下异构信息数据深层特征,构建SCSDA模型;
步骤4.完成SCSDA模型的水下异构信息数据降噪处理,将水下异构信息数据作为测试集,利用SCSDA模型对其进行降噪处理得到降噪结果向量;对降噪结果向量进行反归一化处理及col2im方法处理,得到降噪处理后的水下异构信息数据。
2.根据权利要求1所述的一种水下异构信息数据降噪方法,其特征在于,所述步骤3的具体过程为:
步骤3.1.以3层SDA堆叠构成SSDA网络,提取模拟水下异构信息数据中的过完备稀疏特征;
步骤3.2.将SSDA网络最后一层编码层的输出结果作为CNN的输入,以1层输入层,2层二维卷积层,2层最大池化层以及1层全连接层构成CNN,提取模拟水下异构信息数据深层特征;
步骤3.3.采用级联微调的方式进一步优化网络参数,构建SCSDA模型。
3.根据权利要求2所述的一种水下异构信息数据降噪方法,其特征在于,所述步骤3.1的SSDA网络的训练过程为:
8.根据权利要求7所述的一种水下异构信息数据降噪方法,其特征在于:所述步骤1中利用任意非水下纯净光学图像数据,以强度为0.3的乘性散斑噪声污染纯净光学图像数据,模拟水下图像数据集;利用非水下纯净音频数据,以信噪比为1dB的加性高斯白噪声污染纯净音频数据,模拟水下音频数据集。
9.根据权利要求8所述的一种水下异构信息数据降噪方法,其特征在于:所述步骤2中对水下图像数据进行滑移窗口为8×8,滑移步长为1×1的im2col方法采样,将采样结果变形为向量并进行归一化处理,范围为[0,1];对水下音频数据进行滑移窗口为1×64,滑移步长为1×1的im2col方法采样,将采样结果变形为向量并进行归一化处理,范围为[-1,1]。
10.根据权利要求9所述的一种水下异构信息数据降噪方法,其特征在于:所述步骤4中对水下图像数据降噪结果向量进行反归一化处理,同时采用滑移窗口为8×8,滑移步长为1×1的col2im方法处理得到降噪处理后的水下图像数据;对水下音频数据降噪结果向量进行反归一化处理,同时采用滑移窗口为1×64,滑移步长为1×1的col2im方法处理得到降噪处理后的水下音频数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910633686.0A CN110490816B (zh) | 2019-07-15 | 2019-07-15 | 一种水下异构信息数据降噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910633686.0A CN110490816B (zh) | 2019-07-15 | 2019-07-15 | 一种水下异构信息数据降噪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110490816A CN110490816A (zh) | 2019-11-22 |
CN110490816B true CN110490816B (zh) | 2022-11-15 |
Family
ID=68547045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910633686.0A Active CN110490816B (zh) | 2019-07-15 | 2019-07-15 | 一种水下异构信息数据降噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110490816B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111144303A (zh) * | 2019-12-26 | 2020-05-12 | 华北电力大学(保定) | 基于改进去噪自编码器的电力线信道传输特性识别方法 |
CN111401236A (zh) * | 2020-03-16 | 2020-07-10 | 西北工业大学 | 基于自编码神经网络的水声信号去噪方法 |
CN111543984B (zh) * | 2020-04-13 | 2022-07-01 | 重庆邮电大学 | 一种基于ssda的脑电信号的眼电伪迹去除方法 |
CN112215054B (zh) * | 2020-07-27 | 2022-06-28 | 西北工业大学 | 一种用于水声信号去噪的深度生成对抗方法 |
CN117316175B (zh) * | 2023-11-28 | 2024-01-30 | 山东放牛班动漫有限公司 | 一种动漫数据智能编码存储方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426145A (zh) * | 2012-05-23 | 2013-12-04 | 中国科学院声学研究所 | 一种基于多分辨分析的合成孔径声纳相干斑噪声抑制方法 |
CN109785249A (zh) * | 2018-12-22 | 2019-05-21 | 昆明理工大学 | 一种基于持续性记忆密集网络的图像高效去噪方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10726525B2 (en) * | 2017-09-26 | 2020-07-28 | Samsung Electronics Co., Ltd. | Image denoising neural network architecture and method of training the same |
-
2019
- 2019-07-15 CN CN201910633686.0A patent/CN110490816B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426145A (zh) * | 2012-05-23 | 2013-12-04 | 中国科学院声学研究所 | 一种基于多分辨分析的合成孔径声纳相干斑噪声抑制方法 |
CN109785249A (zh) * | 2018-12-22 | 2019-05-21 | 昆明理工大学 | 一种基于持续性记忆密集网络的图像高效去噪方法 |
Non-Patent Citations (2)
Title |
---|
基于改进栈式稀疏去噪自编码器的图像去噪;马红强等;《计算机工程与应用》;20180215(第04期);全文 * |
海洋声学目标探测技术研究现状和发展趋势;杨益新等;《水下无人系统学报》;20181015(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN110490816A (zh) | 2019-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490816B (zh) | 一种水下异构信息数据降噪方法 | |
CN110599409B (zh) | 基于多尺度卷积组与并行的卷积神经网络图像去噪方法 | |
CN109841226B (zh) | 一种基于卷积递归神经网络的单通道实时降噪方法 | |
CN111242862B (zh) | 多尺度融合并行稠密残差卷积神经网络图像去噪方法 | |
CN106204468B (zh) | 一种基于ReLU卷积神经网络的图像去噪方法 | |
CN111028163A (zh) | 一种基于卷积神经网络的联合图像去噪与弱光增强方法 | |
CN110706181B (zh) | 一种基于多尺度膨胀卷积残差网络的图像去噪方法及系统 | |
CN114140353A (zh) | 一种基于通道注意力的Swin-Transformer图像去噪方法及系统 | |
CN112085677A (zh) | 一种图像处理方法、系统和计算机存储介质 | |
CN112270654A (zh) | 基于多通道gan的图像去噪方法 | |
CN111260591B (zh) | 一种基于注意力机制的图像自适应去噪方法 | |
CN110533614B (zh) | 一种结合频域和空域的水下图像增强方法 | |
CN111723701A (zh) | 一种水中目标识别方法 | |
CN111598804B (zh) | 基于深度学习的图像多级去噪方法 | |
CN106204482A (zh) | 基于加权稀疏的混合噪声去除方法 | |
CN111007566A (zh) | 一种曲率驱动扩散全卷积网络地震数据坏道重建与去噪方法 | |
CN116051408B (zh) | 一种基于残差自编码的图像深度去噪方法 | |
CN112801889A (zh) | 图像去噪方法、系统、设备及存储介质 | |
CN114742911A (zh) | 图像压缩感知重建方法、系统、设备及介质 | |
CN112530449B (zh) | 基于仿生小波变换的语音增强方法 | |
CN114283829A (zh) | 一种基于动态门控卷积循环网络的语音增强方法 | |
CN111047537A (zh) | 一种图像去噪中恢复细节的系统 | |
CN111489306A (zh) | 基于强化学习的图像去噪方法 | |
CN115273886A (zh) | 一种单通道语音增强的方法 | |
CN115187855A (zh) | 一种海底底质声呐图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |