CN109800700A - 一种基于深度学习的水下声信号目标分类识别方法 - Google Patents

一种基于深度学习的水下声信号目标分类识别方法 Download PDF

Info

Publication number
CN109800700A
CN109800700A CN201910036689.6A CN201910036689A CN109800700A CN 109800700 A CN109800700 A CN 109800700A CN 201910036689 A CN201910036689 A CN 201910036689A CN 109800700 A CN109800700 A CN 109800700A
Authority
CN
China
Prior art keywords
sound signal
underwater sound
algorithm
target classification
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910036689.6A
Other languages
English (en)
Other versions
CN109800700B (zh
Inventor
王兴梅
刘安华
孟稼祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201910036689.6A priority Critical patent/CN109800700B/zh
Publication of CN109800700A publication Critical patent/CN109800700A/zh
Application granted granted Critical
Publication of CN109800700B publication Critical patent/CN109800700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明属于水下声信号处理技术领域,具体涉及一种基于深度学习的水下声信号目标分类识别方法。本发明包括以下步骤:(1)原始水下声信号通过Gammatone滤波倒谱系数GFCC算法进行特征提取;(2)提出利用改进经验模态分解MEMD算法提取瞬时能量以及瞬时频率,并与GFCC算法提取的特征值进行融合,构建特征矩阵;(3)建立高斯混合模型GMM,保留水下声信号目标的个性特征;(4)利用深度神经网络DNN完成水下目标分类识别。本发明可以解决传统水下声信号目标分类识别方法特征提取单一,抗噪能力差的问题,并且能有效的提高水下声信号目标分类识别的准确率,在目标声信号较弱、距离较远等情况下仍然具有一定的适应性。

Description

一种基于深度学习的水下声信号目标分类识别方法
技术领域
本发明属于水下声信号处理技术领域,具体涉及一种基于深度学习的水下声信号目标分类识别方法。
背景技术
海洋资源的开发和利用是实现可持续发展重要的途径,水下目标分类识别技术可以帮助更好的进行海洋生物调查和海洋勘探等。海洋环境复杂多变,电磁波在水中有很大衰减,而绝大部分水下目标都具有自己特定的声学特征,因此选择声波这种信号形式对水下目标进行研究是更为合适的。在军事领域,水下声信号目标分类识别技术能准确、及时、隐蔽地检测出水中目标,为各个系统和指挥部门提供准确的信息,对协同作战和抢占作战先机意义重大;在非军事领域,水下声信号目标分类识别技术能用于监测海上交通情况,进行海上交通管理,同时能得到海洋生物类别及生活习性等相关信息,对海洋生物保护也有非常重要的意义。
水下目标的分类识别属于模式识别的范畴。模式识别又称作模式分类,模式是某一类客观事物或者现象的类别总称,而模式中具体的一个对象可以看作一个样本。对于水下目标而言,船舶、海洋动物等都可以作为模式,而通过被动声纳获取的某一艘船舶或者某一个海洋动物的声音就是一个样本信号。分类识别的目的就是利用计算机实现对能够发出声音信号的不同类别水下目标的自动辨识。目前,国内外对于水下目标分类识别的主要研究方法是基于现代信号与信息处理理论的统计模式识别方法。基于这类方法的水下目标分类识别系统一般由数据采集、预处理、特征提取和分类决策组成。其中特征提取和分类决策在水下目标分类识别中起到至关重要的作用。
特征提取是从水下声信号中提取出能代表各类声源特征的过程。国内外学者对水下目标的特征提取进行了深入研究,并取得了重要的成果。其中在已有的文献中最著名和效果最好的分类方法主要包括:1.基于时域波形分析:Meng Qingxin,Yang Shie.A wavestructure based method for recognition of marine acoustic targetsignals.Journal of the Acoustical Society of America,2015,137(4):2242-2242.提出提取螺旋桨旋转的零相交特征和峰间幅值特征方法,有效的应用在噪声相对较小的水下目标分类识别中;2.基于时频分析的特征提取方法:Wang Wenbo,Li Sichun,YangJianshe,Liu Zhao.Feature extraction of underwater target in auditorysensation area based on MFCC.2016IEEE/OES China Ocean Acoustics(COA),Harbin,China,2016:1-6.提出利用梅尔频率倒谱系数Mel Frequency Cepstrum Coefficent即MFCC方法所提取的特征对水下目标分类识别是有效的;3.基于Gammatone滤波器的特征提取方法:Shameer K Mohammed,Supriya M Hariharan,Suraj Kamal.A GTCC-BasedUnderwater HMM Target Classifier with Fading Channel Compensation.Journal ofSensors,2018,2018(3):1-14.提出改进的GFCC方法提取目标音频信号的频谱特征,在噪声条件下,能取得较好的分类识别结果。
分类决策是通过对观测目标信号按照一定的方法进行训练后,对于未知的目标信号进行分类识别。在水下目标分类识别中通常使用神经网络、隐马尔可夫模型和支持向量机即SVM等分类识别方法,这些传统水下声信号目标分类识别方法是采用浅层结构算法完成目标的分类识别,缺乏从大量数据样本中学习数据集本质特征的能力,目前水下声信号目标种类复杂,再加上海底环境复杂,噪声多,这使得传统的分类识别方法无法较精确的完成对水下声信号目标的分类识别。深度学习代表人工智能领域未来最具潜力的发展方向之一,可以通过深层非线性网络实现复杂函数的逼近,分析提取的水下声信号目标特征,完成目标分类识别。由于深度学习模型具有从大数据集合中学习更多的抽象和不变特征这一优势,结合水下声信号特点,采用深度学习模型来完成水下声信号目标的分类识别,是一项具有重要理论意义和工程应用价值的工作。目前的研究主要包括:4.基于深度神经网络的水下目标分类识别:Xu Cao,Zhang Xiaomin,Yang Yu,Niu Letian.Deep learning-basedrecognition of underwater target.IEEE International Conference on DigitalSignal Processing,Beijing,China,2017:89-93.提出一种新颖的深度学习框架,可以适用于水下目标分类识别;5.基于深层信念网络的水下目标分类识别方法:Yang Honghui,Shen Sheng,Yao Xiaohui,Sheng Meiping,Wang Chen.Competitive Deep-BeliefNetworks for Underwater Acoustic Target Recognition.Sensors,2018,18(4):1-13.提出一种深层信念网络学习方法,完成小样本的水下目标分类识别;6.基于深度竞争网络的水下声信号目标分类识别:Shen Sheng,Yang Honghui,Sheng Meiping.Compression ofa deep competitive network based on mutual information for underwateracoustic targets recognition.Entropy,2018,20(4):1-13.提出一种压缩的深度竞争网络来提取船舶辐射噪声的特征,通过网络修剪去掉大量水下声信号的冗余信息,压缩网络,提高网络的抗噪能力,进而提高分类识别精度。
发明内容
本发明的目的在于提供一种基于深度学习的具有较好精度的水下声信号目标分类识别方法。
本发明的目的是这样实现的:
一种基于深度学习的水下声信号目标分类识别方法,包括以下步骤:
(1)利用GFCC算法对原始水下声信号进行特征提取,去除水下声信号中大量冗余的噪声信息,并且保留有效的声纹特征;
(2)提出构建特征矩阵:①采用MEMD算法对原始水下声信号在希尔伯特空间上进行特征提取,提取瞬时能量以及瞬时频率;②以信号帧为量级,对GFCC算法提取的特征值和MEMD算法提取的特征值进行融合,构建特征矩阵;
(3)对特征向量的分布建立GMM模型,将不同的数据点进行高斯分布混合,计算GMM模型中的均值向量,协方差矩阵和混合权重,保留水下声信号目标的个性特征;
(4)提出通过DNN完成分类决策的任务,最终实现精确的目标分类识别。
本发明还可以包括:
在步骤(1)中将原始水下声信号频谱采用Gammatone滤波器组得到初始特征信息,对每个滤波器的输出均进行等响预加重,并采用倒谱分析获得特征值。
在步骤(2)中将原始水下声信号进行希尔伯特黄变换即HHT,将信号转换成希尔伯特谱,从而在希尔伯特谱上找到信号的3阶极值点,利用插值法计算上下包络线以及细节信号IMFs,对第5阶IMF提取瞬时能量和瞬时频率。
在步骤(2)中以相同大小信号帧为量级,对GFCC算法提取的特征值和MEMD算法提取的瞬时能量及瞬时频率进行融合,融合后的特征矩阵维度不变,列数不变,行数变为原来的二倍。
在步骤(3)中将水下声信号样本作为多变量高斯概率密度函数的加权和建立GMM模型框架,概率密度函数为其中每个子分布为μi为均值向量,Σi为协方差矩阵,T为特征向量个数,混合权重wi,i=1,2,…,M满足Ni(x)是D维的联合高斯概率分布。
步骤(3)中每一类水下声信号目标的GMM模型的全参数由各分量的均值向量、协方差矩阵和混合权重的集合构成,参数对应的特征向量表示为λ={wi,μi,Σi},i=1,2,…,M,通过k-均值聚类算法完成GMM模型初始化。
步骤(3)中模型参数估计的方法是期望最大化EM算法完成模型参数的更新,其中EM算法包括E步骤和M步骤,E步骤是在初始参数的基础上,计算特征向量对GMM模型的后验概率,即GMM模型中各个单独高斯函数的占有率,占有率为M步骤是通过E步骤得到的后验概率计算新的参数θ=(M,λ,μ,Σ),M为混合数;通过不断进行E步骤和M步骤,直到模型收敛,得到对应具体水下声信号目标类别的GMM模型。
在步骤(4)中根据GMM模型全参数定义DNN的输入参数为μi,ubm为初始模型的均值向量,采用线性激活函数ReLU作为隐藏层激活函数,输出层使用交叉熵函数完成水下目标分类识别。
与现有技术相比,本发明的有益效果在于:
a.水下目标分类识别重点关注的是声信号的声纹特征信息,因此,本发明利用GFCC算法对原始水下声信号进行特征提取,去除水下声信号中大量冗余的噪声信息,提高鲁棒性,并且保留有效的声纹特征。
b.水下环境复杂多变,噪声干扰较为严重,单一的特征很难满足水下声信号目标分类识别的要求,为丰富特征信息,本发明提出使用MEMD算法提取水下声信号的瞬时能量和瞬时频率,并与GFCC算法提取的特征值进行融合,构建特征矩阵,作为原始水下声信号的特征。
c.为保留水下声信号目标的个性特征,减少冗余特征对模型的影响,本发明对特征向量的分布建立GMM模型,将不同的数据点进行高斯分布混合,计算GMM模型中的均值向量,协方差矩阵和混合权重,对特征矩阵进行重新描述。
d.虽然在对特征向量的分布建立GMM模型的基础上,GMM模型后验概率也可以完成水下声信号目标分类识别,但它是一种浅层的结构,单独作为分类决策方法具有一定的局限性,缺乏从大量数据样本中学习数据集本质特征的能力。因此,本发明提出采用DNN进行分类决策任务,DNN含有大量隐藏层,通过ReLU函数作为隐藏层的激活函数,可以对目标特征进行充分分析,进而增强分类识别能力,最终使用softmax函数完成水下声信号的目标分类识别。
本发明可以解决传统水下声信号目标分类识别方法特征提取单一,抗噪能力差的问题,并且能有效的提高水下声信号目标分类识别的准确率,有一定的适应性。
附图说明
图1是本发明方法的流程图;
图2是原始水下声信号时域波形图;
图3是原始水下声信号特征提取可视化图,图3(a)是MFCC算法提取的特征结果图,图3(b)是GFCC算法提取的特征结果图;
图4是在图2的基础上,含噪水下声信号的时域波形图;
图5是在图4的基础上,MFCC算法和GFCC算法特征提取的可视化图,图5(a)是MFCC算法提取的特征结果图,图5(b)是GFCC算法提取的特征结果图;
图6是对原始水下声信号EMD算法与MEMD算法提取分解的前5个IMFs波形图,图6(a)为EMD算法分解IMFs波形图,图6(b)为MEMD算法分解IMFs波形图;
图7是水下声信号特征矩阵结构示意图;
图8是本发明的DNN结构示意图;
图9是MFCC-GMM,MFCC-GMM-DNN与GFCC-GMM-DNN的分类识别准确率对比图;
图10是GFCC-GMM-DNN,MFCC-MEMD-GMM-DNN与GFCC-MEMD-GMM-DNN的分类识别准确率对比图。
具体实施方式
下面结合附图举例对本发明做更详细地描述:
结合图1,本发明的具体步骤如下:
(1)利用GFCC算法对原始水下声信号进行特征提取
Gammatone滤波器是一个具有无限长序列冲激响应的因果滤波器,在滤波器组中,每个Gammatone滤波器i的时域脉冲响应可以看成Gamma函数和声信号的乘积,定义为:
式中:n为滤波器的阶数,bi表示滤波器的衰减因子,fi为由Hz形式表示的中心频率,代表滤波器的相位,u(t)为阶跃函数,N表示为滤波器的总个数。
在水下声信号特征提取过程中,为了模拟人耳听觉特性,每个滤波器的带宽由人耳的临界频带决定。临界频带具体为:
ERB(f)=24.7×(4.37f/1000+1)
式中:f为中心频率。由临界频带得到Gammatone滤波器组中每个子带滤波器的带宽bi=1.019ERB(fi)。
图2为原始水下声信号时域波形图,通过图2可以看出,原始水下声信号中存在大量的噪音信息。为了验证GFCC算法特征提取的有效性,在图2的基础上,本发明图3中给出原始水下声信号特征提取的可视化图,图3(a)是MFCC算法提取的特征结果图,图3(b)是GFCC算法提取的特征结果图。将GFCC算法与常用的MFCC算法进行特征提取对比,从图3(a)和图3(b)中可以看出,MFCC算法由于更注重语义的特征,因此对于水下声信号目标分类识别,MFCC算法提取的特征较为粗糙。而本发明采用的GFCC算法对原始水下声信号进行特征提取,能去除水下声信号中大量冗余的噪声信息,提高鲁棒性,并且保留有效的声纹特征,提取出的特征更加细致准确。
为进一步比较GFCC算法和MFCC算法在特征提取过程中的抗噪性能,在图2中增加高斯白噪声,当信噪比SNR=10dB条件下,含噪信号的时域波形图如图4所示。在图4的基础上,图5给出含噪情况下MFCC算法和GFCC算法特征提取的可视化图,图5(a)是含噪情况下MFCC算法提取的特征结果图,图5(b)是含噪情况下GFCC算法提取的特征结果图。从图5(a)和图5(b)中可以看出,在含有严重噪声的情况下,MFCC算法提取的特征,分布和大小都产生了很大的改变,影响后续的目标分类识别精度。而GFCC算法特征提取方法具有较强的抗噪性能,在提取水下声信号目标的特征方面具有优越性。
(2)提出构建特征矩阵
①采用MEMD算法提取瞬时能量以及瞬时频率
将原始水下声信号序列进行快速傅里叶变换得到x(t),对x(t)求解3阶导数有z(t),求解z(t)的极大值与极小值,有:
利用3次样条插值法对极值点构建上下包络线emin(t)和emax(t),计算上下包络线的均值m(t)为:
m(t)=(emin(t)+emax(t))/2
使用原始水下声信号与均值m(t)对应帧做差,得到内部细节d(t)为:
d(t)=x(t)-m(t)
当d(t)小于设定的阈值时,均值m(t)为对应第i阶内部残差,记作mi(t)。第i阶IMFs表示为:
IMFi=xi(t)-mi(t)
式中:xi(t)为第i阶快速傅里叶变换后的水下声信号。
xi(t)有:
xi(t)=xi-1(t)-IMFi-1
当d(t)大于设定的阈值时,d(t)作为新的x(t),重新计算,直到d(t)小于设定的阈值。
i阶IMFs所对应的外部残差res(t),具体为:
res(t)=x(t)-IMF1-IMF2-...-IMFi-1
如果res(t)小于设定的阈值或者i等于5时,可提取前5阶IMFs。
为了验证本发明采用MEMD算法的有效性,对于原始水下声信号,图6给出了EMD算法与MEMD算法提取分解的前5个IMFs波形图,图6(a)为EMD算法分解IMFs波形图。图6(b)为MEMD算法分解IMFs波形图。从图中可以看出,由于水下环境复杂多变,噪声干扰较为严重,EMD算法在第5阶IMFs时分解效果极差与原始水下声信号相差较小,后续很难从中有效地提取到水下声信号目标的瞬时能量以及瞬时频率,而MEMD算法在第5阶IMFs时分解效果明显,后续能提取有效的瞬时能量以及瞬时频率。
为提取瞬时能量与瞬时频率通常将提取到的第5阶IMFs进行HHT变换,变换后有:
式中:为IMF5
对IMF5进行解析可以得到解析信号V(t),具体为:
式中:a(t)为H(t)的模,j为虚数单位。
a(t)具体为:
为H(t)的幅角,具体为:
通过解析信号V(t)可以得到瞬时能量以及瞬时频率,瞬时能量为a2(t),瞬时频率f(t)具体为:
②特征值融合构建特征矩阵
以信号帧为量级,对GFCC算法提取的特征值和MEMD算法提取的特征值进行融合,融合后的特征矩阵维度不变,列数不变,行数变为原来的二倍。提出构建的特征矩阵结构示意图如图7所示,融合后的矩阵列数仍为w,行数变为2×k。
(3)对特征向量的分布建立GMM模型
①GMM模型初始化
对M个分量的高斯概率密度函数进行加权求和得到阶数为M的GMM的概率密度函数。
具体为:
式中:x是维度为D的特征向量,Ni(x),i=1,2,…,M为子分布,wi,i=1,2,…,M为混合权重。
每个子分布Ni(x)均是D维的联合高斯概率分布,具体表示为:
式中:μi为均值向量,Σi为协方差矩阵,T为特征向量个数,混合权重wi,i=1,2,…,M满足
每一类水下声信号目标的GMM模型的全参数由各分量的均值向量、协方差矩阵和混合权重的集合构成,参数对应的特征向量表示为:
λ={wiii},i=1,2,…,M
②模型参数的更新
将提取的训练数据特征向量序列表示为X={xt},t=1,2,…,T,其似然度概率为:
对数似然度概率为:
带入高斯密度函数,有:
GMM模型所采用的参数估计方法是最大似然估计(Maximum LikelihoodEstimation,MLE),根据提取的训练数据特征向量序列,不断调整模型参数,直到似然概率P(X|λ)取得最大值。假设似然概率取得最大值时模型参数为λi,λi的值为:
λi=arg max P(X|λ)
具体模型参数的更新方法是EM算法,其中EM算法包括E步骤和M步骤。E步骤是在初始参数的基础上,计算特征向量对GMM模型的后验概率,即GMM模型中各个单独高斯函数的占有率,占有率为:
M步骤是通过E步骤得到的后验概率计算新的参数θ=(M,λ,μ,Σ),M为混合数。通过不断进行E步骤和M步骤,直到模型收敛,得到对应具体水下声信号目标类别的GMM模型。
(4)提出通过DNN完成分类决策的任务,最终实现较精确的目标分类识别
DNN含有大量隐藏层,类似于人脑的结构,能以分层的方式提取特征,可以对目标特征进行充分分析,进而增强分类识别能力。因此,提出在对特征向量的分布建立GMM模型的基础上,采用DNN进行分类决策任务,通过ReLU函数作为隐藏层的激活函数,最终使用softmax函数完成水下声信号的目标分类识别。本发明的分类识别方法在水下声信号目标个性信息被保留的同时,能更好的发挥DNN进行分类决策的优势。
①参数转换
GMM模型的全参数对应的特征向量为λ={wiii},i=1,2,…,M,根据其全参数定义DNN的输入参数为:
式中:μi,ubm为初始模型的均值向量。
②建立DNN实现分类识别任务
本发明采用具有多个隐藏层的完全连通的前馈神经网络,即利用DNN完成水下目标分类识别任务。图8是本发明一个具有输入层、隐藏层和输出层的基本DNN结构示意图。
给定一个I维输入特征向量第一个隐藏层的激活向量为:
式中:W(1)T是第一个隐藏层的权重矩阵的转置,维度为I×N1是大小为N1的偏置向量,σ是隐藏层的激活函数。
第i个隐藏层的激活向量通过第i-1个隐藏层的激活向量求得,具体有:
式中:Ni为第i个隐藏层中神经元的个数,W(i)T是第i个隐藏层的权重矩阵的转置,维度为Ni-1×Ni是大小为Ni的偏置向量。
ReLU函数在DNN的分类识别任务中能表现出很好的性能,因此,ReLU函数被用作隐藏层激活函数σ。具体定义为:
DNN的输出层使用softmax函数完成输出类别,最终实现的水下声信号分类识别。softmax函数如下所示:
式中:zk为J维输出层向量。
采用softmax回归算法作为损失函数,具体为:
式中,为softmax函数的对数值,1{·}表示的是示性函数函数,y(i)表示数据集中第i个数据的预测标签值,d为标签值,当y(i)=d为真时,返回1,否则返回0。
为验证本发明提出的一种基于深度学习的水下声信号目标分类识别方法的有效性,给出4类船舶以及水下大型哺乳类动物的声信号,和水下目标声信号较弱、距离较远情况下噪声信号共6类水下声信号数据集的实验。图9给出MFCC-GMM,MFCC-GMM-DNN与GFCC-GMM-DNN分别做30次分类识别实验的准确率。MFCC算法特征提取之后,在对特征向量的分布建立GMM模型的基础上,分别采用GMM模型后验概率(MFCC-GMM)和DNN(MFCC-GMM-DNN)完成水下目标分类识别的比较实验。从图9中可以看出,虽然在对特征向量的分布建立GMM模型的基础上,GMM模型后验概率也可以完成水下声信号目标分类识别,但它是一种浅层的结构,分类精度相对较低。本发明提出采用DNN进行分类决策任务,能获得相对较高的识别精度。进一步比较MFCC-GMM-DNN与GFCC-GMM-DNN的分类识别准确率,将MFCC算法与GMM-DNN相结合相对于将GFCC算法与GMM-DNN相结合,GFCC-GMM-DNN能再次验证GFCC算法特征提取的优越性,并能得到更加准确和稳定的分类识别效果。
本发明中提出利用MEMD算法提取到第5阶IMFs的瞬时能量以及瞬时频率,并与GFCC算法提取的特征值进行融合,构建特征矩阵。为验证MEMD算法提取特征的有效性以及与GFCC-GMM-DNN算法间的契合度,图10给出GFCC-GMM-DNN,MFCC-MEMD-GMM-DNN以及GFCC-MEMD-GMM-DNN分别做30次实验完成水下目标分类识别的准确率比较。从图10中可以看出,MEMD算法可以增加对水下声信号目标有效特征信息的提取,提高分类识别准确率,进而提高最终分类识别的精度。
为了更清晰的描述本发明提出的一种基于深度学习的水下声信号目标分类识别方法的有效性,表1给出各种算法在30次实验的分类识别准确率。
表1在30次实验中各种算法的分类识别准确率
从表1中可以看到,在30次实验中各种算法用于水下声信号数据集的分类识别均趋于稳定,本发明提出的GFCC-MEMD-GMM-DNN算法分类识别准确率较高。因此,本发明提出基于深度学习的水下声信号目标分类识别方法对船舶以及水下大型哺乳类动物的声信号具有较好的分类识别精度,并且在目标声信号较弱、距离较远等情况下仍然具有一定的适应性。

Claims (8)

1.一种基于深度学习的水下声信号目标分类识别方法,其特征在于,包括以下步骤:
(1)利用GFCC算法对原始水下声信号进行特征提取,去除水下声信号中大量冗余的噪声信息,并且保留有效的声纹特征;
(2)提出构建特征矩阵:①采用MEMD算法对原始水下声信号在希尔伯特空间上进行特征提取,提取瞬时能量以及瞬时频率;②以信号帧为量级,对GFCC算法提取的特征值和MEMD算法提取的特征值进行融合,构建特征矩阵;
(3)对特征向量的分布建立GMM模型,将不同的数据点进行高斯分布混合,计算GMM模型中的均值向量,协方差矩阵和混合权重,保留水下声信号目标的个性特征;
(4)提出通过DNN完成分类决策的任务,最终实现精确的目标分类识别。
2.根据权利要求1所述的一种基于深度学习的水下声信号目标分类识别方法,其特征在于:在步骤(1)中将原始水下声信号频谱采用Gammatone滤波器组得到初始特征信息,对每个滤波器的输出均进行等响预加重,并采用倒谱分析获得特征值。
3.根据权利要求1所述的一种基于深度学习的水下声信号目标分类识别方法,其特征在于:在步骤(2)中将原始水下声信号进行希尔伯特黄变换即HHT,将信号转换成希尔伯特谱,从而在希尔伯特谱上找到信号的3阶极值点,利用插值法计算上下包络线以及细节信号IMFs,对第5阶IMF提取瞬时能量和瞬时频率。
4.根据权利要求1或3所述的一种基于深度学习的水下声信号目标分类识别方法,其特征在于:在步骤(2)中以相同大小信号帧为量级,对GFCC算法提取的特征值和MEMD算法提取的瞬时能量及瞬时频率进行融合,融合后的特征矩阵维度不变,列数不变,行数变为原来的二倍。
5.根据权利要求1所述的一种基于深度学习的水下声信号目标分类识别方法,其特征在于:在步骤(3)中将水下声信号样本作为多变量高斯概率密度函数的加权和建立GMM模型框架,概率密度函数为其中每个子分布为μi为均值向量,Σi为协方差矩阵,T为特征向量个数,混合权重wi,i=1,2,…,M满足Ni(x)是D维的联合高斯概率分布。
6.根据权利要求1或5所述的一种基于深度学习的水下声信号目标分类识别方法,其特征在于:步骤(3)中每一类水下声信号目标的GMM模型的全参数由各分量的均值向量、协方差矩阵和混合权重的集合构成,参数对应的特征向量表示为λ={wi,μi,Σi},i=1,2,…,M,通过k-均值聚类算法完成GMM模型初始化。
7.根据权利要求6所述的一种基于深度学习的水下声信号目标分类识别方法,其特征在于:步骤(3)中模型参数估计的方法是期望最大化EM算法完成模型参数的更新,其中EM算法包括E步骤和M步骤,E步骤是在初始参数的基础上,计算特征向量对GMM模型的后验概率,即GMM模型中各个单独高斯函数的占有率,占有率为M步骤是通过E步骤得到的后验概率计算新的参数θ=(M,λ,μ,Σ),M为混合数;通过不断进行E步骤和M步骤,直到模型收敛,得到对应具体水下声信号目标类别的GMM模型。
8.根据权利要求1所述的一种基于深度学习的水下声信号目标分类识别方法,其特征在于:在步骤(4)中根据GMM模型全参数定义DNN的输入参数为μi,ubm为初始模型的均值向量,采用线性激活函数ReLU作为隐藏层激活函数,输出层使用交叉熵函数完成水下目标分类识别。
CN201910036689.6A 2019-01-15 2019-01-15 一种基于深度学习的水下声信号目标分类识别方法 Active CN109800700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910036689.6A CN109800700B (zh) 2019-01-15 2019-01-15 一种基于深度学习的水下声信号目标分类识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910036689.6A CN109800700B (zh) 2019-01-15 2019-01-15 一种基于深度学习的水下声信号目标分类识别方法

Publications (2)

Publication Number Publication Date
CN109800700A true CN109800700A (zh) 2019-05-24
CN109800700B CN109800700B (zh) 2022-08-02

Family

ID=66559332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910036689.6A Active CN109800700B (zh) 2019-01-15 2019-01-15 一种基于深度学习的水下声信号目标分类识别方法

Country Status (1)

Country Link
CN (1) CN109800700B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807365A (zh) * 2019-09-29 2020-02-18 浙江大学 一种基于gru与一维cnn神经网络融合的水下目标识别方法
CN111027453A (zh) * 2019-12-06 2020-04-17 西北工业大学 基于高斯混合模型的非合作水中目标自动识别方法
CN111951611A (zh) * 2020-07-03 2020-11-17 中国空气动力研究与发展中心计算空气动力研究所 基于多特征融合的ads-b微弱信号检测装置及方法
CN112086105A (zh) * 2020-08-31 2020-12-15 中国船舶重工集团公司七五0试验场 一种基于Gammatone分频带连续谱特征的目标识别方法
CN112132024A (zh) * 2020-09-22 2020-12-25 中国农业大学 水下目标识别网络优化方法及装置
CN112146880A (zh) * 2020-09-17 2020-12-29 天津大学 一种对不同转速下滚动轴承内部结构故障的智能化诊断方法
CN112258132A (zh) * 2020-11-18 2021-01-22 中国联合网络通信集团有限公司 仓储管理方法、系统、计算机设备及存储介质
CN112364779A (zh) * 2020-11-12 2021-02-12 中国电子科技集团公司第五十四研究所 信号处理与深-浅网络多模型融合的水声目标识别方法
CN112432905A (zh) * 2021-01-28 2021-03-02 湖北鑫英泰系统技术股份有限公司 基于变压器油中特征气体光声光谱的声纹识别方法与装置
CN112697883A (zh) * 2020-12-13 2021-04-23 南通卓强信息技术有限公司 基于音频向量协方差矩阵的混凝土管桩浇筑质量检测方法
CN113030986A (zh) * 2021-03-09 2021-06-25 中国科学院水生生物研究所 一种不同鲸类种群间隔离程度的确定方法及系统
CN113126099A (zh) * 2020-01-14 2021-07-16 中国科学院声学研究所 一种基于音频特征提取的单波束底质分类方法
CN113191178A (zh) * 2020-12-04 2021-07-30 中国船舶重工集团公司第七一五研究所 一种基于听觉感知特征深度学习的水声目标识别方法
CN113252161A (zh) * 2021-04-26 2021-08-13 西北工业大学 一种基于深度森林的小样本水中目标识别方法
CN113837071A (zh) * 2021-09-23 2021-12-24 重庆大学 基于多尺度权重选择对抗网络的部分迁移故障诊断方法
CN115188387A (zh) * 2022-07-12 2022-10-14 四川农业大学 一种有效的海洋哺乳动物声音自动检测和分类方法
CN117198330A (zh) * 2023-11-07 2023-12-08 国家海洋技术中心 一种声源识别方法、系统及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760235A (zh) * 2011-04-25 2012-10-31 中国科学院声学研究所 一种基于多视的水下目标分类系统及方法
WO2014173393A1 (de) * 2013-04-26 2014-10-30 Atlas Elektronik Gmbh Verfahren zum identifizieren oder detektieren einer unterwasserstruktur, rechner sowie wasserfahrzeug
CN105488466A (zh) * 2015-11-26 2016-04-13 中国船舶工业系统工程研究院 一种深层神经网络和水声目标声纹特征提取方法
CN107369444A (zh) * 2016-05-11 2017-11-21 中国科学院声学研究所 一种基于mfcc和人工神经网络的水下机动小目标识别方法
CN108846323A (zh) * 2018-05-28 2018-11-20 哈尔滨工程大学 一种面向水下目标识别的卷积神经网络优化方法
CN109100710A (zh) * 2018-06-26 2018-12-28 东南大学 一种基于卷积神经网络的水下目标识别方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760235A (zh) * 2011-04-25 2012-10-31 中国科学院声学研究所 一种基于多视的水下目标分类系统及方法
WO2014173393A1 (de) * 2013-04-26 2014-10-30 Atlas Elektronik Gmbh Verfahren zum identifizieren oder detektieren einer unterwasserstruktur, rechner sowie wasserfahrzeug
CN105488466A (zh) * 2015-11-26 2016-04-13 中国船舶工业系统工程研究院 一种深层神经网络和水声目标声纹特征提取方法
CN107369444A (zh) * 2016-05-11 2017-11-21 中国科学院声学研究所 一种基于mfcc和人工神经网络的水下机动小目标识别方法
CN108846323A (zh) * 2018-05-28 2018-11-20 哈尔滨工程大学 一种面向水下目标识别的卷积神经网络优化方法
CN109100710A (zh) * 2018-06-26 2018-12-28 东南大学 一种基于卷积神经网络的水下目标识别方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
SHENG SHEN 等: ""Compression of a deep competitive network based on mutual information for underwater acoustic targets recognition"", 《ENTROPY》 *
VAN-SANG DOAN 等: ""Underwater Acoustic Target Classification Based on Dense Convolutional Neural Network"", 《IEEE GEOSCIENCE AND REMOTE SENSING LETTERS》 *
ZIXU LIAN 等: ""Underwater acoustic target classification based on modified GFCC features"", 《2017 IEEE IAEAC》 *
刘安华: ""基于多维特征的深度学习水下声信号目标识别研究"", 《中国优秀硕士学位论文全文数据库(基础科学辑)》 *
王兴梅 等: ""Underwater Acoustic Target Recognition: A Combination of Multi-Dimensional Fusion Features and Modified Deep Neural Network"", 《REMOTE SENSING》 *
连梓旭: ""水声目标特征提取与分类识别技术研究"", 《中国优秀硕士学位论文全文数据库(基础科学辑)》 *
马骏: ""水声被动目标特征提取和分类方法研究"", 《中国优秀硕士学位论文全文数据库(工程科技Ⅱ辑)》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807365B (zh) * 2019-09-29 2022-02-11 浙江大学 一种基于gru与一维cnn神经网络融合的水下目标识别方法
CN110807365A (zh) * 2019-09-29 2020-02-18 浙江大学 一种基于gru与一维cnn神经网络融合的水下目标识别方法
CN111027453A (zh) * 2019-12-06 2020-04-17 西北工业大学 基于高斯混合模型的非合作水中目标自动识别方法
CN111027453B (zh) * 2019-12-06 2022-05-17 西北工业大学 基于高斯混合模型的非合作水中目标自动识别方法
CN113126099A (zh) * 2020-01-14 2021-07-16 中国科学院声学研究所 一种基于音频特征提取的单波束底质分类方法
CN113126099B (zh) * 2020-01-14 2023-05-02 中国科学院声学研究所 一种基于音频特征提取的单波束底质分类方法
CN111951611A (zh) * 2020-07-03 2020-11-17 中国空气动力研究与发展中心计算空气动力研究所 基于多特征融合的ads-b微弱信号检测装置及方法
CN112086105B (zh) * 2020-08-31 2022-08-19 中国船舶重工集团公司七五0试验场 一种基于Gammatone分频带连续谱特征的目标识别方法
CN112086105A (zh) * 2020-08-31 2020-12-15 中国船舶重工集团公司七五0试验场 一种基于Gammatone分频带连续谱特征的目标识别方法
CN112146880B (zh) * 2020-09-17 2022-03-29 天津大学 一种对不同转速下滚动轴承内部结构故障的智能化诊断方法
CN112146880A (zh) * 2020-09-17 2020-12-29 天津大学 一种对不同转速下滚动轴承内部结构故障的智能化诊断方法
CN112132024A (zh) * 2020-09-22 2020-12-25 中国农业大学 水下目标识别网络优化方法及装置
CN112132024B (zh) * 2020-09-22 2024-02-27 中国农业大学 水下目标识别网络优化方法及装置
CN112364779B (zh) * 2020-11-12 2022-10-21 中国电子科技集团公司第五十四研究所 信号处理与深-浅网络多模型融合的水声目标识别方法
CN112364779A (zh) * 2020-11-12 2021-02-12 中国电子科技集团公司第五十四研究所 信号处理与深-浅网络多模型融合的水声目标识别方法
CN112258132B (zh) * 2020-11-18 2023-06-16 中国联合网络通信集团有限公司 仓储管理方法、系统、计算机设备及存储介质
CN112258132A (zh) * 2020-11-18 2021-01-22 中国联合网络通信集团有限公司 仓储管理方法、系统、计算机设备及存储介质
CN113191178A (zh) * 2020-12-04 2021-07-30 中国船舶重工集团公司第七一五研究所 一种基于听觉感知特征深度学习的水声目标识别方法
CN112697883A (zh) * 2020-12-13 2021-04-23 南通卓强信息技术有限公司 基于音频向量协方差矩阵的混凝土管桩浇筑质量检测方法
CN112432905B (zh) * 2021-01-28 2021-04-20 湖北鑫英泰系统技术股份有限公司 基于变压器油中特征气体光声光谱的声纹识别方法与装置
CN112432905A (zh) * 2021-01-28 2021-03-02 湖北鑫英泰系统技术股份有限公司 基于变压器油中特征气体光声光谱的声纹识别方法与装置
CN113030986B (zh) * 2021-03-09 2021-09-28 中国科学院水生生物研究所 一种不同鲸类种群间隔离程度的确定方法及系统
CN113030986A (zh) * 2021-03-09 2021-06-25 中国科学院水生生物研究所 一种不同鲸类种群间隔离程度的确定方法及系统
CN113252161A (zh) * 2021-04-26 2021-08-13 西北工业大学 一种基于深度森林的小样本水中目标识别方法
CN113837071B (zh) * 2021-09-23 2024-02-02 重庆大学 基于多尺度权重选择对抗网络的部分迁移故障诊断方法
CN113837071A (zh) * 2021-09-23 2021-12-24 重庆大学 基于多尺度权重选择对抗网络的部分迁移故障诊断方法
CN115188387B (zh) * 2022-07-12 2023-04-07 四川农业大学 一种有效的海洋哺乳动物声音自动检测和分类方法
CN115188387A (zh) * 2022-07-12 2022-10-14 四川农业大学 一种有效的海洋哺乳动物声音自动检测和分类方法
CN117198330A (zh) * 2023-11-07 2023-12-08 国家海洋技术中心 一种声源识别方法、系统及电子设备
CN117198330B (zh) * 2023-11-07 2024-01-30 国家海洋技术中心 一种声源识别方法、系统及电子设备

Also Published As

Publication number Publication date
CN109800700B (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
CN109800700A (zh) 一种基于深度学习的水下声信号目标分类识别方法
Michelsanti et al. Conditional generative adversarial networks for speech enhancement and noise-robust speaker verification
CN105139864B (zh) 语音识别方法和装置
CN110807365A (zh) 一种基于gru与一维cnn神经网络融合的水下目标识别方法
CN110490230A (zh) 基于深度卷积生成对抗网络的水声目标识别方法
CN109887484A (zh) 一种基于对偶学习的语音识别与语音合成方法及装置
CN108922513A (zh) 语音区分方法、装置、计算机设备及存储介质
Wang et al. ia-PNCC: Noise Processing Method for Underwater Target Recognition Convolutional Neural Network.
Pham et al. A Robust Framework for Acoustic Scene Classification.
Sun et al. Underwater single-channel acoustic signal multitarget recognition using convolutional neural networks
Yang et al. A new cooperative deep learning method for underwater acoustic target recognition
CN103985381A (zh) 一种基于参数融合优化决策的音频索引方法
CN108647556A (zh) 基于分频和深度神经网络的声源定位方法
Yang et al. TFPSNet: Time-frequency domain path scanning network for speech separation
CN104732970A (zh) 一种基于综合特征的舰船辐射噪声识别方法
Shi et al. End-to-End Monaural Speech Separation with Multi-Scale Dynamic Weighted Gated Dilated Convolutional Pyramid Network.
CN109036470A (zh) 语音区分方法、装置、计算机设备及存储介质
Cao et al. Underwater target classification at greater depths using deep neural network with joint multiple‐domain feature
Doan et al. Bts-e: Audio deepfake detection using breathing-talking-silence encoder
CN112183582A (zh) 一种多特征融合的水下目标识别方法
Ng et al. Teacher-student training for text-independent speaker recognition
Han et al. Perceptual weighting deep neural networks for single-channel speech enhancement
Liu et al. Few-shot learning with data enhancement and transfer learning for underwater target recognition
Gowda et al. Affective computing using speech processing for call centre applications
Zezario et al. Speech enhancement with zero-shot model selection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant