CN108630209A - 一种基于特征融合与深度置信网络的海洋生物识别方法 - Google Patents
一种基于特征融合与深度置信网络的海洋生物识别方法 Download PDFInfo
- Publication number
- CN108630209A CN108630209A CN201810371675.5A CN201810371675A CN108630209A CN 108630209 A CN108630209 A CN 108630209A CN 201810371675 A CN201810371675 A CN 201810371675A CN 108630209 A CN108630209 A CN 108630209A
- Authority
- CN
- China
- Prior art keywords
- marine organisms
- depth confidence
- confidence network
- parameter
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 42
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000000513 principal component analysis Methods 0.000 claims abstract description 8
- 230000008447 perception Effects 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 35
- 238000001228 spectrum Methods 0.000 claims description 26
- 239000013598 vector Substances 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 238000009432 framing Methods 0.000 claims description 8
- 230000003068 static effect Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 238000004088 simulation Methods 0.000 claims description 4
- 238000010183 spectrum analysis Methods 0.000 claims description 4
- 238000005311 autocorrelation function Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000011160 research Methods 0.000 abstract description 10
- 238000004422 calculation algorithm Methods 0.000 abstract description 4
- 238000012549 training Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000013016 learning Effects 0.000 description 3
- 241000283153 Cetacea Species 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 235000006506 Brasenia schreberi Nutrition 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000686 essence Substances 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
- G10L17/14—Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明涉及一种基于特征融合与深度置信网络的海洋生物识别方法,解决了现有海洋声信号特征提取与分类方法导致算法的鲁棒性能和识别精度十分有限的问题,本发明的具体步骤如下:采集声学信号S(n),对所采集的声学信号进行预处理;提取感知线性预测系数(PLP)特征参数与梅尔倒谱系数(MFCC)特征参数,将PLP特征参数与MFCC特征参数融合成新的特征参数;对新的特征参数进行主成分分析;构建深度置信网络进行学习;完成对海洋生物的识别。本发明可实现对海洋生物的快速识别,其识别精度高,鲁棒性能强,在海洋生物研究、海洋救灾和资源勘探等民生息息相关的问题上,具有重大的研究意义和广阔的应用前景。
Description
技术领域
本发明涉及海洋生物识别技术领域,特别涉及一种基于特征融合与深度置信网络的海洋生物识别方法。
背景技术
海洋生物识别旨在通过非接触的方式实现对生物类别的判断,其被动识别技术是通过被动声呐接收目标声信号进行分类识别。在海洋生物研究、海洋救灾和资源勘探等民生息息相关的问题上,具有重大的研究意义和广阔的应用前景。
海洋目标识别技术由于海洋环境的复杂及各方面限制,是一个难度极大的研究课题,当前还需要重点解决的技术问题主要包括:1.小样本或无监督学习与识别问题,水中目标的数据往往很难获取,难以有足够多的样本数据,严重制约了水中目标识别技术研究的发展。这是客观条件所决定的,只能从数据分析的角度入手,提高对现有数据的分析利用率。同时面对从来没有训练过的无标记数据样本,如何使得系统应该具有相应的判决能力及响应,需要进一步研究;2.实际海况工况下识别鲁棒性的问题,海洋环境复杂多变,获取的目标信号受到声信道的影响,亦或是掺杂了众多的背景噪声,这对目标的自动识别造成了极大的困难。当前研究中的数据或者实验条件都只是在特定条件下进行的,这导致众多性能优良的系统在面对实际数据测试时往往无能为力;3.小型化、实时性的问题,研究的目的是走向实用,研究得到的识别系统最终要应用于实际。那么,在目标识别系统的研发上,就要考虑装备的小型化,尽量不占据过大的空间,同时也要考虑算法的实时性是否能得到满足,这必将需要在效能和体积上权衡利弊,实现平衡。
目前国内外对海洋生物及舰船的识别研究比较多,然而大多采用传统的特征提取与分类方法,存在很多的问题和不足,算法的鲁棒性能和识别精度十分有限。
发明内容
鉴以此,本发明提出一种基于特征融合与深度置信网络的海洋生物识别方法,以解决上述背景技术中提出的问题。
本发明的技术方案是这样实现的,一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,包括下列步骤:
S1、采集声学信号S(n),对所采集的声学信号进行预处理;
S2、提取感知线性预测系数(PLP)特征参数与梅尔倒谱系数(MFCC)特征参数,将PLP特征参数与MFCC特征参数融合成新的特征参数;
S3、对新的特征参数进行主成分分析,获得转换函数P以及融合特征矩阵Y;
S4、构建深度置信网络,将融合特征矩阵Y输入进行学习;
S5、完成对海洋生物的识别。
优选的,所述预处理方式包括预加重、分帧和加窗。
优选的,步骤S2中,所述提取PLP特征参数步骤在于:
将声学信号S(n)进行短时傅立叶变换,得到频谱x(ω),计算频谱x(ω)的功率谱p(ω);
对功率谱p(ω)进行临界频带分析:
Ω(ω)=6ln{ω/1200π+[(ω/1200π)2+1]1/2} (1)
式中,ω为角频率,Ω为Bark域频率。
将功率谱p(ω)与模拟听觉频率临界曲线Ψ(Ω)进行卷积操作,获得临界带功率谱θ[Ωi],临界带曲线的公式为:
进行等响度曲线预加重处理;
进行强度-响度转换;
进行傅里叶逆变换,得到信号短时自相关函数R(τ),根据Durbin公式获得12阶线性预测系数,对所述12阶线性预测系数进行谱分析,获得12维PLP特征参数及其一阶差分特征参数,共24维PLP特征参数。
优选的,将所述Bark域采样步长设置为1,划分成24个临界带域,将所述临界带功率谱θ[Ωi]采样间隔设置为1。
优选的,步骤S2中,所述获得MFCC特征参数的步骤在于:
对声学信号S(n)进行分帧操作,并对每一帧声学信号S(n)进行高频预加重处理;
进行离散傅里叶变换运算,得到离散功率谱X(k);
将X(k)通过多个带通滤波器的滤波器组Hm(n)滤波,得到多个功率值pm;
将所述功率值pm进行对数运算,获得对数能量Lm;
将对数能量Lm经过离散余弦变换得到Dm,求取Dm的静态参数,通过静态参数求取差分系数,将所述静态参数与所述差分系数结合,即获得MFCC特征参数。
优选的,步骤S2中可获得12个维度的MFCC特征参数及其一阶差分特征参数,即总计24维的MFCC特征参数。
优选的,步骤S2中,将所述PLP特征参数与所述MFCC特征参数融合成新的特征参数的步骤在于:
设定特征向量V,将所述PLP特征参数与所述MFCC特征参数进行串联融合:
V=(α β) (4)
式中,α为PLP特征参数,β为MFCC特征参数。
优选的,步骤S3中,对所述新的特征参数进行主成分分析的步骤在于:
将n条m维串联特征向量Vi构成矩阵X:
计算矩阵X每一行的均值:
计算X的协方差矩阵:
对协方差矩阵进行特征值分解,得到协方差矩阵的特征值和对应特征向量;
通过特征值的累积大小贡献率确定选取的特征值个数k,定义前k个主分量的累计贡献率为:
取的前k行组成转换矩阵P;
优选的,步骤S3中,将矩阵X与转换矩阵P相乘,获得融合特征矩阵Y。
优选的,步骤S4中,构建深度置信网络的步骤在于:
利用受限玻尔兹曼机(RBM)来构建深度置信网络;
引入丢弃法(dropout)、加入动量项(momentum)、权重衰减方法(weight decay)对深度置信网络进行优化;
用所述新的特征参数训练深度置信网络。
与现有技术相比,本发明的有益效果是,本发明所提供的一种基于特征融合与深度置信网络的海洋生物识别方法,首先,对声音信号的预处理便于后续稳健特征的提取,同时增加了数据量,为深度学习过程做了铺垫,避免因样本数量不足,训练数据难以拟合的问题。其次,通过主成分分析的特征融合过程,构造的新特征参数具有更好的分类性能,能有效提高识别率。最后,通过深度学习的方法进行特征自主学习过程,可以学习到数据内在的本质信息,有助于提高识别率和算法的鲁棒性,可对目标类别数据进行识别预测,且具有较高的识别率,在海洋生物研究、海洋救灾和资源勘探等民生息息相关的问题上,具有重大的研究意义和广阔的应用前景。
附图说明
图1为本发明实施例的总体流程框图;
图2为本发明实施例提取PLP特征参数的流程框图;
图3为本发明实施例提取MFCC特征参数的流程框图;
图4为本发明实施例PLP特征参数散点图;
图5为本发明实施例MFCC特征参数散点图;
图6为本发明实施例融合特征参数散点图。
具体实施方式
为了更好理解本发明技术内容,下面提供具体实施例,并结合附图对本发明做进一步的说明。
参见图1,一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,包括下列步骤:
S1、采集声学信号S(n),对所采集的声学信号进行预处理,所述预处理方式包括预加重、分帧、加窗;
具体的,预加重是对信号的高频部分进行加重,以增加信号的高频分辨率,使信号的频谱变得平坦,能够利用同样的信噪比在低频到高频的整个频带内求频谱,便于对信号进行频谱分析或声道参数分析;
分帧是指将语音信号划分成短时段的信号,每一段的长度大概为10ms--30ms,每一段称为一帧,分帧的目的是因为声信号是准平稳,只有在短时段上才视为是一个平稳过程;
对语音信号加窗的目的是为了减小截断效应,降低语音帧的坡度,使语音帧的两端平滑的过渡到零。
S2、提取PLP特征参数与MFCC特征参数,将PLP特征参数与MFCC特征参数融合成新的特征参数;
参见图2与图4,具体的,提取PLP特征参数的步骤在于:
将声学信号S(n)进行短时傅立叶变换,得到频谱x(ω),计算频谱x(ω)的功率谱p(ω):
p(ω)=Rx[x(ω)]2+Im[x(ω)]2 (1)
对功率谱p(ω)进行临界频带分析,功率谱p(ω)以其频率轴按下式规整到Bark域:
Ω(ω)=6ln{ω/1200π+[(ω/1200π)2+1]1/2} (2)
式中,ω为角频率,Ω为Bark域频率。
在功率谱规整到Bark域后,将功率谱与模拟听觉频率临界曲线Ψ(Ω)进行卷积操作,临界带曲线的公式为:
Ψ(Ω)曲线近似模拟了人耳的听觉滤波特性,在Bark域中基本稳定,将Bark域采样步长设置为1,划分24个临界带域,通过Ψ(Ω)与P(Ω)的离散卷积,得到采样信号的临界带功率谱:
式中,i取1,2,…,24,θ[Ωi]的采样间隔取1。
进行等响度曲线预加重处理,人耳对声音频率的感知能力是不同的。在同一固定声强级下,人类通常对中高频的声音感觉较为强烈,根据此研究结论,采用基于人耳特性模拟得到的等响曲线对信号频率的分量在傅里叶频域进行等响预加重处理:
Γ[Ω(ω)]=E(ω)θ[Ω(ω)] (6)
式中,ω为信号频率分量,E(ω)近似模拟了人耳对不同频率声信号的感知能力。
进行强度-响度转换,为了模拟客观信号强度与主观感受响度的非线性关系,要控制临界带谱的幅值变换幅度范围。通过求取立方根的方式来对临界带功率谱幅值进行压缩,计算公式如下:
对获得的进行傅里叶逆变换,得到信号短时自相关函数R(τ),通过Durbin公式解得12阶线性预测系数,对所述12阶线性预测系数进行谱分析,获得12维PLP特征参数及其一阶差分特征参数,共24维特征参数。所获得的PLP特征参数散点图如图4所示,由图4可知,PLP特征参数散点分布范围较为宽泛,不同目标类别间散点已有大致的分布中心。
参见图3与图5,具体的,获得MFCC特征参数的步骤在于:
首先取每帧的数据点数为N为1024,然后对采样的声学信号S(n)进行分帧操作,并对每帧声学信号s(n)进行高频预加重、加窗处理;
对每帧声学信号s(n)进行离散傅里叶变换运算,得到离散功率谱X(k):
将X(k)通过M个带通滤波器的滤波器组Hm(n)滤波,得到M个功率值pm,其中m取0,1,…,M-1;
将所述功率值pm进行对数运算,获得对数能量Lm,其中m取0,1,…,M-1;
将对数能量Lm经过离散余弦变换得到梅尔倒谱特征参数Dm:
式中,m取0,1,…,M-1。
去除Dm中的直流分量D0,取D1,D2,…Dk作为MFCC特征参数的静态参数,通过静态参数求取差分系数,将静态参数与差分系数结合,即可得到MFCC特征参数d(n)。
式中,k为常数,表示所取的差分系数的阶数,c(n)表示梅尔倒谱特征参数,最终可获得12个维度的MFCC特征参数及其一阶差分特征参数,总共24维的MFCC特征参数。所获得的MFCC特征参数散点图如图5所示,由图5可知,MFCC特征散点聚集程度较为明显,且表现为相似类别间区分程度较弱。
S3、对新的特征参数进行主成分分析,获得转换函数P以及融合特征矩阵Y;
具体的,所述将PLP特征参数与MFCC特征参数融合成新的特征参数的步骤在于:
设定特征向量V,应用下列公式将24维PLP特征参数与24维MFCC特征参数进行串联融合:
V=(α β) (10)
式中,α为PLP特征参数,β为MFCC特征参数。
具体的,步骤S3中,对新的特征参数进行主成分分析的步骤在于:
将有n条m维串联特征向量Vi构成矩阵X:
计算矩阵X每一行的均值:
式中,m为矩阵X的行数。
计算X的协方差矩阵:
对协方差矩阵进行特征值分解,得到协方差矩阵的特征值和对应特征向量,通过特征值的累积大小贡献率确定选取的特征值个数k,特征值满足从大到小排列的规律,通过特征值的累积大小贡献率确定选取的特征值个数k,定义前k个主分量的累计贡献率为:
当足够大时,可以认为由这k个特征值对应的特征向量组合可以很好的表征原始声学信号,取的前k行组成转换矩阵P,将矩阵X与转换矩阵P相乘,获得融合特征矩阵Y:
Y=PX (15)
式中,Y的每一行为新的融合特征参数。所获得的融合特征参数散点图如图6所示,由图6可知,从散点的分布来看,不同类别特征散点分别聚集在不同区域,融合后的特征对不同类别数据的可区分性更强,也就是具有更好的分类性能。
S4、构建深度置信网络,将融合特征矩阵Y输入进行学习;
首先,构建深度置信网络。利用受限玻尔兹曼机(RBM)来构建深度置信网络。隐层层数为3,节点数目分别为48-24-12。输入层节点数与融合特征参数的维度相同为36,输出层为Softmax,分类器类别输出为4,整个网络的结构为36-48-24-12-4。
其次,优化网络,引入丢弃法(dropout)、加入动量项(momentum)、权重衰减方法(weight decay)对网络进行优化。
最后,利用新的融合特征参数训练深度置信网络。训练过程分为两步:预训练和微调。
(1)预训练。进行RBM参数学习的过程,整个预训练的过程是无监督的。训练的每一个RBM都是对输入数据的新的表示,假设输入数据为向量v,经过一个RBM隐藏层单元激活后得到的输出向量为h,将该输出向量h作为下一个RBM的输入训练数据来训练一个新的RBM,其中获得的每一个RBM的权重都可以独立的从前一层的输出中提取特征。
(2)微调过程。将RBM预训练权重参数作为网络的初始参数,通过随机梯度下降(SGD)有监督地精细调整所有的权重,直至训练完成。
S5、通过训练完成的深度置信网络实现对海洋生物的识别。
本实施例的实施效果通过以下表1实验数据进行说明,在本实施例中,数据量为32000。
表1不同分类方法对海洋鲸类的识别准确率
由此可见,本实施例提出的深度置信网络的识别方法对于海洋鲸类的识别准确率高于传统机器学习分类方法。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,包括下列步骤:
S1、采集声学信号S(n),对所采集的声学信号S(n)进行预处理;
S2、提取感知线性预测系数(PLP)特征参数与梅尔倒谱系数(MFCC)特征参数,将PLP特征参数与MFCC特征参数融合成新的特征参数;
S3、对新的特征参数进行主成分分析,获得转换函数P以及融合特征矩阵Y;
S4、构建深度置信网络,将融合特征矩阵Y输入进行学习;
S5、完成对海洋生物的识别。
2.根据权利要求1所述的一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,所述预处理方式包括预加重、分帧和加窗。
3.根据权利要求1所述的一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,步骤S2中,所述提取PLP特征参数步骤在于:
将声学信号S(n)进行短时傅立叶变换,得到频谱x(ω),计算频谱x(ω)的功率谱p(ω);
对功率谱p(ω)进行临界频带分析:
Ω(ω)=6ln{ω/1200π+[(ω/1200π)2+1]1/2} (1)
式中,ω为角频率,Ω为Bark域频率。
将功率谱p(ω)与模拟听觉频率临界曲线Ψ(Ω)进行卷积操作,获得临界带功率谱θ[Ωi],其中临界带曲线的公式为:
进行等响度曲线预加重处理;
进行强度-响度转换;
进行傅里叶逆变换,得到信号短时自相关函数R(τ),根据Durbin公式获得12阶线性预测系数,对所述12阶线性预测系数进行谱分析,获得12维PLP特征参数及其一阶差分特征参数,共24维PLP特征参数。
4.根据权利要求3所述的一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,将所述Bark域采样步长设置为1,划分成24个临界带域,将所述临界带功率谱θ[Ωi]采样间隔设置为1。
5.根据权利要求1所述的一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,步骤S2中,所述获得MFCC特征参数的步骤在于:
对声学信号S(n)进行分帧操作,并对每一帧声学信号S(n)进行高频预加重处理;
进行离散傅里叶变换运算,得到离散功率谱X(k);
将X(k)通过多个带通滤波器的滤波器组Hm(n)滤波,得到多个功率值pm;
将所述功率值pm进行对数运算,获得自然对数Lm;
将自然对数Lm经过离散余弦变换得到Dm,求取Dm的静态参数,通过静态参数求取差分系数,将所述静态参数与所述差分系数结合,即获得MFCC特征参数。
6.根据权利要求5所述的一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,步骤S2中,可获得12个维度的MFCC特征参数及其一阶差分特征参数,即总计24维MFCC特征参数。
7.根据权利要求1所述的一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,步骤S2中,将所述PLP特征参数与所述MFCC特征参数融合成新的特征参数的步骤在于:
设定特征向量V,将所述PLP特征参数与所述MFCC特征参数进行串联融合:
V=(αβ) (4)
式中,α为PLP特征参数,β为MFCC特征参数。
8.根据权利要求7所述的一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,步骤S3中,对所述新的特征参数进行主成分分析的步骤在于:
将n条m维串联特征向量Vi构成矩阵X:
计算矩阵X每一行的均值:
计算矩阵X的协方差矩阵:
对协方差矩阵进行特征值分解,得到协方差矩阵的特征值和对应特征向量;
通过特征值的累积大小贡献率确定选取的特征值个数k,定义前k个主分量的累计贡献率为:
取的前k行组成转换矩阵P。
9.根据权利要求8所述的一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,步骤S3中,将矩阵X与转换矩阵P相乘,最终获得融合特征矩阵Y。
10.根据权利要求1所述的一种基于特征融合与深度置信网络的海洋生物识别方法,其特征在于,步骤S4中,构建深度置信网络的步骤在于:
利用受限玻尔兹曼机(RBM)来构建深度置信网络;
引入丢弃法(dropout)、加入动量项(momentum)、权重衰减方法(weight decay)对深度置信网络进行优化;
用所述新的特征参数训练深度置信网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810371675.5A CN108630209B (zh) | 2018-04-24 | 2018-04-24 | 一种基于特征融合与深度置信网络的海洋生物识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810371675.5A CN108630209B (zh) | 2018-04-24 | 2018-04-24 | 一种基于特征融合与深度置信网络的海洋生物识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108630209A true CN108630209A (zh) | 2018-10-09 |
CN108630209B CN108630209B (zh) | 2021-05-25 |
Family
ID=63694241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810371675.5A Expired - Fee Related CN108630209B (zh) | 2018-04-24 | 2018-04-24 | 一种基于特征融合与深度置信网络的海洋生物识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108630209B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109409308A (zh) * | 2018-11-05 | 2019-03-01 | 中国科学院声学研究所 | 一种基于鸟类鸣声的鸟类物种识别的方法 |
CN110398744A (zh) * | 2019-07-26 | 2019-11-01 | 中国人民解放军国防科技大学 | 一种基于声信号的海洋温跃层特征参数寻优反演方法 |
CN110658476A (zh) * | 2019-10-16 | 2020-01-07 | 北京航空航天大学 | 一种随机充放电条件下锂电池容量加速衰减的判定方法 |
CN111060975A (zh) * | 2019-12-02 | 2020-04-24 | 上海微波技术研究所(中国电子科技集团公司第五十研究所) | 用于探地雷达目标检测的方法 |
CN111341351A (zh) * | 2020-02-25 | 2020-06-26 | 厦门亿联网络技术股份有限公司 | 基于自注意力机制的语音活动检测方法、装置及存储介质 |
CN111540373A (zh) * | 2020-01-12 | 2020-08-14 | 杭州电子科技大学 | 基于超复数随机神经网络的城市噪声识别方法 |
CN112735443A (zh) * | 2020-12-25 | 2021-04-30 | 浙江弄潮儿智慧科技有限公司 | 一种具有自动分类的海洋空间资源管理系统及其自动分类方法 |
CN117078116A (zh) * | 2023-10-17 | 2023-11-17 | 华能(浙江)能源开发有限公司清洁能源分公司 | 风电场选址对海洋生物群落影响的鲁棒性分析方法及系统 |
CN117292693A (zh) * | 2023-11-27 | 2023-12-26 | 安徽大学 | 融入自注意力机制的crnn珍稀动物识别与定位方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073689A (ja) * | 2000-08-31 | 2002-03-12 | Kajima Corp | 情報収集システム |
US20030125946A1 (en) * | 2002-01-03 | 2003-07-03 | Wen-Hao Hsu | Method and apparatus for recognizing animal species from an animal voice |
CN101594527A (zh) * | 2009-06-30 | 2009-12-02 | 成都艾索语音技术有限公司 | 从音频视频流中高精度检测模板的两阶段方法 |
CN105206270A (zh) * | 2015-08-20 | 2015-12-30 | 长安大学 | 一种组合pca和rbm的孤立数字语音识别分类系统及方法 |
CN105575394A (zh) * | 2016-01-04 | 2016-05-11 | 北京时代瑞朗科技有限公司 | 基于全局变化空间及深度学习混合建模的声纹识别方法 |
CN105845140A (zh) * | 2016-03-23 | 2016-08-10 | 广州势必可赢网络科技有限公司 | 应用于短语音条件下的说话人确认方法和装置 |
-
2018
- 2018-04-24 CN CN201810371675.5A patent/CN108630209B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073689A (ja) * | 2000-08-31 | 2002-03-12 | Kajima Corp | 情報収集システム |
US20030125946A1 (en) * | 2002-01-03 | 2003-07-03 | Wen-Hao Hsu | Method and apparatus for recognizing animal species from an animal voice |
CN101594527A (zh) * | 2009-06-30 | 2009-12-02 | 成都艾索语音技术有限公司 | 从音频视频流中高精度检测模板的两阶段方法 |
CN105206270A (zh) * | 2015-08-20 | 2015-12-30 | 长安大学 | 一种组合pca和rbm的孤立数字语音识别分类系统及方法 |
CN105575394A (zh) * | 2016-01-04 | 2016-05-11 | 北京时代瑞朗科技有限公司 | 基于全局变化空间及深度学习混合建模的声纹识别方法 |
CN105845140A (zh) * | 2016-03-23 | 2016-08-10 | 广州势必可赢网络科技有限公司 | 应用于短语音条件下的说话人确认方法和装置 |
Non-Patent Citations (2)
Title |
---|
张学锋: "融合LPC与MFCC的特征参数", 《计算机工程》 * |
苑津莎: "基于主成分分析和概率神经网络的变压器局部放电模式识别", 《电力自动化设备》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109409308A (zh) * | 2018-11-05 | 2019-03-01 | 中国科学院声学研究所 | 一种基于鸟类鸣声的鸟类物种识别的方法 |
CN110398744A (zh) * | 2019-07-26 | 2019-11-01 | 中国人民解放军国防科技大学 | 一种基于声信号的海洋温跃层特征参数寻优反演方法 |
CN110658476A (zh) * | 2019-10-16 | 2020-01-07 | 北京航空航天大学 | 一种随机充放电条件下锂电池容量加速衰减的判定方法 |
CN111060975A (zh) * | 2019-12-02 | 2020-04-24 | 上海微波技术研究所(中国电子科技集团公司第五十研究所) | 用于探地雷达目标检测的方法 |
CN111060975B (zh) * | 2019-12-02 | 2022-03-18 | 上海微波技术研究所(中国电子科技集团公司第五十研究所) | 用于探地雷达目标检测的方法 |
CN111540373B (zh) * | 2020-01-12 | 2022-12-02 | 杭州电子科技大学 | 基于超复数随机神经网络的城市噪声识别方法 |
CN111540373A (zh) * | 2020-01-12 | 2020-08-14 | 杭州电子科技大学 | 基于超复数随机神经网络的城市噪声识别方法 |
CN111341351A (zh) * | 2020-02-25 | 2020-06-26 | 厦门亿联网络技术股份有限公司 | 基于自注意力机制的语音活动检测方法、装置及存储介质 |
CN112735443A (zh) * | 2020-12-25 | 2021-04-30 | 浙江弄潮儿智慧科技有限公司 | 一种具有自动分类的海洋空间资源管理系统及其自动分类方法 |
CN112735443B (zh) * | 2020-12-25 | 2024-06-07 | 浙江弄潮儿智慧科技有限公司 | 一种具有自动分类的海洋空间资源管理系统及其自动分类方法 |
CN117078116A (zh) * | 2023-10-17 | 2023-11-17 | 华能(浙江)能源开发有限公司清洁能源分公司 | 风电场选址对海洋生物群落影响的鲁棒性分析方法及系统 |
CN117078116B (zh) * | 2023-10-17 | 2024-02-27 | 华能(浙江)能源开发有限公司清洁能源分公司 | 风电场选址对海洋生物群落影响的鲁棒性分析方法及系统 |
CN117292693A (zh) * | 2023-11-27 | 2023-12-26 | 安徽大学 | 融入自注意力机制的crnn珍稀动物识别与定位方法 |
CN117292693B (zh) * | 2023-11-27 | 2024-02-09 | 安徽大学 | 融入自注意力机制的crnn珍稀动物识别与定位方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108630209B (zh) | 2021-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108630209A (zh) | 一种基于特征融合与深度置信网络的海洋生物识别方法 | |
CN108922513B (zh) | 语音区分方法、装置、计算机设备及存储介质 | |
CN110610708B (zh) | 一种基于布谷鸟搜索算法的声纹识别攻击防御方法 | |
CN102881289B (zh) | 一种基于听觉感知特性的语音质量客观评价方法 | |
CN110245608A (zh) | 一种基于半张量积神经网络的水下目标识别方法 | |
CN107633842A (zh) | 语音识别方法、装置、计算机设备及存储介质 | |
CN101452698B (zh) | 一种自动嗓音谐噪比分析方法 | |
CN109256118B (zh) | 基于生成式听觉模型的端到端汉语方言识别系统和方法 | |
CN108417228A (zh) | 乐器音色迁移下的人声音色相似性度量方法 | |
CN108597505A (zh) | 语音识别方法、装置及终端设备 | |
CN104978507A (zh) | 一种基于声纹识别的智能测井评价专家系统身份认证方法 | |
CN110223708A (zh) | 基于语音处理的语音增强方法及相关设备 | |
CN104887263A (zh) | 一种基于心音多维特征提取的身份识别算法及其系统 | |
CN110070888A (zh) | 一种基于卷积神经网络的帕金森语音识别方法 | |
CN109378014A (zh) | 一种基于卷积神经网络的移动设备源识别方法及系统 | |
Wei et al. | A method of underwater acoustic signal classification based on deep neural network | |
CN109631104A (zh) | 油烟机的风量自动调节方法、装置、设备及存储介质 | |
CN109036470A (zh) | 语音区分方法、装置、计算机设备及存储介质 | |
CN109065073A (zh) | 基于深度svm网络模型的语音情感识别方法 | |
CN112183582A (zh) | 一种多特征融合的水下目标识别方法 | |
CN110610722B (zh) | 短时能量及梅尔倒谱系数联合新型矢量量化的低复杂度危险声场景判别方法 | |
CN111243621A (zh) | 一种用于合成语音检测的gru-svm深度学习模型的构造方法 | |
CN113269305A (zh) | 一种加强记忆的反馈语音强化方法 | |
Lin et al. | Acoustic recognition method in low SNR based on human ear bionics | |
CN111785262A (zh) | 一种基于残差网络及融合特征的说话人年龄性别分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210525 |