CN102799892A - 一种mfcc水下目标特征提取和识别方法 - Google Patents

一种mfcc水下目标特征提取和识别方法 Download PDF

Info

Publication number
CN102799892A
CN102799892A CN2012101945305A CN201210194530A CN102799892A CN 102799892 A CN102799892 A CN 102799892A CN 2012101945305 A CN2012101945305 A CN 2012101945305A CN 201210194530 A CN201210194530 A CN 201210194530A CN 102799892 A CN102799892 A CN 102799892A
Authority
CN
China
Prior art keywords
formula
sigma
carry out
mfcc
triangular filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101945305A
Other languages
English (en)
Other versions
CN102799892B (zh
Inventor
曹红丽
方世良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201210194530.5A priority Critical patent/CN102799892B/zh
Publication of CN102799892A publication Critical patent/CN102799892A/zh
Application granted granted Critical
Publication of CN102799892B publication Critical patent/CN102799892B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

一种MFCC水下目标特征提取和识别方法,包括步骤:1)获取数据序列x(n);2)进行分帧处理得到xi(n);3)通过加窗操作得到yi(n);4)计算分帧加窗信号的单边功率谱密度pi(l);5)求解三角滤波器组的传递函数Hm(f),通过三角滤波器组得到Q;6)进行对数变换得到E;7)分别进行t方向和f方向的Sobel算子和拉普拉斯算子3×3的模板块运算得到A、B和C;8)分别进行DCT变换得到特征集CA,CB,CC,组合特征;9)通过基于EM算法的混合高斯模型的聚类分类器进行水下目标识别。本方法有利于提高水下目标的识别率。

Description

一种MFCC水下目标特征提取和识别方法
技术领域
本发明涉及水下目标的分类识别技术,尤其涉及一种新的MFCC水下目标特征提取和识别方法。
背景技术
海洋环境的复杂多变性使得目标特性很难定性描述,因此,水下目标的分类识别是水声信号处理的难题。
发明内容
技术问题:本发明所要解决的技术问题是:提供一种新的MFCC水下目标特征提取和识别方法,该方法利用人耳对声音的非线性辨别能力,通过图像锐化处理中的Sobel算子和拉普拉斯算子运算,获得基于图像处理的新的MFCC特征,并采用基于EM算法的混合高斯模型的聚类分类器,仿真结果具有高识别率。
技术方案:为解决上述技术问题,本发明的一种新的MFCC水下目标特征提取和识别方法:首先对水下目标信号(即舰船辐射噪声信号)分别进行分帧加窗的单边功率谱求取,求解基于Mel频率的三角滤波器的频域传递函数,将水下目标信号的功率谱与三角滤波器组相乘并进行对数变化,经过t方向和f方向的Sobel算子和拉普拉斯算子运算,最后进行DCT变化去除特征间的相关性,设计基于EM算法的混合高斯模型的聚类分类器,提高水下目标的识别率。
本发明的原理是利用了人耳对声音的非线性辨别能力,采用倒谱技术中的MFCC方法,将水下目标发声体和信道的频谱分开,从而提取发声体的特征,并利用图像锐化处理中的线性微分算子运算,提取有利的细微变化特征,设计基于EM算法的混合高斯模型的聚类分类器。
本发明方法的具体实现方式包括以下步骤:
第一步:获取舰船辐射噪声信号对应的数据序列x(n):接收长度为N的实时采集数据或提取N点存储的现成数据作为待处理的数据序列x(n),n=0,1,…N-1,数据的采样率为fs
第二步:进行分帧处理得到xi(n):对第一步的数据序列x(n)进行分帧处理,得到每一帧数据序列xi(n),其中,
xi(n)=x(n+id)           式(1)
在式(1)中,n=0,1,…L-1,i=0,1,…K-1,
Figure BDA00001761032500021
Figure BDA00001761032500022
表示向下取整运算;L表示xi(n)的数据长度,d表示帧之间的重复数据数目,K表示帧的数目;
第三步:通过加窗操作得到yi(n):对每一帧数据序列xi(n)(i=0,1,…K-1)进行加窗处理,得到yi(n),其中,
yi(n)=xi(n)w(n)         式(2)
在式(2)中,i=0,1,…K-1,n=0,1,…L-1,w(n)=0.54-0.46cos(2πn/L),;w(n)表示窗函数;
第四步:计算分帧加窗信号的单边功率谱密度pi(l):对数据序列yi(n)求解单边功率谱密度pi(l),其中,
p i ( l ) = | Σ n = 0 L - 1 y i ( n ) exp { - j 2 πnl / L } | 2 式(3)
在式(3)中,l=0,1,…L/2+1,||表示绝对值运算,j表示虚数单位,即i=0,1,2,…,K-1;
第五步:求解三角滤波器组的传递函数Hm(l),通过三角滤波器组得到Q:求解三角滤波器组在频域的传递函数Hm(l),从第四步的分帧的单边功率谱密度pi(l)通过三角滤波器组得到Q,其中,
Q ( m , i ) = Σ l = 0 L / 2 + 1 H m ( l ) p i ( l ) 式(4)
在式(4)中,Hm(l)表示三角滤波器的传递函数,l=0,1,…L/2+1;i=0,1,…K-1。
将范围在(0,fs/2)的频率f均等分成L/2+1个频率点,按照式(5)计算Mel频率值
mel=2595log(1+f/700)        式(5)
将mel均等分成M+2个Mel频率值,mel的取值范围在(0,2595log(1+fs/700)),依次对每个Mel频率值找f中对应最接近的频率值点,组成[f(0),f(2),…f(m),…f(M+1)],按照式(6)计算Hm(f),将Hm(f)中的f按照序号表示,得到Hm(l),l=0,1,…L/2+1,
H m ( f ) = 0 , f < f ( m - 1 ) 2 ( f - f ( m - 1 ) ) ( f ( m + 1 ) - f ( m - 1 ) ) ( f ( m ) - f ( m - 1 ) ) , f ( m - 1 ) &le; f < f ( m ) 2 ( f ( m + 1 ) - f ( m ) ) ( f ( m + 1 ) - f ( m - 1 ) ) ( f ( m + 1 ) - f ( m ) ) , f ( m ) &le; f < f ( m + 1 ) 0 , f &GreaterEqual; f ( m + 1 ) 式(6)
在式(5)(6)中,m=1,2,…M,M表示三角滤波器的个数。
第六步:进行对数变换得到E:对Q进行对数变化得到E,其中,
E(m,i)=log(Q(m,i))           式(7)
在式(7)中,将E(m,i)小于1的置为1;m=1,2,…M,i=0,1,…K-1。
第七步:分别进行t方向和f方向的Sobel算子和拉普拉斯算子3×3的模板块运算得到A,B和C:将E通过3×3的模板块运算得到A,B和C,其中,
U ( m , i ) = &Sigma; T , F = - 1 1 E ( m + T , i + F ) d U ( T , F ) 式(8)
在式(8)中,U的第一行、最后一行、第一列和最后一列不做变换,U的其余行和列按照式(6)计算,dU表示Sobel算子和拉普拉斯算子3×3的模板,U=A,B,C;m=1,2,…M,i=0,1,…K-1。
第八步:分别进行DCT变换得到特征集CA,CB,CC,组合特征D:将第七步中得到的A,B和C进行离散余弦变换分别得到CA,CB,CC,并对CA,CB,CC按列取平均得到DA,DB,DC,最后拼接成组合特征D,其中,
C U ( n , i ) = &Sigma; m = 1 M U ( m , i ) cos { &pi; ( m - 0.5 ) n / M } 式(9)
D U = 1 K &Sigma; i = 1 K C U ( n , i ) 式(10)
在式(9)(10)中,n=1,2,…p,p表示每一帧数据的特征数目;U=A,B,C,i=0,1,…K-1。
第九步:通过基于EM算法的混合高斯模型的聚类分类器进行水下目标识别:按照第八步得到的特征数据集x={x1,x2,...xNum}作为基于EM算法的混合高斯模型的聚类分类器的输入,首先训练混合高斯模型的各参数,最后根据概率密度最高原则进行聚类,C={C1,C2,…CR},其中,混合高斯模型如式(11)(12)
P = &Sigma; i = 1 R &alpha; i P i ( x | &upsi; i ) 式(11)
P i ( x | &upsi; i ) = ( 2 &pi; ) - d 2 | &Sigma; i - 1 2 | exp ( - 1 2 ( x - &mu; i ) T &Sigma; i - 1 ( x - &mu; i ) ) 式(12)
在式(11)(12)中,μi表示第i-分支的期望,∑i是第i-分支的协方差矩阵,R表示混合高斯模型的模型阶数。
设置初始值,依次按照式(13)(14)(15)(16)进行迭代,直到满足终止条件,停止迭代。
w ij = | &Sigma; i ( t ) - 1 2 | exp ( - 1 2 ( x i - &mu; j ( t ) ) T &Sigma; j ( t ) - 1 ( x i - &mu; j ( t ) ) ) &Sigma; k = 1 R | &Sigma; k ( t ) - 1 2 | exp ( - 1 2 ( x i - &mu; k ( t ) ) T &Sigma; j ( t ) - 1 ( x i - &mu; k ( t ) ) ) 式(13)
&alpha; ^ j = 1 Num &Sigma; i = 1 Num w ij 式(14)
&mu; ^ j = &Sigma; i = 1 Num w ij x i N &alpha; ^ j 式(15)
&Sigma; ^ j = 1 Num &alpha; ^ j &Sigma; i = 1 Num w ij x i ( x i - &mu; ^ j ) ( x i - &mu; ^ j ) T 式(16)
在式(13)(14)(15)(16)中,j=1,2,…,R
有益效果:与现有技术相比,本发明具有以下有益效果:
1.将水下目标看成是发声体,海洋环境及其他的环境看成是信道,则人耳听到的水下目标声音使发声体和信道在时域上的卷积,频域上则是乘积,利用倒谱技术将发声体和信道分开,从而提取发声体相关的自身的物理特征,因此本发明具有明确的物理意义。
2.通过倒谱技术中的MFCC技术,利用人耳对声音的非线性辨别能力,将发声体和信道的频谱转化为Mel频率段的功率谱特征,有效细化了特征。又利用图像锐化处理,通过Sobel算子和拉普拉斯算计运算,以上两种算子是线性微分算子,微分即是求导变化,因此提取MFCC中的细微变化特征,本发明有利于提高水下目标的识别率。
附图说明
图1所示为本发明的流程图。
图2-1~2-3所示为实施例2中水下目标A经过t方向、f方向的Sobel算子及拉普拉斯算子运算的时频图;其中,
图2-1是t方向的Solbel算子时频图;
图2-2是f方向的Solbel算子时频图;
图2-3是拉普拉斯算子时频图;
图3-1~3-3所示为实施例2中水下目标B经过t方向、f方向的Sobel算子及拉普拉斯算子运算的时频图;其中,
图3-1是t方向的Solbel算子时频图;
图3-2是f方向的Solbel算子时频图;
图3-3是拉普拉斯算子时频图;
图4-1~4-3所示为实施例2中水下目标C经过t方向、f方向的Sobel算子及拉普拉斯算子运算的时频图;其中,
图4-1是t方向的Solbel算子时频图;
图4-2是f方向的Solbel算子时频图;
图4-3是拉普拉斯算子时频图。
具体实施方式
下面结合附图,对本发明的技术方案进行详细的说明。
如图1所示,本发明的一新的MFCC水下目标特征提取和识别方法,包括以下步骤:
第一步:获取数据序列x(n):接收长度为N的实时采集数据或提取N点存储的现成数据作为待处理的数据序列x(n),n=0,1,…N-1,数据的采样率为fs=22.5KHz;
第二步:进行分帧处理得到xi(n):对第一步的数据序列x(n)进行分帧处理,得到每一帧数据序列xi(n),其中,
xi(n)=x(n+id)        式(1)
在式(1)中,n=0,1,…L-1,i=0,1,…K-1,d和L的取值分别为256和512,根据
Figure BDA00001761032500061
公式计算帧的数目;
第三步:通过加窗操作得到yi(n):对每一帧数据序列xi(n)(i=0,1,…K-1)进行加窗处理,得到yi(n),其中,
yi(n)=xi(n)w(n)      式(2)
在式(2)中,i=0,1,…K-1,n=0,1,…L-1,其中w(n)为海明窗,窗函数为w(n)=0.54-0.46cos(2πn/L),;
第四步:计算分帧加窗信号的单边功率谱密度pi(l):对数据序列yi(n)求解单边功率谱密度pi(l),其中,
p i ( l ) = | &Sigma; n = 0 L - 1 y i ( n ) exp { - j 2 &pi;nl / L } | 2 式(3)
在式(3)中,l=0,1,…L/2+1,||表示绝对值运算,j表示虚数单位,即
Figure BDA00001761032500063
i=0,1,2,…,K-1;
在第四步中,离散傅里叶变换可用快速傅里叶变换。
第五步:求解三角滤波器组的传递函数Hm(l),通过三角滤波器组得到Q:求解三角滤波器组在频域的传递函数Hm(l),从第四步的分帧的单边功率谱密度pi(l)通过三角滤波器组得到Q,其中,
Q ( m , i ) = &Sigma; l = 0 L / 2 + 1 H m ( l ) p i ( l ) 式(4)
在式(4)中,Hm(l)表示三角滤波器的传递函数,l=0,1,…L/2+1;i=0,1,…K-1。
将范围在(0,fs/2)的频率f均等分成L/2+1个频率点,按照式(5)计算Mel频率值
mel=2595log(1+f/700)        式(5)
将mel均等分成M+2个Mel频率值,mel的取值范围在(0,2595log(1+fs/700)),依次对每个Mel频率值找f中对应最接近的频率值点,组成[f(0),f(2),…f(m),…f(M+1)],按照式(6)计算Hm(f),将Hm(f)中的f按照序号表示,得到Hm(l),l=0,1,…L/2+1,
H m ( f ) = 0 , f < f ( m - 1 ) 2 ( f - f ( m - 1 ) ) ( f ( m + 1 ) - f ( m - 1 ) ) ( f ( m ) - f ( m - 1 ) ) , f ( m - 1 ) &le; f < f ( m ) 2 ( f ( m + 1 ) - f ( m ) ) ( f ( m + 1 ) - f ( m - 1 ) ) ( f ( m + 1 ) - f ( m ) ) , f ( m ) &le; f < f ( m + 1 ) 0 , f &GreaterEqual; f ( m + 1 ) 式(6)
在式(5)(6)中,m=1,2,…M,M表示三角滤波器的个数,取为36。
第六步:进行对数变换得到E:对Q进行对数变化得到E,其中,
E(m,i)=log(Q(m,i))          式(7)
在式(7)中,将E(m,i)小于1的置为1;m=1,2,…M,i=0,1,…K-1。
第七步:分别进行t方向和f方向的Sobel算子和拉普拉斯算子3×3的模板块运算得到A,B和C:将E通过3×3的模板块运算得到A,B和C,其中,
U ( m , i ) = &Sigma; T , F = - 1 1 E ( m + T , i + F ) d U ( T , F ) 式(8)
在式(8)中,U的第一行、最后一行、第一列和最后一列不做变换,U的其余行和列按照式(6)计算,dU表示Sobel算子和拉普拉斯算子3×3的模板,U=A,B,C;m=1,2,…M,i=0,1,…K-1。
其中t方向和f方向的Sobel算子和拉普拉斯算子3×3模板为:
1 2 1 0 0 0 - 1 - 2 - 1 1 0 - 1 2 0 - 1 1 0 - 1 0 - 1 0 - 1 4 - 1 0 - 1 0
X方向Sobel算子    Y方向Sobel算子    拉普拉斯算子
第八步:分别进行DCT变换得到特征集CA,CB,CC,组合特征D:将第七步中得到的A,B和C进行离散余弦变换分别得到CA,CB,CC,并对CA,CB,CC按列取平均得到DA,DB,DC,最后拼接成组合特征D,其中,
C U ( n , i ) = &Sigma; m = 1 M U ( m , i ) cos { &pi; ( m - 0.5 ) n / M } 式(9)
D U = 1 K &Sigma; i = 1 K C U ( n , i ) 式(10)
在式(9)(10)中,n=1,2,…p,p表示每一帧数据的特征数目;U=A,B,C,i=0,1,…K-1。
第九步:通过基于EM算法的混合高斯模型的聚类分类器进行水下目标识别:按照第八步得到的特征数据集x={x1,x2,...xNum},作为基于EM算法的混合高斯模型的聚类分类器的输入,首先训练混合高斯模型的各参数,最后根据概率密度最高原则进行聚类,C={C1,C2,…CR},其中,混合高斯模型如式(11)(12)
P = &Sigma; i = 1 R &alpha; i P i ( x | &upsi; i ) 式(11)
P i ( x | &upsi; i ) = ( 2 &pi; ) - d 2 | &Sigma; i - 1 2 | exp ( - 1 2 ( x - &mu; i ) T &Sigma; i - 1 ( x - &mu; i ) ) 式(12)
在式(11)(12)中,μi表示第i-分支的期望,∑i是第i-分支的协方差矩阵,混合高斯模型的模型阶数为3。
μi和∑i的初始值设置采用K-means方法,依次按照式(13)(14)(15)(16)进行迭代,直到满足前后两次迭代的参数误差平方和不超过0.01,停止迭代。
w ij = | &Sigma; i ( t ) - 1 2 | exp ( - 1 2 ( x i - &mu; j ( t ) ) T &Sigma; j ( t ) - 1 ( x i - &mu; j ( t ) ) ) &Sigma; k = 1 R | &Sigma; k ( t ) - 1 2 | exp ( - 1 2 ( x i - &mu; k ( t ) ) T &Sigma; j ( t ) - 1 ( x i - &mu; k ( t ) ) ) 式(13)
&alpha; ^ j = 1 Num &Sigma; i = 1 Num w ij 式(14)
&mu; ^ j = &Sigma; i = 1 Num w ij x i N &alpha; ^ j 式(15)
&Sigma; ^ j = 1 Num &alpha; ^ j &Sigma; i = 1 Num w ij x i ( x i - &mu; ^ j ) ( x i - &mu; ^ j ) T 式(16)
在式(13)(14)(15)(16)中,j=1,2,3。
基于EM算法的混合高斯模型的聚类算法属于现有技术,例如《通信技术》2010年,11(43)的第150页至第152页中公开的内容。
具体来说:
实施例1
仿真模型:线谱用周期信号产生,环境噪声用零均值的高斯白噪声产生,
Figure BDA00001761032500095
fi分别取30Hz,47Hz,65Hz,89Hz,110Hz,247Hz,580Hz,信噪比
Figure BDA00001761032500096
其中σ2为高斯白噪声的方差,采样频率fs为10KHz,每类的样本点数为4000,每类的样本数为100,信噪比取为-14dB,得到线谱信号和线谱信号加噪声的两类目标的识别率见表1。
表1两类目标信号不同信噪比时的识别率
Figure BDA00001761032500097
实施例2
三类水下目标A,B,C,采样频率为22.5KHz,每类样本的数目分别为48,在第一步分帧处理中,每一帧的长度为512,帧间的重复数据数目为256。三角滤波器组的数目为36,进行DCT变换的特征维数为24,则最后组合的特征维数为66。基于EM算法的混合高斯模型的聚类分类器,均值和方差的初始值设置采用K-means方法设置,分类器停止迭代的条件为前后两次的参数误差平方和不超过0.01。其中图2,3,4分别为水下目标A,B,C,经过三角滤波器组后通过线性微分算子(t方向和f方向的Sobel算子和拉普拉斯算子运算后的时频图)。三类水下目标的识别率见表2。
表2三类水下目标的识别率
Figure BDA00001761032500101
从实施例1的结果可以看出,本发明特征提取和识别方法具有一定的抗噪能力,从实施例2中的结果可以看出,本发明特征提取和识别方法具有高识别率。

Claims (5)

1.一种MFCC水下目标特征提取和识别方法,其特征在于,步骤包括:
首先,对水下目标信号即舰船辐射噪声信号分别进行分帧加窗的单边功率谱求取;
接下来,求解基于Mel频率的三角滤波器的频域传递函数;
然后,将水下目标信号的功率谱与三角滤波器组相乘并进行对数变化,经过t方向和f方向的Sobel算子和拉普拉斯算子运算;
最后,进行DCT变化去除特征间的相关性,设计基于EM算法的混合高斯模型的聚类分类器。
2.按照权利要求1所述的一种新的MFCC水下目标特征提取和识别方法,其特征在于,本方法具体包括以下步骤:
第一步:获取舰船辐射噪声信号对应的数据序列x(n):
接收长度为N的实时采集数据,或提取N点存储的现成数据作为待处理的数据序列x(n),n=0,1,…N-1,数据的采样率为fs
第二步:进行分帧处理得到xi(n):
对第一步的数据序列x(n)进行分帧处理,得到每一帧数据序列xi(n),其中,
xi(n)=x(n+id)        式(1)
在式(1)中,n=0,1,…L-1,i=0,1,…K-1,
Figure FDA00001761032400011
Figure FDA00001761032400012
表示向下取整运算;L表示xi(n)的数据长度,d表示帧之间的重复数据数目,K表示帧的数目;
第三步:通过加窗操作得到yi(n):
对每一帧数据序列xi(n)(i=0,1,…K-1)进行加窗处理,得到yi(n),其中,
yi(n)=xi(n)w(n)      式(2)
在式(2)中,i=0,1,…K-1,n=0,1,…L-1,w(n)=0.54-0.46cos(2πn/L),;w(n)表示窗函数;
第四步:计算分帧加窗信号的单边功率谱密度pi(l):
对数据序列yi(n)求解单边功率谱密度pi(l),其中,
p i ( l ) = | &Sigma; n = 0 L - 1 y i ( n ) exp { - j 2 &pi;nl / l } | 2 式(3)
在式(3)中,l=0,1,…L/2+1,||表示绝对值运算,j表示虚数单位,即
Figure FDA00001761032400022
i=0,1,2,…,K-1;
第五步:求解三角滤波器组的传递函数Hm(l),通过三角滤波器组得到Q,其中,Q表示运算的结果,无特指含义:
求解三角滤波器组在频域的传递函数Hm(l),从第四步的分帧的单边功率谱密度pi(l)通过三角滤波器组得到Q,其中,
Q ( m , i ) = &Sigma; l = 0 L / 2 + 1 H m ( l ) p i ( l ) 式(4)
在式(4)中,Hm(l)表示三角滤波器的传递函数,l=0,1,…L/2+1;i=0,1,…K-1;
将范围在(0,fs/2)的频率f均等分成L/2+1个频率点,按照式(5)计算Mel频率值mel=2595log(1+f/700)        式(5)
将mel均等分成M+2个Mel频率值,mel的取值范围在(0,2595log(1+fs/700)),依次对每个Mel频率值找f中对应最接近的频率值点,组成[f(0),f(2),…f(m),…f(M+1)],按照式(6)计算Hm(f),将Hm(f)中的f按照序号表示,得到Hm(l),l=0,1,…L/2+1,
H m ( f ) = 0 , f < f ( m - 1 ) 2 ( f - f ( m - 1 ) ) ( f ( m + 1 ) - f ( m - 1 ) ) ( f ( m ) - f ( m - 1 ) ) , f ( m - 1 ) &le; f < f ( m ) 2 ( f ( m + 1 ) - f ( m ) ) ( f ( m + 1 ) - f ( m - 1 ) ) ( f ( m + 1 ) - f ( m ) ) , f ( m ) &le; f < f ( m + 1 ) 0 , f &GreaterEqual; f ( m + 1 ) 式(6)
在式(5)(6)中,m=1,2,…M,M表示三角滤波器的个数;
第六步:进行对数变换得到E:
对Q进行对数变化得到E,其中,
E(m,i)=log(Q(m,i))        式(7)
在式(7)中,将E(m,i)小于1的置为1;m=1,2,…M,i=0,1,…K-1;
第七步:分别进行t方向和f方向的Sobel算子和拉普拉斯算子3×3的模板块运算得到A,B和C,其中A,B和C是运算得到的结果,无特指含义:
将E通过3×3的模板块运算得到A,B和C,其中,
U ( m , i ) = &Sigma; T , F = - 1 1 E ( m + T , i + F ) d U ( T , F ) 式(8)
在式(8)中,U的第一行、最后一行、第一列和最后一列不做变换,U的其余行和列按照式(6)计算,dU表示Sobel算子和拉普拉斯算子3×3的模板,U=A,B,C;m=1,2,…M,i=0,1,…K-1;
第八步:分别进行DCT变换得到特征集CA,CB,CC,组合特征D:
将第七步中得到的A,B和C进行离散余弦变换分别得到CA,CB,CC,并对CA,CB,CC按列取平均得到DA,DB,DC,最后拼接成组合特征D,其中,
C U ( n , i ) = &Sigma; m = 1 M U ( m , i ) cos { &pi; ( m - 0.5 ) n / M } 式(9)
D U = 1 K &Sigma; i = 1 K C U ( n , i ) 式(10)
在式(9)(10)中,n=1,2,…p,p表示每一帧数据的特征数目;U=A,B,C,i=0,1,…K-1;
第九步:通过基于EM算法的混合高斯模型的聚类分类器进行水下目标识别。
3.按照权利要求1所述的一种MFCC水下目标特征提取和识别方法,其特征在于,所述第九步中,按照第八步得到的特征数据集x={x1,x2,...xNum}作为基于EM算法的混合高斯模型的聚类分类器的输入;
首先训练混合高斯模型的各参数,然后根据概率密度最高原则进行聚类,C={C1,C2,…CR},其中,混合高斯模型如式(11)、(12)
P = &Sigma; i = 1 R &alpha; i P i ( x | &upsi; i ) 式(11)
P i ( x | &upsi; i ) = ( 2 &pi; ) - d 2 | &Sigma; i - 1 2 | exp ( - 1 2 ( x - &mu; i ) T &Sigma; i - 1 ( x - &mu; i ) ) 式(12)
在式(11)(12)中,μi表示第i-分支的期望,∑i是第i-分支的协方差矩阵,R表示混合高斯模型的模型阶数;
设置初始值,依次按照式(13)(14)(15)(16)进行迭代,直到满足终止条件,停止迭代。
w ij = | &Sigma; i ( t ) - 1 2 | exp ( - 1 2 ( x i - &mu; j ( t ) ) T &Sigma; j ( t ) - 1 ( x i - &mu; j ( t ) ) ) &Sigma; k = 1 R | &Sigma; k ( t ) - 1 2 | exp ( - 1 2 ( x i - &mu; k ( t ) ) T &Sigma; j ( t ) - 1 ( x i - &mu; k ( t ) ) ) 式(13)
&alpha; ^ j = 1 Num &Sigma; i = 1 Num w ij 式(14)
&mu; ^ j = &Sigma; i = 1 Num w ij x i N &alpha; ^ j 式(15)
&Sigma; ^ j = 1 Num &alpha; ^ j &Sigma; i = 1 Num w ij x i ( x i - &mu; ^ j ) ( x i - &mu; ^ j ) T 式(16)
在式(13)(14)(15)(16)中,j=1,2,…,R。
4.按照权利要求1所述的一种MFCC水下目标特征提取和识别方法,其特征在于,所述的第七步中,Sobel算子和拉普拉斯算子3×3的模板为
( m - 1 , i - 1 ) ( m - 1 , i ) ( m - 1 , i + 1 ) ( m , i - 1 ) ( m , i ) ( m , i + 1 ) ( m + 1 , i - 1 ) ( m + 1 , i ) ( m + 1 , i + 1 ) .
5.按照权利要求1所述的一种MFCC水下目标特征提取和识别计方法,其特征在于,所述的第九步中,初始值设置采用K-means设置方法。
CN201210194530.5A 2012-06-13 2012-06-13 一种mfcc水下目标特征提取和识别方法 Active CN102799892B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210194530.5A CN102799892B (zh) 2012-06-13 2012-06-13 一种mfcc水下目标特征提取和识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210194530.5A CN102799892B (zh) 2012-06-13 2012-06-13 一种mfcc水下目标特征提取和识别方法

Publications (2)

Publication Number Publication Date
CN102799892A true CN102799892A (zh) 2012-11-28
CN102799892B CN102799892B (zh) 2015-04-01

Family

ID=47198991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210194530.5A Active CN102799892B (zh) 2012-06-13 2012-06-13 一种mfcc水下目标特征提取和识别方法

Country Status (1)

Country Link
CN (1) CN102799892B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593571A (zh) * 2013-11-22 2014-02-19 东南大学 基于模态分解的水下目标壳体径向振动低频声辐射信号快速估计方法
CN104268394A (zh) * 2014-09-24 2015-01-07 杭州电子科技大学 基于舰船辐射噪声时域特征的水声目标识别方法
CN104361197A (zh) * 2014-09-24 2015-02-18 杭州电子科技大学 基于舰船辐射噪声mfcc特征的水声目标识别方法
CN106644042A (zh) * 2016-11-25 2017-05-10 中国船舶重工集团公司第七0研究所 基于可控滤波器组的舰船噪声功率谱分析电路及其方法
CN107369444A (zh) * 2016-05-11 2017-11-21 中国科学院声学研究所 一种基于mfcc和人工神经网络的水下机动小目标识别方法
CN108038459A (zh) * 2017-12-20 2018-05-15 深圳先进技术研究院 一种水下生物的检测识别方法、终端设备及存储介质
CN108334893A (zh) * 2017-12-30 2018-07-27 中国科学院声学研究所 一种多亮点聚类分析的水下细长体特征识别方法
CN108918931A (zh) * 2018-09-11 2018-11-30 广东石油化工学院 一种负荷分解中功率信号自适应滤波方法
CN108918929A (zh) * 2018-09-11 2018-11-30 广东石油化工学院 一种负荷分解中功率信号自适应滤波方法
CN109257068A (zh) * 2018-09-11 2019-01-22 广东石油化工学院 一种电力线通信信号自适应滤波方法
CN109801236A (zh) * 2018-12-29 2019-05-24 中国科学院遥感与数字地球研究所 一种基于混合高斯模型的光子点云去噪方法
WO2021237958A1 (zh) * 2020-05-27 2021-12-02 苏州大学 基于特征提取和神经网络的水声目标测距方法
CN115223576A (zh) * 2022-06-23 2022-10-21 国网江苏省电力有限公司南京供电分公司 基于mfcc的变压器声纹特征可控精度提取和识别方法与系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289825A (zh) * 2011-07-08 2011-12-21 暨南大学 一种实时图像边缘检测电路及其实现方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289825A (zh) * 2011-07-08 2011-12-21 暨南大学 一种实时图像边缘检测电路及其实现方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘珊: "水下被动目标语音特征和分形特征提取研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 6, 15 June 2010 (2010-06-15), pages 138 - 462 *
赵亚楠等: "LP基础上的MFCC方法在水下目标识别中的应用", 《声学技术》, vol. 30, no. 4, 31 August 2011 (2011-08-31), pages 35 - 38 *
陆振波等: "基于MFCC的舰船辐射噪声特征提取", 《舰船科学技术》, vol. 26, no. 2, 30 April 2004 (2004-04-30), pages 51 - 54 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593571B (zh) * 2013-11-22 2017-01-18 东南大学 基于模态分解的水下目标壳体径向振动低频声辐射信号快速估计方法
CN103593571A (zh) * 2013-11-22 2014-02-19 东南大学 基于模态分解的水下目标壳体径向振动低频声辐射信号快速估计方法
CN104268394A (zh) * 2014-09-24 2015-01-07 杭州电子科技大学 基于舰船辐射噪声时域特征的水声目标识别方法
CN104361197A (zh) * 2014-09-24 2015-02-18 杭州电子科技大学 基于舰船辐射噪声mfcc特征的水声目标识别方法
CN104268394B (zh) * 2014-09-24 2017-06-09 杭州电子科技大学 基于舰船辐射噪声时域特征的水声目标识别方法
CN107369444A (zh) * 2016-05-11 2017-11-21 中国科学院声学研究所 一种基于mfcc和人工神经网络的水下机动小目标识别方法
CN106644042B (zh) * 2016-11-25 2019-10-18 中国船舶重工集团公司第七一0研究所 基于可控滤波器组的舰船噪声功率谱分析电路及其方法
CN106644042A (zh) * 2016-11-25 2017-05-10 中国船舶重工集团公司第七0研究所 基于可控滤波器组的舰船噪声功率谱分析电路及其方法
CN108038459A (zh) * 2017-12-20 2018-05-15 深圳先进技术研究院 一种水下生物的检测识别方法、终端设备及存储介质
CN108334893A (zh) * 2017-12-30 2018-07-27 中国科学院声学研究所 一种多亮点聚类分析的水下细长体特征识别方法
CN108334893B (zh) * 2017-12-30 2021-03-19 中国科学院声学研究所 一种多亮点聚类分析的水下细长体特征识别方法
CN108918929A (zh) * 2018-09-11 2018-11-30 广东石油化工学院 一种负荷分解中功率信号自适应滤波方法
CN109257068A (zh) * 2018-09-11 2019-01-22 广东石油化工学院 一种电力线通信信号自适应滤波方法
CN108918931B (zh) * 2018-09-11 2020-06-19 广东石油化工学院 一种负荷分解中功率信号自适应滤波方法
CN108918929B (zh) * 2018-09-11 2020-12-04 广东石油化工学院 一种负荷分解中功率信号自适应滤波方法
CN108918931A (zh) * 2018-09-11 2018-11-30 广东石油化工学院 一种负荷分解中功率信号自适应滤波方法
CN109257068B (zh) * 2018-09-11 2021-09-17 广东石油化工学院 一种电力线通信信号自适应滤波方法
CN109801236A (zh) * 2018-12-29 2019-05-24 中国科学院遥感与数字地球研究所 一种基于混合高斯模型的光子点云去噪方法
WO2021237958A1 (zh) * 2020-05-27 2021-12-02 苏州大学 基于特征提取和神经网络的水声目标测距方法
CN115223576A (zh) * 2022-06-23 2022-10-21 国网江苏省电力有限公司南京供电分公司 基于mfcc的变压器声纹特征可控精度提取和识别方法与系统

Also Published As

Publication number Publication date
CN102799892B (zh) 2015-04-01

Similar Documents

Publication Publication Date Title
CN102799892B (zh) 一种mfcc水下目标特征提取和识别方法
US20220343898A1 (en) Speech recognition method and apparatus, and computer-readable storage medium
CN107103908B (zh) 复调音乐多音高估计方法及伪双谱在多音高估计中的应用
CN103218524B (zh) 基于密度的欠定盲源分离方法
CN102054480B (zh) 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN102664010B (zh) 一种基于多因素频率位移不变特征的鲁棒说话人辨别方法
CN104375976B (zh) 基于张量正则分解的欠定盲源分离中的混合矩阵识别方法
CN102436809B (zh) 英语口语机考系统中网络语音识别方法
CN102222508A (zh) 一种基于矩阵变换的欠定盲分离方法
CN101833951A (zh) 用于说话人识别的多背景模型建立方法
CN103559888A (zh) 基于非负低秩和稀疏矩阵分解原理的语音增强方法
Jassim et al. New orthogonal polynomials for speech signal and image processing
CN103854646A (zh) 一种实现数字音频自动分类的方法
CN104809358A (zh) 一种基于相位噪声无意调制特征的雷达辐射源识别方法
CN102915742A (zh) 基于低秩与稀疏矩阵分解的单通道无监督语噪分离方法
CN108091345B (zh) 一种基于支持向量机的双耳语音分离方法
CN102789779A (zh) 一种语音识别系统及其识别方法
CN104732972A (zh) 一种基于分组统计的hmm声纹识别签到方法及系统
CN111128209A (zh) 一种基于混合掩蔽学习目标的语音增强方法
CN105469807A (zh) 一种多基频提取方法及装置
CN104732970A (zh) 一种基于综合特征的舰船辐射噪声识别方法
CN103077728A (zh) 一种病人虚弱语音端点检测方法
CN106373559A (zh) 一种基于对数谱信噪比加权的鲁棒特征提取方法
CN103559893B (zh) 一种水下目标gammachirp倒谱系数听觉特征提取方法
CN102623007B (zh) 基于可变时长的音频特征分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant