CN108694953A - 一种基于Mel子带参数化特征的鸟鸣自动识别方法 - Google Patents

一种基于Mel子带参数化特征的鸟鸣自动识别方法 Download PDF

Info

Publication number
CN108694953A
CN108694953A CN201710224881.9A CN201710224881A CN108694953A CN 108694953 A CN108694953 A CN 108694953A CN 201710224881 A CN201710224881 A CN 201710224881A CN 108694953 A CN108694953 A CN 108694953A
Authority
CN
China
Prior art keywords
mel
frame
birds
chirping
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710224881.9A
Other languages
English (en)
Inventor
张赛花
赵兆
许志勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201710224881.9A priority Critical patent/CN108694953A/zh
Publication of CN108694953A publication Critical patent/CN108694953A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种基于Mel子带参数化特征的鸟鸣自动识别方法。该方法针对自然复杂声学环境下基于鸟鸣的物种分类问题,首先采用高斯混合模型拟合连续声学监测数据分帧后的对数能量分布,选取高似然率的数据帧组成候选声音事件,结合基于候选事件能量的后处理过程,完成稳健检测与自动分段;然后在谱图域对相应片段采用Mel带通滤波器组滤波处理,基于自回归模型分别建模各个子带输出的随时间变化的能量序列,得到能够描述不同种类鸟鸣信号时频特性的参数化特征;最后利用支持向量机算法进行分类识别。本发明实现简单,对生态监测有重要意义。

Description

一种基于Mel子带参数化特征的鸟鸣自动识别方法
技术领域
本发明属于生态监测及声信号识别技术领域,具体是一种基于Mel子带参数化特征的鸟鸣自动识别方法,。
背景技术
生物多样性监测作为生态监测的重要组成部分,在研究物种资源与生态环境方面具有十分重要的意义。其中,鸟类作为一种对栖息地改变和环境变化反应极为敏感的环境指示生物,是生物多样性评估与监测、生态环境影响评价的重要指标。基于鸟鸣的鸟类自动监测是一种非侵入式的检测鸟类存在与活动性的方法,对生态学研究有重要意义。
其中,利用声学信号分析手段对野外实测鸟声信号提取特征,是后续进行大规模数据分析、数学建模以及模式识别的基础。近年来已有学者提出基于和差统计法提取鸟鸣片段谱图对应的纹理特征向量(魏静明,李应.利用抗噪纹理特征的快速鸟鸣声识别[J].电子学报,2015,43(1):185-190.),但是实验验证采用的数据样本均为手工截取的长度固定为2秒的片段,并未涉及鸣声片段的自动检测与提取,而对于野外大时间跨度连续声监测应用,人工截取片段方式不具有可行性,且上述方法对于持续时长变化的鸣声片段分类性能较差。
由此可知,现有技术存在方法不全面、功能单一等缺陷。
发明内容
本发明的目的在于提供一种基于Mel子带参数化特征的鸟鸣自动识别方法。
实现本发明目的的技术解决方案为:一种基于Mel子带参数化特征的鸟鸣自动识别方法,步骤如下:
步骤1、对野外实测的连续鸟声监测数据进行预处理,具体为统一采样率并计算功率谱图;
步骤2、对预处理后的连续鸟声数据进行自动分段,提取鸟鸣声片段;
步骤3、对步骤2得到的鸟鸣片段提取参数化特征;
步骤4、对步骤3提取出的特征建立数据库,进行鸟类物种的分类识别。
本发明与现有技术相比,其显著优点为:1)本发明的方法的数据是在野外自然复杂声学环境下录取,在各种背景噪声的影响下仍具有良好性能;2)本发明的方法对持续时长变化的鸟鸣声具有普适性;3)本发明的方法对不同类型的鸟类物种均具有良好的识别性能;4)本发明的方法数据可靠,易于实施,操作简单。
附图说明
图1是本发明基于Mel子带参数化特征的鸟鸣自动识别方法的流程图。
图2是本发明帧对数能量分布直方图及其高斯拟合曲线。
具体实施方式
下面结合附图对本发明作进一步详细描述。
结合图1,本发明的一种基于Mel子带参数化特征的鸟鸣自动识别方法,步骤如下:
步骤1、对野外实测的连续鸟声监测数据进行预处理;
步骤1-1、将野外实测的连续鸟声监测数据统一转换为相同的采样率;
步骤1-2、对连续鸟声监测数据进行分帧、加窗及短时傅里叶变换,得到功率谱图,功率谱图可以表示为如下形式:
SP=[sp(1),sp(2),…,sp(L)];
式中,L表示帧数,第l帧(1≤l≤L)频域向量为:
sp(l)=[|S(0,l)|2,|S(1,l)|2,…,|S(N/2-1,l)|2]T
其中,上标T表示转置,S(k,l),0≤k≤N/2-1表示在时频点(k,l)处的短时傅里叶变换结果,N为每帧信号进行快速傅里叶变换(Fast Fourier Transform,FFT)的点数,k为频率序号;。
步骤2、对预处理后的连续鸟声数据进行自动分段,提取鸟鸣声片段;
步骤2-1、设置频率下限和上限分别为fL和fH
步骤2-2、利用公式确定每一帧的短时能量;
式中,l为帧序号,k为频率序号,S(k,l)表示在时频点(k,l)处的短时傅里叶变换结果,NL和NH分别表示fL和fH对应的频率点序号,e(l)为第l帧的短时能量;
步骤2-3、利用公式le(l)=log10(e(l))确定每一帧的对数能量;
步骤2-4、结合图2,帧对数能量分布用含有两个高斯分量的GMM模型生成,则两个高斯分量可分别近似为鸣声事件帧集合以及环境噪声帧集合的概率密度函数,概率密度函数可表示为:
式中,对应于第m个高斯分量,μm为均值,为方差。wm表示高斯分量权重系数,0≤wm≤1,且满足
步骤2-5、对于第l帧,如果该帧属于鸣声事件帧集合的后验概率大于属于环境噪声帧集合的后验概率,则判决该帧归属某个鸣声片段,与该帧时间上连续且同样满足上述条件的其他帧也归属为该片段,输出鸣声片段集合记为D={AE1,AE2,…,AEK},其中K为片段个数;
步骤2-6、计算步骤2-5得到的鸣声片段集合中各个片段的能量,所用公式为:
最大值记为对于第k个片段,如果ME-EAEk≥20dB,则剔除这个生态研究价值较小的过弱片段。
步骤3、对步骤2得到的鸟鸣片段提取参数化特征;
步骤3-1、对第i个鸣声片段进行分帧、加窗及短时傅里叶变换,得到功率谱图SPi
步骤3-2、设置一个包含32个带通滤波器的Mel滤波器组,其中第1个子带的下限Mel频率与第32个子带的上限Mel频率分别对应步骤2-1中的fL和fH,其转换关系为:
fMel=1127×ln(1+f/700);
步骤3-3、Mel滤波器组中第j个带通滤波器离散化后在物理频率域的频率响应可以表示为:
h(j)=[hj(0),hj(1),…,hj(N/2-1)]T,j=1,2,...,32;
相应滤波器组的频率响应矩阵可表示为:
H=[h(1),h(2),…,h(32)]T
步骤3-4、鸣声片段经过并行滤波后的输出为:
Y=H·SPi
步骤3-5、计算第j个Mel子带内信号能量随时间变化的序列,所用公式为:
式中,表示矩阵第j行,mean(·)表示取均值,uj表示第j个Mel子带内信号能量随时间变化的序列;
步骤3-6、uj对应的Mj阶AR模型可表示为:
其中z(l)为零均值白噪声序列,模型参数即为uj对应的参数化特征,模型阶次Mj由AIC准则(Akaike Information Criterion,AIC)来确定。
步骤3-7、表征一个鸣声片段的参数化特征向量可以表示为:
其中j=1,2,...,32,M=10。当某个Mel子带输出序列uj对应模型阶次Mj小于M时,对应的vj最后M-Mj个系数设置为零。
步骤4、对步骤3提取出的特征建立数据库,进行鸟类物种的分类识别。鸟类物种的分类识别具体为:利用机器学习中的支持向量机分类器完成鸣声片段的自动物种分类。
下面结合实施例对本发明进行更详细的描述:
针对自然复杂声学环境下基于鸟鸣的物种分类问题,提出了一种基于Mel子带参数化特征的鸟鸣自动识别方法。该方法适用于各种类型的鸟类物种分类问题。具体过程为针对野外实测鸟声数据进行基于高斯混合模型的自动片段提取,采用基于候选事件能量的后处理过程剔除较弱的声音事件,然后基于自回归模型分别建模鸣声片段经过Mel带通滤波后各个子带输出的能量序列,得到能够描述不同种类鸟鸣信号谱模式信息的参数化特征,最后用支持向量机分类器进行分类识别。
结合图1,本发明基于Mel子带参数化特征的鸟鸣自动识别方法,步骤如下:
第一步,对在野外自然复杂声学环境下录取的鸟声数据进行预处理。首先将连续鸟声监测数据的采样率统一转换为32kHz,采样精度16bit,再对数据进行分帧、加窗及短时傅里叶变换,得到功率谱图,实例中取帧长为10ms,帧移为5ms,海明(Hamming)窗加权,每帧信号进行快速傅里叶变换的点数为512点。实施例从鸟声数据库下载11种鸟类的连续鸣声数据进行实验,分别为冠蓝鸦、歌带鹀、长嘴沼泽鹪鹩、黄喉地莺、棕顶雀鹀、美洲黄林莺、大蓝鹭、短嘴鸦、雪松太平鸟、家朱雀、靛蓝彩鹀。
第二步,对预处理后的连续鸟声数据进行自动分段,提取鸟鸣声片段。首先采用高斯混合模型拟合连续声学监测数据分帧后的对数能量分布,然后选取高似然率的数据帧组成候选声音事件,并结合基于候选事件能量的后处理过程,完成稳健检测与自动分段。具体过程如下:
(1)频率下限fL设为1kHz用于部分滤除普遍存在的风噪以及人类活动影响,频率上限fH设为16kHz。在[fL,fH]频带范围内计算短时帧能量然后取对数得到帧对数能量le(l)=log10(e(l));
(2)结合图2,用含有两个高斯分量的高斯混合模型拟合帧对数能量分布,则两个高斯分量可分别近似为鸣声事件帧集合以及环境噪声帧集合的概率密度函数。概率密度函数可表示为:
式中,对应于第m个高斯分量,μm为均值,为方差。wm表示高斯分量权重系数,0≤wm≤1,且满足实例中参数集{wm,μmm},m=1,2利用期望最大(expectation-maximization,EM)算法获得相应的最大似然估计。
(3)如果某帧属于鸣声事件帧集合的后验概率大于属于环境噪声帧集合的后验概率,则判决该帧归属某个鸣声片段,与该帧时间上连续且同样满足上述条件的其他帧也归属为该片段。鸣声片段集合记为:D={AE1,AE2,…,AEK},其中K为片段个数;
(4)计算鸣声片段集合中各个片段的对数能量,所用式子为:k=1,…,K,其中最大值记为对于第k个片段,如果ME-EAEk≥20dB,则从鸣声片段集合中剔除这个生态研究价值较小的过弱片段。实施例对11种鸟类通过上述自动分段方法处理后得到鸟鸣片段共2762个。
第三步,对得到的鸟鸣片段提取参数化特征。在谱图域对相应片段采用Mel带通滤波器组滤波处理,然后基于自回归模型分别建模各个子带输出的随时间变化的能量序列,得到能够描述不同种类鸟鸣信号时频特性的参数化特征。具体内容为:
(1)对第i个鸣声片段进行分帧、加窗及短时傅里叶变换,得到功率谱图SPi,实例中取帧长为10ms,帧移减小为2ms以便获得更高的时间分辨率;
(2)设置一个包含32个带通滤波器的Mel滤波器组,Mel滤波器组中第j个带通滤波器离散化后在物理频率域的频率响应为:
h(j)=[hj(0),hj(1),…,hj(N/2-1)]T,j=1,2,...,32;
相应滤波器组的频率响应矩阵为H=[h(1),h(2),…,h(32)]T
(3)第i个鸣声片段经过并行滤波后的输出Y=H·SPi
(4)计算第j个Mel子带内信号能量随时间变化的序列,所用公式为:
式中,表示矩阵第j行,mean(·)表示取均值,uj表示第j个Mel子带内信号能量随时间变化的序列,则集合{u1,…,u32}则表征了鸣声片段AEi在时频域上的谱模式信息;
(5)uj对应的Mj阶AR模型可表示为:
其中z(l)为零均值白噪声序列,模型参数即为uj对应的参数化特征。
由于不同Mel子带内信号能量随时间变化规律不同,相应AR模型的阶次也不同,实例中基于常用的AIC准则(Akaike Information Criterion,AIC)实现模型定阶。另外,针对大量野外实测记录研究发现最高阶次设为10阶可以获得较为满意结果。综上所述,用于表征一个鸣声片段的参数化特征向量可以表示为:其中j=1,2,…,32,M=10。当某个Mel子带输出序列uj对应模型阶次Mj小于M时,对应的vj最后M-Mj个系数设置为零。
第四步,对提取出的参数化特征建立数据库,并采用基于“one-versus-one”策略构造的多分类SVM实现鸣声片段的自动物种分类,实例中采用LIBSVM工具箱,选用径向基核函数(RadialBasis Function,RBF),并采用自动寻优方式设置惩罚因子c和核参数g,最终对应参数为c=8,g=0.0625。并采用查准率precision、查全率recall、F1度量等评价指标进行性能评估,定义分别如下:
式中,TP(True Positive)和FP(False Positive)分别表示测试集中该类所有正例被正确和错误分类的数目;而FN(False Negative)则指测试集中该类所有负例被错误分类的数目。
实施例进行了50次物种分类实验,每次实验采用无放回方式从每类物种中随机抽取60%样本(实验中每个片段对应特征向量称为一个样本)作为总体训练集,余下每类40%样本共同组成总体测试集,并对测试集的分类结果进行性能评估。表1给出了50次物种分类实验中11种鸟的各类平均查准率、查全率以及F1度量结果,由表中结果可知,11种鸟的各类平均查准率、查全率以及F1度量均不低于89%,说明本发明方法性能良好,适用于野外自然环境下连续监测鸟声数据的自动分析。
表1 50次物种分类实验的各类平均查准率、查全率以及F1度量
本发明的方法以野外实测数据为基础,采用基于高斯混合模型的片段自动检测方法,并提取描述不同种类鸟鸣信号多个频带谱包络特性的稳健参数化特征,最后基于机器学习的方法进行鸟类物种的分类识别。通过本发明的方法,可以对鸟类进行非侵入式的连续声学监测。因此,本发明可用于检测鸟类存在与活动性,对生态研究具有十分重要的意义。

Claims (5)

1.一种基于Mel子带参数化特征的鸟鸣自动识别方法,其特征在于步骤如下:
步骤1、对野外实测的鸟声连续监测数据进行预处理;
步骤2、对预处理后的连续监测数据进行自动分段,提取鸟鸣声片段;
步骤3、对步骤2得到的鸟鸣片段提取参数化特征;
步骤4、根据步骤3提取出的特征进行鸟类物种的分类识别。
2.根据权利要求1所述的基于Mel子带参数化特征的鸟鸣自动识别方法,其特征在于:步骤1对野外实测的鸟声连续监测数据进行预处理具体包括以下步骤:
步骤1-1、将野外实测的连续鸟声监测数据统一转换为相同的采样率;
步骤1-2、对连续鸟声监测数据进行分帧、加窗及短时傅里叶变换,得到功率谱图,功率谱图表示为如下形式:
SP=[sp(1),sp(2),…,sp(L)];
式中,L表示帧数,第l帧(1≤l≤L)频域向量为:
sp(l)=[|S(0,l)|2,|S(1,l)|2,…,|S(N/2-1,l)|2]T
其中,上标T表示转置,S(k,l),0≤k≤N/2-1表示在时频点(k,l)处的短时傅里叶变换结果,N为每帧信号进行快速傅里叶变换(Fast Fourier Transform,FFT)的点数,k为频率序号。
3.根据权利要求1所述的基于Mel子带参数化特征的鸟鸣自动识别方法,其特征在于:步骤2对连续鸟声监测数据进行自动分段具体包括以下步骤:
步骤2-1、设置频率下限和上限分别为fL和fH
步骤2-2、利用公式确定每一帧的短时能量;
式中,l为帧序号,k为频率序号,S(k,l)表示在时频点(k,l)处的短时傅里叶变换结果,NL和NH分别表示fL和fH对应的频率点序号,e(l)为第l帧的短时能量;
步骤2-3、利用公式le(l)=log10(e(l))确定每一帧的对数能量;
步骤2-4、帧对数能量分布用含有两个高斯分量的高斯混合模型(Gaussian MixtureModel,GMM)生成,则两个高斯分量分别近似为鸣声事件帧集合以及环境噪声帧集合的概率密度函数,概率密度函数表示为:
式中,对应于第m个高斯分量,μm为均值,为方差。wm表示高斯分量权重系数,0≤wm≤1,且满足
步骤2-5、对于第l帧,如果该帧属于环境噪声帧集合的后验概率大于属于鸣声事件帧集合的后验概率,判决该帧归属环境噪声,环境噪声帧不予处理;如果该帧属于鸣声事件帧集合的后验概率大于属于环境噪声帧集合的后验概率,则判决该帧归属某个鸣声片段,与该帧时间上连续且同样满足上述条件的其他帧也归属为该片段;
鸣声片段集合记为D={AE1,AE2,…,AEK},其中K为片段个数;
步骤2-6、计算步骤2-5得到的各个鸣声片段的对数能量,所用公式为:
最大值记为对于第k个片段,如果ME-EAEk≥20dB,则从鸣声片段集合中剔除这个生态研究价值较小的过弱片段。
4.根据权利要求1或3所述的基于Mel子带参数化特征的鸟鸣自动识别方法,其特征在于,步骤3对鸟鸣片段提取参数化特征具体为:
步骤3-1、根据步骤1-2计算第i个鸣声片段的功率谱图矩阵SPi
步骤3-2、设置一个包含32个带通滤波器的Mel滤波器组,其中第1个子带的下限Mel频率与第32个子带的上限Mel频率分别对应步骤2-1中的fL和fH,其转换关系为:
fMel=1127×ln(1+f/700);
步骤3-3、Mel滤波器组中第j个带通滤波器离散化后在物理频率域的频率响应表示为:
h(j)=[hj(0),hj(1),…,hj(N/2-1)]T,j=1,2,...,32;
相应滤波器组的频率响应矩阵表示为:
H=[h(1),h(2),…,h(32)]T
步骤3-4、第i个鸣声片段经过并行滤波后的输出为:
Y=H·SPi
步骤3-5、计算第j个Mel子带内信号能量随时间变化的序列,所用公式为:
式中,表示矩阵第j行,mean(·)表示取均值,uj表示第j个Mel子带内信号能量随时间变化的序列;
步骤3-6、uj对应的Mj阶自回归(AutoRegressive,AR)模型表示为:
其中z(l)为零均值白噪声序列,模型参数即为uj对应的参数化特征,模型阶次Mj由AIC准则(Akaike Information Criterion,AIC)来确定;
步骤3-7、表征一个鸣声片段的参数化特征向量表示为:
其中M=10;当某个Mel子带输出序列uj对应模型阶次Mj小于M时,对应的vj最后M-Mj个系数设置为零。
5.根据权利要求1所述的基于Mel子带参数化特征的鸟鸣自动识别方法,其特征在于,步骤4进行鸟类物种的分类识别具体为:利用机器学习中的支持向量机(Support VectorMachine,SVM)分类器完成鸣声片段的自动物种分类。
CN201710224881.9A 2017-04-07 2017-04-07 一种基于Mel子带参数化特征的鸟鸣自动识别方法 Pending CN108694953A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710224881.9A CN108694953A (zh) 2017-04-07 2017-04-07 一种基于Mel子带参数化特征的鸟鸣自动识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710224881.9A CN108694953A (zh) 2017-04-07 2017-04-07 一种基于Mel子带参数化特征的鸟鸣自动识别方法

Publications (1)

Publication Number Publication Date
CN108694953A true CN108694953A (zh) 2018-10-23

Family

ID=63842897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710224881.9A Pending CN108694953A (zh) 2017-04-07 2017-04-07 一种基于Mel子带参数化特征的鸟鸣自动识别方法

Country Status (1)

Country Link
CN (1) CN108694953A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109602421A (zh) * 2019-01-04 2019-04-12 平安科技(深圳)有限公司 健康监测方法、装置及计算机可读存储介质
CN109658948A (zh) * 2018-12-21 2019-04-19 南京理工大学 一种面向候鸟迁徙活动的声学监测方法
CN109741759A (zh) * 2018-12-21 2019-05-10 南京理工大学 一种面向特定鸟类物种的声学自动检测方法
CN111524536A (zh) * 2019-02-01 2020-08-11 富士通株式会社 信号处理方法和信息处理设备
CN111540368A (zh) * 2020-05-07 2020-08-14 广州大学 一种稳健的鸟声提取方法、装置及计算机可读存储介质
CN111916068A (zh) * 2019-05-07 2020-11-10 北京地平线机器人技术研发有限公司 音频检测方法和装置
CN113066481A (zh) * 2021-03-31 2021-07-02 南京信息工程大学 一种基于混合特征选择和gwo-kelm模型的鸟声识别方法
CN114638826A (zh) * 2022-05-13 2022-06-17 河南银金达新材料股份有限公司 一种光致变色阻隔膜的光学疲劳度检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489446A (zh) * 2013-10-10 2014-01-01 福州大学 复杂环境下基于自适应能量检测的鸟鸣识别方法
CN105378834A (zh) * 2013-07-05 2016-03-02 杜比国际公司 丢包掩蔽装置和方法以及音频处理系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105378834A (zh) * 2013-07-05 2016-03-02 杜比国际公司 丢包掩蔽装置和方法以及音频处理系统
CN103489446A (zh) * 2013-10-10 2014-01-01 福州大学 复杂环境下基于自适应能量检测的鸟鸣识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张赛花: ""基于Mel 子带参数化特征的自动鸟鸣识别"", 《计算机应用》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109658948A (zh) * 2018-12-21 2019-04-19 南京理工大学 一种面向候鸟迁徙活动的声学监测方法
CN109741759A (zh) * 2018-12-21 2019-05-10 南京理工大学 一种面向特定鸟类物种的声学自动检测方法
CN109741759B (zh) * 2018-12-21 2020-07-31 南京理工大学 一种面向特定鸟类物种的声学自动检测方法
CN109602421A (zh) * 2019-01-04 2019-04-12 平安科技(深圳)有限公司 健康监测方法、装置及计算机可读存储介质
CN111524536A (zh) * 2019-02-01 2020-08-11 富士通株式会社 信号处理方法和信息处理设备
CN111524536B (zh) * 2019-02-01 2023-09-08 富士通株式会社 信号处理方法和信息处理设备
CN111916068A (zh) * 2019-05-07 2020-11-10 北京地平线机器人技术研发有限公司 音频检测方法和装置
CN111540368A (zh) * 2020-05-07 2020-08-14 广州大学 一种稳健的鸟声提取方法、装置及计算机可读存储介质
CN111540368B (zh) * 2020-05-07 2023-03-14 广州大学 一种稳健的鸟声提取方法、装置及计算机可读存储介质
CN113066481A (zh) * 2021-03-31 2021-07-02 南京信息工程大学 一种基于混合特征选择和gwo-kelm模型的鸟声识别方法
CN113066481B (zh) * 2021-03-31 2023-05-09 南京信息工程大学 一种基于混合特征选择和gwo-kelm模型的鸟声识别方法
CN114638826A (zh) * 2022-05-13 2022-06-17 河南银金达新材料股份有限公司 一种光致变色阻隔膜的光学疲劳度检测方法

Similar Documents

Publication Publication Date Title
CN108694953A (zh) 一种基于Mel子带参数化特征的鸟鸣自动识别方法
Salamon et al. Towards the automatic classification of avian flight calls for bioacoustic monitoring
CN105841797B (zh) 一种基于mfcc和svm的车窗电机异常噪声检测方法及装置
Baumgartner et al. A generalized baleen whale call detection and classification system
CN112802484B (zh) 一种混合音频下的大熊猫声音事件检测方法及系统
Pace et al. Subunit definition and analysis for humpback whale call classification
CN111881723B (zh) 雷电地闪回击波形的自动识别方法、系统及电子设备
CN105841961A (zh) 一种基于Morlet小波变换和卷积神经网络的轴承故障诊断方法
CN109949823A (zh) 一种基于dwpt-mfcc与gmm的车内异响识别方法
CN101710490A (zh) 语音评测的噪声补偿方法及装置
Jiang et al. Clicks classification of sperm whale and long-finned pilot whale based on continuous wavelet transform and artificial neural network
CN111724770B (zh) 一种基于深度卷积生成对抗网络的音频关键词识别方法
CN109034046A (zh) 一种基于声学检测的电能表内异物自动识别方法
CN102592593B (zh) 一种考虑语音中多线性群组稀疏特性的情绪特征提取方法
CN108898164A (zh) 一种基于特征融合的鸟鸣自动识别方法
CN102623009A (zh) 一种基于短时分析的异常情绪自动检测和提取方法和系统
CN109409308A (zh) 一种基于鸟类鸣声的鸟类物种识别的方法
CN110533007A (zh) 一种桥梁车载应变影响线特征智能识别与提取方法
CN102982351A (zh) 基于bp神经网络的瓷绝缘子振动声学检测数据分类方法
CN109631104A (zh) 油烟机的风量自动调节方法、装置、设备及存储介质
CN109512390A (zh) 基于eeg时域多维度特征及m-wsvm的睡眠分期方法及可穿戴装置
CN109741759A (zh) 一种面向特定鸟类物种的声学自动检测方法
Zhang et al. Fault diagnosis method based on MFCC fusion and SVM
CN116884416A (zh) 野生动物音频采集检测系统、方法、存储介质及电子设备
CN109919101A (zh) 一种基于手机客户端的用户体验评价方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Zhao Zhao

Inventor after: Zhang Saihua

Inventor after: Xu Zhiyong

Inventor before: Zhang Saihua

Inventor before: Zhao Zhao

Inventor before: Xu Zhiyong

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181023