CN104392722B - 一种基于声音的生物种群识别方法及系统 - Google Patents
一种基于声音的生物种群识别方法及系统 Download PDFInfo
- Publication number
- CN104392722B CN104392722B CN201410713252.9A CN201410713252A CN104392722B CN 104392722 B CN104392722 B CN 104392722B CN 201410713252 A CN201410713252 A CN 201410713252A CN 104392722 B CN104392722 B CN 104392722B
- Authority
- CN
- China
- Prior art keywords
- sound
- feature vector
- target feature
- value
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Abstract
本发明公开了一种基于声音的生物种群识别方法及系统。其中一种基于声音的生物种群识别方法包括:判断获取的声音序列中是否包含待识别的所选物种的声音;在声音序列中含有待识别的所选物种的声音时,从声音序列中提取含有待识别的所选物种的声音序列;将在含有待识别的所选物种的声音序列中提取出的所有特征组成目标特征向量;将目标特征向量作为分类数据,并对利用分类数据创建的分类模型进行训练。通过从声音片段提取包含有待识别的所选物种的声音,并对包含有待识别的所选物种声音的有效声音片段进行处理,避免了声音序列中的无声片段、风声或者其他杂声对所需识别声音的影响,提高了声音识别的平均准确率。
Description
技术领域
本发明涉及模式识别技术领域,更具体地说,涉及一种基于声音的生物种群识别方法及系统。
背景技术
声音是人类获取信息的重要媒介,因此很容易让人想到利用计算机从图像中获取我们需要的信息,声音识别也由此发展起来。在声音识别中,生物种群的声音识别是一项相当实用的技术,它对追踪野外动物的生活轨迹、检测自然保护区珍稀物种的活动轨迹等用于研究发挥着重大作用。
目前采用的生物种群识别方法是任意选取几种生物物种,如猫、狼、大象、狗和驴等,将其作为选择的对象,通过声音采集设备采集随机所选取物种的声音,从随机选取的声音中提取声音序列,并从所提取的声音序列中进行特征提取,同时将得到的特征向量作为分类的数据,建立模型,以得到所选物种声音的分类模型。
虽然目前生物种群声音识别的方法实现了对生物种群声音的识别,但该方法在生物物种声音识别的过程中仍存在许多不足,如,通过声音采集设备采集的物种声音中含有需要其他声音片段,即非有效的声音片段;由于生物在发声的过程中会存在一些破音情况,以至于得出的特征向量会使后期的分类准确率降低,影响了声音识别的平均准确率。
发明内容
有鉴于此,本发明的目的是提供一种声音识别方法及系统,以提高声音识别的平均准确率。
为了实现上述目的,本发明提供如下技术方案:
一方面,本发明提供了一种基于声音的生物种群识别方法,所述方法包括:
判断获取的声音序列中是否包含待识别的所选物种的声音;
在所述声音序列中含有所述待识别的所选物种的声音时,从所述声音序列中提取含有待识别的所选物种的声音序列;
将在所述含有待识别的所选物种的声音序列中提取出的所有特征组成目标特征向量;
将所述目标特征向量作为分类数据,并对利用所述分类数据创建的分类模型进行训练。
优选的,在所述判断获取的声音序列中是否包含待识别的所选物种的声音之前,所述方法还包括:
采集随机选取的物种的声音,从所述声音中读取声音序列,并将所述声音序列划分为多个帧声音序列。
优选的,在将所述目标特征向量作为分类数据前,所述方法还包括:
将所述目标特征向量进行降维并组合形成新的所述目标特征向量。
优选的,所述将所述目标特征向量进行降维并组合形成新的所述目标特征向量后,所述方法还包括:
将所述目标特征向量的值作极值处理,获取满足极值要求的所述目标特征向量。
优选的,所述对所述目标特征向量的值作极值处理包括:
确定所述极值的极大值和极小值;
获取所有所述目标特征向量的值;
将获取的所有所述目标特征向量的值的平均值作为基准值;
判断所述目标特征向量的值与所述基准值的差值是否包含在所述极大值与所述极小值之间;
当所述目标特征向量的值与所述基准值的差值在所述极大值与所述极小值之间时,将所述目标特征向量作为分类数据,并对利用所述分类数据创建的分类模型进行训练;
当所述目标特征向量的值与所述基准值的差值不包含在所述极大值与所述极小值之间时,将所述不包含在所述极大值与所述极小值之间的所述目标特征向量删除。
优选的,所述对利用所述分类数据创建的分类模型进行训练好后,所述方法还包括:
采集新的声音序列对所述模型进行测试。
另一方面,本发明提供了一种基于声音的生物种群识别系统,所述系统包括:
判断单元,用于判断获取的声音序列中是否包含待识别的所选物种的声音;
提取单元,用于在所述声音序列中含有所述待识别的所选物种的声音时,从所述声音序列中提取含有所述待识别的所选物种的声音序列;
第一组合单元,用于将在所述含有待识别的所选物种的声音序列中提取出的所有特征组成目标特征向量;
训练单元,用于将所述目标特征向量作为分类数据,并对利用所述分类数据创建的分类模型进行训练。
优选的,所述系统还包括:
预处理单元,用于采集随机选取的物种的声音,从所述声音中读取声音序列,并将所述声音序列划分为多个帧声音序列;
第二组合单元,用于将所述目标特征向量进行降维并组合形成新的所述目标特征向量;
测试单元,用于采集新的所述声音序列对所述模型进行测试。
优选的,所述第二组合单元包括:
处理单元,用于将所述目标特征向量的值作极值处理,获取满足极值要求的所述目标特征向量。
优选的,所述处理单元包括:
确定单元,用于确定所述极值的极大值和极小值;
获取单元,用于获取所有所述目标特征向量的值;
预设单元,用于将获取的所有所述目标特征向量的值的平均值预设为基准值。
第一判断单元,用于判断所述目标特征向量的值与所述基准值的差值是否包含在所述极大值与所述极小值之间;
建模单元,用于当所述目标特征向量的值与所述基准值的差值在所述极大值与所述极小值之间时,将所述目标特征向量作为分类数据,并对利用所述分类数据创建的分类模型进行训练;
删除单元,用于当所述目标特征向量的值与所述基准值的差值不包含在所述极大值与所述极小值之间时,将所述不包含在所述极大值与所述极小值之间的所述目标特征向量删除。
与现有技术相比,本发明的优点如下:
本发明提供的基于声音的生物种群识别方法,通过从声音片段提取包含有待识别的所选物种的声音,并对包含有待识别的所选物种声音的有效声音片段进行处理,与现有技术中直接对采集的声音片段进行处理的方法相比,本发明提供的基于声音的生物种群识别方法,避免了声音序列中的无声片段、风声或者其他杂声对所需识别声音的影响,提高了声音识别的平均准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种基于声音的生物种群识别方法的第一种流程图;
图2为本发明实施例提供的一种基于声音的生物种群识别方法的第二种流程图;
图3为本发明实施例提供的一种基于声音的生物种群识别方法的分帧的示意图;
图4为本发明实施例提供的一种基于声音的生物种群识别方法的第三种流程图;
图5为本发明实施例提供的一种基于声音的生物种群识别系统的一种结构示意图;
图6为本发明实施例提供的一种利用K-近邻法对K值进行测定的示意图;
图7为本申请实施例提供的一种基于声音的生物种群识别系统的另一种结构示意图;
图8为本申请实施例提供的一种基于声音的生物种群识别系统的一种子结构流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种基于声音的生物种群识别方法,请参考图1,其示出了本发明实施例提供的一种基于声音的生物种群识别方法的第一种流程图,可以包括以下步骤:
步骤101:判断获取的声音序列中是否包含待识别的所选物种的声音;如果是,则执行步骤102。
由于获取的声音序列中不仅包含待识别的所选物种的声音,在获取的声音片段中还含有些许的无声片段,风声或者其他的噪声,而后续所需要的声音片段是含有待识别的所选物种的声音,所以需要对其进行判断。
步骤102:在声音序列中含有待识别的所选物种的声音时,从声音序列中提取含有待识别的所选物种的声音序列。
从声音片段中提取含有待识别的所选物种的声音序列可以利用新提出的算法对声音片段进行处理,进而得出有效的能够直接用于特征提取的有效声音片段。
步骤103:将在含有待识别的所选物种的声音序列中提取出的所有特征组成目标特征向量。
步骤104:将目标特征向量作为分类数据,并对利用分类数据创建的分类模型进行训练。
本发明实施例提供的基于声音的生物种群识别方法,通过从声音片段提取包含有待识别的所选物种的声音,并对包含有待识别的所选物种声音的有效声音片段进行处理,与现有技术中直接对采集的声音片段进行处理的方法相比,本发明提供的基于声音的生物种群识别方法,避免了声音序列中的无声片段、风声或者其他杂声对所需识别声音的影响,提高了声音识别的平均准确率。
请参考图2,其示出了本发明实施例提供的一种基于声音的生物种群识别方法的第二种流程图,可以包括以下步骤:
步骤200:采集随机选取的物种的声音,从声音中读取声音序列,并将声音序列划分为多个帧声音序列。
为了保证实验效果的准确性,随机选取了五种生物,本实施例中选取的是猫、狼、大象、狗和驴,利用声音采集器采集所选的五种生物的声音,并利用MATLAB的库函数从所采集的生物声音中读取出声音序列,将原始的声音信号转换成数字信号。
由于声音信号是不平稳的,所以不能对声音信号进行直接统计分析,而当每帧声音信号长度在25ms左右时,可以认定声音是平稳的,故可以对其利用统计的知识进行分析,所以需要将读取的声音序列进行分帧。分帧后的声音还需要加汉明窗,构造一个函数。这个函数在某一区间内有非零值,而在其余区间内皆为0。
需要说明的是,本发明在对五种生物的声音序列进行分帧是以256个数据为帧进行分帧的。其中,图3所示为本发明实施例中对所获取的声音序列进行分帧后的示意图。
步骤201:判断获取的声音序列中是否包含待识别的所选物种的声音;如果是,则执行步骤202。
步骤202:在声音序列中含有待识别的所选物种的声音时,从声音序列中提取含有待识别的所选物种的声音序列。
从声音片段中提取含有待识别的所选物种的声音序列可以利用新提出的算法对声音片段进行处理,进而得出有效的能够直接用于特征提取的有效声音片段。
有效的声音片段是从已经获取到的原始的声音信号序列中提取的,只属于生物的声音,而不是无声片段、风声或者其他杂声。
在利用每帧声音片段的短时能量进行分析,在短时能量足够小的时候,由于此时声音的能量基本上没有动物声音片段的能量高,所以可以认定该声音片段属于无声的片段或者是背景声音,比如比较小的风声等等;而当短时能量足够大的时候,表示该声音片段可能属于动物声音与其他噪音混合的结果,导致短时能量比单独只有动物声音的时候要高。故将其为待识别的所选物种的声音。
其中,本发明实施例中获取有效声音片段可以通过以下方法实现:
一是,计算每帧声音片段的能量值Ei(i=1,2,…,N),其中N为语音总帧数,Ei是第i帧信号强度的平方和。
二是,记录EMAX=max(E1,E2,…,EN),EMIN=min(E1,E2,…,EN),计算Edif=EMAX-EMIN。
三是,选取所有能量介于Eup和Elow之间的帧序列,其中,Eup=EMIN+Edif*10%,Elow=EMAX-Edif*10%。
利用新提出的算法对原始声音片段进行处理,得出新的有效的声音序列,是能够直接用于特征提取的声音片段数据。
其中进行有效声音片段提取的目的在于去除一些无效的声音片段,甚至宁愿多摒弃一些动物的声音片段也不愿加入一些噪声影响分类结果,而使得作为后期分类的动物声音尽可能的纯正,这样不仅可以使得系统的计算速度更快,而且可以使得分类准确率更高。
步骤203:将在含有待识别的所选物种的声音序列中提取出的所有特征组成目标特征向量。
在本发明实施例中提取的特征可以包括频谱重心、信号带宽、信号扩展度、短时自相关分析、Teager能量、信号平坦度、频谱重心、峰度系数、共振峰、信号偏度、短时平均幅度差、过零率、谱通量、协方差、短时能量和MFCC等,其中,频谱重心、信号带宽、信号扩展度、短时自相关分析、Teager能量可以依据以下公式获取:
(1)频谱重心:
其中Xm(n)是语音信号短时傅里叶变换,M是短时傅里叶变换长度的一半。
(2)信号带宽:
其中SC是频谱重心。
(3)信号扩展度:声音扩展度描述的是频谱在均值附近的扩展。
定义为:
其中N是每帧信号的帧长。
(4)短时自相关分析:短时自相关函数定义为:
其中k是最大延迟点数。
(5)Teager能量:
将进行特征提取后得到的所有特征组成一个28维的特征向量。按照理论分析可知,特征向量的维数越多,分类结果越准确。然而在实际上的实验结果中,特征向量随着向量维数的增加,分类准确率将越来越高,但当维数达到一个值后,再继续增大向量的维数时,分类准确率反而会越来越低。其中,维数越大的向量对分类计算的速率影响越大。所以,为了提高分类计算的速率,需要对特征向量进行降维。
本发明实施例中选取尽可能多的特征用以分类准备工作,以此消除了人工选择特征所带来的人为主观性以及不确定性。
步骤204:将目标特征向量进行降维并组合形成新的目标特征向量。
本发明实施例提供的声音识别方法采用Fisher判别法对特征向量进行降维。Fisher判别法的基本思想就是首先计算单个特征的分类能力,即依次利用单个特征作用于此本专利所提出的系统,得出每个特征的平均识别率,以此作为该特征的分类能力指标。接着根据特征的分类能力进行排序,将分类能力最强的特征依次加入到特征向量中。
其中,在降维后得到重新组合的目标特征向量:MFCC、信号带宽、信号平坦度、信号扩展度、短时自相关分析、Teager能量和频谱重心。
其中,本发明实施例中对特征向量进行降维的可以通过以下方法获取:
首先,计算每个特征的分类能力,记为ai。
其次,将所有特征的分类能力从高到底进行排序,获取特征分类能力序列(b1,b2,…bn,)。
再次,将分类能力序列依次加入所述第二特征向量序列,设加入了i个特征之后的分类能量记为Ei=E(b1,b2,…,bn)。
最后,添加bi+1直到|Ei-Ei+1|<ε,其中ε是一个足够小的值。
同时,在对特征向量进行降维的过程中,当需要识别的生物种群发生变化时,本发明提供的基于声音的生物种群识别方法会自动选取新的特征组合组成目标特征向量以满足新的需要,避免了现有技术中,依靠人工的选择新的特征组合以满足需要识别的生物种群发生变化。
步骤205:将目标特征向量的值作极值处理,获取满足极值要求的目标特征向量。
对于同一生物种群而言,其多个特征向量的值将散布在数据空间中,这些值可能在数据空间中比较分散,为了获取分布较为集中的目标特征向量,需要对降维后重新组合得到的目标特征向量进行极值处理。
步骤206:将目标特征向量作为分类数据,并对利用分类数据创建的分类模型进行训练。
将得到的目标特征向量作为分类的数据,采用K-近邻法对分类模型进行训练。
其中,K-近邻法是基于最近邻法的改进,即选择K个离未知样本最近的已知样本,未知样本的类别由选择的K个样本中使用最多的类别来决定。因为考虑到当K很小时,噪声的影响较大,所以K取值不能过小。但当K取值过大时,由于是不同的生物物种的数据,各个物种的声音特征组合之间存在一定的交集,所以当K太大时,这些交集也会带来误差。
步骤207:采集新的声音序列对模型进行测试。
当模型训练好后,为了验证模型的精确性,不仅对模型参数进行理论上的分析,还利用采用的五种生物的声音对模型进行了实验验证。
本发明实施例提供的基于声音的生物种群识别方法,在提取有效声音片段的基础上,为了提高分类的准确性,对目标特征向量进行降维,并在降维过程中自动形成新的目标特征向量,避免了需要手动选择特征重新组合,又更近一步的对目标特征向量进行极值处理,有效的去除了在数据空间中分散不集中的目标特征向量,有效的提高了声音识别方法的平均准确率。
请参考图4其示出了本发明实施例提供的一种基于声音的生物种群识别方法的第三种流程图,其可以包括以下步骤:
步骤500:确定极值的极大值和极小值。
根据实际需要,确定极值的最大值和最小值。
步骤501:获取所有目标特征向量的值。
步骤502:将获取的所有目标特征向量的值的平均值作为基准值。
将计算得出的所有目标特征向量的值相加,获取所有目标特征向量的值得平均值,将其作为基准值。
步骤503:判断目标特征向量的值与基准值的差值是否包含在所述极大值与所述极小值之间;如果是,则执行步骤504;如果否,则执行步骤505。
步骤504:当目标特征向量的值与基准值的差值在极大值与极小值之间时,将目标特征向量作为分类数据,并对利用分类数据创建的分类模型进行训练。
步骤505:当目标特征向量的值与基准值的差值不包含在极大值与极小值之间时,将不包含在极大值与极小值之间的目标特征向量删除。
在对声音序列进行分帧后,是利用短时能量提取有效的声音片段,而此处利用目标特征向量进行滤除,避免了不包含在极大值与极小值之间的目标特征向量,使得剩余的目标特征向量的值在数据空间中的聚合度明显的提高了。而此处对不包含在极大值与极小值之间的目标特征向量进行滤除免的依据是将远离所有目标特征向量的值的平均值较远的目标特征向量。
与上述方法的实施例相对应,本发明实施例还提供了一种基于声音的生物种群识别系统,基于声音的生物种群识别系统的结构示意图请参考图5所示,包括:判断单元11,提取单元12,第一组合单元13和训练单元14,其中:
判断单元11,用于判断获取的声音序列中是否包含待识别的所选物种的声音。
提取单元12,用于在声音序列中含有待识别的所选物种的声音时,从声音序列中提取含有待识别的所选物种的声音序列。
第一组合单元13,用于将在含有待识别的所选物种的声音序列中提取出的所有特征组成目标特征向量。
训练单元14,用于将目标特征向量作为分类数据,并对利用分类数据创建的分类模型进行训练。
将得到的目标特征向量作为分类的数据,采用K-近邻法对分类模型进行训练。
其中,K-近邻法是基于最近邻法的改进,即选择K个离未知样本最近的已知样本,未知样本的类别由选择的K个样本中使用最多的类别来决定。因为考虑到当K很小时,噪声的影响较大,所以K取值不能过小。但当K取值过大时,由于是不同的生物物种的数据,各个物种的声音特征组合之间存在一定的交集,所以当K太大时,这些交集也会带来误差。其中,利用K-近邻法对目标特征向量进行分类,使得本发明提供的声音识别方法的平均准确率达到了89.9%。请参考图6,其示出了本发明实施例中利用K-近邻法对K值进行测定的示意图。经过反复的测定,最后选择K=5作为K-近邻法参数。
本发明实施例提供的基于声音的生物种群识别系统,通过从声音片段提取包含有待识别的所选物种的声音,并对包含有待识别的所选物种声音的有效声音片段进行处理,与现有技术中直接对采集的声音片段进行处理的系统相比,本发明实施例提供的基于声音的生物种群识别方法,避免了声音序列中的无声片段、风声或者其他杂声对所需识别声音的影响,提高了声音识别的平均准确率。
请参考图7,其示出了本发明实施例提供的一种基于声音的生物种群识别系统的另一种结构示意图,在图5的基础上,还包括:预处理单元15、第二组合单元16、处理单元17和测试单元18,其中:
预处理单元15,用于采集随机选取的物种的声音,从声音中读取声音序列,并将声音序列划分为多个帧声音序列。
由于声音信号是不平稳的,所以不能对声音信号进行直接统计分析,而当每帧声音信号长度在25ms左右时,可以认定声音是平稳的,故可以对其利用统计的知识进行分析,所以需要将读取的声音序列进行分帧。分帧后的声音还需要加汉明窗,构造一个函数。这个函数在某一区间内有非零值,而在其余区间内皆为0。
为了便于对采集的声音序列进行处理,需要对其进行分帧加窗操作,构造一个函数,以满足声音信号是短时平稳的。
第二组合单元16,用于将目标特征向量进行降维并组合形成新的目标特征向量。
本发明提供的基于声音的生物种群识别系统采用Fisher判别法对特征向量进行降维。Fisher判别法的基本思想就是首先计算单个特征的分类能力,即依次利用单个特征作用于此本专利所提出的系统,得出每个特征的平均识别率,以此作为该特征的分类能力指标。接着根据特征的分类能力进行排序,将分类能力最强的特征依次加入到特征向量中。其中,在利用Fisher判别法对目标特征向量进行降维的过程中,本发明实施例提供的一种基于声音的生物种群识别系统会自动选取新的特征组合用以新的需要,其中,表1为在对目标特征向量进行降维的过程中进行特征选取的结果。
表1特征选择的结果
其中,在降维后得到重现组合的目标特征向量:MFCC、信号带宽、信号平坦度、信号扩展度、短时自相关分析、Teager能量和频谱重心。
处理单元17,用于将目标特征向量的值作极值处理,获取满足极值要求的所述目标特征向量。
其中,请参考图8所示的结构示意图,处理单元17还可以包括:确定单元21,获取单元22,预设单元23,第一判断单元24,建模单元25和删除单元26。其中:
确定单元21,用于确定极值的极大值和极小值。
获取单元22,用于获取所有目标特征向量的值。
预设单元23,用于将获取的所有目标特征向量的值的平均值预设为基准值。
第一判断单元24,用于判断目标特征向量的值与基准值的差值是否包含在极大值与极小值之间。
建模单元25,用于当目标特征向量的值与基准值的差值在极大值与极小值之间时,将目标特征向量作为分类数据,并对利用分类数据创建的分类模型进行训练。
删除单元26,用于当目标特征向量的值与基准值的差值不包含在极大值与极小值之间时,将不包含在极大值与极小值之间的目标特征向量删除。
为了提高本发明提供的基于声音的生物种群识别系统的准确率,在提取有效声音片段的基础上,对特征选择之后的目标特征向量又进行了极值处理。其目的在于提高目标特征向量数据的聚合度,即以所有目标特征向量值的平均值为基准值,对目标特征向量进行筛选,将满足目标特征向量的值与基准值的差值在极大值与极小值之间的特征向量作为分类数据进行建模训练,而对于目标特征向量的值与基准值的差值不包含在极大值与极小值之间的特征向量,则将其直接删除,并将剩余的目标特征向量作为分类数据进行建模训练。
测试单元18,用于采集新的声音序列对模型进行测试。
在模型训练好后,利用采集的五种生物的声音片段对模型进行测试,其测试的实验结果如表2所示。
表2测试的实验结果
最后,还需要说明的是,在本文中,诸如目标和目标等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种基于声音的生物种群识别方法,其特征在于,所述方法包括:
判断获取的声音序列中是否包含待识别的所选物种的声音;
在所述声音序列中含有所述待识别的所选物种的声音时,从所述声音序列中提取含有待识别的所选物种的声音序列;
将在所述含有待识别的所选物种的声音序列中提取出的所有特征组成目标特征向量;
将所述目标特征向量进行降维并组合形成新的所述目标特征向量,在降维后得到重新组合的目标特征向量:MFCC、信号带宽、信号平坦度、信号扩展度、短时自相关分析、Teager能量和频谱重心;
将目标特征向量的值作极值处理,获取满足极值要求的目标特征向量;
将所述目标特征向量作为分类数据,并采用K-近邻法对利用所述分类数据创建的分类模型进行训练。
2.根据权利要求1所述的方法,其特征在于,在所述判断获取的声音序列中是否包含待识别的所选物种的声音之前,所述方法还包括:
采集随机选取的物种的声音,从所述声音中读取声音序列,并将所述声音序列划分为多个帧声音序列;
分帧后的声音还需要加汉明窗,构造一个函数,这个函数在某一区间内有非零值,而在其余区间内皆为0。
3.根据权利要求1所述的方法,其特征在于,所述对所述目标特征向量的值作极值处理包括:
确定所述极值的极大值和极小值;
获取所有所述目标特征向量的值;
将获取的所有所述目标特征向量的值的平均值作为基准值;
判断所述目标特征向量的值与所述基准值的差值是否包含在所述极大值与所述极小值之间;
当所述目标特征向量的值与所述基准值的差值在所述极大值与所述极小值之间时,将所述目标特征向量作为分类数据,并对利用所述分类数据创建的分类模型进行训练;
当所述目标特征向量的值与所述基准值的差值不包含在所述极大值与所述极小值之间时,将所述不包含在所述极大值与所述极小值之间的所述目标特征向量删除。
4.根据权利要求1所述的方法,其特征在于,所述对利用所述分类数据创建的分类模型进行训练好后,所述方法还包括:
采集新的声音序列对所述模型进行测试。
5.一种基于声音的生物种群识别系统,其特征在于,所述系统包括:
判断单元,用于判断获取的声音序列中是否包含待识别的所选物种的声音;
提取单元,用于在所述声音序列中含有所述待识别的所选物种的声音时,从所述声音序列中提取含有所述待识别的所选物种的声音序列;
第一组合单元,用于将在所述含有待识别的所选物种的声音序列中提取出的所有特征组成目标特征向量;
第二组合单元,用于将所述目标特征向量进行降维并组合形成新的所述目标特征向量;
处理单元,用于将所述目标特征向量的值作极值处理,获取满足极值要求的所述目标特征向量;
训练单元,用于将所述目标特征向量作为分类数据,并采用K-近邻法对利用所述分类数据创建的分类模型进行训练。
6.根据权利要求5所述的系统,其特征在于,所述系统还包括:
预处理单元,用于采集随机选取的物种的声音,从所述声音中读取声音序列,并将所述声音序列划分为多个帧声音序列;分帧后的声音还需要加汉明窗,构造一个函数,这个函数在某一区间内有非零值,而在其余区间内皆为0;
测试单元,用于采集新的所述声音序列对所述模型进行测试。
7.根据权利要求5所述的系统,其特征在于,所述处理单元包括:
确定单元,用于确定所述极值的极大值和极小值;
获取单元,用于获取所有所述目标特征向量的值;
预设单元,用于将获取的所有所述目标特征向量的值的平均值预设为基准值;
第一判断单元,用于判断所述目标特征向量的值与所述基准值的差值是否包含在所述极大值与所述极小值之间;
建模单元,用于当所述目标特征向量的值与所述基准值的差值在所述极大值与所述极小值之间时,将所述目标特征向量作为分类数据,并对利用所述分类数据创建的分类模型进行训练;
删除单元,用于当所述目标特征向量的值与所述基准值的差值不包含在所述极大值与所述极小值之间时,将所述不包含在所述极大值与所述极小值之间的所述目标特征向量删除。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410713252.9A CN104392722B (zh) | 2014-11-28 | 2014-11-28 | 一种基于声音的生物种群识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410713252.9A CN104392722B (zh) | 2014-11-28 | 2014-11-28 | 一种基于声音的生物种群识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104392722A CN104392722A (zh) | 2015-03-04 |
CN104392722B true CN104392722B (zh) | 2018-11-09 |
Family
ID=52610615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410713252.9A Expired - Fee Related CN104392722B (zh) | 2014-11-28 | 2014-11-28 | 一种基于声音的生物种群识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104392722B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112185396B (zh) * | 2020-09-10 | 2022-03-25 | 国家海洋局南海调查技术中心(国家海洋局南海浮标中心) | 一种基于被动声学的海上风电场生物监测方法及系统 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030125946A1 (en) * | 2002-01-03 | 2003-07-03 | Wen-Hao Hsu | Method and apparatus for recognizing animal species from an animal voice |
DE102004030281B4 (de) * | 2004-06-23 | 2006-07-27 | Meyerhuber, Alfred, Dr. | Verfahren und Vorrichtung zur Erkennung einer Vogelstimme |
CN102413101A (zh) * | 2010-09-25 | 2012-04-11 | 盛乐信息技术(上海)有限公司 | 声纹密码语音提示的声纹认证系统及其实现方法 |
CN101976564A (zh) * | 2010-10-15 | 2011-02-16 | 中国林业科学研究院森林生态环境与保护研究所 | 昆虫声音识别方法 |
US9177559B2 (en) * | 2012-04-24 | 2015-11-03 | Tom Stephenson | Method and apparatus for analyzing animal vocalizations, extracting identification characteristics, and using databases of these characteristics for identifying the species of vocalizing animals |
CN102760434A (zh) * | 2012-07-09 | 2012-10-31 | 华为终端有限公司 | 一种声纹特征模型更新方法及终端 |
CN103117061B (zh) * | 2013-02-05 | 2016-01-20 | 广东欧珀移动通信有限公司 | 一种基于语音的动物识别方法及装置 |
CN103176963B (zh) * | 2013-03-08 | 2015-06-03 | 北京理工大学 | 基于crf++汉语句义结构模型自动标注方法 |
CN103905559A (zh) * | 2014-04-14 | 2014-07-02 | 重庆工商职业学院 | 一种基于鸟叫声声纹特性的珍稀鸟类种群分布探测系统 |
CN103985385A (zh) * | 2014-05-30 | 2014-08-13 | 安庆师范学院 | 基于波谱特征鉴定蛙类个体信息的方法 |
CN104102923A (zh) * | 2014-07-16 | 2014-10-15 | 西安建筑科技大学 | 一种基于mfcc算法的朱鹮个体识别方法 |
-
2014
- 2014-11-28 CN CN201410713252.9A patent/CN104392722B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN104392722A (zh) | 2015-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Agamaite et al. | A quantitative acoustic analysis of the vocal repertoire of the common marmoset (Callithrix jacchus) | |
Keen et al. | A comparison of similarity-based approaches in the classification of flight calls of four species of North American wood-warblers (Parulidae) | |
Samizade et al. | Adversarial example detection by classification for deep speech recognition | |
CN101710490A (zh) | 语音评测的噪声补偿方法及装置 | |
CN110120230A (zh) | 一种声学事件检测方法及装置 | |
Lin et al. | An automatic detection algorithm for extracting the representative frequency of cetacean tonal sounds | |
CN112750442B (zh) | 一种具有小波变换的朱鹮种群生态体系监测系统及其方法 | |
Huang et al. | Intelligent feature extraction and classification of anuran vocalizations | |
CN103761965B (zh) | 一种乐器信号的分类方法 | |
Xie et al. | Adaptive frequency scaled wavelet packet decomposition for frog call classification | |
CN111414832B (zh) | 一种基于鲸豚类低频水声信号的实时在线识别分类系统 | |
Himawan et al. | Deep Learning Techniques for Koala Activity Detection. | |
Zhang et al. | Classifying and ranking audio clips to support bird species richness surveys | |
Lapp et al. | Automated detection of frog calls and choruses by pulse repetition rate | |
Boes et al. | Machine listening for park soundscape quality assessment | |
Kiapuchinski et al. | Spectral noise gate technique applied to birdsong preprocessing on embedded unit | |
CN115410711A (zh) | 基于声音信号特征和随机森林的白羽肉鸡健康监测方法 | |
CN104392722B (zh) | 一种基于声音的生物种群识别方法及系统 | |
Wa Maina et al. | Cost effective acoustic monitoring of biodiversity and bird populations in Kenya | |
Xiao et al. | AMResNet: An automatic recognition model of bird sounds in real environment | |
Xie et al. | Detecting frog calling activity based on acoustic event detection and multi-label learning | |
Xie et al. | Detection of anuran calling activity in long field recordings for bio-acoustic monitoring | |
CN113111786A (zh) | 基于小样本训练图卷积网络的水下目标识别方法 | |
Stattner et al. | Acoustic scheme to count bird songs with wireless sensor networks | |
CN103985385A (zh) | 基于波谱特征鉴定蛙类个体信息的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181109 Termination date: 20211128 |
|
CF01 | Termination of patent right due to non-payment of annual fee |