CN102708860B - 一种基于声信号识别鸟类种类的判断标准建立方法 - Google Patents
一种基于声信号识别鸟类种类的判断标准建立方法 Download PDFInfo
- Publication number
- CN102708860B CN102708860B CN201210214961.3A CN201210214961A CN102708860B CN 102708860 B CN102708860 B CN 102708860B CN 201210214961 A CN201210214961 A CN 201210214961A CN 102708860 B CN102708860 B CN 102708860B
- Authority
- CN
- China
- Prior art keywords
- signal
- birds
- bird
- analysis
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及一种基于声信号识别鸟类种类的判断标准的建立方法,属于生态监测及声信号识别技术领域。首先将声音采集设备录制的鸟类鸣啭(声)载入到鸟声信号分析系统中,通过改变亮度、对比度、色调、饱和度等颜色参数对信号声谱图颜色进行调整,以凸显特征信号成分;接着调整STFT分帧长度、窗函数类型、窗长度及窗口重叠比以使时频分辨率达到理想程度;随后改变图谱线性刻度为对数刻度,使用带通滤波器限制分析带宽;框选信号分析范围并借由高级联合时频分析算法对其进行背景降噪;进行局部信号分析,同时把所观察的鸟类的名称和所处的状态作为样本记录在样本库中,从而建立起这种鸟类的生活习性的判断标准,对不同的鸟类做同样的观察,最终建立起样本库,为后续判断鸟的种类和生活习惯提供依据,本方法判断的准确度高,适用于区域性生态环境监测,受天气等外界因素影响较小。
Description
技术领域
本发明涉及一种基于声信号识别鸟类种类的判断标准的建立方法,属于生态监测及声信号识别技术领域。
背景技术
鸟类鸣啭(声)是其相互沟通的媒介,具有寻求配偶、保卫领域、躲避捕食、社会交往等多种作用,是协调个体间和群体间行为的一种重要方式。通过鸣声研究可以了解鸟类的鸣声通讯,如个体识别和物种识别、性选择等;同样在分类学中,鸟类鸣啭(声)也起着重要的作用,既可发现新物种,还可评估物种地位等级和分析系统发育关系。因此鸟声研究也被广泛应用于神经生物学、鸟类行为学、进化生物学等领域。
目前,国际上关于鸟类声行为的研究主要集中在两个方面:繁殖与性选择;分类与系统进化。国内关于鸟类声行为的研究起步较晚,大部分集中在声音监测及简单的声行为描述和分类探讨。因此,应当充分分析鸟类声信号鸣声的差异,积累鸟类鸣声研究的材料,为深入开展鸣声研究奠定基础。
发明内容
为了解决以上问题,本发明提出一种基于声信号识别鸟类种类的判断标准的建立方法,利用现代技术,通过对各种鸟类鸣啭的采集,归类,存储,从而建立起一种基于声信号识别鸟类种类的判断标准,为后续的判断提供依据。
本发明采用的技术方案:具体步骤如下:
第一步、使用声音采集设备录制同一鸟类、在不同时间的声信号,并载入到鸟声信号分析系统中;
第二步、通过改变亮度、对比度、色调、饱和度等颜色参数对声谱图颜色显示进行调整,以凸显特征信号成分;
第三步、调整STFT分帧长度、窗函数类型、窗长度及窗口重叠比以使时频分辨率达到理想程度;
第四步、改变图谱线性刻度为对数刻度以放大低频压缩高频,同时使用带通滤波器限制分析带宽;
第五步、框选信号分析范围并借由高级联合时频分析算法对其进行背景降噪,可通过设置阈值及选取任意信号块得到降噪后的信号;
第六步、进行局部信号分析,同时把所观察的鸟类的名称和所处的状态作为样本记录在样本库中,从而建立起这种鸟类的生活习性的判断标准;
第七步、重复上述步骤一至六,对其他鸟类的进行观察,采集,分析,建立起对应的样本,存入样本库中,从而建立起对多种鸟类生活习性的判断标准。
在建立起判断标准以后,我们可以将采集到的鸟类声信号载入分析系统中,通过修改颜色参数、STFT参数及滤波参数并通过背景降噪后到包含较明显特征的待分析信号,对待分析信号进行功率谱、倒谱、包络谱、倍频程、过零点分析等分析手段测量出局部信号特征;将其与样本库中存入的样本数据进行比照,为最终实现对鸟类种类及习性的有效辨识做准备。
本发明的有益效果:利用丰富的声信号处理手段,有效提取鸟类鸣啭(声)中的特征成分进行分析辨识,建立样本库,为后续判断鸟的种类和生活习惯提供依据,判断的准确度高,适用于区域性生态环境监测,受天气等外界因素影响较小。
附图说明
图1表示本发明的流程示意图;
图2表示实验1原始声信号时间波形图及声谱图;
图3表示实验1调整颜色参数后的时间波形图及声谱图;
图4表示实验1调整STFT参数后的时间波形图及声谱图;
图5表示实验1带通滤波后的时间波形图及声谱图;
图6表示实验1时变滤波器处理过程;
图7表示实验1背景降噪后的时间波形图及声谱图;
图8表示实验1鸟声信号局部切片谱图;
图9表示实验1鸟声信号相似性辨识结果列表;
图10表示实验2的原始声信号时间波形及声谱图;
图11表示实验2的原始声信号经幅值增益后的时间波形及声谱图;
图12表示实验2的原始声信号经色度调节后的时间波形及声谱图;
图13表示实验2鸟声信号局部切片谱图;
图14表示实验2鸟声信号相似性辨识结果列表;
图15表示实验3原始声信号时间波形图及声谱图;
图16表示实验3原始信号经阈值滤波后的降噪效果;
图17表示实验3原始信号经形态滤波后的降噪效果;
图18表示实验3原始信号经任意滤波后的降噪效果;
图19表示实验3鸟声信号局部切片谱图;
图20表示实验3鸟声信号相似性辨识结果列表;
图21表示根据本发明的一个实施方式的原始待识别鸟类声信号时间波形图及声谱图;
图22表示根据本发明的一个实施方式的经分析辨识后的时间波形图及声谱图;
图23表示根据本发明的一个实施方式的鸟类声信号相似性辨识结果列表。
具体实施方式
以下结合多个实施例及相关附图对本发明作进一步阐述,但本发明的保护内容不限于所述范围。
如图1所示:本发明通过对各种鸟类声信号的采集,归类,存储,从而建立起一种基于声信号识别鸟类种类的判断标准,为后续的判断提供依据,具体可以按照下面步骤进行:
第一步、使用声音采集设备录制同一鸟类、在不同时间的声信号,并载入到鸟声信号分析系统中;
第二步、通过改变亮度、对比度、色调、饱和度等颜色参数对声谱图颜色显示进行调整,以凸显特征信号成分;
第三步、调整STFT分帧长度、窗函数类型、窗长度及窗口重叠比以使时频分辨率达到理想程度;
第四步、改变图谱线性刻度为对数刻度以放大低频压缩高频,同时使用带通滤波器限制分析带宽;
第五步、框选信号分析范围并借由高级联合时频分析算法对其进行背景降噪,可通过设置阈值及选取任意信号块得到降噪后的信号;
第六步、进行局部信号分析,同时把所观察的鸟类的名称和所处的状态作为样本记录在样本库中,从而建立起此种鸟类的生活习性的判断标准;
第七步、重复上述步骤一至六,对其他鸟类的进行观察,采集,分析,建立起对应的样本,存入样本库中,从而建立起对多种鸟类生活习性的判断标准。
实施例1
以德国大斑点啄木鸟进食时的声信号采集实验为例:
第一步、使用声音采集设备录制德国大斑点啄木鸟进食时的鸣啭(声)并载入到鸟声信号分析系统中;
如图2所示:是实验1的原始声信号时间波形及声谱图,从图中可以看出,由于在野外进行录制,受到其他噪声干扰,造成其特征成分无法被凸显。
第二步、通过改变亮度、对比度、色调、饱和度等颜色参数对声谱图颜色显示进行调整,以凸显特征信号成分;
如图3所示:是实验1的原始声信号经颜色参数调整后的时间波形图及声谱图,由图可见该鸟鸣的能量主要集中在700Hz—20000Hz,1500Hz—7000Hz部分能量较高,可以判断这是特征信号成分。
第三步、调整STFT分帧长度、窗函数类型、窗长度及窗口重叠比以使时频分辨率达到理想程度;
如图4所示:是实验1调整STFT参数后的时间波形图及声谱图,设置窗函数为Hanning窗,窗口长度128点,FFT重叠比为1/2(50%),此时可以更为清晰的看到信号成分的分布。
第四步、改变图谱线性刻度为对数刻度以放大低频压缩高频,同时使用带通滤波器限制分析带宽;
如图5所示:是实验1带通滤波后的时间波形图及声谱图,上限截止频率:16997Hz,下限截止频率:749Hz。
第五步、框选信号分析范围并借由高级联合时频分析算法对其进行背景降噪,可通过设置阈值及选取任意信号块得到降噪后的信号;
如图6所示:是实验1时变滤波器处理过程,阈值调整到0.762时基本已经将背景噪声完全滤除,仅留下德国大斑点啄木鸟较为明显的声信号特征。
如图7所示:是实验1背景降噪后的时间波形图及声谱图,统计其中一个句子(Verse)中的音节(Syllable)个数为7,此时可进行局部信息分析。
第六步、进行局部信号分析,同时把所观察的鸟类的名称和所处的状态作为样本记录在样本库中,从而建立起这种鸟类的生活习性的判断标准;
如图8所示:是图7中较为明显的一个音节的局部切片谱及各种统计信息如持续时间、能量均值、频段范围、最大能量频率点等。
如图9所示:是选取图7中较为明显的一个音节进行相似性辨识的结果列表,综合各种相似度参数的比较结果,得出德国大斑点啄木鸟进食时的声信号的特点,存入样本库中,并做出对应的标记。
实施例2:
以西班牙棕柳莺(Chiffchaff)发出的鸣叫的声信号增益及色彩参数调节实验为例:
此次发现过程与实验1过程一样,图10是实验2的原始声信号时间波形及声谱图,通过调节增益和调节色度来实现使得声谱图中的特征信息成分能够更明显的表现出来。
图11为调节增益后的效果。
图12为调节色度后的效果。
图13是图10中较为明显的一个音节的局部切片谱及各种统计信息,由图可见其能量中心集中在4608.11Hz附近,能量均值为-16dB。
图14是选取图10中较为明显的一个音节进行相似性辨识的结果列表,综合各种相似度参数(持续时间、相关系数、幅值谱余弦测度等)的比较结果,得出西班牙棕柳莺(Chiffchaff)发出的鸣叫特点。
实施例3:
以英国宽耳蝠(BarbastelleBat)的声信号背景降噪实验为例,方法与实验1和实验2相同。
图15是实验3录音的声谱图和波形图,由于存在背景噪声的干扰,不利于对特征信息的观察和分析。可以通过3种方法来滤除背景噪声,凸显特征信息。
图16是图15中信号经阈值滤波(阈值为0.430时)的降噪结果,图17是图15中信号经形态滤波后的降噪结果,图18是图15中信号经任意滤波后的降噪结果。可以看出3种背景降噪方式的降噪结果各有不同,但基本上都已经将主要声音成分显现出来。
图19是图17中较为明显的一个音节的局部切片谱及各种统计信息,由图可见其能量中心集中在3563.75Hz附近,能量均值为-20.8dB。
图20是选取图16中较为明显的一个音节进行相似性辨识的结果列表,综合各种相似度参数的比较结果,得出英国宽耳蝠(BarbastelleBat)的鸣叫特点。
建立起判断标准以后,我们可以采集鸟类的声音信息,利用这个标准对鸟类的种类和生活习性做出判断。
实施例4
图21表示一个原始的待识别鸟类声信号时间波形图及声谱图,由于在野外进行录制,受到背景噪声干扰,造成其特征成分很不清晰。
图22是原始信号经时频滤波及背景降噪后的时间波形图及声谱图,此时分析能量较为集中的0Hz—5KHz频段,设置STFT窗函数为Blackman窗,窗口长度512点,FFT重叠比为7/8;设置带通滤波器上限截止频率:4114Hz,下限截止频率:1279Hz;采用正逆Gabor变换实现背景降噪,阈值设置为0.594。由图中可见,其中一个句子(Verse)中的音节(Syllable)个数为7。此时可对降噪前后信号进行对比播放(播放超声时需要超声声卡及功放),同时可进行各种特征值如能量均值、频段范围、最大能量频率点的自动分析。
图23是相似性辨识的结果列表,综合各种相似度参数如持续时间、相关系数、幅值谱余弦测度等,对比样本库中储存的数据信息,可以判断出此种鸟类为五十雀(Nuthatch),该鸟类正在求偶。
本发明是通过具体实施过程进行说明的,在不脱离本发明范围的情况下,还可以对本发明专利进行各种变换及等同代替,因此,本发明专利不局限于所公开的具体实施过程,而应当包括落入本发明专利权利要求范围内的全部实施方案。
Claims (1)
1.一种基于声信号识别鸟类的判断标准的建立方法,其特征在于:通过对各种鸟类声信号的采集,归类,存储,从而建立起一种基于声信号识别鸟类种类的判断标准,为后续的判断提供依据,具体可以按照下面步骤进行:
第一步、使用声音采集设备录制同一鸟类、在不同时间的声信号,并载入到鸟声信号分析系统中;
第二步、通过改变亮度、对比度、色调、饱和度等颜色参数对声谱图颜色显示进行调整,以凸显特征信号成分;
第三步、调整STFT分帧长度、窗函数类型、窗长度及窗口重叠比以使时频分辨率达到理想程度;
第四步、改变图谱线性刻度为对数刻度以放大低频压缩高频,同时使用带通滤波器限制分析带宽;
第五步、框选信号分析范围并借由高级联合时频分析算法对其进行背景降噪,可通过设置阈值及选取任意信号块得到降噪后的信号;
第六步、进行局部信号分析,同时把所观察的鸟类的名称和所处的状态作为样本记录在样本库中,从而建立起这种鸟类的生活习性的判断标准;
第七步、重复上述步骤一至六,对其他鸟类的进行观察,采集,分析,建立起对应的样本,存入样本库中,从而建立起对多种鸟类生活习性的判断标准。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210214961.3A CN102708860B (zh) | 2012-06-27 | 2012-06-27 | 一种基于声信号识别鸟类种类的判断标准建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210214961.3A CN102708860B (zh) | 2012-06-27 | 2012-06-27 | 一种基于声信号识别鸟类种类的判断标准建立方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102708860A CN102708860A (zh) | 2012-10-03 |
CN102708860B true CN102708860B (zh) | 2014-04-23 |
Family
ID=46901562
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210214961.3A Expired - Fee Related CN102708860B (zh) | 2012-06-27 | 2012-06-27 | 一种基于声信号识别鸟类种类的判断标准建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102708860B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103489446B (zh) * | 2013-10-10 | 2016-01-06 | 福州大学 | 复杂环境下基于自适应能量检测的鸟鸣识别方法 |
CN105514865A (zh) * | 2015-12-17 | 2016-04-20 | 徐晶 | 智能化高压线路防鸟系统 |
CN105580801A (zh) * | 2015-12-17 | 2016-05-18 | 无锡桑尼安科技有限公司 | 基于鸟声检测的输电线路防鸟平台 |
CN105375396A (zh) * | 2015-12-17 | 2016-03-02 | 邢丽丽 | 多功能供电线路检测平台 |
CN106953266B (zh) * | 2017-04-26 | 2019-07-12 | 国网河南镇平县供电公司 | 一种输电线路清洁与驱鸟装置 |
CN107134739B (zh) * | 2017-04-26 | 2019-05-03 | 国网河南镇平县供电公司 | 一种输电线路修缮与驱鸟装置 |
CN107369451B (zh) * | 2017-07-18 | 2020-12-22 | 北京市计算中心 | 一种辅助鸟类繁殖期的物候研究的鸟类声音识别方法 |
CN110033777A (zh) * | 2018-01-11 | 2019-07-19 | 深圳市诚壹科技有限公司 | 鸟类识别方法、装置、终端设备及计算机可读存储介质 |
CN110570874B (zh) * | 2018-06-05 | 2021-10-22 | 中国科学院声学研究所 | 一种用于监测野外鸟类鸣声强度及分布的系统及其方法 |
CN109741759B (zh) * | 2018-12-21 | 2020-07-31 | 南京理工大学 | 一种面向特定鸟类物种的声学自动检测方法 |
CN111626093B (zh) * | 2020-03-27 | 2023-12-26 | 国网江西省电力有限公司电力科学研究院 | 一种基于鸣声功率谱密度的输电线路相关鸟种识别方法 |
CN111540368B (zh) * | 2020-05-07 | 2023-03-14 | 广州大学 | 一种稳健的鸟声提取方法、装置及计算机可读存储介质 |
CN113257232B (zh) * | 2021-07-07 | 2021-10-08 | 深圳市声扬科技有限公司 | 语谱图的生成方法、装置、电子设备及存储介质 |
CN117711411A (zh) * | 2023-12-15 | 2024-03-15 | 百鸟数据科技(北京)有限责任公司 | 一种声音监测与识别设备、系统、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007193035A (ja) * | 2006-01-18 | 2007-08-02 | Sony Corp | 音声信号分離装置及び方法 |
JP2008233866A (ja) * | 2007-02-21 | 2008-10-02 | Sony Corp | 信号分離装置、および信号分離方法、並びにコンピュータ・プログラム |
EP2270981A2 (en) * | 2009-06-19 | 2011-01-05 | Fujitsu Limited | Digital signal processing apparatus and digital signal processing method |
CN102576538A (zh) * | 2009-09-07 | 2012-07-11 | 诺基亚公司 | 用于处理音频信号的方法和设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1239455A3 (de) * | 2001-03-09 | 2004-01-21 | Alcatel | Verfahren und Anordnung zur Durchführung einer an die Übertragungsfunktion menschilcher Sinnesorgane angepassten Fourier Transformation sowie darauf basierende Vorrichtungen zur Geräuschreduktion und Spracherkennung |
-
2012
- 2012-06-27 CN CN201210214961.3A patent/CN102708860B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007193035A (ja) * | 2006-01-18 | 2007-08-02 | Sony Corp | 音声信号分離装置及び方法 |
JP2008233866A (ja) * | 2007-02-21 | 2008-10-02 | Sony Corp | 信号分離装置、および信号分離方法、並びにコンピュータ・プログラム |
EP2270981A2 (en) * | 2009-06-19 | 2011-01-05 | Fujitsu Limited | Digital signal processing apparatus and digital signal processing method |
CN102576538A (zh) * | 2009-09-07 | 2012-07-11 | 诺基亚公司 | 用于处理音频信号的方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN102708860A (zh) | 2012-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102708860B (zh) | 一种基于声信号识别鸟类种类的判断标准建立方法 | |
Agamaite et al. | A quantitative acoustic analysis of the vocal repertoire of the common marmoset (Callithrix jacchus) | |
Pieretti et al. | Application of a recently introduced index for acoustic complexity to an avian soundscape with traffic noise | |
Priyadarshani et al. | Automated birdsong recognition in complex acoustic environments: a review | |
Farina et al. | The application of the acoustic complexity indices (ACI) to ecoacoustic event detection and identification (EEDI) modeling | |
Pieretti et al. | A new methodology to infer the singing activity of an avian community: The Acoustic Complexity Index (ACI) | |
Kasten et al. | The remote environmental assessment laboratory's acoustic library: An archive for studying soundscape ecology | |
Ross et al. | Utility of acoustic indices for ecological monitoring in complex sonic environments | |
Ganchev et al. | Automated acoustic detection of Vanellus chilensis lampronotus | |
Gannier et al. | Performance of a contour-based classification method for whistles of Mediterranean delphinids | |
Hartwig | Individual acoustic identification as a non-invasive conservation tool: an approach to the conservation of the African wild dog Lycaon pictus (Temminck, 1820) | |
Ruse et al. | Automated analysis of song structure in complex birdsongs | |
Lin et al. | An automatic detection algorithm for extracting the representative frequency of cetacean tonal sounds | |
CN111414832B (zh) | 一种基于鲸豚类低频水声信号的实时在线识别分类系统 | |
Ikeda et al. | Recognition of two psychological conditions of a single cow by her voice | |
Einhäupl et al. | Attractiveness of grasshopper songs correlates with their robustness against noise | |
Brown et al. | Primate habitat acoustics | |
Magnúsdóttir et al. | Humpback whale (Megaptera novaeangliae) song unit and phrase repertoire progression on a subarctic feeding ground | |
Lin et al. | Automatic classification of delphinids based on the representative frequencies of whistles | |
Wei et al. | Study on feeding activity of Litopenaeus vannamei based on passive acoustic detection | |
Yip et al. | Automated classification of avian vocal activity using acoustic indices in regional and heterogeneous datasets | |
Hull et al. | Acoustic Identification of Wild Gray Wolves, Canis lupus, Using Low Quality Recordings. | |
Xie et al. | Detecting frog calling activity based on acoustic event detection and multi-label learning | |
Pahl et al. | Repertoire and geographic variation in underwater vocalisations of Weddell seals (Leptonychotes weddellii, Pinnipedia: Phocidae) at the Vestfold Hills, Antarctica | |
Gage et al. | Acoustic observations in agricultural landscapes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140423 Termination date: 20210627 |
|
CF01 | Termination of patent right due to non-payment of annual fee |