CN113129907A - 一种野外鸟类鸣声自动检测装置及方法 - Google Patents
一种野外鸟类鸣声自动检测装置及方法 Download PDFInfo
- Publication number
- CN113129907A CN113129907A CN202110308594.2A CN202110308594A CN113129907A CN 113129907 A CN113129907 A CN 113129907A CN 202110308594 A CN202110308594 A CN 202110308594A CN 113129907 A CN113129907 A CN 113129907A
- Authority
- CN
- China
- Prior art keywords
- bird
- singing
- signal
- digital
- digital signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012545 processing Methods 0.000 claims description 94
- 238000001914 filtration Methods 0.000 claims description 52
- 238000004891 communication Methods 0.000 claims description 31
- 238000005070 sampling Methods 0.000 claims description 31
- 238000001228 spectrum Methods 0.000 claims description 28
- 238000012544 monitoring process Methods 0.000 claims description 27
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 238000013075 data extraction Methods 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 14
- 239000012634 fragment Substances 0.000 claims description 12
- 230000008447 perception Effects 0.000 claims description 12
- 230000003321 amplification Effects 0.000 claims description 10
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 7
- 238000009432 framing Methods 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 claims description 6
- 238000000926 separation method Methods 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 230000002902 bimodal effect Effects 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 238000001308 synthesis method Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 241000271566 Aves Species 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 7
- 238000009499 grossing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012806 monitoring device Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 241000272161 Charadriiformes Species 0.000 description 1
- 241000269851 Sarda sarda Species 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/20—Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
- H04R1/083—Special constructions of mouthpieces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/02—Details casings, cabinets or mounting therein for transducers covered by H04R1/02 but not provided for in any of its subgroups
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Catching Or Destruction (AREA)
Abstract
本发明属于鸟类鸣声检测和信息技术领域,具体地说,涉及一种野外鸟类鸣声自动检测装置及方法,该装置为中部设有拾音窗口的刚性球体结构,其具体包括:上半圆壳(1)、下半圆壳(2)、电路仓(3)和拾音传感器阵列(6);上半圆壳(1)和下半圆壳(2)之间呈上下位置设置,且上半圆壳(1)与下半圆壳(2)之间相隔,二者之间设有空气介质层,作为拾音窗口(4);电路仓(3)和拾音传感器阵列(6)设置在下半圆壳(2)内,拾音传感器阵列(6)设置在下半圆壳(2)的顶面的外圆周,且其下方设置密封的电路仓(3)。
Description
技术领域
本发明属于鸟类鸣声检测和信息技术领域,具体地说,涉及一种野外鸟类鸣声自动检测装置及方法。
背景技术
海岛是鸟类重要的栖息地,也是鸟类生态环境保护和利用的重要场所。对于国内鸟类监测网络,开展了大量的鸟类调查与监测工作,主要集中于对一个地区的陆地鸟类的种类、数量和分布的研究,并取得了很好的效果。为推动鸟类监测工作,近年来,开展了生物多样性(鸟类)示范监测,通过开展试点研究,探索构建生物多样性监测网络。目前,海岛及滨海湿地鸟类的研究相对薄弱,仅对中华凤头燕鸥、红脚鲣鸟、黄嘴白鹭等海岛鸟类开展过有限的研究。
海岛湿地是鸟类重要栖息、迁徙、繁衍的场所,对鸟类研究有重要意义,对海岛等地的鸟类调查和数据分析,往往需要花费大量时间和人力、物力,成本较高,效率较低。另外,对海岛湿地而言,还存在地理环境特殊、交通不便、气候恶劣多变、背景噪声复杂等问题,现有的声传感器多为单基元装置,并形成的无线传感网络,容易受海浪、海风等噪声的影响,不利于获得高信噪比的鸟鸣声,难以适用于海岛环境下鸟类鸣声智能、在线监测需要。同时,无用噪声信号的采集、传输也浪费了大量的传输和存储资源。
另外,现有的鸟类鸣声检测装置无法及时而准确的获得监测装置所在区域有效鸟类鸣声,无法去除了大量无鸣声时的环境噪声,增加了功耗,降低了鸣声的监测效率,无法适应野外复杂环境下长期、无人值守情况下的鸟类生态的远程自动化监测。
发明内容
为解决现有技术存在的上述缺陷,本发明提出了一种野外鸟类鸣声自动检测装置,解决海岛湿地环境下鸟类鸣声远程自动监测中存在上述问题,该装置采用刚性球形结构的多阵元(基元的个数取决于实际应用的需要)的圆形麦克风阵列,采用人耳听觉感知的子能量特征,进行鸟类鸣声的自动检测,并将检测到的鸟类鸣声传输到数据处理中心,进行后续处理。
本发明提供了一种野外鸟类鸣声自动检测装置,该装置为中部设有拾音窗口的刚性球体结构,其具体包括:上半圆壳、下半圆壳、电路仓和拾音传感器阵列;
上半圆壳和下半圆壳之间呈上下位置设置,且上半圆壳与下半圆壳之间相隔,二者之间设有空气介质层,作为拾音窗口;电路仓和拾音传感器阵列设置在下半圆壳内,拾音传感器阵列设置在下半圆壳的顶面的外圆周,且其下方设置密封的电路仓。
作为上述技术方案的改进之一,所述拾音传感器阵列包括N+1个基本阵元;所述基本阵元为麦克风拾音器,
其中一个麦克风拾音器位于圆的中心,该圆为下半圆壳的顶面的外圆周;该麦克风拾音器的信号作为参考信号,N个麦克风拾音器,呈均匀分布在外圆周上。
作为上述技术方案的改进之一,所述电路仓内设置多通道信号采集模块、信号处理模块、主控制模块、通信模块和电源模块;
所述多通道信号采集模块,用于对每个麦克风拾音器拾取的微弱的鸟类鸣声数字信号分别进行前置放大、抗混叠滤波处理、模数转换、数字滤波和数据抽取处理,得到多个通道的鸟类鸣声数字信号,并将其输入至信号处理模块;
所述信号处理模块,用于将多个通道的鸟类鸣声数字信号进行合成,得到高信噪比的鸟类鸣声数字信号,并对该高信噪比的鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据;
所述主控制模块,用于对多通道信号采集模块、信号处理模块和通信模块的工作状态进行控制;
所述通信模块,用于采用WIFI、4G和/或5G双模态的无线通信方式,根据野外监测区域的通讯情况,选择对应的通讯方式;
所述电源模块,用于给多通道采集模块、信号处理模块、主控制模块和通讯模块提供正常工作的电源。
作为上述技术方案的改进之一,所述多通道信号采集模块包括:前置放大电路、抗混叠滤波器和模数转换器;
所述前置放大电路,用于对每个麦克风拾音器拾取的微弱的鸟类鸣声数字信号分别进行前置放大,得到每个通道的放大后的鸟类鸣声数字信号,并将其输入至抗混叠滤波器;
所述抗混叠滤波器,用于采用10Hz的高通滤波和30kHz的低通模拟滤波器,对每个通道中的放大后的鸟鸣声信号进行抗混叠滤波处理,实现抗混叠滤波,去除放大后的鸟类鸣声数字信号中的带外噪声,得到每个通道的抗混叠滤波处理后的鸟类鸣声数字信号;
所述模数转换器,用于对每个通道的抗混叠滤波处理后的鸟类鸣声数字信号进行模数转换和数字滤波,对滤波后的信号按照采样率由高到低的顺序进行数据抽取,对高采样率的信号进行降采样处理,得到每个通道的鸟类鸣声数字信号,并将其输入至信号处理模块。
作为上述技术方案的改进之一,所述信号处理模块包括:合成单元和去噪与整合单元;
所述合成单元,用于将每个通道的鸟鸣声数字信号以位于拾音传感器阵列中心的基本阵元所采集的信号为参考信号,结合剩余的基本阵元采集的信号数据,采用常规的时延--求和波束合成方法或者自适应波束形成方法,对采集的多个通道的鸟类鸣声数字信号进行波束合成处理,获得高信噪比的鸟类鸣声数字信号;
所述去噪与整合单元,用于对高信噪比鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据。
作为上述技术方案的改进之一,所述去噪与整合单元的的具体实现过程为;
步骤1)计算高信噪比鸟类鸣声数字信号的短时功率谱;
选取指定长度的高信噪比的鸟类鸣声数字信号X(t)为处理片段,对该信号X(t)进行分帧,数据帧长度为20毫秒,做1024点傅里叶变换,帧重叠512点,Hanning窗加权,预加重,并对每一帧的鸣声信号进行短时傅里叶变换,得到每一帧的鸣声信号的短时能量谱|Xi(k)|2;
步骤2)根据步骤1)得到的每一帧的鸣声信号的短时能量谱|Xi(k)|2,计算每一帧的鸣声信号听觉感知域的Mel子带能量;
其中,Ei(m,k)为第i帧的鸣声信号听觉感知域的Mel子带能量;Hm(k)代表第m个梅尔三角滤波器的频率响应;bl和bh分别为第m个梅尔三角滤波器的上限频率和下限频率;M为梅尔三角滤波器的最多个数;0<m<M;
其中,
其中,f(m)表示频率;
其中,B(f)为梅尔频率,B(f)=1125×ln(1+f/700);f为频率;fl和fh分别为频带范围内的最低频率和最高频率;fs为采样频率;
步骤3)采用双门限方法,选取自动检测的端点高门限阈值TH和低门限阈值TL:
TH=αPmin(k);TL=βPmin(k);
采用双门限作为活动鸣声段检测的两个阈值:TH=αPmin(k)和TL=βPmin(k)。一般满足:1.1<β<α<1.4;
其中,β=1.15;α=1.35;
步骤4)利用隔点差分法计算,寻找步骤2)鸣声段中子带能量的局部极大值点集合{Emax(m,k)};
将子带能量集合中Emax(m,k)>TH作为端点检测的特征量,以Emax(m,k)为基点,向鸣声段的前后两端延伸直到E(m,k)<TL,由此确定有效鸣声片段的开始点和结束点;
步骤5)将步骤4)得到的鸣声段各向前后延伸鸣声段长度的15%,作为有效的鸟类鸣声片段;
步骤6)重复步骤1)-5),提取多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据。
本发明还提供了一种野外鸟类鸣声自动检测方法,基于在某一监测区域内布设的多个野外鸟类鸣声自动检测装置实现;
该方法包括:
多通道信号采集模块将采集到的每个微弱的鸟类鸣声数字信号进行前置放大、抗混叠滤波处理、模数转换、数字滤波和数据抽取处理,得到多个鸟类鸣声数字信号;
合成单元将多个鸟类鸣声数字信号进行波束合成处理,得到高信噪比鸟类鸣声数字信号;
去噪与整合单元对高信噪比鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据;
对每个检测装置均实施上述检测过程,得到多个完整的鸟类鸣声数据,完成对野外鸟类鸣声的检测。
作为上述技术方案的改进之一,所述多通道信号采集模块将采集到的每个微弱的鸟类鸣声数字信号进行前置放大、抗混叠滤波处理、模数转换、数字滤波和数据抽取处理,得到多个鸟类鸣声数字信号;其具体过程为:
前置放大电路对每个麦克风拾音器拾取的微弱的鸟类鸣声数字信号分别进行前置放大,得到每个通道的放大后的鸟类鸣声数字信号,并将其输入至抗混叠滤波器;
抗混叠滤波器于采用10Hz的高通滤波和30kHz的低通模拟滤波器,对每个通道中的放大后的鸟鸣声信号进行抗混叠滤波处理,实现抗混叠滤波,去除放大后的鸟类鸣声数字信号中的带外噪声,得到每个通道的抗混叠滤波处理后的鸟类鸣声数字信号;
模数转换器对每个通道的抗混叠滤波处理后的鸟类鸣声数字信号进行模数转换和数字滤波,对滤波后的信号按照采样率由高到低的顺序进行数据抽取,对高采样率的信号进行降采样处理,得到每个通道的鸟类鸣声数字信号。
作为上述技术方案的改进之一,所述去噪与整合单元对高信噪比鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据;其具体过程为:
步骤1)计算高信噪比鸟类鸣声数字信号的短时功率谱;
选取指定长度的高信噪比的鸟类鸣声数字信号X(t)为处理片段,对该信号X(t)进行分帧,数据帧长度为20毫秒,做1024点傅里叶变换,帧重叠512点,Hanning窗加权,预加重,并对每一帧的鸣声信号进行短时傅里叶变换,得到每一帧的鸣声信号的短时能量谱|Xi(k)|2;
步骤2)根据步骤1)得到的每一帧的鸣声信号的短时能量谱|Xi(k)|2,计算每一帧的鸣声信号听觉感知域的Mel子带能量;
其中,Ei(m,k)为第i帧的鸣声信号听觉感知域的Mel子带能量;Hm(k)代表第m个梅尔三角滤波器的频率响应;bl和bh分别为第m个梅尔三角滤波器的上限频率和下限频率;M为梅尔三角滤波器的最多个数;0<m<M;
其中,
其中,f(m)表示频率;
其中,B(f)为梅尔频率,B(f)=1125×ln(1+f/700);f为频率;fl和fh分别为频带范围内的最低频率和最高频率;fs为采样频率;
步骤3)采用双门限方法,选取自动检测的端点高门限阈值TH和低门限阈值TL:
TH=αPmin(k);TL=βPmin(k);
采用双门限作为活动鸣声段检测的两个阈值:TH=αPmin(k)和TL=βPmin(k)。一般满足:1.1<β<α<1.4;
其中,β=1.15;α=1.35;
步骤4)利用隔点差分法计算,寻找步骤2)鸣声段中子带能量的局部极大值点集合{Emax(m,k)};
将子带能量集合中Emax(m,k)>TH作为端点检测的特征量,以Emax(m,k)为基点,向鸣声段的前后两端延伸直到E(m,k)<TL,由此确定有效鸣声片段的开始点和结束点;
步骤5)将步骤4)得到的鸣声段各向前后延伸鸣声段长度的15%,作为有效的鸟类鸣声片段;
步骤6)重复步骤1)-5),提取多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据。
本发明与现有技术相比的有益效果是:
1、本发明的装置能够及时而准确的获得监测装置所在区域有效鸟类鸣声,而去除了大量无鸣声时的环境噪声,只传递有效的鸟鸣声,降低了功耗,提高了鸣声的监测效率,适应野外复杂环境下长期、无人值守情况下的鸟类生态的远程自动化监测;
2、本发明的装置实现野外环境下鸟类鸣声在无人值守状态下鸟类鸣声的自动检测,并传输到与外界相连的数据处理中心,解决了鸟类行为活动的监测的快速反应,突破了鸟类远程自动化生态监测的技术瓶颈,可以应用于海岛、湿地等特殊环境下的鸟类及生态环境监测。
附图说明
图1是本发明的一种野外鸟类鸣声自动检测装置的结构剖视图;
图2是本发明的一种野外鸟类鸣声自动检测装置的下半圆壳的俯视图;
图3是本发明的一种野外鸟类鸣声自动检测装置的另一个角度的结构示意图;
图4是本发明的一种野外鸟类鸣声自动检测装置的电路仓内设置的各个模块的连接示意图;
图5是本发明的一种野外鸟类鸣声自动检测装置的拾音传感器阵列的结构示意图。
附图标记:
1、上半圆壳 2、下半圆壳
3、电路仓 4、拾音窗口
5、基本阵元 6、拾音传感器阵列
具体实施方式
现结合附图对本发明作进一步的描述。
如图1所示,本发明提供了一种野外鸟类鸣声自动检测装置,具体涉及用于海岛湿地等野外环境下的鸟类鸣声自动检测装置,有一种野外鸟类鸣声自动检测装置效解决野外鸟类鸣声采集、活动鸣声检测及有效鸣声传输等鸟类生态监测中的鸣声信号的自动检测。
如图1、2和3所示,该装置为中部设有拾音窗口的刚性球体结构,其具体包括:上半圆壳1、下半圆壳2、电路仓3和拾音传感器阵列6;
上半圆壳1和下半圆壳2之间呈上下位置设置,且上半圆壳1与下半圆壳2之间相隔,二者之间设有空气介质层,作为拾音窗口4;电路仓3和拾音传感器阵列6设置在下半圆壳2内,拾音传感器阵列6设置在下半圆壳2的顶面的外圆周,且其下方设置密封的电路仓3。
如图5所示,所述拾音传感器阵列6包括N+1个基本阵元5;其中,所述基本阵元5为麦克风拾音器,
其中一个麦克风拾音器位于圆的中心,该圆为下半圆壳2的顶面的外圆周;该麦克风拾音器的信号作为参考信号,N个麦克风拾音器,呈均匀分布在外圆周上;即将位于圆形传声器阵列中心的麦克风拾音器作为参考信号,即N+1个基本阵元5中的“1”,剩余的N个麦克风拾音器,以位于圆形传声器阵列中心的麦克风拾音器为圆心,呈圆周均匀对称分布在下半圆壳2的圆形表面上。其中,拾音传声器可以采用测量级的传声器或者数字传声器,有利于降低成本,提高性能。
在本实施例中,如图2所示,所述拾音传感器阵列6采用“6+1”个全向的麦克风拾音器作为基本阵元构成圆形传声器阵列;其中,“1”代表的全向的麦克风拾音器,位于圆形传声器阵列的中心,可以作为参考信号,“6”代表的是6个全向的麦克风拾音器,均匀对称地分布在以“1”代表的全向的麦克风拾音器为圆心的圆周上,圆形传感器阵列和电路仓均安装在带有刚性金属球体结构的下半圆壳2的腔内,且圆形传感器阵列的下方设置密封的电路仓。所述麦克风拾音器为SPH0644LM4H数字传声器。
其中,上半圆壳1和下半圆壳2之间设有特定的高度(即高度由监测区域和监测范围确定,一般不超过半径的1/2)的拾音窗口,使得鸟类鸣声数字信号经过该拾音窗口到达麦克风拾音器能够满足平面波要求。利用刚性球的散射特性,可以降低部分野外环境噪声的影响,高信噪比的鸟类鸣声数字信号进入拾音窗口时的各向一致性好,且对各频点模态相对平滑,有利于麦克风拾音器更好地拾取鸟类鸣声数字信号。将电路结构放置在具有刚性球体结构的下半圆壳2内,同时能够密封,防止内部电路受到野外的水汽等侵蚀,保证其能长时间、持续地工作。
多个基本阵元5(即多个麦克风拾音器)接收鸟类鸣声数字信号,并通过采用波束形成处理,抑制环境噪声,实现鸣声增强,提高接收信号的信噪比,改善海岛野外背景噪声下的纯净的鸟鸣声的信号接收性能。波束形成之后的高信噪比的鸟类鸣声数字信号,传输至电路仓内设置的信号处理模块,实现该鸟类鸣声数字信号的自动检测,去除非鸟类鸣声的噪声信号,保留纯净的鸟类鸣声数字信号,并通过无线通信模块,传输到外界的数据处理中心,即数据处理工作站,完成对该纯净的鸟类鸣声数字信号的后续处理。
如图1、2和4所示,所述电路仓内设置多通道信号采集模块、信号处理模块、主控制模块、通信模块和电源模块;
拾音传感器阵列与多通道信号采集模块电性连接,其中,每个通道信号采集模块与每个基本阵元电性连接,多通道信号采集模块分别与主控制模块和信号处理模块电性连接,通信模块分别与主控制模块和信号处理模块电性连接,用于传输检测后的鸣声数据,电源模块分别给各个模块供电,整个电路采用低功耗设计,采用新能源的供电方式进行供电,所述供电方式为太阳能或风能。
所述多通道信号采集模块,用于对每个麦克风拾音器拾取的微弱的鸟类鸣声数字信号分别进行前置放大、抗混叠滤波处理、模数转换、数字滤波和数据抽取处理,得到多个通道的鸟类鸣声数字信号,并将其输入至信号处理模块;
具体地,所述多通道信号采集模块包括:前置放大电路、抗混叠滤波器和模数转换器;
前置放大电路的前端与每个基本阵元5相连接,建立对应的采集通道,其后端与抗混叠滤波器电性连接;抗混得滤波器与模数转换器电性连接;模数转换器的频率不低于192kHz;
所述前置放大电路,用于对每个麦克风拾音器拾取的微弱的鸟类鸣声数字信号分别进行前置放大,得到每个通道的放大后的鸟类鸣声数字信号,并将其输入至抗混叠滤波器;
所述抗混叠滤波器,用于采用10Hz的高通滤波和30kHz的低通模拟滤波器,对每个通道中的放大后的鸟鸣声信号进行抗混叠滤波处理,实现抗混叠滤波,去除放大后的鸟类鸣声数字信号中的带外噪声,得到每个通道的抗混叠滤波处理后的鸟类鸣声数字信号;
所述模数转换器,用于对每个通道的抗混叠滤波处理后的鸟类鸣声数字信号进行模数转换和数字滤波,对滤波后的信号按照采样率由高到低的顺序进行数据抽取,对高采样率的信号进行降采样处理,得到每个通道的鸟类鸣声数字信号,并将其输入至信号处理模块;其中,每个模数转换器的频率大于或等于192kHz;
所述信号处理模块为高速通用信号处理芯片(DSP),用于将多个通道的鸟类鸣声数字信号进行合成,得到高信噪比的鸟类鸣声数字信号,并对该高信噪比的鸟类鸣声数字信号进行去噪处理,并提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据,并将其输入至与外界相连接的数据处理中心,进行后续处理,识别出该完整的鸟类鸣声数据对应的鸟类种类;
具体地,所述信号处理模块包括:合成单元和去噪与整合单元;
所述合成单元,用于将每个通道的鸟鸣声数字信号以位于拾音传感器阵列中心的基本阵元所采集的信号为参考信号,结合剩余的基本阵元采集的信号数据,采用常规的时延--求和波束合成方法或者自适应波束形成方法,对采集的多个通道的鸟类鸣声数字信号进行波束合成处理,获得高信噪比的鸟类鸣声数字信号;
所述去噪与整合单元,用于对该高信噪比的鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据,并将其输入至与外界相连接的数据处理中心,进行后续处理,识别出该完整的鸟类鸣声数据对应的鸟类种类。
具体地,得到一个完整的鸟类鸣声数据的具体过程为:
步骤1)计算高信噪比鸟类鸣声数字信号的短时功率谱;
选取指定长度(取2~3秒)的高信噪比的鸟类鸣声数字信号X(t)为处理片段,对该信号X(t)进行分帧,数据帧长度为20毫秒,做1024点傅里叶变换(FFT),帧重叠512点,Hanning窗加权,预加重,并对每一帧的鸣声信号进行短时傅里叶变换,得到每一帧的鸣声信号的短时能量谱|Xi(k)|2;
步骤2)根据步骤1)得到的每一帧的鸣声信号的短时能量谱|Xi(k)|2,计算每一帧的鸣声信号听觉感知域的Mel子带能量;
其中,Ei(m,k)为第i帧的鸣声信号听觉感知域的Mel子带能量;Hm(k)代表第m个梅尔三角滤波器的频率响应;bl和bh分别为第m个梅尔三角滤波器的上限频率和下限频率;M为梅尔三角滤波器的最多个数;0<m<M;
其中,
其中,f(m)表示频率;
其中,B(f)为梅尔频率,B(f)=1125×ln(1+f/700);f为频率;fl和fh分别为频带范围内的最低频率和最高频率;fs为采样频率;
步骤3)采用双门限方法,选取自动检测的端点高门限阈值TH和低门限阈值TL:
TH=αPmin(k);TL=βPmin(k);
海岛等野外环境下的噪声常具有非平稳特性,当含噪声的鸟类鸣声数字信号的能量可以衰减到噪声能量的级别时,含噪声的鸟类鸣声数字信号的短时能量谱快速地收敛到噪声功率谱,因此,可以通过估计含噪声的鸟类鸣声数字信号的局部最小值的方法,来自适应估计噪声的门限值,其优点是无需进行无声段的判断,无需活动鸣声跟踪,提高了算法鲁棒性。
检测端点门限选取时,对含噪声的鸟类鸣声数字信号的短时能量谱进行平滑处理,以降低干扰信号的影响:
Pi(k)=λPi-1(k)+(1-λ)|Xi(k)|2 (4)
式中,Pi(k)为平滑后的含噪声的鸣声功率谱;λ为平滑系数,一般取值为0.94~0.98,取平滑功率谱的最小值Pmin(k)作为门限选取的基准阈值;
采用双门限作为活动鸣声段检测的两个阈值:TH=αPmin(k)和TL=βPmin(k)。一般满足:1.1<β<α<1.4;
其中,β=1.15和α=1.35,为经验值;
步骤4)检测活动鸣声起止端点
检测每段鸣声信号中能量较高的子带,确定有效鸣声的起止点。为了提高计算效率,提升差分效果,减少前后点的误差,利用隔点差分法计算,寻找步骤2)鸣声段中子带能量的局部极大值点集合{Emax(m,k)}。将子带能量集合中Emax(m,k)>TH作为端点检测的特征量,以Emax(m,k)为基点,向鸣声段的前后两端延伸直到E(m,k)<TL,由此确定有效鸣声片段的开始点和结束点。
步骤5)鸣声分段与静音去除
在实际传输过程中,只传输有效的鸣声段,对得到的鸣声进行自动分段,如果没有检测到活动鸣声段,剔除冗余的无音数据段,则数据不上传。为了能够获得完整的鸣声段,便于后续进一步的处理,通常将步骤4)得到的鸣声段各向前后延伸鸣声段长度的15%作为完整的鸣声段上传,如果两段鸣声之间的静音长度小于各自延伸长度的和,则认为这是连续的鸣声段上传。
步骤6)重复步骤1)-5),提取多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据。
所述主控制模块,用于对多通道信号采集模块、信号处理模块和通信模块的工作状态进行控制;
具体地,对所采集的鸟类鸣声数字信号的采样频率、工作周期、增益、数据传输、波束合成进行工作参数设置,获得最佳工作状态,并控制将自动检测后的有效鸟鸣声信号发送给无线通讯模块,再由通讯模块,将有效活动的鸟鸣声信号发送至数据处理中心进行后期处理;
所述通讯模块,用于采用WIFI、4G和/或5G双模态的无线通信方式,根据野外监测区域的通讯情况,选择对应的通讯方式;
所述电源模块,用于给多通道采集模块、信号处理模块、主控制模块和通讯模块提供正常工作的电源;
其中,电源模块的外部采用新能源方式进行供电;所述供电方式为太阳能或风能。
在本实施例中,所述多通道信号采集模块,其最高采样率为2MHz,采样精度16bit的Σ-Δ的AD转换器,在接收到采样时钟信号后将按照一定时序输出高速PDM数字信号,控制器通过对控制同步时钟,实现对不同传声器的同步采样。当信号处理模块接收到每个通道的高速PDM数字信号后,将对每个通道的高速PDM数字信号进行数字滤波和数据抽取,并最终将信号抽取为所需采样率和量化精度的PCM信号,再将其输入至信号处理模块。
在本实施例中,信号处理模块和主控模块均采用ARM架构Amlogic公司的4核Cortex-A53内核的A113X芯片,支持8通道PDM的音频输入,完成多通道的同步鸟类鸣声数字信号的采集。存储芯片采用Macronix公司的MX30LF4G18AC型号的NAND Flash,存储容量为4Gb。随机访问存储器采用SK Hynix公司的H5TC4G63CFR-RDC芯片,容量为4Gb。
所述通信模块,采用WIFI和4G/5G的双通道,能够根据监测现场的通讯状态来选择对应的工作方式。WIFI芯片采用AP6356型芯片,AP6356型芯片的一端设有SDIO接口,通过专用的SDIO接口与信号处理模块相连,实现信号处理模块与WIFI芯片之间的数据通信。AP6356芯片的另一端连接着对应的天线,通过配置,有限区域内,多个检测装置作为多个监测节点,可通过单个路由实现因特网的接入,也可以独立接入互联网。同时,核心电路板上设计了专用的4G/5G模块通信接口,可在商用4G/5G模块的配合下,实现4G/5G的单个节点网络连接的需求。
所述电源模块,根据电路板的芯片电压要求,采用开关电源与线性直流电源相结合的方式,提供不同的电压。其中,采用Silergy公司的SY8120B1ABC开关电源芯片,搭配LDO芯片WL2803E18-5,通过不同电阻、电容以及电感的应用,使其满足电路板上芯片5V、3.3V、1.35V、1.8V的板级电压需求。通过滤波、去耦合等处理来实现整版电路的纹波控制和电源噪声抑制。电源模块采用新能源方式进行供电;所述供电方式为太阳能或风能。
所述电路仓内的电路结构具有小型化和低功耗,满足野外环境下,特别是海岛电源短缺情况下的长期监测;通过对鸟类鸣声数字信号采集、信号调理和数字化,并完成鸟类鸣声数字信号的数字滤波和数据抽样,然后经信号处理模块的多通道的波束合成和活动鸟鸣声的自动检测,去除非鸣声噪声信号,获得鸟类鸣声数字信号,再由通讯模块传输到数据处理中心;再利用主控制模块,实现对整个电路仓的控制和参数的设置,进而实现对鸟类鸣声的自动远程监测。
每个自动检测装置之间能够通过各自的通讯模块独立地与互联网相连接,将每个装置的有效鸣声信号传输至外界指定的数据处理中心,进行后处理。数据处理中心可以独立地控制每个检测装置,实现鸣声的分布式采集,进行集中式处理。
本发明的鸟类鸣声自动检测装置整体采用刚性球体结构,下班圆壳的球体中心设有拾音窗口,由于检测装置的外表面为刚性球体,当有声波到达时,部分声波被球体表面散射,能够避免不同频率上的模态强度的陡变,从而能够保障到达拾音器阵列的声音信号满足平面波的传播条件。利用刚性球的散射特性,可以降低部分也噪声的影响,声信号进入接收窗时的各向一致性好,且对各频点模态相对平滑,有利于传声器更好的拾取鸣声信号。将电路仓设置在下半圆壳的刚性球体结构内,同时能够密封,防止内部电路受到野外的水汽等侵蚀。
本发明还提供了一种野外鸟类鸣声自动检测方法,该方法具体包括:
在某一监测区域内,布设多个检测装置;
每个检测装置中的多通道信号采集模块将采集到的每个微弱的鸟类鸣声数字信号进行前置放大、抗混叠滤波处理、模数转换、数字滤波和数据抽取处理,得到多个鸟类鸣声数字信号;
具体地,前置放大电路对每个麦克风拾音器拾取的微弱的鸟类鸣声数字信号分别进行前置放大,得到每个通道的放大后的鸟类鸣声数字信号,并将其输入至抗混叠滤波器;
抗混叠滤波器于采用10Hz的高通滤波和30kHz的低通模拟滤波器,对每个通道中的放大后的鸟鸣声信号进行抗混叠滤波处理,实现抗混叠滤波,去除放大后的鸟类鸣声数字信号中的带外噪声,得到每个通道的抗混叠滤波处理后的鸟类鸣声数字信号;
模数转换器对每个通道的抗混叠滤波处理后的鸟类鸣声数字信号进行模数转换和数字滤波,对滤波后的信号按照采样率由高到低的顺序进行数据抽取,对高采样率的信号进行降采样处理,得到每个通道的鸟类鸣声数字信号。
信号合成单元将多个鸟类鸣声数字信号进行波束合成处理,得到高信噪比鸟类鸣声数字信号;
去噪与合成单元对高信噪比鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据;
具体地,获得完整的鸟类鸣声数据的具体过程如下:
步骤1)计算高信噪比鸟类鸣声数字信号的短时功率谱;
选取指定长度(取2~3秒)的高信噪比的鸟类鸣声数字信号X(t)为处理片段,对该信号X(t)进行分帧,数据帧长度为20毫秒,做1024点傅里叶变换(FFT),帧重叠512点,Hanning窗加权,预加重,并对每一帧的鸣声信号进行短时傅里叶变换,得到每一帧的鸣声信号的短时能量谱|Xi(k)|2;
步骤2)根据步骤1)得到的每一帧的鸣声信号的短时能量谱|Xi(k)|2,计算每一帧的鸣声信号听觉感知域的Mel子带能量;
其中,Ei(m,k)为第i帧的鸣声信号听觉感知域的Mel子带能量;Hm(k)代表第m个梅尔三角滤波器的频率响应;bl和bh分别为第m个梅尔三角滤波器的上限频率和下限频率;M为梅尔三角滤波器的最多个数;0<m<M;
其中,
其中,f(m)表示频率;
其中,B(f)为梅尔频率,B(f)=1125×ln(1+f/700);f为频率;fl和fh分别为频带范围内的最低频率和最高频率;fs为采样频率;
步骤3)采用双门限方法,选取自动检测的端点高门限阈值TH和低门限阈值TL:
TH=αPmin(k);TL=βPmin(k);
海岛等野外环境下的噪声常具有非平稳特性,当含噪声的鸟类鸣声数字信号的能量可以衰减到噪声能量的级别时,含噪声的鸟类鸣声数字信号的短时能量谱快速地收敛到噪声功率谱,因此,可以通过估计含噪声的鸟类鸣声数字信号的局部最小值的方法,来自适应估计噪声的门限值,其优点是无需进行无声段的判断,无需活动鸣声跟踪,提高了算法鲁棒性。
检测端点门限选取时,对含噪声的鸟类鸣声数字信号的短时能量谱进行平滑处理,以降低干扰信号的影响:
Pi(k)=λPi-1(k)+(1-λ)|Xi(k)|2 (4)
式中,Pi(k)为平滑后的含噪声的鸣声功率谱;λ为平滑系数,一般取值为0.94~0.98,取平滑功率谱的最小值Pmin(k)作为门限选取的基准阈值;
采用双门限作为活动鸣声段检测的两个阈值:TH=αPmin(k)和TL=βPmin(k)。一般满足:1.1<β<α<1.4;
其中,β=1.15和α=1.35,为经验值;
步骤4)检测活动鸣声起止端点
检测每段鸣声信号中能量较高的子带,确定有效鸣声的起止点。为了提高计算效率,提升差分效果,减少前后点的误差,利用隔点差分法计算,寻找步骤2)鸣声段中子带能量的局部极大值点集合{Emax(m,k)}。将子带能量集合中Emax(m,k)>TH作为端点检测的特征量,以Emax(m,k)为基点,向鸣声段的前后两端延伸直到E(m,k)<TL,由此确定有效鸣声片段的开始点和结束点。
步骤5)鸣声分段与静音去除
在实际传输过程中,只传输有效的鸣声段,对得到的鸣声进行自动分段,如果没有检测到活动鸣声段,剔除冗余的无音数据段,则数据不上传。为了能够获得完整的鸣声段,便于后续进一步的处理,通常将步骤4)得到的鸣声段各向前后延伸鸣声段长度的15%作为完整的鸣声段上传,如果两段鸣声之间的静音长度小于各自延伸长度的和,则认为这是连续的鸣声段上传。
步骤6)重复步骤1)-5),提取多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据。
对每个检测装置均实施上述检测过程,得到多个完整的鸟类鸣声数据,并将其输入至外界的数据处理中心,进行后续处理,识别出每个完整的鸟类鸣声数据对应的鸟类种类。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种野外鸟类鸣声自动检测装置,其特征在于,该装置为中部设有拾音窗口的刚性球体结构,其具体包括:上半圆壳(1)、下半圆壳(2)、电路仓(3)和拾音传感器阵列(6);
上半圆壳(1)和下半圆壳(2)之间呈上下位置设置,且上半圆壳(1)与下半圆壳(2)之间相隔,二者之间设有空气介质层,作为拾音窗口(4);电路仓(3)和拾音传感器阵列(6)设置在下半圆壳(2)内,拾音传感器阵列(6)设置在下半圆壳(2)的顶面的外圆周,且其下方设置密封的电路仓(3)。
2.根据权利要求1所述的野外鸟类鸣声自动检测装置,其特征在于,所述拾音传感器阵列(6)包括N+1个基本阵元(5);所述基本阵元(5)为麦克风拾音器,
其中一个麦克风拾音器位于圆的中心,该圆为下半圆壳(2)的顶面的外圆周;该麦克风拾音器的信号作为参考信号,N个麦克风拾音器,呈均匀分布在外圆周上。
3.根据权利要求1所述的野外鸟类鸣声自动检测装置,其特征在于,所述电路仓内设置多通道信号采集模块、信号处理模块、主控制模块、通信模块和电源模块;
所述多通道信号采集模块,用于对每个麦克风拾音器拾取的微弱的鸟类鸣声数字信号分别进行前置放大、抗混叠滤波处理、模数转换、数字滤波和数据抽取处理,得到多个通道的鸟类鸣声数字信号,并将其输入至信号处理模块;
所述信号处理模块,用于将多个通道的鸟类鸣声数字信号进行合成,得到高信噪比的鸟类鸣声数字信号,并对该高信噪比的鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据;
所述主控制模块,用于对多通道信号采集模块、信号处理模块和通信模块的工作状态进行控制;
所述通信模块,用于采用WIFI、4G和/或5G双模态的无线通信方式,根据野外监测区域的通讯情况,选择对应的通讯方式;
所述电源模块,用于给多通道采集模块、信号处理模块、主控制模块和通讯模块提供正常工作的电源。
4.根据权利要求3所述的野外鸟类鸣声自动检测装置,其特征在于,所述多通道信号采集模块包括:前置放大电路、抗混叠滤波器和模数转换器;
所述前置放大电路,用于对每个麦克风拾音器拾取的微弱的鸟类鸣声数字信号分别进行前置放大,得到每个通道的放大后的鸟类鸣声数字信号,并将其输入至抗混叠滤波器;
所述抗混叠滤波器,用于采用10Hz的高通滤波和30kHz的低通模拟滤波器,对每个通道中的放大后的鸟鸣声信号进行抗混叠滤波处理,实现抗混叠滤波,去除放大后的鸟类鸣声数字信号中的带外噪声,得到每个通道的抗混叠滤波处理后的鸟类鸣声数字信号;
所述模数转换器,用于对每个通道的抗混叠滤波处理后的鸟类鸣声数字信号进行模数转换和数字滤波,对滤波后的信号按照采样率由高到低的顺序进行数据抽取,对高采样率的信号进行降采样处理,得到每个通道的鸟类鸣声数字信号,并将其输入至信号处理模块。
5.根据权利要求3所述的野外鸟类鸣声自动检测装置,其特征在于,所述信号处理模块包括:合成单元和去噪与整合单元;
所述合成单元,用于将每个通道的鸟鸣声数字信号以位于拾音传感器阵列中心的基本阵元所采集的信号为参考信号,结合剩余的基本阵元采集的信号数据,采用常规的时延--求和波束合成方法或者自适应波束形成方法,对采集的多个通道的鸟类鸣声数字信号进行波束合成处理,获得高信噪比的鸟类鸣声数字信号;
所述去噪与整合单元,用于对高信噪比鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据。
6.根据权利要求5所述的野外鸟类鸣声自动检测装置,其特征在于,所述去噪与整合单元的的具体实现过程为;
步骤1)计算高信噪比鸟类鸣声数字信号的短时功率谱;
选取指定长度的高信噪比的鸟类鸣声数字信号X(t)为处理片段,对该信号X(t)进行分帧,数据帧长度为20毫秒,做1024点傅里叶变换,帧重叠512点,Hanning窗加权,预加重,并对每一帧的鸣声信号进行短时傅里叶变换,得到每一帧的鸣声信号的短时能量谱|Xi(k)|2;
步骤2)根据步骤1)得到的每一帧的鸣声信号的短时能量谱|Xi(k)|2,计算每一帧的鸣声信号听觉感知域的Mel子带能量;
其中,Ei(m,k)为第i帧的鸣声信号听觉感知域的Mel子带能量;Hm(k)代表第m个梅尔三角滤波器的频率响应;bl和bh分别为第m个梅尔三角滤波器的上限频率和下限频率;M为梅尔三角滤波器的最多个数;0<m<M;
其中,
其中,f(m)表示频率;
其中,B(f)为梅尔频率,B(f)=1125×ln(1+f/700);f为频率;fl和fh分别为频带范围内的最低频率和最高频率;fs为采样频率;
步骤3)采用双门限方法,选取自动检测的端点高门限阈值TH和低门限阈值TL:
TH=αPmin(k);TL=βPmin(k);
采用双门限作为活动鸣声段检测的两个阈值:TH=αPmin(k)和TL=βPmin(k)。一般满足:1.1<β<α<1.4;
其中,β=1.15;α=1.35;
步骤4)利用隔点差分法计算,寻找步骤2)鸣声段中子带能量的局部极大值点集合{Emax(m,k)};
将子带能量集合中Emax(m,k)>TH作为端点检测的特征量,以Emax(m,k)为基点,向鸣声段的前后两端延伸直到E(m,k)<TL,由此确定有效鸣声片段的开始点和结束点;
步骤5)将步骤4)得到的鸣声段各向前后延伸鸣声段长度的15%,作为有效的鸟类鸣声片段;
步骤6)重复步骤1)-5),提取多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据。
7.一种野外鸟类鸣声自动检测方法,基于在某一监测区域内布设的多个权利要求5-6中任一所述的野外鸟类鸣声自动检测装置实现;
该方法包括:
多通道信号采集模块将采集到的每个微弱的鸟类鸣声数字信号进行前置放大、抗混叠滤波处理、模数转换、数字滤波和数据抽取处理,得到多个鸟类鸣声数字信号;
合成单元将多个鸟类鸣声数字信号进行波束合成处理,得到高信噪比鸟类鸣声数字信号;
去噪与整合单元对高信噪比鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据;
对每个检测装置均实施上述检测过程,得到多个完整的鸟类鸣声数据,完成对野外鸟类鸣声的检测。
8.根据权利要求7所述的野外鸟类鸣声自动检测方法,其特征在于,所述多通道信号采集模块将采集到的每个微弱的鸟类鸣声数字信号进行前置放大、抗混叠滤波处理、模数转换、数字滤波和数据抽取处理,得到多个鸟类鸣声数字信号;其具体过程为:
前置放大电路对每个麦克风拾音器拾取的微弱的鸟类鸣声数字信号分别进行前置放大,得到每个通道的放大后的鸟类鸣声数字信号,并将其输入至抗混叠滤波器;
抗混叠滤波器于采用10Hz的高通滤波和30kHz的低通模拟滤波器,对每个通道中的放大后的鸟鸣声信号进行抗混叠滤波处理,实现抗混叠滤波,去除放大后的鸟类鸣声数字信号中的带外噪声,得到每个通道的抗混叠滤波处理后的鸟类鸣声数字信号;
模数转换器对每个通道的抗混叠滤波处理后的鸟类鸣声数字信号进行模数转换和数字滤波,对滤波后的信号按照采样率由高到低的顺序进行数据抽取,对高采样率的信号进行降采样处理,得到每个通道的鸟类鸣声数字信号。
9.根据权利要求7所述的野外鸟类鸣声自动检测方法,其特征在于,所述去噪与整合单元对高信噪比鸟类鸣声数字信号进行去噪处理,提取出多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据;其具体过程为:
步骤1)计算高信噪比鸟类鸣声数字信号的短时功率谱;
选取指定长度的高信噪比的鸟类鸣声数字信号X(t)为处理片段,对该信号X(t)进行分帧,数据帧长度为20毫秒,做1024点傅里叶变换,帧重叠512点,Hanning窗加权,预加重,并对每一帧的鸣声信号进行短时傅里叶变换,得到每一帧的鸣声信号的短时能量谱|Xi(k)|2;
步骤2)根据步骤1)得到的每一帧的鸣声信号的短时能量谱|Xi(k)|2,计算每一帧的鸣声信号听觉感知域的Mel子带能量;
其中,Ei(m,k)为第i帧的鸣声信号听觉感知域的Mel子带能量;Hm(k)代表第m个梅尔三角滤波器的频率响应;bl和bh分别为第m个梅尔三角滤波器的上限频率和下限频率;M为梅尔三角滤波器的最多个数;0<m<M;
其中,
其中,f(m)表示频率;
其中,B(f)为梅尔频率,B(f)=1125×ln(1+f/700);f为频率;fl和fh分别为频带范围内的最低频率和最高频率;fs为采样频率;
步骤3)采用双门限方法,选取自动检测的端点高门限阈值TH和低门限阈值TL:
TH=αPmin(k);TL=βPmin(k);
采用双门限作为活动鸣声段检测的两个阈值:TH=αPmin(k)和TL=βPmin(k)。一般满足:1.1<β<α<1.4;
其中,β=1.15;α=1.35;
步骤4)利用隔点差分法计算,寻找步骤2)鸣声段中子带能量的局部极大值点集合{Emax(m,k)};
将子带能量集合中Emax(m,k)>TH作为端点检测的特征量,以Emax(m,k)为基点,向鸣声段的前后两端延伸直到E(m,k)<TL,由此确定有效鸣声片段的开始点和结束点;
步骤5)将步骤4)得到的鸣声段各向前后延伸鸣声段长度的15%,作为有效的鸟类鸣声片段;
步骤6)重复步骤1)-5),提取多个有效的鸟类鸣声片段,并剔除有效的鸟类鸣声片段之间的静音或无音数据,得到一个完整的鸟类鸣声数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110308594.2A CN113129907B (zh) | 2021-03-23 | 2021-03-23 | 一种野外鸟类鸣声自动检测装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110308594.2A CN113129907B (zh) | 2021-03-23 | 2021-03-23 | 一种野外鸟类鸣声自动检测装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113129907A true CN113129907A (zh) | 2021-07-16 |
CN113129907B CN113129907B (zh) | 2022-08-23 |
Family
ID=76773761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110308594.2A Active CN113129907B (zh) | 2021-03-23 | 2021-03-23 | 一种野外鸟类鸣声自动检测装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113129907B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114067809A (zh) * | 2021-11-15 | 2022-02-18 | 百鸟数据科技(北京)有限责任公司 | 野生动物声音智能监测与ai识别系统以及装置 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030160862A1 (en) * | 2002-02-27 | 2003-08-28 | Charlier Michael L. | Apparatus having cooperating wide-angle digital camera system and microphone array |
US7068801B1 (en) * | 1998-12-18 | 2006-06-27 | National Research Council Of Canada | Microphone array diffracting structure |
US20090323981A1 (en) * | 2008-06-27 | 2009-12-31 | Microsoft Corporation | Satellite Microphone Array For Video Conferencing |
CN104569484A (zh) * | 2015-01-27 | 2015-04-29 | 长春建筑学院 | 一种多输入多输出阵列式超声测风系统及测量方法 |
CN104581463A (zh) * | 2013-10-25 | 2015-04-29 | 哈曼贝克自动系统股份有限公司 | 麦克风阵列 |
CN105911523A (zh) * | 2016-04-13 | 2016-08-31 | 东北石油大学 | 基于半球型麦克风阵列的点声源定位系统智能检测前端 |
US9560441B1 (en) * | 2014-12-24 | 2017-01-31 | Amazon Technologies, Inc. | Determining speaker direction using a spherical microphone array |
CN207096800U (zh) * | 2017-09-01 | 2018-03-13 | 南昌欧菲光科技有限公司 | 智能家居控制装置和智能家居系统 |
CN207321416U (zh) * | 2017-06-29 | 2018-05-04 | 青岛海尔多媒体有限公司 | 一种拾音组件、拾音器及电视机唤醒远讲语音系统 |
CN109409308A (zh) * | 2018-11-05 | 2019-03-01 | 中国科学院声学研究所 | 一种基于鸟类鸣声的鸟类物种识别的方法 |
TWM583997U (zh) * | 2019-06-17 | 2019-09-21 | 正修學校財團法人正修科技大學 | 智慧幼兒伴隨裝置 |
CN110570874A (zh) * | 2018-06-05 | 2019-12-13 | 中国科学院声学研究所 | 一种用于监测野外鸟类鸣声强度及分布的系统及其方法 |
US20190387297A1 (en) * | 2018-06-15 | 2019-12-19 | GM Global Technology Operations LLC | Weather and wind buffeting resistant microphone assembly |
-
2021
- 2021-03-23 CN CN202110308594.2A patent/CN113129907B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7068801B1 (en) * | 1998-12-18 | 2006-06-27 | National Research Council Of Canada | Microphone array diffracting structure |
US20030160862A1 (en) * | 2002-02-27 | 2003-08-28 | Charlier Michael L. | Apparatus having cooperating wide-angle digital camera system and microphone array |
US20090323981A1 (en) * | 2008-06-27 | 2009-12-31 | Microsoft Corporation | Satellite Microphone Array For Video Conferencing |
CN104581463A (zh) * | 2013-10-25 | 2015-04-29 | 哈曼贝克自动系统股份有限公司 | 麦克风阵列 |
US9560441B1 (en) * | 2014-12-24 | 2017-01-31 | Amazon Technologies, Inc. | Determining speaker direction using a spherical microphone array |
CN104569484A (zh) * | 2015-01-27 | 2015-04-29 | 长春建筑学院 | 一种多输入多输出阵列式超声测风系统及测量方法 |
CN105911523A (zh) * | 2016-04-13 | 2016-08-31 | 东北石油大学 | 基于半球型麦克风阵列的点声源定位系统智能检测前端 |
CN207321416U (zh) * | 2017-06-29 | 2018-05-04 | 青岛海尔多媒体有限公司 | 一种拾音组件、拾音器及电视机唤醒远讲语音系统 |
CN207096800U (zh) * | 2017-09-01 | 2018-03-13 | 南昌欧菲光科技有限公司 | 智能家居控制装置和智能家居系统 |
CN110570874A (zh) * | 2018-06-05 | 2019-12-13 | 中国科学院声学研究所 | 一种用于监测野外鸟类鸣声强度及分布的系统及其方法 |
US20190387297A1 (en) * | 2018-06-15 | 2019-12-19 | GM Global Technology Operations LLC | Weather and wind buffeting resistant microphone assembly |
CN109409308A (zh) * | 2018-11-05 | 2019-03-01 | 中国科学院声学研究所 | 一种基于鸟类鸣声的鸟类物种识别的方法 |
TWM583997U (zh) * | 2019-06-17 | 2019-09-21 | 正修學校財團法人正修科技大學 | 智慧幼兒伴隨裝置 |
Non-Patent Citations (3)
Title |
---|
POTAMITIS I,NTALAMPIRAS S,JAHN O,ET AL.: "Automatic bird sound detection in long real-field recordings:applications and tools", 《APPLIED ACOUSTICS》 * |
刘祥楼等: "基于半球型麦克风阵列的点声源定位系统智能检测前端设计与实现", 《电子设计工程》 * |
张赛花等: "基于Mel子带参数化特征的自动鸟鸣识别", 《计算机应用》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114067809A (zh) * | 2021-11-15 | 2022-02-18 | 百鸟数据科技(北京)有限责任公司 | 野生动物声音智能监测与ai识别系统以及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113129907B (zh) | 2022-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018137704A1 (zh) | 一种基于麦克风阵列的拾音方法及系统 | |
US11830479B2 (en) | Voice recognition method and apparatus, and air conditioner | |
CN110570874B (zh) | 一种用于监测野外鸟类鸣声强度及分布的系统及其方法 | |
CN111175729B (zh) | 一种基于齿鲸类高频声呐信号的实时在线监测预警系统 | |
CN110265065B (zh) | 一种构建语音端点检测模型的方法及语音端点检测系统 | |
CN111540347A (zh) | 基于音频的电缆隧道监测方法及系统 | |
CN113129907B (zh) | 一种野外鸟类鸣声自动检测装置及方法 | |
CN103219012A (zh) | 一种基于声源距离的双麦克风噪声消除方法及装置 | |
CN107483120A (zh) | 水声信号采集与处理系统 | |
CN106782519A (zh) | 一种机器人 | |
CN109921811A (zh) | 一种水声通信方法、装置及系统 | |
CN108447483A (zh) | 语音识别系统 | |
CN110473544A (zh) | 一种低功耗语音唤醒方法及装置 | |
CN109186752A (zh) | 基于图形处理器的水下声学信号采集、传输和检测系统 | |
CN111883161A (zh) | 一种音频采集和位置识别的方法及装置 | |
CN102307271A (zh) | 网络数字一体对讲系统及其传输方法 | |
CN116612780B (zh) | 一种野外声音收集方法、装置、计算机设备和存储介质 | |
CN207184490U (zh) | 一种水声信号采集装置 | |
CN205726362U (zh) | 一种双麦克风语音降噪系统 | |
CN208538474U (zh) | 语音识别系统 | |
CN216791377U (zh) | 基于ecm麦克风的多通道声阵列成像系统 | |
CN105577909A (zh) | 一种消噪方法及装置 | |
CN209402679U (zh) | 拾音组件和系统 | |
CN114019455A (zh) | 一种基于mems加速度计的目标声源探测系统 | |
CN114449410A (zh) | 一种多通道声纹信号同步采集系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |