CN114743562B - 一种飞机声纹识别方法、系统、电子设备及存储介质 - Google Patents
一种飞机声纹识别方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114743562B CN114743562B CN202210644525.3A CN202210644525A CN114743562B CN 114743562 B CN114743562 B CN 114743562B CN 202210644525 A CN202210644525 A CN 202210644525A CN 114743562 B CN114743562 B CN 114743562B
- Authority
- CN
- China
- Prior art keywords
- frequency
- aircraft
- acoustic signal
- frame
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000005070 sampling Methods 0.000 claims abstract description 20
- 238000001228 spectrum Methods 0.000 claims description 100
- 230000003595 spectral effect Effects 0.000 claims description 74
- 238000012216 screening Methods 0.000 claims description 52
- 238000001914 filtration Methods 0.000 claims description 25
- 230000005236 sound signal Effects 0.000 claims description 17
- 230000007613 environmental effect Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 claims description 12
- 229940087412 maxidex Drugs 0.000 claims description 12
- 230000005238 low-frequency sound signal Effects 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 5
- 230000001143 conditioned effect Effects 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000012360 testing method Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明提供了一种飞机声纹识别方法、系统、电子设备及存储介质,属于飞机声纹数据处理技术领域。该方法包括:实时采集环境中的声信号;对所采集的声信号进行采样和量化处理,得到声信号的时域特征;利用FFT将时域特征转换成频域特征;对所述频域特征进行三层识别,得到飞机声信号,并发送指示信号。本发明基于上述方案解决了现有技术难以在室外无人环境下快速、实时识别飞机信号的问题。
Description
技术领域
本发明属于飞机声纹数据处理技术领域,尤其涉及一种飞机声纹识别方法、系统、电子设备及存储介质。
背景技术
声纹作为一种常见的生物感知特征,随着数字信号处理技术的发展,现已成为了一种有效的侦查手段。各类飞行器在运行过程中无法避免得会产生噪音,利用声纹探测飞机目标,是一种有效的信息获取手段。在军事应用领域,基于声信号被动感知敌方飞机发动机噪声,为指挥中心及时提供一线情报,可弥补雷达与遥感手段仅能监测近场目标的缺陷;在民用领域,声信号被动感知探测飞机目标,能够在搜救、监控等场景中提供及时、精确的情报信息。近年来在被动声识别技术应用于识别飞机等战场目标的研究中,基于声音的时频谱特征,BP神经网络、支持向量机、自编码器等机器学习方法已被证实具有可行性。但在实际应用探测场景中,无论是飞机起降或是跑道滑行,机场跑道往往位于或空旷或偏远的室外环境中,对于飞机这种高速运动目标,既要保证较高的识别率又要保证识别的及时性,往往存在以下难点:一方面,机器学习建模所需的全面、大量的飞机声音样本难以获取,且建模、训练过程较为复杂;另一方面,室外环境下无法联网进行探测,可用的嵌入式平台运算量和运算精度有限,难以部署复杂的识别模型。
鉴于此,本文提出一种时间序列频谱特征飞机声纹识别方法、系统、电子设备及存储介质,适用于嵌入式平台,通过计算声信号频谱能量比率、频谱能量集中度在时间序列上的统计特征筛选出飞机声信号,简单高效。
发明内容
针对现有技术中的上述不足,本发明提供的一种飞机声纹识别方法、系统、电子设备及存储介质,解决了现有技术存在的难以在室外无人环境下快速、实时识别飞机信号的问题。
为了达到以上目的,本发明采用的技术方案为:
第一方面,本方案提供了一种飞机声纹识别方法,包括:
S1、实时采集环境中的声信号;
S2、对所采集的声信号进行采样和量化处理,得到声信号的时域特征;
S3、利用FFT将时域特征转换成频域特征;
S4、对频域特征进行三层识别,得到飞机声信号,并发送指示信号。
本发明的有益效果是:本发明依托于嵌入式声处理平台和时间序列频谱特征,建立了一种飞机声纹识别方法,相比基于机器学习的识别算法降低了运算负荷与模型训练成本,减少了对样本质量和数量的需求,简单高效,为解决现有技术存在的需要在室外无人环境下快速识别飞机信号的困难提供了技术支撑。
进一步地,所述进行采样和量化处理为:将采集的连续的声信号转换为离散的时间和幅度信号,得到声信号的时域特征。
上述进一步方案的有益效果是:该过程即采样、量化,把电信号转化为数字信号进行处理。
再进一步地,所述将时域特征转换成频域特征的表达式如下:
上述进一步方案的有益效果是:由于飞机声音是低频信号,转为频域特征更易进行特征提取。
再进一步地,所述步骤S4包括以下步骤:
S401、根据频域特征,通过频谱能量比率取阈值过滤高频噪声信号,筛选得到低频声信号;
S402、根据低频声信号和飞机特征频段的统计特征,过滤与飞机噪声特征存在差异的环境噪声;
S403、根据步骤S402的过滤结果,筛选得到频谱能量集中特征稳定的声信号,从而得到飞机声信号,并发送指示信号。
上述进一步方案的有益效果是:本发明基于时间序列频谱特征,通过计算频谱能量比率和频谱能量集中度在时间序列上的统计特征,设置三层判断条件,依次递进得筛选出低频声信号、飞机声信号及类似信号、稳定的飞机声信号。从而快速、简单、有效地识别环境中的飞机声信号。
再进一步地,所述频谱能量比率的表达式如下:
再进一步地,所述筛选得到低频声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:BERt,(0,1000),(0,3000) >70%且MAXXt(k)>70dB,其中,BERt,(0,1000),(0,3000)表示第t帧声信号频谱特征0-1000hz占0-3000hz频谱能量比,MAXXt(k)表示第t帧声信号频谱幅值最大值。
上述进一步方案的有益效果是:通过低频筛选,过滤掉高频噪声,同时考虑声信号距离衰减,与室外环境低频噪声,为低频段频谱幅值的最大值设置临界值。此外,为避免瞬时噪声影响,引入占空比进行判断。
再进一步地,所述过滤与飞机噪声特征存在差异的环境噪声的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MEANXt(100,230)>50dB、BERt,(100,230),(0,1000) >30% 和30%>BERt,(400,600),(0,1000) >5% 其中,MEANXt(100,230) 表示100-230hz频段的声信号频谱幅值均值,BERt,(100,230),(0,1000)表示第t帧声信号100-230hz占0-1000hz频谱能量比,BERt,(400,600),(0,1000)表示第t帧声信号400-600hz占0-1000hz频谱能量比。
上述进一步方案的有益效果是:飞机声信号能量主要集中在100-230hz(频段1),其次是400-600hz(频段2),通过为频段1、频段2频谱能量占低频段(0-1000hz)比率设置阈值进行判断,同时为频段1频谱幅值均值设置最低门限阈值,从而筛选出飞机声信号及类似声信号,为避免瞬时噪声影响,引入占空比进行判断。
再进一步地,所述筛选得到飞机声信号的频谱能量集中特征的条件为:所述筛选得到频谱能量集中特征稳定的声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MAXXt(0,1000)>100dB 且STD_TS_MAXINDEX ∈[0,3] 且MEAN_TS_MAXINDEX∈[6,9],其中,MAXXt(0,1000) 表示第t帧声信号0-1000hz频段频谱幅值最大值,STD_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动标准差,MEAN_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动均值。
上述进一步方案的有益效果是:基于飞机声信号低频带(0-1000hz)的最大值对应的频率索引在时间序列上的波动特征:标准差与均值,其本质是为了筛选频谱能量集中特征在时间序列上稳定的声信号。为避免瞬时噪声影响,引入占空比进行判断。
第二方面,本发明提供了一种飞机声纹识别系统,所述飞机声纹识别系统位于嵌入式平台中,包括:
采集模块,用于实时采集环境中的声信号;
第一处理模块,用于对所采集的声信号进行采样和量化处理,得到声信号的时域特征;
第二处理模块,用于利用FFT将时域特征转换成频域特征;
识别模块,用于对频域特征进行三层识别,得到飞机声信号,并发送指示信号。
本发明的有益效果是:本发明依托于嵌入式声处理平台和时间序列频谱特征,建立了一种飞机声纹识别系统,相比基于机器学习的识别算法降低了运算负荷与模型训练成本,减少了对样本质量和数量的需求,简单高效,为解决现有技术存在的需要在室外无人环境下快速识别飞机信号的困难提供了技术支撑。
进一步地,所述进行采样和量化处理为:将采集的连续的声信号转换为离散的时间和幅度信号,得到声信号的时域特征。
上述进一步方案的有益效果是:该过程即采样、量化,把电信号转化为数字信号进行处理。
再进一步地,所述将时域特征转换成频域特征的表达式如下:
上述进一步方案的有益效果是:由到飞机声音是低频信号,转为频域特征更易进行特征提取。
再进一步地,所述识别模块包括:
第一筛选单元,用于根据频域特征,通过频谱能量比率取阈值过滤高频噪声信号,筛选得到低频声信号;
第二筛选单元,用于根据低频声信号和飞机特征频段的统计特征,过滤与飞机噪声特征存在差异的环境噪声;
第三筛选单元,用于根据第二筛选单元的过滤结果,筛选得到频谱能量集中特征稳定的声信号,从而得到飞机声信号,并发送指示信号。
上述进一步方案的有益效果是:本发明基于时间序列频谱特征,通过计算频谱能量比率和频谱能量集中度在时间序列上的统计特征,设置三层判断条件,依次递进得筛选出低频声信号、飞机声信号及特征相似的声信号、稳定的飞机声信号,从而快速、简单、有效地识别环境中的飞机声信号。
再进一步地,所述频谱能量比率的表达式如下:
再进一步地,所述筛选得到低频声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:BERt,(0,1000),(0,3000) >70%且MAXXt(k)>70dB,其中,BERt,(0,1000),(0,3000)表示第t帧声信号频谱特征0-1000hz占0-3000hz频谱能量比,MAXXt(k)表示第t帧声信号频谱幅值最大值。
上述进一步方案的有益效果是:通过低频筛选,过滤掉高频噪声,同时考虑声信号距离衰减,与室外环境低频噪声,为低频段频谱幅值的最大值设置临界值。此外,为避免瞬时噪声影响,引入占空比进行判断。
再进一步地,所述过滤与飞机噪声特征存在差异的环境噪声的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MEANXt(100,230)>50dB、BERt,(100,230),(0,1000) >30% 和30%>BERt,(400,600),(0,1000) >5% 其中,MEANXt(100,230) 表示100-230hz频段的声信号频谱幅值均值,BERt,(100,230),(0,1000)表示第t帧声信号100-230hz占0-1000hz频谱能量比,BERt,(400,600),(0,1000)表示第t帧声信号400-600hz占0-1000hz频谱能量比。
上述进一步方案的有益效果是:飞机声信号能量主要集中在100-230hz(频段1),其次是400-600hz(频段2),通过为频段1、频段2频谱能量占低频段(0-1000hz)比率设置阈值进行判断,同时为频段1频谱幅值均值设置最低门限阈值,从而筛选出飞机声信号及类似声信号,为避免瞬时噪声影响,引入占空比进行判断。
再进一步地,所述筛选得到频谱能量集中特征稳定的声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MAXXt(0,1000)>100dB 且STD_TS_MAXINDEX ∈[0,3] 且MEAN_TS_MAXINDEX∈[6,9],其中,MAXXt(0,1000) 表示第t帧声信号0-1000hz频段频谱幅值最大值,STD_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动标准差,MEAN_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动均值。
上述进一步方案的有益效果是:基于飞机声信号低频带(0-1000hz)的最大值对应的频率索引在时间序列上的波动特征:标准差与均值,其本质是为了筛选频谱能量集中特征在时间序列上稳定的声信号。为避免瞬时噪声影响,引入占空比进行判断。
第三方面,本发明提供了一种电子设备包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现任一所述的飞机声纹识别方法的步骤。
第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,执行所述计算机程序时实现任一项所述的飞机声纹识别方法的步骤。
附图说明
图1为本发明的方法流程图。
图2为本实施例中试验噪声时间序列频谱幅值均值曲线分布示意图。
图3为本实施例中飞机特征频段频谱能量比率时间序列分布特征示意图。
图4为本实施例中低频段(0-1000hz)频谱幅值最大值对应频率索引时间序列波动分布特征示意图。
图5为本发明的系统结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例1
本发明提出一种适用于嵌入式平台的,基于时间序列频谱统计特征的飞机声纹识别方法,能够在室外环境下快速、有效探测到飞机声信号。为实现这一目的,本发明提出以下技术方案:如图1所示,本发明提供了一种飞机声纹识别方法,其实现方法如下:
S1、实时采集环境中的声信号;
S2、对所采集的声信号进行采样和量化处理,得到声信号的时域特征;
S3、利用FFT将时域特征转换成频域特征;
S4、对频域特征进行三层识别,得到飞机声信号,并发送指示信号,其实现方法如下:
S401、根据频域特征,通过频谱能量比率取阈值过滤高频噪声信号,筛选得到低频声信号;
所述筛选得到低频声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:BERt,(0,1000),(0,3000) >70%且MAXXt(k)>70dB,其中,BERt,(0,1000),(0,3000)表示第t帧声信号频谱特征0-1000hz占0-3000hz频谱能量比,MAXXt(k)表示第t帧声信号频谱幅值最大值;
S402、根据低频声信号和飞机特征频段的统计特征,过滤与飞机噪声特征存在差异的环境噪声;
所述过滤与飞机噪声特征存在差异的环境噪声的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MEANXt(100,230)>50dB、BERt,(100,230),(0,1000) >30% 和30%>BERt,(400,600),(0,1000) >5% 其中,MEANXt(100,230) 表示100-230hz频段的声信号频谱幅值均值,BERt,(100,230),(0,1000)表示第t帧声信号100-230hz占0-1000hz频谱能量比,BERt,(400,600),(0,1000)表示第t帧声信号400-600hz占0-1000hz频谱能量比;
S403、根据步骤S402的过滤结果,筛选得到频谱能量集中特征稳定的声信号,从而得到飞机声信号,并发送指示信号;
所述筛选得到频谱能量集中特征稳定的声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MAXXt(0,1000)>100dB 且STD_TS_MAXINDEX ∈[0,3]且MEAN_TS_MAXINDEX∈[6,9],其中,MAXXt(0,1000) 表示第t帧声信号0-1000hz频段频谱幅值最大值,STD_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动标准差,MEAN_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动均值。
本实施例中,本发明利用嵌入式平台的采音装置(麦克风或声传感器等)实时采集环境中的声信号,因为所要识别的目标飞机声信号属于低频信号,因此采样频率设置为6000hz即可满足识别需求。
本实施例中,在嵌入式平台中,对所采集的声信号进行采样和量化处理:将连续的声信号转换为离散的时间和幅度信号,得到声信号的时域特征。
本实施例中,本发明基于时间序列频谱特征:整个系统放在飞机可能低空出现的无人环境中,进行实时识别,环境中存在各种各样的噪声,通过计算频谱能量比率、频谱能量集中度在时间序列上的统计特征,设置有三层判断条件,第一层判断为低频筛选;第二层判断条件是基于目标飞机声信号的特征频段进行筛选;第三层判断条件是基于目标飞机声信号低频带(0-1000hz)的最大值对应的频率索引在时间序列上的波动特征设置,从而筛选出飞机声信号。基于上述三层判断条件,为降低对其他环境噪声的虚警率,每一层判断条件都引入占空比作为时间序列特征稳定性评价,占空比指在一段时间序列窗口内,满足条件的数据帧占总数据帧的比例,以识别飞机声信号。为了识别稳定的飞机声信号,降低对其他环境噪声的虚警率,每一层判断条件都引入占空比作为时间序列特征稳定性评价,占空比指在一段时间序列窗口内,满足条件的数据帧占总数据帧的比例。
本实施例中,第一层判断条件进行低频声信号筛选:通过为低频段(0-1000hz)频谱能量占总能量比率设置阈值来过滤掉高频噪声,同时考虑目标飞机声信号距离衰减,与室外环境低频噪声,为低频段频谱幅值的最大值设置临界值。低频声信号筛选的时间序列窗口为1秒钟,占空比大于等于80%。即,通过频谱能量比率取阈值,并根据该阈值过滤高频飞机噪声,对于频段i和频段j,频谱能量比率的表式如下:
本实施例中,目标飞机声信号属于低频信号,能量集中在0-1000hz频段内,同时为消除瞬时噪声的影响,引入占空比进行特征稳定性判断,如图2所示,自然环境中获取的飞机噪声:采集飞机声音1、采集飞机声音2的时间序列频谱幅值均值都集中在低频0-1000hz,且集中在100-230hz、400-600hz两个频段;采集得到的其他环境、机械噪声如强台风声音、挖掘机音效等也属于低频噪声,会给飞机声信号识别带来干扰。低频声信号筛选的条件设置为:1秒的时间序列窗口内占空比大于等于80%,每帧数据需满足:0-1000hz频谱能量占频谱总能量比率大于70%,频谱最大值大于70dB。即,在1000hz 以下1秒的时间序列窗口内占空比大于80%,且每帧数据同时满足:BERt,(0,1000),(0,3000)和MAXXt(k)>70dB,其中,BERt,(0,1000),(0,3000)表示第t帧声信号频谱特征0-1000hz占0-3000hz频谱能量比,MAXXt(k)表示第t帧声信号频谱幅值最大值。
在0-1000hz频段中,频谱能量占比大于总能量比率的70%,频谱最大值大于70dB,其中,频谱能量为信号傅里叶变换后频段频谱幅值绝对值之和;频谱总能量为信号傅里叶变换后整个频段频谱幅值绝对值之和。
本实施例中,在对低频声信号筛选之后,第二层判断条件是基于飞机声信号特征频段进行筛选,飞机声信号能量主要集中在100-230hz(频段1),其次是400-600hz(频段2)。通过为频段1、频段2频谱能量占低频段(0-1000hz)比率设置阈值进行判断,同时为频段1频谱幅值均值设置最低门限阈值。第二层判断的时间序列窗口为1秒钟,占空比大于等于80%。设置判断条件为,1秒的时间序列窗口内占空比大于等于80%,每帧数据需满足:100-230hz频谱幅值均值大于50dB,100-230hz频谱能量占0-1000hz频段比率大于30%,400-600hz频谱能量占0-1000hz频段比率小于等于30%、大于等于5%。即,根据统计得到的飞机声信号特征频段对低频噪声进行筛选,筛选得到与飞机声信号特征相似的声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据同时满足:MEANXt(100,230)>50dB、BERt,(100,230),(0,1000) >30% 和30% >BERt,(400,600),(0,1000) >5%其中,MEANXt(100,230) 表示100-230hz频段的声信号频谱幅值均值,BERt,(100,230),(0,1000)表示第t帧声信号100-230hz占0-1000hz频谱能量比,BERt,(400,600),(0,1000)表示第t帧声信号400-600hz占0-1000hz频谱能量比。如图3所示,图3中,M和N分别代表频段在100-230hz的BERt,(100,230),(0,1000) 和频段在400-600hz的BERt,(400,600),(0,1000) ,M1为采集的飞机声信号1频段在100-230hz的BERt,(100,230),(0,1000),M2为采集的飞机声信号2频段在100-230hz的BERt,(100,230),(0,1000),N1为采集的飞机声信号1在频段400-600hz的BERt,(400,600),(0,1000),N2为采集的飞机声信号2在频段400-600hz的BERt,(400,600),(0,1000)。
本实施例中,第三层判断条件是基于飞机声信号低频段(0-1000hz)的最大值对应的频率索引在时间序列上的波动特征:标准差与均值,其本质是为了筛选频谱能量集中特征在时间序列上稳定的声信号,为标准差和均值设定阈值区间进行判断,同时为频段1频谱幅值最大值设置最低门限阈值。第三层判断的时间序列窗口为1秒钟,占空比大于等于80%,飞机低频(即0-1000hz)频谱幅值最大值所对应的频率索引在1秒时间序列窗口内的均值和标准差波动稳定在一定区间内,其本质为低频频谱幅值最大值所对应的频率稳定在100-230hz间。筛选出飞机声信号的条件为:在1000hz以下1秒的时间序列窗口内占空比大于等于80%,且每帧数据同时满足:MAXXt(0,1000)>100dB 且STD_TS_MAXINDEX ∈[0,3] 且MEAN_TS_MAXINDEX∈[6,9],其中,MAXXt(0,1000) 表示第t帧声信号0-1000hz频段频谱幅值最大值,STD_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动标准差,MEAN_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动均值。如图4所示,图4中,X和Y分别为标准差STD_TS_MAXINDEX和均值MEAN_TS_MAXINDEX,X1为采集的飞机声信号1的标准差STD_TS_MAXINDEX,X2为采集的飞机声信号2的标准差STD_TS_MAXINDEX,Y1为采集的飞机声信号1的均值MEAN_TS_MAXINDEX,Y2为采集的飞机声信号2的均值MEAN_TS_MAXINDEX。
实施例2
如图5所示,本发明提供了一种飞机声纹识别系统,所述飞机声纹识别系统位于嵌入式平台中,包括:
采集模块,用于实时采集环境中的声信号;
第一处理模块,用于对所采集的声信号进行采样和量化处理,得到声信号的时域特征;
第二处理模块,用于利用FFT将时域特征转换成频域特征;
识别模块,用于对频域特征进行三层识别,得到飞机声信号,并发送指示信号。
在其中一个实施例中,所述进行采样和量化处理为:将采集的连续的声信号转换为离散的时间和幅度信号,得到声信号的时域特征。
在其中一个实施例中,所述将时域特征转换成频域特征的表达式如下:
在其中一个实施例中,所述识别模块包括:
第一筛选单元,用于根据频域特征,通过频谱能量比率取阈值过滤高频噪声信号,筛选得到低频声信号;
第二筛选单元,用于根据低频声信号和飞机特征频段的统计特征,过滤与飞机噪声特征存在差异的环境噪声;
第三筛选单元,用于根据第二筛选单元的过滤结果,筛选得到频谱能量集中特征稳定的声信号,从而得到飞机声信号,并发送指示信号。
在其中一个实施例中,所述频谱能量比率的表达式如下:
在其中一个实施例中,所述筛选得到低频声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:BERt,(0,1000),(0,3000) >70%且MAXXt(k)>70dB,其中,BERt,(0,1000),(0,3000)表示第t帧声信号频谱特征0-1000hz占0-3000hz频谱能量比,MAXXt(k)表示第t帧声信号频谱幅值最大值。
在其中一个实施例中,所述过滤与飞机噪声特征存在差异的环境噪声的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MEANXt(100,230)>50dB、BERt,(100,230),(0,1000) >30% 和30%>BERt,(400,600),(0,1000) >5% 其中,MEANXt(100,230) 表示100-230hz频段的声信号频谱幅值均值,BERt,(100,230),(0,1000)表示第t帧声信号100-230hz占0-1000hz频谱能量比,BERt,(400,600),(0,1000)表示第t帧声信号400-600hz占0-1000hz频谱能量比。
在其中一个实施例中,所述筛选得到频谱能量集中特征稳定的声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MAXXt(0,1000)>100dB 且STD_TS_MAXINDEX ∈[0,3] 且MEAN_TS_MAXINDEX∈[6,9],其中,MAXXt(0,1000) 表示第t帧声信号0-1000hz频段频谱幅值最大值,STD_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动标准差,MEAN_TS_MAXINDEX表示MAXXt(0,1000) 所对应的频率索引波动均值。
如图5所示实施例提供的飞机声纹识别系统可以执行上述方法实施例飞机声纹识方法所示的技术方案,其实现原理与有益效果类似,此处不再赘述。
本实施例中,本申请可以根据飞机声纹识别方法进行功能单元的划分,例如可以将各个功能划分为各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成单元即可以采用硬件的形式来实现,也可以采用软件功能单元的形式来实现。需要说明的是,本发明中对单元的划分是示意性的,仅仅为一种逻辑划分,实际实现时可以有另外的划分方式。
本实施例中,飞机声纹识别系统为了飞机声纹识别方法的原理与有益效果,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本发明所公开的实施例描述的各示意单元及算法步骤,本发明能够以硬件和/或硬件和计算机软件结合的形式来实现,某个功能以硬件还是计算机软件驱动的方式来执行,取决于技术方案的特定应用和设计约束条件,可以对每个特定的应用来使用不同的方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本实施例中,本发明提供的飞机声纹识别系统,可在室外环境下有效识别1-3km距离的飞机声信号,该系统基于嵌入式声处理平台,包括:采集模块(麦克风/声传感器)实时对环境声信号进行采集;第一处理模块对数据进行采样、量化,获取声信号的时域数据;第二处理模块,利用FFT将时域特征转换成频域特征:识别模块,通过计算频谱能量比率、频谱能量集中度在时间序列上的稳定性特征进行判断,当识别到飞机声信号时,指示模块发送指示信号。本发明依托于嵌入式声处理平台和时间序列频谱特征,建立了一种飞机声纹识别系统,相比基于机器学习的识别系统降低了运算负荷与模型训练成本,减少了对样本质量和数量的需求,简单高效,为解决现有技术存在的需要在室外无人环境下快速识别飞机信号的困难提供了技术支撑。
实施例3
第三方面,本发明提供了一种电子设备包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现任一所述的飞机声纹识别方法的步骤。
本实施例中,电子设备可以包括:处理器,存储器,总线和通信接口,处理器、通信接口和存储器通过总线连接,存储器中存储有可在处理器上运行的计算机程序,处理器运行该计算机程序时执行本申请前述实施例1所提供的飞机声纹识别方法的部分或全部步骤。
实施例4
第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,执行所述计算机程序时实现任一项所述的飞机声纹识别方法的步骤。
上述计算机可读存储介质可以中由任何类型的易失性或非易失性存储设备或他们的组合实现,如静态随机存取存储器(SRAM),可擦除可维和只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘,可读存储介质可以是通用或专用计算机能够存取的任何可用介质。可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息,可读存储介质也可以是处理器组成部分,处理器和可读存储介质可以位于专用集成电路(ASIC)中,处理器和可读存储介质也可以作为分立组件存在于飞机声纹识别系统中。
本发明实施例可提供为方法、装置、或计算机程序产品,因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且本发明可采用一个或多个其中包括有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程和/或方框图来描述的,应理解可由计算机程序指令实现流程图和/或方框图中每一流程和/或方框图、以及流程图和/或方框图的结合,可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图中一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
实施例5
基于上述实施例阐述,下面对本发明的具体实施方式做进一步说明,使本发明的技术路线更加清晰。采集距机场跑道1-3km处的飞机起降、跑道滑行音频以及其他设备、环境噪声音频用于试验。其中飞机噪声因距离衰减传播至嵌入式平台的分贝大于70dB,最终采集、收集了飞机以及应用场景中常见的人为、自然、机械等其他三种环境噪声音频共71个,总时长大于18分钟。嵌入式平台以PyAI-K210开发板为例,实施步骤如下:
步骤1、在试验环境中模拟播放不同距离、方位的试验噪声集,确保到达开发板的飞机声信号分贝大于70dB,将PyAI-K210放置在试验环境中利用麦克风模块实时采集声信号,采样频率为6000,采样点数为512,每秒大约处理12帧数据。
步骤2、利用PyAI-K210的模数转换模块对所采集的声音进行采样、量化处理以获取声信号的时域数据:采样和量化将连续的声信号变成时间和幅度都离散的数字信号。
步骤3、PyAI-K210的核心处理模块内嵌了飞机声纹识别方法,首先通过傅里叶变换(FFT)将信号从时域转为频域特征,其变换公式为:
其中,表示x[n]变换后的复数频谱,N表示声信号的长度,n表示第n长度的声信号,且n属于[0,N-1],i表示虚数单位,x[n]表示长度为N的声信号,exp()表示指数函数,k表示频谱特征个数,实数信号x在经过离散傅里叶变换之后,得到的为复数频谱,对频谱取幅值,便得到N个频谱幅值特征;
其中,BERt,i,j表示频谱能量比率,Si和Sj分别表示第t帧声信号频谱的频段i和频段j的傅里叶变换系数,表示第t帧声信号的傅里叶变换,k表示频谱特征个数。飞机声信号属于低频信号,能量集中在0-1000hz频段内,同时为消除瞬时噪声的影响,引入占空比进行特征稳定性判断,占空比指在一段时间序列窗口内,满足条件的数据帧占总数据帧的比例。因此低频筛选的条件设置为,1秒的时间序列窗口内占空比大于等于80%,每帧数据需满足:0-1000hz频谱能量占总能量比率大于70%(见附图2),频谱最大值大于70dB,即:
BERt,(0,1000),(0,3000) >70%且MAXXt(k)>70dB
步骤5、根据低频声信号和飞机特征频段的统计特征,过滤与飞机噪声特征差异较大的环境噪声,可筛选到飞机、强台风、挖掘机等低频噪声(见附图2),第二层判断条件是基于飞机声信号特征频段进行筛选,飞机声信号能量主要集中在100-230hz,其次是400-600hz(见附图2)。设置判断条件为,1秒的时间序列窗口内占空比大于等于80%,每帧数据需满足:100-230hz 频谱幅值均值大于50dB,100-230hz频谱能量占0-1000hz频段比率大于30%,400-600hz频谱能量占0-1000hz频段比率小于等于30%、大于等于5%(见附图3),即:
MEANXt(100,230)>50dB 且 BERt,(100,230),(0,1000) >30%且BERt,(400,600),(0,1000) >5%
步骤6、第三层判断是基于飞机声信号的频谱能量集中特征,飞机低频(即0-1000hz)频谱幅值最大值所对应的频率索引在一秒时间序列窗口内的均值和方差波动稳定在一定区间内,其本质为低频频谱幅值最大值所对应的频率稳定在100-230hz间。设置判断条件为:1秒的时间序列窗口内占空比大于等于80%,每帧数据需满足:低频频谱幅值最大值大于100dB,最大值所对应的频率索引波动标准差STD_TS_MAXINDEX属于[0,3]区间,均值MEAN_TS_MAXINDEX属于[6,9]区间(见附图4),即:
MAXXt(0,1000)>100dB 且 STD_TS_MAXINDEX ∈[0,3] 且MEAN_TS_MAXINDEX∈[6,9]
步骤7、当声音信号均通过三层判断条件时,即识别飞机声信号,PyAI-K210发送指示信号,指示灯亮起。
最终,在71个试验噪声集中,该算法的识别率为92.3%,误触发率为1.7%,能够有效的探测到飞机声纹。
本领域的技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (16)
1.一种飞机声纹识别方法,其特征在于,包括以下步骤:
S1、实时采集环境中的声信号;
S2、对所采集的声信号进行采样和量化处理,得到声信号的时域特征;
S3、利用FFT将时域特征转换成频域特征;
S4、对频域特征进行三层识别,得到飞机声信号,并发送指示信号;
所述步骤S4包括以下步骤:
S401、根据频域特征,通过频谱能量比率取阈值过滤高频噪声信号,筛选得到低频声信号;
S402、根据低频声信号和飞机特征频段的统计特征,过滤与飞机噪声特征存在差异的环境噪声;
S403、根据步骤S402的过滤结果,筛选得到频谱能量集中特征稳定的声信号,从而得到飞机声信号,并发送指示信号。
2.根据权利要求1所述的飞机声纹识别方法,其特征在于,所述进行采样和量化处理为:将采集的连续的声信号转换为离散的时间和幅度信号,得到声信号的时域特征。
5.根据权利要求1所述的飞机声纹识别方法,其特征在于,所述筛选得到低频声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:BERt,(0,1000),(0,3000)>70%且MAXXt(k)>70dB,其中,BERt,(0,1000),(0,3000)表示第t帧声信号频谱特征0-1000hz占0-3000hz频谱能量比,MAXXt(k)表示第t帧声信号频谱幅值最大值。
6.根据权利要求1所述的飞机声纹识别方法,其特征在于,所述过滤与飞机噪声特征存在差异的环境噪声的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MEANXt(100,230)>50dB、BERt,(100,230),(0,1000)>30% 和30%>BERt,(400,600),(0,1000)>5% 其中,MEANXt(100,230)表示100-230hz频段的声信号频谱幅值均值,BERt,(100,230),(0,1000)表示第t帧声信号100-230hz占0-1000hz频谱能量比,BERt,(400,600),(0,1000)表示第t帧声信号400-600hz占0-1000hz频谱能量比。
7.根据权利要求1所述的飞机声纹识别方法,其特征在于,所述筛选得到频谱能量集中特征稳定的声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MAXXt(0,1000)>100dB 且STD_TS_MAXINDEX∈[0,3] 且 MEAN_TS_MAXINDEX∈[6,9],其中,MAXXt(0,1000)表示第t帧声信号0-1000hz频段频谱幅值最大值,STD_TS_MAXINDEX表示MAXXt(0,1000)所对应的频率索引波动标准差,MEAN_TS_MAXINDEX表示MAXXt(0,1000)所对应的频率索引波动均值。
8.一种飞机声纹识别系统,其特征在于,所述飞机声纹识别系统位于嵌入式平台中,包括:
采集模块,用于实时采集环境中的声信号;
第一处理模块,用于对所采集的声信号进行采样和量化处理,得到声信号的时域特征;
第二处理模块,用于利用FFT将时域特征转换成频域特征;
识别模块,用于对频域特征进行三层识别,得到飞机声信号,并发送指示信号,所述识别模块包括:
第一筛选单元,用于根据频域特征,通过频谱能量比率取阈值过滤高频噪声信号,筛选得到低频声信号;
第二筛选单元,用于根据低频声信号和飞机特征频段的统计特征,过滤与飞机噪声特征存在差异的环境噪声;
第三筛选单元,用于根据第二筛选单元的过滤结果,筛选得到频谱能量集中特征稳定的声信号,从而得到飞机声信号,并发送指示信号。
9.根据权利要求8所述的飞机声纹识别系统,其特征在于,所述进行采样和量化处理为:将采集的连续的声信号转换为离散的时间和幅度信号,得到声信号的时域特征。
12.根据权利要求8所述的飞机声纹识别系统,其特征在于,所述筛选得到低频声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:BERt,(0,1000),(0,3000)>70%且MAXXt(k)>70dB,其中,BERt,(0,1000),(0,3000)表示第t帧声信号频谱特征0-1000hz占0-3000hz频谱能量比,MAXXt(k)表示第t帧声信号频谱幅值最大值。
13.根据权利要求8所述的飞机声纹识别系统,其特征在于,所述过滤与飞机噪声特征存在差异的环境噪声的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MEANXt(100,230)>50dB、BERt,(100,230),(0,1000)>30% 和30%>BERt,(400,600),(0,1000)>5% 其中,MEANXt(100,230)表示100-230hz频段的声信号频谱幅值均值,BERt,(100,230),(0,1000)表示第t帧声信号100-230hz占0-1000hz频谱能量比,BERt,(400,600),(0,1000)表示第t帧声信号400-600hz占0-1000hz频谱能量比。
14.根据权利要求8所述的飞机声纹识别系统,其特征在于,所述筛选得到频谱能量集中特征稳定的声信号的条件为:在1秒的时间序列窗口内占空比大于等于80%,且每帧数据满足:MAXXt(0,1000)>100dB 且STD_TS_MAXINDEX∈[0,3] 且 MEAN_TS_MAXINDEX∈[6,9],其中,MAXXt(0,1000)表示第t帧声信号0-1000hz频段频谱幅值最大值,STD_TS_MAXINDEX表示MAXXt(0,1000)所对应的频率索引波动标准差,MEAN_TS_MAXINDEX表示MAXXt(0,1000)所对应的频率索引波动均值。
15.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-7中任一所述的飞机声纹识别方法的步骤。
16.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,执行所述计算机程序时实现如权利要求1-7任一项所述的飞机声纹识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210644525.3A CN114743562B (zh) | 2022-06-09 | 2022-06-09 | 一种飞机声纹识别方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210644525.3A CN114743562B (zh) | 2022-06-09 | 2022-06-09 | 一种飞机声纹识别方法、系统、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114743562A CN114743562A (zh) | 2022-07-12 |
CN114743562B true CN114743562B (zh) | 2022-11-01 |
Family
ID=82288140
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210644525.3A Active CN114743562B (zh) | 2022-06-09 | 2022-06-09 | 一种飞机声纹识别方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114743562B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116229987B (zh) * | 2022-12-13 | 2023-11-21 | 广东保伦电子股份有限公司 | 一种校园语音识别的方法、装置及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106772227A (zh) * | 2017-01-12 | 2017-05-31 | 浙江大学 | 一种基于声纹多谐波识别的无人机方向估计方法 |
WO2018138725A1 (en) * | 2017-01-24 | 2018-08-02 | Arbe Robotics Ltd | Method for separating targets and clutter from noise, in radar signals |
CN113674763A (zh) * | 2021-08-19 | 2021-11-19 | 世邦通信股份有限公司 | 利用线谱特性的鸣笛声识别方法及系统、设备与存储介质 |
CN114550747A (zh) * | 2022-01-11 | 2022-05-27 | 西安理工大学 | 基于无线紫外光组网的无人机声识别管控方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2786308B1 (fr) * | 1998-11-20 | 2001-02-09 | Sextant Avionique | Procede de reconnaissance vocale dans un signal acoustique bruite et systeme mettant en oeuvre ce procede |
JP4003566B2 (ja) * | 2002-07-19 | 2007-11-07 | 株式会社豊田中央研究所 | 音声認識装置 |
CN107172534B (zh) * | 2017-06-20 | 2019-07-09 | 北京航空航天大学 | 构建多排人工模拟旋转声源发生器的方法 |
CN107993648A (zh) * | 2017-11-27 | 2018-05-04 | 北京邮电大学 | 一种无人机识别方法、装置及电子设备 |
CN111341347B (zh) * | 2020-03-11 | 2023-07-18 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种噪声检测方法及相关设备 |
CN111667831B (zh) * | 2020-06-08 | 2022-04-26 | 中国民航大学 | 基于管制员指令语义识别的飞机地面引导系统及方法 |
CN113640768B (zh) * | 2021-08-13 | 2023-09-19 | 北京理工大学 | 一种基于小波变换的低分辨雷达目标识别方法 |
-
2022
- 2022-06-09 CN CN202210644525.3A patent/CN114743562B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106772227A (zh) * | 2017-01-12 | 2017-05-31 | 浙江大学 | 一种基于声纹多谐波识别的无人机方向估计方法 |
WO2018138725A1 (en) * | 2017-01-24 | 2018-08-02 | Arbe Robotics Ltd | Method for separating targets and clutter from noise, in radar signals |
CN113674763A (zh) * | 2021-08-19 | 2021-11-19 | 世邦通信股份有限公司 | 利用线谱特性的鸣笛声识别方法及系统、设备与存储介质 |
CN114550747A (zh) * | 2022-01-11 | 2022-05-27 | 西安理工大学 | 基于无线紫外光组网的无人机声识别管控方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114743562A (zh) | 2022-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106653032B (zh) | 低信噪比环境下基于多频带能量分布的动物声音检测方法 | |
CN109616140B (zh) | 一种异常声音分析系统 | |
CN109087655A (zh) | 一种交通道路声音监测与异常声音识别系统 | |
CN112735473B (zh) | 基于声音识别无人机的方法及系统 | |
CN109949823A (zh) | 一种基于dwpt-mfcc与gmm的车内异响识别方法 | |
CN104916289A (zh) | 行车噪声环境下快速声学事件的检测方法 | |
CN114743562B (zh) | 一种飞机声纹识别方法、系统、电子设备及存储介质 | |
CN106548786A (zh) | 一种音频数据的检测方法及系统 | |
CN113763986B (zh) | 一种基于声音分类模型的空调内机异常声音检测方法 | |
Mallidi et al. | Novel neural network based fusion for multistream ASR | |
CN103514877A (zh) | 振动信号特征参数提取方法 | |
Kiktova et al. | Comparison of different feature types for acoustic event detection system | |
KR20190087363A (ko) | 실질 잡음 환경에서 mfcc 기법을 이용한 hmm 기반 무인 항공기 음향 인식 방법 및 시스템 | |
CN108922514A (zh) | 一种基于低频对数谱的鲁棒特征提取方法 | |
CN111816205A (zh) | 一种基于飞机音频的机型智能识别方法 | |
Vacher et al. | Sound detection and classification through transient models usingwavelet coefficient trees | |
Xie et al. | Detection of anuran calling activity in long field recordings for bio-acoustic monitoring | |
CN111755025B (zh) | 一种基于音频特征的状态检测方法、装置及设备 | |
Xie et al. | Acoustic feature extraction using perceptual wavelet packet decomposition for frog call classification | |
CN116364108A (zh) | 变压器声纹检测方法及装置、电子设备、存储介质 | |
CN110808067A (zh) | 基于二值多频带能量分布的低信噪比声音事件检测方法 | |
Dadula et al. | Neural network classification for detecting abnormal events in a public transport vehicle | |
CN112908344B (zh) | 一种鸟鸣声智能识别方法、装置、设备和介质 | |
CN114093385A (zh) | 一种无人机检测方法及装置 | |
KR20190019726A (ko) | 실질 잡음 환경에서 mfcc 기법을 이용한 hmm 기반 무인 항공기 음향 인식 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |