CN107393555A - 一种低信噪比异常声音信号的检测系统及检测方法 - Google Patents
一种低信噪比异常声音信号的检测系统及检测方法 Download PDFInfo
- Publication number
- CN107393555A CN107393555A CN201710577135.8A CN201710577135A CN107393555A CN 107393555 A CN107393555 A CN 107393555A CN 201710577135 A CN201710577135 A CN 201710577135A CN 107393555 A CN107393555 A CN 107393555A
- Authority
- CN
- China
- Prior art keywords
- signal
- detection
- feature
- abnormal sound
- noise ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 102
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 38
- 230000005236 sound signal Effects 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000001914 filtration Methods 0.000 claims abstract description 9
- 238000004891 communication Methods 0.000 claims abstract description 4
- 238000012360 testing method Methods 0.000 claims description 21
- 238000000354 decomposition reaction Methods 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 10
- 239000012634 fragment Substances 0.000 claims description 8
- 238000012790 confirmation Methods 0.000 claims description 7
- 238000009432 framing Methods 0.000 claims description 6
- 238000007689 inspection Methods 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000013461 design Methods 0.000 abstract description 3
- 238000011897 real-time detection Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 239000002360 explosive Substances 0.000 description 2
- 238000013100 final test Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 206010039740 Screaming Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
- G10L19/0216—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation using wavelet decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种低信噪比异常声音信号的检测系统及检测方法,检测方法选取声音的时频域能量特征,对待检测信号分帧处理后计算相对于目标信号的能量增值,对多帧结果融合后进行中值滤波,引入软阈值处理方式来进行预警判断;检测系统主要包括检测单元和上位机软件,利用异常声音特征库可以实现多种目标的选择性检测,依靠互联网通信,可以实现与背景无关联的实时性检测和预警。该系统设计可以有效地在低信噪比环境下对异常目标声音进行检测并给出及时的预警判断,可以满足实际应用的实时性要求。
Description
技术领域
本发明涉及计算机音频处理领域,具体涉及一种低信噪比异常声音信号的检测系统及检测方法。
背景技术
声音信号是人类最熟悉的承载信息的信号之一,随着信息技术和多媒体技术的发展,开展机器对声音的感知和理解研究越来越受到重视。目前,计算机对音频的检测和识别技术在工业控制、医疗护理、军事国防等各个领域都有着广泛的应用。特别是异常声音信号往往预示着异常事件发生,如:尖叫声、爆炸声等,而声音检测手段有着不易受环境因素影响、特征稳定等其他检测手段无法比拟的优势。因此,声音信号检测已经成为了公共安全监控智能化发展的一个重要组成部分,近年来引起了学者们的广泛研究。
目前,对声音信号的研究主要分为语音和非语音。非语音信号能够更多地传达声源特性和环境特征,对计算机更深刻地认识环境有着重要的作用,而异常声音的检测就属于非语音信号的研究范畴,即通过对一段连续的声音信号进行特征提取、分析,从而检测出是否含有异常声音信号。现阶段对非语音信号的检测研究主体可以分为两个方面:基于特征的检测方法和基于模型的检测方法。基于特征的检测方法依据特征提取所基于的时间单元长度可以分为短时特征和长时特征,如;爆炸声和无人机入侵的声音特征就分属短时特征和长时特征。不同的异常声音其声学特征存在很大的差异,现在常用的一些时域特征有短时能量、过零率、振幅等,但是由于计算过程简单,仅仅适用于单一环境等问题使得时域特征一般不单独使用;频域特征有频谱分布、基频、梅尔倒谱系数、线性预测倒谱系数等,这些频域特征在实际检测中表现出很好的鲁棒性;在声音检测中,还有一类时频域特征能够综合时域和频域特性,典型的如短时傅里叶变换、小波变换等,小波变换能够对信号的时域和频域同时做局部变换,从而有效地从信号中提取时-频信息,而且其正交性和多尺度分析的特性也非常适合于处理非平稳信号,现已经广泛应用于声音信号处理领域。这类方法都是从不同的分析角度寻找声音信号中的特征信息从而通过特征比较实现对不同声音信号的区分。例如:A.Averbuch等利用小波包系数块之间的能量分布来检测噪声环境下的车辆是否到达。基于模型的检测方法大多是从机器学习中已成熟的模型提出的,这类方法都需要比较准确且大量的训练数据,常用的有基于隐马尔科夫模型的方法、基于支持向量机的识别方法和基于高斯混合模型的方法等。例如:Clavel等利用高斯混合模型来检测识别噪声环境中的枪声;S.Ntalampiras等针对地铁环境中的尖叫、爆炸、枪击等异常声音,使用隐马尔科夫模型(HMM)来检测异常声音在不同信噪比下的情况。
研究者们对声音检测技术的研究已经提出了许多特征选择和分析的方法,但目前对声音检测的应用案例大多是在小规模简单环境中进行,如会议室、家庭等,待检测目标声音信噪比较高;基于模型的检测方法,其需要大量的样本数据训练模型,计算复杂度高;并且大部分的研究方法都采用的是声音信号的短时特征,然而对于一些持续时间长的声音信号,长时信息对检测更为有利。当实际需要在非平稳的背景环境下,对信噪比很低的异常声音进行实时检测时,现有声音信号检测方法都很难达到预期效果。
发明内容
本发明的目的在于克服上述不足,提供一种低信噪比异常声音信号的检测系统及检测方法,实现在低信噪比环境和复杂信号背景下对异常声音信号进行实时性检测。
为了达到上述目的,一种低信噪比异常声音信号的检测系统,包括置于待测环境中的检测单元,检测单元连接异常声音特征库,检测单元和异常声音特征库均连接上位机控制模块;
所述检测单元用于接收上位机控制指令后执行相应功能,运行检测算法,对待检测环境声音进行采集、检测并上传结果;
所述异常声音特征库用于储存多种待检测的目标声音的声学特征模板,为检测过程提供比较数据;
所述上位机控制模块用于对检测单元的通信控制;对检测结果进行分析、显示和预警,并且对检测单元上的检测程序进行远程维护和更新。
所述检测单元包括声音传感器、放大器、数据采集卡和嵌入式处理器。
所述检测单元通过互联网与上位机控制模块进行通信。
一种低信噪比异常声音信号的检测系统的检测方法,包括以下步骤:
步骤一,提取声音信号在时频域的能量特征,并依据实际环境因素对其进行修正;
步骤二,对待检测信号进行分帧化处理;
步骤三,对分帧后的待检测信号做小波包变换,将小波包系数矩阵按每帧中的分段来计算子带能量,从而得到每帧数据的特征矩阵;
步骤四,通过待检测信号特征矩阵依次求取每段信号相比目标信号的能量增值,组合得到此帧信号的能量增值向量;
步骤五,采用取平均的方式对多帧数据的能量增值向量做融合,得到最终的检测结果序列{di};
步骤六,依据设置的平稳时长对此阶段的检测结果序列{di}进行中值滤波,以中值滤波结果的最大值来修正预定阈值;
步骤七,对检测结果序列{di}进行中值滤波,产生稍滞后的确认序列{qi},确认序列{qi}滞后的时间等于滤波窗口长度的一半;
步骤八,依据确认序列{qi}和修正后的阈值来计算产生预警结果序列{ai}。
所述步骤一中,首先利用小波包分解的方式提取目标声音信号的声学特征,用向量t表示;其次,根据声音在空气中的传播衰减特性对目标特征t进行修正,得到然后,利用带通滤波器滤除超低频和超高频部分的干扰噪声,即将中该部分频率所对应的特征值置为0,得到最后,重新对特征向量归一化,得到目标信号的声学特征ts。
所述步骤二中,检测窗口帧长度为test_win_n,每帧分为ts_n片段,每段长度为segment_n。
所述步骤三中,待检测帧数据做小波包分解,得到小波包系数矩阵Srow×col;然后,将系数矩阵Srow×col按段计算子带能量特征,得到每帧数据的特征矩阵
所述步骤四中,计算待检测信号特征相对于目标信号特征ts的能量增值Ets_n。
与现有技术相比,本发明通过三个模块组成一个完整的检测系统,检测单元可以根据需要在实际检测现场进行网络化布设,使用上位机软件进行联网集中设置;异常声音特征库可以提供多种目标声音的特征模板,针对不同目标可以实现不同的应用目的,从而提高了检测系统的通用性。
本发明的方法可以实现在低信噪比背景环境下对异常声音信号的检测,对检测结果进行了软阈值处理,根据检测结果序列就可以判断待检测声音信号中是否有目标声音发生以及确定目标声音的发生时间。并且依据检测结果给出一个稍滞后的预警序列,从而可以满足在实际应用中对实时性的要求。
附图说明
图1是本发明的功能原理图;
图2是小波包分解示意图;
图3是信号分帧化处理示意图;
图4是声音A和声音B的混合信号A+B,其子带分量特征分布示意图;
图5是检测帧窗口滑动示意图;
图6是本检测系统的框架示意图;
图7是上位机软件界面示意图;
图8是不同信噪比下的检测预警示意图;其中a为-10dB、b为-15dB、c为-20dB、d为-25dB。
具体实施方式
下面结合附图对本发明做进一步说明。
参见图1,本发明的检测方法部分通过如下方法实现:
(1)目标信号声学特征提取。声音信号是一种模拟信号,从信号本身很难发现有用特征,所以该步骤目的是为了提取声音信号在时频域的能量特征,并依据实际环境因素对其进行修正,供后续检测过程比对使用。已知一段待检测目标声音的样本信号,是本方法后续检测实现的基础。
实际检测中遇到的声音信号大多都是非平稳的,特别是对具有长时特征的声音使用信号在不同频率范围内的能量特征可以更加精细地刻画声音。因此本方法通过小波包分解的方式将原始信号分解到不同频段上,并将每个频段上的小波包系数取平方和作为该频段上的能量表示,小波包分解示意见图2。
首先,选择小波包分解层数为N,对原始声音信号进行N层小波包分解可以得到分解后的系数矩阵为coefrow×col,其中,row=2N为小波包分解后的频段数,col为每个频段内的数据个数;依据公式1对小波包系数矩阵按行取平方和得到子带能量的特征向量t。
其中,ti,i∈[1,row]表示子带i的子带能量,coefi,j表示目标信号分解后的小波包系数。
声音在空气中传播时会发生能量衰减,主要是由于大气吸收产生。衰减规律见公式2,
pt=p0·exp(-0.1151·α·s) (公式2)
其中,p0代表原始能量,pt代表衰减后的能量,α为衰减系数,s为声音传播的距离。
衰减系数α可以依据ISO9613-1的户外声传播衰减标准进行计算,其值与频率的平方成正比,而特征向量t的不同元素恰好代表了不同频段上的能量值,所以对不同的元素根据其所对应的频率可以计算得到不同的衰减系数αi,组成目标声音的特征向量t的衰减向量经过大量实验得到传播距离s=100m时修正效果最好。因此,对信号的子带能量特征t进行归一化后按照公式2进行修正,得到修正后的特征向量
然后,利用带通滤波器滤除超低频和超高频部分的干扰噪声。经过大量实验发现,不同的声音信号都存在一个或几个主要特征集中的特定频段,在实际异常声音的检测中,这些频段对检测结果起了决定性的作用,而超低频和超高频部分往往会带来许多干扰噪声。因此本方法设计了一个低频截止频率为Cut_offlow,高频截止频率为Cut_offhigh的带通滤波器,对特征向量进行修正,即通过频率换算将截止频率所对应的特征值置为0,得到
最后,重新对修正过后的特征向量进行归一化,得到目标信号的声学特征ts。
(2)待检测信号预处理。实际环境的声音信号往往是一种非平稳的时序信号,而本方法面向的异常声音信号可能在时间上持续时间较短也可能较长,为了在实时处理时尽可能多的获取声音信息,需要依次对一小段时间内的信号进行特征分析,这样的操作称为分帧化处理,参见图3。
经过大量的实验,本方法以长度为test_win_n=10s的检测窗口将待处理信号分帧,在检测窗口内部,又将数据分为ts_n=10片段,每个片段长度为segment_n=1s,依次偏移shift_n=1s;随着检测的不断进行,帧窗口依次向后滑动1s,通过这样的方式将原始检测数据划分为若干帧。
(3)待检测帧信号特征提取。对分帧后的待检测信号做小波包变换,计算方法与上文所述的目标信号特征提取类似,所不同的是需要将小波包系数矩阵按每帧中的分段来计算子带能量,从而得到每帧数据的特征矩阵。
首先,对待检测帧数据进行N层小波包分解可以得到分解后的系数矩阵为Srow×col,其中row=2N为小波包分解后的频段数,col为每个频段内的数据个数;
然后,计算该帧数据内的每个片段经过N层小波包分解后应该包含的数据个数:对片段i计算相应的cps个小波包系数平方和为:
由此组成了每帧数据的特征矩阵:
其中,si,j表示待检测信号分解后的小波包系数。
(4)基于能量增值的检测方式。使用前面得到的待检测信号特征矩阵使用本方法依次求取每段信号相比目标信号的能量增值,组合得到此帧信号的能量增值向量。
待检测信号的特征矩阵表示了该帧信号的所有片段所对应的能量特征,本方法采用的是一种基于能量增值的检测方法。其思想是:虽然从时域上看待检测信号中目标的信噪比很低,但是将待检测信号分解到时频域后,可能存在关键子带上,背景能量是相对“缺失”的,即目标呈现高信噪比。
在背景噪声干扰下进行的目标声音信号检测问题可以描述如下:设A表示纯目标声音信号,其功率谱为a;B表示纯背景噪声,其功率谱为b;A+B表示两种信号的混合,即背景声中混有目标声,其功率谱为c。按照声音的叠加原理,A+B的子带分量ci可以表示为:其中表示两个分量对应的声压之间的相位差。对于一段时间Tc上的特征,由中心极值定理可以得到其中心频率为fi的子带上特征ci的分布,近似等于以ai+bi为期望值,标准差为的正态分布,如图4所示。
对关键子带i,如果我们希望以κσi对应的概率保证ci>bi+αai,即要求可得:意味着对于子带i要求其信噪比大于某个下界值,其中α∈(0,1)为设定阈值。
在实际检测中往往不知道最大信噪比的关键子带的编号,此时考察在满足前提下,可以得到以κσ对应概率的Nf次幂(Nf为子带数)的概率满足而上述前提在实际检测中非常容易满足。因此,本方法直接计算待检测帧数据的每段能量特征与目标信号的能量特征t比值,选择能量增值最小的子带增值作为本段数据的算法结果,由此组成了此帧数据的能量增值向量:
其中,表示待检测信号特征矩阵的(k,i)元素,ts i表示目标信号特征向量的第i个元素。
(5)多帧数据融合。由于本方法对待检测信号进行分帧检测,所以采用取平均的方式对多帧数据的能量增值向量做融合,得到最终的检测结果序列。
如图5所示,本方法采用的分帧化处理会使得每一帧中有(test_win_n-1)s的数据重叠,即相邻两帧的能量增值向量中有(ts_n-1)个元素表示的是相同片段。因此在检测过程中,对当前已有的能量增值序列中的重叠片段所对应的向量元素取平均值,作为该片段的检测结果,最终形成了检测结果序列{di}。
(6)软阈值计算。为了使本方法在不同背景环境下都有准确的预警结果,所以需要设置一段平稳时间,来对环境声音进行估计,以此来修正预定的阈值,从而实现与背景无关联的检测。
因为不同的背景环境其声音能量特征是不同的,为了能够在不同环境下有准确的检测判断,本方法在检测初期会设置一段平稳时间Steady_T=50s,在这段时间内不引入目标声音,只对纯背景声音进行测量,计算得到检测结果序列以大小为13的窗口对其进行滑动中值滤波,然后取滤波结果的最大值作为对背景声音的能量估计,以此来修正预设的阈值α。定义阈值偏差后续的检测结果均需要减去αoffest。
(7)中值滤波。为了减弱检测结果的随机性,对检测结果序列进行中值滤波处理,从而得到可靠性更高的确认序列,以此为预警判断提供更有效的数据。
本方法在检测时对声音信号做了分帧化处理,且每帧之间有交叠,所以其能量特征不会在短时间内发生突变,并且特定环境下的背景声音也是不会发生突变的,为了进一步减弱结果的随机性,本方法对检测结果序列{di}进行了滑动中值滤波处理,滤波窗口大小为13,产生一组稍滞后的、可靠性更高的确认序列,以供预警判断使用。
(8)结果预警。其目的是对检测结果做出更加直观的预警解释,依据检测结果序列和修正后的阈值,对某一时刻是否检测出目标声音做出不同等级的预警。
当确认序列的结果大于设定阈值时,本方法使用确认序列减去设定阈值,将其差值分为5种不同的等级来预示此时刻出现目标声音的概率,等级越高,出现目标声音的可能性越大。
本发明的检测系统部分通过如下方案实现:
本检测系统的主要分为两个模块:检测单元和上位机控制软件。为了实现友好的人机交互,本系统尽可能地考虑到实际使用中的各种需求对各个主要模块的功能如下。系统框架如图6所示。
(1)检测单元。检测单元是一个最小检测功能实现单元,其包括声音传感器、放大器、数据采集卡和嵌入式处理器。可以根据实际需要在检测现场进行网络化布设,统一通过互联网与控制中心的上位机软件进行通信。其主要负责声音采集,算法检测和结果上传等任务。
本发明在检测单元上实现了一个管理系统,主要承担与上位机通信以及控制检测流程。为了保证音频采集和算法检测同时进行,管理系统采用了多线程技术。其各部分功能实现技术说明如下:
①管理系统与上位机通信采用TCP/IP协议通过Socket网络通信实现;
②将管理系统为主进程,实时接收上位机指令并进行指令解析,然后执行对应的功能;
③声音采集使用NI数据采集卡,为了在数据处理的同时保证采集的连续性,本系统设计了一个FIFO的循环队列存储多个数据缓冲区,当一个缓冲区数据采集完成时,该缓冲区出队列并自动将数据保存到队列中的下一个空缓冲区,与此同时触发指定事件,调用相应的回调函数对数据进行处理,处理完成后将该缓冲区清空并重新添加至循环队列中;
④检测算法在一个新线程中执行,通过设置全局标志量来实现线程间的同步;
⑤为了方便通过上位机进行算法更新,本方案中将检测算法部分的程序设计为一个动态链接库(dll),在新线程的运行中动态加载,实现了该部分程序与管理系统的分离,在更新时只需要通过上位机将该dll文件替换即可。
(2)异常声音特征库。为了实现对特定目标声音的检测,本方法必须提前获取该类声音的声学特征,本方案设计中将多种目标声音的特征存放在一个统一的特征库中,可以通过上位机对检测目标进行选择,从而拓展了系统的通用性。
(3)上位机控制软件。基于windows系统开发,控制检测单元,对检测结果分析、显示和预警,对检测单元的模板库和检测程序进行维护。上位机软件是一个使用MFC开发的程序,通过Socket与检测单元通信,软件界面如图7所示,其各部分功能说明如下:
①初始化部分:主要与检测单元建立通信连接和断开连接,是在检测最初和检测结束后需要进行的;
②设置部分:主要是为成功检测所进行的一系列功能性设置;制作模板,可以根据实际现场环境,制作新的目标特诊模板并对特征库进行更新;选项设置,预留的功能按钮;参数调节,根据实际检测环境,对算法检测过程中的主要参数进行调节;
③提示部分:使用过程中的信息提示框,主要用于反馈检测单元的信息,供使用者了解检测现场情况;
④检测部分:控制检测流程,主要是开始与停止功能;
⑤绘图区部分:根据确认序列产生预警示意图,供使用者判断,不同高度的预警块显示了不同的预警等级,预警块越高,说明此时出现目标声音的可能性越大。如图8所示,以四旋翼无人机声音作为异常目标声音,广场环境作为背景声音,每段背景声中包含四段无人机声音,其中图(a)~(d)分别为-10dB、-15dB、-20dB、-25dB信噪比下的检测结果示意图。
综上,根据上述检测方法和系统设计,将本发明的检测系统应用到低信噪比异常声音检测中可以实现对异常声音信号的有效检测。
Claims (8)
1.一种低信噪比异常声音信号的检测系统,其特征在于,包括置于待测环境中的检测单元,检测单元连接异常声音特征库,检测单元和异常声音特征库均连接上位机控制模块;
所述检测单元用于接收上位机控制指令后执行相应功能,运行检测算法,对待检测环境声音进行采集、检测并上传结果;
所述异常声音特征库用于储存多种待检测的目标声音的声学特征模板,为检测过程提供比较数据;
所述上位机控制模块用于对检测单元的通信控制;对检测结果进行分析、显示和预警,并且对检测单元上的检测程序进行远程维护和更新。
2.根据权利要求1所述的一种低信噪比异常声音信号的检测系统,其特征在于,所述检测单元包括声音传感器、放大器、数据采集卡和嵌入式处理器。
3.根据权利要求1所述的一种低信噪比异常声音信号的检测系统,其特征在于,所述检测单元通过互联网与上位机控制模块进行通信。
4.权利要求1所述的一种低信噪比异常声音信号的检测系统的检测方法,其特征在于,包括以下步骤:
步骤一,提取声音信号在时频域的能量特征,并依据实际环境因素对其进行修正;
步骤二,对待检测信号进行分帧化处理;
步骤三,对分帧后的待检测信号做小波包变换,将小波包系数矩阵按每帧中的分段来计算子带能量,从而得到每帧数据的特征矩阵;
步骤四,通过待检测信号特征矩阵依次求取每段信号相比目标信号的能量增值,组合得到此帧信号的能量增值向量;
步骤五,采用取平均的方式对多帧数据的能量增值向量做融合,得到最终的检测结果序列{di};
步骤六,依据设置的平稳时长对此阶段的检测结果序列{di}进行中值滤波,以中值滤波结果的最大值来修正预定阈值;
步骤七,对检测结果序列{di}进行中值滤波,产生稍滞后的确认序列{qi},确认序列{qi}滞后的时间等于滤波窗口长度的一半;
步骤八,依据确认序列{qi}和修正后的阈值来计算产生预警结果序列{ai}。
5.根据权利要求4所述的一种低信噪比异常声音信号的检测系统的检测方法,其特征在于,所述步骤一中,首先利用小波包分解的方式提取目标声音信号的声学特征,用向量t表示;其次,根据声音在空气中的传播衰减特性对目标特征t进行修正,得到然后,利用带通滤波器滤除超低频和超高频部分的干扰噪声,即将中该部分频率所对应的特征值置为0,得到最后,重新对特征向量归一化,得到目标信号的声学特征ts。
6.根据权利要求4所述的一种低信噪比异常声音信号的检测系统的检测方法,其特征在于,所述步骤二中,检测窗口帧长度为test_win_n,每帧分为ts_n片段,每段长度为segment_n。
7.根据权利要求4所述的一种低信噪比异常声音信号的检测系统的检测方法,其特征在于,所述步骤三中,待检测帧数据做小波包分解,得到小波包系数矩阵Srow×col;然后,将系数矩阵Srow×col按段计算子带能量特征,得到每帧数据的特征矩阵
8.根据权利要求4所述的一种低信噪比异常声音信号的检测系统的检测方法,其特征在于,所述步骤四中,计算待检测信号特征相对于目标信号特征ts的能量增值Ets_n。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710577135.8A CN107393555B (zh) | 2017-07-14 | 2017-07-14 | 一种低信噪比异常声音信号的检测系统及检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710577135.8A CN107393555B (zh) | 2017-07-14 | 2017-07-14 | 一种低信噪比异常声音信号的检测系统及检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107393555A true CN107393555A (zh) | 2017-11-24 |
CN107393555B CN107393555B (zh) | 2020-08-18 |
Family
ID=60339251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710577135.8A Expired - Fee Related CN107393555B (zh) | 2017-07-14 | 2017-07-14 | 一种低信噪比异常声音信号的检测系统及检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107393555B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108182950A (zh) * | 2017-12-28 | 2018-06-19 | 重庆大学 | 改进的经验小波变换的公共场所异常声音特征分解与提取方法 |
CN108470570A (zh) * | 2018-01-23 | 2018-08-31 | 浙江大学山东工业技术研究院 | 电机异音检测方法 |
CN108538310A (zh) * | 2018-03-28 | 2018-09-14 | 天津大学 | 一种基于长时信号功率谱变化的语音端点检测方法 |
CN109470352A (zh) * | 2018-10-19 | 2019-03-15 | 威海北洋光电信息技术股份公司 | 基于自适应阈值的分布式光纤管道安全监测算法 |
CN109741762A (zh) * | 2019-02-15 | 2019-05-10 | 杭州嘉楠耘智信息科技有限公司 | 声音活动检测方法及装置和计算机可读存储介质 |
CN110223684A (zh) * | 2019-05-16 | 2019-09-10 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
CN110411554A (zh) * | 2018-04-27 | 2019-11-05 | 华为技术有限公司 | 一种电机设备检测方法、装置及系统 |
CN110412547A (zh) * | 2019-07-24 | 2019-11-05 | 中国电子科技集团公司第三十六研究所 | 基于旋翼无人机载设备和地面设备的目标信号识别系统 |
CN110910897A (zh) * | 2019-12-05 | 2020-03-24 | 四川超影科技有限公司 | 一种用于电机异常声音识别的特征提取方法 |
CN114155879A (zh) * | 2021-12-06 | 2022-03-08 | 哈尔滨工程大学 | 一种利用时频融合补偿异常感知及稳定性的异音检测方法 |
CN115547312A (zh) * | 2022-11-30 | 2022-12-30 | 深圳时识科技有限公司 | 带活动检测的预处理器、芯片和电子设备 |
CN117891268A (zh) * | 2024-03-11 | 2024-04-16 | 成都凯天电子股份有限公司 | 自降噪的旋翼无人机声探测控制方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6094631A (en) * | 1998-07-09 | 2000-07-25 | Winbond Electronics Corp. | Method of signal compression |
CN102419972A (zh) * | 2011-11-28 | 2012-04-18 | 西安交通大学 | 一种声音信号检测和识别的方法 |
CN102522082A (zh) * | 2011-12-27 | 2012-06-27 | 重庆大学 | 一种公共场所异常声音的识别与定位方法 |
CN106453878A (zh) * | 2016-09-30 | 2017-02-22 | 努比亚技术有限公司 | 基于声音的提示方法及移动终端 |
CN106653032A (zh) * | 2016-11-23 | 2017-05-10 | 福州大学 | 低信噪比环境下基于多频带能量分布的动物声音检测方法 |
-
2017
- 2017-07-14 CN CN201710577135.8A patent/CN107393555B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6094631A (en) * | 1998-07-09 | 2000-07-25 | Winbond Electronics Corp. | Method of signal compression |
CN102419972A (zh) * | 2011-11-28 | 2012-04-18 | 西安交通大学 | 一种声音信号检测和识别的方法 |
CN102522082A (zh) * | 2011-12-27 | 2012-06-27 | 重庆大学 | 一种公共场所异常声音的识别与定位方法 |
CN106453878A (zh) * | 2016-09-30 | 2017-02-22 | 努比亚技术有限公司 | 基于声音的提示方法及移动终端 |
CN106653032A (zh) * | 2016-11-23 | 2017-05-10 | 福州大学 | 低信噪比环境下基于多频带能量分布的动物声音检测方法 |
Non-Patent Citations (4)
Title |
---|
ALAIN DUFAUX.ET AL.: "Methodology of wavelet packet selection for event detection", 《SIGNAL PROCESSING》 * |
ZU-REN FENG ET AL.: "A target guided subband filter for acoustic event detection in noisy environments using wavelet packets", 《IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 * |
许春冬: "嘈杂声学环境下的时频语音出现概率与噪声功率谱估计", 《中国博士学位论文全文数据库信息科技辑》 * |
陈志全等: "基于EEMD的异常声音特征提取", 《计算机与数字工程》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108182950A (zh) * | 2017-12-28 | 2018-06-19 | 重庆大学 | 改进的经验小波变换的公共场所异常声音特征分解与提取方法 |
CN108182950B (zh) * | 2017-12-28 | 2021-05-28 | 重庆大学 | 改进的经验小波变换的公共场所异常声音特征分解与提取方法 |
CN108470570B (zh) * | 2018-01-23 | 2021-06-18 | 浙江大学山东工业技术研究院 | 电机异音检测方法 |
CN108470570A (zh) * | 2018-01-23 | 2018-08-31 | 浙江大学山东工业技术研究院 | 电机异音检测方法 |
CN108538310A (zh) * | 2018-03-28 | 2018-09-14 | 天津大学 | 一种基于长时信号功率谱变化的语音端点检测方法 |
CN108538310B (zh) * | 2018-03-28 | 2021-06-25 | 天津大学 | 一种基于长时信号功率谱变化的语音端点检测方法 |
CN110411554A (zh) * | 2018-04-27 | 2019-11-05 | 华为技术有限公司 | 一种电机设备检测方法、装置及系统 |
CN110411554B (zh) * | 2018-04-27 | 2022-04-29 | 华为技术有限公司 | 一种电机设备检测方法、装置及系统 |
CN109470352A (zh) * | 2018-10-19 | 2019-03-15 | 威海北洋光电信息技术股份公司 | 基于自适应阈值的分布式光纤管道安全监测算法 |
CN109741762A (zh) * | 2019-02-15 | 2019-05-10 | 杭州嘉楠耘智信息科技有限公司 | 声音活动检测方法及装置和计算机可读存储介质 |
CN109741762B (zh) * | 2019-02-15 | 2020-12-22 | 嘉楠明芯(北京)科技有限公司 | 声音活动检测方法及装置和计算机可读存储介质 |
CN110223684A (zh) * | 2019-05-16 | 2019-09-10 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
CN110412547A (zh) * | 2019-07-24 | 2019-11-05 | 中国电子科技集团公司第三十六研究所 | 基于旋翼无人机载设备和地面设备的目标信号识别系统 |
CN110910897A (zh) * | 2019-12-05 | 2020-03-24 | 四川超影科技有限公司 | 一种用于电机异常声音识别的特征提取方法 |
CN110910897B (zh) * | 2019-12-05 | 2023-06-09 | 四川超影科技有限公司 | 一种用于电机异常声音识别的特征提取方法 |
CN114155879A (zh) * | 2021-12-06 | 2022-03-08 | 哈尔滨工程大学 | 一种利用时频融合补偿异常感知及稳定性的异音检测方法 |
CN114155879B (zh) * | 2021-12-06 | 2022-07-01 | 哈尔滨工程大学 | 一种利用时频融合补偿异常感知及稳定性的异音检测方法 |
CN115547312A (zh) * | 2022-11-30 | 2022-12-30 | 深圳时识科技有限公司 | 带活动检测的预处理器、芯片和电子设备 |
CN117891268A (zh) * | 2024-03-11 | 2024-04-16 | 成都凯天电子股份有限公司 | 自降噪的旋翼无人机声探测控制方法 |
CN117891268B (zh) * | 2024-03-11 | 2024-07-12 | 成都凯天电子股份有限公司 | 自降噪的旋翼无人机声探测控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107393555B (zh) | 2020-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107393555A (zh) | 一种低信噪比异常声音信号的检测系统及检测方法 | |
CN103578468B (zh) | 一种语音识别中置信度阈值的调整方法及电子设备 | |
CN114201988B (zh) | 卫星导航复合干扰信号识别方法和系统 | |
CN109616140B (zh) | 一种异常声音分析系统 | |
CN107068154A (zh) | 基于声纹识别的身份验证的方法及系统 | |
CN111814872B (zh) | 基于时域、频域自相似性的电力设备环境噪音识别方法 | |
CN112735473B (zh) | 基于声音识别无人机的方法及系统 | |
CN105788603A (zh) | 一种基于经验模态分解的音频识别方法及系统 | |
CN108511000A (zh) | 一种测试智能音箱唤醒词识别率的方法及系统 | |
CN109949823A (zh) | 一种基于dwpt-mfcc与gmm的车内异响识别方法 | |
CN101494049A (zh) | 一种用于音频监控系统中的音频特征参数的提取方法 | |
CN113566948A (zh) | 机器人化煤机故障音频识别及诊断方法 | |
CN107274911A (zh) | 一种基于声音特征的相似度分析方法 | |
CN113763986B (zh) | 一种基于声音分类模型的空调内机异常声音检测方法 | |
CN111986699B (zh) | 基于全卷积网络的声音事件检测方法 | |
Yao et al. | An adaptive seismic signal denoising method based on variational mode decomposition | |
CN105845149A (zh) | 声音信号中主音高的获取方法及系统 | |
CN110488675A (zh) | 一种基于动态规整算法的变电站声信号特征提取方法 | |
US20210319802A1 (en) | Method for processing speech signal, electronic device and storage medium | |
CN108172220A (zh) | 一种新型语音除噪方法 | |
CN110534121A (zh) | 一种基于频域特征的音频内容一致性的监测方法及系统 | |
Song et al. | Research on scattering transform of urban sound events detection based on self-attention mechanism | |
CN110580915B (zh) | 基于可穿戴式设备的声源目标识别系统 | |
CN114743562B (zh) | 一种飞机声纹识别方法、系统、电子设备及存储介质 | |
Li et al. | Unsupervised Anomalous Sound Detection for Machine Condition Monitoring Using Temporal Modulation Features on Gammatone Auditory Filterbank. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200818 |