CN1655229A - 检测和鉴别冲击声的设备和方法 - Google Patents

检测和鉴别冲击声的设备和方法 Download PDF

Info

Publication number
CN1655229A
CN1655229A CNA2005100055325A CN200510005532A CN1655229A CN 1655229 A CN1655229 A CN 1655229A CN A2005100055325 A CNA2005100055325 A CN A2005100055325A CN 200510005532 A CN200510005532 A CN 200510005532A CN 1655229 A CN1655229 A CN 1655229A
Authority
CN
China
Prior art keywords
power
event
attack
impact
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005100055325A
Other languages
English (en)
Inventor
文学
李荣范
李在原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1655229A publication Critical patent/CN1655229A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H1/00Measuring characteristics of vibrations in solids by using direct conduction to the detector

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

提供一种用于检测冲击声的设备和方法和使用其鉴别冲击声的设备和方法。冲击声检测设备包括:发作检测器,将帧单元的输入信号分离为低频信号和高频信号,测量所分离的信号的功率,并通过检测在所测量的功率中的变化来检测发作;事件缓冲器,缓冲通过发作检测器测量的功率和输入信号的频谱数据;和冲击声检验器,确定是否所检测的发作的每一个是冲击发作,并且如果所检测的发作的每一个是冲击发作,通过检查存储在事件缓冲器中的功率来检测从冲击发作开始的事件,并且如果所检测的发作的每一个满足预定条件,则确定所检测的事件的每一个为冲击事件。

Description

检测和鉴别冲击声的设备和方法
技术领域
本发明涉及一种用于检测冲击声的设备和方法及使用其鉴别冲击声的设备和方法,更特别地,涉及一种用于在从周围环境中产生的各种声音中检测冲击声的设备和方法,以及用于鉴别是否所检测的冲击声是目标冲击声的冲击声鉴别设备和方法。
背景技术
通过物体间的机械相互作用产生的冲击声或冲击声学事件具有短持续时间和相对高的强度。冲击声的这个特性称为冲击状态(impulsiveness))。根据信号处理理论,冲击状态可以被建模为线性系统的零状态冲击响应。
冲击声例如包括:单一的声音,例如当实心棒击打玻璃窗时产生的声音;和复杂的声音,例如爆炸声和当硬币掉在地板上时产生的声音。
冲击声通过从连续的声音流检测和鉴别冲击声学事件的存在和特性来鉴别。
发明内容
本发明提供一种冲击声检测设备和方法,用于检测发作信号和检测冲击声。
本发明还提供一种冲击声鉴别设备和方法,用于通过使用冲击声源检验所检测的冲击声来鉴别所检测的冲击声是否是目标冲击声。
根据本发明的一个方面,提供一种冲击声检测设备,包括:发作检测器,将帧单元的输入信号分离成低频信号和高频信号,测量所分离信号的功率,并通过检测在所测量功率中的变化检测发作;事件缓冲器,缓冲通过发作检测器所测量的功率和输入信号的频谱数据;和冲击声检验器,确定是否所检测的发作的每一个是冲击发作,和如果所检测的发作的每一个是冲击发作,通过检查存储在事件缓冲器中的功率检测从冲击发作开始的事件,且如果所检测的发作的每一个满足预定的条件,确定所检测的事件的每一个为冲击事件。
根据本发明的另一个方面,提供一种冲击声检测方法,包括:将帧单元的输入信号分离成高频的AC分量和低频的DC分量;测量所分离信号的功率并通过检查所测量功率的变化检测发作;缓冲所测量的功率和输入信号并确定是否所检测的发作的每一个是冲击发作;如果所检测的发作的每一个是冲击发作,通过检查缓冲的功率检测每一个从冲击发作开始的事件;并如果检测的事件满足冲击事件的预定条件,确定所检测的事件为冲击事件。
根据本发明的另一个方面,提供一种冲击声鉴别设备,包括:发作检测器,将帧单元的输入信号分离为低频信号和高频信号,测量所分离信号的功率,且通过检查所测量的功率的变化检测发作;事件缓冲器,缓冲通过发作检测器所测量的功率和输入信号;冲击声检验器,确定是否所检测的发作的每一个是冲击发作,且如果所检测的发作的每一个是冲击发作,通过检查存储在事件缓冲器中的功率来检测从冲击发作开始的事件,并如果所检测的发作的每一个满足预定的条件,确定所检测的发作的每一个为冲击事件;和冲击声源检验器,如果确定所检测的发作的每一个为冲击事件,通过将冲击事件和目标冲击声事件比较来鉴别冲击事件。
根据本发明的另一个方面,提供一种冲击声鉴别方法,包括:将帧单元的输入信号分离成高频的AC分量和低频的DC分量;测量所分离信号的功率并通过检查所测量功率的变化来检测发作;缓冲所测量的功率和输入信号,并确定是否所检测的发作的每一个是冲击发作;如果所检测的发作的每一个是冲击发作,通过检查缓冲的功率检测从冲击发作开始的每一个事件;如果所检测的事件满足冲击事件的预定条件,确定所检测的事件为冲击事件;且如果确定每一个所检测的事件为冲击事件,通过将冲击事件和目标冲击声事件比较来鉴别冲击事件。
附图说明
通过参考附图详细地描述其中的示例性实施例,本发明的上述和其他特性和优点将更为明显,其中:
图1是根据本发明的实施例检测和鉴别冲击声的设备的框图;
图2示出具有两个事件的信号;
图3是图1的发作检测器的详细的框图;
图4A示出从图2的信号中提取的展开相位谱的线性分量;
图4B示出延伸图4A的相位谱的线性分量的结果;
图5A示出计算图2的信号的功率增长率的结果;
图5B示出计算图2的信号功率的结果;
图5C示出用对数度量图5B的功率的结果;
图5D示出图3的增量(delta)计算器的输出信号;
图6示出向图5B的对数功率应用发作滤波器的结果;
图7是图1的冲击声检验器的详细的框图;
图8示出典型冲击事件信号;
图9A到9D示出输入信号的对数功率信号和对数功率信号的近似的信号;和
图10是图1的冲击声源检验器的详细的框图。
具体实施方式
在此,将参照附图更加全面地描述本发明,其中示出本发明的实施例。
图1是根据本发明的实施例检测和鉴别冲击声的设备的框图。参照图1,冲击声检测设备包括发作检测器11、事件缓冲器15和冲击声检验器12。
冲击声鉴别设备包括冲击声检测设备和冲击声源检验器13。
发作检测器可以进一步包括用于发作检测的噪音电平检测器14,且冲击声源检验器13可以进一步包括模板池16。
发作检测器11将帧单元的输入信号分离为低频信号和高频信号,测量信号的功率,且通过执行关于信号的傅立叶分析和其他统计过程来检测发作。
在此,发作(onset),是一种突然发生的物理事件信号,其示出快速的振幅或功率增长。事件(event),是一种声学事件,其具有普通事件所具有的衰减图案。事件具有从发作到当功率下降到预定电平之下时的时间或当另一个冲击发作发生时的时间的持续时间。
图2示出具有两个事件的信号。当用木棒击打木板时产生信号,且信号的持续时间是0.27秒。附图标记11-1和11-2代表冲击事件的发作,且发作之间的间隔是大约23毫秒(ms)。
事件缓冲器15存储当通过发作检测器11处理输入信号时产生的输入信号的频谱数据和功率数据。
噪音电平检测器14从输入信号检测长期噪音电平。发作检测器11可以通过从输入信号减去长期噪音电平并处理相减后的信号来检测发作。
冲击声检验器12从通过发作检测器11检测的发作中检验和输出冲击事件发作(以下为,冲击发作)。冲击声检验器12使用存储在事件缓冲器15中的功率数据来检验通过发作检测器11检测的发作是否是冲击发作。冲击发作通过确认功率电平的绝对值是否大于发作后的预定阈值、且是否具有如一般冲击声图案所示的功率衰减图案来验证。
冲击声源检验器13提取并分类存储于事件缓冲器15的频谱数据的特征向量,并验证输入信号是否包括目标冲击声。模板池16存储当将来自输入信号的特征向量分类时所参考的多个特征向量。
图3是图1的发作检测器11的详细框图。发作检测器11通过使用窗口大小的N个样本处理帧单元中的输入信号来检测发作,其中N为偶数。参照图3,发作检测器11包括AC/DC分离器20,高频发作检测器(HOD)21,低频发作检测器(LOD)23,和发作确定器24。
AC/DC分离器20包括低通滤波器(LPF)201和加法器202,并分离来自输入信号的AC/DC信号。通过使输入信号通过过LPF201并仅提取低频分量来获得DC信号。通过从输入信号中减去低频分量来获得AC信号。在此,在帧单元中处理输入信号。
HOD21包括快速傅立叶变换器(FTT)211、线性相位跨度单元(LPS)212、第一加权单元213、累积(banked)功率增长率计算器214、第二加权单元215、功率计算器216、增量计算器217、发作滤波器218、第三加权单元219、合并器220、和发作触发单元221,并检测高频分量的发作。在此,FFT211、LPS212、和累积功率增长率计算器214是在频率域内操作的信号处理块;且功率计算器216、增量计算器217、和发作滤波器218是在时间域中操作的信号处理块。
FFT211快速傅立叶变换输入信号的AC分量。
如果输入信号的频谱数据是x(0)、x(1)、...x(N-1),且每半帧是Y1和Y2,Y1和Y2是向量,每一个具有N/2元素。Y1和Y2如等式1所示表示。
[等式1]
Y 1 = DFT ( { x ( 0 ) , x ( 1 ) , . . . , x ( N 2 - 1 ) } ) , Y 2 = DFT ( { x ( N d ) , x ( N 2 + 1 ) , . . . , x ( N ) } )
在此,DFT是离散傅立叶变换函数。
LPS212展开频谱数据的相位,并提取展开的相位谱φ(n)的线性度。φ(n)是线性函数,可以使用等式2近似得出。
[等式2]
Figure A20051000553200141
在此,a是常数。
根据等式2,φ(n)的线性度可以使用如等式3中所示的φ(n)的方差近似得出。
[等式3]
Figure A20051000553200142
其中,
Figure A20051000553200143
如果将等式3应用到每一个频谱数据,为了展开频谱数据的相位,LPS212将2mπ加到每一个相位角,使得在所有邻近相位角之间的差的绝对值不大于π。在此,m是自然数。线性分量表示为其频率n在0和N/2之间且当n=0时其值为0的线性函数。线性函数的斜率是通过以(1,2,...,N/2)的内积和第一到第N/2个展开的相位角乘24、并用N(N+1)(N+2)除乘出的结果而获得的值。
从第一相位线性度值和第N/2个相位线性度值之间的差来计算线性相位跨度(span)。
图4A示出从图2的信号中提取的展开相位谱的线性分量。图4B示出延伸图4A的相位谱的线性分量的结果。
第一加权单元213检查接着LPS 212的线性增长图案的最后输出值。最好第一加权单元213是匹配滤波器。第一加权单元213的输出是从通过以包括LPS 212的最近N/2输出值的向量与期望的图案向量的内积乘N/2获得的值计算出的。在此,期望的图案向量具有理想的相位跨度,且对应于第k个线性相位跨度的理想值是24(N/2-k)/(N-1_N(N+1))π。
累积功率增长率计算器214从当前帧获得较高的N/2和较低的N/2频谱数据的功率,如等式4中所示,计算具有大于预定阈值的功率增长的频率数,并输出以N/2除所计算的数的结果。
[等式4]
其中,th是大于0的阈值,且s(t)表示其中t≥0的阶梯函数。
根据等式4的计算结果,在发作时间附近获得高电平(几乎为1),且高电平区的持续时间取决于窗口的长度。图5A示出计算图2的信号的功率增长率的结果。参照图5A,在发作附近将高电平维持预定的时间周期。
功率计算器216计算帧的AC分量的功率并以对数运算符号来度量功率。增量计算器217获得当前输入对数功率和前一输入对数功率之间的差值。使用等式5计算功率和增量对数功率。
[等式5]
图5B示出计算图2的信号的功率的结果。参照图5B,功率在发作处极大地增加。图5C示出用对数度量图5B的功率的结果。参照图5C,附图标记216a代表噪音电平,且附图标记216b代表大于噪音电平大约为10.8dB的阈值。图5D示出图3的增量计算器217的输出信号。参照图5D,可以更加准确地获得发作发生的位置。
第二加权单元215轮乘(shift-multiply)累积功率增长率计算器214的输出和增量计算器217的输出。现在将详细描述轮乘操作。如果X和Y代表两个向量,s代表轮流(shift)操作,且Z代表轮乘X和Y的结果,则将从各个值中的最大值获得Z的第k个元素,该各个值是通过相乘X和Y的各个元素获得的,每一个具有k-s到k+s指数。如果s=0,轮乘的结果与两个向量的标量相乘的结果相同。
发作滤波器218分别计算从功率计算器216输出的对数-功率的当前帧和前一帧中的平均值,并输出通过从当前平均值减去前一平均值获得的值。两个平均值是使用通过组合两个一阶线性滤波器形成的第二滤波器计算的,且使用等式6计算对组合滤波器的冲击响应。
[等式6]
h ( n ) = ( 1 - e 1 / τ e ) e n / τ e - ( 1 - e 1 / τ i ) e n / τ i , n = 1,2,3 , . . .
在此,τe和τi代表两个一阶线性滤波器的时间常量,且τe≤τi
图6示出将发作滤波器应用于图5B的对数功率的结果。
第三加权单元219可以是一致(identity)运算符。
合并器220将第一、第二和第三加权单元213、215、和219的输出相加。如果加法结果是正的,代表第一、第二和第三加权单元213、215、和219的所有输出超出预定阈值。
发作触发单元221通过使用发作滤波器218的输出作为控制信号、根据合并器220的输出,输出正或负的触发值。如果控制信号小于活动电平,发作触发单元221不管合并器220的输出而输出负值,且如果控制信号等于或大于活动电平,发作触发单元221当合并器220的输出是正的时输出正值,且当合并器220的输出是负的时输出负值。
LOD 23包括滤波器组单元231、功率计算器232、增量计算器233、比较器234、和合并器235。
滤波器组(bank)单元231包括多个通带滤波器(未示出),且将从LPF 201输出的低频音频信号再分为各个频带。功率计算器232对应于每一个频带累积低频音频信号的功率。增量计算器233从第i个频带的功率减去第(i-1)个频带的功率,并通过对减法结果进行对数运算输出增量对数功率。比较器234通过确定增量对数功率是否大于预定阈值来检测在每一个频带中的局部发作。合并器235合并在每一个频带中检测的发作,并输出整个低频带的发作确定值。
发作确定器24将HOD21和HOD23的输出相加,并输出代表发作是否发生的二进制信号。如果LOD23的输出信号是正的、且通过功率计算器232计算的整个低频带的功率大于或等于总音频信号功率的20%,或如果HOD21的输出信号是正的、且通过功率计算器216计算的整个高频带的功率大于或等于总音频信号功率的5%,可以确定发作发生了。否则,确定发作没有发生。
图7是图1的冲击声检验器12的框图。参照图7,冲击声检验器12包括冲击发作选择器31、事件形成器32、和冲击事件选择器33。
如果通过发作检测器11检测到发作,冲击发作选择器31监控事件缓冲器15中缓冲的对数功率,并输出发作的功率峰值是否发生的结果。当用对数度量的功率在发作持续时间内达到最大值时,功率峰值发生。发作持续时间是图2的发作触发单元221处于活动状态的时间周期。冲击发作选择器31还搜索其中功率在发作开始时间和峰值时间之间极大地增长的区域。在该区域中,有连续的数据示出在短于第二阈值的持续时间期间功率增长大于第一阈值。如果搜索成功,冲击发作选择器3 1输出正值。否则,其输出负值。
当冲击发作选择器31在监测对数功率的同时输出正值、并确定事件持续时间时,触发事件形成器32,所述对数功率是从事件缓冲器15输出的,所述事件持续时间是从功率峰值发生时开始的。事件持续时间是从事件开始时间到事件结束时间。事件开始时间定义为当功率峰值发生时的时间,且事件结束时间是对数功率落在背景噪音电平之下、或通过冲击发作选择器31再次触发事件形成器32的时间。事件形成器32在事件开始时间和事件结束时间向冲击声源检验器13输出时间戳。
如果事件结束时间通过上述两个例子中的一个代表,冲击事件选择器33确定在事件持续时间期间,事件信号的峰值电平是否以适当的衰减方法衰减。也就是,冲击事件选择器33确定从发作开始衰减的整个事件是否是冲击事件。在此,适当的衰减方法是指使峰值电平指数地衰减,且通过选择代表对数功率信号图案的功率函数和检查代表衰减程度的参数是否在适当的范围内来完成该确定。
图8示出典型的冲击事件信号。图8中的冲击信号包括输入信号80、对数功率信号81、噪音电平82、高于噪音电平10.8dB的电平83、和发作84。参照图8,发作84极大地增长。附图标记85代表显示冲击事件特性的几乎线性衰减的对数功率电平。图8中示出的对数功率的斜率可以以指数函数exp(·)表示,其中λ近似对数功率的斜率。
冲击事件选择器33搜索近似于对数功率信号的λ,并确定λ是否在期望的范围内。
图9A到9D示出对应于输入信号的对数功率信号和对应于对数功率信号的近似信号。参照图9A到9D,附图标记90-1,90-2,90-3,90-4分别代表输入信号,且附图标记91-1,91-2,91-3,和91-4分别代表输入信号的对数功率。附图标记92-1,92-2,92-3,和92-4代表近似的对数功率信号。当每一个对数功率信号在为每一个信号设置的噪音电平和高于噪音电平的阈值之间时,对数功率信号近似为0,且当每一个对数功率信号从每一个发作衰减到阈值时,对数功率信号近似为其中λ分别是0.520、0.959、1.435、和37.59的信号。图9B示出其中λ几乎为1的理想冲击事件信号。图9A和9C示出冲击事件信号。图9D还示出极大增长的功率电平。然而,由于λ>>1,信号不能被认为是冲击事件。实际上,图9D示出了语音信号,而非冲击声。
如果冲击事件选择器33确定输入信号为冲击事件信号,则其触发冲击声源检验器13。
图10是图1的冲击声源检验器13的详细的框图。参照图10,冲击声源检验器13包括特征向量提取器41和分类器42。
特征向量提取器41包括分配器411、累加器412、和离散余弦变换器(DCT)413,并从事件的频谱数据中提取适当的特征向量。
分配器411在通过从事件形成器32输入的时间戳指定的间隔中,将从事件缓冲器15输入的频谱数据分成M段。累加器412累加每一段的频谱数据,并生成每一个具有N/2个元素的M个向量。在此,可以将积加的结果标准化,以补偿所积加结果的变化。
DCT413通过对M个向量执行离散余弦变换来输出特征向量。其他特征向量可以被加到从DCT413输出的特征向量。特征的例子可以是从事件持续时间获得的衰减斜率或事件的近似功率函数。
分类器42确定是否通过将从DCT413输出的特征向量与从模板池16输出的模板进行比较来检测想要的冲击声。在此,模板池16存储目标事件的统计模型和用于检测的阈值。分类器42通过计算在特征向量和模板之间的相似性和确定所计算的相似性是否大于用于检测的阈值,来输出输入信号是否是目标冲击声的结果。统计分类器,例如高斯混合模型、N-最近相邻法、和神经网络,可以被用作分类器42。
本发明可以通过运行来自计算机可读介质的程序、在通用计算机中实施,所述计算机可读介质包括但不限于例如磁存储介质(ROMs、RAMs、软盘、磁带等)、光可读介质(CD-ROMs、DVDs等)、和载波(通过互联网传送)的存储介质。本发明可以作为具有计算机可读程序代码单元的计算机可读介质实施,其中计算机可读程序代码单元用于使通过网络连接的多个计算机系统实现分布处理。并且用于实施本发明的功能程序、代码和代码段可以通过本发明所属领域的程序员很容易地演绎出来。
如上面所描述的,根据本发明,可以在从周围产生的冲击声中鉴别想要的冲击声,例如,物体的冲击声、当窗玻璃被打碎时的声音、枪声、或脚步声。因此,可以将本发明应用到安全系统,并将其用于在声学诊断的基础上诊断结构的缺陷。
虽然本发明已假定输入视频数据是参照其首选的实施例编码的可变的长度,本领域技术人员可以理解,输入视频数据的固定长度编码可以根据本发明的精神和范围来实施。首选的实施例应被认为仅是描述性的,而不是用于限制的目的。因此,本发明的范围不是通过本发明的详细描述而是通过所附的权利要求限定的,并且将在本发明范围内的所有差别分析为包括在本发明中。

Claims (42)

1.一种冲击声检测设备,包括:
发作检测器,将帧单元的输入信号分离为低频信号和高频信号,测量所分离的信号的功率,并通过检测所测量的功率中的变化来检测发作;
事件缓冲器,缓冲通过发作检测器测量的功率和输入信号的频谱数据;和
冲击声检验器,确定是否所检测的发作的每一个是冲击发作,且如果所检测的发作的每一个是冲击发作,通过检查存储在事件缓冲器中的功率检测从冲击发作开始的事件,并且如果所检测的发作满足预定的条件,则确定所检测的事件的每一个为冲击事件。
2.如权利要求1所述的设备,其中发作检测器包括:
AC/DC分离器,将来自输入信号的高频的AC分量和低频的DC分量分离;
高频发作检测器,获得在频率域中的相位特性和AC分量的功率变化量,计算在时间域中的AC分量的功率变化量,使用相位特性和功率变化量检测AC分量的发作,并输出触发值;
低频发作检测器,将DC分量再分成各个频带,获得每一个频带的功率变化量,通过将功率变化量与第一阈值比较、并合并功率变化量来检测DC分量的发作,并输出发作确定值;和
发作确定器,使用功率变化量、触发值和发作确定值确定是否在输入信号中发生发作。
3.如权利要求2所述的设备,其中AC/DC分离器包括:
低通滤波器,通过输入信号的低频信号;和
减法器,通过从输入信号中减去低频信号来输出高频信号。
4.如权利要求2所述的设备,其中高频发作检测器包括:
频率域发作检测器,通过对AC分量执行快速傅立叶变换获得在频率域中的相位线性度和功率变化率;
时间域发作检测器,通过输入信号的各个频谱数据获得在时间域中的AC分量的功率并获得功率变化量;
合并器,合并频率域发作检测器的输出和时间域发作检测器的输出;和
发作触发单元,根据时间域发作检测器的功率变化量确定合并器的输出是发作,并输出触发值。
5.如权利要求4所述的设备,其中频率域发作检测器包括:
快速傅立叶变换器(FFT),对AC分量执行快速傅立叶变换;
线性相位跨度单元,将快速傅立叶变换的频谱数据的相位近似为线性函数,并获得近似的第一频谱数据的相位和位于帧中心处的频谱数据的相位之间的差值;和
累积功率增长率计算器,获得快速傅立叶变换的频谱数据的功率,将该帧的第一半的功率与第二半的功率比较,并获得大于第二阈值的功率比率。
6.如权利要求5所述的设备,其中时间域发作检测器包括:
功率计算器,获得AC分量的功率并用对数度量该功率;
增量计算器,计算当前频谱数据和从功率计算器输出的前一频谱数据的对数功率之间的差值;和
发作滤波器,获得在当前帧中对数功率的平均值,并输出当前帧和前一帧的对数功率平均值间的差值。
7.如权利要求6所述的设备,其中发作滤波器是通过合并两个一阶滤波器形成的二阶滤波器,并具有如下冲击响应:
h ( n ) = ( 1 - e 1 / τ e ) e n / τ e - ( 1 - e ↓ / τ i ) e n / τ i , n = 1,2,3 , . . .
其中,τe和τi是两个一阶滤波器的时间常数。
8.如权利要求6所述的设备,其中合并器进一步包括:
第一加权单元,匹配滤波线性相位跨度单元的输出;
第二加权单元,轮乘累积功率增长率计算器和增量计算器的输出;和
第三加权单元,执行发作滤波器的输出的一致操作,其中
所述合并器将第一、第二和第三加权单元的输出相加并输出相加的结果。
9.如权利要求6所述的设备,其中发作触发单元通过使用发作滤波器的输出作为控制信号、根据合并器的输出来输出正或负值。
10.如权利要求2所述的设备,其中低频发作检测器包括:
滤波器组单元,将DC分量再分成多个频带;
功率计算器,计算每一个频率的功率并用对数度量该功率;
增量计算器,计算在邻近频带之间、从功率计算器输出的对数功率的差值;
比较器,通过将从用于每一个频带的增量计算器输出的增量对数功率与第一阈值进行比较来确定是否发生局部发作;和
合并器,将通过比较器检测的局部发作合并,以输出发作确定值。
11.如权利要求2所述的设备,其中如果输出触发值,且通过高频发作检测器测量的功率与输入信号的总功率的比率大于第二阈值,发作确定器通过将触发值和发作确定值相加来输出代表是否发生发作的二进制信号。
12.如权利要求2所述的设备,其中如果输出发作确定值,且通过低频发作检测器测量的功率与输入信号的总功率的比率大于第二阈值,则发作确定器通过将触发值和发作确定值相加来输出代表是否发生发作的二进制信号。
13.如权利要求1所述的设备,发作检测器进一步包括噪音电平检测器,检测输入信号的噪音电平,
其中发作检测器在通过从输入信号减去所检测的噪音电平获得的信号中检测发作。
14.如权利要求1所述的设备,其中冲击声检验器包括:
冲击发作选择器,如果通过发作检测器检测到发作,则通过检查存储在事件缓冲器中的功率来确定所检测的发作的每一个是否是冲击发作;
事件形成器,如果确定所检测的发作的每一个是冲击发作,使用存储于事件缓冲器中的功率来搜索从冲击发作开始的每一个事件持续时间;和
冲击事件选择器,如果所述事件满足冲击事件的特性,确定通过事件形成器搜索的每一个事件为冲击事件。
15.如权利要求14所述的设备,其中如果检测到发作,冲击发作选择器通过监测存储于事件缓冲器中的功率来确定是否发生功率峰值,并通过将从每一个发作的开始时间到每一个功率峰值时间的功率增长量与预定阈值进行比较来确定该发作是否是冲击发作。
16.如权利要求15所述的设备,其中事件形成器通过定义事件持续时间的开始时间作为功率峰值的每一个的发生时间、和定义事件持续期间的结束时间作为功率落在预定电平之下或冲击发作选择器输出后继冲击发作时的时间,来形成事件的每一个。
17.如权利要求15或16所述的设备,其中冲击事件选择器搜索近似通过事件形成器形成的事件的功率函数,并通过确定功率函数是否在预定的范围、从功率峰值的每一个指数地衰减,来确定事件的每一个是否是冲击事件。
18.一种冲击声检测方法,包括:
将帧单元的输入信号分离成高频的AC分量和低频的DC分量;
测量分离的信号的功率并通过检查所测量的功率的变化来检测发作;
缓冲所测量的功率和输入信号,并确定是否所检测的发作的每一个是冲击发作;
如果所检测的发作的每一个是冲击发作,通过检查所缓冲的功率来检测从冲击发作开始的每一个事件;并且
如果检测的事件满足冲击事件的预定条件,确定检测的事件为冲击事件。
19.如权利要求18所述的方法,其中发作的检测包括:
获得相位特性和在频率域中的AC分量的功率变化量;
在时间域中计算AC分量的功率变化量;
通过将相位特性和功率变化量合并来检测AC分量的发作,以输出触发值;
将DC分量再分成多个频带并获得每一个频带的功率变化量;
通过将每一个频带的DC分量的功率变化量与第一阈值比较并合并功率变化量来检测DC分量的发作;和
通过合并AC和DC分量的所检测的发作、触发值和发作确定值来检测输入信号的发作。
20.如权利要求19所述的方法,其中相位特性通过以下获得:
对AC分量执行快速傅立叶变换;
将快速傅立叶变换的频谱数据的相位近似为线性函数;和
获得近似的第一频谱数据的相位和位于帧中间的频谱数据的相位之间的差值。
21.如权利要求19所述的方法,其中在频率域中的AC分量的功率变化量通过以下获得:
对AC分量执行快速傅立叶变换;和
通过将快速傅立叶变换的频谱数据的帧的第一半的功率与第二半比较,来获得大于第二阈值的功率增长的率。
22.如权利要求19所述的方法,其中在时间域中AC分量的功率变化量通过以下获得:
获得AC分量的功率并用对数度量该功率;
计算当前频谱数据和前一频谱数据的对数功率之间的差值;和
获得当前帧中的对数功率的平均值,并输出当前帧和前一帧的对数功率平均值之间的差值。
23.如权利要求19所述的方法,相位特性和功率变化量的合并包括:
匹配滤波相位特性;
在频率域和时间域中轮乘功率变化量;和
对在当前帧和前一帧的对数功率平均值之间的差值执行一致运算,
其中将匹配滤波结果、轮乘结果和一致运算结果相加。
24.如权利要求19所述的方法,其中输入信号的发作的检测是输出二进制信号,该二进制信号代表发作是否发生,并且通过如果将触发值输出、且AC分量的测量功率与输入信号的总功率的比率大于第二阈值、则相加触发值和发作确定值来获得该发作的检测。
25.如权利要求19所述的方法,其中输入信号的发作的检测包括:输出二进制信号,该二进制信号代表发作是否发生,并且通过如果将发作确定值输出、且DC分量的测量功率与输入信号的总功率的比率大于第二阈值、则相加触发值和发作确定值来获得该发作的检测。
26.如权利要求18所述的方法,其中所检测的事件的每一个为冲击事件的确定包括:通过监测缓冲的功率来确定是否发生功率峰值,和通过将从发作的每一个的开始时间到功率峰值时间增长的功率值与预定阈值进行比较,来确定发作的每一个是否是冲击发作。
27.如权利要求26所述的方法,其中事件的检测包括:通过定义事件持续时间的每一个的开始时间作为功率峰值时间,和定义事件持续时间的每一个的结束时间作为功率落在预定电平之下或后继冲击发作发生时间,来形成事件。
28.如权利要求27所述的方法,其中确定所检测的事件为冲击事件包括:搜索近似在检测事件中形成的事件的功率函数,并通过确定功率函数是否在预定的范围内、从功率峰值的每一个指数地衰减来确定是否事件的每一个是冲击事件。
29.一种冲击声鉴别设备,包括:
发作检测器,将帧单元的输入信号分离为低频信号和高频信号,测量所分离的信号的功率,且通过检查所测量的功率的变化来检测发作;
事件缓冲器,缓冲通过发作检测器测量的功率和输入信号;
冲击声检验器,确定是否所检测的发作的每一个是冲击发作,且如果所检测的发作的每一个是冲击发作,通过检查存储在事件缓冲器中的功率检测从冲击发作开始的事件,且如果所检测的发作的每一个满足预定的条件,则确定所检测的发作的每一个是冲击事件。
冲击声源检验器,如果确定所检测的发作的每一个为冲击事件,通过将冲击事件与目标冲击声事件比较来鉴别冲击事件。
30.如权利要求29所述的设备,其中发作检测器包括:
AC/DC分离器,将来自输入信号的高频的AC分量和低频的DC分量分离;
高频发作检测器,获得在频率域中的AC分量的功率变化量和相位特性,计算在时间域中的AC分量的功率变化量,使用相位特性和功率变化量检测AC分量的发作,并输出触发值;
低频发作检测器,将DC分量再分成多个频带,获得每一个频带的功率变化量,通过将功率变化量与第一阈值比较、并合并功率变化量来检测DC分量的发作,并输出发作确定值;和
发作确定器,使用各个功率变化量、触发值和发作确定值确定是否发作在输入信号中发生。
31.如权利要求29所述的设备,其中冲击声检验器包括:
冲击发作选择器,如果通过发作检测器检测到发作,通过检查存储在事件缓冲器中的功率来确定是否所检测的发作的每一个是冲击发作;
事件形成器,如果确定所检测的发作的每一个是冲击发作,使用存储于事件缓冲器中的功率搜索从冲击发作开始的每一个事件持续时间;和
冲击事件选择器,如果所述事件满足冲击事件的特性,确定通过事件形成器搜索的每一个事件为冲击事件。
32.如权利要求31所述的设备,其中事件形成器输出在事件持续时间的开始时间和结束时间之间的时间戳,并且
冲击声源检验器包括:
特征向量提取器,从存储在事件缓冲器中的频谱数据中对应于时间戳的频谱数据中提取特征向量;和
分类器,通过计算在提取的特征向量和目标冲击声事件中的特征向量之间的相似性来鉴别输入信号。
33.如权利要求32所述的设备,其中特征向量提取器包括:
分配器,将在时间戳中从事件缓冲器输入的频谱数据分成多个段;
累加器,累加每一段的频谱数据来产生向量;和
离散余弦变换器,通过对向量执行离散余弦变换来输出特征向量。
34.如权利要求33所述的设备,其中累加器进一步标准化累加的结果,使得累加结果的偏差得到补偿。
35.如权利要求32所述的设备,其中分类器进一步包括:
模板池,存储目标冲击声的特征向量。
36.一种冲击声鉴别方法,包括:
将帧单元的输入信号分离成高频的AC分量和低频的DC分量;
测量所分离的信号的功率并通过检查所测量的功率的变化检测发作;
缓冲所测量的功率和输入信号,并确定是否所检测的发作的每一个是冲击发作;
如果所检测的发作的每一个是冲击发作,通过检查缓冲的功率来检测从冲击发作开始的每一个事件;
如果所检测的事件满足冲击事件的预定条件,确定所检测的事件为冲击事件;和
如果确定所检测的事件的每一个为冲击事件,通过将冲击事件与目标冲击声事件比较来鉴别冲击事件。
37.如权利要求36所述的方法,其中发作的检测包括:
获得在频率域中AC分量的功率变化量和相位特性;
计算在时间域中AC分量的功率变化量;
通过合并相位特性和功率变化量来检测AC分量的发作,以输出触发值;
将DC分量再分成多个频带,并获得每一个频带的功率变化量;
通过将每一个频带的DC分量的功率变化量与第一阈值比较、并合并功率变化量来检测DC分量的发作;和
通过合并AC和DC分量的所检测的发作、触发值和发作确定值来检测输入信号的发作。
38.如权利要求36所述的方法,其中确定所检测的事件的每一个为冲击事件包括:通过监测缓冲的功率来确定是否功率峰值发生,并通过将从发作的每一个的开始时间到功率峰值时间增长的功率值与预定阈值进行比较,来确定是否发作的每一个是冲击发作。
39.如权利要求38所述的方法,其中事件的检测包括:通过定义事件持续时间的每一个的开始时间作为功率峰值时间、和定义事件持续时间的每一个的结束时间作为功率落在预定电平之下或后继冲击发作发生的时间,来形成事件。
40.如权利要求39所述的方法,其中冲击事件的鉴别包括:
获得事件持续时间的每一个的开始时间和结束时间之间的时间戳;
从缓冲的频谱数据中对应于时间戳的频谱数据提取特征向量;和
通过计算在提取的特征向量和目标冲击声事件的特征向量之间的相似性来鉴别输入信号。
41.如权利要求40所述的方法,其中特征向量的提取包括:
将在时间戳内的缓冲的频谱数据分成多个段;
累加每一段的频谱数据以生成向量;和
通过对向量执行离散余弦变换获得特征向量。
42.如权利要求41所述的方法,其中该累加进一步标准化所累加的结果,使得累加结果的偏差得到补偿。
CNA2005100055325A 2004-02-10 2005-01-20 检测和鉴别冲击声的设备和方法 Pending CN1655229A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020040008738A KR100580643B1 (ko) 2004-02-10 2004-02-10 충격음 감지 장치, 방법 그리고 이를 이용한 충격음 식별장치 및 방법
KR8738/2004 2004-02-10

Publications (1)

Publication Number Publication Date
CN1655229A true CN1655229A (zh) 2005-08-17

Family

ID=34909934

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005100055325A Pending CN1655229A (zh) 2004-02-10 2005-01-20 检测和鉴别冲击声的设备和方法

Country Status (3)

Country Link
US (1) US7234340B2 (zh)
KR (1) KR100580643B1 (zh)
CN (1) CN1655229A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102177313A (zh) * 2008-10-10 2011-09-07 斯奈克玛 监测涡轮喷气发动机的方法和系统
CN101464788B (zh) * 2008-12-31 2013-07-31 无锡中星微电子有限公司 二进制数是否为三的倍数的检验装置及芯片
CN103886868A (zh) * 2014-04-16 2014-06-25 上海其高电子科技有限公司 冲击声检测方法及检测系统
CN103954552A (zh) * 2014-04-11 2014-07-30 中国石油化工股份有限公司 提高撞击感度试验精确度的方法
CN105118520A (zh) * 2015-07-13 2015-12-02 腾讯科技(深圳)有限公司 一种音频开头爆音的消除方法及装置
CN111341348A (zh) * 2020-04-23 2020-06-26 武汉东信同邦信息技术有限公司 发令枪声的声音频谱识别与声压振动侦测装置及方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1769887B1 (en) * 2000-03-16 2008-07-30 Makita Corporation Power tools
KR100612870B1 (ko) * 2004-11-10 2006-08-14 삼성전자주식회사 임펄스 이벤트 분리 장치 및 방법
EP2031581A1 (de) 2007-08-31 2009-03-04 Deutsche Thomson OHG Verfahren zum Erkennen eines akustischen Ereignisses in einem Audio-Signal
KR100851602B1 (ko) * 2008-02-14 2008-08-12 (주) 펄스피어 충격음과 그 충격음의 리듬을 검출하는 장치와 방법
WO2009102141A2 (ko) * 2008-02-14 2009-08-20 Pulsphere Co., Ltd 충격음과 그 충격음의 리듬을 검출하는 장치와 방법
KR100973740B1 (ko) * 2009-11-06 2010-08-06 김효영 물질 특유의 사운드 패턴을 이용한 유리 파열음 감지장치 및 감지방법
US9208773B2 (en) * 2011-12-23 2015-12-08 Bose Corporation Headset noise-based pulsed attenuation
US8457912B1 (en) * 2012-01-30 2013-06-04 Osisoft, Llc Unwrapping angles from phasor measurement units
WO2014136628A1 (ja) * 2013-03-05 2014-09-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
WO2014136629A1 (ja) * 2013-03-05 2014-09-12 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
WO2014165163A1 (en) * 2013-03-12 2014-10-09 Brigham Young University Method and system for structural integrity assessment
WO2015029546A1 (ja) * 2013-08-30 2015-03-05 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
JP6406257B2 (ja) * 2013-08-30 2018-10-17 日本電気株式会社 信号処理装置、信号処理方法および信号処理プログラム
KR101578998B1 (ko) * 2014-03-17 2015-12-22 재단법인 다차원 스마트 아이티 융합시스템 연구단 감시 카메라에서 dct 계수를 이용한 이벤트 감지 방법 및 시스템
US9965685B2 (en) * 2015-06-12 2018-05-08 Google Llc Method and system for detecting an audio event for smart home devices
WO2016205207A1 (en) 2015-06-14 2016-12-22 Brigham Young University Flexible elements for probes and guard rings
EP3553780B1 (en) * 2016-12-06 2021-08-11 Nippon Telegraph and Telephone Corporation Signal feature extraction apparatus, signal feature extraction method, and program
US11935552B2 (en) * 2019-01-23 2024-03-19 Sony Group Corporation Electronic device, method and computer program
KR102238429B1 (ko) * 2019-04-24 2021-04-09 주식회사 이엠텍 돌발성 잡음 검출 장치
CN111754988B (zh) * 2020-06-23 2022-08-16 南京工程学院 基于注意力机制和双路径深度残差网络的声场景分类方法
CN114429769A (zh) * 2020-10-29 2022-05-03 漳州立达信光电子科技有限公司 玻璃破碎声音侦测方法及相关设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5046362A (en) * 1988-04-26 1991-09-10 Ford New Holland, Inc. Grain loss monitors for harvesting machines
CA1315868C (en) * 1988-05-30 1993-04-06 Rene Schmidt Blast recorder and method of displaying blast energy
US4845464A (en) * 1988-08-09 1989-07-04 Clifford Electronics, Inc. Programmable sensor apparatus
US5425436A (en) * 1992-08-26 1995-06-20 Nippondenso Co., Ltd. Automotive suspension control system utilizing variable damping force shock absorber
US5438317A (en) * 1994-04-08 1995-08-01 Detection Systems, Inc. Glass break detection with noise riding feature
US5450061A (en) * 1994-04-08 1995-09-12 Detection Systems, Inc. Glass break detection using temporal sequence of selected frequency characteristics
US5737481A (en) * 1994-06-22 1998-04-07 Matsushita Electric Industrial Co., Ltd. Information recording method, information recording apparatus and information recording medium
JP3419232B2 (ja) 1997-01-21 2003-06-23 スズキ株式会社 波数計数方法及びこれを用いた振動測定装置
JPH10260075A (ja) 1997-03-18 1998-09-29 Fuji Xerox Co Ltd 信号検出装置および信号検出方法
JP2003083802A (ja) 2001-09-13 2003-03-19 Fuji Xerox Co Ltd 音響信号検出装置および音響信号検出方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102177313A (zh) * 2008-10-10 2011-09-07 斯奈克玛 监测涡轮喷气发动机的方法和系统
CN102177313B (zh) * 2008-10-10 2014-04-16 斯奈克玛 监测涡轮喷气发动机的方法
CN101464788B (zh) * 2008-12-31 2013-07-31 无锡中星微电子有限公司 二进制数是否为三的倍数的检验装置及芯片
CN103954552A (zh) * 2014-04-11 2014-07-30 中国石油化工股份有限公司 提高撞击感度试验精确度的方法
CN103886868A (zh) * 2014-04-16 2014-06-25 上海其高电子科技有限公司 冲击声检测方法及检测系统
CN103886868B (zh) * 2014-04-16 2019-05-24 上海其高电子科技有限公司 冲击声检测方法及检测系统
CN105118520A (zh) * 2015-07-13 2015-12-02 腾讯科技(深圳)有限公司 一种音频开头爆音的消除方法及装置
WO2017008587A1 (zh) * 2015-07-13 2017-01-19 腾讯科技(深圳)有限公司 一种音频开头爆音的消除方法、装置及存储介质
CN105118520B (zh) * 2015-07-13 2017-11-10 腾讯科技(深圳)有限公司 一种音频开头爆音的消除方法及装置
US10199053B2 (en) 2015-07-13 2019-02-05 Tencent Technology (Shenzhen) Company Limited Method, apparatus for eliminating popping sounds at the beginning of audio, and storage medium
CN111341348A (zh) * 2020-04-23 2020-06-26 武汉东信同邦信息技术有限公司 发令枪声的声音频谱识别与声压振动侦测装置及方法

Also Published As

Publication number Publication date
US20050199064A1 (en) 2005-09-15
US7234340B2 (en) 2007-06-26
KR20050080647A (ko) 2005-08-17
KR100580643B1 (ko) 2006-05-16

Similar Documents

Publication Publication Date Title
CN1655229A (zh) 检测和鉴别冲击声的设备和方法
EP1763018B1 (en) System for detection section including particular acoustic signal, method and program thereof
US8586847B2 (en) Musical fingerprinting based on onset intervals
Filho et al. Preprocessing passive sonar signals for neural classification
US20090002490A1 (en) Acoustic recognition apparatus, acoustic recognition method, and acoustic recognition program
CN101133442B (zh) 生成音频信号的印迹的方法
JP4099576B2 (ja) 情報識別装置及び方法、並びにプログラム及び記録媒体
CN101042870A (zh) 用于评估声音间相似度的方法和设备
CN115510909A (zh) 一种dbscan进行异常声音特征的无监督算法
CN115310477A (zh) 基于分形特征和捕食者算法的泵机设备故障声音检测方法及其系统
US7966179B2 (en) Method and apparatus for detecting voice region
EP3696815B1 (en) Nonlinear noise reduction system
US9215350B2 (en) Sound processing method, sound processing system, video processing method, video processing system, sound processing device, and method and program for controlling same
CN1599983A (zh) 用于检测谱的量化的方法
JP4046592B2 (ja) 音源識別装置および突発事象検出装置並びに突発事象自動記録装置
JP3418005B2 (ja) 音声ピッチ検出装置
JP4392805B2 (ja) オーディオ情報分類装置
KR101661666B1 (ko) 하이브리드 오디오 핑거프린팅 장치 및 방법
CN1924850A (zh) 音频快速搜索方法
JP2003083801A (ja) 故障検知装置及び故障検知方法
Mapelli et al. Audio hashing technique for automatic song identification
CN117316184B (zh) 一种基于音频信号的事件检测反馈处理系统
RU2623842C1 (ru) Способ обнаружения объектов, передвигающихся по охраняемой территории, и устройство для его осуществления
KR102443221B1 (ko) 수면 음성 분석 장치 및 방법
Korycki Detection of tampering in lossy compressed digital audio recordings

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20050817